10 チャプター
74 課題

コース概要

本コースは、SRE(Site Reliability Engineering)としてのスキルを飛躍的に向上させ、愚直に数字へ結びつけるための実践的な知見が詰まった、まさに「アラカルト」なカリキュラムです。単なる座学ではなく、現場で直面する課題を解決するための具体的な手札を、一気に手に入れることができます。

監査ログ基盤の構築

はじめに、構築ハードルが高いとされるデータ基盤を、サーバーレスな構成で一から構築します。

具体的には、CloudWatch Logsから監査ログを収集し、Firehose(Lambdaによる変換を挟む)でS3に保存します。その後、Glue CrawlerによりGlue Catalogを作成し、AthenaからSQLで監査ログを解析する基盤を構築します。

監査ログ基盤の構成図

AWS Batch によるバッチ処理

次に、強力ながら知名度がそこまで高くないAWS Batchを扱います。BatchはECSのように登場する概念が多く、初見ではとっつきづらいのですが、

・キューの実行に優先順位をつけられたり ・リトライ制御をできたり ・過去の実行履歴をダッシュボードで確認できたり

と大変便利なサービスです。学習コースと構築のハードルがそこそこ高いのがネックですが、解説動画と課題を通して楽しく構築してもらえるように作りました。

AWS Batch 構成図

運用監視基盤の構築

その後は、CloudWatchを主軸として運用監視基盤を構築していきます。

CloudWatchロググループのエラーログをカウントアップし、カスタムメトリクスを作成 → 閾値を超えたらSNS → Amazon Q Developer経由でSlackに通知が飛ぶ基盤を構築します。

最後はCloudWatchダッシュボードを作成し、チームで運用が回るためのTipsについても解説します。

アラート通知基盤の構成図

セキュリティ道場 & コスト削減道場

最後に、セキュリティ道場、コスト削減道場が続き、SREとして自ら提案をしていけるような知見を一気にインプットできるようにしました。私自身がインフラに関する技術アドバイザー業務で普段提案している内容を全て盛り込んだので、そのまま現場に使える内容となっています。

セキュリティ道場 & コスト削減道場

AWS 道場コースを通して、SREとして自ら施策を提案し、愚直に数字へ結びつけるための知識を一気にインプットできるはずです!

学習ポイント

  • サーバーレス構成による監査ログ基盤の構築(Firehose / Glue / Athena)
  • AWS Batch によるバッチ処理基盤の構築
  • CloudWatch カスタムメトリクス & アラート通知基盤
  • Amazon Q Developer 経由での Slack 通知
  • セキュリティ道場(CloudTrail / Config / GuardDuty / Macie / Inspector / Security Hub)
  • コスト削減道場(Cost Explorer / Savings Plans / RI / Compute Optimizer / S3 Intelligent Tiering)
Ch.01 AWS 道場コースのオンボーディング
01 AWS 道場コースの全体像を把握する
02 AWS 道場コースで必要なAWSのコスト感を掴む
03 AWS 道場コースでのGitHubリポジトリの運用方法を知る
Ch.02 監査ログ基盤を構築する [オンボーディング]
01 監査ログ (Audit Log) とは?
02 【動画】監査ログ基盤を構築する手札を知る
03 監査ログ基盤の全体像を把握する
04 CloudWatch Logsに監査ログを出力してみる
Ch.03 Kinesis Data Firehoseにより監査ログをS3に自動送信する
01 Kinesis Data FirehoseによりS3まで監査ログを送信する全体像を把握する
02 監査ログを永続化するS3バケットを作成する
03 Kinesis Data Firehoseとは?
04 Kinesis Data Firehoseを作成する
05 【動画】CloudWatch ロググループにサブスクリプションフィルターをつけて監査ログを自動送信する
06 LambdaによりFirehoseのレコードのフォーマットを変換する
07 CloudWatch Logs → Kinesis Firehose → S3 への繋ぎこみ動作確認を行う
08 Kinesis Data Firehose関連のリソースをTerraform化する
Ch.04 AWS GlueによりS3に蓄積した監査ログをデータベース化する
01 AWS GlueによりS3のオブジェクトをデータベース化する全体像を把握する
02 AWS Glueとは?
03 Data Catalogにて監査ログ用のデータベースを作成する
04 Glue CrawlerでS3のデータから動的にカタログを作成する
05 【動画】AWS Glueによるデータベース化の動作確認を行う
06 S3にParquet形式で出力されるようにFirehoseの設定を更新する
07 AWS Glue関連のリソースをTerraform化する
Ch.05 AthenaによりS3のログをSQLで解析する
01 Athenaとは?
02 Athenaにより監査ログをSQLで解析する
03 AthenaをTerraform化する
04 [総集編] 監査ログ基盤全体を通しての動作確認を行う
05 【コラム】FirehoseでParquet変換をする場合はガチガチのスキーマ管理が必要になる
Ch.06 AWS Batchによりバッチ処理を実行する
01 AWS Batchとは? ECS Run Task では実現できない強みを知る
02 AWS Batchで登場する概念を一気にマスターする
03 AWS Batchのコンピューティング環境を作成する
04 Slack Metrics用のジョブ定義を作成する
05 Slack Metrics用のジョブキューを作成する
06 【動画】AWS Batchの画面からジョブを実行する
07 EventBridge SchedulerからAWS Batchを起動する
08 【Tips】AWS Batchの自動デプロイ戦略を知る
09 AWS Batchの関連リソースをTerraform化する
10 AWS Batchの総まとめ
11 【番外編】スケジュールポリシーと消耗品リソースについて完全に理解する
Ch.07 AWS 運用・監視道場
01 なぜ運用監視が必要なのか?オブザーバビリティの原点を知る
02 CloudWatch Metrics入門
03 【動画】モニタリングから標準メトリクスを覗いてみる
04 サーバエラー監視基盤の全体像を把握する
05 CloudWatchロググループにエラーログを出力する
06 エラーログを検知するメトリクスフィルターを作成する
07 【動画】エラーログ用のカスタムメトリクスを表示する
08 【コラム】カスタムメトリクスのディメンジョン設定をミスって一瞬で6000円ふっ飛んだ話
09 アラート通知基盤の全体の流れを把握する
10 アラート通知用のSNSトピックを作成する
11 Amazon Q DeveloperとSlackチャンネルを連携する
12 500エラー検知用のCloudWatch Alarmを作成する
13 RDSのCPU使用率が閾値を超えた時にSlack通知を行う
14 ダッシュボードを作成してAWSリソースを横断的に監視する
15 AWS 運用・監視道場で登場したAWSサービスをTerraform化する
Ch.08 AWS セキュリティ道場
01 AWSでセキュリティ施策を行う際の考え方
02 【動画】CloudTrail により「誰が・いつ・何をしたか」を証拠として残す
03 Config によりAWSリソースの設定を記録・監視・ルールに基づいて修復する
04 GuardDuty によりAWS環境の不審な動きを自動検知する
05 【動画】Amazon Macie によりS3バケット内の機密ファイルを自動検出する
06 Amazon Inspector によりOSレベルの脆弱性を継続的に自動スキャンする
07 Security Hub によりAWS内でのセキュリティ施策を一元管理する
Ch.09 AWS コスト削減道場
01 企業のフェーズにおけるAWS利用料の相場を知る
02 AWSのコストがかさみがちなリソースとコスト削減の手札について知る
03 【動画】Cost Explorerの使い方について理解する
04 コスト配分タグでAWSコストをリソース単位まで可視化する
05 AWS Cost Budget で予期せぬ出費を未然に防ぐ
06 Savings Plans によりEC2, ECS のコストを削減する
07 リザーブドインスタンス(RI) によりRDSのコストを削減する
08 絶対やるべきCloudWatch Logsのコスト削減施策5選
09 AWS Compute Optimizerで過剰なスペックを見直そう
10 【動画】S3のストレージ料金を削減する手札を知る (Storage Lens, Intelligent-Tiering)
11 AWS請求代行の落とし穴:コスト管理の柔軟性が失われることに注意しよう
12 Cloudflare R2によりCloudFrontのネットワーク配信料を削減する
Ch.10 AWS 道場コース ラップアップ編
01 AWS 道場コースの最終課題を提出する
02 学習用AWSアカウントのお掃除ガイドライン

コース突破者の声

K.S さん 受講完了

実際に SRE として働いていることもあり、このコースを今の本業と照らし合わせて考えることができているのがとても大きかった。
コスト削減は目に見えて数字に現れる部分なので、Cost Explorer 周りは 100 % 理解して使いこなせるようにしたいと思った。
監査ログのところは Kinesis Firehose や AWS Glue などほとんど使ったことがないサービスだったので、手触り感を理解できてよかった。
AWS Batch は本業でも使っているので、ぜひ新規でバッチ処理を使う際には手札として用意しておきたい。
S3 のストレージ料金や CloudWatchLogs の料金、NAT Gateway の通信量あたりは今まであまり気にしてこなかった部分でもあるので、しっかりモニタリングしながら適宜対策を打てるようにしていきたい。このようにコストが高くなる主な要因をこのコースである程度理解できたのも大きい。

M.Y さん 受講完了

AWS道場コースを完走しました。
監査ログ基盤の構築から AWS Batch、セキュリティ道場、運用・監視道場、コスト削減道場まで、実践的な内容が盛りだくさんのコースでした。

T.I さん 受講完了

今仕事で、S3に保存されているデータとBigQueryに保存されているデータをマージしていい感じにする基盤を作っているので、そこでGlueやAthenaが活かせそうでした。
また、今回はSubscription FilterでFirehose -> S3 -> Glue Crawler + Athena のような感じの構成だったと思いますが、抽象度を上げるとざっくりですがフィルター -> 参照 -> 分析のように考えられるんだなと理解でき、その時々のユースケースに応じて適切なサービスだったりツールを選択できそうという自信が持てました。

H.O さん 受講完了

今回のコースで触れるAWSリソースや課題内容は中々実務でも経験する機会が少ないと思うので、特にKinesis Firehose、AWS Glue Catalog/Crawler、Athenaを利用した監査ログ基盤の構築課題はかなり実践的な内容だと感じました!!

Y.N さん 受講完了

運用、監視、セキュリティ、コストは地味でありますが、これを知っているかどうかでサービス運用の安定性に差が出ると思います。どれも有益な情報ばかりでした!

R.K さん 受講完了

これまで触れる機会が少なかったサービスを体系的に学べたコースでした。
監査ログ基盤(CloudWatch Logs → Kinesis Firehose → S3 → Athena)やAWS Batchなど、実務で「知ってはいるが構築したことがない」領域を実際に手を動かして構築できたことで、設計の引き出しが大きく広がりました。