Amazon Web Services ブログ
AWS Summit Japan 2024 に Chaos Kitty がパワーアップして帰ってきます!
みなさんお久しぶりです! 猫が大好きな Solutions Architect の服部です。昨年の AWS Summit Tokyo でご好評いただいた Chaos Kitty がパワーアップして AWS Summit Japan に帰ってきました!
この記事では、2024 年の AWS Summit Japan の Developer Zone 内で展示される、「 Chaos Kitty で楽しくインシデント対応ゲームをしよう!」についてご紹介します。本展示は、システムを構築する上でも重要なレジリエンスやセキュリティをゲームを通じて楽しく学ぶことができる体験型コンテンツです。システムのレジリエンスやセキュリティを強化したい全ての方に本記事を読んでいただき、実際に AWS Summit Japan の会場まで足を運んで体験いただけると幸いです。開催期間は 2024 年 6 月 20 日 (木) と 21 日 (金) の 2 日間で、会場は幕張メッセになります。まだ登録してない方はこちらのページからご登録ください。Chaos Kitty は、AWS Village の Developer Zone の中にあります。詳細はこちら。
Chaos Kitty とは?
Chaos Kitty は、AWS のアーキテクチャを物理的に表現し、障害対応の体験学習ができるソリューションです。以下の 3 つの主要機能を備えています。詳細は、昨年の記事も合わせてご確認ください!
1. IoT 電球によるリアルタイムの状態可視化
物理的なブロックと電球で表現された Web 3 層 アプリケーションのアーキテクチャにおいて、各コンポーネント (EC2, RDS, S3 など ) の状態が IoT 電球の色で示されます。電球は、正常な場合には緑、何か異常がある場合には赤で点灯する設定になっており、設定に異常が検出された場合には、電球が緑から赤に変わる仕組みとなっています。これにより AWS 上のアプリケーションの状況をリアルタイムで監視でき、異常をすぐに検知することができます。
2. 障害挿入機能による対応訓練
付属のボタンを押すと AWS での設定に意図的に設定ミスを注入し、IoT 電球の色が赤に変わります。ユーザーは AWS コンソールを使ってこの設定ミスを特定・修復し、電球を緑に戻すゲームを行います。修復が完了すれば、修復にかかった時間が表示され、手動での対応の難しさを体感できます。
3. 自動修復機能による対応の効率化
注入された設定変更に対して、自動修復するスクリプトを実行する物理的なボタンが用意されています。マネジメントコンソールを使用した手動修復と比べた自動化の優位性と、クリティカルなワークロードでの損失抑制の重要性を実感できます。
図 1 : Chaos Kitty 外観
図 2 : Web 3 層アプリケーション画面
パワーアップした Chaos Kitty とは?
2023年までの Chaos Kitty のシナリオはセキュリティが中心でしたが、今年の Chaos Kitty はレジリエンスのシナリオを新たに追加し、実際にアプリケーションの障害と復旧をゲーム内で体感いただける内容となっております。レジリエンスを実現するためには、一部のコンポーネントに障害が発生しても稼働し続け、かつ自動で復旧するアーキテクチャを取ることが重要です。また、障害が発生した際に、素早く検知して復旧させるための調査の仕組みも必要となります。
Chaos Kitty ではゲームとしてわかりやすくするために、アプリケーションの問題箇所を電球で可視化していますが、実際のシステムではそう簡単にはいきません。実システムでは、ユーザ影響がある障害が発生しているかどうか、すぐに確認・分析できるようにするためのダッシュボードによる可視化が有効です。今回の Chaos Kitty では、レジリエンスのシナリオを通してシステムの状態を把握する必要性を実感いただくために、リソース稼働状況を一目で確認できるよう Amazon CloudWatch を活用したダッシュボードを用意しています。Amazon CloudWatch Synthetics を使ってリクエストの状態やレスポンスタイムを測定し、アプリケーションの稼働状況を監視したり、システム内のどこに障害が発生しているか把握するために AWS X-Ray を利用してトレース情報を取得し、ダッシュボードに表示するようにしています。本ゲームを通じて、レジリエンスのあるシステムの開発にご興味を持っていただけると幸いです。
図 3 : ダッシュボード画面
終わりに
Chaos Kitty は実際の障害を模擬する形でサービスの稼働状況を電球やブロックを使ってわかりやすく表現しております。日頃クラウドサービスに慣れ親しむ機会が少ない方でも、運用における障害対応を気軽に体験いただけます。AWS Summit Japan 2024 で、皆様にお会いできることを楽しみにお待ちしております!
Choas Kitty は AWS Japan ソリューションアーキテクトの高野 翔史、堀 貴裕、津郷 光明、宋 子豪、河角 修、服部 一成が中心となって運営しております。