Amazon Web Services ブログ

Amazon Q Developer による運用上の問題の調査と修正 (プレビュー中)

現代のソフトウェアはますます複雑化しているため、トラブルシューティングが困難になり、さまざまなシステムにわたる深い知識と手作業が必要になります。その結果、問題解決が遅くなり、運用の効率が低下します。問題をより迅速に解決し、顧客にイノベーションを提供することに集中できるように、日常的なタスクを処理し、複雑なプロセスを簡素化するための自動化ツールを必要とするお客様が増えています。

12 月 3 日、Amazon Q Developer の運用上の問題を調査して修正する新機能を発表しました。これは現在プレビュー段階です。この生成 AI を搭載した機能は、運用診断を通じてガイドし、ワークロードの問題の根本原因分析を自動化します。

ここでは、Amazon Q Developer を運用調査にどのように使用できるかを簡単に説明します。

AWS は、他のどの大手クラウドプロバイダーよりも運用経験と規模が豊富で、17 年以上にわたって世界中の顧客にクラウドサービスを提供してきました。AWS は、この経験を Amazon Q Developer の運用能力に組み込んで、調査仮説を立てて提示し、トラブルシューティングと修復を行うためのガイダンスを提供しました。これは他の主要なクラウドプロバイダーにはない機能です。

Amazon Q Developer を使用して運用調査を始める
Amazon Q Developer が提供するこの新機能は Amazon CloudWatch および AWS Systems Manager とシームレスに統合され、問題のトラブルシューティングを行う際に統一されたエクスペリエンスを提供します。この機能を使い始めるには、いくつかの前提条件を満たす必要があります。詳細については、[Amazon Q Developer 運用調査入門] ページを参照してください。

セットアップを完了し、アプリケーションのメトリクスをモニタリングする CloudWatch アラームを設定しました。通知メールを受け取ったら、Amazon CloudWatch でそのアラームに移動します。指標が数期間にわたってしきい値を超えていることがわかりました。

この結果から、[調査] を選択します。次に、[新しい調査を始める] または [既存の調査に追加する] の 2 つの選択肢があります。まだ始めたばかりなので、[新しい調査を始める] を選択し、必要に応じて詳細とメモを提供します。

調査を作成したら、バナーの [詳細を表示] を選択して詳細を表示できます。

調査ページは 2 つの主要なセクションに分かれています。左側のフィードパネルには調査中に追加されたすべての調査結果が表示され、右側の提案パネルには調査に役立つ Amazon Q Developer からの結果提案のリストが表示されます。

Amazon Q Developer は、私の AWS リソースに関する知識を活用して、リソース間の関係を自動的に検出し、アプリケーションのトポロジーマップを作成します。これにより、Amazon Q Developer はアーキテクチャをたどり、アラームの原因となったコンポーネントをすばやく見つけることができるようになり、これまで以上に早く本番環境に戻ることができます。

さらに詳しく調べていくと、Amazon Q Developer は、Amazon DynamoDBAWS LambdaAmazon Elastic Container Service (Amazon ECS) などのさまざまな AWS サービスからの一連の関連メトリックスに基づいて仮説を提案しています。理由を理解するには、[理由を表示]を選択します。

仮説の 1 つは、読み込みと書き込みのキャパシティーユニットがプロビジョニングされた制限を頻繁に超える DynamoDB テーブルのスロットリングが原因であるというものです。この仮説は理にかなっていると思います。受け入れることで、フィードに取り込まれます。

これらすべての調査結果に基づいて、この問題のトラブルシューティングに必要なすべての裏付けデータを収集できます。Amazon Q Developer の仮説の 1 つに、提案されているアクションも見ることができます。修正のオプションを理解するために、[アクションを表示] を選択します。

推奨アクションメニューでは、Amazon Q Developer が仮説に関連する AWS Systems Manager Automation のランブックを提案します。該当する場合は、AWS Systems Manager ライブラリの自動ランブックをお勧めします。このランブックには、発生している問題の修正に役立つ、400 を超える AWS が作成したランブックと数千ものお客様が作成したランブックが含まれています。各ランブックには、問題を解決するために Systems Manager が実行するアクションが定義されています。さらに、Amazon Q Developer は AWS re:Post 記事や AWS Documentation ページからの関連ドキュメントリンクを提供しています。

Amazon Q Developer からの推奨アクションのリストは次のとおりです。DynamoDB のプロビジョニング容量を変更することでこの問題を解決する方法について詳しく理解するために、[ランブックを表示] を選択しました。

このランブックの詳細については、こちらをご覧ください。ランブックの説明が表示されます。実行履歴から、過去にこのアカウントでこのランブックを正常に実行できたかどうかがわかります。

設定で定義されている必須パラメータを入力できます。実行プレビューセグメントでは、対象リソースへの影響を強調した概要を確認できます。詳細を確認したら、[実行] を選択してワークロードに必要な変更を実装します。

ランブックを実行すると、結果が表示され、それがフィードに追加されます。

私が高く評価しているもう 1 つの機能は、この機能にアクセスする方法が複数あることです。たとえば、AWS Lambda 関数の CloudWatch メトリックスでは、調査を開始して結果を直接追加できます。Amazon Q Developer 運用調査アイコンを選択して調査パネルを開くこともできます。

Amazon Q Developer が提供するこの新機能は、AWS の専門家が 24/7、運用上のトラブルシューティングを支援してくれるようなものです。これにより、運用経験の障壁が下がり、貴重な時間と労力が節約されます。

プレビュー中
運用上の問題の調査と修正に役立つ Amazon Q Developer の新機能は、現在、米国東部 (バージニア北部) リージョンでプレビューされています。Amazon Q Developer を活用して、今すぐ運用調査を変革し、改善を加速させましょう。開始するには、Amazon CloudWatch のドキュメントページにアクセスしてください。

ハッピートラブルシューティング!

– Donnie

原文はこちらです。