Amazon Web Services ブログ

Amazon Q Developer を使用して Amazon SageMaker Canvas で ML モデルを構築してください

私はデータサイエンティストとして、機械学習の経験がないビジネスアナリスト、マーケティングアナリスト、データアナリスト、データアナリスト、データエンジニアが、それぞれの分野の専門家である機械学習(ML)を利用できるようにするという課題を直接経験してきました。だからこそ、Amazon Q DeveloperAmazon SageMaker Canvas で利用できるようになったという 12 月 4 日の Amazon Web Services (AWS) の発表に特に興奮しています。私が注目したのは、Amazon Q Developer が ML の専門知識とビジネスニーズを結び付け、組織間で ML にアクセスしやすくする方法です。

Amazon Q Developer は、ドメインの専門家が ML の専門知識を持っていなくても、自然言語による対話を通じて正確で本番品質の ML モデルを構築できるよう支援します。Amazon Q Developer は、こうしたユーザーのビジネス上の問題を分析してデータを分析し、カスタム ML モデルを構築するためのステップバイステップのガイダンスを提案することで、こうしたユーザーを導きます。ユーザーのデータを変換して異常を取り除き、カスタム ML モデルを構築して評価して最適なモデルを推奨すると同時に、ガイド付き ML ワークフローのすべてのステップをユーザーが制御および可視化できるようにします。これにより、組織は市場投入までの時間を短縮しながら、より迅速にイノベーションを起こすことができます。また、ML の専門家への依存度も下がるため、専門家はより複雑な技術的課題に集中できます。

たとえば、マーケティングアナリストが「住宅の特性と過去の販売データを使用して住宅販売価格を予測したい」と言うと、Amazon Q Developer がこれを一連の ML ステップに変換して、関連する顧客データを分析し、複数のモデルを構築し、最適なアプローチを推奨します。

実際の動作
Amazon Q Developer を使い始めるには、「Amazon SageMaker Canvas の使用開始」ガイドに従って Canvas アプリケーションを起動します。このデモでは、自然言語の指示を使用して、マーケティングチームと財務チームの住宅価格を予測するモデルを作成します。SageMaker Canvas ページから Amazon Q を選択し、次に [新しい会話を始める] を選択します。

新しい会話では、次のように書いています。

私はアナリストで、マーケティングチームと財務チームの住宅価格を予測する必要があります。

次に、Amazon Q Developer が問題を説明し、適切な ML モデルタイプを推奨します。また、必要なデータセットの特性を含むソリューション要件についても概説しています。次に、Amazon Q Developer が、データセットをアップロードするか、ターゲット列を選択するかを尋ねてきます。これを選択してデータセットをアップロードします。

次のステップでは、Amazon Q Developer が、住宅に関する関連情報、現在の住宅価格、リグレッションモデルのターゲット変数を含むデータセット要件を一覧表示します。次に、[データセットをアップロードしたい]、[既存のデータセットを選択する]、[新しいデータセットを作成する]、[ターゲット列を選択したい] などの次のステップが推奨されました。このデモでは、canvas-sample-housing.csv サンプルデータセットを既存のデータセットとして使用します。

select_an_existing_dataset

データセットを選択して読み込んだ後、Amazon Q Developer はそれを分析し、リグレッションモデルのターゲット列として median_house_value を提案します。[「median_house_value」を予測したい] 列を選択して同意します。 次のステップに進み、Amazon Q Developer は、median_house_value を予測するためにどのデータセットの特徴(「location」、「housing_median_age」、「total_rooms」など)を使用するかを詳細に説明します。

モデルトレーニングに進む前に、データ品質について質問します。良いデータがなければ、信頼できるモデルを構築できないからです。Amazon Q Developer が私のデータセット全体の品質インサイトを返してくれました。

データ品質をより深く理解するために、個々の機能とその分布について具体的な質問をすることができます。

データセットの列

驚いたことに、前の質問を通じて、「世帯」列には極値間のばらつきが大きく、モデル予測精度に影響を与える可能性があることがわかりました。そこで、Amazon Q Developer にこの外れ値の問題を修正するよう依頼します。

変換が完了したら、Amazon Q Developer がこの変更を行うためにどのような手順を踏んだかを尋ねることができます。舞台裏では、Amazon Q Developer が SageMaker Canvas のデータ準備機能を使用して高度なデータ準備手順を適用しています。これらの手順を確認して確認できるので、プロセスを視覚化して複製し、モデルのトレーニング用に準備された最終データセットを取得できます。

データ準備の手順を確認したら、[トレーニングジョブの開始] を選択します。

トレーニングジョブを開始する

トレーニングジョブが開始されると、会話の進行状況と作成されたデータセットを確認できます。

データサイエンティストである私は、Amazon Q Developer を使用して、分類モデルの混同行列や精度再現スコア、リグレッションモデルの二乗平均平方根誤差 (RMSE) などの詳細なメトリクスを確認できることに特に感謝しています。これらは、モデルのパフォーマンスを評価し、データ主導の意思決定を行う際に私が常に重視している重要な要素です。技術チームが必要とする深さを維持しながら、信頼を築き、適切なガバナンスを実現するために、技術者以外のユーザーにもわかりやすい方法で提示されているのを見るのは新鮮です。

これらのメトリックスにアクセスするには、[マイモデル] または Amazon Q 会話メニューから新しいモデルを選択します。

  • 概要 – このタブには、カラム影響分析が表示されます。この場合、私のモデルに影響を与える主な要因として median_income が浮かび上がってきます。
  • スコアリング – このタブには、RMSE メトリクスを含むモデル精度のインサイトが表示されます。
  • 詳細メトリクス – このタブには、詳細なモデル評価のための詳細なメトリックテーブル残差エラー密度が表示されます。

マイモデルの分析

これらの指標を確認してモデルのパフォーマンスを検証したら、ML ワークフローの最終段階に進むことができます。

  • 予測 – [予測] タブを使用してモデルをテストし、実際のパフォーマンスを検証できます。
  • デプロイ – エンドポイントデプロイメントを作成して、モデルを本番環境で使用できるようにすることができます。

これにより、これまで DevOps に関する豊富な知識が必要だったデプロイプロセスが、ビジネスアナリストが自信を持って処理できる簡単な操作に簡素化されます。

予測とデプロイ

知っておくべきこと
Amazon Q Developer は、組織全体で機械学習を民主化します。

ML であらゆるスキルレベルを強化 – Amazon Q Developer が SageMaker Canvas で利用できるようになり、ML の経験がないビジネスアナリスト、マーケティングアナリスト、データプロフェッショナルが、ガイド付きの ML ワークフローを通じてビジネス上の問題のソリューションを作成できるようになりました。データ分析、モデルの選択からデプロイまで、ユーザーは自然言語を使用してビジネス上の問題を解決できるため、データサイエンティストなどの機械学習の専門家への依存度が減り、組織は市場投入までの時間を短縮してイノベーションを加速できます。

ML ワークフローの合理化 – SageMaker Canvas の Amazon Q Developer を利用すると、ユーザーはガイド付きの透明なワークフローを通じてデータを準備し、ML モデルを構築、分析、デプロイできます。Amazon Q Developer が提供する高度なデータ準備機能と AutoML 機能により、ML の民主化が可能になり、ML の専門家でなくても高精度の ML モデルを作成できます。

ML ワークフローを完全に可視化 – Amazon Q Developer は、基盤となるコードや、データ変換ステップ、モデルの説明可能性、精度測定などの技術的アーティファクトを生成することで、完全な透明性を実現します。これにより、ML の専門家を含む部門横断的なチームが必要に応じてモデルを確認、検証、更新できるようになり、安全な環境でのコラボレーションが容易になります。

在庫状況 – Amazon Q Developer は現在 Amazon SageMaker Canvas でプレビューリリース中です。

価格Amazon Q Developer Pro 利用枠Amazon Q Developer 無料利用枠のどちらのユーザーも、追加費用なしで Amazon Q Developer を SageMaker Canvas で利用できるようになりました。ただし、SageMaker Canvas ワークスペースインスタンスなどのリソースや、モデルの構築やデプロイに使用されるリソースには標準料金が適用されます。詳細な価格情報については、Amazon SageMaker Canvas 料金表を参照してください。

開始方法の詳細については、Amazon Q Developer 製品のウェブページを参照してください。

Eli

原文はこちらです。