Amazon SageMaker Canvas の特徴

ビジュアルインターフェイスを使用して非常に正確な ML モデルを構築します。コーディングは不要です

Amazon Q Developer を利用したチャット駆動型の ML 開発

Amazon Q Developer は、ビジネス上の課題と ML モデルの間のギャップを埋めるのに役立ちます。ビジネス上の問題をステップバイステップの ML ワークフローに巧みに変換し、非技術的な言語を使用して ML の用語を説明します。

Amazon Q Developer は、データの準備から、ML モデルの構築、トレーニング、デプロイまで、モデル開発のあらゆるステップでユーザーを巧みにガイドします。Amazon Q Developer は、チャットインターフェイスを使用してコンテキストを踏まえたアシスタンスを提供して、ユーザーがエンドツーエンドの ML ワークフローに対応し、本番対応の ML モデルを構築するのをサポートします。

Amazon Q Developer の決定論的パイプラインビルダーと高度な AutoML 手法は、モデル作成における再現性と精度をサポートします。Q Developer は、高度なデータサイエンス機能をユーザーに提供することで、モデルの有用性における信頼を維持しながら迅速な実験を可能にします。

Amazon Q Developer は、元のデータセットや変換されたデータセットなどのアーティファクト、および自然言語を使用して作成されたデータ準備パイプラインを維持します。さらに、Q Developer を使用して構築されたモデルは SageMaker モデルレジストリに登録でき、さらなるカスタマイズおよび統合のためにモデルノートブックをエクスポートできます。

データを準備する

SageMaker Canvas は 50 以上のデータソースに接続できます。また、ローカルファイルをアップロードして ML モデルをトレーニングすることもできます。表形式、画像、またはテキストデータがサポートされています。また、SQL を使用してデータソースにアクセスするクエリを記述したり、CSV、Parquet、ORC、JSON などのさまざまなファイル形式、およびデータベーステーブルでデータを直接インポートしたりすることもできます。
SageMaker Canvas のノーコードインターフェイスでは、ビルトインまたはカスタムのビジュアライゼーションを使用してデータを探索、視覚化、分析できます。ワンクリックで、Data Quality and Insight レポートを生成して、データセットに欠損値や重複行がないことを確認するなど、データ品質を検証できます。また、外れ値、クラスの不均衡、データ漏えいなどの異常も検出できます。
SageMaker Canvas には、300 種類以上の PySpark ベースのデータ変換があらかじめ用意されているため、コードを 1 行も記述せずにデータを変換できます。または、基盤モデルを利用したチャットインターフェイスを使用してデータを準備することもできます。
SageMaker Canvas では、データ準備ワークフローを簡単に起動またはスケジュールして、データを迅速に処理してデータセット全体にわたってデータ準備を拡張したり、SageMaker Studio ノートブックにエクスポートしたり、SageMaker Pipelines と統合したりできます。

ML モデルへのアクセスと構築

SageMaker Canvas のノーコードインターフェースにより、企業データを使用してカスタム ML モデルを自動的に構築できます。データを選択して準備し、予測したいものを特定したら、SageMaker Canvasは問題の種類を特定し、問題の種類に基づいて何百ものMLモデルをテストし(線形回帰、ロジスティック回帰、ディープラーニング、時系列予測、勾配ブースティングなどの ML 手法を使用)、データセットに基づいて最も正確な予測を行うカスタムモデルを作成します。または、以前に構築した独自のモデルを SageMaker Canvas に持ち込んで、そのモデルをデプロイして推論することもできます。

SageMaker Canvasでは、感情分析、画像内のオブジェクト検出、画像内のテキスト検出、エンティティ抽出などのユースケースで、すぐに使用できる表形式、NLP、CVモデルにアクセスできます。すぐに使えるモデルはモデル構築を必要とせず、 Amazon Rekognition、Amazon Textract 、Amazon Comprehend などの AWS AI サービスを搭載しています。

モデルを構築したら、会社のデータを使用してモデルを本番環境にデプロイする前に、モデルのパフォーマンスを評価できます。モデル応答を簡単に比較して、ニーズに最適な応答を選択できます。

SageMaker Canvas では、コンテンツ生成、テキスト抽出、およびテキスト要約のためのすぐに使用できる基盤モデル (FM) にアクセスできます。 Claude 2、Llama-2、Amazon Titan、Jurassic-2、Command (Amazon Bedrock を利用) などの FM や、Falcon、Flan-T5、Mistral、Dolly、MPT (SageMaker JumpStart を利用) などの公開されている FM にアクセスし、独自のデータを使用してチューニングできます。

ML 予測を生成

SageMaker Canvas では、「仮定」を視覚的に分析できるため、モデル入力を変更し、その変更が個々の予測にどのように影響するかを理解できます。データセット全体の自動バッチ予測を作成でき、データセットが更新されると、ML モデルが自動的に更新されます。ML モデルが更新されたら、SageMaker Canvas のノーコードインターフェースから更新された予測を確認できます。

SageMaker Canvas モデルを SageMaker エンドポイントにデプロイして、リアルタイムで推論することができます。

モデル予測を Amazon QuickSight と共有して、従来のビジネスインテリジェンスと予測データを同じインタラクティブなビジュアルにまとめたダッシュボードを構築できますさらに、SageMaker Canvas モデルを共有して QuickSight に直接統合できるため、アナリストは QuickSight ダッシュボード内で新しいデータについての高精度の予測を生成できます。

MLOP をレバレッジする

SageMaker Canvas で作成した ML モデルをワンクリックで SageMaker モデルレジストリに登録して、そのモデルを既存のモデルデプロイメント CI/CD プロセスに統合できます。

SageMaker Canvas で作成したモデルを、SageMaker Studio を使用しているデータサイエンティストと共有することができます。その後、データサイエンティストは更新されたモデルをレビュー、更新、共有したり、モデルをデプロイして推論したりできます。