このガイダンスでは、ソーシャルメディアの投稿、カスタマーレビュー、その他の短い形式のコンテンツに基づいて、センチメント、エンティティ、場所、トピックなどのインサイトを取得する方法を示します。付属のサンプルコードでは、情報抽出システムとして機能するコードベースが提供されます。このシステムは、X、Facebook、Instagram などのさまざまなソーシャルメディアプラットフォームから大規模言語モデル (LLM) を使用して情報を抽出し、自社の製品やサービスに関する実用的なインサイトを提供します。
アーキテクチャ図
ステップ 1
Amazon Elastic Container Service (Amazon ECS) タスクは、AWS Fargate が管理するサーバーレスインフラストラクチャ上で実行され、ソーシャルメディアへのオープン接続を維持します。
ステップ 2
ソーシャルメディアアクセストークンは安全に AWS Systems Manager Parameter Store に保存され、コンテナイメージは Amazon Elastic Container Registry (Amazon ECR) でホストされます。
ステップ 3
新しいソーシャルメディア投稿が到着すると、Amazon Simple Queue Service (Amazon SQS) キューに入れられます。
ステップ 4
このガイダンスのロジックは、AWS Step Functions によって調整された AWS Lambda 関数のマイクロサービスにあります。
ステップ 5
投稿は Amazon Bedrock がサポートする大規模言語モデル (LLM) の 1 つによってリアルタイムで処理されます。
ステップ 6
Amazon Location Service はロケーション名を座標に変換します。
ステップ 7
投稿とメタデータ (インサイト) は Amazon Simple Storage Service (Amazon S3) に送信されます。
ステップ 8
Amazon Athena は処理されたツイートを標準 SQL でクエリします。
ステップ 9
Amazon Lookout for Metrics は、カテゴリごとのメンション数の異常を検出します。Amazon Simple Notification Service (Amazon SNS) は、異常が検出されるとユーザーにアラートを送信します。
ステップ 10
ユーザーがインサイトを簡単に視覚化できるように、Amazon QuickSight ダッシュボードを設定することをお勧めします。
今すぐ始める
このガイダンスをデプロイ
Well-Architected の柱
AWS Well-Architected フレームワークは、クラウドでシステムを構築する際に行う決定の長所と短所を理解するのに役立ちます。フレームワークの 6 つの柱により、信頼性が高く、安全かつ効率的で、費用対効果が高く、持続可能なシステムを設計および運用するためのアーキテクチャのベストプラクティスを学ぶことができます。AWS マネジメントコンソールで無料で提供されている AWS Well-Architected Tool を使用し、各柱の一連の質問に回答することで、これらのベストプラクティスに照らしてワークロードを確認できます。
上記のアーキテクチャ図は、Well-Architected のベストプラクティスを念頭に置いて作成されたソリューションの例です。完全に Well-Architected であるためには、可能な限り多くの Well-Architected ベストプラクティスに従う必要があります。
-
運用上の優秀性
Amazon CloudWatch はテキスト処理ワークフローで実行された操作のログを保持するので、アプリケーションの状態を効率的に監視できます。Amazon CloudFormation はデプロイを再現できるようにし、デプロイが失敗した場合に安定した状態にロールバックすることもできます。さらに、Amazon Bedrock はシンプルなインターフェイスで LLM を使用するマネージドサービスです。モニタリング、再現可能なデプロイ、AWS マネージド LLM の使用を組み合わせることで、基盤となるインフラストラクチャを管理しなくても強力な自然言語処理機能が得られます。
-
セキュリティ
Amazon S3 に保存されたデータは、保存時に AWS Key Management Service (AWS KMS) キーを使用して暗号化され、AWS Identity and Access Management (IAM) を使用してデータへのアクセスを制御できます。具体的には、AWS KMS は Amazon S3 に保存されているデータを安全に暗号化するために使用される暗号化キーの作成と管理を支援します。一方、IAM では、ロールに基づいてきめ細かい許可を設定して、そのデータへの最小特権のアクセス制御を行うことができます。
-
信頼性
データは、99.999999999% (イレブンナイン) の耐久性を提供するオブジェクトストレージサービスである Amazon S3 に保存されます。LLM は Amazon Bedrock を使用して、自動的にスケールアップおよびスケールダウンできるシンプルで効率的な API インターフェイスを介して呼び出されます。Athena、QuickSight、AWS Glue を使用すると、インフラストラクチャをプロビジョニングしなくても、データを大規模にクエリして視覚化できます。
-
パフォーマンス効率
このガイダンスは、さまざまなサーバーレスおよびマネージド型の AWS サービスを使用することで、ワークロードのパフォーマンス効率を高め、ワークロードの需要に応じてリソースを自動的にスケールし、ソーシャルメディアプラットフォームからのインサイトにシームレスにアクセスする体験を享受できるようにすることを目的としています。例えば、サーバーレスのコンピューティングサービスである Lambda は、需要に応じて自動的にスケールアップ/スケールダウンし、コンピューティング容量がワークロードに最適化されるようにします。Amazon Bedrock を使用すると、基盤となるサーバーをプロビジョニングして管理しなくても、広範なカタログから LLM を呼び出すことができます。
-
コストの最適化
このアーキテクチャでは Lambda を使用してイベントを処理し、バッチ変換分析を開始するため、サーバーを継続的に稼働させる必要がなくなります。さらに、AWS Glue ジョブは、個々のレコードではなく、ユーザーデータのバッチに対して抽出、変換、読み込み (ETL) を実行するために使用されます。データを集約してより大きなチャンクに処理することで、全体的なコンピューティングとストレージの要件が軽減され、各レコードを個別に処理する場合に比べてコストが削減されます。最後に、Amazon Bedrock では予算要件に最も適した LLM を使用できるため、より強力ではあるが過剰にプロビジョニングされる可能性のあるモデルにまつわる不必要な費用が発生することはありません。
-
持続可能性
Lambda、AWS Glue、Athena、QuickSight はすべてオンデマンドで動作するサーバーレスサービスであり、現在のワークロードに合わせてリソース使用量を調整します。これにより、サービスは必要な需要に応じて自動的にスケールアップ/スケールダウンされるため、パフォーマンスとリソースの使用量を最大化できます。このようなサーバーレスサービスを使用することで、このアーキテクチャは必要なリソースを効率的に利用でき、コンピューティング、ストレージ、その他のインフラストラクチャコンポーネントの過剰プロビジョニングや過少利用を回避できます。
関連コンテンツ
Twitter、Amazon SageMaker、Hugging Face を使って、ニュースベースのリアルタイムアラートシステムを構築する
免責事項
サンプルコード、ソフトウェアライブラリ、コマンドラインツール、概念の実証、テンプレート、またはその他の関連技術 (私たちの担当者から提供される前述のものを含む) は、AWS カスタマーアグリーメント、またはお客様と AWS との間の関連文書契約 (いずれか該当する方) に基づき、AWS コンテンツとしてお客様に提供されるものです。お客様は、この AWS コンテンツを、お客様の本番アカウント、または本番データもしくはその他の重要なデータで使用すべきではありません。お客様は、サンプルコードなどの AWS コンテンツを、お客様固有の品質管理手法および基準に基づいて、本番グレードでの使用に適したテスト、セキュリティ確保、および最適化を行う責任を負います。AWS コンテンツのデプロイには、Amazon EC2 インスタンスの実行や Amazon S3 ストレージの使用など、AWS の課金対象リソースを作成または使用するための AWS 料金が発生する場合があります。