Amazon Web Services ブログ
AWS Content Analysis ソリューションのご紹介
このブログは “Introducing the AWS Content Analysis Solution” を翻訳したものです。
AWS Content Analysis ソリューションは、コンテンツベースの完全に自動化された動画検索エンジンです。AWS の画像認識と音声解析の AI サービスを使用して動画コンテンツを定量化し、その後、ユーザーが指定した検索条件に従って動画コレクションを閲覧できるように動画をカタログ化します。このソリューションは、検索用に動画アーカイブをカタログ化するために必要な人間の関与を劇的に減らすことができる自動化を提供します。
また、このソリューションは AWS AI サービスが自社のコンテンツに対して生成するインサイトを一目で確認し、それらのサービスが自社のユースケースに対して十分なドメイン知識を提供しているかどうかを理解するためにも有効です。
AWS Content Analysis ソリューションで、ユーザーは次のような疑問を調べることができます。
- Amazon Rekognition は、私が探しているオブジェクトのラベルを提供しているか?
- Amazon Transcribe は、私の動画の中の音声を認識しているか?
- Amazon Translate は、私の動画の中の書き起こされた音声を正確に解釈しているか?
このソリューションでは、以下の AWS サービスを使用して動画を処理します。
- AWS Elemental MediaConvert を使用したサムネイルと音声の抽出
- Amazon Rekognition を使用したオブジェクト、有名人、顔検出、顔検索、および明示的なコンテンツ検出
- Amazon Transcribe を使用した書き起こしの生成
- Amazon Translate を使用した書き起こしの翻訳
- Amazon Comprehend を用いた書き起こしのキーフレーズ検出とその他のテキスト分析
AWS Content Analysis ウェブアプリケーションで動画をアップロードする前に、ユーザーは有効にする AWS AI サービスを選択できます。
動画分析
AWS Content Analysis ソリューションは、これらのサービスによって生成されたデータをインタラクティブな UI と統合し、ユーザーが選択したオブジェクトのバウンディングボックスの表示、動画のタイムラインでのオブジェクトの調査、自動生成された書き起こしの表示、翻訳の生成などを行うことができます。
このソリューションで収集された動画データの忠実さは、詳細な分析を容易にします。以下は、私が好きな映画「ビッグ・リボウスキ」の 2 分間のシーンで記録されたデータ量を示すグラフです。この 2 分間の映像には約 18,000 件のデータが記録されており、映像のカタログ化にはこれだけのデータ量が予想されるのがわかります。
AWS Content Analysis ソリューションでは、長編映画の処理も可能です。例えば、2 時間の映画「アメリ」は、次のチャートに示すように、合計 652,000 のデータレコードを生成しました。
動画検索
動画は、Amazon OpenSearch インスタンスでインデックス化され、カタログ化されています。GUI で動画を分析する際に表示されるものはすべて、標準の OpenSearch クエリ言語(Lucene としても知られています)を使用して検索できます。このセクションでは、一般的な検索パターンの例をいくつか紹介します。
全文検索
全文検索を使用すると、動画カタログ内のあらゆるデータを検索することができます。たとえば、Amazon Rekognition 有名人検出サービスでは、動画で検出された有名人のフルネームが返されます。これらのスクリーンショットに示すように、名前を入力するだけで有名人を検索できます。
信頼度の高いデータを検索する
Amazon Rekognition が返すラベルには、それが正確であることをどれだけ確信できるかを示す信頼度値が割り当てられています。この値を使って、検索結果をフィルタリングできます。例えば、Violence AND Confidence:>80
とすると、80% 以上の信頼度値の暴力を含む動画を検索します。
個々のオペレータからデータを検索する
検索は、OpenSearch のメタデータカタログ全体に問い合わせます。Violence
の基本的な検索は、コンテンツモデレーションによる “Violence” ラベルを含む動画にマッチしますが、”Violence” という単語を含む書き起こしを持つ動画にもマッチします。以下のように、オペレータ名でコンテンツモデレーションの結果のみに検索を限定できます。Operator:content_moderation AND (Name:Violence AND Confidence:>80)
のように、オペレータ名を持つコンテンツモデレーション結果のみに検索を限定できます。
以下は、検索クエリのフィルタリングに使用できるオペレータ名の全リストです。
- label_detection
- celebrity_detection
- content_moderation
- face_detection
- face_search
- transcribe
- key_phrases
- entities
複数のオペレータで関連する概念を検索する
複数のオペレータを使用した複合検索の例として、コンテンツモデレーションで識別される “Violence” とラベル検出で識別される “guns” または “weapons” を返すクエリを示します: (Operator:content_moderation AND Name:Violence AND Confidence:>80) OR (Operator:label_detection AND (Name:Gun OR Name:Weapon))
まとめ
AWS Content Analysis ソリューションは、一般利用可能です。このソリューションは、大規模な動画コレクションの維持に、現在課題を抱える組織が、動画管理に検索の力を活用できるよう設計されています。また、このソリューションは、個人が自分の動画コンテンツで AWS の AI サービスをテスト利用し、これらのサービスを適用できるシナリオをよりよく理解するのに役立ちます。
AWS Content Analysis の詳細については、ソリューションページをご覧ください。
参考リンク
AWS Media Services
AWS Media & Entertainment Blog (日本語)
AWS Media & Entertainment Blog (英語)
AWS のメディアチームの問い合わせ先: awsmedia@amazon.co.jp
※ 毎月のメルマガをはじめました。最新のニュースやイベント情報を発信していきます。購読希望は上記宛先にご連絡ください。
翻訳は SA 前川 が担当しました。原文はこちらです。