Amazon Web Services ブログ

生成AI時代のメディカルコンテンツ作成

このブログは “Medical content creation in the age of generative AI” を翻訳したものです。

生成AIやトランスフォーマーを活用した大規模言語モデル(LLM)が最近の大きなニュースになっています。これらのモデルは、質問への回答、文章の要約、コードおよびテキストの生成において優れた性能を発揮しています。現在、LLMは、規制の厳しいヘルスケア・ライフサイエンス業界(HCLS)を含む企業において実際の業務で使用されるようになってきました。ユースケースとしては、医療情報の抽出や臨床記録の要約から、マーケティングコンテンツの生成や医療に関する法務レビュー (Medical Legal Review, MLR) の自動化まで多岐にわたります。このブログでは、LLMを使用して疾患啓発のためのマーケティングコンテンツを作成する方法を紹介します。

マーケティングコンテンツは、ライフサイエンス企業のコミュニケーション戦略における重要な要素です。また、科学的な内容は正確であると同時に、対象読者にとって魅力的でなければならないため、非常にバランスが必要な作業でもあります。マーケティングコンテンツの主な目的は、特定の疾患についての認知を高め、可能な治療法に関する知識を患者と医療従事者に広めることです。最新かつ正確な情報にアクセスすることで、医療従事者はより多くの情報に基づいて患者の治療を選択することができます。しかし、医療情報を取り扱うコンテンツは機微性が高いため、徹底した法令遵守と評価プロセスにより、多数のレビューサイクルを経る必要があるため、作成プロセスには長い時間がかかり(数日から数週間)ます。

高度なテキスト生成機能を備えたLLMは、プロダクトマネージャーやメディカルエキスパートによる執筆とレビューを支援することで、このプロセスを合理化できるでしょうか?

この質問に答えるために、AWS 生成 AI イノベーションセンターは最近、メディカルコンテンツ生成のための AI アシスタントを開発しました。このシステムは Amazon Bedrock を使って構築されており、LLM 機能を活用して、疾患啓発に役立つ厳選されたメディカルコンテンツを生成します。このAIアシスタントにより、対象分野の専門家(SME: Subject Matter Expert)が生成プロセスをより細かく制御できるようにしながら、全体の生成時間を数週間から数時間に効果的に短縮できます。また、自動改訂機能により、ユーザーはインタラクティブなフィードバックループを介してLLMと対話し、指示やコメントを直接LLMに送信できます。通常、コンテンツの改訂がプロセスの主なボトルネックであるため、これは特に重要です。

医学関連情報は患者の健康に大きな影響を与える可能性があるため、コンテンツの生成には正確性の確保という要件に対応する必要があります。このため、ファクトチェックとルール評価のためのガードレールが追加され、システムが強化されています。これらのモジュールの目的は、生成されたテキストのファクトチェックと、事前に指定された規則や規制との整合性を評価することです。これらの機能により、LLM の基盤となる生成ロジックの透明性と制御性が向上します。

この投稿では、主にコンテンツ生成モジュールと改訂モジュールに焦点を当てて、実装の詳細と設計の選択肢について説明します。ファクトチェックとルール評価には特別な対応が必要であり、今後の投稿で説明します。

図1: AI アシスタントとそのさまざまなコンポーネントの概要

アーキテクチャ

全体的なアーキテクチャとコンテンツ作成プロセスの主な手順を図 2 に示します。このソリューションは以下のサービスを使用して設計されています。

図2: コンテンツ生成ステップ

ワークフローは下記の通り。

  • ステップ 1 では、ユーザーが、作りたいマーケティングコンテンツの概要をアップロード、および関連する参考論文を選択します。さらに社内ルールやガイドラインの情報を登録します。
  • ステップ 2 では、ユーザーは Streamlit UI を使用してシステムを操作します。最初にドキュメントをアップロードし、次に対象読者と言語を選択します。
  • ステップ 3 では、フロントエンドが WebSocket API と API ゲートウェイ経由で HTTPS リクエストを送信し、最初の Amazon Lambda 関数をトリガーします。
  • ステップ 5 では、Lambda 関数が Amazon Textract をトリガーして PDF ドキュメントからデータを解析および抽出します。
  • 抽出されたデータは S3 バケットに保存され、ステップ 6 と 7 に示すように、プロンプトの LLM への入力として使用されます。
  • ステップ 8 では、Lambda 関数がコンテンツ生成、要約、およびコンテンツ改訂のロジックをリクエストします。
  • オプションで、ステップ 9 では、LLMによって生成されたコンテンツを、Amazon Translateを使用して他の言語に翻訳できます。
  • 最後に、LLM は入力データとプロンプトに基づいて新しいコンテンツを生成します。Lambda 関数を介してそれをウェブソケットに送り返します。

生成パイプラインの入力データの準備

正確なメディカルコンテンツを作成するために、LLMには、対象となる疾患に関連する選別された医学データ(医学雑誌、記事、ウェブサイトなど)が登録されます。これらの文献は、プロダクトマネージャー、メディカルエキスパート、および適切な医療専門知識を持つその他の担当者によって選択されます。

インプットには、生成されたコンテンツが従うべき一般的な要件とルール(トーン、スタイル、対象読者、単語数など)を説明する概要も含まれます。従来のマーケティングコンテンツ生成プロセスでは、この概要は通常、コンテンツ作成業者に共有されます。

また、医療情報のプライバシーとセキュリティを保護するためのHIPAAプライバシーガイドラインなど、より精緻な規則や規制を統合することもできます。さらに、これらの規則は、一般的で普遍的に適用できる場合もあれば、特定のケースに固有の場合もあります。たとえば、一部の規制要件は、一部のマーケット/地域または特定の疾患に適用される場合があります。今回の生成システムでは高度なパーソナライズが可能なため、入力データを調整するだけで、コンテンツを新しい設定に合わせて簡単に調整および個別化が可能です。

コンテンツは、患者または医療従事者のいずれかを対象とする読者に適合させる必要があります。実際、内容のトーン、スタイル、科学的な複雑さを、読者の持っている医学知識にに応じて選択する必要があります。コンテンツのパーソナライズは、地域チーム間の相乗効果と効率の向上につながるため、グローバルで業務を行うライフサイエンス企業にとって非常に重要です。

システム設計の観点からは、厳選された記事や医学論文を大量に処理する必要があるかもしれません。これは、知りたい疾患が高度な医学知識を必要とする場合や、より新しい論文情報などに依存している場合に特に当てはまります。さらに、参考文献には、プレーンテキストまたはより複雑な画像で構成されたさまざまな情報が含まれており、注釈や表が埋め込まれています。システムを拡張するには、この情報をシームレスに解析、抽出、保存することが重要です。この目的のために、エンティティの認識と抽出のための機械学習 (ML) サービスである Amazon Textract を使用しています。

入力データが処理されると、API 呼び出しを通じてコンテキスト情報として LLM に送信されます。Anthropic Claude 3のコンテキストウィンドウは200,000トークンにもなるため、オリジナルの医学コーパスをそのまま使用して生成されるコンテンツの品質を向上させるか(ただし、レイテンシーは大きくなります)、生成パイプラインで使用する前に参考文献を要約するかを選択できます。

医学文献の要約は、全体的なパフォーマンスを最適化する上で不可欠なステップであり、LLMの要約機能を活用することで実現されます。このシステムではプロンプトエンジニアリングを使用して要約の指示をLLMに送信します。重要なのは、要約を実行する場合、タイトル、著者、日付など、記事のメタデータをできるだけ多く保存する必要があるということです。

図3: 簡略版の要約プロンプト

生成パイプラインを開始するには、ユーザーは入力データを UI にアップロードします。これにより Textract がトリガーされ、オプションで要約 Lambda 関数がトリガーされ、完了時に処理されたデータが S3 バケットに書き込まれます。後続の Lambda 関数は入力データを S3 から直接読み取ることができます。S3 からデータを読み取ることで、大きなペイロードを処理する際に Websocket で通常発生するスロットリング問題を回避できます。

図4: コンテンツ生成パイプラインの概要

コンテンツ生成

このソリューションは主に、Bedrock LLMとのやり取りにおけるプロンプトエンジニアリングが重要な役割を担っています。すべてのインプット(文献、概要、ルール)は、LangChain PrompteTemplateオブジェクトを介してLLMにパラメーターとして提供されます。引用スタイルなどをフューショットの入力としてLLMに対して提供します。パラメータ効率の高いファインチューニングの手法は、LLMを医療知識にさらに特化させることができ、後の段階で検討する予定です。

図5: 簡略版のコンテンツ生成プロンプト

私たちのパイプラインは、さまざまな言語でコンテンツを生成できるという意味で多言語です。たとえば、Claude 3は英語以外にも数十種類の言語でトレーニングされており、それらの言語間でコンテンツを翻訳することができます。ただし、ターゲット言語が複雑なため、特殊なツールが必要な場合もあることを認識しています。その場合は、Amazon Translate を使用して追加の翻訳手順を実行する必要があります。

図6: エーラス・ダンロス症候群の原因、症状、合併症に関する記事の生成を示す動画

コンテンツ改訂

文書の改訂は、LLMにフィードバックを繰り返し求めることで、生成されたコンテンツをさらに調整できるようになるため、このソリューションにおける重要な機能です。このソリューションは主にアシスタントとして設計されているため、これらのフィードバックループにより、既存のプロセスとシームレスに統合でき、専門家が正確なメディカルコンテンツを設計する際に効果的に支援できます。たとえば、ユーザーは、以前のバージョンではLLMで完全には適用されていなかったルールを適用したり、一部のセクションの明確さと正確さを向上させたりすることができます。文書の改訂はテキスト全体に適用できます。または、ユーザーは個々の段落を修正することを選択できます。いずれの場合も、改訂版とフィードバックは新しいプロンプトに追加され、LLM に送信されて処理されます。

図7: 簡略版のコンテンツ改訂プロンプト

LLM に指示を送信すると、Lambda 関数は更新されたプロンプトで新しいコンテンツ生成プロセスをトリガーします。全体的な構文の一貫性を保つには、他の段落はそのままにして、記事全体を再生成することが望ましいです。ただし、フィードバックが提供されたセクションのみを再生成することで、プロセスを改善できます。この場合、テキストの一貫性に適切な注意を払う必要があります。この改訂プロセスは、コンテンツがユーザーに満足のいくものであると判断されるまで、以前のバージョンを改善することで再帰的に適用できます。

図8: エーラス・ダンロス症候群の文献の改訂を示す動画で、例えばユーザは追加情報を要求できる

結論

LLMで生成されたテキストの品質が最近向上したことで、生成AIは、幅広いプロセスやビジネスを合理化および最適化する可能性を秘めた変革的なテクノロジーになりました。

疾患啓発のためのメディカルコンテンツの生成は、LLMを活用して厳選された質の高いマーケティングコンテンツを数週間ではなく数時間で作成する方法を示す重要な例です。これにより、オペレーションが大幅に改善され、地域チーム間の相乗効果が高まります。改訂機能により、このソリューションは既存の従来のプロセスとシームレスに統合でき、メディカルエキスパートやプロダクトマネージャーを支援する真のアシスタントツールとなります。

疾患啓発のためのマーケティングコンテンツは、生成されるコンテンツの正確性が極めて重要な、規制の厳しいユースケースの例でもあります。専門家がハルシネーションや誤った記述の可能性を検出して訂正できるように、生成されたテキストに出典文献を明記することで潜在的なずれを検出することを目的としたファクトチェックモジュールを設計しました。

さらに、ルール評価機能は、ルールや規制の不適切な表現を自動的に強調表示することで、専門家のMLRプロセスに役立ちます。これらの補完的なガードレールにより、生成パイプラインのスケーラビリティと堅牢性の両方を確保し、その結果、業務に実装可能な安全で責任あるAIの導入を実現しています。

参考文献

  • Vaswani, Ashish, et al. “Attention is all you need.” Advances in neural information processing systems 30 (2017).
  • Brown, Tom, et al. “Language models are few-shot learners.” Advances in neural information processing systems 33 (2020): 1877-1901.
  • Meskó, Bertalan, and Eric J. Topol. “The imperative for regulatory oversight of large language models (or generative AI) in healthcare.” NPJ digital medicine1 (2023): 120.
  • Clusmann, Jan, et al. “The future landscape of large language models in medicine.” Communications medicine1 (2023): 141.
  • He, Kai, et al. “A survey of large language models for healthcare: from data, technology, and applications to accountability and ethics.” arXiv preprint arXiv:2310.05694 (2023).
  • Mu, Weiyi, et al. “Factors affecting quality of life in children and adolescents with hypermobile Ehlers‐Danlos syndrome/hypermobility spectrum disorders.” American journal of medical genetics Part A 179.4 (2019): 561-569.
  • Berglund, Britta, Gun Nordström, and Kim Lützén. “Living a restricted life with Ehlers-Danlos syndrome (EDS).” International Journal of Nursing Studies 37.2 (2000): 111-118.

著者

Sarah Boufelja Y. データサイエンスと機械学習の分野で8年以上の経験を持つシニアデータサイエンティストです。GenAIIセンターでの職務では、機械学習と生成AIのツールを使用して、主要な関係者と協力してビジネス上の問題に対処しました。彼女の専門分野は、機械学習、確率論、最適輸送の融合にあります。

Liza (Elizaveta) Zinovyeva AWS 生成AI イノベーションセンターの応用科学者で、ベルリンを拠点としています。彼女は、さまざまな業界のお客様が生成AIを既存のアプリケーションやワークフローに統合できるよう支援しています。彼女はAI/ML、金融、ソフトウェアセキュリティのトピックに情熱を注いでいます。余暇には、家族と過ごしたり、スポーツをしたり、新しいテクノロジーを学んだり、テーブルクイズを楽しんだりしています。

Nikita Kozodoi AWS 生成AI イノベーションセンターの応用科学者で、さまざまな業界のお客様の現実世界のビジネス問題を解決するための生成AI と ML ソリューションの構築と開発を行っています。余暇には、ビーチバレーボールをするのが大好きです。

Marion Eigner 複数の生成AIソリューションの立ち上げを主導してきた生成AIストラテジストです。エンタープライズ・トランスフォーメーションとプロダクト・イノベーションに関する専門知識を持つ彼女は、生成AIを活用した新しい製品やサービスの迅速なプロトタイプ作成、上市、拡張を企業を支援することを専門としています。

Nuno Castro AWS 生成AI イノベーションセンターのシニア応用科学マネージャーです。生成AIカスタマーエンゲージメントを率い、AWSのお客様がアイディエーション、プロトタイプ、プロダクションに至るまで、最もインパクトのあるユースケースを見つけられるよう支援しています。金融、製造、旅行などの業界で17年の経験があり、10年間MLチームを率いてきました。

Aiham Taleb, PhD 生成AIイノベーションセンターの応用科学者であり、AWSの企業顧客と直接連携して、影響の大きいいくつかのユースケースで生成AIを活用しています。Aihamは教師なし表現学習の博士号を持ち、コンピュータービジョン、自然言語処理、医療画像処理など、さまざまな機械学習アプリケーションにまたがる業界経験があります。


このブログは Senior Solutions Architect, HCLS の松永と Senior Business Development Manager の亀田が翻訳しました。