AWS Startup ブログ

【開催報告 & 資料公開】ヘルスケア領域における生成AIの活用 ~DeNA・アルムの取り組み~ HCLS Startup Day #5

このたび、2024 年 5 月 28 日に、今年初の Healthcare and Life Sciences Startup Day  (略称:HCLS Startup Day ) を開催いたしました。HCLS Startup Day とは、その時々で注目されているトピックを選出し、それらのテーマに精通した専門家を招待することで、知識と経験を共有するコミュニティ主導のイベントです。(2023年の振り返りブログ)

今回のイベントでは、「ヘルスケア・メディカル領域における生成AIの活用」をテーマに、AWS スタートアップ事業本部 ヘルスケア・ライフサイエンス担当の尾原、そして特別ゲストとして DeNA AI エンジニア 兼 PdM 森さま、アルム 研究開発部 Join プロダクトグループの 佐藤さまに登壇いただきました。

アジェンダは以下の通りで、本記事では セッションおよび Q&A セッションの内容を要約してレポートいたします。

<アジェンダ>

· 19:05-19:30: ヘルスケア領域における AWS の生成 AI 利活用

アマゾンウェブサービスジャパン (AWS) Startup HCLS SA 尾原 颯

· 19:30-20:10: 非構造化データの構造化におけるLLMの検証

株式会社 ディー・エヌ・エー (DeNA) AI エンジニア 兼 PdM 森 大輝

株式会社 アルム 研究開発部 Joinプロダクトグループ 佐藤 里佳

· 20:10-20:30: Q&A セッション

上記3名 & 株式会社 アルム イノベーショングループ 研究開発部 Fernando Wong

· 20:30-21:25: ネットワーキング

ヘルスケア領域における AWS の生成 AI 利活用


アマゾンウェブサービスジャパン (AWS) Startup HCLS SA 尾原 颯

AWS での生成 AI

Amazonでは、過去25年以上にわたり AI と機械学習(ML)を活用してきました。その中で学んだ最も重要な教訓の一つは、ビジネスに価値をもたらし、競争優位性を確保するためにデータの重要性を理解することです。 多くの方は生成 AI について語る際に、基盤モデルや LLM に注目しますが、生成 AI アプリケーションは氷山の一角に過ぎません。 データの蓄積、加工、分析といった作業に加え、プライバシーの遵守やアクセス制御を確保するためのガバナンスプロセスも考慮する必要があります。

AWSでは、日々お客様の声に耳を傾ける中で、生成AIを提供するために必要な3つの要素が明らかになりました。

1. 高性能でコスト効率の良いインフラ

2. 安全でプライバシーを保護しつつ、基盤モデルを使って新しいアプリケーションを簡単に構築・拡張する方法

3. ビジネスの背景や文脈に適応できる生成AIアプリケーションと機能

このように、お客様それぞれのデータやユースケースに応じた生成 AI の構築とスケーリングを実現するために、AWS では基盤モデルを活用した多様なサービスを提供しています。

具体的には、構築済みのアプリケーションを利用するケース、API を通じて基盤モデルを利用するアプリ開発のケース、そして基盤モデルを開発・カスタマイズするケースがあります。

ヘルスケアでの生成 AI 利活用

ヘルスケア分野では、生成 AI のさまざまなユースケースがあります。

臨床研究の分野では、データクリーニングの自動化や、患者間のクエリで臨床試験に適したものを特定することで、臨床研究を促進できます。

医師の業務効率化においては、患者の会話記録、臨床記録の要約、複数の情報源からの記録を電子カルテに統合することで、退院サマリーの作成など、臨床医のワークフローをサポートできます。また、患者データに基づいて最適な画像検査と診断を提案することも可能です。

院内向けの事務作業では、医療請求書類の自動生成や、チャットボットを使って文書を検索したり、IT、人事、その他の社内質問に回答することができます。

患者体験を向上させるユースケースでは、個別化された情報提供に加え、 生成AIがコンシェルジュのような役割を果たし、患者との積極的なコミュニケーション、退院後のケアガイダンス提供、患者にわかりやすいレポートの生成などが可能です。さらに、文書や書類の自動作成による業務効率化や、患者の治験結果予測や治療計画のパーソナライズ化など、多岐にわたる応用が考えられます。

一方で、ヘルスケア分野での生成 AI 活用における課題点もあります。

  1. 技術課題 –  偏ったデータセットによる不公平性や、複雑なモデルの解釈の難しさ。
  2. 倫理的考慮 –  患者データの学習利用によるプライバシーやセキュリティ侵害のリスク。
  3. 組織的障害 –  目的のアラインメント不足による非効率な業務プロセスや、AIツールの適切な理解と活用方法の欠如。

これらの課題を解決し、責任あるAIを利用するためには、以下の要素が重要です:

  1. 公平性 – システムがユーザー集団 (性別や民族など) に応じて与える影響を考慮する。
  2. 説明可能性 – AI システムの出力結果を理解し評価する仕組みを構築する。
  3. 堅牢性 – AIシステムの確実な運用を実現するための仕組みを整える。
  4. プライバシーとセキュリティ – プライバシーに配慮したデータ利用と、盗難や流出からの保護を確保する。
  5. ガバナンス – 責任あるAIの実践を定義し、実装し、遵守するプロセスを導入する。
  6. 透明性 – ステークホルダーが十分な情報を得た上でAIを利用できる仕組みを提供する。

非構造化データの構造化におけるLLMの検証


(左) DeNA AI エンジニア 兼 PdM 森 大輝 様、(右) アルム 研究開発部 Joinプロダクトグループ 佐藤 里佳 様

Joinとは

DeNA の子会社である株式会社アルム は、医療 ICT 分野におけるデジタル技術とノウハウを活かし、様々なアプローチで医療分野での事業展開を行っている企業です。同社は、 院内外問わず様々な場面で医療関係者のコミュニケーションを支援するアプリである「Join」を提供されています。Join には、チャット、音声/ビデオ通話、DICOM ビューワー、臨床データ共有などが搭載されており、日本初の保険適用アプリとして、世界30カ国以上に導入実績があります。

医療症例機能における課題

アルムでは、Join の新機能として『医療症例機能』の検証を行っています。この機能はチャット、音声/ビデオ通話、PDFなど複数形式で共有された非構造化の臨床情報を、構造化された臨床データとして提供するものです。これにより、アプリ内で構造化された医療データを収集し、各医療機関のユースケースに合わせてカスタマイズした臨床ワークフロー(プロトコル)を作成することができます。

しかし、この機能の実装には、以下の課題がありました。

  1. 情報過多と時間的制約  –  医療スタッフは、一日の終わりにチャットなどを見直して臨床フォームに情報を再入力するのに多くの時間と労力を要し、エラーも発生しやすい。
  2. 医療ワークフローの多様性 –  病院や国によって医療ワークフローが異なるため、従来の方法では非構造化データから医療情報を抽出するのが困難。
  3. 医療テクニカルワードへの対応 – 医療分野の専門性は非常に高く、医療知識と文脈依存性を考慮する必要がある。また商用利用できる医療データセットが少なく、進化し続ける医療分野への対応が必要。
  4. 医療個⼈情報の扱い –  国によって法律や規制  (GDPR, HIPAAなど) が異なり、法令を遵守したセキュアなデータ管理が不可欠。

課題に対する解決策

これらの課題に対し、アルムでは LLM を活用し、臨床データの自動抽出と構造化に取り組んでいます。様々な入力形式からテキストデータを取得し、長文からも関連情報を抽出することで、医療ワークフローの多様性に対応しつつ、医療スタッフの作業負荷を大幅に軽減することを目指しています。

医療分野特有の専門用語や文脈依存性への対応については、完全自動化ではなく、人間の医師が介在してデータの正確性を検証する「ヒューマン・イン・ザ・ループ」の手法を採用しています。精度と信頼性を確保するために、医療従事者と協力しながら、一つ一つのミスに対してプロンプトを改善するアプローチも取られています。

個人情報保護の観点では、設計段階から慎重に検討を重ね、Amazon Bedrock の活用により、データを AWS 環境内に閉じたまま処理し、高度なセキュリティ対策とセキュアな環境での LLM 活用を実現してます。

検証結果と今後

実際に、脳卒中患者の擬似データ40件を用いて、脳卒中プロトコルに基づく固有表現抽出の検証実験を実施しました。その結果、Anthropic 社 の Claude 3 モデルが Amazon Bedrock 経由で出力した値の正解率は 97.4% に達し、検証に利用した計 8 つの LLM の中で最も優れた数字となりました。

モデルは進化し続ける中で、今後はタスクに応じて LLM を使い分けていく方針です。並行して、医療従事者との継続的なPDCA サイクルを実践し、彼らからのフィードバックを活かしてプロンプトの改善することで、更なる精度向上を目指していきます。

このような取り組みには、医療分野特有の難しさがありますが、テクノロジーと人間の専門家を上手く協働させながら、一歩ずつ前進していきます。

Q&A セッション


(右) アルム イノベーショングループ 研究開発部 Fernando Wong 様

他社クラウドプロバイダーも生成AIに力を入れている中で、Bedrockを活用している理由は?

·    森さん – 大きく二つの理由があります。一点目は、多様な FM にアクセスが可能な点です。日々新しいバージョンのモデルがアップデートされる中で、一つのモデルに依存せずに、単一のAPIを介して、Claude 3 や Llama 3 を自由に切り替えられるのは、Bedrock ならではだと思います。二点目は高度なデータプライバシーとセキュリティの観点です。Private Link を利用することで、インターネットに出ずに、プライベートなネットワーク内で利用することができる。そして現時点では、東京リージョンで使えるモデルを限られますが、東京リージョンを選択することで、入出力データを国内に保持できる点もとても重要なポイントだと思います。

Joinのアプリを導入することに対して、医療機関からの抵抗はありました?

·    佐藤さん – Join が日本ではじめて保険診療の適用が認められた医療機器プログラムとして認定されたのが、2016年のこと。現在は日本やブラジルなど様々な国の医療機関に導入されている。その背景としては、日本の他にも米国(FDA)、欧州(CE)、ブラジル、サウジアラビアの医療機器認証を取得している点に加えて、HIPAA、GDPR、ISO 27001 などの認証を取得することにより、信頼できる実績を作れている。導入によってポジティブな効果があるという口コミが広がったりもして、導入数も増えた。

Join 導入済みの医療機関にたいして LLM を活用した新機能をリリースするのに拒否反応は?

·    佐藤さん – 印象として、医療機関のデータが学習として利用されるのではと思われる可能性はある。実際に機能として実装する際は、希望する医療機関のみが自分で判断して機能をオンしていただけるようにする等、利用者の意思を反映できるようにしたい。

·    尾原さん – 補足として、Amazon Bedrock 上で利用いただいたデータに関しては、一切モデルプロバイダーに提供されないです。唯一提供されるデータとしては、どれぐらい使ったかという利用量に関するデータのみ。

モデル検証時に医療分野のような高い専門性を克服するためにどういった取り組み?

·    フェルナンドさん – テクニカルタームへの対応に関しては、週次で医療従事者と LLM の出力内容をチェックする場を設けている。そこでデータを見て、ミスの傾向があるところは、Promptに反映していく形で PDCA を回している。現状は、RAG が必要になっておらず、Prompt のみで上手くチューニングできている。

ファインチューニングしてる?医療機関で 97% って低くないですか?

·    森さん – 現状ファインチューニングはしていない。LLM の関係者は色々な意見をもっており、我々も今後使う可能性はあるが、僕自身の意見としては、ファインチューニングには否定的。ファインチューニングによって LLM が壊れることも多々ある。Claude 3 Opus レベルになると、プロンプトや RAG でコントロールする方が筋がいいと思っているので、ファインチューニングの優先度は下げて開発を行っている。一応 human in the loop の仕組みがあり、97% の精度はかなり医師の負担を軽減できる数字だと思う。しかし、ほぼ 100% に近づけていきたいと思っている。

LLMが抱える問題は人間が抱えている問題と似ている。人間同様 AI も過ちを犯すものという前提で活用を考えた方が建設的では?

·    尾原 – AIはミスを犯すもの。生成 AI (基を辿れば機械学習)の領域というのは、確率の世界でしかなく、100%というのは存在しない世界の中で作られている技術。その為、間違いを犯したときに、どのように対処をするのかといった話をするのが建設的。例えば、Amazon Pharmacy は、LLM(Chatbot) の回答をすぐにユーザーに返さずに、一回担当者 (オペレーター)が確認してから返すような仕組みを入れている。

·    森さん – 全く同意。そもそも LLMの学習データが全て正しいとはいえないし、間違いを犯す前提で考えるべき。

終わりに

本記事では、2024 年 5 月 28 日に開催した ヘルスケア領域における生成AIの活用 ~DeNA・アルム社の取り組み~【HCLS Startup Day @ AWS Startup Loft #5】についてレポートいたしました。最後までご愛読いただき誠にありがとうございました!

今後も、皆さまと共にヘルスケア・ライフサイエンス業界を盛り上げていきたいと思います!

「このテーマについてさらに深く知りたい」や、他にご質問やご要望がある場合は、 こちらの宛先 までお気軽にお問い合わせください。
引き続きどうぞよろしくお願いいたします!

著者について

浦田 力樹 (Riki Urata) は、AWS Japan にて主にヘルスケア・ライフサイエンス領域のスタートアップのお客様を担当しています。趣味は野球とゴルフ。好きなアスリートは大谷翔平選手。ロールモデルは桑田真澄さん。

 

 

鈴木 賢人(Kento Suzuki)は、AWS Japan にてゲーム・エンターテインメント領域のお客様を担当しています。趣味は旅行と日曜エンジニアリングで、好きなサービスは AWS Lambda です。