Amazon Web Services ブログ
Summit Tokyo 2023 ヘルスケア・ライフサイエンスブース 開催報告ブログ
2日間にわたって開催されたAWS Summit Tokyoでは、総勢25,000名を超える方々にご来場いただき、4年ぶりのオンサイトでのイベントは、150以上のセッションや180以上のブースが展示され、大盛況のうちに幕を閉じました。ヘルスケア・ライフサイエンスに関連したセッションとしては、キーノートセッションでインテグリティヘルスケア様が、またブレイクアウトセッションでは中外製薬様や国立病院機構様が登壇されました。
今回のブログでは、数あるブースの中でもヘルスケア・ライフサイエンスブースを取り上げてご紹介します。このブースでは、2022年のre:Invent で発表された新サービスやお客様の関心が高いソリューションを中心に3つのデモを展示しました。1つ目は、個別化医療の発展を背景にゲノムデータを含むマルチオミクスデータを保存、クエリ、分析し、データからインサイトを取り出す新サービス“Amazon Omics”、2つ目は、医療現場では画像検査の実施件数が全世界で55億件を超えると言われ、データサイズが増加の一途を辿るペタバイトクラスの医用画像を簡単に保存、共有、分析ができるHIPAA対応の新サービス“Amazon HealthLake Imaging”、そして最後に、研究者の反復業務を機械学習で自動化し、より付加価値の高い業務に向き合うために、動態検知の自動化に貢献するAI/MLサービス“Amazon Rekognition Custom Labels”です。以下のパートでこの3つのデモを詳細にご紹介します。
WebappとAmazon Omicsによるゲノムデータの大規模計算とAWSサービスを利用した解析デモ [Slide]
Amazon Omics は、ヘルスケア・ライフサイエンス領域のお客様をご支援する、業界特化型の新サービスです。Amazon Omics を利用することで、ゲノムデータ、トランスクリプトームデータ、その他のオミックスデータを保存、検索、分析し、そのデータから健康の改善と科学的発見の促進につながるインサイトを生み出すことに役立てることが可能です。
今回のデモでは、ゲノム変異解析について、プロジェクトリーダーやバイオインフォマティシャン、リサーチャーが Amazon Omics ワークフローをより簡単に操作することが可能な Web アプリケーション (Webapp)、Amazon Omics で実施するゲノムデータの大規模計算、AWS サービスを利用した解析をご紹介します。
デモは、上図の利用シチュエーションを想定しています。オンプレミスのシーケンサーから取得したゲノムデータが Amazon S3 バケットにインポートされると、プロジェクトリーダーは解析に必要なワークフローについて Nextflow や WDL の実行環境である Docker イメージとワークフローの定義ファイルを用意して、Webapp から各リソースをアップロードしてワークフロー定義を行います。定義されたワークフローはバイオインフォマティシャンやリサーチャーによって実行され、Amazon Omics で大規模にスケールした環境で計算が行われます。得られた結果はバイオインフォマティシャンによって Amazon SageMaker の Jupyter Notebook 上でインタラクティブな解析が行われ、左記の解析結果は BI ツールのサービスである Amazon QuickSight を利用することでリサーチャーからも確認可能です。
デモで登場する Webapp はバイオインフォマティクスに関わるバイオインフォマティシャンやリサーチャーのための Web アプリケーションです。Amazon Omics ワークフローを Webapp から操作可能であったり、実行中のワークフローのステータスをチャートとテーブルで視覚化したり、プロジェクトリーダーがメンバー作成やグループへの追加が可能です。この Webapp は aws-samples にオープンソースとして提供されております。詳細はこちらをご参照ください。
解析のデモでは、過去に AWS ブログで紹介されているシナリオを実施しています。非アルコール性脂肪性肝疾患 (NASH/NAFLD) を被験した患者データをもとに、患者毎に病原性のある遺伝子や病気を引き起こす可能性が高い病原性バリアントをもつ遺伝子を可視化した結果、以下のグラフから全患者が家族性高コレステロール血症のリスクを高める APOA2 遺伝子のバリアントを持っていることが確認できます。また NAFLD と高コレステロール値および肥満との間には関連性があるという幾つかのエビデンスがあり、実際に3名の患者は Type-1 Diabetes (1型糖尿病) に罹患しやすくなる IL2RA バリアントを持っていることも確認可能です。
Amazon HealthLake Imaging による画像保管とDICOM Web Viewerを用いたメタデータ検索 / 医用画像表示 [Slide]
Amazon HealthLake Imagingは2022年11月に発表された医用画像を扱うストレージサービスです。執筆時点ではプレビュー中でお客様からのフィードバックを基に機能改善しています。医用画像はDICOM(Digital Imaging and Communications in Medicine)という国際医療技術標準に基づいて、ファイル形式や通信プロトコルが定められています。DICOMの特徴はピクセルデータ(画像)だけではなく、患者情報や検査情報といった文字情報を含めて、1つのファイルになっていることです。
Amazon HealthLake Imagingでは、そのDICOMファイルを取り込み、文字情報はJSONとして、ピクセルデータはHTJ2K(High-Throughput JPEG 2000)という圧縮形式で保管します。アプリケーション開発者はDICOMを意識せずに、Amazon HealthLake ImagingのAPIを呼び出すことで、対象となる医用画像を検索し、文字情報や圧縮画像を取得することが出来るようになります。ブースではオープンソースのDICOM Viewerを改修し、Amazon HealthLake ImagingのAPIを呼び出すデモを展示しました。
同アプリケーションの検査リスト画面からは患者IDや患者名などの検索条件に応じて、DICOMファイルに含まれる文字情報を素早く取得し、患者/検査情報をリスト表示しています。リストから該当する検査を選択することで、圧縮画像を取得し、HTJ2Kの伸長では複数のCPU/GPUで並列処理することで高速に表示することができます。
今後、医用画像の解像度の向上や画像枚数の増加はストレージ容量と画像表示速度における課題となります。AWSではそのようなお客様からいただいた課題解決のために、医用画像に特化したサービスを提供しようとしています。今回のデモからは、既存のアプリケーションからAmazon HealthLake Imagingを利用するイメージを掴んでいただけたと思います。APIは主要なプログラミング言語から利用可能なので、Pythonで医用画像を機械学習に活用するなど、様々なユースケースでお使いいただけます。デモブースに来場されたお客様からも、自社で開発している製品のインフラとして活用できそうといった声や、増え続ける医用画像のバックアップや運用管理に使いたいという声をいただきました。今後、一般公開を予定しておりますので、ご興味を持たれた方はお問い合わせページよりご連絡ください。
Amazon Rekogntion Custom Labelsを用いた動態検知 [Slide]
創薬における行動評価は、薬理作用と安全性の観点で重要です。しかし、行動評価には労力がかかるだけでなく、研究員による評価のばらつきや多様な行動識別のトレーニングといった課題があります。このような課題をAI技術で解決できれば、研究員は論文執筆や他の優先度の高い研究に時間を費やすことができます。ただ、評価すべき行動は多様であるため一般的なモデルでは検出が難しいため、独自の行動評価モデルが必要になります。しかし、モデルの精度向上にはアルゴリズムの選定やチューニングといったMLの専門知識はもちろん、評価したい行動の大量のデータセットが必要です。Amazon Rekognition Custom Labelsは、多くのカテゴリにわたる数千万もの画像を用いてトレーニングされたAmazon Rekognitionの既存機能を基に構築されています。そのため、少量のデータセット(数十枚から)を用意するだけで、MLの専門知識なしに精度の高いモデル作成が可能です。ブースでは、太鼓を叩くおもちゃを用意し、太鼓を叩くアクション(動画内の赤枠)と頷くアクション(動画内の緑枠)をAmazon Rekognition Custom Labelsで事前トレーニングしたモデルを用いて、その場で撮影した動画の解析結果をウェブアプリケーションで再生するデモを行いました。アップロードした動画を連続静止画に分割し、各静止画に対してDetectCustomLabelsを用いてName, Confidence, BoundingBoxの情報を取得して画像にマージし、全ての解析が完了すると連続静止画を動画に再構築しています。
※赤枠: 太鼓を叩くアクション、緑枠: 頷くアクション
トレーニング用のデータセットはAmazon Rekogntion Custom Labelsのコンソール上にてラベリングして準備可能ですが、行動評価のデータはWebカメラなどで撮影された動画であるため、動画をフレーム分割して1枚ずつラベリングするには時間がかかります。そこで、今回はAmazon SageMaker Ground Truthを用いて動画ファイルを自動フレーム分割し、自動ラベリングのPredictionを用いてラベリングデータの準備時間を大幅に削減しています。執筆時点では、Amazon SageMaker Ground TruthでラベリングしたデータセットをAmazon Rekognition Custom Labelsにインポートするにはマニフェストファイルの書き換えが必要です。ラベリングとマニフェストファイルの書き換えについては、こちらを参照ください。
おわりに
本ブログでご紹介したデモに関して、ご興味・ご質問をお持ちのお客様はお問い合わせフォームもしくは担当営業までご連絡ください。またご紹介した、キーノート、ブレイクアウトセッションの講演内容はこちらでアーカイブでご視聴いただけます。
参考コンテンツ:
Amazon Omics コードデモ:https://github.com/aws-samples/amazon-omics-webapp-integrations
Amazon Rekognition Custom Labels コードデモ: https://aws.amazon.com/blogs/machine-learning/detecting-playful-animal-behavior-in-videos-using-amazon-rekognition-custom-labels/
ヘルスケア・ライフサイエンス領域向けAWSウェブサイト:https://aws.amazon.com/jp/local/health/