Amazon Web Services ブログ
AWSを利用した創薬向けクライオ電子顕微鏡コンピューティング環境の最適化
高エネルギー加速器研究機構(以下、KEK)は、クライオ電子顕微鏡(Cryo-EM)の単粒子解析法に関わるコンピューティング環境の最適化の研究をAWSを利用して実施されています。今回この取り組みが英国科学誌 Nature の姉妹紙である Communications Biology に論文として掲載されました。これに関連する KEK プレスリリースはこちらとなります。KEK と AWS は研究DX加速のため連携強化を2022年に発表しており、今回の論文掲載はその成果の一つとなります。この論文では、GoToCloud の全体アーキテクチャだけでなく、単粒子解析の各ステップでのCPUおよびGPU搭載インスタンスでの性能評価や、セキュリティ上の考慮点についても述べられており、GoToCloud の利用者だけでなくクラウド上で同様の解析を行う方々にとって参考になる内容です。
Cryo-EM は、膜タンパク質を含む多くの創薬のターゲットとなる物質(タンパク質などの生体高分子)の3D構造を原子分解能で可視化するために広く用いられている手法です。しかしながら構造ベースの創薬(SBDD:Structure-Based Drug Design)に必要なスループットが達成されておらず、検出器の技術や画像取得方法の急速な進歩により、データ解析が大きなボトルネックとなっていました。KEK は Cryo-EM における高度なデータ解析と管理のためにクラウドコンピューティングベースのプラットフォームである「GoToCloud」プロジェクトを実施しています。各処理ステップごとに最適な並列計算を選択することで、コンピューティングリソースを最適化し、スループットを高めつつ、コストの最適化を行うことができます。GoToCloud では、インスタンスの選択などを含めた並列処理設定や必要な目標分解能が、処理時間とコストパフォーマンスに大きな影響を与えることが実証されています。Cryo-EM SBDD を加速する有望なプラットフォームの1つとして GoToCloud の利用があげられます。
KEK の GoToCloud 環境では、AWS ParallelCluster を利用しています。この AWS ParallelCluster はハイパフォーマンスコンピューティング(HPC)のクラスタ環境を構築、構成、管理ができるもので、必要に応じてコンピューティングリソースを増減させて効率的に使うことが可能です。この GoToCloud 環境では、AWS上で複雑な処理環境の構築とセットアップの手順を自動化し3つの手順にまで簡略化しています。Cryo-EM 単粒子解析用のソフトウェアの実行を、各ステップごとに最適なインスタンス(主に GPU 搭載の有無)で行うため、RELION(Cryo-EM 構造解析のためのソフトウェアパッケージ) の実行ファイルを複数種類用意して利用しています。これまで解析環境の準備や運用に課題があり個別の解析環境を持つことが出来なかったユーザにとって、この GoToCloud 環境を使うことで、データ処理ソフトウェアの保守や最適化など技術的な面を気にすることなく、データ解析作業に集中できるようになります。Cryo-EM 施設側でセットアップした環境を個別のユーザが利用、各ユーザ自身のAWSアカウントに GoToCloud 環境を構築して利用のどちらの形も可能となっており、既に製薬企業や他の研究機関でもご活用いただいております。
図 GoToCloud 構成図(KEK公開事例より)
KEK は継続して各ステップごとに最適なインスタンスタイプの割り出しやスポットインスタンスを利用したトータルコスト削減、処理時間の削減に取り組んでいます。またクラウドサービスを有効的に活用することで、GoToCloud において Cryo-EM 単粒子解析をサポートするより高度なシステムへの拡張を目指しています。複数の Cryo-EM 施設をインターネットを介してクラウドに接続する IoT化や、機械学習などを用いたアルゴリズムの開発など高度な自動化を進めていく予定です。このように AWS を利用していただくことで、解析環境を柔軟に構築、利用ができ、コスト最適化をしながら、AWS の様々なサービスと組み合わせていただくことで、システムの機能拡張の取り組みをさらに加速していただくことが可能となります。
アマゾン ウェブ サービス ジャパン合同会社 常務執行役員 パブリックセクター統括本部長 宇佐見 潮は、次のように述べています。「AWS は、これまでにも高エネルギー加速器研究機構とは HPC(ハイパフォーマンスコンピューティング)分野において深く連携を図ってきました。今回の「GoToCloud」プロジェクトは飽くなき探求心が生んだ成果だと考えております。クラウドコンピューティングの可能性を最大限に生かし、研究開発の新たな地平を切り開く取り組みを支援できることを大変光栄に思います。AWS はその架け橋となることで、日本の研究分野における無限の可能性に貢献していきます。」
■ KEKプレスリリース: 「クラウドコンピューティング環境の活用で加速する タンパク質立体構造に基づく新しい創薬デザイン! ~「GoToCloud プラットフォーム」の開発~」
・ 高エネルギー加速器研究機構について
高エネルギー加速器研究機構 (KEK) は、電子や陽子などを加速する粒子加速器と呼ばれる装置を使う加速器科学の世界的拠点の一つです。国内外の研究者と共同研究を行うとともに、共同利用の場を提供する大学共同利用機関法人として、素粒子、原子核の謎の探究や物質、生命現象の理解に取り組んでいます。ノーベル賞との関わりも深く、ここで行われた実験による成果で、物理学賞と化学賞が生まれています。前身の旧文部省高エネルギー物理学研究所は 1971 年に創設され、現在、茨城県つくば市と東海村に拠点を持っています。詳細については以下の URL をご覧ください。
https://www.kek.jp/
・クライオ電子顕微鏡 (Cryo-EM)について
精製したタンパク質などの生体高分子を溶かした液体を急速に凍らせ、液体窒素で-200℃ぐらいの低温に保ったまま、透過型電子顕微鏡(TEM)を用いて撮影した 2D 画像から、コンピューターによる画像処理で生体高分子の立体構造を決定します(この技術を開発した 3 名は 2017 年、ノーベル化学賞を共同受賞しています)。タンパク質は、電子顕微鏡内部の高真空にさらされると干からびて形が変わってしまいますが、薄い氷の中に閉じ込めて保護・固定して観察します。歴史の長いX線によるタンパク質の構造解析では、良質な結晶が必須で作成する負担が大きいですが、Cryo-EM ではその必要がないため、結晶化が困難な巨大なタンパク質やその複合体の構造解析に力を発揮しています。ただ氷の中のタンパク質の向きはまちまちであるため、別々に撮影した膨大な数の 2D 画像からそれぞれのタンパク質粒子像の三次元的な撮影方向を推定することでうまく重ね合わせて立体構造を再現する複雑な計算をしなければなりません。そのため、膨大な計算資源が必要になります。
【日本の高等教育機関および研究機関向け お問合せ窓口】
AWSのご相談全般に関しては「aws-jpps-er@amazon.com」までご連絡ください。。
* * * *
本記事は、パブリックセクターシニアソリューションアーキテクト櫻田が執筆しました。