投稿日: May 25, 2022

  • 日本の創薬を支えるタンパク質の構造解析を AWS のクラウドで構築した「GoToCloud」プラットフォームを利用して 7 倍高速化、60% の管理コスト削減を実現、さらに 85% の削減を目指す
  • AWS は日本で 300 万人以上が利用する学術情報ネットワーク(SINET6)に、AWS Direct Connect を利用して複数の 100Gbps 物理回線を新たに敷設

Amazon.com, Inc. の関連会社であるアマゾン ウェブ サービス ジャパン合同会社(以下、AWS)と高エネルギー加速器研究機構(以下、KEK)は、AWS クラウドを活用する KEK の「GoToCloud」*プラットフォームの構築および今後の展開について連携を強化することを発表いたしました。「GoToCloud」は、タンパク質の構造解析にかかる時間およびコストを大幅に削減し、構造生物学研究を含む日本の科学研究分野におけるデジタルトランスフォーメーション(研究 DX)を加速させます。新型コロナウイルス感染症の世界的流行を背景に、ワクチン開発につながる抗体や薬剤のターゲットとして使われるタンパク質に関する研究が増加するのに伴い、タンパク質の構造解析需要も拡大しています。KEK と AWS はこの度の連携強化により、生命の起源の理解や創薬研究など様々な研究領域において、タンパク質の構造解析を利用する全ての日本の研究者が、世界トップクラスの研究成果を数多く生み出していくことを支援します。
* GoToCloud: KEK がタンパク質の構造解析を行うために AWS のクラウドサービスを活用して構築したプラットフォームで、他の研究機関などにも展開を進めるプロジェクト

タンパク質の構造は従来、X 線結晶解析で調べられてきましたが、タンパク質の立体構造を 3D で詳細に解析するクライオ電子顕微鏡と呼ばれる生体分子観察技術も併用することで大幅な進展が達成されており、ここ 4 年間で国内だけでも台数は 3 倍以上になりました。クライオ電子顕微鏡によるタンパク質の構造解析の需要が急増する一方、撮影後の画像データの解析にかかる計算量が膨大であることが課題でした。KEK では高まる需要に対応するため、早急に計算時間を短縮する必要があると考えました。そこで 2021年、従来のオンプレミス型のインフラから、ストレージやコンピュートなど幅広く奥深い AWS のクラウドサービスを活用した「GoToCloud」環境の構築を開始しました。

KEK が構築する「GoToCloud」環境では、クライオ電子顕微鏡で取得した膨大な枚数のタンパク質粒子の 2D 画像から、立体構造を決定する高度なデータ解析計算やデータ管理を高速かつ高コストパフォーマンスに行うため、AWS ParallelCluster によるクラウド High Performance Computing (HPC) 環境、Amazon FSx for Lustre による高速処理用ストレージ、および Amazon Simple Storage Service (Amazon S3) による低コストの大容量データ保管用ストレージが活用されています。特に AWS ParallelCluster では、Amazon Elastic Compute Cloud (Amazon EC2)  の多様なインスタンスタイプを活用し、処理内容に応じて適切な CPU や GPU を必要な時に必要な量を確保することで、計算資源の最適化が図られコスト削減にもつながっています。AWS のクラウドサービスで構築した「GoToCloud」環境では、これまで KEK が活用してきたオンプレミス環境と比較して、およそ半年の運用ですでにインフラ構築や管理に要するコストを 60% 削減しており、今後さらに 85% の削減を目指しています。そしてタンパク質の構造解析計算の主要部分に要する時間についても、約 7 分の 1 の短縮を実現しています。また「GoToCloud」環境では、AWS が提供する高性能のリモートデスクトップソフトウェア NICE DCV による遠隔地からの GUI 操作に加え、同一環境を複数のユーザー向けに共有・複製し、解析環境と入出力データを共有することが可能となり、世界中の研究者や製薬会社とアクセス管理などのセキュリティを確保したうえで、構造解析に関連する研究の連携が容易となりました。さらに、コロナ禍においても在宅勤務でのデータ解析やワークショップ開催、学術指導もオンラインで簡便に行えるようになりました。

図表:AWS のクラウドサービスを活用して構築されたKEKの「GoToCloud」環境

図表:AWS のクラウドサービスを活用して構築されたKEKの「GoToCloud」環境

今後さらに機械学習などを含む AWS のクラウドの活用を進め、KEK はタンパク質の立体構造 1 つを明らかにする時間を、2 週間から 1 日程度まで縮めることを目指しています。データ解析の自動化が進むことにより KEK は、日本および世界の科学や医療に寄与する研究成果創出への取り組みを一層加速させることができるほか、AWS のプロトタイプの開発支援の仕組みを活用したユーザインターフェースの開発により、研究者の「GoToCloud」環境の利用を容易にします。

高エネルギー加速器研究機構 物質構造科学研究所 教授/構造生物学研究センター センター長 千田 俊哉氏は次のように述べています。「ライフサイエンスの更なる進歩だけでなく、未だに治療法のない疾病を治すために、革新的な新薬をより早く、より効率的に開発することが求められています。タンパク質の立体構造情報は、これらの進歩には欠くことのできないものです。AWS は、世界のライフサイエンスおよびヘルスケア業界にとって信頼できる技術およびイノベーションのパートナーであり、唯一無二の信頼性、セキュリティ、およびデータプライバシーを提供しています。クラウドの拡張性と敏捷性を利用することで、複雑な作業を自動化し、コスト効率よく研究を加速させ、科学者がタンパク質の立体構造解析を高速化させることでライフサイエンス研究や創薬プロジェクトがさらに発展することを期待しています」

KEK との連携強化に加え AWS は本日、AWS Direct Connect により日本のアカデミア全体に対する支援も一層強化することを発表いたしました。日本全国にある 900 以上の大学や研究機関が参加し、300 万人以上のユーザーを擁する学術情報基盤「学術情報ネットワーク (SINET6)」への支援の一環として、複数の 100Gbps 物理回線接続を追加構築します。国立情報学研究所(NII)が運用・整備し、本格運用が開始された SINET6 と AWS のアジア太平洋(東京)リージョンの間には、10Gbps 複数本の専用回線がすでに敷設されています。この度 AWS Direct Connect を利用して複数の 100Gbps 物理回線を新たに敷設することで、日本の大学や公的研究機関は従来よりも 10 倍のネットワーク帯域となる回線環境で SINET クラウド接続サービスの利用が可能となります。KEK は、この高速な SINET6 と AWS 間の 100Gbps 回線を日本で最初に利用する研究機関の一つになる見込みで、クラウド上で大容量のデータを扱うことが可能となります。

アマゾン ウェブ サービス ジャパン合同会社 執行役員 パブリックセクター 統括本部長 宇佐見 潮は、次のように述べています。「KEK との連携強化により、タンパク質の構造解析を加速させる挑戦に貢献でき、日本の研究分野における DX を支援できることを光栄に思います。また、今回発表したSINET6 と AWS のアジア太平洋(東京)リージョン間のネットワーク増強により、SINET6 の超高速・大容量という利点とAWSクラウドの俊敏性・柔軟性の利点が組み合わさり、日本の研究開発がより一層加速すると確信しています。今後も引き続きAWSは、KEK 様および他の大学・研究機関との連携強化と、SINET6 への投資により、日本の研究 DX を支援していきます」

高エネルギー加速器研究機構について
高エネルギー加速器研究機構 (KEK) は、電子や陽子などを加速する粒子加速器と呼ばれる装置を使う加速器科学の世界的拠点の一つです。国内外の研究者と共同研究を行うとともに、共同利用の場を提供する大学共同利用機関法人として、素粒子、原子核の謎の探究や物質、生命現象の理解に取り組んでいます。ノーベル賞との関わりも深く、ここで行われた実験による成果で、物理学賞と化学賞が生まれています。前身の旧文部省高エネルギー物理学研究所は 1971 年に創設され、昨年 50 周年を迎えました。現在、茨城県つくば市と東海村に拠点を持っています。詳細については以下の URL をご覧ください。https://www.kek.jp

クライオ電子顕微鏡について
精製したタンパク質などの生体高分子を溶かした液体を急速に凍らせ、液体窒素で -200℃ ぐらいの低温に透過型電子顕微鏡(TEM)を用いて取得した 2D 画像から、コンピューターによる画像処理で生体高分子の立体構造を決定します(この技術を開発した 3 名は 2017 年、ノーベル化学賞を共同受賞しています)。タンパク質は、電子顕微鏡内部の高真空にさらされると干からびて形が変わってしまいますが、薄い氷の中に閉じ込めて保護・固定して観察します。歴史の長いX線によるタンパク質の構造解析では、良質な結晶が必須で作成する負担が大きいですが、クライオ電子顕微鏡ではその必要がないため、結晶化が困難な巨大なタンパク質やその複合体の構造解析に力を発揮しています。ただ氷の中のタンパク質の向きはまちまちであるため、別々に撮影した膨大な数の 2D 画像からタンパク質の向きがそろったものをうまく重ね合わせて立体構造を再現する複雑な計算をしなければなりません。そのため、膨大な計算資源が必要になります。