AWS Startup ブログ

AI 創薬事業を支えるアーキテクチャの設計方針とは。SyntheticGestalt 社の AWS 活用事例

AI を活用した創薬事業を展開する SyntheticGestalt(シンセティックゲシュタルト)株式会社。新薬候補物質を製薬企業に提供する「自社創薬」の事業を主軸としています。

SyntheticGestalt 社の創薬システムは、数十億の化合物から新薬候補物質をスピーディーに発見し、創薬における研究期間を大幅に短縮します。また、従来の In silico 創薬とは異なり、創薬標的タンパク質の構造情報を必要としないため、これまで治療薬の創出が困難であった標的も、創薬の対象にできるという利点があります。

SyntheticGestalt 社は AWS のサービスを有効利用して事業に注力し、開発・運用の効率化やシステムの品質向上などを実現している企業でもあります。今回は同社の AWS 活用事例について、CTO の神谷 幸太郎氏と Research Engineer の堀 義宗氏、小山 恭平氏にお話を伺いました。

SyntheticGestalt 社のオフィスには広い庭があります。今回はその庭にて、メンバー全員で焚き火を囲みながらインタビューを実施しました。CTO の神谷氏曰く「火は人類にとって最古のテクノロジーのうちの一つであるため、SyntheticGestalt 社が AI というプログレッシブな技術からプリミティブな技術まで幅広く取り扱うことを焚き火で象徴しています」とのこと

発明・発見という行為をシステムによって自動化する

――SyntheticGestalt 社の企業概要や事業概要を教えてください。

神谷:私たちは「発明を量産する人工知能の開発」というビジョンを掲げています。

これまでの人類の歴史のなかで、偉大な発明や科学上の発見は、一部の優秀な人々が成し遂げてきました。その役割を AI が主導する未来を目指して、私たちはシステム開発を続けています。その第一歩が AI 創薬事業であり、また酵素事業や合成生物といったライフサイエンス領域の研究開発も行っています。

――なぜ創薬という領域で AI を使う意義があるのでしょうか。

神谷:既存の創薬プロセスでは、薬の候補となる物質や生体内のタンパク質との膨大な組み合わせをひとつひとつ調べていく必要があり、薬を作るまでにとてつもない時間がかかります。研究活動を表す言葉として Drug Design(設計)よりも Drug Discovery(発見)がしっくり来るぐらい、偶然性が占める部分が大きい分野なのです。そこで私たちは、AI の力によって創薬の各種工程を自動化することで、探索にかかる期間を短縮したり、費用を安くしたりといった効果を狙っています。

SyntheticGestalt株式会社 CTO 神谷 幸太郎氏

Amazon SageMaker を有効活用した AI・ML 基盤

――SyntheticGestalt 社では、創業当時から Amazon SageMaker を利用しているそうですね。AI・ML 基盤を構築する際に、オンプレミスのインフラ環境を構築する企業も多い印象なのですが、御社が Amazon SageMaker を採用された理由を知りたいです。

堀:私たちは自社創薬が主軸であるため、外部のユーザーに対してサービスを提供するわけではなく、あくまでシステム利用者が社内のエンジニアのみにとどまります。また、私たちは少数精鋭のチーム組成でプロジェクトを推進しており、インフラ運用にかかる工数をなるべく減らしたいと思ったため、オンプレミスを選択しませんでした。

また、別の観点としてコンテナ技術を有効活用したいと考えていました。Docker を用いてアセットや環境を管理することで、別のインフラ環境への移植を行いやすくなり、実験の再現性も高められます。これらの理由から、インフラ管理を省力化でき、かつカスタムのコンテナを並列的に展開できる機構を持つ MLOps に適したサービスを求めていました。そして、その条件に当てはまるのが Amazon SageMaker だったのです。

さらに、Amazon SageMaker はトレーニング単位でジョブを管理できるなど、「コンテナの分散展開機能に加えてプラスアルファの要素」がいくつもあったことも、導入の決め手になりました。SyntheticGestalt では社内独自のラッパーフレームワークを作成し、そこから Amazon SageMaker を呼び出す形で活用しています。

SyntheticGestalt株式会社 Research Engineer 堀 義宗氏

――どのような AWS サービスを用いて AI・ML 基盤を構築されているか、アーキテクチャ概要をご説明ください。

神谷:前処理では Amazon S3 + Amazon EMR を使って PySpark のバッチを実行し、学習・評価では Amazon S3 + Amazon SageMaker を使うというシンプルな構成になっています。 Strage to Strage で、Amazon S3 に配置された各種データをプログラムで処理したうえで、結果も Amazon S3 に格納する構造ですね。補助的に Amazon Athena + AWS GlueAWS Batch などを使うケースもあります。

――このアーキテクチャの設計の考え方をお聞かせください。

小山:小さいプログラムであろうと、大きなアーキテクチャであろうと、全て一貫して関数型プログラミングの思想を適用するというコンセプトがあります。私たちが取り組んでいる研究開発の領域では再現性が重要ですから、可能な限り副作用を排除したい。そのため、常に状態の分離に気を遣って設計しています。

その目的を達成するために、状態を有するものはすべて Amazon S3 に置き、何かの状態から別の状態を作るようなアルゴリズムは、コンテナの中で動くプログラムとして記述する。そして、処理の実行は AWS のインフラを起点とするという基本コンセプトがあります。Amazon SageMaker はトレーニング単位で ID を割り振ることや、Amazon S3 との接続機能もあることから、そのコンセプトとの親和性が高いです。

――インフラのコスト削減のために工夫していることはありますか?

小山:深層学習ベースのモデルを学習する際には、Amazon SageMaker のスポットインスタンスを使っています。仮にインスタンスが落ちても、チェックポイントを残しているため、再びそのジョブを途中から始められるようにしています。コストを下げられるスポットインスタンスの利点を有効活用しつつ、ジョブの成果物を消失してしまうリスクを下げる工夫をしていますね。

SyntheticGestalt株式会社 Research Engineer 小山 恭平氏

「自分たちの本質的な業務」に集中させてくれる AWS の価値は高い

――事業やシステムのアーキテクチャをどのように発展させたいか、今後の展望について教えてください。

神谷:直近の目標は、自分たちの AI 創薬のシステムによって薬の候補を発見し、世の中に出していくことです。では、それを支えるのは何かというと、やはり技術です。

私たちは世の中に価値提供できる技術を生み出すために、あるいはその土台を作るために、アプリケーションの開発に注力してきました。そして、インフラにはあまり工数をかけずに、本質的な事業の価値に直結する業務に集中したいからこそ、クラウドを活用してきたという経緯があります。その意味で、AWS の利便性に助けられた部分は本当に大きかったと感じています。

しかし、AWS をフルに使い倒すという観点で最近困っているのは、利用するサービスが増えるに従って「各種サービスをいかにして統括するか」という新たなる課題です。そこで私たちは、AWS Step Functions をうまく活用して、この課題に対応しようと考えています。

かつて AWS Step Functions が登場したばかりの頃は、まだ機能もそれほど充実しておらず“AWS Lambda コネクタ”という色合いが強かったように思います。しかし、機能が着実に充実してきており、最近では“AWS サービスコネクタ”として利用できるようになりました。メタ・サービスとしてレベルが上がったように感じています。AWS Step Functions をうまく活用することで、自分たちのインフラ運用にかかる工数をより省力化していきたいです。

コンセプチュアルな話になりますが、私たちは「発明・発見という行為をシステムによって自動化すること」を謳っています。ですから、自分達も普段から達成すべきスペック定義やシステムの設計に頭を使わなければ、それを AI にさせることは夢のまた夢になってしまう。だからこそ、「発明を行う AI の設計者として、自分たちが何に取り組むべきか」を考えることが私たちの意思決定や発想の根底にあります。

――SyntheticGestalt 社の思想が伝わるインタビューでした。今回はどうもありがとうございました。


導入支援・お見積り・資料請求等に関するご質問、ご相談に日本担当チームがお答えします。平日 10:00〜17:00 はチャットでもお問い合わせいただけます。お問い合わせはこちら