グローバルに広がるシナモンの AI 開発体制と、そのバックエンドを支える Amazon SageMaker【AWS Summit Tokyo 2019 基調講演書き起こし】

2019年6月12日〜14日、幕張メッセにて「AWS Summit Tokyo 2019」が開催されました。AWS Startup Blogでも、3日間にわたって現地からの速報リポートをお届けしましたが、今回のブログポストでは、基調講演にご登壇頂いた、株式会社シナモンの CEO 平野様、シンセティックゲシュタルト株式会社の CEO 島田様、そして、株式会社メルカリの CTO 名村様の講演の様子を3回に分けてお届けしたいと思います。今回は、株式会社シナモンの CEO 平野様による講演の模様です。

本記事は、ログミーによる提供です。

人間が人間らしい仕事に集中できるには

平野未来氏（以下、平野）：みなさん、おはようございます。シナモンの平野です。本日はどうぞよろしくお願いいたします。

シナモンがミッションとして掲げているのは「Extend human potential by eliminating repetitive tasks」です。ホワイトカラーには本当にたくさんの面倒な仕事があると思うんですが、そういったお仕事はどんどん人工知能にやってもらって、人間は人間らしい仕事に集中できる世界の実現を目指しています。

私たちの組織のユニークなところは、AI リサーチャーがたくさんいることなんです。現在、グローバルに200人を超えるメンバーがいるんですが、そのうち100人は AI リサーチャーとなっております。

ちなみに、日本全国全世代で見ても、AI リサーチャーというと400人程度しかいませんので、この100人という数字はかなりインパクトのある数字ではないのかなと思っています。

なぜこれができるのか。私たちは事業開発を日本・アメリカで行っているんですが、AI ラボは理数系の強いベトナム・台湾に持っているからなんですね。そちらで数学の天才たちを見つけてきて、彼らにディープラーニングのトレーニングをする。そうすることによって、非常にハイレベルな AI リサーチャーの獲得に成功しています。

「Cinnamon AI Platform」による業務効率化

平野：本日ご紹介させていただくのは「Cinnamon AI Platform」です。

企業のデータのうち8割は、メールや画像、音声のような非構造データと言われています。非構造データがたくさんあったとしても、その中から意味のある情報を抽出するには、これまでは人間が行う必要がありました。シナモンの AI Platform では、非構造データから意味のある構造データを抽出することができます。

私たちには、3つの research pillar があるんですが、そのうち2つは認識レイヤーとなっています。

まずドキュメントを認識できる文字認識、そして音声データを認識する音声認識、この2つの技術によって、まずはお客様の非構造データをデジタル化します。そして、そのデータを自然言語理解する。それが3つ目の research pillar です。

これまで私たちは、自然言語理解を実現するさまざまなアルゴリズムを実現してまいりました。例えば文脈理解や情報抽出、オントロジーなどです。こういったアルゴリズムを組み合わせることによって、ビジネス上でもインパクトのある AI をご提供させていただいております。

例えば保険業界。保険業界というと、毎日、本当にたくさんの紙を受け取ります。そういった紙をデータ化するために入力する方々がたくさんいらっしゃるんです。まず私たちは、文字認識によってその紙をデジタルデータ化いたします。それに対して、文章理解をし、そして尤度（ゆうど）解析をする。こういったアルゴリズムを組み合わせることによって、年間50億円もの削減見込みとなっております。

そして、コールセンターで、オペレーターの方とお客様の間のコミュニケーションをまずは音声認識でデジタル化いたします。そのデータに対して文脈理解をし、そして適切な FAQ をレコメンドする。そして最後に要約する。こうすることによって、新人さんのようなオペレーターの方でもハイパフォーマーになることができます。

そして、契約書など。文章理解や情報抽出、Question Answering、クラスタリング、こういったアルゴリズムを組み合わせることによって、弁護士の方でも1週間かかっていたタスクが、たった30分に短縮しております。

現在、私たちは50社を超えるお客様がいらっしゃるんですが、そのほとんどが大企業となっております。

より良いアルゴリズムを作るための3つの課題

平野：ここで私たちのビジネス環境をご説明させていただきますと、まず、ベトナム・台湾に AI ラボがございまして、そこでモデルの開発を行っています。

そこで開発したモデルを日本・アメリカにいる AI デリバリーがお客様にご提供しているんですが、その結果、「ここがよかった」「ここがよくなかった」みたいなフィードバックをAIラボに返し、さらにアルゴリズムの精度を高めるために、そのモデルの改善をします。

そういったサイクルが行われているんですが、より良いアルゴリズムを作るためには、そのサイクルを高速化する必要がございます。具体的には3つの課題がありました。

1つは、100人もの AI リサーチャーがいるんですが、それぞれで開発環境が違っていたので、なかなか効率的な開発が行えていない。

2つ目は、GPU インスタンスを人力で管理しているので、これはコスト増にもつながります。

そして3点目が、グローバルコラボレーションの難しさです。お客様の非常に重要な学習データを扱う必要があるんですが、そういったデータを国外に持ち出すことができない。そのようなさまざまな問題がありました。

それを解決したのが「Amazon SageMaker」でした。

最先端のエンタープライズAIフレームワーク

平野：まず、AI リサーチャーに統一化された環境を用意し、好みのディープラーニングフレームワークを選択できるような環境を実現いたしました。これにより社内オペレーションが効率化いたしました。

そして、GPU インスタンス。マネージドサービスで学習時のみ GPU インスタンスが起動いたします。これはコスト削減にもつながります。

そして3点目、日本のデリバリ環境との統一により、モデル開発のサイクルが高速化いたしました。サイクルが高速化されたことで、精度をより高められる環境が実現されたこととなります。

これまでシナモンは本当にさまざまなチャレンジを行ってきたんですが、現在、新たなチャレンジを行っています。機械学習を、より身近に、より効率的に。まず、お客様のサーバに AWS のVPC（Virtual Private Cloud）をつないだセキュアな環境をご用意いただきます。そして、シナモンのサーバにもAWSのVPCをつないだセキュアな環境がありますので、その2つをまたいでAmazon SageMaker を活用する仕組みを作ります。この仕組みが画期的なのは、1つは、データをお客様の環境に留めることで、セキュアな推論環境を実現できることです。これまで問題だった学習データの受け渡しについても、そもそもデータを渡す必要がなくなります。

2点目は、リサーチャーが開発したモデルを即座にご提供できることです。これまで、セキュアな環境で機械学習を実現するためには、お客様のもとにモデルを持っていく必要がありました。そんな必要もなくなります。