Amazon Web Services ブログ
製造業のニーズに最適な機械学習サービスの選択
はじめに
機械学習 (ML) は製造業で欠かせない技術となりましたが、どの機械学習サービスやツールが自分の業務に最適かを判断するのは難しい場合があります。そこで、アマゾンウェブサービス (AWS) の 各 ML サービスの使い方を、ユースケースを交えて説明します。
急速なイノベーションの時代において、製造業は競争力を高めるために、生産中断の抑制、環境負荷の低減、品質管理の改善、単位あたりの生産コストを削減するためのさまざまな方法を模索しています。
この目標を達成するために採用されているコア技術の1つが自動機械学習 (ML) です。AutoML と呼ばれている自動機械学習は、データ収集からモデルの運用まで、ML ワークフロー全体にわたる退屈で反復的な時間のかかる作業を取り除きます。これにより、企業は優先度の低い細かな作業に費やす時間を減らし、機械学習を活用してビジネス成果を向上させる時間を増やすことができます。AutoML ツールは、データの収集・整備、特徴量エンジニアリング、モデルの学習・チューニング・デプロイ、そして継続的なモデルの監視と更新を行います。
これらの AutoML サービスはモデル開発を容易にしますが、適切なサービスを見つけて採用することが1 つの重要な課題です。しかし、この課題は見過ごされがちで、かつ優れたモデルの開発が長期化する可能性があります。そこで、 IT と OT (オペレーショナルテクノロジー) が AutoML 機能を使い始めるときに投げかける課題は、これらの質問に回答することです。
- AutoML サービスを利用する主な目的は何ですか?
- AutoML サービスのユースケースは汎用的な使用ができますか?それとも特定のシナリオ向けに設計されていますか?
- どのサービスを、いつ使いますか?
AWS の機械学習サービス
AWS では、産業機械のユースケース向けに AutoML サービスをいくつか提供しています。その結果、製造業のお客様は ML に関する深い専門知識がなくても ML モデルをより迅速に開発できます。AWS の AutoML サービスには次のものがあります。
- 目的:機械学習 (ML) を用いて産業機器の異常状態を検出し、ワイヤレスセンサーから機器の振動と温度のデータを収集することで予防保全を容易にします。
- 適切な使用例:ギアボックス、モーター、ポンプ、コンプレッサー、ファンなど、生産ラインや倉庫にあるさまざまな回転機。
- 不適切な使用例:屋外にある発電所で使用される機械、海外の石油・ガスステーションの機器、家電製品など、工場以外の利用。
- 目的:産業機器モニタリングの ML サービスで、機器の計画外のダウンタイムを回避します。
- 適切な使用例:コンプレッサー、ポンプ、モーター、タービン、ボイラー、熱交換器、インバーターなど、動作条件の変動が少なく、連続的に稼働する産業用プロセス機器。
- 不適切な使用例:建設機械 (クレーンやトラック)、車両、ロボット、 CNC マシンなど、 動作条件の変動が大きい機器での利用。
- 目的:機械学習を使いビジネスデータや運用データ内の異常を検出および診断をします。
- 適切な使用例:小売、ゲーム、ネット広告、通信などの業界におけるカスタマーエンゲージメント(顧客接点)、運用、販売、マーケティングに関連するビジネス指標。
- 不適切な使用例:多変量データの取り扱い。短い間隔(例:5分未満)でセンサーデータの異常検知を必要とする処理。※1 または計測データが 1 日のうち数時間ではなく、数週間または数か月にわたって低下するなど、時間の経過とともに増加する異常値。 ※1: Amazon Lookout for Equipment では 5 分を超える期間の異常しか検出できません。
- 目的:対象物の外観上の欠陥を検知することで、生産プロセスの品質向上と運用コストの削減に貢献します。
- 適切な使用例:部品の損傷の検出、不足している部品の検知。
- 不適切な使用例:注意すべきいくつかの制限として、 Amazon Lookout for Vision は最大 5 MB の画像ファイルサイズをサポートし、 JPEG および PNG の画像形式のみをサポートします。
- 目的:フルマネージド型のインフラストラクチャ、ツール、ワークフローを使用して、ほぼすべてのユースケースに対応する ML モデルの構築、トレーニング、デプロイ時に活用されます。
- 適切な使用例:要件に合うマネージド ML サービスがなく、カスタム機械学習モデルを作る場合。ML エンジニアが Amazon SageMaker でカスタム機械学習モデルを作ると、一元管理ができます。最適なアルゴリズムを選択し、ハイパーパラメータのチューニングを行い、再トレーニングを行うことができます。
- 目的: ML デバイスとソフトウェア開発キット (SDK) により、コンピュータビジョン (CV) をオンプレミスのインターネットプロトコル (IP) カメラに取り込み、高精度で低遅延な推論を自動的に行うことができます。
データの種類別の ML サービス
最も適切な ML サービスを選択するためには、データ変数とデータの種類を評価することが重要です。データ変数には以下が含まれます。
- 多変量データ:1つの結果を得るために、2つ以上の変数が関わります。例えば、コンプレッサーに設置された温度、圧力、振動センサーの測定値から、これらの変数を考慮して機器の故障を予測することができます。
- 単変量データ:時間に依存する単一の変数です。例えば、製造装置によるエネルギー消費量 (kWh) です。
ML サービスを選択する時に、評価するデータには 3 種類あります。
- センサーデータ:センサーデバイスの出力として集められる時系列データ。例:気象センサー、製造装置、車速センサーなど
- ビジネスメトリクス:運用上の指標、売上データ、マーケティングデータ、カスタマーエンゲージメント(顧客接点)など、さまざまな領域からの単変量データ。
- 画像データ:ピクセルの集合体で構成される画像
以下の図は様々な要件を示すことで、特定のユースケースに適したサービスを選択するのに役立ちます。
まとめ
あらゆるケースで万能な ML サービスはありません。しかし、皆さんの業務に最適な ML サービスを選択するためのシンプルな評価基準があります。覚えておくべき、いくつかのガイドラインは以下の通りです。
- 多変量データセットの異常検出または予測を行うには、 Amazon Lookout for Equipment をご検討ください。
- 単変量データセットで、時間経過とともに増加しない異常値の検出を行うには、 Amazon Lookout for Metrics をご検討ください。
- コンピュータビジョンが必要なユースケースについては、 Amazon Lookout for Vision と AWS Panoramaをご検討ください。
- 上記以外のユースケースで、ハイパーパラメータのチューニング、カスタム機械学習モデルの開発やモデルの詳細な制御を必要とする場合は、 Amazon SageMaker をご検討ください。
作者情報
Raghu Iyer は顧客のデジタルトランスフォーメーションを支援するアマゾンウェブサービスのシニア パートナー ソリューションアーキテクトです。彼はデジタルトランスフォーメーションプログラムとソリューションの設計を主導してきた経験が22年以上あります。彼は、堅牢でスケーラブルで革新的なソリューションを実装することで、お客様のビジネス目標の達成を支援することに情熱を注いでいます。
このブログの翻訳はソリューションアーキテクトの梶山政伸が担当しました。原文はこちらです。