Amazon Bedrock でクロスリージョン推論のサポートを開始

投稿日: 2024年8月27日

本日、Amazon Bedrock はクロスリージョン推論のサポートを発表しました。これは、開発者がさまざまな AWS リージョンのコンピューティングを利用してトラフィックバーストをシームレスに管理できるようにするオプション機能です。クロスリージョン推論を使用することで、オンデマンドモードを使用する Bedrock のお客様は、より高いスループット制限 (割り当てられたリージョン内のクォータの最大 2 倍) を得ることができ、需要のピーク時にレジリエンスを強化できます。オプトインすることで、開発者は需要の変動を予測するために時間と労力を費やす必要がなくなります。代わりに、クロスリージョン推論によって複数のリージョン間でトラフィックが動的にルーティングされるため、各リクエストに最適な可用性が確保され、使用率の高い時間帯のパフォーマンスが向上します。

顧客は、事前に定義された一連のリージョンから選択することで推論データのフローを制御でき、適用されるデータレジデンシー要件と主権法に準拠できるようになります。さらに、この機能は、可能な場合に接続された Bedrock API ソースリージョンを優先し、レイテンシーを最小限に抑え、応答性を向上させるのに役立ちます。その結果、お客様はアプリケーションの信頼性、パフォーマンス、効率を向上させることができます。

クロスリージョン推論を使用しても追加のルーティングコストは発生せず、リクエストを行ったリージョン (ソースリージョン) に基づいて請求されます。サポート対象のモデルと事前定義されたリージョンのリストは、こちらをご覧ください。この機能の詳細と使用開始方法については、Amazon Bedrock のドキュメントまたはこのブログを参照してください。