Amazon Aurora Parallel Query は Amazon Aurora データベースの機能の 1 つで、現在のデータに対する分析クエリの高速化を実現します。このとき、データを別のシステムにコピーする必要はありません。コアトランザクションワークロードの高スループットを維持しながら、クエリを最大 2 桁まで高速化することができます。
一部のデータベースでは、1 台または少数のサーバーにおいて複数の CPU のクエリ処理を並列化できますが、Parallel Query は Aurora 独自のアーキテクチャを利用して、Aurora ストレージレイヤー内の数千もの CPU にわたってクエリ処理をプッシュダウンし、並列化します。Parallel Query は分析クエリの処理を Aurora ストレージレイヤーに任せることによって、ネットワーク、CPU、およびバッファープールとトランザクションワークロードとの競合を抑制します。
特徴
分析クエリの迅速化
従来のデータベースでは、データベースに直接分析クエリを実行すると、たとえ軽度のクエリであっても、クエリパフォーマンスが低下するとともにトランザクションワークロードが減速するリスクがありました。クエリは、テーブルおよびデータベースサーバーのインスタンスのサイズに応じて、数分から数時間実行できます。また、クエリの速度はネットワークレイテンシーによっても低下します。これは、ストレージレイヤーが処理のために全テーブルをデータベースサーバーに転送せざるを得ない場合があるためです。
Parallel Query を使用すると、クエリの処理が Aurora ストレージレイヤーにプッシュダウンされます。クエリの処理能力は大幅にアップし、ネットワークを介して転送するデータの量もはるかに少なくなります。その間、Aurora データベースインスタンスは、トランザクションの処理を続行でき、中断もはるかに少なくなります。このように、トランザクションワークロードと分析ワークロードを同じ Aurora データベースで並行して実行できます。また、それと同時にハイパフォーマンスを維持できます。
最新のデータに関するクエリ
多くの分析ワークロードには、最新のデータと良好なクエリパフォーマンスの両方が必要です。例えば、ネットワークモニタリング、サイバーセキュリティ、不正検出などの運用システムは、トランザクションデータベースの最新のリアルタイムデータに依存しており、データが分析システムに抽出されるまで待機することはできません。
トランザクションのパフォーマンスを低下させずに、トランザクション処理に使用する同じデータベース内のクエリを実行することによって、Amazon Aurora Parallel Query では、ソフトウェアを追加したり、クエリに変更を加えたりすることなく、運用上の意思決定をさらにスマートに行うことが可能になります。
開始方法
Parallel Query は、MySQL と互換性を持つ Amazon Aurora で利用できます。簡単に利用開始: Aurora クラスターの作成時に Parallel Query を有効にするだけです。
パフォーマンス向上の予測に基づき、特定のクエリそれぞれについて Parallel Query を使用するかどうかを Aurora クエリオプティマイザーが自動的に決定します。Aurora の他のクエリと同様、実際に使用した I/O の料金のみをお支払いいただきます。
MySQL 互換の Amazon Aurora に関する詳細