概要
Amazon Redshift では、1 時間あたりわずか 0.25 USD で開始し、ペタバイト単位のデータと数千人の同時ユーザーに対応できるようにスケールアップできます。コンピューティングやストレージを過剰にプロビジョニングすることなく、ストレージを成長させることができるため、ビジネスニーズに合ったものを選択することができます。プロビジョニングされた Amazon Redshift では、オンデマンドインスタンスを選択することで、長期間の契約や初期費用がなく、時間単位でデータベースの料金が発生し、また、リザーブドインスタンスを選択することで、さらなる節約が可能です。また、Amazon Redshift Serverless では、アプリケーションのニーズに応じて自動的に起動、シャットダウン、容量のスケールアップおよびスケールダウンを行うため、ワークロードの処理中に消費された容量に対してのみ料金が発生します。
プロビジョニングされた Amazon Redshift が実現できること:
まず、ニーズに最適なクラスター設定を選択できるようにする、ノードタイプについて詳しく学びます。1 回の API コールで、または Redshift コンソールを数回クリックするだけで、クラスターを素早くスケールすることも、クラスターを一旦停止および再開することも、ノードタイプを切り替えることもできます。選択する前にはオンデマンド料金が表示されます。後からリザーブドノードを購入して大幅な割引を受けることも可能です。
選択したら、安定した状態で処理できるよう、Elastic Resize 機能を使用して、プロビジョニングしたコンピューティング性能の量を簡単に調整できます。スケジューラーをリサイズすることで、日次または週次ベースでノードを追加または削除することにより、コストを最適化し、最高のパフォーマンスを引き出せます。動的ワークロードについては、同時実行スケーリングを使用して、追加的なコンピューティング性能を自動的にプロビジョニングし、無料使用枠を使い終えたあとは秒ごとに使用した容量の料金をお支払いいただけます (同時実行スケーリングの料金を参照)。
AWS 料金計算ツール
Amazon Redshift とアーキテクチャのコストを一回の見積もりで算出します。
Amazon Redshift のノードタイプ
マネージドストレージが付属する RA3 ノードでは、コンピューティング性能とマネージドストレージのスケーリングと支払いを独立させることで、データウェアハウスを最適化できます。RA3 では、パフォーマンス要件に基づいてノードの数を選択し、使用したマネージドストレージに対してのみ料金が発生します。日々処理するデータ量を基に、RA3 クラスターのサイズを選択してください。
Redshift マネージドストレージ (RMS) では、各 RA3 ノードに大容量の高性能ソリッドステートドライブ (SSD) を使用し、ローカルストレージの高速化が行われています。また、Amazon Simple Storage Service (Amazon S3) によって長期間の耐久性があるストレージが提供されています。1 つのノード内のデータが増加して大容量ローカル SSD のサイズを超えた場合、そのデータは RMS により自動的に Amazon S3 にオフロードされます。RMS に対して支払うのは、データが高性能 SSD 内にあるか Amazon S3 内にあるかにかかわらず、同じ低額な料金です。ますます増大するストレージを必要とするワークロードの場合、マネージドストレージを使用することでデータウェアハウスのストレージ容量を自動的にスケールできます。ノードの追加やそのための支払いは必要ありません。
DC2 ノードでは、ローカル SSD ストレージを搭載し、コンピューティング負荷の高いデータウェアハウスを実現します。必要なノード数はデータサイズとパフォーマンス要件に基づいて選択します。DC2 ノードは高いパフォーマンスを引き出すためローカルにデータを格納し、データのサイズが増えるに従って、さらに多くのコンピューティングノードを追加して、クラスターのストレージ容量を増強できます。未圧縮で 1 TB 未満のデータセットでは、最も低い価格で最良のパフォーマンスを得るため、DC2 ノードタイプの利用を推奨します。データ量の増大が予想される場合は、RA3 ノードのご利用をお勧めします。このタイプのノードを使用することで、コンピューティング性能とストレージを別々にサイジングし、最高量の料金とパフォーマンスを活用できます。
従量制料金体系の Redshift 機能
- Amazon Redshift のノードタイプ: ニーズに最適なクラスター設定とノードタイプを選択し、Amazon Redshift のオンデマンド料金で時間単位で容量に対して支払いを行うことができます。オンデマンド料金を選択すると、クラスターが使用されていないときにオンデマンド料金を中断するために、一時停止と再開の機能を使用できます。また、安定状態のワークロードのためにオンデマンドインスタンスの代わりにリザーブドインスタンスを選択し、オンデマンド料金よりも大幅な割引を受けることができます。
- Amazon Redshift Spectrum の料金: エクサバイト規模の Amazon S3 データレイクに直接 SQL クエリを実行します。お支払いはスキャンされたバイト数の分だけです。
- 同時実行スケーリングの料金: それぞれのクラスターは、1 日あたり最長 1 時間の無料同時実行スケーリングクレジットを獲得します。これは 97% のお客様にとって十分な時間です。これにより、同時クエリ数や同時ユーザー数が数千件に達しても、安定した高速なパフォーマンスを実現できます。無料クレジットを超える使用分については、秒単位のオンデマンド料金をお支払いいただきます。
- RMS の料金: プロビジョニングされたコンピューティングノードの数とはかかわりなく、RA3 クラスターに保存したデータに対してのみお支払いいただきます。マネージドストレージに保存した合計データ量に対する時間単位の料金のみを支払います。 RMS は Amazon Redshift Serverless でも使用されます。
- Redshift ML: SQL を使用して、機械学習 (ML) モデルを作成、トレーニング、デプロイします。Amazon SageMaker の無料利用枠を使い果たした後は、モデルとストレージの作成に費用がかかります。 Redshift ML は、Amazon Redshift Serverless でも使用できます。
Amazon Redshift 無料トライアル
これまでに Amazon Redshift Serverless を利用したことがない場合、コンピューティングとストレージの利用に対して 90 日間の有効期限付き 300 USD のクレジットが付与されます。このクレジットの消費率は、実際の使用量とサーバーレスエンドポイントのコンピューティング性能に依存します。
Amazon Redshift Serverless がまだ利用できないリージョンでは、お客様はプロビジョニングされたクラスターの無料トライアルを開始できます。DC2 ラージノードの 2 か月間無料トライアルの対象となります。組織は 1 か月あたり 750 時間無料で使用できます。これは、160 GB の圧縮 SSD ストレージのある 1 つの DC2 large ノードを連続して実行するのに十分です。2 か月間の無料トライアルが終了するか、1 か月間の使用量が 750 時間を超えた場合、クラスターをシャットダウンして料金を請求されないようにできます。または、標準のオンデマンド料金で利用を続けることもできます。詳細については、Amazon Redshift 無料トライアルページをご覧ください。
オンデマンド料金
Amazon Redshift オンデマンド料金では、データウェアハウスを実行するために選択した特定のノードタイプのプロビジョニングされた容量に対して、期間の契約や前払いコストなしに時間単位で支払うことができます。単純に、選択したタイプとクラスター内のノード数に基づいた時間料金を支払うだけで、クラスターが稼働している間は課金されます。クラスターの作成、削除、停止、再開といった請求対象となるステータス変更に続いて、1 時間未満の時間は秒単位で請求されます。停止と再開の機能によって、クラスターを停止している間、一時的にオンデマンド料金が発生しないようにすることができます。一時停止と再開は、Redshift のノードタイプでは、手動またはスケジュールされたオペレーションです。クラスターを停止している間は、バックアップストレージの料金のみが発生します。これにより、データウェアハウスの容量を事前にプランニングしたり購入したりする手間が省けます。また、開発環境またはテスト環境をコスト効率のよい方法で管理することができます。 マルチ AZ 配置では、同じ課金レートでも、シングル AZ 配置の 2 倍のコンピュート数を支払うことになります。
現行世代
*各 RA3 ノード付属マネージドストレージの対応ストレージ容量の合計。
旧世代
1 TB あたりの年間のオンデマンド実質料金の計算
オンデマンド料金の場合、1 TB あたりの年間実質料金はインスタンスの時間料金 × 年間の時間数 ÷ インスタンスあたりの TB 数で計算されます。RA3 の場合、マネージドストレージに保存されたデータは、RA3 ノードタイプに保存された実際のデータ量に基づいて別途請求されます。年間の 1 TB あたりの実質料金はコンピューティングノードのコストだけを計算したものです。
Amazon Redshift Serverless
Amazon Redshift Serverless は、1 時間あたり 3 USD という低料金で使い始めることができます。お支払いいただくのは、データウェアハウスがアクティブなときに消費したコンピューティングキャパシティに対してのみです。データウェアハウスの容量は、分析ワークロードの需要に合わせて自動的にスケールアップまたはスケールダウンし、非アクティブ時はシャットダウンされるため、管理する時間とコストを節約できます。Amazon Redshift は、データウェアハウスの容量を Redshift Processing Unit (RPU) で測定します。Amazon S3 のオープンファイル形式のデータにアクセスするクエリを含め、RPU-時間で実行するワークロードの料金を秒単位で支払います (60 秒の最低料金あり)。データウェアハウスの起動時間には料金はかかりません。オートスケーリングと包括的なセキュリティ機能が含まれています。同時実行スケーリングと Redshift Spectrum はどちらも Amazon Redshift Serverless に含まれているため、個別に料金を支払う必要はありません。
オプションで、[ベース]、[最大 RPU-時間]、および [MaxRPU (最大容量)] 設定を使用して、データウェアハウスのパフォーマンスとコストを制御できます。
- ベース – この設定では、Amazon Redshift がクエリを処理するために使用するベースのデータウェアハウス容量を指定できます。ベース容量は RPU で指定されます。ベースのコンピューティング性能を高く設定すると、特に、大量のデータを処理し、変換とエンリッチメントを実行するデータ処理と ETL (抽出、変換、ロード) ジョブのクエリパフォーマンスを向上させることができます。Amazon Redshift マネジメントコンソールから、または Amazon Redshift API を呼び出すことで、ベースを 8 RPU から 512 RPU まで、8 単位 (8、16、24、32、40、48 など、最大 512) で調整することができます。
- 最大 – この設定では、使用制限を指定し、それらの制限に達した場合に Amazon Redshift が自動的に実行するアクションを定義して、予測可能性をもって予算を管理できます。最大は RPU-時間で指定され、日、週、または月の期間に関連付けられています。より高い最大コンピューティング性能を設定すると、システムの全体的なスループットを向上させることができ、一貫して高いパフォーマンスを維持しながら高い同時実行性を扱う必要があるワークロードには特に有益です。最大は、Amazon Redshift マネジメントコンソールから、または Amazon Redshift API を呼び出して調整できます。
- MaxRPU (最大容量) – この設定では、Amazon Redshift Serverless がスケーリング目的で対応できる RPU の最大数を設定します。自動コンピューティングスケーリングが必要な場合、MaxRPU の値を大きくするとクエリのスループットを向上させることができます。MaxRPU の上限に達すると、ワークグループコンピューティングはそれ以上リソースをスケールアップしません。
プライマリストレージ容量は、Redshift マネージドストレージ (RMS) として請求され、ユーザースナップショットに使用されるストレージは、このページに記載されている標準のバックアップ課金レートで請求されます。ストレージは、Amazon Redshift のプロビジョニングされたクラスターと同じ料金で請求されます。Amazon Redshift Serverless では、データウェアハウスを 30 分粒度で過去 24 時間の特定のポイントに無料で復元できます。データ転送コストと ML コストは、プロビジョニングされたクラスターと同様に、別途適用されます。AWS リージョン間のスナップショットレプリケーションとデータ共有には、このページに記載されている転送料金が適用されます。
Amazon Redshift マネージドストレージの料金
マネージドストレージに保存されたデータに対して、対象のリージョンにおいて GB 単位の固定月額料金が課金されます。マネージドストレージは RA3 ノードタイプのみに付属し、データサイズにかかわらず、同じ低額の Redshift マネージドストレージ料金が課金されます。マネージドストレージの使用量は、マネージドストレージ内に存在するデータの合計量に基づき、時間単位で計算されます (GB-時間の使用量から GB-月料金への変換については下記の例を参照してください)。RA3 クラスターのデータ量は、Amazon CloudWatch や AWS マネジメントコンソールでモニタリングできます。RA3 ノードとマネージドストレージの間のデータ転送に対する支払いは発生しません。マネージドストレージの料金に、自動/手動スナップショットによるバックアップストレージ料金は含まれません (バックアップストレージ参照)。クラスターが終了した場合、手動バックアップの保持には引き続き料金が発生します。
マネージドストレージ料金の例
GB-月に変換すると、36,900,000 GB-時間/720 時間 (4 月 1 か月の時間数) = 51,250 GB-月になります。
Amazon Redshift Spectrum の料金
Amazon Redshift Spectrum により、Amazon S3 にあるエクサバイト単位のデータに SQL クエリを直接実行できます。Redshift Spectrum によってスキャンされたバイト数に対して課金されます。バイト数はメガバイト単位で切り上げられ、10 MB 未満のクエリは 10 MB と計算されます。CREATE TABLE、ALTER TABLE、DROP TABLE などの Data Definition Language (DDL)、パーティションを管理するステートメント、および正常に実行されなかったクエリに対しては課金されません。
Amazon S3 の外部データの Amazon Redshift Serverless のクエリは、個別に請求されることはなく、RPU-時間の金額で Amazon Redshift Serverless の請求額に含まれます。
圧縮され、パーティション化され、列指向データ形式でデータを保存することで、クエリパフォーマンスの向上とコスト削減を実現できます。Redshift Spectrum がサポートするいずれかの形式でデータを圧縮すると、スキャンされるデータが減るため、コストを削減できます。同じように、Apache Parquet や Optimized Row Columnar (ORC) などの列指向形式でデータを保存すると、Redshift Spectrum はクエリで必要な列のみをスキャンするため、料金が安くなります。
追加料金
Redshift Spectrum のデータクエリに使用された Amazon Redshift クラスターに対して料金が発生します。Redshift Spectrum では、Amazon S3 のデータに対し、クエリが直接実行されます。S3 バケットへのオブジェクト保存と、S3 バケットに対して行われたリクエストについて、標準の S3 料金が発生します。詳細については、Amazon S3 の料金を参照してください。
Amazon Redshift Spectrum で AWS Glue データカタログを使用する場合は、標準の AWS Glue データカタログ料金が課金されます。詳しくは、AWS Glue の料金を参照してください。
Amazon Redshift Spectrum を使用して Amazon S3 内の AWS Key Management Service (KMS) で暗号化したデータをクエリする場合、標準の AWS KMS 料金が請求されます。 詳しくは、AWS KMS の料金を参照してください。
Redshift Spectrum の料金の例は、米国東部 (バージニア北部) の料金に基づいています。
合計サイズが 4 TB の、非圧縮テキストファイルとして Amazon S3 に保存された、均等に区切られた 100 の列があるテーブルがあるとします。テーブルの 1 つの列からデータを取得するクエリを実行する場合、テキスト形式では分割できないため、Redshift Spectrum はファイル全体をスキャンする必要があります。このクエリは 4 TB をスキャンし、20 USD かかります。(5 USD/TB × 4 TB = 20 USD)
GZIP を使用してファイルを圧縮して、圧縮率が 4:1 であるとします。この場合、圧縮されたファイルのサイズは 1 TB になります。Redshift Spectrum はファイル全体をスキャンする必要がありますが、サイズは 4 分の 1 になっているため、コストも 4 分の 1、つまり 5 USD になります。(5 USD/TB × 1TB = 5 USD)
ファイルを圧縮して Apache Parquet などの列指向形式に変換し、圧縮率が 4:1 であるとすると、圧縮されたファイルのサイズは 1 TB になります。上記と同じクエリを使用すると、Redshift Spectrum がスキャンする必要があるのは、Parquet ファイルのうちの 1 列のみになります。このクエリのコストは 0.05 USD になります。(5 USD/TB × 1 TB ファイルサイズ × 1/100 列、またはスキャンされる合計 10 GB = 0.05 USD)
注: 上記料金は一例です。圧縮率はファイルや列によって異なります。
同時実行スケーリングの料金
Amazon Redshift は一時的な容量を自動的に追加し、数千の同時ユーザーやクエリに対応する場合でも、一貫して高速なパフォーマンスを提供します。リソース管理コストや前払いコストは不要で、一時的なクラスターのスタートアップ時間やシャットダウン時間も課金されません。メインのクラスター実行中は、24 時間ごとに 1 時間分の同時実行スケーリングクラスタークレジットが貯まります。無料クレジットを超えて使用された同時実行スケーリングクラスターの秒単位のオンデマンド料金は、クエリが実行されているときに限り、同時実行スケーリングクラスターがアクティブになるたびに課金されます (最小課金時間は 1 分)。秒単位のオンデマンド料金は Amazon Redshift クラスターのノードのタイプと数に基づきます。
Amazon Redshift Serverless は、デフォルトでワークロードのニーズに合わせて必要に応じてリソースを自動的にスケールアップおよびスケールダウンします。同時実行スケーリングに別途料金はかかりません。
同時実行スケーリングのクレジット
Redshift クラスターは、1 日あたり最大 1 時間の無料同時実行スケーリングクレジットを獲得します。クレジットは、AWS アカウントのアクティブなクラスターについて 1 時間単位で付与され、クレジットが付与された後に同じクラスターでのみ使用できます。アクティブなクラスターあたり最大 30 時間の無料同時実行スケーリングクレジットを累積できます。クラスターが解約されない限り、クレジットは期限切れになりません。
同時実行スケーリングの料金の例
米国東部の 10 DC2.8XL ノードの Redshift クラスター料金は 1 時間あたり 48 USD になります。2 つの一時的なクラスターが無料同時実行スケーリングクレジットを超えて 5 分間使用されるシナリオを考えてみます。同時実行スケーリングの秒単位のオンデマンド料金は、48 USD × 1/3600 = 0.013 USD (1 秒あたり) となります。この場合の同時実行スケーリングの追加コストは、0.013 USD/秒 × 300 秒 × 2 つの一時的なクラスター = 8 USD となります。したがって、この場合の Amazon Redshift クラスターと 2 つの一時的なクラスターの総コストは 56 USD となります。
Redshift ML の料金
Redshift ML の使用を開始すると、Amazon SageMaker を以前に使用したことがない場合は、Amazon SageMaker の無料利用枠を利用できます。1 か月あたり 2 か月間の無料 CREATE MODEL リクエストが、リクエストあたり最大 100,000 セルが含まれます。無料利用枠は、初めて Redshift ML のモデルを作成した最初の月から開始されます。
Amazon S3 料金
CREATE MODEL リクエストでは、Amazon S3 の少額料金も発生します。CREATE MODEL によって生成される S3 データの量は数ギガバイトのオーダーであり、Amazon S3 のコストは月額 1 USD 未満である必要があります。ガベージコレクションがオンになっているときは、すぐに削除されます。Amazon S3 は、最初に、CREATE MODEL の SELECT クエリによって生成されたトレーニングデータを保存するために使用されます。次に、予測に必要なさまざまなモデル関連のアーティファクトを保存するために使用されます。デフォルトのガベージコレクションモードでは、CREATE MODEL の最後にトレーニングデータとモデル関連のアーティファクトの両方が削除されます。
コスト管理オプション
MAX_CELLS を設定することにより、トレーニングコストを制御できます。そうしない場合、MAX_CELLS のデフォルト値は 100 万です。これにより、ほとんどの場合、トレーニングコストが 20 USD 未満に抑えられます。トレーニングデータセットが 100 万を超えると、料金は次のように増加します。
セルの数 | 料金 |
最初の 1,000 万セル |
100 万セルあたり 20 USD |
次の 9,000 万セル |
100 万セルあたり 15 USD |
1 億個以上のセル |
100 万セルあたり 7 USD |
注: 実際の料金は、上記で共有されている上限よりも低くなることがよくあります。
CREATE MODEL コストの例
- 10 万セルは 20 USD (= 1 x 20)
- 200 万セルは 40 USD (= 2 x 20)
- 2,300 万セルは 395 USD (= 10 x 20 + 13 x 15)
- 9,900 万セルは 1,535 USD (= 10 x 20 + 89 x 15) であり、
- 2 億 1,100 万セルは 2,327 USD (= 10 x 20 + 90 x 15 + 111 x 7)
CREATE MODEL リクエストの SELECT クエリによって生成されたトレーニングデータが、指定した MAX_CELLS 制限 (指定しなかった場合はデフォルトの 100 万) を超える場合、CREATE MODEL は、トレーニングデータセットから約 MAX_CELLS/“列数” レコードをランダムに選択し、これらのランダムに選択されたタプルを使用してトレーニングします。ランダムな選択は、削減されたトレーニングデータセットにバイアスが生じないように設計されています。したがって、MAX_CELLS を設定することにより、コストを範囲内に保つことができます。
リザーブドインスタンスの料金
リザーブドインスタンスは、使用率が安定した本番ワークロードに最適です。Amazon Redshift ノードタイプのオンデマンド料金と比べ、大幅な割引を受けられます。実験や PoC (概念実証) を実施して本番用の構成を検証してから、リザーブドインスタンスを購入するのが一般的です。
1 年または 3 年の契約で Amazon Redshift を使用すると、オンデマンドに比べて料金を大幅に節約できます。リザーブドインスタンスの料金は購入したノードタイプによって異なります。料金は予約期間が終了するまで有効です。価格には、データの 2 つの追加コピーが含まれています。1 つはクラスターノードへのコピー、もう 1 つは Amazon S3 へのコピーです。バックアップ、耐久性、可用性、セキュリティ、モニタリング、メンテナンスは AWS 側で維持管理します。
リザーブドインスタンスには、3 種類の料金オプションがあります。
前払いなし – 前払いは一切不要で、1 年の期間を通じて月単位で支払う契約を結びます。
一部前払い – リザーブドインスタンス料金の一部を事前に支払い、残額は 1 年または 3 年の期間にわたって支払います。
全額前払い – リザーブドインスタンスの全期間 (1 年または 3 年) の料金を一括で前払いします。
リザーブドインスタンスは課金上の概念であり、データウェアハウスクラスターの作成には適用されません。購入すると、その時点でクラスターを実行していない場合や、既存のクラスターが中断されている場合でも、関連する前払い料金と月額料金が請求されます。リザーブドインスタンスを購入するには、Redshift コンソールの [Reserved Nodes] タブを参照してください。
今後 AWS はリザーブドインスタンスの料金プログラムを終了することがあります。リザーブドインスタンスの料金の対象であることに加えて、当社のサービスの使用について規定する AWS カスタマー契約やその他の契約に基づき、データ転送やその他の料金もリザーブドインスタンスの対象となります。
*これはリザーブドインスタンス期間全体の月別お支払額の平均です。毎月の実際のお支払額は、その月の実際の時間数に時間使用料金を掛けて計算した金額、またはその月の実際の秒数に、3600 で除算した時間使用料金を掛けて計算した金額に相当します。これは、実行する Redshift インスタンスタイプに応じて決まります。時間単位のご利用単価は、リザーブドインスタンス期間全体の月別お支払額の合計をリザーブドインスタンス期間全体の総時間数 (1 年は 365 日とする) で除算したものに相当します。
** 実効時間単価は、オンデマンドの料金と比較したリザーブドインスタンスのコスト削減額の計算に役立てていただくためのものです。リザーブドインスタンスを購入すると、選択したリザーブドインスタンス期間が終了するまでの間、インスタンスを実行するかどうかにかかわらず 1 時間ごとに料金請求が発生します。実効時間単価は、時間あたりの償却されたインスタンスコストを示します。これにより、前払いを含む全期間にわたるリザーブドインスタンスの合計コストが計算され、リザーブドインスタンス期間の 1 時間ごとに分散されます。
*** リザーブドインスタンスの場合、前払い料金 + (時間料金 × 期間内の時間数) ÷ (期間内の年数 × ノードあたりの TB 数) で計算されます。RA3 の場合、マネージドストレージに保存されたデータは、RA3 ノードタイプに保存された実際のデータ量に基づいて別途請求されます。年間の 1 TB あたりの実質料金はコンピューティングノードのコストだけを計算したものです。
ゼロ ETL 統合のコスト
Amazon Redshift は、オンライントランザクション処理 (OLTP) データベースやエンタープライズアプリケーションとゼロ ETL 統合を行えるため、抽出、変換、ロード (ETL) パイプラインを構築および管理する必要がなくなります。サポートされているデータベースには、Amazon Aurora、Amazon DynamoDB、Amazon Relational Database Service (Amazon RDS) for MySQL が含まれています。サポートされているエンタープライズアプリケーションには、Salesforce、ServiceNow、Zendesk などがあります。
これらの統合により柔軟性が高まり、データベースまたはエンタープライズアプリケーション内の特定のデータテーブルを選択して Amazon Redshift に自動的にレプリケートできます。この柔軟性により、複数のアプリケーションとデータソースにわたって統合分析を実行できます。ゼロ ETL 統合に AWS から追加料金が請求されることはありません。ゼロ ETL 統合の一環として作成された変更データの作成と処理に使用された既存のリソースについての料金はお支払いいただきます。これには、レプリケートされたデータを保存するための追加の Amazon Redshift ストレージ、データレプリケーションを処理するためのコンピューティングリソース (または Amazon Redshift Serverless の RPU)、ソースからターゲットにデータを移動するための AZ 間のデータ転送コストが含まれます。ゼロ ETL 統合によるデータ変更の継続的な処理は、追加料金なしで利用いただけます。詳細については、Aurora、Amazon RDS for MySQL、DynamoDB、および AWS Glue の料金ページをご覧ください。
バックアップストレージ
バックアップストレージは、データウェアハウスのスナップショットに関連するストレージです。データウェアハウスによるバックアップストレージの使用量は、バックアップ保持期間の延長やスナップショットの追加取得を行うと増加します。Amazon Redshift では、コンソール、アプリケーションプログラミングインターフェイス (API)、コマンドラインインターフェイス (CLI) を使って行うマニュアルスナップショットにも料金がかかります。Amazon Redshift のスナップショットスケジューリング機能で作成されるデフォルトの Redshift 自動スナップショットに料金は発生せず、最大 35 日間保持することができます。24 時間未満の Amazon Redshift Serverless リカバリーポイントについては、課金されません。24 時間を超えてリカバリーポイントを保持することを選択した場合、RMS の一部として料金が発生します。RA3 クラスターに保存されたデータは RMS の一部であるため RMS レートで請求されますが、RA3 クラスターに対して作成された手動スナップショットは、このページで説明されている標準的な Amazon S3 レートによりバックアップのストレージとして請求されます。
たとえば、お使いの RA3 クラスターに 10 TB のデータと 30 TB の手動スナップショットがある場合は、10 TB の RMS と 30 TB のバックアップストレージに対して請求されます。高密度コンピューティング (DC) および高密度ストレージ (DS) クラスターでは、ストレージはクラスターに含まれ、個別に請求されることはありませんが、バックアップは Amazon S3 の外部に保存されます。DC クラスターおよび DS クラスターにプロビジョニングされたストレージサイズを超えるバックアップストレージは、標準的な S3 料金によってバックアップストレージとして請求されます。スナップショットは、クラスターが中断または削除されたときを含め、期限切れまたは削除されるまで請求されます。
データ転送
バックアップ、復元、読み込み、アンロードといったオペレーションのために、同じ AWS リージョン内の Amazon Redshift と Amazon S3 の間でデータを転送しても、料金はかかりません。これ以外の Amazon Redshift との間のデータ転送すべてには、通常の AWS データ転送料金が請求されます。 特に、Amazon Virtual Private Cloud (VPC) で Amazon Redshift クラスターを実行する場合、Amazon Redshift クラスターエンドポイントへの JDBC/ODBC によるデータ転送に対し、標準の AWS データ転送料金がかかります。さらに、拡張された VPC のルーティングを使用する場合や、別のリージョンにある Amazon S3 にデータをアンロードする場合は、通常の AWS データ転送料金が発生します。AWS データ転送料金の詳細については、Amazon Elastic Cloud Compute (Amazon EC2) 料金ページを参照してください。
Amazon Redshift は、リージョン間のデータ共有およびリージョン間のスナップショットコピーに課金されます。データ共有の料金は、データにアクセスしている消費者のリージョンで請求されます。リージョン間のスナップショットコピーは、スナップショットを作成したクラスターが存在するソースリージョンで請求されます。 データ転送料金は、すべてのスナップショット (自動と手動の両方) とリカバリポイントに適用されます。スナップショットコピーのすべてのデータ転送料金は、インクリメンタルデータのみを対象としています。
データ共有のデータ転送 (受信) またはスナップショットコピーのデータ転送 (送信)
料金の例
4 台の ra3.xlarge ノードと、40 TB の RMS を 1 か月間使用します。また、その月に Redshift Spectrum を使用して 20 TB のデータをスキャンします。オンデマンド料金を使用しています。
この場合、料金は以下のように計算されます。
- Redshift RA3 インスタンスコスト = 4 インスタンス × 3.26 USD/時間 × 730 時間/月 = 9,519.20 USD
- RMS コスト = 40 TB × 1,024 GB/TB × 0.024 USD = 983.04 USD
- Redshift Spectrum コスト = 20 TB x 5.00 USD = 100.00 USD
合計の月額コスト: 10,602.24 USD
2つの AZ に同時に展開されるマルチ AZ クラスターを使用します。クラスター には、AZ ごとに 4 つの ra3.4xlarge ノードがあり、1 か月で 40TB の RMS を使用します。オンデマンド料金を使用しています。
この場合、料金は以下のように計算されます。
- AZ1 の Redshift RA3 インスタンスコスト = 4 インスタンス × 3.26 USD/時間 × 730 時間/月 = 9,519.20 USD
- AZ2 の Redshift RA3 インスタンスコスト = 4 インスタンス × 3.26 USD/時間 × 730 時間/月 = 9,519.20 USD
- RMS コスト = 40 TB × 1,024 GB/TB × 0.024 USD = 983.04 USD
合計の月額コスト: 20,021.44 USD
米国東部 (バージニア北部) リージョンの Amazon Redshift データウェアハウスで、午前 7 時から午後 7 時まで 1 時間ごとに実行される必要があるデータ処理ジョブがあるとします。簡単にするために、ジョブが実行されるたびに、同じ時間 (10 分 30 秒) がかかると仮定します。Amazon Redshift がジョブの実行に 128 RPU の容量を使用するとします。
以下の表は、その日の総使用量をまとめたものです。
クエリの間隔 |
ジョブは午前 7 時から午後 7 時の間に 13 回実行され、毎回 10 分 30 秒かかるとします。つまり、136 分 30 秒 = 8190 秒となります。 |
使用容量 |
128 RPU |
毎日の料金 |
109.20 USD ((8190 × 128 RPU × 0.375 USD/RPU-時間)/3600) |
米国東部 (バージニア北部) リージョンの Amazon Redshift データウェアハウスにダッシュボーディングアプリケーションがあるとします。このアプリケーションは、組織内の様々なユーザー (データアナリスト、デベロッパー、データサイエンティストなど) によって使用されており、1 日の中でピーク時とダウン時があります。具体的には、このアプリケーションは、朝の 9 時から 11 時、午後 2 時から 4 時にユーザーアクティビティが活発になり、ほとんどのユーザーが分析を行い、データウェアハウスからデータにアクセスします。例えば、このアプリケーションには、午前 11 時から午後 2 時までの間に、ユーザーアクティビティがない 15 分の時間間隔が 4 回あるとします。また、午後 10 時から午前 5 時までユーザーアクティビティはありません。
次に、Amazon Redshift データウェアハウスのリソース使用状況を見てみましょう。料金のパフォーマンスをよりよくコントロールするために、Amazon Redshift Serverless のベースの設定を 64 RPU として明示的に設定したとします。午前と午後のピーク時には、Amazon Redshift が自動的にスケールし、それぞれ合計 192 RPU と 128 RPU の容量を使用すると仮定します。
以下の表は、その日の総使用量をまとめたものです。
期限 |
クエリの総実行時間 |
午前 5 時~午前 9 時 |
64 RPU を 4 時間 = 64 × 4 = 256 RPU-時間 |
午前 9 時~午前 11 時 |
192 RPU を 2 時間 = 384 RPU-時間 |
午前 11 時~午後 2 時 |
4 回の 15 分間の休息時間を除くと、アクティビティの時間は 2 時間です。 64 RPU を 2 時間 = 64 × 2 = 128 RPU-時間 |
午後 2 時〜午後 3 時 |
128 RPU を 1 時間 = 128 RPU-時間 |
午後 3 時〜午後 10 時 |
64 RPU を 7 時間 = 64 × 7 = 448 RPU-時間 |
午後 10 時~午前 5 時 |
アクティビティなし |
毎日の料金 |
504 USD ((256 + 384 + 128 + 128 + 448) × 0.375 USD/RPU-時間) |
米国東部の 10 DC2.8XL ノードの Redshift クラスター料金は 1 時間あたり 48 USD になります。2 つの一時的なクラスターが無料同時実行スケーリングクレジットを超えて 5 分間使用されるシナリオを考えてみます。同時実行スケーリングの秒単位のオンデマンド料金は、48 USD × 1/3600 = 0.013 USD (1 秒あたり) となります。この場合の同時実行スケーリングの追加コストは、0.013 USD/秒 × 300 秒 × 2 つの一時的なクラスター = 8 USD となります。したがって、Redshift クラスターと 2 つの一時的なクラスターの総コストは 56 USD となります。
合計サイズが 4 TB の、非圧縮テキストファイルとして Amazon S3 に保存された、均等に区切られた 100 の列があるテーブルがあるとします。テーブルの 1 つの列からデータを取得するクエリを実行する場合、テキスト形式では分割できないため、Redshift Spectrum はファイル全体をスキャンする必要があります。米国東部 (バージニア北部) の Redshift Spectrum の料金に基づくと、このクエリは 4 TB をスキャンし、コストは 20 USD となります。(5.00 USD/TB × 4 TB = 20 USD)
GZIP を使用してファイルを圧縮して、圧縮率が 4:1 であるとします。この場合、圧縮されたファイルのサイズは 1 TB になります。Redshift Spectrum はファイル全体をスキャンする必要がありますが、サイズは 4 分の 1 になっているため、コストも 4 分の 1、つまり 5 USD になります。(5 USD/TB × 1TB = 5 USD)
ファイルを圧縮して Apache Parquet などの列指向形式に変換し、圧縮率が 4:1 であるとすると、圧縮されたファイルのサイズは 1 TB になります。上記と同じクエリを使用すると、Redshift Spectrum がスキャンする必要があるのは、Parquet ファイルのうちの 1 列のみになります。このクエリのコストは 0.05 USD になります。(5 USD/TB × 1 TB ファイルサイズ × 1/100 列、またはスキャンされる合計 10 GB = 0.05 USD)
注: 上記料金は一例です。圧縮率はファイルや列によって異なります。
料金に関するその他のリソース
AWS の月額料金を簡単に計算
個別のお見積もりをご希望の場合、AWS のスペシャリストに問い合わせる
Amazon Redshift リソースに関する詳細