Types de nœuds Amazon Redshift

Amazon Redshift propose différents types de nœuds afin de prendre en charge vos charges de travail. Nous vous recommandons de choisir RA3 ou DC2 en fonction des exigences de performances, de taille des données et de croissance. Amazon Redshift Serverless alloue automatiquement les ressources appropriées requises pour gérer la charge de travail, de sorte que vous n'ayez pas besoin de choisir un type de nœud.

Les nœuds RA3 avec stockage géré vous permettent d'optimiser votre entrepôt des données en mettant à l'échelle et en payant le calcul et le stockage géré indépendamment. Avec RA3, vous choisissez le nombre de nœuds en fonction de vos exigences de performances et ne payez que le stockage géré que vous utilisez. Vous devriez dimensionner votre cluster RA3 en fonction du volume de données que vous traitez quotidiennement.

Le stockage géré par Redshift (RMS) utilise des disques SSD de grande taille et très performants dans chaque nœud RA3 pour un stockage local rapide et Amazon Simple Storage Service (Amazon S3) pour un stockage durable à plus long terme. Si les données d'un nœud dépassent la taille des grands disques SSD locaux, RMS décharge automatiquement ces données vers Amazon S3. Vous payez le même tarif réduit pour RMS, que les données résident dans des disques SSD hautes performances ou dans Amazon S3. Pour les applications nécessitant un stockage toujours plus important, le stockage géré vous permet de mettre à l'échelle automatiquement la capacité de stockage de votre entrepôt des données sans avoir à ajouter et à payer des nœuds supplémentaires.

Les nœuds DC2 permettent de créer des entrepôts des données à forte intensité de calcul avec un stockage SSD local inclus. Choisissez le nombre de nœuds dont vous avez besoin en fonction de la taille des données et des exigences en matière de performance. Les nœuds DC2 stockent vos données localement pour des performances élevées. À mesure que la taille des données grandit, vous pouvez ajouter plus de nœuds de calcul afin d'augmenter la capacité de stockage du cluster. Pour les jeux de données décompressés de moins de 1 To, nous vous recommandons les types de nœuds DC2 qui vous permettent de bénéficier des meilleures performances au prix le plus bas. Si vous souhaitez voir vos données grandir, nous vous recommandons d'utiliser les nœuds RA3. Ainsi, vous pouvez dimensionner le calcul et le stockage indépendamment afin de bénéficier du meilleur prix et des meilleures performances.

Fonctionnalités Redshift avec paiement à l'utilisation

  • Types de nœuds Amazon Redshift : choisissez la meilleure configuration de cluster et le meilleur type de nœud pour vos besoins. Vous pouvez payer la capacité à l'heure avec la tarification à la demande d'Amazon Redshift. Lorsque vous choisissez la tarification à la demande, vous pouvez utiliser la fonction de pause et de reprise pour suspendre la facturation à la demande lorsqu'un cluster n'est pas en cours d’utilisation. Vous pouvez également choisir des instances réservées au lieu d'instances à la demande pour les applications stables et bénéficier de réductions importantes par rapport à la tarification à la demande.
  • Tarification Amazon Redshift Spectrum : exécutez des requêtes SQL directement sur les données de votre lac de données Amazon S3, jusqu'à des exaoctets (vous payez simplement pour le nombre d'octets analysés).
  • Tarification de la mise à l'échelle de la simultanéité : chaque cluster bénéficie d'une heure de crédit de mise à l'échelle de la simultanéité gratuit au maximum par jour, soit un volume suffisant pour 97 % des clients. Cela vous permet de fournir des performances toujours élevées, même en présence de milliers d'utilisateurs et de requêtes simultanés. Vous payez simplement un tarif à la demande par seconde pour votre utilisation excédant le crédit gratuit.
  • Tarification de RMS : payez uniquement les données que vous stockez dans des clusters RA3, indépendamment du nombre de nœuds de calcul alloués. Vous payez simplement un tarif à l'heure pour le volume de données total qui figure dans le stockage géré. RMS est aussi utilisé avec Amazon Redshift Serverless
  • Redshift ML: utilisez SQL pour créer, entraîner et déployer des modèles de machine learning (ML). Lorsque vous avez épuisé l'offre gratuite d'Amazon SageMaker, des frais vous sont facturés pour la création de vos modèles et votre stockage. Redshift ML est également disponible pour une utilisation avec Amazon Redshift sans serveur.

Essai gratuit d'Amazon Redshift

Si vous n'avez jamais utilisé Amazon Redshift Serverless auparavant, vous pouvez bénéficier d'un crédit de 300 USD avec une expiration de 90 jours pour votre utilisation du calcul et du stockage. Le taux de consommation de ce crédit dépend de l'utilisation réelle et de la capacité de calcul de votre point de terminaison sans serveur.

Dans les régions où Amazon Redshift Serverless n'est pas encore disponible, les clients peuvent commencer un essai gratuit pour les clusters provisionnés. Vous pouvez bénéficier d'un essai gratuit de deux mois de notre nœud DC2 de grande taille. Votre organisation dispose de 750 heures gratuites par mois, ce qui est suffisant pour exécuter en continu un nœud DC2 large avec 160 Go de stockage SSD compressé. Une fois que votre essai gratuit de deux mois expire ou que votre utilisation dépasse 750 heures par mois, vous pouvez arrêter votre cluster pour éviter tout frais, ou le maintenir en activité à notre tarif à la demande standard. Consultez la page d'essai gratuit d'Amazon Redshift pour en savoir plus.

Tarification à la demande

La tarification à la demande d'Amazon Redshift vous permet de payer la capacité allouée à l'heure sans engagement ni frais initiaux pour le type de nœud spécifique sur lequel vous choisissez d'exécuter votre entrepôt de données. Payez simplement un tarif horaire basé sur le type et le nombre de nœuds choisis dans votre cluster et vous serez facturé tant que le cluster fonctionnera. Les heures partielles sont facturées par incrément d'une seconde après un changement d'état facturable, par exemple la création, la suppression, la mise en pause ou la reprise du cluster. La fonction de mise en pause et de reprise vous permet de suspendre la facturation à la demande durant la mise en pause du cluster. Mise en pause et Reprise est une opération manuelle ou planifiée sur les types de nœuds Redshift. Durant la mise en pause d'un cluster, vous ne payez que pour le stockage de sauvegarde. Vous n'avez donc pas à vous soucier de la planification et de l'achat de capacités pour l'entrepôt de données en amont, ce qui vous permet de gérer de manière rentable vos environnements à des fins de test ou de développement. Dans le cas d'un déploiement Multi-AZ, vous payez les mêmes taux de facturation mais pour le double de la capacité de calcul que dans le cas d'un déploiement mono-AZ.

Génération actuelle

* Capacité totale de stockage adressable dans le stockage géré avec chaque nœud RA3.

Génération précédente

Calcul de votre prix réel à la demande par To et par an

Pour les tarifs à la demande, le tarif réel par To et par an correspond au tarif horaire de l'instance multiplié par le nombre d'heures dans une année, et divisé par le nombre de To par instance. Pour RA3, les données stockées dans le stockage géré sont facturées séparément en fonction des données réelles qui sont stockées dans les types de nœud RA3. Le prix réel par To et par an est calculé pour les coûts des nœuds de calcul uniquement.

Amazon Redshift sans serveur

Vous pouvez commencer à utiliser Amazon Redshift sans serveur pour seulement 3 dollars de l'heure et ne payer que pour la capacité de calcul consommée par votre entrepôt des données lorsqu'il est actif. La capacité de votre entrepôt des données augmente ou diminue automatiquement pour répondre aux demandes de la charge de travail de votre analytique et s'arrête pendant les périodes d'inactivité pour économiser du temps et des frais d'administration. Amazon Redshift mesure la capacité de l'entrepôt de données en unités de traitement Redshift (RPU). Vous payez les charges de travail que vous exécutez en RPU-heures à la seconde (avec des frais minimum de 60 secondes), y compris les requêtes qui accèdent aux données dans des formats de fichiers ouverts dans Amazon S3. Le temps de démarrage de l'entrepôt de données est gratuit. Les capacités de scalabilité automatique et de sécurité complète sont incluses. Vous n'avez pas besoin de payer séparément la mise à l'échelle de la simultanéité et Redshift Spectrum, car ils sont tous deux inclus avec Amazon Redshift sans serveur.

Vous pouvez éventuellement utiliser les paramètres Base, Max RPU-Hours et MaxRPU (capacité maximale) pour contrôler les performances et les coûts de l'entrepôt de données.

  • Base – Ce paramètre vous permet de spécifier la capacité de l'entrepôt de données de base qu'Amazon Redshift utilise pour répondre aux requêtes. La capacité de Base est spécifiée en RPU. La configuration d'une capacité de calcul de base plus élevée peut permettre d'améliorer les performances des requêtes, en particulier pour les tâches de traitement des données et les tâches ETL (extraction, transformation, chargement) qui traitent de grandes quantités de données et effectuent des transformations et des enrichissements. Vous pouvez régler la base de 8 RPU à 512 RPU par unités de 8 (8, 16, 24, 32, 40, 48 et ainsi de suite, jusqu'à 512) à partir de la console de gestion Amazon Redshift ou en appelant une API Amazon Redshift.
  • Max – Ce paramètre vous permet de spécifier des limites d'utilisation quotidiennes, hebdomadaires et mensuelles, et définir les actions qu'Amazon Redshift exécute automatiquement si ces limites sont atteintes pour maintenir votre budget avec prévisibilité. Max est spécifié en RPU-heures et est associé à une durée quotidienne, hebdomadaire ou mensuelle. La configuration d'une capacité de calcul maximale plus élevée peut améliorer le débit global du système, ce qui est particulièrement avantageux pour les charges de travail qui doivent gérer une simultanéité élevée tout en maintenant des performances constamment élevées. Vous pouvez ajuster le Max à partir de la console de gestion Amazon Redshift ou en appelant une API Amazon Redshift.
  • MaxRPU (capacité maximale) - Ce paramètre établit le nombre le plus élevé de RPU qu'Amazon Redshift sans serveur peut prendre en charge à des fins de mise à l'échelle. Lorsque la mise à l'échelle automatique des calculs est requise, une valeur plus élevée pour MaxRPU peut améliorer le débit des requêtes. Lorsque la limite MaxRPU est atteinte, le calcul du groupe de travail n'augmente plus verticalement les ressources.

La capacité de stockage principale est facturée en tant que Redshift Managed Storage (RMS) et le stockage utilisé pour les instantanés utilisateur est facturé aux taux de facturation de sauvegarde standard décrits sur cette page. Le stockage est facturé aux mêmes tarifs qu'avec les clusters Amazon Redshift alloués. Avec Amazon Redshift sans serveur, vous pouvez restaurer gratuitement votre entrepôt de données à des points spécifiques au cours des dernières 24 heures avec une granularité de 30 minutes. Les coûts de transfert de données et de ML s’appliquent séparément, de la même manière que les clusters alloués. La réplication d’instantanés et le partage de données entre les Régions AWS sont facturés aux taux de transfert indiqués sur cette page.

Tarification du stockage géré d'Amazon Redshift

Vous payez les données stockées dans le stockage géré à un taux par Go-mois fixe pour votre région. Le stockage géré comprend exclusivement des types de nœuds RA3 et vous payez le même tarif réduit pour le stockage géré Redshift, quelle que soit la taille des données. L'utilisation du stockage géré est calculée à l'heure en fonction du volume total des données présentes dans le stockage géré (voir l'exemple ci-dessous qui convertit l'utilisation en Go-heures en frais en Go-mois). Vous pouvez contrôler le volume de données de votre cluster RA3 via Amazon CloudWatch ou la console de gestion AWS. Vous ne payez aucuns frais de transfert de données entre les nœuds RA3 et le stockage géré. Les frais de stockage géré n'incluent pas les frais de stockage de sauvegarde dus aux instantanés automatiques et manuels (consultez Stockage de sauvegarde). Une fois le cluster résilié, la conservation de vos sauvegardes manuelles continue de vous être facturée.

Exemple de tarification pour la tarification du stockage géré

Supposons que vous stockez 100 Go de données dans le stockage géré, avec les types de nœud RA3, pendant les 15 premiers jours en avril et 100 To de données durant les 15 derniers jours de ce mois.
 
Calculons tout d’abord l’utilisation en Go-heures. Au cours des 15 premiers jours, vous obtiendrez l'utilisation suivante : 100 Go x 15 jours x (24 heures/jour) = 36 000 Go-heures. Au cours des 15 derniers jours, vous obtiendrez l'utilisation suivante : 100 To x 1024 Go/To x 15 jours x (24 heures/jour) = 36 864 000 Go-heures.
 
À la fin du mois d'avril, l'utilisation totale en Go-heures s'élève à : 36 000 Go-heures + 36 864 000 Go-heures = 36 900 000 Go-heures
Si l'on convertit cela en Go-mois, on obtient : 36 900 000 Go-heures / 720 heures par mois en avril = 51 250 Go-mois.
 
Si ces données ont été stockées dans la région USA Est (Virginie du Nord), le stockage géré sera facturé à 0,024 USD/Go-mois. Les frais de stockage mensuels pour 51 250 Go-mois s'élèveront à : 51 250 Go-mois x 0,024 USD par Go-mois = 1 230 USD.
 
Frais RMS totaux pour avril = 1 230 USD

Tarification Amazon Redshift Spectrum

Amazon Redshift Spectrum permet d'exécuter des requêtes SQL sur plusieurs exaoctets de données dans Amazon S3. Vous êtes facturé en fonction du nombre d'octets analysés par Redshift Spectrum, arrondi au mégaoctet supérieur le plus proche, avec un minimum de 10 Mo par requête. Aucuns frais ne vous sont facturés pour les instructions DDL (Data Definition Language), telles que CREATE/ALTER/DROP TABLE, pour la gestion des partitions et des requêtes ayant échoué.

Les requêtes Amazon Redshift Serverless relatives aux données externes dans Amazon S3 ne sont pas facturées séparément, et sont incluses dans le montant facturé pour Amazon Redshift Serverless en montants RPU-heure.

Vous pouvez améliorer les performances des requêtes et réduire les coûts en stockant vos données dans un format de données compressés, partitionné ou en colonnes. Si vous compressez les données à l'aide de l'un des formats pris en charge par Redshift Spectrum, vos coûts diminueront du fait d'une quantité moins importante de données analysées. De même, si vous stockez des données dans un format en colonnes, comme Apache Parquet ou Optimized Row Columnar (ORC), vos frais diminueront, car Redshift Spectrum ne scanne que les colonnes nécessaires à la requête.

Coûts supplémentaires

Le cluster Amazon Redshift qui est utilisé pour interroger des données avec Redshift Spectrum vous est facturé. Redshift Spectrum interroge les données directement dans Amazon S3. Le stockage d'objets dans vos compartiments S3 et les requêtes effectuées dans vos compartiments S3 sont facturés selon les tarifs S3 standard. Pour plus d'informations, référez-vous aux tarifs Amazon S3

Si vous utilisez le catalogue de données AWS Glue avec Amazon Redshift Spectrum, le tarif standard du catalogue de données AWS Glue s'applique. Pour plus d'informations, référez-vous à la tarification d'AWS Glue.

Lorsque vous utilisez Amazon Redshift Spectrum pour effectuer des requêtes sur des données chiffrées d'AWS Key Management Service (KMS) dans Amazon S3, les frais AWS KMS standard vous sont facturés. Pour plus d'informations, référez-vous à la tarification d'AWS KMS.

Exemples de tarification Redshift Spectrum basés sur la tarification de la région USA Est (Virginie du Nord)

Imaginez une table avec 100 colonnes de même taille stockée dans Amazon S3 sous la forme d'un fichier texte non compressé d'une taille totale de 4 To. Pour exécuter une requête afin d'obtenir des données auprès d'une colonne de la table, Redshift Spectrum doit analyser la totalité du fichier, car les formats texte ne peuvent pas être divisés. Cette requête analyserait 4 To et vous coûterait 20 USD. (5 USD par To x 4 To = 20 USD)

Si vous compressez le fichier avec GZIP, vous pourriez constater un taux de compression de 4:1. Dans ce cas, vous obtiendrez un fichier compressé de 1 To. Redshift Spectrum doit analyser la totalité du fichier, mais comme il fait le quart de sa taille, vous payez un quart du coût, soit 5 USD. (5 USD par To x 1 To = 5 USD)

Si vous compressez votre fichier et le convertissez dans un format en colonnes comme Apache Parquet, vous pouvez constater un taux de compression de 4:1 et obtenir un fichier compressé de 1 To. En utilisant la même requête que précédemment, Redshift Spectrum ne doit analyser qu'une colonne dans le fichier Parquet. Le coût de cette requête serait de 0,05 USD (5 USD par To x 1 To de taille de fichier x 1/100 colonnes, soit un total de 10 Go analysés = 0,05 USD).

Remarque : les exemples de tarification ci-dessus ne sont fournis qu'à titre indicatif. Le taux de compression des différents fichiers et colonnes peut varier.

Tarification de la mise à l'échelle de la simultanéité

Amazon Redshift ajoute automatiquement de la capacité transitoire pour fournir des performances rapides en permanence, même en présence de milliers de requêtes et d'utilisateurs simultanés. Il n'y a ni ressources à gérer ni coûts initiaux, et les temps de démarrage et d'arrêt des clusters transitoires ne vous sont pas facturés. Vous pouvez accumuler une heure de crédits de cluster de mise à l'échelle de la simultanéité toutes les 24 heures lorsque votre cluster principal est en cours d'exécution. Vous êtes facturé un tarif à la demande par seconde pour tout cluster transitoire de mise à l'échelle de la simultanéité utilisé en sus de votre crédit gratuit, et ce uniquement si vous utilisez ledit cluster pour vos requêtes. Par ailleurs, vous payez un coût minimal d'une minute à chaque activation d'un cluster de mise à l'échelle de la simultanéité. Le tarif à la demande par seconde est basé sur le type et le nombre de nœuds existant dans votre cluster Amazon Redshift.

Amazon Redshift sans serveur augmente ou diminue automatiquement les ressources selon les besoins, pour répondre aux besoins de la charge de travail par défaut, et il n'y a pas de frais distincts pour la mise à l'échelle de la simultanéité.

Crédits de mise à l'échelle de la concurrence

Les clusters Redshift bénéficient d'un crédit de mise à l'échelle de la simultanéité gratuite d'une heure maximum par jour. Les crédits sont acquis sur une base horaire pour chaque cluster actif dans votre compte AWS, et peuvent être consommés par le même cluster seulement après acquisition des crédits. Vous pouvez cumuler jusqu'à 30 heures de crédit d'adaptation de la simultanéité gratuit pour chaque cluster actif. Le crédit n'expire pas avec la déconnexion du cluster.

Exemple de tarification de l'adaptation de la simultanéité

Un cluster Redshift de nœud A 10 DC2.8XL dans la région USA Est coûte 48 USD par heure. Imaginons que deux clusters transitoires sont utilisés pendant cinq minutes en sus du crédit de la mise à l'échelle de la simultanéité gratuite. La tarification à la demande par seconde pour la mise à l'échelle de la simultanéité est : 48 USD x 1/3600 = 0,013 USD par seconde. Le coût additionnel de la mise à l'échelle de la simultanéité dans ce cas est : 0,013 USD par seconde x 300 secondes x 2 clusters transitoires = 8 USD. Ainsi, le coût total du cluster Amazon Redshift et des deux clusters transitoires dans cet exemple est 56 USD.

Tarification de Redshift ML

Lorsque vous commencez à utiliser Redshift ML, vous êtes éligible à l'offre gratuite d'Amazon SageMaker si nous n'aviez jamais utilisé Amazon SageMaker. Cette éligibilité vous donne droit à deux requêtes CREATE MODEL gratuites par mois pendant deux mois, comportant chacune jusqu'à 100 000 cellules. Vous commencez à profiter de votre offre gratuite le mois où vous créez votre premier modèle dans Redshift ML.

Frais Amazon S3
La requête CREATE MODEL induit également quelques frais minimes Amazon S3. Les coûts S3 devraient être inférieurs à 1 USD par mois puisque la quantité de données S3 générées par CREATE MODEL est de l'ordre de quelques gigaoctets. Lorsque le récupérateur de mémoire est activé, l'élimination de fait rapidement. Amazon S3 est utilisé d'abord pour stocker les données d'entraînement générées par la requête SELECT de CREATE MODEL. Il est ensuite utilisé pour stocker divers artefacts relatifs aux modèles nécessaires pour effectuer des prédictions. Le mode de nettoyage par défaut élimine les données d'entraînement et les artefacts relatifs aux modèles à la fin de la requête CREATE MODEL.

Options de contrôle des coûts
Vous pouvez contrôler les coûts d'entraînement en définissant le paramètre MAX_CELLS. À défaut, la valeur par défaut de MAX_CELLS est 1 million, un chiffre qui maintient généralement vos coûts d'entraînement en deçà de 20 USD. Lorsque les données d'entraînement sont définies sur plus de 1 million, la tarification évolue comme suit :

Nombre de cellules Prix

10 premiers millions de cellules

20 USD par million de cellules

90 millions de cellules suivants

15 USD par million de cellules

Plus de 100 millions de cellules

7 USD par million de cellules

 

Remarque : la tarification réelle est souvent inférieure aux plafonds ci-dessus. 

Exemples de coûts liés à la requête CREATE MODEL :

  • 100 000 cellule à 20 USD (= 1 x 20)
  • 2 000 000 cellules à 40 USD (= 2 x 20)
  • 23 000 000 cellules à 395 USD (= 10 x 20 + 13 x 15)
  • 99 000 000 cellules à 1 535 USD (= 10 x 20 + 89 x 15) et 
  • 211 000 000 cellules à 2 327 USD (= 10 x 20 + 90 x 15 + 111 x 7)

Si les données d'entraînement générées par la requête SELECT de la demande CREATE MODEL dépassent la limite MAX_CELLS que vous avez définie (ou la valeur par défaut de 1 million, au cas où vous n'en auriez pas défini), CREATE MODEL choisit de manière aléatoire et approximative les enregistrements MAX_CELLS/« nombre de colonnes » à partir du jeu de données d'entraînement et entraîne uniquement ces tuples choisis aléatoirement. Le mode de choix aléatoire vise à prévenir tout biais lié à la réduction du jeu de données d'entraînement. Ainsi, en définissant la valeur MAX_CELLS, vous pouvez maîtriser vos coûts.

Tarification des instances réservées

Les instances réservées conviennent aux applications régulières en production et vous permettent de réaliser d'importantes économies par rapport à la tarification à la demande des types de nœuds Amazon Redshift. Les clients achètent généralement des instances réservées après avoir réalisé des expériences et des démonstrations de faisabilité pour valider leurs configurations en production.

Vous pouvez bénéficier d'économies importantes par rapport à la tarification à la demande en vous engageant à utiliser Amazon Redshift pour une durée d'un ou trois ans. La tarification des instances réservées est spécifique au type de nœud acheté et reste en vigueur jusqu'à la fin du terme de la réservation. Les tarifs comprennent deux copies supplémentaires de vos données, l'une sur les nœuds du cluster et l'autre dans Amazon S3. Nous prenons en charge la sauvegarde, la durabilité, la disponibilité, la sécurité, la surveillance et la maintenance pour vous.

Pour la tarification des instances réservées, trois options s'offrent à vous :

Aucun paiement anticipé : vous ne payez rien à l'avance, et vous vous engagez à payer un taux mensuel tout au long d'une année.

Paiement anticipé partiel : vous payez une partie des frais initiaux de l'instance réservée, et le reste sur un ou trois ans.

Tous les frais initiaux ; vous payez la durée totale de réservation de l'instance (un ou trois ans) en un seul paiement initial.

Les instances réservées représentent un concept de facturation et ne sont pas utilisées pour créer des clusters d'entrepôts des données. Lorsque vous effectuez un achat, les frais pour paiement anticipé et mensuel associés vous seront facturés, même si vous n'avez pas de cluster en cours d'exécution à ce moment ou si un cluster existant est en pause. Pour acheter des instances réservées, accédez à l'onglet Nœuds réservés de la console Redshift.

Nous sommes susceptibles de résilier le programme de tarification des instances réservées à tout moment. En plus d’être soumis à la tarification des instances réservées, les instances réservées sont également soumises à tous les frais de transfert de données et autres frais applicables selon le Contrat client AWS ou tout autre contrat conclu avec nous pour régir votre utilisation de nos services.

*Il s'agit du paiement mensuel moyen sur l'ensemble de la durée de l'instance réservée. Pour chaque mois, le paiement mensuel réel sera égal au nombre réel d'heures dans ce mois multiplié par le taux d'utilisation horaire ou le nombre de secondes dans ce mois multiplié par le taux d'utilisation horaire divisé par 3 600, selon le type d'instance Redshift que vous exécutez. Le tarif d'utilisation horaire correspond au total des paiements mensuels moyens sur la durée de réservation de l'instance réservée, divisé par le nombre total d'heures (sur une année de 365 jours) que compte la durée de réservation de l'instance réservée.

** La tarification horaire effective vous permet de calculer vos économies avec une instance réservée par rapport à la tarification à la demande. Lorsque vous achetez une instance réservée, vous êtes facturé pour chaque heure tout au long de la durée de réservation de l'instance réservée, peu importe que l'instance soit en cours d'exécution. Le prix horaire effectif indique le coût horaire amorti de l'instance. Il s'agit du coût total de l'instance réservée sur toute la durée, y compris tout paiement initial. Il est réparti sur chaque heure de la durée de l'instance réservée.

*** Pour les instances réservées, ajoutez le paiement initial au taux horaire multiplié par le nombre d'heures sur la période totale, et divisez ce chiffre par le nombre d'années et le nombre de To par nœud. Pour RA3, les données stockées dans le stockage géré sont facturées séparément en fonction des données réelles qui sont stockées dans les types de nœud RA3. Le prix réel par To et par an est calculé uniquement pour les coûts des nœuds de calcul.

Coûts d'intégration zéro ETL NOUVEAU

Amazon Redshift propose des intégrations zéro ETL avec les bases de données OLTP, ce qui élimine le besoin de créer et de gérer des pipelines ETL. Les bases de données prises en charge incluent Amazon Aurora, Amazon DynamoDB et Amazon Relational Database Service (Amazon RDS) pour MySQL. Ces intégrations vous offrent de la flexibilité. Vous pouvez donc choisir des tables de données spécifiques dans une base de données à répliquer automatiquement sur Amazon Redshift. Cette flexibilité vous permet d'exécuter des analyses unifiées sur plusieurs applications et sources de données. AWS ne facture aucuns frais supplémentaires pour l'intégration zéro ETL. Vous payez pour les ressources existantes utilisées pour créer et traiter les données de modification créées dans le cadre d'une intégration zéro ETL. Cela inclut le stockage Amazon Redshift supplémentaire pour le stockage des données répliquées, le calcul pour le traitement de la réplication des données (ou les RPU sur Amazon Redshift sans serveur) et les coûts de transfert de données entre plusieurs AZ pour le transfert de données de la source vers la cible. Le traitement continu des modifications de données par intégration zéro ETL est proposé sans frais supplémentaires. Pour plus d'informations, consultez les pages de tarification d'Aurora, de RDS pour MySQL et de DynamoDB.

Stockage de sauvegarde

Le stockage de sauvegarde correspond au stockage associé aux instantanés issus de votre entrepôt de données. L'allongement de votre période de rétention des sauvegardes ou la capture d'instantanés supplémentaires augmente le volume du stockage de sauvegarde consommé par votre entrepôt des données. Amazon Redshift facture les instantanés manuels que vous prenez à l’aide de la console, de l’interface de programmation d’application (API) ou de l’interface de ligne de commande (CLI). Les instantanés automatiques de Redshift, qui sont par défaut et créés à partir de la fonctionnalité de planification des instantanés d’Amazon Redshift ne sont pas facturés et peuvent être retenus pendant 35 jours au maximum. Vous n’êtes pas facturé pour les points de récupération Amazon Redshift sans serveur datant de moins de 24 heures. Des frais seront facturés dans le cadre du RMS si vous choisissez de conserver les points de récupération au-delà de 24 heures. Les données stockées sur les clusters RA3 font partie du RMS et sont facturées selon les taux de RMS, mais les instantanés manuels pris pour les clusters RA3 sont facturés en tant que stockage de sauvegarde aux taux Amazon S3 standards énoncés sur cette page.

Par exemple, si votre cluster RA3 possède 10 To de données et 30 To d'instantanés manuels, vous serez facturé pour 10 To de RMS et 30 To de stockage de sauvegarde. Avec les clusters de calcul intensif (DC) et de stockage intensif (DS), le stockage est inclus dans le cluster et n'est pas facturé séparément, mais les sauvegardes sont stockées de manière externe dans Amazon S3. Le stockage de sauvegarde dépassant la taille de stockage alloué dans les clusters DC et DS est facturé en tant que stockage de sauvegarde aux tarifs standard de S3. Les instantanés sont facturés jusqu'à leur expiration ou leur suppression, y compris lorsque le cluster est mis en pause ou supprimé.

Transfert de données

Vous n'aurez pas de frais à payer pour les données transférées entre Amazon Redshift et Amazon S3 au sein de la même région AWS, pour les opérations de sauvegarde, de restauration, de chargement et de déchargement. Les tarifs de transfert de données AWS standard s'applique pour tous les transferts de données vers Amazon Redshift et à partir de celui-ci. Si vous exécutez notamment votre cluster Amazon Redshift dans Amazon Virtual Private Cloud (VPC), les frais de transfert de données AWS standard s'applique pour les données transférées sur JDBC/ODBC vers le point de terminaison de votre cluster Amazon Redshift. De plus, lorsque vous utilisez le routage VPC amélioré et déchargez des données vers Amazon S3 dans une autre région, vous payez les frais de transfert de données AWS standard. Pour en savoir plus sur les tarifs de transfert de données AWS, consultez la page Tarification d'Amazon Elastic Cloud Compute (Amazon EC2).

Amazon Redshift facture le partage de données entre les régions, ainsi que la copie d'instantanés entre les régions. Les frais de partage de données sont facturés dans la région du consommateur où les données sont consultées. La copie d'instantané entre les régions est facturée dans la région source où se trouve le cluster qui a créé l'instantané. Des frais de transfert de données s'appliquent à tous les instantanés (automatisés et manuels) et à tous les points de restauration. Tous les frais de transfert de données pour la copie d’instantanés concernent uniquement les données incrémentielles.

Partage de données transfert de données ENTRANTES depuis ou copie d'instantané transfert de données SORTANTES depuis

Exemples de tarification

Exemple pour RMS

Vous utilisez quatre nœuds ra3.xlarge et 40 To de RMS pour un mois. Au cours du mois, vous analysez également 20 To de données en utilisant Redshift Spectrum et analysez 20 To de données. Vous utilisez la tarification à la demande

Vos frais seront calculés comme suit :

  • Coût de l'instance Redshift RA3 = 4 instances x 3,26 USD par heure x 730 heures dans un mois= 9 519,20 USD
  • Coût de RMS = 40 To x 1 024 Go par To x 0,024 USD = 983,04 USD
  • Coût de Redshift Spectrum = 20 To x 5,00 USD = 100,00 USD

Coût mensuel total : 10 602,24 USD

Exemple pour multi-AZ

Vous utilisez un cluster Multi-AZ déployé dans deux AZ simultanément. Votre cluster comporte quatre nœuds ra3.4xlarge par AZ et vous utilisez 40 To de RMS pendant un mois. Vous utilisez la tarification à la demande

Vos frais seront calculés comme suit :

  • Coût de l'instance Redshift RA3 pour AZ1 = 4 instances x 3,26 USD par heure x 730 heures dans un mois= 9 519,20 USD
  • Coût de l'instance Redshift RA3 pour AZ2 = 4 instances x 3,26 USD par heure x 730 heures dans un mois= 9 519,20 USD
  • Coût de RMS = 40 To x 1 024 Go par To x 0,024 USD = 983,04 USD

Coût mensuel total : 20 021,44 USD

Exemple pour Amazon Redshift sans serveur
Cet exemple montre la facturation d'Amazon Redshift en utilisant le mode de capacité à la demande pour l'option sans serveur.
Exemple de base

Supposons que vous ayez une tâche de traitement de données qui doit être exécutée toutes les heures de 7 h à 19 h sur votre entrepôt de données Amazon Redshift dans la région USA Est (Virginie du Nord). Par souci de simplicité, supposons que chaque fois que la tâche s'exécute, elle nécessite la même durée - 10 minutes et 30 secondes. Disons qu'Amazon Redshift utilise une capacité de 128 RPU pour exécuter la tâche.

Le tableau suivant résume votre utilisation totale pour la journée.

Période de requête

La tâche a été exécutée 13 fois entre 7 h et 19 h, durant à chaque fois 10 minutes et 30 secondes = 136 minutes et 30 secondes = 8190 secondes

Capacité utilisée

128 RPU

Frais quotidiens

109,20 USD ((8 190 x 128 RPU x 0,375 USD par RPU-heure)/3 600) 

Exemple avec configuration de base et scalabilité automatique

Supposons que vous ayez une application de tableau de bord sur votre entrepôt de données Amazon Redshift dans la région USA Est (Virginie du Nord). L'application est utilisée par une variété d'utilisateurs dans l'organisation (tels que les analystes de données, les développeurs et les scientifiques des données) et a des périodes de pointe et d'arrêt dans la journée. Plus précisément, l'application connaît un pic d'activité des utilisateurs le matin de 9h à 11h et de 14h à 16h lorsque la plupart des utilisateurs effectuent des analyses et accèdent aux données de l'entrepôt de données. Disons que l'application a quatre intervalles de 15 minutes de 11h à 14h lorsqu'il n'y a pas d'activité des utilisateurs. Il n'y a pas non plus d'activité des utilisateurs entre 22h et 5h.

Examinons maintenant l'utilisation des ressources sur l'entrepôt de données Amazon Redshift. Supposons que pour mieux contrôler les performances tarifaires, vous avez explicitement défini la configuration Base d'Amazon Redshift Serverless sur 64 RPU. Supposons que pendant les périodes de pointe du matin et de l'après-midi, Amazon Redshift s'adapte automatiquement et utilise une capacité totale de 192 RPU et 128 RPU respectivement.

Le tableau suivant résume votre utilisation totale pour la journée.

Échéancier

Période d'exécution totale des requêtes

5h à 9h

64 RPU pendant 4 heures = 64 x 4 = 256 RPU-heures

9h à 11h

192 RPU pendant 2 heures = 384 RPU-heures

11h à 14h

Exception faite des quatre intervalles de 15 min d'inactivité, le temps d'activité est de 2 heures.

64 RPU pendant 2 heures = 64 x 2 = 128 RPU-heures

14h à 15h

128 RPU pendant 1 heure = 128 RPU-heures

15h à 22h

64 RPU pendant 7 heures = 64 x 7 = 448 RPU-heures

22h à 5h

Aucune activité

Frais quotidiens

504 USD ((256 + 384 + 128 + 128 + 448) x 0,375 USD par RPU-heure) 

Exemple pour la mise à l'échelle de la simultanéité Amazon Redshift

Un cluster Redshift de nœud A 10 DC2.8XL dans la région USA Est coûte 48 USD par heure. Imaginons que deux clusters transitoires sont utilisés pendant cinq minutes en sus du crédit de la mise à l'échelle de la simultanéité gratuite. La tarification à la demande par seconde pour la mise à l'échelle de la simultanéité est : 48 USD x 1/3600 = 0,013 USD par seconde. Le coût additionnel de la mise à l'échelle de la simultanéité dans ce cas est : 0,013 USD par seconde x 300 secondes x 2 clusters transitoires = 8 USD. Ainsi, le coût total du cluster Redshift et des deux clusters transitoires est 56 USD.

Exemple pour Amazon Redshift Spectrum

Imaginez une table avec 100 colonnes de même taille stockée dans Amazon S3 sous la forme d'un fichier texte non compressé d'une taille totale de 4 To. Pour exécuter une requête afin d'obtenir des données auprès d'une colonne de la table, Redshift Spectrum doit analyser la totalité du fichier, car les formats texte ne peuvent pas être divisés. Sur la base de la tarification Redshift Spectrum pour la région USA Est (Virginie du Nord), cette requête analysera 4 To de données et coûtera 20 USD. (5,00 USD/To x 4 To = 20 USD)

Si vous compressez le fichier avec GZIP, vous pourriez constater un taux de compression de 4:1. Dans ce cas, vous obtiendrez un fichier compressé de 1 To. Redshift Spectrum doit analyser la totalité du fichier, mais comme il fait le quart de sa taille, vous payez un quart du coût, soit 5 USD. (5 USD par To x 1 To = 5 USD)

Si vous compressez votre fichier et le convertissez dans un format en colonnes tel qu’Apache Parquet, vous pouvez constater un taux de compression de 4:1 et obtenir un fichier compressé de 1 To. En utilisant la même requête que précédemment, Redshift Spectrum ne doit analyser qu'une colonne dans le fichier Parquet. Le coût de cette requête serait de 0,05 USD (5 USD par To x 1 To de taille de fichier x 1/100 colonnes, soit un total de 10 gigaoctets analysés = 0,05 USD).

Remarque : les exemples de tarification ci-dessus ne sont fournis qu'à titre indicatif. Le taux de compression des différents fichiers et colonnes peut varier.

Ressources de tarification supplémentaires

Calculateur de tarification AWS

Calculez facilement vos coûts mensuels avec AWS

Obtenir de l'aide pour la tarification

Contacter les spécialistes AWS pour obtenir un devis personnalisé

Découvrez davantage de ressources Amazon Redshift

Consulter la page de ressources
Prêt à concevoir ?
Démarrer avec Amazon Redshift
D'autres questions?
Contactez-nous.