Fonctionnalités d'Amazon Aurora

Pourquoi utiliser Amazon Aurora ?

Amazon Aurora est un service de base de données relationnelle qui associe la vitesse et la disponibilité des bases de données commerciales haut de gamme à la simplicité et la rentabilité des bases de données open source. Aurora est entièrement compatible avec MySQL et PostgreSQL, ce qui permet aux applications et outils existants de s’exécuter sans modifications.

Hautes performances et évolutivité

Les tests de performances standard réalisés avec SysBench ont montré une augmentation du débit allant jusqu'à 5 fois par rapport au stock MySQL et 3 fois par rapport au stock PostgreSQL sur du matériel similaire. Amazon Aurora utilise diverses techniques logicielles et matérielles pour permettre au moteur de base de données d'utiliser pleinement les ressources de calcul, de mémoire et de réseau disponibles. Les opérations d'I/O utilisent des techniques de système distribué telles que les quorums pour améliorer l'homogénéité des performances.

Amazon Aurora sans serveur est une configuration d’autoscaling à la demande pour Aurora avec laquelle la base de données démarre, s’arrête et se met automatiquement à l’échelle au gré des besoins de votre application. Amazon Aurora sans serveur vous permet d’exécuter votre base de données dans le cloud sans gérer d’instance de base de données. Vous pouvez également utiliser des instances Aurora sans serveur v2 ainsi que des instances provisionnées dans vos clusters de bases de données existants ou nouveaux.

Les API Amazon Relational Database Service (Amazon RDS) ou la console de gestion AWS peuvent vous servir à mettre à l’échelle les instances provisionnées pour accélérer ou réduire votre déploiement. Les opérations de dimensionnement des ressources de calcul s'effectuent généralement en quelques minutes.

Aurora adapte automatiquement les E/S pour répondre aux besoins de vos applications les plus exigeantes. Cela augmente également la taille du volume de votre base de données à mesure que vos besoins de stockage augmentent. Le volume augmente par tranche de 10 Go jusqu'à un maximum de 128 To. Vous n'avez pas besoin de prévoir d'espace de stockage supplémentaire pour maîtriser la croissance future de votre base de données. Lorsque vous utilisez la configuration de la version optimisée E/S d’Amazon Aurora pour vos clusters de bases de données, Aurora permet également de réaliser jusqu’à 40 % d’économies lorsque les dépenses d’E/S dépassent 25 % des dépenses de votre base de données Aurora. Pour en savoir plus, consultez la section Aurora storage and reliability.

Vous pouvez augmenter le débit de lecture pour prendre en charge les requêtes d’application à volume élevé en créant jusqu’à 15 réplicas Amazon Aurora. Les réplicas Aurora partagent le même stockage sous‑jacent que l’instance source, ce qui permet de réaliser des économies et d’éviter toute écriture sur les nœuds de réplica. Cela libère davantage de puissance de traitement pour traiter les requêtes en lecture et réduit également le temps de latence des réplicas (quelques millisecondes seulement).

Aurora fournit un point de terminaison du lecteur afin que l'application puisse se connecter sans devoir garder une trace des réplicas ajoutées et retirées. Elle prend également en charge l'autoscaling, ce qui permet d'ajouter ou de supprimer automatiquement des réplicas en réponse à des modifications que vous spécifiez pour les métriques de performance. Pour en savoir plus, consultez la section Using Amazon Aurora Auto Scaling with Aurora Replicas.

Aurora prend en charge les réplicas en lecture entre régions. Les réplicas entre régions fournissent des lectures locales rapides à vos utilisateurs, et chaque région peut avoir 15 réplicas Aurora supplémentaires pour encore mettre à l’échelle des lectures locales. Consultez la section Amazon Aurora Global Database pour plus de détails.

Les points de terminaison personnalisés vous permettent de distribuer et d'équilibrer les charges de travail entre plusieurs ensembles d'instances de base de données. Par exemple, vous pouvez configurer un ensemble de réplicas Aurora pour utiliser un type d'instance avec une capacité de mémoire supérieure afin d'exécuter une charge de travail d'analytique. Un point de terminaison personnalisé peut ensuite vous aider à acheminer la charge de travail vers ces instances configurées de manière appropriée, tout en maintenant les autres instances isolées de celle-ci.

Les lectures optimisées d’Amazon Aurora représentent une nouvelle fonctionnalité d’optimisation du rapport prix/performances. Elles permettent de diviser par huit la latence des requêtes et de réaliser jusqu’à 30 % d’économies par rapport aux instances qui n’en bénéficient pas. Elle est idéale pour les applications dont les jeux de données volumineux dépassent la capacité de mémoire d'une instance de base de données.

Les instances de lectures optimisées utilisent un stockage SSD local au niveau des blocs basé sur NVMe, disponible sur les instances r6gd basées sur Graviton et r6id basées sur Intel, afin d'améliorer la latence des requêtes des applications dont les ensembles de données dépassent la capacité mémoire d'une instance de base de données. Les lectures optimisées incluent des améliorations de performances telles que la mise en cache hiérarchisée et les objets temporaires pour vous permettre de tirer le meilleur parti de vos instances de base de données.

Avec une latence de requête jusqu'à 8 fois supérieure, vous pouvez exécuter efficacement des charges de travail gourmandes en lecture et gourmandes en E/S, telles que des tableaux de bord opérationnels, la détection d'anomalies et des recherches de similarité avec pgvector. Les lectures optimisées d’Amazon Aurora PostgreSQL avec pgvector permettent de multiplier par neuf le nombre de requêtes par seconde pour la recherche vectorielle dans les charges de travail qui dépassent la mémoire d’instance disponible. Des lectures optimisées sont disponibles pour Aurora avec compatibilité avec PostgreSQL.

La fonctionnalité Amazon Aurora Parallel Query fournit des requêtes d’analyse plus rapides pour vos données actuelles. Elle peut multiplier par jusqu'à deux la vitesse d'exécution des requêtes, tout en maintenant élevé le débit de votre charge de travail de transaction de base. En poussant le traitement des requêtes vers la couche de stockage Aurora, elle génère une grande quantité de puissance de calcul tout en réduisant le trafic du réseau. Utilisez cette fonction pour exécuter des charges de travail transactionnelles ou analytiques en même temps et dans la même base de données Aurora. La requête parallèle est disponible pour les versions Aurora compatibles MySQL.

Amazon DevOps Guru est un service d’opérations cloud basé sur le machine learning (ML) qui permet d’améliorer la disponibilité des applications. Avec Amazon DevOps Guru pour RDS, vous pouvez utiliser des informations alimentées par le ML pour détecter et diagnostiquer aisément les problèmes de bases de données relationnelles liés à la performance. Ce service est conçu pour les résoudre en quelques minutes plutôt qu'en quelques jours. Les développeurs et les ingénieurs DevOps peuvent utiliser DevOps Guru pour RDS pour identifier automatiquement la cause première des problèmes de performance et obtenir des recommandations intelligentes pour résoudre le problème, sans avoir besoin de l'aide d'experts en bases de données.

Pour commencer, rendez-vous dans la console de gestion Amazon RDS et activez l'analyse des performances d'Amazon RDS. Une fois la fonctionnalité Analyse des performances activée, accédez à la console Amazon DevOps Guru et activez‑la pour vos ressources Amazon Aurora, pour d’autres ressources prises en charge ou pour l’ensemble de votre compte.

Disponibilité et durabilité élevées

Amazon RDS surveille en permanence l’état de votre base de données Aurora et celui de l’instance Amazon Elastic Compute Cloud (Amazon EC2) sous-jacente. En cas d'échec, Amazon RDS redémarre automatiquement la base de données et les processus associés. Amazon Aurora ne vous oblige pas à exécuter les fichiers de journalisation redo de la base de données en différé pour restaurer le système, ce qui accélère grandement le redémarrage. Le service sépare également le cache mémoire des processus de la base de données, ce qui permet au cache de survivre au redémarrage de la base de données.

En cas de défaillance d’une instance, Aurora utilise la technologie Amazon RDS Multi-AZ pour opérer le basculement automatique vers l’un des 15 réplicas Aurora que vous avez créés dans trois zones de disponibilité. Si aucune réplica Amazon Aurora n'a été mise en service, en cas d'échec, Amazon RDS tentera de créer automatiquement une nouvelle instance de base de données Amazon Aurora pour vous. Réduisez le temps de basculement en remplaçant les pilotes MySQL et PostgreSQL de communauté par le pilote AWS JDBC pour MySQL et le pilote AWS JDBC pour PostgreSQL open source et compatibles pour un remplacement. Vous pouvez également utiliser RDS Proxy pour raccourcir les temps de basculement et améliorer la disponibilité. En cas de basculement, le Proxy Amazon RDS achemine directement les requêtes vers la nouvelle instance de base de données, réduisant ainsi les temps de basculement de jusqu’à 66 % tout en préservant les connexions aux applications.

Pour les applications distribuées mondialement, vous pouvez utiliser Aurora Global Database pour étendre une base de données Aurora sur plusieurs régions AWS, ce qui permet des lectures locales et des reprises après sinistre rapides. La base de données globale utilise une réplication basée sur le stockage pour répliquer une base de données sur plusieurs régions AWS, avec une latence générale inférieure à 1 seconde. Vous pouvez utiliser une région secondaire en tant qu'option de sauvegarde au cas où une récupération rapide est nécessaire suite à une dégradation ou une interruption régionale. Les capacités de lecture/écriture peuvent être activées sur une base de données stockée dans une région secondaire en moins de 1 minute. Pour en savoir plus, consultez la section Using Amazon Aurora global databases.

Le volume de stockage de la base de données d’Aurora est segmenté en segments de 10 Gio et répliqué sur trois zones de disponibilité, chaque zone de disponibilité conservant 2 copies de chaque écriture. Le stockage Aurora est tolérant aux pannes. Il peut supporter la perte de deux copies de données sans affecter la disponibilité en écriture de la base de données, et celle de trois copies sans affecter la disponibilité en lecture. Le stockage Aurora est doté d’un mécanisme d’auto-réparation : les blocs de données et les disques sont continuellement analysés pour trouver des erreurs et sont réparés automatiquement.

La fonction de sauvegarde d’Aurora vous permet de rétablir votre instance à un instant donné. Vous pouvez ainsi restaurer votre base de données chaque seconde de votre période de rétention et ce, jusqu’aux cinq dernières minutes. Vous pouvez configurer une période de rétention des sauvegardes automatiques de 35 jours maximum. Les sauvegardes automatisées sont stockées dans Amazon Simple Storage Service (Amazon S3), ce qui garantit une durabilité de 99,999999999 %. Les sauvegardes Aurora sont automatiques, progressives et continues et n’affectent pas les performances de la base de données.

Les instantanés de DB sont des sauvegardes initiées par l'utilisateur de votre instance, stockées dans Amazon S3. Ils sont conservés jusqu'à ce que vous décidiez de les supprimer de manière explicite. Les instantanés incrémentiels automatisés permettent de réduire les délais et l'espace nécessaires. Vous pouvez créer une nouvelle instance à partir d'un instantané de DB chaque fois que vous le désirez.

Backtrack vous permet de ramener rapidement une base de données à un point précédent, sans avoir besoin de restaurer des données à partir d’une sauvegarde. Il vous permet de récupérer rapidement d'erreurs des utilisateurs, comme la suppression du mauvais tableau ou de la mauvaise ligne. Lorsque vous activez le retour sur trace, Aurora conserve les enregistrements de données pour la durée spécifiée dans Retour sur trace. Par exemple, vous pouvez configurer une marche sur la trace pour mouvoir votre base de données 72 heures avant. Le retour sur trace se fait en quelques secondes, même pour de grandes bases de données, car aucun enregistrement de données n'a besoin d'être copié. Vous pouvez aller en avant ou en arrière pour retrouver le point se trouvant juste avant l'erreur.

Backtrack est aussi utile pour le développement et les tests, particulièrement dans les situations ou votre test supprime ou invalide les données. Simplement marchez sur la trace a le status originale de la base de données, et vous êtes prêt pour un 'autre teste. Vous pouvez créer un script faisant appel au retour sur trace via une API et exécutant ensuite le test pour une intégration simple dans votre environnement de test. Le retour sur trace est disponible pour Aurora avec la compatibilité MySQL.

Hautement sécurisé

Aurora s’exécute dans Amazon Virtual Private Cloud (Amazon VPC), ce qui vous permet d’isoler votre base de données au sein de votre propre réseau virtuel et d’accéder à votre infrastructure informatique sur site à l’aide de connexions VPN IPsec chiffrées standard. Pour en savoir plus sur l’utilisation du service de la base de données relationnelle d’Amazon (RDS) dans Amazon VPC, reportez-vous au Guide de l’utilisateur Amazon RDS. En outre, lorsque vous utilisez Amazon RDS, vous pouvez configurer les paramètres du pare-feu et contrôler l'accès réseau à vos instances de base de données.

Aurora est intégré avec la gestion des identités et des accès AWS (IAM) et vous permet de contrôler les opérations que vos groupes et utilisateurs IAM peuvent effectuer sur certaines ressources Amazon Aurora (par exemple, les instances de base de données, les instantanés de base de données, les groupes de paramètres de base de données, les abonnements à des événements de base de données et les groupes d'options de base de données). Vous pouvez également étiqueter vos ressources Aurora et contrôler ainsi les opérations que vos groupes et utilisateurs IAM peuvent effectuer sur des groupes de ressources ayant la même balise (et la même valeur de balise). Pour plus d'informations sur l'intégration IAM, consultez la documentation relative à l'authentification de base de données IAM.

Aurora vous aide à chiffrer les bases de données à l'aide de clés que vous créez et contrôlez par l'intermédiaire d'AWS Key Management Service (KMS). Sur une instance de base de données en cours d'exécution utilisant le chiffrement Aurora, les données stockées au repos dans le stockage sous-jacent sont chiffrées, tout comme les sauvegardes automatisées, les instantanés et les réplicas dans le même cluster. Aurora utilise le chiffrement SSL (AES-256) pour sécuriser les données en transit.

Aurora vous aide à journaliser les événements de base de données avec un minimum d'impact sur les performances de la base de données. Les journaux peuvent être analysés par la suite pour la gestion de la base de données, la sécurité, la gouvernance, la conformité réglementaire et d'autres objectifs. Vous pouvez également surveiller l’activité en envoyant des journaux d’audit à Amazon CloudWatch.

Amazon GuardDuty assure la détection des menaces pour Aurora afin d’identifier les menaces potentielles pesant sur les données stockées dans les bases de données Aurora. GuardDuty RDS Protection analyse et surveille l’activité de connexion aux bases de données (nouvelles ou existantes) de votre compte, et utilise des modèles ML personnalisés pour détecter avec précision les connexions suspectes aux bases de données Aurora. Si une menace potentielle est détectée, GuardDuty génère un rapport de sécurité qui inclut les détails de la base de données et des informations contextuelles riches sur l'activité suspecte. L'intégration d'Aurora avec GuardDuty donne un accès direct aux journaux d'événements des bases de données sans que vous ayez à modifier vos bases de données et est conçue pour ne pas avoir d'impact sur leurs performances.

Rentabilité

Il n’y a aucun engagement initial avec Aurora. Vous payez des frais horaires pour chaque instance que vous lancez, et lorsque vous en avez terminé avec une instance de base de données Aurora, vous pouvez la supprimer. Vous n’avez pas besoin de prévoir davantage de stockage que nécessaire par précaution, et vous ne payez que pour le stockage que vous consommez réellement. Pour en savoir plus, consultez la section détaillant la tarification Aurora.

Aurora offre la flexibilité nécessaire pour optimiser les dépenses de votre base de données en choisissant entre deux options de configuration en fonction de vos besoins en termes de rapport prix/performances et de prévisibilité des prix, indépendamment de la consommation d'E/S de votre application. Les deux options de configuration sont Aurora I/O Optimized et Aurora Standard. Aucune de ces options ne nécessite d'E/S ni de provisionnement de stockage en amont, et les deux options peuvent adapter les E/S pour prendre en charge vos applications les plus exigeantes.

Aurora I/O Optimized est une configuration de cluster de bases de données. Il offre un meilleur rapport prix-performance aux clients dont les charges de travail sont gourmandes en E/S, telles que les systèmes de traitement des paiements, les systèmes de commerce électronique et les applications financières. Si vos dépenses en E/S dépassent 25 % de vos dépenses totales en bases de données Aurora, vous pouvez économiser jusqu'à 40 % sur les coûts des charges de travail intensives en E/S grâce à Aurora I/O-Optimized. Avec Aurora I/O Optimized, vous payez pour les instances de base de données et le stockage. Les opérations d'E/S en lecture et en écriture sont gratuites, ce qui permet de prévoir les prix pour toutes les applications, indépendamment de la variabilité des E/S.

Aurora Standard est une configuration de cluster de base de données qui offre des tarifs abordables pour la grande majorité des applications avec une utilisation faible à modérée des E/S. Avec Aurora Standard, vous payez pour les instances de base de données, le stockage et les E/S payantes à la demande.

Pour une application fortement analytique, les coûts des E/S sont généralement ceux qui pèsent le plus sur le coût de la base de données. Les E/S sont des opérations en entrée/sortie réalisées par le moteur de base de données Aurora sur sa couche de stockage virtualisée basée sur SSD. Chaque opération de lecture de page de base de données compte comme une E/S. Le moteur de base de données Aurora émet des lectures sur la couche de stockage afin d'extraire les pages de la base de données qui ne sont pas présentes dans le cache de la mémoire tampon. Chaque page de base de données a une taille de 8 Ko dans Aurora avec la compatibilité PostgreSQL et 16 Ko dans Aurora avec la compatibilité MySQL.

Aurora a été conçu pour supprimer toutes les opérations d'E/S inutiles, afin de réduire les coûts et de garantir la disponibilité des ressources dans le but de gérer le trafic de lecture/écriture. Les E/S en écriture sont uniquement consommées lorsque vous transférez les fichiers journaux des transactions vers la couche de stockage afin d'augmenter la durabilité des écritures. Les opérations d'E/S en écriture sont comptées en unités de 4 Ko. Par exemple, un fichier journal de transactions de 1,024 octets comptera comme une opération d'E/S. Cependant, les opérations d'écriture simultanées dont le fichier journal de transactions est inférieur à 4 Ko peuvent être traitées par lots par le moteur de base de données Aurora afin d'optimiser la consommation des E/S. À la différence des moteurs de base de données traditionnels, Amazon Aurora ne transfère jamais des pages de base de données modifiées vers la couche de stockage, vous permettant ainsi de réduire encore davantage votre consommation d'E/S.

Vous pouvez voir le nombre d'E/S consommées par votre instance Aurora en vérifiant la console de gestion AWS. Pour afficher votre consommation d'E/S, accédez à la section RDS de la console, consultez votre liste d'instances, sélectionnez vos instances Aurora, puis recherchez les métriques « Opérations de lecture facturées » et « Opérations d'écriture facturées » dans la section Surveillance.

Les opérations d'E/S en lecture et en écriture vous sont facturées lorsque vous configurez vos clusters de bases de données selon la configuration Aurora Standard. Les opérations d’E/S en lecture et en écriture ne vous sont pas facturées lorsque vous configurez vos clusters de bases de données de manière à optimiser les E/S d’Aurora. Pour en savoir plus sur la tarification des opérations d’E/S, consultez la page Tarification Amazon Aurora.

La fonctionnalité de lectures optimisées d’Aurora pour Aurora PostgreSQL offre aux clients, dotés d’applications sensibles à la latence et d’ensembles de travail volumineux, une alternative avantageuse en termes de rapport qualité‑prix pour respecter leurs SLA professionnels. Les clients disposent également d’une plus grande flexibilité pour développer leurs jeux de données sans avoir à augmenter fréquemment la taille de leurs instances de base de données pour obtenir une plus grande capacité de mémoire. Les lectures optimisées incluent des améliorations de performances telles que la mise en cache hiérarchisée et les objets temporaires.

La mise en cache hiérarchisée permet d'améliorer la latence des requêtes jusqu'à 8 fois et de réaliser jusqu'à 30 % d'économies pour les applications gourmandes en lecture et gourmandes en E/S, telles que les tableaux de bord opérationnels, la détection des anomalies et les recherches de similarité vectorielles. Ces avantages sont obtenus car les données mises en cache sont automatiquement expulsées du cache tampon de la base de données en mémoire vers le stockage local afin d'accélérer les accès ultérieurs à ces données. La mise en cache hiérarchisée est uniquement disponible pour Aurora PostgreSQL avec la configuration de la version optimisée E/S d'Aurora.

Les objets temporaires accélèrent le traitement des requêtes en plaçant les tables temporaires générées par Aurora PostgreSQL sur le stockage local, améliorant ainsi les performances des requêtes impliquant des tris, des agrégations de hachage, des jointures à charge élevée et d'autres opérations gourmandes en données.

Entièrement géré

Il est facile de démarrer avec Aurora. Il vous suffit de lancer une nouvelle instance de base de données Aurora via la console de gestion Amazon RDS, un simple appel d’API ou l’interface de la ligne de commande. Les instances de base de données Aurora sont préalablement configurées avec un ensemble de paramètres et de réglages appropriés pour la classe d’instances de base de données que vous avez sélectionnée. Vous pouvez lancer une instance de base de donnéeset connecter votre application en quelques minutes, sans autre configuration. Les groupes de paramètres DB vous permettent de contrôler et de paramétrer précisément votre base de données.

Amazon Aurora fournit gratuitement des métriques Amazon CloudWatch pour vos instances de base de données. L'interface AWS Management Console vous permet de visualiser plus de 20 mesures opérationnelles clés concernant vos instances de base de données, y compris les ressources de calcul/mémoire/stockage, le débit des requêtes, le ratio de connexions au cache et les connexions actives. Vous pouvez également utiliser Enhanced Monitoring pour regrouper des métriques provenant de l'instance de système d'exploitation sur laquelle votre base de données s'exécute. Enfin, vous pouvez utiliser l’outil de surveillance de bases de données Analyse des performances d’Amazon RDS qui facilite la détection des problèmes de performances liées aux bases de données et l’adoption des mesures correctives, via un tableau de bord simple d’utilisation qui permet de visualiser la charge des bases de données. Enfin, vous pouvez également utiliser Amazon DevOps Guru pour RDS pour détecter facilement les problèmes de performance, identifier automatiquement la cause principale des problèmes de performance et obtenir des recommandations intelligentes pour aider à résoudre le problème sans avoir besoin de l'aide d'experts en bases de données.

Les déploiements bleu/vert d’Amazon RDS vous permettent d’effectuer des mises à jour de bases de données plus sûres, plus simples, plus rapides et sans aucune perte de données, sur les éditions d’Aurora compatible MySQL et compatible PostgreSQL. En quelques étapes, les déploiements bleus/verts créent un environnement de transit qui reflète l’environnement de production et maintient les deux environnements synchronisés à l’aide de la réplication logique. Vous pouvez effectuer des changements (tels que des mises à niveau de versions majeures ou mineures, des modifications de schémas et des changements de paramètres) sans avoir d'impact sur votre charge de travail de production.

Lors de la promotion de votre environnement de transit, les déploiements bleu/vert bloquent les écritures dans les environnements bleus et verts jusqu'à ce que le basculement soit terminé. Les déploiements bleu/vert utilisent des barrières de protection de basculement intégrés qui interrompent la promotion si elle dépasse votre temps d'arrêt maximal tolérable, détecte les erreurs de réplication, vérifie l'intégrité des instances, et plus encore.

Aurora maintiendra votre base de données à jour en appliquant les derniers correctifs disponibles. Vous pouvez contrôler si et quand votre instance est corrigée grâce à la gestion des versions de moteur de base de données. Lorsque cela est possible, Aurora utilise des correctifs sans temps mort : si un intervalle de temps convenable se présente, l'instance est mise à jour en place, les sessions d'application sont préservées et le moteur de base de données redémarre pendant la mise à jour, ce qui donne une très légère baisse de débit (cinq secondes environ).

Aurora peut vous informer par e-mail ou par SMS des événements importants concernant la base de données, comme le basculement automatisé. Vous pouvez utiliser la Console de gestion AWS ou les API Amazon RDS pour vous abonner à plus de 40 événements de base de données distincts liés à vos bases de données Aurora.

Aurora prend en charge des opérations de clonage rapides et efficaces, lors desquelles des clusters de base de données de plusieurs To entiers peuvent être clonés en quelques minutes. Le clonage est utile pour un certain nombre d'objectifs comprenant le développement d'application, les tests, les mises à jour de base de données et l'exécution de requêtes analytiques. La disponibilité immédiate des données peut accélérer grandement le développement de votre logiciel et les projets de mise à jour, ainsi que rendre les analyses plus précises.

Vous pouvez cloner une base de données Aurora en quelques clics. Aucun frais de stockage ne vous sera facturé, sauf si vous utilisez de l’espace supplémentaire pour stocker des modifications de données.

Vous pouvez arrêter et démarrer manuellement une base de données Aurora en quelques clics. Ainsi, lorsque la base de données n’est pas obligée d’être constamment en cours d’exécution, l’utilisation d’Aurora à des fins de développement et de tests devient simple et abordable. L'arrêt de votre base de données n'entraîne pas la suppression des données. Pour en savoir plus, consultez la documentation relative à l'arrêt/démarrage.

Intégrations zéro ETL

L’intégration zéro ETL d’Amazon Aurora avec Amazon Redshift permet l’analytique et le ML en temps quasi réel via l’utilisation d’Amazon Redshift sur des pétaoctets de données transactionnelles provenant d’Aurora. Ainsi, vous n’avez plus à créer ni à gérer de pipelines de données complexes effectuant des opérations d’extraction, transformation et chargement (ETL). Les données transactionnelles sont répliquées automatiquement et en continu quelques secondes après avoir été écrites dans Aurora, puis mises à disposition dans Amazon Redshift.

Une fois les données disponibles dans Amazon Redshift, vous pouvez commencer à les analyser immédiatement et à y appliquer des fonctionnalités avancées, telles que le partage de données, les vues matérialisées et Amazon Redshift ML, pour obtenir des informations analytiques holistiques et prédictives. Vous pouvez consolider plusieurs tables issues de divers clusters de bases de données Aurora et répliquer vos données dans un entrepôt de données Amazon Redshift pour exécuter des analytiques unifiées sur plusieurs applications et sources de données. Lorsque vous utilisez Aurora sans serveur et Amazon Redshift sans serveur, vous pouvez générer une analytique en temps quasi réel sur les données transactionnelles sans avoir à gérer d’infrastructure pour les pipelines de données. Consultez notre documentation sur l’utilisation des intégrations zéro ETL Aurora avec Amazon Redshift.

IA générative

Aurora offre des fonctionnalités permettant aux modèles de machine learning (ML) et d’intelligence artificielle (IA) générative de travailler avec des données stockées dans Aurora en temps réel et sans déplacer les données. Avec l’édition Amazon Aurora compatible avec PostgreSQL, vous pouvez accéder à des fonctionnalités de base de données vectorielles pour stocker, rechercher, indexer et interroger des intégrations de ML avec l’extension pgvector.

Une intégration vectorielle est une représentation numérique qui représente la signification sémantique d’un contenu tel que du texte, des images et des vidéos. L’IA générative et d’autres systèmes d’IA et de ML utilisent des intégrations pour recueillir la signification sémantique de ce contenu dans un grand modèle de langage (LLM). Vous pouvez stocker les vectorisations de modèles de ML et d’IA, tels que ceux d’Amazon Bedrock et d’Amazon SageMaker, dans vos bases de données Aurora. Consultez notre documentation sur les versions d’extension d’Aurora PostgreSQL.

Amazon Aurora PostgreSQL est disponible en tant que base de connaissances pour Amazon Bedrock afin de connecter les sources de données privées de votre entreprise à des modèles de fondation (FM) et d’y activer des flux de travail automatisés de génération à enrichissement contextuel (RAG). Cela permet à vos FM de mieux connaître votre domaine et votre organisation spécifiques. Consultez notre documentation sur l’utilisation d’Aurora PostgreSQL comme base de connaissances pour Amazon Bedrock.

Le machine learning Aurora (Aurora ML) simplifie également l’ajout de prédictions modélisées d’IA générative à votre base de données Aurora. Aurora ML expose les modèles de ML sous forme de fonctions SQL, ce qui vous permet d’utiliser le langage SQL standard pour appeler des modèles de ML, leur transmettre des données et renvoyer des prévisions, des résumés textuels ou des sentiments sous forme de résultats de requête. Avec Aurora ML, vous pouvez ajouter en temps réel de nouvelles vectorisations à votre base de données Aurora PostgreSQL avec l’extension pgvector via des appels périodiques à un modèle SageMaker ou Amazon Bedrock, qui renvoie les vectorisations mises à jour les plus récentes.

Prise en charge de la migration

Aurora prend en charge les outils d’importation et d’exportation MySQL standard. Vous pouvez également créer une nouvelle base de données Aurora à partir d’un instantané de base de données Amazon RDS for MySQL. Les opérations de migration réalisées à l’aide d’instantanés de bases de données exigent en général une heure. Cette durée peut varier selon la quantité et le format des données transférées.

Par ailleurs, AWS Database Migration Service (AWS DMS) propose des outils natifs intégrés à partir de la console DMS pour simplifier la migration. En l'absence d'instances de réplication à provisionner ou à mettre à l'échelle, vous pouvez lancer une migration de base de données en quelques clics et ne payer que sur une base horaire en fonction du temps utilisé.

Vous pouvez également configurer une réplication basée sur binlog entre une base de données compatible avec MySQL Aurora et une base de données MySQL externe fonctionnant à l'intérieur ou à l'extérieur d'AWS.

Les outils d’importation et d’exportation PostgreSQL standard fonctionnent avec Aurora, incluant pg_dump et pg_restore. Aurora prend également en charge l’importation d’instantanés depuis Amazon RDS for PostgreSQL et la réplication avec AWS Database Migration Service (AWS DMS).

Aurora fournit un environnement idéal pour enlever les charges de travail de base de données des bases de données commerciales. Aurora présente des capacités fonctionnelles qui correspondent étroitement à celles des moteurs de base de données commerciales et fournit les performances, la durabilité et la haute disponibilité de niveau professionnel, requises par la plupart des charges de travail de base de données professionnelles. AWS Database Migration Service (AWS DMS) permet d’accélérer les migrations de bases de données vers Aurora grâce à des fonctionnalités gérées telles que la conversion de schémas DMS et DMS sans serveur. La conversion de schémas DMS évaluera et convertira automatiquement les schémas et les objets source afin qu’ils soient compatibles avec le cluster Aurora cible. Parallèlement, DMS sans serveur automatise le provisionnement, la surveillance et la mise à l’échelle des ressources de migration.

Babelfish for Aurora PostgreSQL est une nouvelle fonctionnalité pour l’édition d’Aurora compatible PostgreSQL qui permet à Aurora de comprendre les commandes d’applications écrites pour Microsoft SQL Server. Avec Babelfish, Aurora PostgreSQL comprend désormais le dialecte SQL propriétaire de T-SQL et Microsoft SQL Server, et prend en charge le même protocole de communication. Vos applications initialement écrites pour SQL Server peuvent donc désormais fonctionner avec Aurora moyennant peu de modifications de code. Ainsi, modifier les applications s’exécutant sur SQL Server 2005 ou des versions plus récentes et les déplacer vers Aurora nécessitent moins d’efforts, ce qui entraîne des migrations plus rapides, plus économiques et à moindres risques. Babelfish est une fonctionnalité intégrée d’Aurora disponible sans coûts supplémentaires. Vous pouvez activer Babelfish sur votre cluster Aurora en quelques étapes seulement dans la console RDS.

Productivité des développeurs

Trusted Language Extensions (TLE) pour PostgreSQL (français non garanti) est un kit de développement et un projet open source qui vous permet de créer rapidement des extensions haute performance et de les exécuter en toute sécurité sur Amazon Aurora sans avoir à faire certifier le code par AWS. Les développeurs peuvent utiliser des langages de confiance courants, comme JavaScript, PL/pgSQL, Perl et SQL, pour écrire des extensions en toute sécurité. TLE est conçu pour empêcher l'accès aux ressources non sécurisées et limite les défauts des extensions à une seule connexion à la base de données. Les DBA ont un contrôle précis et direct sur les personnes qui peuvent installer des extensions et peuvent créer un modèle d'autorisation pour les exécuter. TLE est disponible pour les clients Aurora sans frais supplémentaires.

Aurora offre des possibilités de Machine Learning directement depuis la base de données, ce qui vous permet d’ajouter des prédictions basées sur ML à vos applications via le langage de programmation familier que constitue SQL. Grâce à une simple intégration optimisée et sécurisée entre Aurora et les services de Machine Learning d'AWS, vous avez accès à un large choix d'algorithmes ML sans avoir à créer d'intégrations personnalisées ni à déplacer des données. Pour en savoir plus, consultez la section sur le machine learning Aurora.

Aurora s’utilise avec le Proxy Amazon RDS, un proxy de base de données entièrement géré et hautement disponible qui rend les applications plus sûres, plus évolutives et plus résilientes face aux défaillances des bases de données. RDS Proxy permet aux applications de regrouper et de partager des connexions établies avec la base de données, améliorant l'efficacité de cette dernière et l'évolutivité des applications. RDS Proxy réduit les temps de basculement en se connectant automatiquement à une nouvelle instance de base de données tout en préservant les connexions des applications. Le Proxy RDS améliore en outre la sécurité grâce à des intégrations à AWS IAM et AWS Secrets Manager.

L’API Data est une API HTTPS sécurisée et facile à utiliser qui permet d’exécuter des requêtes SQL sur des bases de données Aurora afin d’accélérer le développement d’applications modernes. L’API Data élimine les tâches de configuration du réseau et des applications nécessaires pour se connecter en toute sécurité à une base de données Aurora, ce qui rend l’accès à Aurora aussi simple qu’un appel d’API. L’API Data élimine l’utilisation de pilotes de base de données et de logiciels de regroupement de connexions côté client. Elle améliore également la capacité de mise à l’échelle des applications en regroupant et en partageant automatiquement les connexions de bases de données. L’API Data améliore en outre la sécurité grâce à des intégrations à AWS IAM et AWS Secrets Manager.

Les développeurs peuvent appeler l’API Data via des applications créées avec un kit SDK AWS. L’API Data fournit également un accès aux bases de données Aurora pour les API AWS AppSync GraphQL.