Publié le: Nov 19, 2021
Aujourd'hui, nous sommes heureux d'annoncer qu'Amazon Athena prend en charge les index de partition du catalogue de données AWS Glue pour optimiser la planification des requêtes et réduire leur durée d'exécution. Lorsque vous interrogez une table contenant un grand nombre de partitions, Athena récupère les partitions disponibles dans le catalogue de données AWS Glue et détermine celles qui sont requises par votre requête. À mesure que de nouvelles partitions sont ajoutées, le temps nécessaire à la récupération des partitions augmente et peut entraîner une augmentation de la durée d'exécution de la requête. Le catalogue de données AWS Glue permet aux clients de créer des index de partition qui réduisent le temps nécessaire à la récupération et au filtrage des métadonnées de partition sur des tables comportant des dizaines et des centaines de milliers de partitions.
L'utilisation des index de partition avec Athena est un processus simple, en deux étapes. Commencez par sélectionner les colonnes que vous souhaitez indexer dans le catalogue de données Glue et lancez la création de l'index. Activez ensuite le filtrage de partition sur vos tables et revenez à Athena pour exécuter votre requête. Pour plus d'informations, consultez Indexation et filtrage de partition AWS Glue.
Les index de partition sont pris en charge sur les tables nouvelles et existantes, de sorte que vous n'avez pas besoin de reconstruire les jeux de données ou de réécrire les requêtes pour profiter des bénéfices en termes de performances. Pour en savoir plus, consultez Amélioration des performances des requêtes Amazon Athena grâce aux index de partition du catalogue de données AWS Glue.
Les index de partition profitent également aux charges de travail analytiques exécutées sur Amazon EMR, Amazon Redshift Spectrum et AWS Glue en plus d'Amazon Athena. Pour en savoir plus, consultez Amélioration des performances des requêtes grâce aux index de partition AWS Glue.