Publicado: Nov 19, 2021
Anunciamos que o Amazon Athena oferece suporte a índices de partição do AWS Glue Data Catalog para otimizar o planejamento de consultas e reduzir o tempo de execução de consultas. Quando você consulta uma tabela contendo um grande número de partições, o Athena recupera as partições disponíveis do AWS Glue Data Catalog e determina quais delas são exigidas pela sua consulta. À medida que novas partições são adicionadas, o tempo necessário para recuperar as partições aumenta e pode fazer com que o tempo de execução da consulta aumente. O AWS Glue Data Catalog permite que os clientes criem índices de partição que reduzem o tempo necessário para recuperar e filtrar metadados de partições em tabelas com dezenas e centenas de milhares de partições.
Usar índices de partição com o Athena é um processo simples de duas etapas. Comece selecionando as colunas que você deseja indexar no Glue Data Catalog e inicie a criação do índice. Em seguida, habilite a filtragem de partições nas suas tabelas e retorne ao Athena para executar sua consulta. Para obter mais informações, consulte Indexação e filtragem de partições do AWS Glue.
Índices de partição têm suporte em tabelas novas e existentes e, portanto, você não precisa recriar conjuntos de dados ou reescrever consultas para desbloquear os benefícios de performance. Para saber mais, consulte Melhorar a performance de consultas do Amazon Athena usando índices de partição do AWS Glue Data Catalog.
Os índices de partição também beneficiam as workloads de análise executadas no Amazon EMR, no Amazon Redshift Spectrum e no AWS Glue, além de no Amazon Athena. Para saber mais, consulte Melhorar a performance da consultas usando índices de partição do AWS Glue.