Amazon EMR

Execute e escale facilmente o Apache Spark, o Hive, o Presto e outras workloads de big data

Introdução ao EMR Sem Servidor

O Amazon EMR Serverless é uma nova opção do Amazon EMR que facilita e reduz custos para os engenheiros e analistas de dados na execução de aplicações criadas com frameworks de big data de código aberto, como Apache Spark, Hive ou Presto, sem a necessidade de ajustar, operar, otimizar, proteger ou gerenciar clusters.

Benefícios

Execute aplicações de big data e análises de dados em escala de petabyte com mais rapidez e com menos da metade do custo das soluções on-premises.

Crie aplicações usando os mais recentes frameworks de código aberto, com opções para execução em clusters personalizados do Amazon EC2, do Amazon EKS, do AWS Outposts, ou do Amazon EMR Sem Servidor.

Tenha insights até na metade do tempo com versões do Spark, Hive e Presto de código aberto otimizadas para performance e compatíveis com APIs.

Desenvolva, visualize e depure facilmente suas aplicações usando os cadernos do EMR e ferramentas conhecidas de código aberto no EMR Studio.

Casos de uso

Execute processamento de dados distribuídos e análises de hipóteses em grande escala usando algoritmos estatísticos e modelos preditivos para revelar padrões ocultos, correlações, tendências de mercado e preferências dos clientes.
Extraia dados de diversas fontes, processe-os em escala e disponibilize-os para aplicações e usuários.
Analise eventos de origens de dados de transmissão em tempo real para criar pipelines de dados de transmissão de longa duração, alta disponibilidade e tolerantes a falhas.
Analise dados usando frameworks de ML de código aberto, como Apache Spark MLlib, TensorFlow e Apache MXNet. Conecte-se ao Amazon SageMaker Studio para realizar treinamento de modelos, análises e relatórios em grande escala.

Veja mais sobre a AWS