Amazon EMR

Apache Spark, Hive, Presto 및 다른 빅 데이터 워크로드를 손쉽게 실행하고 규모를 조정

EMR Serverless 소개

Amazon EMR Serverless는 Amazon EMR의 새로운 옵션입니다. 데이터 엔지니어링 및 분석 작업 시 Apache Spark, Hive 또는 Presto와 같은 오픈 소스 빅 데이터 프레임워크를 사용하여 구축된 애플리케이션을 클러스터 튜닝, 운영, 최적화, 보안 또는 관리 작업 없이 실행할 수 있습니다.

이점

빅 데이터 애플리케이션과 페타바이트 규모의 데이터 분석을 온프레미스 솔루션의 절반 미만의 비용으로 더 빠르게 실행하십시오.

맞춤형 Amazon EC2 클러스터, Amazon EKS, AWS Outposts 또는 Amazon EMR Serverless에서 실행할 수 있는 옵션과 최신 오픈 소스 프레임워크를 사용하여 애플리케이션을 구축합니다.

성능 최적화 및 오픈 소스 API 호환 버전의 Spark, Hive 및 Presto를 사용하여 최대 2배 더 빠른 인사이트를 얻을 수 있습니다.

EMR Studio의 EMR Notebooks 및 친숙한 오픈 소스 도구를 사용하여 애플리케이션을 쉽게 개발, 시각화 및 디버그할 수 있습니다.

사용 사례

통계 알고리즘 및 예측 모델을 사용하여 대규모 데이터 처리 및 가정 분석을 실행하여 숨겨진 패턴, 상관 관계, 시장 동향 및 고객 선호도를 밝혀냅니다.
다양한 소스에서 데이터를 추출하고 대규모로 처리하여 애플리케이션과 사용자가 사용할 수 있도록 합니다.
스트리밍 데이터 소스의 이벤트를 실시간으로 분석하여 장기 실행, 고가용성, 내결함성 스트리밍 데이터 파이프라인을 생성합니다.
Apache Spark MLlib, TensorFlow 및 Apache MXNet과 같은 오픈 소스 기계 학습 프레임워크를 사용하여 데이터를 분석합니다. 대규모 모델 훈련, 분석 및 보고를 위해 Amazon SageMaker Studio에 연결합니다.

AWS 자세히 살펴보기