Amazon Athena for Apache Spark

Apache Spark에서 1초 내에 대화식 분석 실행

왜 Apache Spark에서 Athena를 사용할까요?

Amazon Athena for Apache Spark를 사용하여 1초 내에 페타바이트 분량의 데이터를 분석할 수 있는 대화식 분석을 시작하세요. 최적화된 Spark 런타임으로 대화식 Spark 애플리케이션이 즉시 시작되고 더 빠르게 실행되므로 결과를 기다리기보다 인사이트에 더 많은 시간을 할애할 수 있습니다. Athena 콘솔에서 또는 Athena API를 통해 간소화된 노트북 경험으로 Python의 표현력을 사용하여 Spark 애플리케이션을 빌드하십시오. Athena 서버리스 완전관리형 모델을 사용하면 리소스를 관리, 프로비저닝, 구성할 필요가 없습니다. 또한 최소 수수료나 설정 비용을 지불하지 않아도 됩니다. 비용은 실행한 쿼리에 대해서만 지불하면 됩니다.

이점

결과를 기다리는 것보다 인사이트에 더 많은 시간을 할애할 수 있습니다. 최적화된 Spark 런타임으로 대화형 Spark 애플리케이션이 즉시 시작되고 더 빠르게 실행됩니다.
널리 사용되는 오픈 소스 Spark 프레임워크와 함께 Python의 표현력을 활용하여 데이터에서 더 복잡한 인사이트를 찾아냅니다. 노트북을 사용해 데이터를 쿼리하고 연쇄적으로 계산하며 결과를 시각화할 수 있습니다.
리소스 프로비저닝이나 관리 없이 Spark 애플리케이션을 비용 효율적으로 실행할 수 있습니다. Spark 구성 또는 버전 업그레이드를 신경 쓰지 않고 Spark 애플리케이션을 구축할 수 있습니다.
데이터 이동 없이 사용자의 비즈니스 애플리케이션을 통해 다양한 데이터 레이크의 데이터를 개방형 데이터 형식으로 작업할 수 있습니다. AWS Glue가 검색하여 범주화한 데이터를 사용해 Spark 인사이트를 구축할 수 있습니다.

사용 사례

Athena 및 AWS Glue를 사용해 데이터 세트를 탐색하고 데이터 작업을 수행할 수 있습니다. 

다양한 데이터 세트와 데이터 형식을 함께 분석하여 인사이트를 도출합니다.

Athena for Apache Spark를 사용하여 대화식으로 데이터 작업을 수행하는 SaaS 애플리케이션을 구축할 수 있습니다.

샘플 데이터 세트를 생성하기 위해 데이터 스토어는 물론 대화식 기능 생성도 살펴볼 수 있습니다.