게시된 날짜: Apr 9, 2020
새로운 메이저 버전의 Hadoop, Hive, HBase 및 Amazon Linux 2를 지원하고 Docker를 통한 Spark 환경 종속성 패키징을 지원하는 Amazon EMR 릴리스 6.0.0을 발표하게 되어 기쁘게 생각합니다.
Spark 사용자는 이제 EMR 릴리스 6.0.0과 함께 Docker Hub의 Docker 이미지 및 Amazon Elastic Container Registry(Amazon ECR)를 사용하여 환경 및 라이브러리 종속성을 정의할 수 있습니다. Docker를 사용하면 개별 클러스터 호스트에 대한 종속성을 설치할 필요 없이 개별 작업의 Python 및 R 종속성을 쉽게 패키징할 수 있습니다. EMR 6.0.0과 함께 Docker를 사용하는 방법에 관한 자세한 내용은 Docker 구성 방법에 대한 EMR 관리 안내서 섹션 및 Docker로 Spark 종속성 관리를 간소화하는 방법에 대한 블로그 게시물을 참조하시기 바랍니다.
Hive 사용자는 이제 EMR 릴리스 6.0.0과 함께 Hive LLAP(Live Long and Process)를 사용할 수 있습니다. 이에 따라 EMR 5.29보다 2배 빠른 성능을 통해 개별 Hive TPC-DS 쿼리에서 최대 10배까지 향상된 속도를 체감할 수 있습니다*. Hive LLAP는 동적 메모리 내 캐싱과 함께 영구 데몬을 사용하여 쿼리 실행 속도를 높이는 Hive의 새로운 실행 모델입니다. Hive LLAP를 활성화하는 방법에 대한 자세한 내용과 관련하여, Hive LLAP 사용 설명서 및 블로그 게시물을 참조하여 Apache Hive가 EMR 6.0.0의 Hive LLAP에서 2배 빠른 이유를 확인하시기 바랍니다.
EMR 릴리스 6.0.0은 새로운 메이저 버전의 Apache Hadoop 3.2.1, Apache Hive 3.1.2, Apache HBase 2.2.3 및 Apache Phoenix 5.0.0과 함께 Scala 2.12를 지원하는 Apache Spark 2.4.4용 EMR 런타임을 제공합니다. EMR 릴리스 6.0.0은 Amazon Linux 2 및 Amazon Corretto JDK 8을 기반으로 합니다. Amazon Linux 2는 Amazon Linux 서버 운영 체제의 최신 버전으로, systemd init 시스템과 같은 새로운 시스템 도구 및 Amazon Linux LTS 커널에 맞춰진 성능을 제공합니다. Amazon Corretto JDK 8은 Java SE 인증 호환 JDK를 제공합니다. 여기에는 장기 지원, 성능 개선 및 보안 수정 사항이 포함되어 있습니다. EMR 릴리스 6.0.0에서 업데이트된 모든 EMR 애플리케이션에 대한 자세한 내용은 출시 정보를 참조하십시오.
이제 모든 Amazon EMR 지원 리전에서 Amazon EMR 릴리스 6.0.0을 사용할 수 있습니다.
EMR 출시 정보 피드를 구독하면 EMR 릴리스 관련 최신 정보를 계속 받을 수 있습니다. EMR 릴리스 안내서의 상단에 있는 아이콘을 사용하여 피드 URL을 즐겨 찾는 피드 리더에 직접 연결하십시오.
*EMR 5.29.0과 EMR 6.0.0을 비교한 3TB TPC-DS 벤치마크를 기반으로 한 결과입니다.