AWS Outposts 上的 Amazon EMR

为什么选择 Outposts 上的 EMR?

AWS Outposts 可将 AWS 服务、基础设施和运营模式引入绝大部分数据中心、主机托管空间或本地设施。Amazon EMR 在 AWS Outposts 上可用,您可以像在云端一样,在本地环境中设置、部署、管理和扩展 Apache Hadoop、Apache Hive、Apache Spark 和 Presto 集群。Amazon EMR 在 Outposts 中提供经济高效的容量,同时自动化耗时的管理任务,包括基础设施预置、集群设置、配置或优化,让您有更多时间专注于应用程序。

您可以使用相同的 AWS 管理控制台、API 和适用于 EMR 的 CLI 在本地快捷轻松地创建托管的 EMR 集群。在 Outpost 启动的 EMR 集群将像其他集群一样出现在 AWS 控制台中,但将在 Outpost 中运行。

优势

设置好 Outpost 后,您可以在本地启动新的 EMR 集群并在几分钟内连接到现有 HDFS 存储。这可以让您在本地系统需要额外处理容量时快速响应。向本地 Hadoop 和 Spark 集群添加容量有助于在高利用率时期满足工作负载需求并维护 SLA。
如果您正在将数据和 Apache Hadoop 工作负载迁移到云中,并且想在迁移完成前开始使用 EMR,您可以使用 AWS Outposts 来在本地启动连接到现有 HDFS 存储的 EMR 集群。然后,您可以逐渐将数据迁移到 Amazon S3,作为云架构演变的一部分。
Apache Hadoop、Apache Hive、Apache Spark 和 Presto 通常用于处理、转换和分析大型数据架构中的一部分数据。对于因管理、合规性或其他原因而保留在本地的数据,您可以使用 EMR 在本地部署并运行应用程序(如 Apache Hadoop 和 Apache Spark),以关闭您的数据。这样便无需将大量本地数据移动到云中,减少了处理这些数据所需的总体时间。