发布于: Sep 13, 2022
Amazon SageMaker Studio 是一个适用于机器学习 (ML) 的完全集成的开发环境 (IDE),该环境供数据科学家和开发人员执行机器学习工作流程的每个步骤,从准备数据到构建、训练、优化和部署模型。SageMaker Studio 附带快速启动的协作笔记本。您可以在 Studio 中快速启动笔记本,而无需中断工作即可轻松增加或减少底层计算资源,甚至只需单击几下鼠标即可共享笔记本。今天,我们很高兴地宣布,Amazon SageMaker Studio 笔记本现在附带与 AWS Glue 交互式会话的内置集成。数据科学家和数据工程师可以使用由 AWS Glue 交互式会话管理的无服务器 Apache Spark 运行时环境,在其 Studio 笔记本中以交互方式大规模准备数据。
使用 SageMaker Studio Notebooks 中的 Glue 交互式会话很简单;您可以为 Studio 笔记本选择内置的 Glue PySpark 或 Glue Spark 内核,以在数秒内初始化交互式无服务器 Spark 会话,而无需担心预置和管理复杂的计算集群基础设施。初始化后,您可以直接在 Studio 笔记本中快速浏览 Glue 数据目录、运行大型查询以及使用 Spark 交互式分析和准备数据。然后,您可以使用 SageMaker Studio 中专门构建的 ML 工具,使用准备好的数据来构建、训练、优化和部署模型。