Amazon SageMaker Lakehouse 功能

页面主题

一般性问题

一般性问题

使用您选择的与 Apache Iceberg 兼容的工具和引擎,就地访问和查询数据。使用您首选的与 Apache Iceberg 兼容的引擎和工具,运行各种分析和机器学习 (ML) 使用案例,范围涵盖 Apache Spark 提取、转换、加载(ETL)作业、SQL 仪表板、ML 个性化模型和生成式人工智能应用程序等。

无需更改现有数据架构,即可获得数据湖的灵活性和数据仓库的性能。访问高度优化的 Amazon Redshift 存储和二级数据结构,例如实体化视图,以加快数据湖中的 SQL 分析。

在单个数据副本上运行您选择的分析工具和引擎,例如 SQL、Apache Spark、商业智能(BI)和 AI/ML 工具,同时以最适合您工作负载的格式存储数据。

由于兼容 Apache Iceberg,SageMaker Lakehouse 中的所有数据都完全符合 ACID(原子性、一致性、隔离性、持久性)标准,可用于进行高性能 SQL 分析。

对存储在多个第三方来源的数据运行联合查询,以就地访问和查询数据。

使用零 ETL 集成,将 Amazon DynamoDB、Amazon Aurora MySQL、Amazon Aurora PostgreSQL、Amazon RDS for MySQL 等运营数据库以及 Salesforce、ServiceNow 和 Zendesk 等应用程序的数据引入 SageMaker Lakehouse,以进行近实时分析。

通过集成访问控制,保护 SageMaker Lakehouse 中数据的安全。只需定义一次权限,这些权限就会在所有分析工具和引擎的所有数据中强制执行。