Amazon SageMaker Lakehouse

Analytik und KI mit einem einheitlichen, offenen und sicheren Data Lakehouse vereinfachen

Was ist SageMaker Lakehouse?

Amazon SageMaker Lakehouse vereinheitlicht all Ihre Daten aus Data Lakes von Amazon Simple Storage Service (Amazon S3) und Amazon Redshift Data Warehouses und hilft Ihnen so, leistungsstarke Analytik- und KI/ML-Anwendungen auf einer einzigen Datenkopie zu erstellen. SageMaker Lakehouse bietet Ihnen die Flexibilität, mit allen Apache-Iceberg-kompatiblen Tools und Engines direkt auf Ihre Daten zuzugreifen und diese abzufragen. Schützen Sie Ihre Daten im Lakehouse, indem Sie differenzierte Berechtigungen definieren, die in allen Tools und Engines für Analytik und Machine Learning (ML) durchgesetzt werden. Bringen Sie Daten aus Betriebsdatenbanken und Anwendungen durch Null-ETL-Integrationen nahezu in Echtzeit in Ihr Lakehouse. Darüber hinaus können Sie mit Verbundabfragefunktionen aus Datenquellen von Drittanbietern direkt auf Daten zugreifen und diese abfragen.

Vorteile

Vereinheitlichen Sie all Ihre Daten in Amazon S3 Data Lakes und Amazon Redshift Data Warehouses mit SageMaker Lakehouse. Bringen Sie Ihre Daten aus Betriebsdatenbanken und Anwendungen durch Null-ETL-Integrationen nahezu in Echtzeit in das Lakehouse. Sie können Hunderte von Konnektoren verwenden, um Daten aus verschiedenen Quellen zu integrieren. Darüber hinaus können Sie mit Verbundabfragefunktionen aus Datenquellen von Drittanbietern direkt auf Daten zugreifen und diese abfragen.
Nutzen Sie Ihre bevorzugten Tools und Engines, die mit dem offenen Standard Apache Iceberg kompatibel sind. Erlangen Sie die Flexibilität, mit allen Apache-Iceberg-kompatiblen Tools direkt auf Ihre Daten zuzugreifen und diese abzufragen, und zwar in einer einzigen Datenkopie. SageMaker Lakehouse ist mit der Spezifikation des Iceberg-REST-Katalogs kompatibel und ermöglicht Ihnen die Nutzung von Analytik-Tools und Engines Ihrer Wahl, wie z. B. SQL-, Apache-Spark, BI- (Business Intelligence) und KI/ML-Tools, sowie die Zusammenarbeit mit Daten aus Data Lakes von Amazon S3 und aus Data Warehouses von Amazon Redshift. Verwenden Sie SageMaker Lakehouse mit Ihrer bestehenden Datenarchitektur ermöglichen Sie die Verwendung Ihrer bevorzugten Speicherformate und Abfrage-Engines, die mit Apache Iceberg kompatibel sind.
Schützen Sie Ihre Daten mit integrierten, differenzierten Zugriffskontrollen, die für all Ihre Daten in allen Analytik-Tools und Engines durchgesetzt werden. Definieren Sie Berechtigungen einmal und teilen Sie Daten vertrauensvoll in Ihrem Unternehmen.

Anwendungsfälle

Vereinheitlichen Sie all Ihre Daten in Amazon S3 Data Lakes und Amazon Redshift Data Warehouses für Ihre Analytik- und KI-Initiativen mit einer einzigen Datenkopie. Mit integrierten Zugriffskontrollen können Sie mit SageMaker Lakehouse differenzierte Berechtigungen definieren und eine einzige Datenkopie sicher im gesamten Unternehmen teilen.
Greifen Sie über Null-ETL-Integrationen nahezu in Echtzeit auf Daten aus operativen Datenbanken und Anwendungen im SageMaker Lakehouse zu. Greifen Sie direkt auf Ihre Daten zu und fragen Sie sie ab – mit einer Vielzahl von AWS-Services sowie Open-Source-Tools und Engines von Drittanbietern, die Apache Iceberg unterstützen.
Bringen Sie vorhandene Daten aus mehreren Amazon Redshift Data Warehouses in SageMaker Lakehouse, um Daten abzufragen und zu verknüpfen, die in Redshift-Clustern und Arbeitsgruppen gespeichert sind. Skalieren Sie Ihre Workloads für Prozesse von Extract, Transform, Load (ETL), BI-Berichte und Analysen nach Bedarf, ohne mehrere Datenfreigaben verwalten zu müssen.