Amazon SageMaker Lakehouse

ลดความซับซ้อนในการวิเคราะห์และ AI ด้วย Data Lakehouse แบบรวมเป็นหนึ่งเดียว เปิดกว้าง และปลอดภัย

SageMaker Lakehouse คืออะไร

Amazon SageMaker Lakehouse รวมข้อมูลทั้งหมดของคุณใน Data Lake ของ Amazon Simple Storage Service (Amazon S3) และคลังข้อมูล Amazon Redshift ซึ่งช่วยให้คุณสร้างการวิเคราะห์และแอปพลิเคชัน AI/ML ที่มีประสิทธิภาพบนสำเนาข้อมูลเดียว SageMaker Lakehouse มอบความยืดหยุ่นในการเข้าถึงและสืบค้นข้อมูลของคุณภายในระบบด้วยเครื่องมือและกลไกที่ใช้งานร่วมกันได้กับ Apache Iceberg ทั้งหมด รักษาความปลอดภัยของข้อมูลใน Lakehouse ได้ด้วยการปรับแต่งสิทธิ์แบบละเอียดที่มีการนำไปใช้กับเครื่องมือและเอ็นจินการวิเคราะห์และแมชชีนเลิร์นนิง (ML) ทั้งหมด นำข้อมูลจากฐานข้อมูลการดำเนินงานและแอปพลิเคชันเข้าสู่ Lakehouse ของคุณแบบใกล้เรียลไทม์ผ่านการบูรณาการ ETL แบบไร้รอยต่อ นอกจากนี้ การเข้าถึงและการสืบค้นข้อมูลยังมีความสามารถในการสืบค้นที่เชื่อมโยงกับส่วนกลางในแหล่งที่มาของข้อมูลจากภายนอก

ประโยชน์

รวมข้อมูลทั้งหมดจาก Data Lake ของ Amazon S3 และคลังข้อมูลของ Amazon Redshift เข้าด้วยกันด้วย SageMaker Lakehouse นำข้อมูลของคุณจากฐานข้อมูลการดำเนินงานและแอปพลิเคชันเข้าสู่ Lakehouse ได้แบบแทบจะเรียลไทม์ผ่านการบูรณาการ ETL แบบไร้รอยต่อ คุณสามารถใช้ตัวเชื่อมต่อหลายร้อยตัวเพื่อผสานรวมข้อมูลจากแหล่งต่าง ๆ นอกจากนี้ คุณยังสามารถเข้าถึงและสืบค้นข้อมูลในตัวได้ด้วยความสามารถในการสืบค้นที่เชื่อมโยงกับส่วนกลางในแหล่งที่มาของข้อมูลจากภายนอก
ใช้เครื่องมือและกลไกที่คุณต้องการ เข้ากันได้กับมาตรฐานเปิด Apache Iceberg รับความยืดหยุ่นในการเข้าถึงและสืบค้นข้อมูลของคุณในสถานที่ด้วยเครื่องมือที่เข้ากันได้กับ Apache Iceberg ทั้งหมดในสำเนาข้อมูลเดียว SageMaker Lakehouse เข้ากันได้กับข้อมูลจำเพาะแคตตาล็อก Iceberg REST ให้คุณใช้เครื่องมือวิเคราะห์และกลไกที่คุณเลือก เช่น SQL, Apache Spark, business intelligence (BI) และเครื่องมือ AI/ML และทำงานร่วมกับข้อมูลที่เก็บไว้ใน Data Lake Amazon S3 และคลังข้อมูล Amazon Redshift ใช้ SageMaker Lakehouse พร้อมกับสถาปัตยกรรมข้อมูลที่มีอยู่ ช่วยให้คุณสามารถใช้รูปแบบการจัดเก็บข้อมูลและเครื่องมือสืบค้นที่คุณต้องได้ ซึ่งสามารถใช้งานร่วมกันได้กับ Apache Iceberg
รักษาความปลอดภัยให้ข้อมูลของคุณด้วยการควบคุมสิทธิ์การเข้าถึงแบบละเอียดที่ผสานรวม ซึ่งมีการบังคับใช้ในข้อมูลทั้งหมดของคุณในเครื่องมือและเอนจินการวิเคราะห์ทั้งหมด กำหนดสิทธิ์เพียงครั้งเดียวแล้วแชร์ข้อมูลในองค์กรของคุณอย่างมั่นใจ

กรณีใช้งาน

รวมข้อมูลทั้งหมดของคุณใน Data Lake ของ Amazon S3 และคลังข้อมูล Amazon Redshift เพื่อการวิเคราะห์และการความคิดริเริ่มด้าน AI ด้วยสำเนาข้อมูลเดียว ด้วยระบบควบคุมสิทธิ์การเข้าถึงแบบผสานรวม SageMaker Lakehouse จึงช่วยให้คุณสามารถกำหนดสิทธิ์แบบละเอียดและแชร์สำเนาข้อมูลเดียวได้อย่างปลอดภัยทั่วทั้งองค์กร
เข้าถึงข้อมูลในฐานข้อมูลการดำเนินงานและแอปพลิเคชันแบบแทบจะเรียลไทม์ใน SageMaker Lakehouse ผ่านการบูรณาการ ETL แบบไร้รอยต่อ เข้าถึงและสืบค้นข้อมูลของคุณในตัวจากบริการ AWS ที่หลากหลาย รวมถึงเครื่องมือและเอนจินแบบโอเพนซอร์สและจากภายนอกที่รองรับ Apache Iceberg
นำข้อมูลที่มีอยู่จากคลังข้อมูลของ Amazon Redshift หลายแห่งเข้าสู่ SageMaker Lakehouse เพื่อสืบค้นและรวมข้อมูลที่เก็บไว้ในคลัสเตอร์และเวิร์กกรุ๊ป Redshift ปรับขนาดเวิร์กโหลดของคุณสำหรับกระบวนการ Extract, Transform and Load (ETL), การรายงาน BI และการวิเคราะห์ตามความจำเป็นโดยไม่ต้องจัดการการแชร์ข้อมูลหลายรายการ