為什麼選擇 AWS Glue?
準備您的資料以取得高品質結果是分析或 ML 專案的第一步。AWS Glue 是一項無伺服器資料整合服務,可使資料準備變得更簡單、快速而且實惠。您可以發現並連線到超過 100 個不同的資料來源,在集中式資料型錄中管理您的資料,並且以視覺方式建立、執行與監控 ETL 管道,將資料載入到您的資料湖。藉助內建的生成式 AI 功能,您可透過 ETL 編寫和 Spark 故障診斷的智慧協助,來現代化 Spark 任務並加速開發。
AWS Glue 簡介 (01:54)
AWS Glue 的優勢
運作方式
AWS Glue 是一種無伺服器、可擴展的資料整合服務,可讓您更輕鬆地探索、準備、移動和整合來自多個來源的資料,以進行分析、機器學習 (ML) 和應用程式開發。
-
資料整合引擎選項
-
事件驅動的 ETL
-
AWS Glue Data Catalog
-
無程式碼 ETL 任務
-
管理和監控資料品質
-
資料準備
-
資料整合引擎選項
-
事件驅動的 ETL
-
AWS Glue 可在新資料到達時執行擷取、轉換和載入 (ETL) 任務。例如,您可以設定 AWS Glue 在 Amazon Simple Storage Service (S3) 上的新資料變得可用時立即開始執行您的 ETL 任務。
-
AWS Glue Data Catalog
-
您可以使用資料型錄快速探索和搜尋多個 AWS 資料集,而無需移動資料。資料編入型錄之後,即可使用 Amazon Athena、Amazon EMR 和 Amazon Redshift Spectrum 搜尋和查詢。
-
無程式碼 ETL 任務
-
AWS Glue Studio 讓您可以更輕鬆地以視覺化方式建立、執行和監控 AWS Glue ETL 任務。您可以建置 ETL 任務,該任務可使用拖放編輯器移動和轉換資料,而 AWS Glue 可自動產生程式碼。
-
管理和監控資料品質
-
資料準備
-
藉助 AWS Glue DataBrew,您可以探索和試驗直接來自資料湖、資料倉儲和資料庫的資料,包括 Amazon S3、Amazon Redshift、AWS Lake Formation、Amazon Aurora 和 Amazon Relational Database Service (RDS)。您可以從 DataBrew 中 250 多個預先建置的轉換中進行選擇,以自動化資料準備任務,例如篩選異常、標準化格式和更正無效值。
此外,AWS Glue Studio 還提供資料準備工具,可讓您透過互動式的點按式視覺化介面來準備資料,而無需編寫程式碼。
使用案例
支援多種不同的處理架構和工作負載
More easily support various data processing frameworks, such as ETL and ELT, and various workloads, including batch, micro-batch, and streaming.
簡化 ETL 管道管理
透過自動佈建和工作者管理免除掉基礎設施管理,並將您的所有資料整合需求併入單一裝置中。
以互動方式探索、試驗及處理資料
Using AWS Glue interactive sessions, data engineers can interactively explore and prepare data using the integrated development environment (IDE) or notebook of their choice.
有效探索資料
Quickly identify data across AWS, on premises, and other clouds, and then make it instantly available for querying and transforming.
最新消息
開始使用 Glue
找到今天所需的資訊了嗎?
讓我們知道,以便我們改善頁面內容的品質。