概觀
下一代 Amazon SageMaker 簡化資料湖、AI 模型和應用程式中資料與 AI 的探索、管控和協作。藉助以 Amazon DataZone 為基礎建置的 Amazon SageMaker Catalog,使用者可以將生成式 AI 建置的中繼資料與語義搜尋搭配使用來安全地探索和存取已核准的資料和模型,或者您也可以使用自然語言要求 Amazon Q Developer 尋找您的資料。使用者可以使用 Amazon SageMaker Unified Studio 中具有集中精細存取控制項的單一許可模型,來定義和強制執行存取政策。透過簡單的發佈和訂閱工作流程,針對資料和 AI 資產進行順暢的共用與協作。藉助 SageMaker,您可以使用 Amazon Bedrock 防護機制保障和保護自己的 AI 模型,以及實作負責任 AI 政策。透過資料品質監控與自動化、敏感資料偵測以及資料與機器學習 (ML) 歷程,培養組織範圍內的資料信任。
查看 Amazon SageMaker 型錄的實際應用

優勢
功能
針對關聯內容和可尋找性的精選資料
SageMaker Catalog 將業務內容引入您的技術中繼資料,並可讓您使用業務內容豐富中繼資料。您可在業務關聯內容中使資料可見,讓所有使用者快速且輕鬆地尋找、了解並信任資料。
自動化中繼資料建議
自動將業務描述和名稱新增至資料,這有助於您輕鬆了解關聯內容,並避免處理含義模糊的技術名稱。此自動化採用大型語言模型 (LLM) 技術,以提高準確性和一致性。
為所有應用程式帶來一致水平的 AI 安全
Amazon Bedrock 防護機制會根據使用案例特定的政策來協助評估使用者輸入和基礎模型 (FM) 回應,並提供額外的防護層,無論底層 FM 為何。
快速稽核和追蹤模型
透過統一檢視快速稽核所有模型、端點和模型監控任務的效能,並進行疑難排解。使用自動化提醒追蹤與預期模型行為的偏差,以及遺失或非作用中的監控任務。
資料品質
透過資料品質統計資料,資料取用者可以查看來自 AWS 或第三方系統的資料品質指標。資料取用者可以信賴用於決策的資料來源,並在搜尋資產時獲得資料品質的背景資訊。資料生產者和 IT 團隊也可以使用 API 將第三方系統的資料品質統計資料整合到統一的主控台外入口網站。
資料和 ML 歷程
了解資料和模型在一段時間內的移動情況。歷程可協助資料取用者了解資料來源、資料變更以及取用情況,藉此提高信任度以及組織的資料和 AI 素養。您可以減少對應資料和 AI 資產及其關係、疑難排解和開發管道,以及確定資料和 AI 管控做法的時間。
客戶
CISCO
「您希望探索、共用和管控自己的資料。無論將其稱為資料網格還是資料結構,資料都存在於多個孤島中的不同團隊之間,因此需要採用一種方法將它們整合在一起。Amazon SageMaker 型錄可連線資料生產者和取用者,讓生產者能夠藉助內建控制項和資料合約共用資料,同時讓取用者能夠使用自己選擇的工具存取資料」
Cisco AI/ML 資深總監Shaja Arul Selvamani

Natera, Inc.
「我們的組織一直在利用 Amazon DataZone、Amazon SageMaker AI、Amazon Athena 和 Amazon Redshift 來管理和分析臨床與基因體資料。我們很高興現在擁有 Amazon SageMaker Catalog 的統一管控功能,這將簡化我們的資料探索和存取,讓團隊能夠快速分析整個領域的相關資料。這種整合將協助我們建立量身打造的資料集,從而有可能減少我們取得洞見的時間,並最終推動改善患者的治療結果,因為我們正在推進將個人化基因檢測作為護理標準部分的目標。」
Natera, Inc. 軟體工程副總裁 Mirko Buholzer

NatWest
「我們的資料平台工程團隊一直在為資料工程、ML、SQL 和生成式 AI 任務部署多個最終使用者工具。在尋求簡化整個銀行的程序期間,我們一直在研究簡化使用者身分驗證和資料存取授權。Amazon SageMaker 提供現成的使用者體驗,協助我們在整個組織中部署單一環境,從而將資料使用者存取新工具所需的時間縮短大約 50%。」
NatWest Group 的 CDAO:Zachery Anderson

開始使用 Amazon SageMaker Catalog
找到今天所需的資訊了嗎?
讓我們知道,以便我們改善頁面內容的品質。