Amazon SageMaker Catalog

安全地探索、管控和協作資料和 AI

概觀

下一代 Amazon SageMaker 簡化資料湖、AI 模型和應用程式中資料與 AI 的探索、管控和協作。藉助以 Amazon DataZone 為基礎建置的 Amazon SageMaker Catalog,使用者可以將生成式 AI 建置的中繼資料與語義搜尋搭配使用來安全地探索和存取已核准的資料和模型,或者您也可以使用自然語言要求 Amazon Q Developer 尋找您的資料。使用者可以使用 Amazon SageMaker Unified Studio 中具有集中精細存取控制項的單一許可模型,來定義和強制執行存取政策。透過簡單的發佈和訂閱工作流程,針對資料和 AI 資產進行順暢的共用與協作。藉助 SageMaker,您可以使用 Amazon Bedrock 防護機制保障和保護自己的 AI 模型,以及實作負責任 AI 政策。透過資料品質監控與自動化、敏感資料偵測以及資料與機器學習 (ML) 歷程,培養組織範圍內的資料信任。

查看 Amazon SageMaker 型錄的實際應用

sagemaker 型錄縮圖

優勢

利用在 Amazon DataZone 基礎上建置的 SageMaker Catalog,大規模探索您的資料和 AI 資產。利用生成式 AI 增強資料探索,以根據業務內容自動豐富您的資料和中繼資料,讓所有使用者可更輕鬆地尋找、理解和使用資料。透過資料表和資料欄名稱或業務詞彙術語進行篩選,共用資料、AI 模型、提示和生成式 AI 資產。自動為每個資料集建議有價值的欄和相關的分析應用程式,從而能夠使用正確的資料快速建置適當的模型。通過在專案上的單一體驗中發佈和訂閱工作流程,支援集中式和分散式管控模式,實現無縫的資料和 AI 共用。

透過即時查看 SageMaker 中的資料品質以及資料及 ML 歷程來獲得信任。自動化資料分析和資料品質建議,監控資料品質規則,以及接收提醒。藉由使用以規則和 ML 為基礎的方法協調實體,解決難以發現的資料品質問題,以便您提供高品質的資料來做出自信的業務決策。透過內建模型監控來偵測偏差,並報告功能如何影響模型預測,從而提高資料管道與 AI 專案的透明度。
透過精細存取控制、資料分類和防護機制,在 SageMaker 中集中實作資料和 AI 安全性,以確保資料、分析和 AI 模型得到適當使用。定義一次許可,並在資料和模型中強制執行這些許可。藉助原生整合的 Amazon Bedrock,客戶可在其生成式 AI 應用程式中使用 Amazon Bedrock 防護機制,即透過封鎖有害內容、篩選幻覺並啟用可自訂的保護措施來實現隱私權、安全性和準確性。使用 Amazon Comprehend 自動識別管道中的敏感資訊。
藉助資料用量以及模型記錄和監控滿足稽核和法規遵循。透過專案型隔離,支援整個企業內分析和 AI 資產的可接受使用。了解整個資料湖中的資料和模型用量以增強安全性。使用 Amazon SageMaker Clarify 監控模型的偏差、準確性和穩定性,並符合負責任 AI 標準。將成本與業務計劃保持一致,並清楚地了解您的業務投資。

功能

針對關聯內容和可尋找性的精選資料

SageMaker Catalog 將業務內容引入您的技術中繼資料,並可讓您使用業務內容豐富中繼資料。您可在業務關聯內容中使資料可見,讓所有使用者快速且輕鬆地尋找、了解並信任資料。

自動化中繼資料建議

自動將業務描述和名稱新增至資料,這有助於您輕鬆了解關聯內容,並避免處理含義模糊的技術名稱。此自動化採用大型語言模型 (LLM) 技術,以提高準確性和一致性。

為所有應用程式帶來一致水平的 AI 安全

Amazon Bedrock 防護機制會根據使用案例特定的政策來協助評估使用者輸入和基礎模型 (FM) 回應,並提供額外的防護層,無論底層 FM 為何。

快速稽核和追蹤模型

透過統一檢視快速稽核所有模型、端點和模型監控任務的效能,並進行疑難排解。使用自動化提醒追蹤與預期模型行為的偏差,以及遺失或非作用中的監控任務。

資料品質

透過資料品質統計資料,資料取用者可以查看來自 AWS 或第三方系統的資料品質指標。資料取用者可以信賴用於決策的資料來源,並在搜尋資產時獲得資料品質的背景資訊。資料生產者和 IT 團隊也可以使用 API 將第三方系統的資料品質統計資料整合到統一的主控台外入口網站。

資料和 ML 歷程

了解資料和模型在一段時間內的移動情況。歷程可協助資料取用者了解資料來源、資料變更以及取用情況,藉此提高信任度以及組織的資料和 AI 素養。您可以減少對應資料和 AI 資產及其關係、疑難排解和開發管道,以及確定資料和 AI 管控做法的時間。

客戶

CISCO

「您希望探索、共用和管控自己的資料。無論將其稱為資料網格還是資料結構,資料都存在於多個孤島中的不同團隊之間,因此需要採用一種方法將它們整合在一起。Amazon SageMaker 型錄可連線資料生產者和取用者,讓生產者能夠藉助內建控制項和資料合約共用資料,同時讓取用者能夠使用自己選擇的工具存取資料」

Cisco AI/ML 資深總監Shaja Arul Selvamani

image

Natera, Inc.

「我們的組織一直在利用 Amazon DataZone、Amazon SageMaker AI、Amazon Athena 和 Amazon Redshift 來管理和分析臨床與基因體資料。我們很高興現在擁有 Amazon SageMaker Catalog 的統一管控功能,這將簡化我們的資料探索和存取,讓團隊能夠快速分析整個領域的相關資料。這種整合將協助我們建立量身打造的資料集,從而有可能減少我們取得洞見的時間,並最終推動改善患者的治療結果,因為我們正在推進將個人化基因檢測作為護理標準部分的目標。」

Natera, Inc. 軟體工程副總裁 Mirko Buholzer

image

NatWest

「我們的資料平台工程團隊一直在為資料工程、ML、SQL 和生成式 AI 任務部署多個最終使用者工具。在尋求簡化整個銀行的程序期間,我們一直在研究簡化使用者身分驗證和資料存取授權。Amazon SageMaker 提供現成的使用者體驗,協助我們在整個組織中部署單一環境,從而將資料使用者存取新工具所需的時間縮短大約 50%。」

NatWest Group 的 CDAO:Zachery Anderson

image