Amazon Bedrock 知識庫

有了 Amazon Bedrock 知識庫,您可以從公司的私人資料來源向基礎模型和代理程式提供內容資訊,進而提供更相關、準確和自訂的回應

全受管的端對端 RAG 工作流程支援

為了向基礎模型 (FM) 提供最新且專有的資訊,組織採用檢索增強生成 (RAG) 技術,從公司資料來源擷取資料,使用該資料擴充提示,以提供更相關且更準確的回應。Amazon Bedrock 知識庫是一項完全受管的功能,內建工作階段內容管理和來源歸因,可協助您實現從擷取到檢索和提示擴充的整個 RAG 工作流程,而無需建立資料來源的自訂整合和管理資料流程。您也可以提出問題並彙總單一文件中的資料,而無需設定向量資料庫。如果您的資料包含結構化來源,Amazon Bedrock 知識庫會為結構化查詢語言提供內建的受管理自然語言,以產生查詢命令以擷取資料,而無需將資料移至其他存放區。

知識庫概述的正式描述

安全連接 FM 和代理程式到資料來源

如果您有非結構化資料來源,Amazon Bedrock 知識庫會自動從來源擷取資料,例如 Amazon Simple Storage Service (Amazon S3)、Confluence (預覽版)、Salesforce (預覽版)、SharePoint (預覽版) 或 Web 編目程式 (預覽版)。此外,您還會收到程式化文件擷取,讓客戶能夠從不受支援的來源擷取串流資料或資料。一旦擷取內容,Amazon Bedrock 知識庫將內容分割成文字區塊,將文字轉換為嵌入,並將嵌入式儲存在向量資料庫中。您可以從多個支援的向量存放區中進行選擇,包括 Amazon Aurora、Amazon OpenSearch Serverless、Amazon Neptune Analytics MongoDB、Pinecone 和 Redis Enterprise Cloud。您也可以選擇連線到 Amazon Kendra 混合式搜尋索引以進行受管理的擷取

使用 Amazon Bedrock 知識庫,您也可以連線到結構化資料存放區,以產生有根據的回應。當您有儲存在資料倉儲和資料湖中的交易詳細資料等來源資料時,這特別有用。Amazon Bedrock 知識庫使用 Natural Language to SQL 將查詢轉換為 SQL 命令,並執行命令以擷取資料,無需從來源資料來源移動資料。

建立知識庫和設置資料來源的螢幕

自訂 Amazon Bedrock 知識庫以在執行時期提供準確的回應

使用 Amazon Bedrock 知識庫作為完全受管的 RAG 解決方案,您可以靈活地自訂和提高擷取準確度。對於包含諸如影像和具有複雜版面 (例如包含表格、圖形、圖表和圖解的文件) 等視覺豐富文件的多模態資料之非結構化資料來源,您可以設定 Bedrock 知識庫來解析、分析和擷取有意義的洞察。您可以選擇 Bedrock 資料自動化或基礎模型為剖析器。這可以順暢處理複雜的多模態資料,讓您可以建立高度準確的 GenAI 應用程式。

Amazon Bedrock 知識庫提供各種進階資料區塊化選項,包括語義、階層和固定大小區塊化。為取得完整控制,您還可以將自己的資料區塊化程式碼編寫為 Lambda 函數,甚至可以使用 LangChain 和 LlamaIndex 等架構的現成元件。如果您選擇 Amazon Neptune Analytics 作為向量存放區,Amazon Bedrock 知識庫會自動建立嵌入和圖形,以將相關內容與您的資料來源連結。Bedrock 知識庫利用與 GraphRAG 的這些內容關係來提高擷取的準確性,進而為使用者提供更全面、相關且可解釋的回應。

bedrock 資料群集剖析組態螢幕擷取畫面

擷取資料和增強提示

使用擷取 API,您可以從知識庫擷取使用者查詢的相關結果 (包括影像、圖表、和表格等視覺元素) 或是從資料庫擷取結構化資料 (如適用)。RetrieveAndGenerate API 更進一步,直接使用擷取的結果來增強 FM 提示並返回回應。您還可以將 Amazon Bedrock 知識庫新增至 Amazon Bedrock 代理程式,提供代理程式上下文內容。您也可以選擇提供篩選器或使用 FM 產生隱式篩選器,以將傳回的結果限制為僅相關內容。Amazon Bedrock 知識庫提供重新排名模型,以提高擷取的文件區塊的相關性。

檢索和生成 API

提供來源歸因

所有從 Amazon Bedrock 知識庫中擷取的資訊均附有引用 (其中也包括視覺效果),以提高透明度並將幻覺降至最低。

使用者與代理程式進行對話的聊天視窗