用作向量数据库的 Amazon OpenSearch Service

使用可扩展、安全和高性能的向量数据库构建向量驱动的搜索和企业人工智能应用程序。

概览

OpenSearch Service 的向量引擎为现代生成式人工智能应用程序提供了可扩展、安全而且高性能的向量数据库。使用高级 k 最近邻(k-NN)和近似最近邻(ANN)算法,以及分层可导航小世界(HNSW)和倒排文件(IVF)实现,在几毫秒内轻松存储和搜索数十亿个高维向量。将向量嵌入与基于文本的关键字无缝结合,以实现向量驱动的搜索功能(语义、多模式、对话等)、推荐系统、聊天机器人和其他现代生成式人工智能应用程序。构建检索增强生成(RAG)应用程序,将基础模型(FM)安全地连接到您的业务数据,以获得准确的情境感知响应,无需微调或重新训练。通过智能数据生命周期管理优化成本,同时保持所有存储层的快速查询性能。向量数据库以完全托管或无服务器的配置提供。

Amazon OpenSearch 无服务器的向量引擎(0:30)

优势

在单个搜索请求中无缝地将向量嵌入与基于文本的关键字查询相结合,并使用高级最近邻算法,例如 ANN(跨 HNSW 和 IVF)和具有自动扩缩功能的精确 k-NN 向量搜索,为数十亿个向量提供低延迟相似度搜索。这降低了系统的复杂性,消除了对多个系统的需求,并加快了人工智能驱动的应用程序的上市时间,例如向量驱动的搜索(混合、语义、多模态、对话等)、推荐系统和人工智能聊天机器人以及其他现代生成式人工智能应用程序。

利用基于磁盘的向量存储和智能数据生命周期管理,扩展到数十亿个高维向量,同时优化存储成本。OpenSearch Service 简化了向量数据库操作,为完全托管和无服务器配置提供了易于使用的界面。您可以选择使用托管集群进行精确控制或使用无服务器进行自动资源优化,从而在不产生不必要成本的情况下高效扩展向量工作负载。这两个选项都可确保在所有存储级别上快速响应查询,同时利用智能数据生命周期管理来优化工作负载增长的成本。通过 OpenSearch Service 的直观控制台和 API,您可以直接部署、管理和扩展向量数据库,从而降低操作复杂性。

实时添加、更新或删除向量嵌入,无需重新索引,也不会影响查询性能。这种功能可确保人工智能模型和搜索应用程序保持对动态数据变化的响应,使其成为数据频繁演变的电子商务个性化或异常检测等应用场景的理想之选。

Amazon OpenSearch Service 与 AWS 服务和第三方 AI 平台集成,支持现代生成式人工智能应用程序。借助与 Amazon DynamoDB 和 Amazon DocumentDB 的零 ETL 集成,您能够通过对运营数据的向量搜索来增强生成人工智能应用程序,无需构建复杂的管道。与 Amazon Bedrock 的原生双向集成简化了生成式人工智能工作流程,使您可以将基础模型连接到知识库,实现高效的嵌入生成和检索增强生成(RAG)应用程序。OpenSearch Service 是 AWS 为 Amazon Bedrock 推荐的向量数据库。开发人员可以利用 Amazon SageMaker 的强大功能进行模型训练和部署,或者通过预构建的连接器轻松连接到 Amazon Titan 或 OpenAI、Cohere、DeepSeek 等第三方模型。这样可以实现安全、高效和可扩展的开发,同时最大限度地提高现有数据和基础设施投资的价值。

一项完全托管的服务,可管理 OpenSearch,提供企业可靠性,同时利用开源创新。全球开源社区积极促进并增强 OpenSearch(现为 Linux Foundation 的一部分),推动持续发展,而托管的服务消除了基础设施管理开销。这种方法可提供高可用性(99.99% 的 SLA)、自动扩缩、补丁和更新,以及 Apache 2.0 许可技术的灵活性和供应商中立性。开源社区还有助于指导项目的方向,确保持续创新,使所有用户受益。

使用案例

通过将传统的关键字搜索与向量相似度相结合来增强搜索体验,从而提高相关性。支持自然语言理解、多模态查询(文本、图像、音频)和混合搜索功能,为不同的内容类型提供与上下文相关的结果。
大规模提供个性化推荐,使用向量相似度匹配数十亿个项目的用户偏好,近乎实时地提供相关建议。
通过将基础模型连接到您的业务数据,实现准确、上下文感知的响应和任务执行,构建值得信赖的人工智能聊天机器人、助手和应用程序。通过基于向量的信息检索消除幻觉并提高准确性,同时保持简单查询和复杂交互的快速响应时间。
通过比较大型数据集的向量相似度,大规模识别模式和异常,从而实时检测潜在的欺诈、假冒或可疑活动。

客户和合作伙伴

riskCanvas 客户评论

riskCanvas 是 Genpact 的子公司。这是一款提供金融犯罪合规解决方案的 SaaS 产品,利用前沿的大数据、自动化和机器学习技术为其客户提供合规性、效率和自动化。

"riskCanvas 直接与 Amazon OpenSearch 无服务器的向量引擎集成,这样我们就可以通过 AWS 的生成式人工智能功能公开我们现有的客户端运营数据。这是一个颠覆性的改变,因为我们现在可以利用汇总来加速对调查的分析,撰写金融犯罪报告的种子叙事,并提出相关升级建议,同时使用保存在 riskCanvas 安全飞地中的真实数据。借助向量引擎,我们正在缩短金融犯罪用例的处理时间,提高叙述的一致性并减少错误,通过直通式处理提高效率,并将人工参与转向更深入的分析。”

Ryan Skousen,Genpact Financial Crimes 首席技术官(riskCanvas)兼技术副总裁

riskCanvas 徽标

Academia 客户评论

Academia 是分享学术研究的平台。Adademia.edu 以加速推进世界各地的研究为使命。

“Amazon OpenSearch Service 使我们能够高效地对数百万个向量进行索引和搜索,并找到最相关的学术论文推荐给我们的用户,从而推进学术界加速推进世界各地研究的使命。与之前的推荐解决方案相比,切换到 Amazon OpenSearch Service 服务使我们的用户对内容推荐的参与度提高了 20%。”

Bob Tucker,Academia 工程总监

Academia 徽标

Intuit 客户评论

Intuit Inc. 是一家全球金融技术平台,通过提供财务管理、合规性以及营销产品和服务来助力消费者和小型企业繁荣发展。

“我们的平台团队与 AWS 密切合作,构建高级功能来高效存储、管理和查询由最先进的 ML 模型生成的向量嵌入,从而为自然语言处理应用程序和服务解锁新的可能性。得益于 Amazon OpenSearch Service,该解决方案现已成为 Intuit 所有向量需求的默认存储。我们很高兴能够进一步普及基于 OpenSearch 的向量数据库,以应对未来几个月新的和即将出现的使用案例。”

Achal Kumar,Intuit 数据能力总监

Intuit 徽标