使用 Amazon Neptune 实现生成式人工智能

高性能图形分析和无服务器数据库,可提供卓越的可扩展性和可用性

概览

Amazon Neptune ML 是一项 Neptune 新功能。它采用的图形神经网络(GNN)是一种专为图形而构建的机器学习(ML)技术,能够通过使用图形数据,轻松、快速和更准确地进行预测。与使用非图形方法进行预测相比,使用 Neptune ML 后,大多数图形预测的准确性可以提高 50% 以上。

对具有数十亿关系的图形进行准确预测可能会很困难且耗时。现有的 ML 方法(如 XGBoost)无法有效作用于图形,因为它们专为表格数据而设计。因此,针对图形使用这些方法可能要耗费大量的时间,需要开发人员的专业技能并产生次优预测。

AWS 贡献的开源库 Deep Graph Library(DGL)可以轻松地将深度学习应用于图形数据。Neptune ML 自动执行为图形数据选择和训练最佳 ML 模型的繁重工作,并允许用户直接使用 Neptune API 和查询在其图形上运行 ML。因此,您现在可以在数小时(而不是数周)内创建、训练和应用 Neptune 数据上的 ML,而无需学习新工具和 ML 技术。

机器学习和生成式人工智能

Neptune ML 可根据您的图形数据自动创建、训练和应用 ML 模型。它使用 DGL 自动为您的工作负载选择和训练最佳 ML 模型,这样,您就可以在几小时(而不是几周)内对图形数据做出基于 ML 的预测。

Neptune ML 采用 GNN,这是一种应用于图形数据的先进 ML 技术,可以推断图形中的数十亿个关系,从而做出更准确的预测。

*根据斯坦福大学发表的研究,Neptune ML 使用 GNN 进行预测的准确性可比使用非图形 ML 高出 50% 以上。

LangChain 是一个开源 Python 框架,旨在简化使用大型语言模型(LLM)的应用程序的创建。Neptune 与 LangChain 的集成使开发人员能够使用 LangChain 的开源框架来简化上下文感知应用程序的创建。

借助 Neptune 和 LangChain,您可以根据提供的上下文返回响应,并使用 openCypher 查询语言查询 Neptune 图形数据库。例如,您可以使用 Neptune openCypher 问答链将英语问题翻译为 openCypher 查询并返回人类可读的响应。该问答链可用于回答诸如“奥斯汀机场有多少条出境航线?”之类的问题。

有关 Neptune openCypher 问答链的更多详细信息,请访问开源 LangChain 文档

LlamaIndex 是一个开源数据框架,用于将自定义数据来源连接到大型语言模型(LLM),并支持将知识图与 LLM 一起使用。

借助 LlamaIndex,可以使用 Neptune 作为图形存储向量存储,以使用 GraphRAG 等技术构建生成式人工智能应用程序。

使用案例

公司因遭受欺诈而损失了数百万(甚至数十亿)美元,并且希望检测欺诈性用户、账户、设备、IP 地址或信用卡,以最大程度地减少损失。您可以使用基于图形的表示来捕捉实体(用户、设备或卡)的交互情况并检测聚合,例如用户何时发起多个小型交易或使用可能存在欺诈的不同账户。

了解详情

身份图谱根据客户和潜在客户在一组设备和标识符上与产品或网站的交互情况,提供客户和潜在客户的单一统一视图。组织使用身份图谱为数百万用户提供实时个性化和广告定向。Neptune ML 根据跨设备的以往搜索历史记录或它们在获取渠道中的位置等特征,自动向某些客户推荐后续步骤或产品折扣。

了解详情

知识图谱可以合并和整合组织的信息资产,便于组织的所有成员使用。Neptune ML 可以推断数据来源之间缺失的关联并识别相似的实体,以便所有人更好地探索知识。

了解详情

传统推荐使用分析服务手动提供产品推荐。Neptune ML 可以直接在图形数据上识别新关系,并以列表形式轻松推荐玩家有兴趣购买的游戏、要关注的其他玩家或要购买的产品。

定价

无需前期投资。您只需为 Amazon SageMaker、Neptune 和 Amazon Simple Storage Service(Amazon S3)等使用的 AWS 资源付费。

入门

开始使用 Neptune ML 的最简单方法是使用预构建的 AWS CloudFormation 快速入门模板。您还可以浏览 Neptune ML 笔记本,查看使用预构建的 CloudFormation 堆栈的节点分类、节点回归和链接预测的端到端示例。

创建 Neptune ML 堆栈