本指南演示了航空航天技术人员如何使用生成式人工智能(生成式人工智能)驱动的“助手”使用自定义文档库来回答自然语言技术问题,以获得权威答案。由于飞机组装和维修手册通常包含数千页,因此技术人员手动搜索这些实体文档非常耗时。使用光学字符识别(OCR),可以将扫描的文档转换为可搜索的文本,然后与人工智能助手集成以实现自然语言查询。技术人员可以通过关键字快速搜索或获得口头问题的答案,从而提高效率,同时保持装配和故障排除过程的质量和安全。
请注意:[免责声明]
架构图
-
Amazon Q
-
Amazon Bedrock
-
Amazon SageMaker
-
VPC 联网
-
Amazon Q
-
此架构图显示了如何使用 Amazon Q 实现纸质文档的自然语言搜索。
步骤 1
创建 Amazon Q Business 应用程序和关联的检索器。Amazon Q 为 Amazon Kendra 索引和原生索引提供检索器。您可以选择 Amazon Q 检索器与 Amazon Q 原生索引一起使用,也可以使用已配置的 Amazon Kendra 索引作为检索器。检索器在对话期间实时从索引中提取数据。
步骤 2
将您的数据来源连接到您的检索器。可用数据来源将根据您选择的检索器而有所不同。您可以使用 Amazon Simple Storage Service(Amazon S3)、Amazon Relational Database Service(Amazon RDS)或其他数据来源,也可以从支持的数据连接器中进行选择。步骤 3
使用 AWS Identity and Access Management(IAM)Identity Center 作为管理用户访问的网关。对于使用传统身份管理的应用程序,Amazon Q Business 要求您将 Web 体验与符合 SAML 2.0 的身份提供者(IdP)集成。 Amazon Q Business 可以与任何符合 SAML 2.0 的 IdP 配合使用。Amazon Q 使用服务启动的单点登录对用户进行身份验证。
-
Amazon Bedrock
-
此架构图显示了如何使用 Amazon Bedrock 实现纸质文档的自然语言搜索。
步骤 1
上传数据到 Amazon S3。步骤 2
使用 Amazon Bedrock 知识库通过生成嵌入并将它们存储在支持的向量存储(例如Amazon OpenSearch Service)中为您的数据建立索引。步骤 3
查询大型语言模型(LLM)并向应用程序返回增强响应。使用 AWS Lambda 和 Amazon API Gateway 为外部和 AWS 端点提供对 Amazon Bedrock API 的访问。Amazon Bedrock 是一项服务,提供对基础模型的访问以构建生成式人工智能应用程序。
步骤 4
使用 Amazon Bedrock 代理来编排和分析任务,以利用基础模型的推理能力将它们分解成正确的逻辑顺序。Amazon Bedrock 代理会自动调用必要的 API 与您的系统进行交易来满足请求,并在此过程中确定他们是否可以继续或是否需要收集更多信息。
步骤 5
作为您负责任的人工智能(AI)策略的一部分,您现在可以使用 Amazon Bedrock 的防护机制来促进用户与使用人工智能生成的应用程序之间的安全交互。您可以通过实施针对您的应用场景和负责任的人工智能策略定制的安全措施来做到这一点。
-
Amazon SageMaker
-
此架构图显示了如何使用 Amazon SageMaker 实现纸质文档的自然语言搜索。
步骤 1
上传数据到 Amazon S3。步骤 2
使用 Amazon Textract 将 PDF 或图像文件的文件转换为文本。将 Amazon Transcribe 用于多媒体文件。将转换后的文本存储在 Amazon S3 中。步骤 3
如果需要,使用 Amazon Translate 将您的文本翻译成与您选择的 LLM 兼容的语言。将翻译后的文本存储在 Amazon S3 中。步骤 4
将文档处理状态信息和其他相关元数据存储在 Amazon DynamoDB 中。步骤 5
在 Amazon SageMaker 端点上使用嵌入模型,根据已处理或翻译的文本数据创建嵌入内容。将嵌入内容存储在 OpenSearch Service 索引中。步骤 6
在 SageMaker 端点(查询端点)上托管 LLM 以处理用户查询。步骤 7
使用 Lambda 对您的 SageMaker 端点、OpenSearch Service 索引、DynamoDB 和其他 AWS 服务进行查询。步骤 8
使用 API Gateway 为您的 Lambda 函数提供访问控制、授权和 API 访问权限。步骤 9
使用 DynamoDB 存储聊天信息以启用有状态聊天界面。步骤 10
使用 AWS 服务端点将您的检索增强生成(RAG)框架与其他 AWS 服务集成。 -
VPC 联网
-
此架构图显示了如何为生成式人工智能解决方案中使用的服务启用 VPC 联网。
步骤 1
使用网关端点将 Amazon S3 和 DynamoDB 连接到 Amazon Virtual Private Cloud(Amazon VPC)环境。步骤 2
使用 VPC 端点将 Amazon Textract、Amazon Translate、Amazon Transcribe 和 API Gateway 连接到您的 VPC。步骤 3
使用服务管理的弹性网络接口连接到 SageMaker 推理端点、Lambda 函数和 OpenSearch Service 域。
开始使用
Well-Architected 支柱
当您在云中构建系统时,AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。框架的六大支柱使您能够学习设计和操作可靠、安全、高效、经济高效且可持续的系统的架构最佳实践。使用 AWS 管理控制台中免费提供的 AWS Well-Architected Tool,您可以通过回答每个支柱的一组问题,根据这些最佳实践来检查您的工作负载。
上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。
-
卓越运营
Lambda、API Gateway 和 DynamoDB 会生成 Amazon CloudWatch 日志文件,用于跟踪将新文档摄取到知识库的操作步骤。CloudWatch 还跟踪基于 Web 的用户聊天会话的交互、构造提示和调用生成式人工智能模型。记录处理管道的每个阶段对于识别错误和保持聊天机器人的可用性和性能至关重要,您可以使用这些日志文件(以及其他集成工具,如 AWS X-Ray)来跟踪实施错误以解决问题。DynamoDB 表格还会跟踪个人用户的聊天历史记录和文档摄取状态。您可以使用这些表(以及时间点恢复)来重新创建错误状态。本指南为用户对生成的每项技术响应提供直接反馈的机制,以便定期调整模型并提供实现业务目标的策略。
-
安全性
Amazon VPC 提供了一个在逻辑上隔离其所有资源的虚拟网络,只有获得授权的用户和服务才能访问本指南中的资源。本指南将 Lambda、OpenSearch Service 和 SageMaker 部署到 VPC 中并使用 VPC 端点,这样这些服务就可以在不遍历公共互联网的情况下安全地与 AWS 管理的函数(如 API Gateway)进行通信。SageMaker、Amazon Bedrock 和 Amazon Q Business 存储 LLM 聊天记录;相关数据保留在您的私人账户中,永远不会输入公共 LLM 存储库。Amazon Bedrock 的防护机制还可以防止 LLM 显示任何未经授权或不当的内容。
-
可靠性
Amazon S3 允许您存储具有极高耐久性的技术知识库文档。DynamoDB 提供本机备份、还原和时间点恢复,因此您可以在出现中断时快速恢复操作。所有这些服务完全由 AWS 管理,以实现高可靠性和可用性;例如,DynamoDB 会在单独的可用区自动创建所有表的三个副本。
-
性能效率
Amazon Bedrock、Amazon Q、Lambda 和 DynamoDB 都是完全托管的服务,因此您无需选择实例类型或管理扩展。此外,它们都是无服务器的,因此它们会自动扩展容量以满足需求。这些服务托管 LLM,通过代理实施工作流,管理知识库并存储文档元数据和聊天历史记录。此外,Lambda 支持高度的并发性,因此技术人员的助手可以同时支持大量用户。
-
成本优化
通过使用 Amazon S3 Intelligent-Tiering,您可以定制文档存储保留政策。例如,您可以自动将不经常访问的文档移至成本较低的层级,例如 Amazon S3 Glacier Instant Retrieval。DynamoDB 支持生存时间(TTL)功能,该功能可自动从您的表格中删除旧条目(例如过期的聊天历史记录),这样它们就不会消耗写入带宽。通过使用这些服务和功能,您可以将知识库的经常性存储成本降至最低。所有计算服务都使用即用即付模式,并且成本直接随着您使用技术人员助手聊天机器人的情况而增加;因此,您可以通过不过度预调配容量的方式来节省开支。
-
可持续性
Amazon S3、DynamoDB、Amazon Q、Amazon Bedrock 和 Lambda 是完全托管的服务,可根据需求自动扩展其资源的分配。此外,Amazon S3 支持 S3 Intelligent-Tiering 策略,DynamoDB 支持 TTL 功能。您可以使用这些选项自动删除未使用的数据(例如文档或会话历史记录),以最大限度地减少存储空间,从而降低碳足迹。此外,本指南根据需求扩展计算资源,以帮助您避免能源浪费。
相关内容
免责声明
示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。
本指南中提及第三方服务或组织并不意味着 Amazon 或 AWS 与第三方之间存在认可、赞助或从属关系。AWS 的指导是一个技术起点,您可以在部署架构时自定义与第三方服务的集成。