Amazon SageMaker Ground Truth 常见问题

页面主题

一般性问题

一般性问题

人机闭环是在整个机器学习生命周期中利用人类输入来提高模型的准确性和相关性的过程。人类可以执行从数据生成和注释到模型审查、定制和评估等各种任务。人类干预对于生成式人工智能应用尤其重要,人类通常既是内容的请求者又是内容的消费者。因此,人类训练基础模型(FM)如何准确、安全和相关的响应用户的提示至关重要。可以应用人类反馈来帮助您完成多项任务。首先,通过有监督学习(人类模拟模型应如何响应用户提示的风格、长度和准确性)和提供人类反馈的强化学习(人类对模型响应进行排名和分类)为生成式人工智能应用程序创建高质量的标记训练数据集。其次,使用人工生成的数据针对特定任务或使用您的公司和领域特定数据来定制 FM,并使模型输出与您相关。最后,通过人工评估和比较来选择最适合您的应用场景和项目要求的 FM。

Amazon SageMaker Ground Truth 提供最全面的人机交互功能。有两种使用 Amazon SageMaker Ground Truth 的方法:自助式产品和 AWS 托管产品。在自助式产品中,您的数据注释者、内容创建者和提示工程师(内部、供应商管理或利用公共人群)可以使用我们的低代码用户界面来加速人机闭环任务,同时可以灵活地构建和管理您自己的自定义工作流程。在 AWS 托管的产品(SageMaker Ground Truth Plus)中,我们为您处理繁重的工作,包括为您的使用案例选择和管理合适的员工。SageMaker Ground Truth Plus 设计和定制端到端工作流程(包括详细的员工培训和质量保证步骤),并提供熟练的 AWS 管理团队,该团队接受过特定任务方面的培训,并满足您的数据质量、安全性和合规性要求。

人机闭环功能在创建和改进由 FM 提供支持的生成式人工智能应用程序方面发挥重要作用。接受过任务指南培训的高技能员工可以在一些活动中提供反馈、指导、意见和评测,例如生成演示数据以训练 FM、纠正和改进样本响应、根据公司和行业数据微调模型、通过行动防范毒舌和偏见,等等。因此,人机闭环功能可以提高模型的准确性和性能。

要开始使用 Amazon SageMaker Ground Truth Plus(AWS 托管产品),请先填写项目要求表。我们的团队将与您联系,讨论您的人机闭环项目。

要开始使用 Amazon SageMaker Ground Truth(自助服务),只需登录 AWS 管理控制台并导航到 SageMaker 控制台即可。从此处选择 Ground Truth 下的标记作业。您可以在此创建一项标记作业。首先,作为标记作业创建流程的一部分,您要提供指向包含待标记数据集的 S3 存储桶的指针。Ground Truth 提供了常见标记任务的模板,您只需点击几个选项并提供有关如何标记您数据的最低限度的指示。或者,您可以创建您自己的自定义模板。作为创建标记作业的最后一步,您可以选择以下三种劳动力选项之一:(1) 公共众包人力;(2) 精选的数据标记服务提供商组合,或 (3) 引入您自己的员工。您还可以选择启用自动化数据标记。

默认情况下,Amazon SageMaker Ground Truth 会对存储于 Amazon S3 存储桶中的静态和传输中数据进行加密。另外,它会使用 AWS Identity and Access Management(IAM)控制对您的数据的访问。SageMaker Ground Truth 不会在您的 AWS 环境(由您创建或通过 AWS 托管服务创建)之外存储或复制您的数据,您的数据仍处于您的控制之中。此外,Ground Truth 还支持通用数据保护条例(GDPR)等合规标准,并使用 Amazon CloudWatch 和 Amazon CloudTrail 记录和审核对数据的所有访问。有关更多信息,请访问 Amazon SageMaker Ground Truth 文档

借助 Amazon SageMaker Ground Truth Plus(AWS 托管产品),您可以根据需要联系接受过特定人工智能/机器学习任务培训的专家,他们可以根据特定的项目要求动态地向上或向下扩展您的工作流,并且可以帮助满足您对数据质量、安全性和合规性的要求。我们的团队将与您合作,了解您的项目所需的技能,并为其配备合适的员工。

有关最新的定价信息,请参阅 SageMaker Ground Truth 定价页面。SageMaker Ground Truth Plus 项目单独定价,我们的团队将在您提交项目需求表后,与您一起审查定价选项。AWS 区域表列出了当前已推出 Amazon SageMaker Ground Truth 的所有 AWS 区域。