跳至主要内容

Amazon Nova Forge

使用 Nova 构建自己的前沿模型

Amazon Nova Forge:使用 Nova 构建自己的前沿模型

Nova Forge 是一项新服务,供您使用 Nova 构建自己的前沿模型。Nova Forge 客户可以从早期的模型检查点开始开发,将专有数据与 Amazon Nova 策管的训练数据混合在一起,并将其自定义模型安全地托管在 AWS 上。

Nova Forge 是非常简单、极具成本效益的方式,供您构建自己的前沿模型。

优势

在预训练、训练中期或训练后阶段,使用早期的 Nova 检查点,在 SageMaker AI 上开始自定义模型开发。这样您就可以在模型训练的最佳点引入您的专有数据,从而最大限度地利用模型从数据中学习。

使用 Amazon 提供的 SageMaker 配方,将专有数据与 Amazon Nova 策管的训练数据混合在一起。这种方法可以让您构建一个深刻理解组织专有知识的模型,同时最大限度地降低灾难性遗忘等风险,保留推理等基础功能。

在您的环境中集成奖励功能以进行强化微调(RFT)。这样模型就可以在您的环境中从应用程序生成的反馈中学习。

使用 Nova Forge 中提供的负责任的人工智能工具包来配置自定义模型的安全和内容审核设置。您可以调整设置,进而满足您在安全、安保和操作等领域的特定业务需求。

抢先体验包括 Nova 2 Pro 和 Nova 2 Omni 在内的全新 Nova 模型,保持在人工智能技术的最前沿。

所有模型训练阶段的控制和灵活性

在训练的最初阶段最大限度地学习

拥有大量非结构化数据的客户可以通过持续预训练(CPT)引入数据。从预训练的检查点开始,可确保在模型处于学习新领域的高峰期时将新数据集引入模型,同时混合 Nova 训练数据,进而最大限度地降低诸如灾难性遗忘基础功能之类的风险。

aws-library_illustration_data_12_1200

使用专业数据集增强模型功能

对于拥有中等数量非结构化数据的客户,Nova Forge 提供了模型检查点和配方,用于在训练中引入数据,在训练中,从新训练数据中学习的倾向不如预训练中那么高。与预训练一样,客户可以在训练中期将自己的专有数据与 Amazon Nova 策管的训练数据混合在一起。  这样模型就能够吸收特定领域的知识,同时保留语言理解和推理等通用功能,但学习速率更为保守,以避免灾难性遗忘。 

aws-library_illustration_data_5_1200

通过 SFT 和数据混合生成针对特定应用程序的有效响应

有监督微调使用带有标签的数据(例如指令响应数据集)来教模型如何响应查询模式。客户可以选择在其创建的自定义基础检查点、Nova 的预构建基础检查点或 Nova 的指令调整模型上运行有监督微调,具体取决于他们的需求和训练数据的可用性。与 CPT 一样,在有监督微调期间,客户可以将自己的专有数据与 Amazon Nova 策管的带标签数据集混合在一起。这样客户就能够为其专业应用程序训练模型,同时保持广泛的模型功能,例如指令跟踪。

aws-library_illustration_data_3_1200

最大限度地提高准确性,使模型与现实世界的反馈和模拟保持一致

强化学习(RL)使用奖励信号和人工反馈进一步细化模型的行为。在 RL 阶段,Nova Forge 客户可以使用来自远程奖励功能的反馈调整其模型。这样他们就能够在对齐期间通过 API 使用来自自定义环境的反馈以及专有工具和验证器。与小型 Python 文件中定义的简单奖励功能的行业标准不同,这种基于 API 的方法使客户能够集成复杂的自定义环境工具并大规模运行这些工具。自定义奖励功能的示例包括物理模拟器、使用带有嵌套工具调用的内部系统的复杂代码评估,以及针对专有测试框架的机器人任务。

aws-library_illustration_data_7_1200

Nova 自定义和训练功能

Missing alt text value
与 Nova Forge 合作,我们能够通过更加统一的系统改善 Reddit 上的内容审核,该系统已经取得了令人印象深刻的成果。我们正在用单一、更准确的解决方案取代许多不同的模型,从而提高审核效率。能够用一种统一的方法取代多个专业机器学习工作流程,这标志着我们在 Reddit 上实施和扩展人工智能的方式发生了转变。在看到我们在安全工作中取得的这些早期成功之后,我们渴望探讨 Nova Forge 如何在其他业务领域提供帮助。

Chris Slowe

Reddit 首席技术官
www.reddit.com
Missing alt text value
我们正在使用 Nova Forge 构建一个统一的药物发现助手,该助手可以预测分子特性,推理化学问题,并生成新的候选药物。在实验室进行测试之前,通过计算探索成千上万的候选药物(每个实验的成本高达数千),我们可以更快地为患者提供更好的药物,同时降低成本。通过使用 Nova 2 Lite 进行有监督微调和强化微调,我们在属性预测任务上的表现已经比 Sonnet 4 等现有的大型语言模型高出 20-50%;在相同任务上超过或匹配几个专门的 GNN 模型的性能,我们现在正进入分子生成领域。

Leela Dodda

Nimbus Therapeutics 计算化学总监
www.nimbustx.com
Missing alt text value
借助 Nova Forge,我们能够构建特定于行业的 LLM,作为开放权重模型的有吸引力的替代方案。在带有托管训练基础设施的 SageMaker AI 上运行,通过将 Amazon Nova 策管的数据与我们的专有数据集相结合,我们可以高效地开发专业模型,例如我们的日本金融服务 LLM。

Takahiko Inaba

Nomura Research Institute, Ltd. 人工智能负责人兼董事总经理
www.nri.com
Missing alt text value
在 Cosine AI,我们通过强化微调不断突破软件开发代理的界限。我们共同设计了 Nova Forge 基于 API 的方法,这样我们就能够使用内部工具和模型环境来学习和优化您的业务面临的确切挑战,这是我们实现先进水平的关键组成部分。

Yang Li

Cosine AI 联合创始人 – Cosine AI 联合创始人 Yang Li
www.cosine.sh
Missing alt text value
我们正在利用 Nova Forge 计划为我们多样化的业务和运营构建先进的人工智能。在索尼集团,我们正在挑战自己,使用由 Nova Forge 开发的模型提供支持的人工智能代理,将审核和评测过程的效率提高 100 倍。通过强化微调,早期的结果表明,我们的性能超过了大型模型,同时受益于 Nova 的低延迟和性价比。

Masahiro Oba

索尼集团公司数字与技术平台人工智能加速部高级总经理
www.sony.com
Missing alt text value
Nova 2 Lite 使我们能够开发下一代对话体验,重塑用户与西门子网站的交互方式。利用 Nova 的微调功能,我们可以优化检索增强生成(RAG)系统的上下文输出,完善工具调用的相关性,并提高搜索结果的整体准确性。

Fabian Fischer

西门子企业架构师
www.siemens.com

找到今天要查找的内容了吗?

请提供您的意见,以便我们改进网页内容的质量。