Build on Trainium

一项耗资 1.1 亿美元的投资计划,旨在通过 AWS Trainium 加速人工智能研究和教育

什么是 “Build on Trainium”?

“Build on Trainium” 是一项耗资 1.1 亿美元的投资计划,专注于人工智能研究和大学教育,旨在支持 AWS Trainium 的下一代创新和发展。AWS Trainium 是一款专为推进最先进的人工智能理念和应用而设计的人工智能脉动阵列芯片。“Build on Trainium” 资助在 Trainium 上进行的创新 AI 研究,投资领先的学术团队,在关键领域推动创新,包括新模型架构、机器学习库、优化、大规模分布式系统等。这项为期多年的计划激励学术界使用、投资和参与围绕 Trainium 的开源社区,为人工智能的未来奠定了基础。将这些优势与 Neuron 软件开发工具包(SDK)和最近推出的 Neuron Kernel 接口(NKI)相结合,Trainium 客户现在可以在云端进行大规模创新。

数据图示

AWS Trainium 研究集群

我们已经创建了一个包含多达 40,000 个 Trainium 芯片的专用 Trainium 研究集群,用户可以通过 Amazon EC2 Trn1 实例访问该集群,而这些实例则通过 Amazon EC2 UltraClusters 连接在一个单一的非阻塞 PB 级网络上。研究团队和学生可以使用适用于 ML 的 Amazon EC2 容量块进行自管理容量块预留来访问这些芯片。

红色和紫罗兰色抽象纹理

AWS 研究奖励

我们正在向广泛的研究界进行多轮亚马逊研究奖 (ARA) 提案征集 (CFP),入选的提案将获得 AWS Trainium 积分和可访问 Trainium 研究集群。请访问 ARA CFP 页面了解更多信息。“Build on Trainium” 欢迎那些利用流行开源机器学习库和框架的研究提案,并将研究成果回馈给开源社区,以增加机器学习开发者社区的资源。

两个人在船上画画的插图

Neuron Kernel 接口

Neuron Kernel 接口(NKI)是适用于 AWS 人工智能芯片 Trainium 和 Inferentia 的全新编程接口。NKI 提供对 AWS Trainium 和 Inferentia 上可用硬件原语和指令的直接访问,使研究人员能够构建和调整计算内核以实现最佳性能。它是一个基于 Python 的编程环境,采用常用的类似 Triton 的语法和图块级语义。研究人员可以使用 NKI 为深度学习模型增加新功能、优化性能,并推动科学创新。要了解更多信息,请访问 NKI 文档页面。

黄色和紫色的几何形状、圆圈、三角形、正方形和线条的插图

优势

访问专用 AWS Trainium 研究集群,并使用世界一流的人工智能硬件和可扩展的云基础设施来支持您最宏大的研究项目。
构建性能优于现有架构和技术的创新和优化的计算内核,以突破生成式人工智能研究和开源创新的界限。构建高度优化的内核,以优化模型中最关键或最差异化的部分。
使用与 PyTorch 和 JAX 无缝集成的 Neuron SDK 轻松入门。Neuron Kernel 接口基于 Python 的编程环境采用常用的类似 Triton 的语法来帮助您快速上手。
与更广泛研究社区的 AWS 专家合作,扩大您的工作对现实世界的影响。

参与的大学

以下是顶尖大学如何从 “Build on Trainium” 计划中受益。

  • Berkeley University of California

    Trainium 超越了可编程的范畴——不仅可以运行程序,还可以通过低级访问来调整硬件本身的功能。架构中每一步都融入灵活性调节功能,使其成为研究的理想平台。AWS 确实在推动意想不到的创新。我走过实验室,每个项目都需要计算集群资源来实现不同的用途。“Build on Trainium” 资源将非常有用——从日常工作到我们在实验室进行的深入研究。

    Christopher Fletcher,加州大学伯克利分校计算机科学副教授
  • Carnegie Mellon University

    AWS 全新的 “Build on Trainium” 计划使我们的教职员工和学生能够大规模访问 AWS Trainium 等现代加速器,采用开放的编程模型,并使我们能够大幅扩展在张量程序编译、机器学习并行化、以及语言模型服务与调优方面的研究。

    Todd C. Mowry,卡内基梅隆大学计算机科学教授