什么是 “Build on Trainium”?
“Build on Trainium” 是一项耗资 1.1 亿美元的投资计划,专注于人工智能研究和大学教育,旨在支持 AWS Trainium 的下一代创新和发展。AWS Trainium 是一款专为推进最先进的人工智能理念和应用而设计的人工智能脉动阵列芯片。“Build on Trainium” 资助在 Trainium 上进行的创新 AI 研究,投资领先的学术团队,在关键领域推动创新,包括新模型架构、机器学习库、优化、大规模分布式系统等。这项为期多年的计划激励学术界使用、投资和参与围绕 Trainium 的开源社区,为人工智能的未来奠定了基础。将这些优势与 Neuron 软件开发工具包(SDK)和最近推出的 Neuron Kernel 接口(NKI)相结合,Trainium 客户现在可以在云端进行大规模创新。
AWS Trainium 研究集群
我们已经创建了一个包含多达 40,000 个 Trainium 芯片的专用 Trainium 研究集群,用户可以通过 Amazon EC2 Trn1 实例访问该集群,而这些实例则通过 Amazon EC2 UltraClusters 连接在一个单一的非阻塞 PB 级网络上。研究团队和学生可以使用适用于 ML 的 Amazon EC2 容量块进行自管理容量块预留来访问这些芯片。
AWS 研究奖励
我们正在向广泛的研究界进行多轮亚马逊研究奖 (ARA) 提案征集 (CFP),入选的提案将获得 AWS Trainium 积分和可访问 Trainium 研究集群。请访问 ARA CFP 页面了解更多信息。“Build on Trainium” 欢迎那些利用流行开源机器学习库和框架的研究提案,并将研究成果回馈给开源社区,以增加机器学习开发者社区的资源。
Neuron Kernel 接口
Neuron Kernel 接口(NKI)是适用于 AWS 人工智能芯片 Trainium 和 Inferentia 的全新编程接口。NKI 提供对 AWS Trainium 和 Inferentia 上可用硬件原语和指令的直接访问,使研究人员能够构建和调整计算内核以实现最佳性能。它是一个基于 Python 的编程环境,采用常用的类似 Triton 的语法和图块级语义。研究人员可以使用 NKI 为深度学习模型增加新功能、优化性能,并推动科学创新。要了解更多信息,请访问 NKI 文档页面。
优势
参与的大学
以下是顶尖大学如何从 “Build on Trainium” 计划中受益。
-
Berkeley University of California
-
Carnegie Mellon University