為何選擇 Amazon EC2 UltraClusters?
Amazon Elastic Compute Cloud (Amazon EC2) UltraClusters 可協助您擴展至數千個 GPU 或專門打造的 ML AI 晶片 (例如 AWS Trainium),以取得超級電腦的隨需存取。它們透過依用量計費用量模型,不需任何設定或維護成本,為機器學習 (ML)、生成式 AI和高效能運算 (HPC) 開發人員將超級運算類別效能的存取大眾化。在 EC2 超群組中部署的 Amazon EC2 執行個體包括 P5en、P5e、P5、P4d、Trn2 和 Trn1 執行個體。
EC2 UltraClusters 由數千個加速 EC2 執行個體組成,共置在指定 AWS 可用區域,並且使用 PB 規模非阻攔式網路中的 Elastic Fabric Adapter (EFA) 網路互連。EC2 UltraClusters 也提供 Amazon FSx for Lustre 的存取,這是建置在最熱門高效能、平行檔案系統上的全受管共用儲存,快速隨需和大規模處理大量資料集,且延遲低於一毫秒。EC2 UltraCluster 為分散式 ML 訓練和緊密連接的 HPC 工作負載提供擴展功能。
優勢
功能
高效能聯網
高效能儲存
支援的執行個體
找到今天所需的資訊了嗎?
讓我們知道,以便我們改善頁面內容的品質。