Amazon EC2 P5 인스턴스를 사용해야 하는 이유
NVIDIA H100 Tensor Core GPU로 구동되는 Amazon Elastic Compute Cloud(Amazon EC2) P5 인스턴스와 NVIDIA H200 Tensor Core GPU로 구동되는 P5e 및 P5en 인스턴스는 딥 러닝(DL) 및 고성능 컴퓨팅(HPC) 애플리케이션을 위한 Amazon EC2에서 최고의 성능을 제공합니다. 이전 세대 GPU 기반 EC2 인스턴스 대비 솔루션 구현 시간을 최대 4배 앞당기고 ML 모델 훈련 비용을 최대 40%까지 절감할 수 있습니다. 이러한 인스턴스를 사용하면 솔루션을 더 빠르게 반복하여 시장에 더 빨리 출시할 수 있습니다. P5, P5e 및 P5en 인스턴스를 사용하여 점점 복잡해지는 대규모 언어 모델(LLM) 및 가장 까다로운 생성형 인공 지능(AI) 애플리케이션을 지원하는 확산 모델을 훈련하고 배포할 수 있습니다. 이러한 애플리케이션에는 질문 응답, 코드 생성, 비디오 및 이미지 생성, 음성 인식 등이 포함되어 있습니다. 또한 이러한 인스턴스를 사용하여 신약 발견, 지진 분석, 기상 예측, 금융 모델링을 위한 까다로운 HPC 애플리케이션을 대규모로 배포할 수 있습니다.
이러한 성능 개선 사항과 비용 절감을 위해 P5 및 P5e 인스턴스는 이전 세대 GPU 기반 인스턴스 대비 2배 더 뛰어난 CPU 성능, 2배 더 높은 시스템 메모리, 4배 더 많은 로컬 스토리지로 NVIDIA H100 및 H200 Tensor Core GPU를 보완합니다. P5en 인스턴스는 NVIDIA H200 Tensor Core GPU와 고성능 인텔 Sapphire Rapids CPU를 결합하여 CPU와 GPU 간의 Gen5 PCIe를 지원합니다. P5en 인스턴스는 P5e 및 P5 인스턴스에 비해 CPU와 GPU 간에 최대 2배의 대역폭을 제공하고 네트워크 지연 시간이 짧기 때문에 분산 훈련 성능이 향상됩니다. P5 및 P5e 인스턴스 지원은 2세대 Elastic Fabric Adapter(EFA)를 사용하여 최대 3,200Gbps의 네트워킹을 제공합니다. Nitro v5를 사용하는 3세대 EFA를 탑재한 P5en은 이전 세대의 EFA와 Nitro를 사용하는 P5에 비해 지연 시간이 최대 35% 개선되었습니다. 이를 통해 딥 러닝, 생성형 AI, 실시간 데이터 처리, 고성능 컴퓨팅(HPC) 애플리케이션과 같은 분산 훈련 워크로드의 집단 통신 성능을 개선할 수 있습니다. 짧은 지연 시간으로 대규모 컴퓨팅을 제공하기 위해 해당 인스턴스를 페타비트급 비차단 네트워크와 상호 연결된 Amazon EC2 UltraClusters에 배포하여 H100 또는 H200 GPU를 최대 2만 개까지 확장할 수 있습니다. EC2 UltraClusters의 P5, P5e 및 P5en 인스턴스는 슈퍼컴퓨터와 동등한 성능인 최대 20엑사플롭스의 총 컴퓨팅 성능을 제공할 수 있습니다.
Amazon EC2 P5 인스턴스
이점
기능
고객 추천사
고객과 파트너가 Amazon EC2 P4 인스턴스를 사용하여 비즈니스 목표를 달성한 몇 가지 사례를 소개합니다.
-
Anthropic
Anthropic은 신뢰할 수 있고, 해석할 수 있으며, 조종 가능한 AI 시스템을 구축합니다. 이 시스템은 상업적으로나, 그리고 퍼블릭의 이익을 위하여 가치를 창출할 수 있는 많은 기회를 갖게 될 것입니다.
-
Cohere
언어 AI 분야의 선도적인 선구자인 Cohere는 모든 개발자와 기업이 데이터를 비공개로 안전하게 유지하면서 세계 최고의 자연어 처리(NLP) 기술을 사용하여 놀라운 제품을 만들 수 있도록 지원합니다.
-
Hugging Face
Hugging Face는 좋은 기계 학습의 대중화를 사명으로 삼고 있습니다.
제품 세부 정보
인스턴스 크기 | vCPU | 인스턴스 메모리(TiB) | GPU | GPU 메모리 | 네트워크 대역폭(Gbps) | GPUDirect RDMA | GPU P2P | 인스턴스 스토리지(TB) | EBS 대역폭(Gbps) |
---|---|---|---|---|---|---|---|---|---|
p5.48xlarge | 192 | 2 | H100 8개 | 640GB HBM3 |
3,200Gbps EFA | 예 | 900GB/s NVSwitch | 8 x 3.84 NVMe SSD | 80 |
p5e.48xlarge | 192 | 2 | H200 8개 | 1,128GB HBM3e |
3,200Gbps EFA | 예 | 900GB/s NVSwitch | 8 x 3.84 NVMe SSD | 80 |
p5en.48xlarge | 192 | 2 | H200 8개 | 1,128GB HBM3e | 3,200Gbps EFA | 예 | 900GB/s NVSwitch | 8 x 3.84 NVMe SSD | 100 |
ML 사용 사례 시작하기
HPC 사용 사례 시작하기
P5, P5e 및 P5en 인스턴스는 엔지니어링 시뮬레이션, 컴퓨팅 금융, 지진 분석, 분자 모델링, 유전체학, 렌더링 및 기타 GPU 기반 HPC 워크로드를 실행하기에 적합한 플랫폼입니다. HPC 애플리케이션에는 뛰어난 네트워크 성능, 빠른 스토리지, 대용량 메모리, 뛰어난 컴퓨팅 성능 또는 위의 모든 성능이 필요할 때가 많습니다. 세 가지 인스턴스가 모두 EFA를 지원하므로 메시지 전달 인터페이스(MPI)를 사용하여 수천 개의 GPU로 확장되는 HPC 애플리케이션을 지원할 수 있습니다. AWS Batch 및 AWS ParallelCluster는 HPC 개발 작업에서 분산 HPC 애플리케이션을 빠르게 구축하고 확장하는 데 도움이 됩니다.
자세히 알아보기