Neden Amazon EC2 P5 Bulut Sunucuları?
NVIDIA H100 Tensor Core GPU'lar tarafından desteklenen Amazon Elastic Compute Cloud (Amazon EC2) P5 bulut sunucuları ve NVIDIA H200 Tensor Core GPU'lar tarafından desteklenen P5e bulut sunucuları, derin öğrenme (DL) ve yüksek performanslı bilgi işlem (HPC) uygulamaları için Amazon EC2'de en yüksek performansı sunar. Önceki nesil GPU tabanlı EC2 bulut sunucularına kıyasla çözüme ulaşma sürenizi 4 kata kadar hızlandırmanıza ve makine öğrenimi modellerini eğitme maliyetini %40'a kadar azaltmanıza yardımcı olurlar. Bu bulut sunucuları, çözümlerinizi daha hızlı bir şekilde yinelemenize ve pazara daha hızlı ulaşmanıza yardımcı olur. Giderek daha karmaşık hale gelen büyük dil modellerini (LLM'ler) ve en zorlu üretken yapay zeka (AI) uygulamalarını destekleyen dağıtım modellerini eğitmek ve dağıtmak için P5 ve P5e bulut sunucularını kullanabilirsiniz. Bu uygulamalar arasında soru yanıtlama, kod oluşturma, video ve görüntü oluşturma ve konuşma tanıma yer alır. Bu bulut sunucularını farmasötik keşif, sismik analiz, hava durumu tahmini ve finansal modelleme için zorlu HPC uygulamalarını geniş ölçekte dağıtmak amacıyla da kullanabilirsiniz.
Bu performans iyileştirmelerini ve maliyet tasarruflarını sağlamak için P5 ve P5e bulut sunucuları, önceki nesil GPU tabanlı bulut sunucularına kıyasla 2 kat daha yüksek CPU performansı, 2 kat daha yüksek sistem belleği ve 4 kat daha yüksek yerel depolama ile NVIDIA H100 ve H200 Tensor Core GPU'larını tamamlar. İkinci nesil Esnek Yapı Bağdaştırıcısı (EFAv2) kullanarak 3.200 Gbps'ye kadar ağ iletişimi ile dağıtılmış eğitim ve sıkı bir şekilde birleştirilmiş HPC iş yükleri için pazar lideri ölçeklendirme yetenekleri sağlarlar. P5 ve P5e bulut sunucuları, düşük gecikmeyle büyük ölçekli işlem sunmak için 20.000 H100 veya H200 GPU'ya kadar ölçeklendirmeye olanak tanıyan Amazon EC2 UltraClusters'a dağıtılır. Bunlar petabit ölçeğinde engellenemeyen bir ağ ile birbirine bağlıdır. EC2 UltraClusters'taki P5 ve P5e bulut sunucuları, 20 exaflop'a kadar toplam işlem kapasitesi sunabilir. Bu, süper bilgisayar performansına eş değerdir.
Amazon EC2 P5 Bulut Sunucuları
Avantajlar
Özellikler
Müşteri görüşleri
Müşterilerin ve çözüm ortaklarının, Amazon EC2 P4 bulut sunucularıyla işletme hedeflerine nasıl ulaştıklarına ilişkin bazı örnekleri aşağıda bulabilirsiniz.
-
Anthropic
Anthropic, ticari olarak ve kamu yararına değer yaratmak için birçok fırsata sahip olacak güvenilir, yorumlanabilir ve yönlendirilebilir yapay zeka sistemleri oluşturuyor.
-
Cohere
Dilde yapay zeka alanında lider bir öncü olan Cohere, her geliştiriciye ve kuruluşa, dünya lideri doğal dil işleme (NLP) teknolojisiyle inanılmaz ürünler oluşturma ve aynı zamanda verilerini gizli ve güvende tutma gücü veriyor
-
Hugging Face
Hugging Face'in misyonu, iyi makine öğrenimini demokratik hâle getirmek.
Ürün bilgileri
Bulut Sunucusu Boyutu | vCPU'lar | Bulut Sunucusu Belleği (TiB) | GPU | GPU belleği | Ağ Bant Genişliği (Gbps) | GPUDirect RDMA | GPU Eşler Arası | Bulut Sunucusu Depolama Alanı (TB) | EBS Bant Genişliği (Gbps) |
---|---|---|---|---|---|---|---|---|---|
p5.48xlarge | 192 | 2 | 8 H100 | 640 GB HBM3 |
3200 Gbps EFA | Evet | 900 GB/s NVSwitch | 8 x 3.84 NVMe SSD | 80 |
p5e.48xlarge | 192 | 2 | 8 H200 | 1128 GB HBM3e |
3200 Gbps EFA | Evet | 900 GB/s NVSwitch | 8 x 3.84 NVMe SSD | 80 |
ML kullanım örneklerini kullanmaya başlama
HPC kullanım örneklerini kullanmaya başlama
P5 bulut sunucuları mühendislik simülasyonları, hesaplamalı finans, sismik analiz, moleküler modelleme, genomik, görsel işleme ve benzeri, yoğun GPU tabanlı HPC iş yüklerini çalıştırmak için ideal bir platformdur. HPC uygulamaları genellikle yüksek ağ performansı, hızlı depolama, büyük miktarda bellek, çok yüksek kapasiteli işlem özellikleri ya da bunların hepsini birden gerektirir. P5 bulut sunucuları, HPC uygulamalarının binlerce GPU'ya ölçeklendirmek için Message Passing Interface'i (MPI) kullanmasını sağlayan EFAv2'yi destekler. AWS Toplu İşlem ve AWS ParallelCluster, HPC geliştiricilerinin dağıtılmış HPC uygulamalarını hızla oluşturmasına ve ölçeklendirmesine yardımcı olur.
Daha fazla bilgi edinin