Instans Amazon EC2 G5

Instans berbasis GPU performa tinggi untuk aplikasi intensif grafis dan inferensi machine learning

Instans Amazon EC2 G5 adalah generasi terbaru dari instans berbasis GPU NVIDIA yang dapat digunakan untuk berbagai kasus penggunaan intensif grafis dan machine learning. Mereka memberikan performa hingga 3x lebih baik untuk aplikasi intensif grafis dan inferensi machine learning dan performa hingga 3,3x lebih tinggi untuk pelatihan machine learning dibandingkan dengan instans Amazon EC2 G4dn.

Pelanggan dapat menggunakan instans G5 untuk aplikasi intensif grafis seperti stasiun kerja jarak jauh, rendering video, dan game untuk menghasilkan grafis fidelitas tinggi secara waktu nyata. Dengan instans G5, pelanggan machine learning mendapatkan performa tinggi dan infrastruktur hemat biaya untuk melatih dan men-deploy model yang lebih besar dan lebih canggih untuk pemrosesan bahasa alami, penglihatan komputer, dan kasus penggunaan mesin rekomendasi.

Instans G5 menampilkan hingga 8 GPU NVIDIA A10G Tensor Core dan prosesor AMD EPYC generasi kedua. Instans ini juga mendukung hingga 192 vCPU, bandwidth jaringan hingga 100 Gbps, dan penyimpanan NVMe SSD lokal hingga 7,6 TB.

Instans Amazon EC2 G5 Baru (1:20)

Keuntungan

Performa tinggi untuk aplikasi intensif grafis

Instans G5 menghadirkan performa grafis hingga 3x lebih tinggi dan performa harga hingga 40% lebih baik daripada instans G4dn. Mereka memiliki lebih banyak inti ray tracing daripada EC2 instance berbasis GPU lainnya, memiliki memori 24 GB per GPU, dan mendukung teknologi NVIDIA RTX. Ini membuatnya ideal untuk merender adegan realistis dengan lebih cepat, menjalankan stasiun kerja virtual yang kuat, dan mendukung aplikasi grafis berat dengan fidelitas yang lebih tinggi.

Performa tinggi dan efisiensi biaya untuk inferensi ML

Instans G5 menghadirkan performa hingga 3x lebih tinggi dan performa harga hingga 40% lebih baik untuk inferensi machine learning dibandingkan dengan instans G4dn. Instans ini adalah solusi berperforma tinggi dan hemat biaya bagi pelanggan yang ingin menggunakan perpustakaan NVIDIA seperti TensorRT, CUDA, dan cuDNN untuk menjalankan aplikasi ML mereka.

Pelatihan hemat biaya untuk model ML yang cukup rumit

Instans G5 menawarkan biaya pelatihan hingga 15% lebih rendah daripada instans P3 Amazon EC2. Mereka juga memberikan performa hingga 3,3x lebih tinggi untuk pelatihan ML dibandingkan dengan instans G4dn. Ini menjadikannya solusi hemat biaya untuk melatih model machine learning simpul tunggal yang cukup kompleks untuk pemrosesan bahasa alami, penglihatan komputer, dan kasus penggunaan mesin rekomendasi.

Efisiensi sumber daya yang dimaksimalkan

Instans G5 dibangun di AWS Nitro System, kombinasi perangkat keras khusus dan hypervisor ringan yang memberikan hampir semua sumber daya komputasi dan memori perangkat keras host ke instans Anda untuk keseluruhan performa dan keamanan yang lebih baik. Dengan instans G5, sistem Nitro menyediakan GPU dalam mode pass-through, memberikan performa yang sebanding dengan bare-metal.

Fitur

AWS NVIDIA A10G Tensor Core GPU

Instans G5 adalah yang pertama di cloud yang menampilkan GPU NVIDIA A10G Tensor Core yang menghadirkan performa tinggi untuk aplikasi machine learning dan grafis yang intensif. Setiap instans memiliki hingga 8 GPU Tensor Core A10G yang dilengkapi dengan 80 ray tracing core dan memori 24 GB per GPU. Instans ini juga menawarkan 320 NVIDIA Tensor Cores generasi ketiga yang menghadirkan hingga 250 TOPS yang menghasilkan performa tinggi untuk beban kerja ML.

Driver NVIDIA

Instans G5 menawarkan driver NVIDIA RTX Enterprise dan driver game kepada pelanggan tanpa biaya tambahan. Driver NVIDIA RTX Enterprise dapat digunakan untuk menyediakan stasiun kerja virtual berkualitas tinggi untuk berbagai beban kerja intensif grafis. Driver game NVIDIA menyediakan grafis tak tertandingi dan dukungan komputasi untuk pengembangan game. Instans G5 juga mendukung pustaka CUDA, cuDNN, NVENC, TensorRT, cuBLAS, OpenCL, DirectX 11/12, Vulkan 1.1, dan OpenGL 4.5.

Jaringan dan penyimpanan performa tinggi

Instans G5 hadir dengan throughput jaringan hingga 100 Gbps yang memungkinkannya mendukung kebutuhan latensi rendah dari inferensi machine learning dan aplikasi intensif grafis. Memori 24 GB per GPU bersama dengan dukungan hingga 7,6 TB penyimpanan NVMe SSD lokal memungkinkan penyimpanan lokal model besar dan set data untuk pelatihan dan inferensi machine learning performa tinggi. Instans G5 juga dapat menyimpan file video besar secara lokal yang menghasilkan peningkatan performa grafis dan kemampuan untuk merender file video yang lebih besar dan lebih kompleks.

Dibangun di AWS Nitro System

Instans G5 dibangun di AWS Nitro System, yang merupakan kumpulan blok penyusun yang kaya yang memindahkan banyak fungsi virtualisasi tradisional ke perangkat keras dan perangkat lunak khusus untuk menghadirkan performa tinggi, ketersediaan tinggi, dan keamanan tinggi sekaligus mengurangi kelebihan virtualisasi.

Detail produk

  Ukuran Instans GPU Memori GPU (GiB) vCPU Memori (GiB) Penyimpanan (GB) Bandwidth Jaringan (Gbps) Bandwidth EBS (Gbps) Harga Sesuai Permintaan/jam* ISP 1 Tahun Efektif Per Jam (Linux) ISP 3 Tahun Efektif Per Jam (Linux)
VM GPU tunggal g5.xlarge 1 24 4 16 1x250 Hingga 10 Hingga 3,5 1,006 USD 0,604 USD 0,402 USD
g5.2xlarge 1 24 8 32 1x450 Hingga 10 Hingga 3,5 1,212 USD 0,727 USD 0,485 USD
g5.4xlarge 1 24 16 64 1x600 Hingga 25 8 1,624 USD 0,974 USD 0,650 USD
g5.8xlarge 1 24 32 128 1x900 25 16 2,448 USD 1,469 USD 0,979 USD
g5.16xlarge 1 24 64 256 1x1900 25 16 4,096 USD 2,458 USD 1,638 USD
                       
VM Multi-GPU g5.12xlarge 4 96 48 192 1x3800 40 16 5,672 USD 3,403 USD 2,269 USD
g5.24xlarge 4 96 96 384 1x3800 50 19 8,144 USD 4,886 USD 3,258 USD
g5.48xlarge 8 192 192 768 2x3800 100 19 16,288 USD 9,773 USD 6,515 USD

* Harga yang ditampilkan adalah untuk Wilayah AWS AS Timur (Virginia Utara). Harga untuk instans terpesan 1 tahun dan 3 tahun adalah untuk opsi pembayaran "Sebagian di Muka" atau "Tanpa Uang Muka" untuk instans tanpa opsi Sebagian di Muka.

Testimoni pelanggan

Logo Athenascope

Athenascope menggunakan perkembangan mutakhir dalam penglihatan komputer dan kecerdasan buatan untuk menganalisis alur permainan dan secara otomatis memunculkan momen permainan yang paling menarik untuk membuat video sorotan bagi para pemain game dan pembuat konten.

“Untuk menciptakan pengalaman video yang mulus, analisis video latensi rendah menggunakan model CV kami adalah tujuan mendasar bagi kami. Instans Amazon EC2 G5 menawarkan peningkatan 30% dalam harga/performa dibandingkan penerapan sebelumnya dengan instans G4dn.”

Chris Kirmse, CEO & Pendiri, Athenascope

Netflix

Netflix adalah salah satu layanan hiburan streaming terkemuka di dunia dengan 214 juta keanggotaan berbayar di lebih dari 190 negara yang menikmati serial TV, dokumenter, dan film layar lebar dalam berbagai genre dan bahasa. 

“Membangun studio di cloud untuk membuat animasi, efek visual, dan konten aksi langsung untuk penonton kami telah menjadi prioritas bagi kami. Kami ingin memberi artis fleksibilitas untuk mengakses stasiun kerja kapan pun dan di mana pun mereka membutuhkannya. Kami terus mencari cara untuk membantu artis kami berinovasi dengan menawarkan mereka akses ke workstation yang lebih kuat.”

Stephen Kowalski, Direktur Teknik Infrastruktur Produksi Digital, Netflix

“Dengan instans Amazon EC2 G5 baru, kami dapat menyediakan stasiun kerja grafis kelas atas yang menawarkan perfoma hingga 3x lebih tinggi dibandingkan dengan stasiun kerja dengan instans EC2 G4dn. Dengan instans G5, pembuat konten memiliki kebebasan untuk membuat konten yang lebih kompleks dan realistis bagi penonton kami.”

Ben Tucker, Pimpinan Teknis, Teknik Sistem Produksi Animasi, Netflix

Varjo
"Untuk aplikasi VR/XR kelas atas, instans Amazon EC2 G5 adalah pengubah permainan. Kami dapat menjalankan aplikasi profesional dalam resolusi mata manusia khas Varjo dengan kecepatan frame rate tiga kali lipat dibandingkan dengan instans G4dn yang digunakan sebelumnya, memberi pelanggan kami kualitas pengalaman yang belum pernah dilihat sebelumnya saat streaming dari server.” 

Urho Konttori, Founder dan Chief Technology Officer, Varjo

Baca studi kasus »

Memulai

AWS Deep Learning AMIs (DLAMI) dan AWS Deep Learning Containers (DLC)

AWS Deep Learning AMIs (DLAMI) dan AWS Deep Learning Containers (DLC) memberikan citra mesin dan kontainer yang telah diinstal sebelumnya dengan kerangka kerja deep learning kepada Ilmuwan Data, praktisi ML, dan peneliti untuk memudahkan memulai dengan memungkinkan Anda melewati proses yang rumit saat membangun dan mengoptimalkan lingkungan perangkat lunak dari awal. SDK SynapseAI SDK untuk akselerator Gaudi terintegrasi ke AWS DL AMI dan DLC yang memungkinkan Anda mulai menggunakan instans DL1 dengan cepat.

Amazon Elastic Kubernetes Service (EKS) atau Elastic Container Service (ECS)

Pelanggan yang lebih memilih untuk mengelola beban kerja kontainer mereka sendiri melalui layanan orkestrasi kontainer bisa men-deploy instans DL1 dengan Amazon EKS atau ECS.

Sumber daya tambahan

Demo: Model deep learning pelatihan menggunakan instans DL1 Amazon EC2 (2:03)
Memperkenalkan Instans DL1 Amazon EC2 (3:41)
Perbandingan biaya pelatihan DL1 Amazon EC2 (0:50)
Mulai menggunakan instans DL1 Amazon EC2 dengan mudah (0:49)

Dokumentasi Gaudi® Habana® v0.15

Kunjungi dokumentasi »

Forum developer Habana®

Kunjungi forum »

Repositori GitHub Habana®

Kunjungi GitHub »

Sumber daya

Lembaran data

NVIDIA A10G tensor core GPU: Percepatan komputasi dan grafis untuk cloud AWS

Memulai dengan AWS

Mendaftar akun AWS

Mendaftar akun AWS

Dapatkan akses secara instan ke AWS Tingkat Gratis.

Pelajari dengan tutorial sederhana

Pelajari dengan tutorial 10 menit

Jelajahi dan pelajari dengan tutorial sederhana.

Mulai membangun dengan EC2 di konsol

Mulai membangun di konsol

Mulai membangun dengan panduan langkah demi langkah untuk membantu Anda meluncurkan proyek AWS.