Mengapa memilih Trainium?
Chip AWS Trainium adalah rangkaian chip AI yang dirancang khusus oleh AWS untuk pelatihan dan inferensi AI untuk memberikan performa tinggi sekaligus mengurangi biaya.
Chip AWS Trainium generasi pertama mendukung instans Trn1 Amazon Elastic Compute Cloud (Amazon EC2), yang memiliki biaya pelatihan hingga 50% lebih rendah daripada instans Amazon EC2 yang sebanding. Banyak pelanggan, termasuk Databricks, Ricoh, NinjaTech AI, dan Arcee AI, mengakui manfaat performa dan biaya instans Trn1.
Chip AWS Trainium2 memberikan performa hingga 4x dari Trainium generasi pertama. Instans Trn2 EC2 Amazon berbasis Trainium2 dibuat khusus untuk AI generatif dan merupakan instans EC2 paling andal untuk melatih dan melakukan deployment model dengan ratusan miliar hingga triliun+ parameter. Instans Trn2 menawarkan performa sesuai harga 30-40% lebih baik daripada instans EC2 P5e dan P5en berbasis GPU generasi saat ini. Instans Trn2 dilengkapi dengan 16 chip Trainium2 yang saling terhubung dengan NeuronLink, interkoneksi chip-ke-chip milik kami. Anda dapat menggunakan instans Trn2 untuk melatih dan men-deploy model dengan syarat ketat termasuk model bahasa besar (LLM), model multi-modal, dan transformator difusi untuk membangun serangkaian aplikasi AI generatif generasi berikutnya yang beragam. UltraServers Trn2, penawaran EC2 yang benar-benar baru (tersedia dalam pratinjau), cocok untuk model terbesar yang membutuhkan lebih banyak memori dan bandwidth memori daripada yang dapat disediakan oleh instans EC2 mandiri. Desain UltraServer menggunakan NeuronLink untuk menghubungkan 64 chip Trainium2 di empat instans Trn2 menjadi satu simpul, yang membuka kemampuan baru. Kesimpulannya, UltraServers membantu memberikan waktu respons terdepan di industri untuk menciptakan pengalaman waktu nyata terbaik. Untuk pelatihan, UltraServers meningkatkan kecepatan dan efisiensi pelatihan model dengan komunikasi kolektif yang lebih cepat untuk paralelisme model dibandingkan dengan instans mandiri.
Anda dapat memulai pelatihan dan deployment model pada instans Trn2 dan Trn1 dengan dukungan native untuk kerangka kerja machine learning (ML) populer. seperti PyTorch dan JAX.