Pour choisir les instances Amazon EC2 Trn1 ?
Optimisées par les puces AWS Trainium, les instances Amazon Elastic Compute Cloud (EC2) Trn1 sont spécialement conçues pour l’entraînement deep learning (DL) à hautes performances de modèles d’IA générative, notamment de grands modèles de langage (LLM) et des modèles de diffusion latente. Les instances Trn1 permettent d’économiser jusqu’à 50 % sur les coûts d’entraînement par rapport à d’autres instances Amazon EC2 comparables. Vous pouvez utiliser les instances Trn1 pour entraîner plus de 100 milliards de paramètres DL et des modèles d’IA générative dans un large éventail d’applications telles que la synthèse de texte, la génération de code, la réponse à des questions, la génération d’images et de vidéos, la recommandation et la détection des fraudes.
Le kit SDK AWS Neuron aide les développeurs à entraîner des modèles sur AWS Trainium (et à déployer des modèles sur les accélérateurs AWS Inferentia). Il s’intègre nativement avec des cadres tels que PyTorch et TensorFlow, afin que vous puissiez continuer à utiliser votre code et vos flux de travail existants pour entraîner des modèles sur des instances Trn1. Pour en savoir plus sur la prise en charge actuelle par Neuron des cadres et bibliothèques de machine learning (ML), des architectures de modèles et des optimisations matérielles, consultez la documentation de Neuron.
Présentation des instances Amazon EC2 Trn1 basées sur AWS Trainium
Avantages
Caractéristiques
Témoignages des clients et des partenaires
Voici quelques exemples de la manière dont les clients et partenaires ont atteint leurs objectifs métier grâce aux instances Amazon EC2 Trn1.
-
Databricks
Plus de 10 000 organisations dans le monde, dont Comcast, Condé Nast et plus de 50 % des entreprises du Fortune 500, font confiance à Databricks pour unifier leurs données, leurs analyses et leur IA.
-
Stockmark Co., Ltd
Avec pour mission de « réinventer le mécanisme de création de valeur et de faire progresser l’humanité », Stockmark aide de nombreuses entreprises à créer et à développer des activités innovantes en fournissant une technologie de pointe en matière de traitement du langage naturel.
-
RICOH
RICOH propose des solutions d’environnement de travail et des services de transformation numérique conçus pour gérer et optimiser le flux d’informations entre les entreprises.
-
HeliXon
-
Money Forward, Inc.
Money Forward, Inc. sert les entreprises et particuliers au moyen d'une plateforme financière ouverte et juste.
-
Magic
Magic est une société intégrée de produits et de recherche qui développe une IA qui se présente comme un collègue chargé de rendre le monde plus productif.
-
Cactus Communications
CACTUS propose une gamme de produits et de solutions destinés aux chercheurs et aux organisations qui améliorent la manière dont la recherche est financée, publiée, communiquée et découverte.
-
Watashiha
Watashiha propose un service de chatbot intelligent innovant et interactif, appelé « OGIRI AI », qui intègre l'humour pour donner une réponse amusante et instantanée à une question.
-
PyTorch
-
Hugging Face
-
Amazon
Mise en route
Informations sur le produit
Taille de l’instance | Puces Trainium |
Accélérateur Mémoire (Go) |
vCPU | Instance Mémoire (Gio) |
Local NVMe Stockage (To) |
Réseau Bande passante (Gbit/s) |
EFA et RDMA Support |
EBS Bande passante (Gbit/s) |
À la demande Tarif horaire |
1 an Réservée Instance Efficace Tarif horaire* |
3 ans Réservée Instance Efficace Tarif horaire* |
trn1.2xlarge | 1 | 32 | 8 | 32 | 0,5 | Jusqu'à 12,5 | Non | Jusqu'à 20 | 1,34 USD | 0,79 USD | 0,4744 USD |
trn1.32xlarge | 16 | 512 | 128 | 512 | 8 | 800 | Oui | 80 | 21,50 USD | 12,60 USD | 7,59 USD |
trn1n.32xlarge |
16 | 512 | 128 | 512 | 8 | 1 600 | Oui | 80 | 24,78 USD | 14,52 USD | 8,59 USD |