Pourquoi choisir les instances Amazon EC2 Trn2 et les UltraServers ?
Les instances Amazon EC2 Trn2, alimentées par 16 puces AWS Trainium2, sont spécialement conçues pour l’IA générative et sont les instances EC2 les plus puissantes pour la formation et le déploiement de modèles comportant des centaines de milliards à plus de billions de paramètres. Les instances Trn2 offrent un rapport qualité/prix supérieur de 30 à 40 % à celui de la génération actuelle d’instances EC2 P5e et P5en basées sur GPU. Avec les instances Trn2, vous pouvez bénéficier de performances d’entraînement et d’inférence de pointe tout en réduisant les coûts, ce qui vous permet de réduire les temps de formation, d’itérer plus rapidement et de proposer des expériences en temps réel alimentées par l’IA. Vous pouvez utiliser les instances Trn2 pour entraîner et déployer des modèles, notamment des grands modèles de langage (LLM), des modèles multimodaux et des transformeurs de diffusion afin de créer des applications d’IA génératives de nouvelle génération.
Pour réduire les temps d’entraînement et fournir des temps de réponse révolutionnaires (latence par jeton) pour les modèles les plus exigeants et les plus modernes, vous pourriez avoir besoin de plus de calcul et de mémoire que ce qu’une seule instance peut fournir. Les serveurs Trn2 UltraServer utilisent NeuronLink, une interconnexion puce à puce propriétaire, pour connecter 64 puces Trainium2 sur quatre instances Trn2, quadruplant ainsi la bande passante du réseau, de mémoire et de réseau disponible sur un seul nœud et offrant des performances révolutionnaires sur AWS pour le deep learning et les charges de travail d’IA génératives. À titre d’inférence, les UltraServers contribuent à fournir un temps de réponse de pointe afin de créer les meilleures expériences en temps réel. En matière d’entraînement, les UltraServers augmentent la vitesse et l’efficacité de l’entraînement des modèles grâce à une communication collective plus rapide pour le parallélisme des modèles, par rapport aux instances autonomes.
Vous pouvez facilement démarrer sur les instances Trn2 et les serveurs Trn2 UltraServer grâce à la prise en charge native des cadres du machine learning (ML) courants tels que PyTorch et JAX.
Avantages
Caractéristiques
Témoignages de clients et de partenaires
Voici quelques exemples de la manière dont les clients et partenaires ont atteint leurs objectifs commerciales grâce aux instances Amazon EC2 Trn2.
-
Anthropic
-
Databricks
-
poolside
-
Itaú Unibanco
L’objectif d’Itaú Unibanco est d’améliorer la relation des gens par rapport à l’argent, en créant un impact positif sur leur vie tout en élargissant leurs possibilités de transformation. Chez Itaú Unibanco, nous pensons que chaque client est unique et nous nous attachons à répondre à leurs besoins grâce à des parcours numériques intuitifs, qui tirent parti de la puissance de l’IA pour s’adapter en permanence à leurs habitudes de consommation.
-
NinjaTech AI
Ninja est un agent d’IA complet pour une productivité illimitée : un simple abonnement, un accès illimité aux meilleurs modèles d’IA du monde ainsi qu’aux meilleures compétences d’IA telles que : l’écriture, le codage, le brainstorming, la génération d’images, la recherche en ligne. Ninja est une plateforme agentique qui propose « SuperAgent ». Cette plateforme utilise un mélange d’agents avec une précision de classe mondiale comparable (et dans certaines catégories, elle les surpasse) aux modèles de fondations pionnières. La technologie agentique de Ninja exige des accélérateurs les plus performants, afin d’offrir les expériences uniques en temps réel auxquelles nos clients s’attendent.
-
Ricoh
L’équipe de machine learning RICOH développe des solutions d’environnement de travail et des services de transformation numérique conçus pour gérer et optimiser le flux d’informations dans nos solutions d’entreprise.
-
PyTorch
-
Refact.ai
Refact.ai propose des outils d’IA complets tels que la saisie automatique du code alimentée par la génération augmentée par extraction (RAG), fournissant des suggestions plus précises et un chat contextuel utilisant à la fois des modèles propriétaires et open source.
-
Karakuri Inc.
-
Stockmark Inc.
-
Brave
-
Anyscale
Anyscale est la société à l’origine de Ray, un moteur de calcul basé sur l’IA qui alimente le ML et les initiatives d’IA générative pour les entreprises. Grâce à la plateforme d’IA unifiée d’Anyscale pilotée par RayTurbo, les clients constatent un traitement des données pouvant être 4,5 fois plus rapide, une inférence par lots 10 fois moins coûteuse avec les LLM, une mise à l’échelle 5 fois plus rapide, une itération 12 fois plus rapide et des économies de coûts de 50 % pour l’inférence de modèles en ligne grâce à l’optimisation de l’utilisation des ressources.
-
Datadog
-
Hugging Face
-
Lightning AI
Lightning AI, le créateur de PyTorch Lightning et de Lightning Studios, propose la plateforme de développement d’IA la plus intuitive et la plus complète pour l’IA d’entreprise. Lightning fournit des outils à code complet, à code réduit et sans code pour créer en toute rapidité des agents, des applications d’IA et des solutions d’IA générative. Conçu dans un souci de flexibilité, il fonctionne parfaitement sur votre cloud ou sur le nôtre en tirant parti de l’expertise et du soutien d’une communauté de développeurs forte de plus de 3 millions de personnes.
-
Domino Data Lab
Domino orchestre tous les artefacts de science des données, y compris l’infrastructure, les données et les services sur AWS dans tous les environnements, complétant ainsi Amazon SageMaker par des fonctionnalités de gouvernance et de collaboration destinées à soutenir les équipes de science des données des entreprises. Domino est disponible via AWS Marketplace en tant qu’offre SaaS ou en mode autogéré.
Mise en route
Informations sur le produit
Taille d’instance | Disponible dans EC2 UltraServers | Puces Trainium2 | Accélérateur mémoire |
vCPU | Mémoire (To) |
Storage d’instance (To) | Bande passante du réseau (Tbit/s) | Bande passante EBS (Go/s) |
trn2.48xlarge | Non | 16 | 1,5 To | 192 | 2 To | 4 SSD NVMe 1,92 | 3,2 | 80 |
trn2u.48xlarge | Oui (version préliminaire) | 16 | 1,5 To | 192 | 2 To | 4 SSD NVMe 1,92 | 3,2 | 80 |