¿Por qué elegir los UltraServers de Amazon EC2?

Los servidores UltraServer de Amazon Elastic Compute Cloud (Amazon EC2) son ideales para los clientes que buscan el máximo rendimiento de inferencia y entrenamiento de IA para modelos a una escala de un billón de parámetros. Los UltraServer conectan varias instancias de EC2 mediante una interconexión dedicada de acelerador de alto ancho de banda y baja latencia, lo que le permite aprovechar una red de aceleradores estrechamente acoplada en todas las instancias de EC2 y acceder a una cantidad considerable de mayor capacidad de cómputo y memoria que las instancias de EC2 independientes.

Los UltraServer de EC2 son ideales para los modelos más grandes que requieren más memoria y más ancho de banda de memoria que los que pueden proporcionar las instancias de EC2 independientes. El diseño de UltraServer utiliza la conectividad del acelerador entre instancias para conectar varias instancias en un nodo, lo que desbloquea nuevas capacidades. A modo de inferencia, los UltraServers ayudan a ofrecer un tiempo de respuesta líder en la industria para crear las mejores experiencias en tiempo real. En cuanto al entrenamiento, los UltraServers aumentan la velocidad y la eficiencia del entrenamiento de modelos con una comunicación colectiva más rápida para lograr el paralelismo de los modelos en comparación con las instancias independientes. Los UltraServer de EC2 admiten redes EFA y, cuando se implementan en UltraClusters de EC2, permiten un entrenamiento distribuido y escalable en decenas de miles de aceleradores en una sola red sin bloqueos a escala de petabit. Al ofrecer un mayor rendimiento tanto para la formación como para la inferencia, los UltraServers aceleran el tiempo de comercialización y lo ayudan a ofrecer aplicaciones en tiempo real impulsadas por los modelos fundacionales de última generación con mayor rendimiento.

Beneficios

Los UltraServer permiten el entrenamiento y la inferencia eficientes de modelos con cientos de miles de millones o billones de parámetros al vincular un conjunto más grande de aceleradores con una interconexión de alto ancho de banda y baja latencia para ofrecer más computación y memoria que las instancias EC2 independientes.

Los UltraServer permiten la inferencia en tiempo real para modelos de gran tamaño que exigen recursos sustanciales de memoria y ancho de banda de memoria más allá de lo que puede ofrecer una sola instancia EC2.

Los UltraServer permiten una comunicación colectiva más rápida para el paralelismo de modelos en comparación con las instancias independientes, lo que le ayuda a reducir el tiempo de entrenamiento.

Características

Puede lanzar instancias en un UltraServer y aprovechar una interconexión aceleradora dedicada, de gran ancho de banda y baja latencia en todas estas instancias. Los UltraServer permiten el acceso a una mayor cantidad de aceleradores conectados a esta interconexión dedicada, lo que proporciona una cantidad significativamente mayor de computación y memoria en un solo nodo que las instancias EC2 independientes.

Los EC2 UltraServers implementados en EC2 UltraClusters están interconectados con redes EFA a escala petabit para mejorar el rendimiento de las cargas de trabajo de entrenamiento distribuidas.

Puede utilizar los EC2 UltraServers junto con soluciones de almacenamiento de alto rendimiento como Amazon FSx para Lustre, un almacenamiento compartido completamente administrado que se basa en el sistema de archivos paralelo de alto rendimiento más popular. También puede utilizar un almacenamiento rentable prácticamente ilimitado con Amazon Simple Storage Service (Amazon S3).

Los EC2 UltraServers se crean en AWS Nitro System, una amplia colección de bloques de creación que descarga muchas de las funciones de virtualización tradicionales a los equipos y software dedicados. Nitro ofrece un alto rendimiento, una gran disponibilidad y una seguridad superior, a la vez que reduce la sobrecarga de virtualización.

Instancias compatibles

Instancias Trn2

Con la tecnología de los chips AWS Trainium2, las instancias Trn2 en una configuración UltraServer Trn2 (disponible en versión preliminar) permiten escalar hasta 64 chips Trainium2 conectados con NeuronLink, la interconexión dedicada de alto ancho de banda y baja latencia para los chips de IA de AWS. Los UltraServers Trn2 ofrecen un rendimiento sin precedentes en Amazon EC2 para el entrenamiento y la inferencia de la IA generativa.

Más información