Por que optar pelos servidores UltraServers do Amazon EC2?

Os servidores UltraServers do Amazon Elastic Compute Cloud (Amazon EC2) são ideais para clientes que buscam a mais alta performance em treinamento e em inferência de IA para modelos em escala de trilhões de parâmetros. Os servidores UltraServers conectam diversas instâncias do EC2 por meio de uma interconexão de aceleradores dedicada com alta largura de banda e baixa latência. Isso possibilita o uso de uma malha de aceleradores fortemente acoplada entre as instâncias do EC2 e o acesso a muito mais capacidade de computação e memória em comparação com instâncias autônomas do EC2.

Os servidores UltraServers do EC2 são perfeitos para os modelos mais complexos que necessitam de mais memória e mais largura de banda de memória do que as instâncias autônomas do EC2 conseguem disponibilizar. O projeto do UltraServer usa a conectividade de aceleradores internos às instâncias para conectar várias instâncias em um único nó, desbloqueando novas funcionalidades. Para tarefas de inferência, os servidores UltraServers contribuem para proporcionar tempos de resposta de ponta, garantindo as melhores experiências em tempo real. Para tarefas de treinamento, os UltraServers aumentam a velocidade e a eficiência do treinamento de modelos com uma comunicação coletiva mais rápida para o paralelismo de modelos, em comparação com as instâncias autônomas. Os servidores UltraServers do EC2 são compatíveis com a rede EFA e, ao serem implantados em UltraClusters do EC2, possibilitam o treinamento distribuído do aumento horizontal da escala, com dezenas de milhares de aceleradores em uma rede de escala petabit sem bloqueios. Ao fornecer uma performance superior tanto para o treinamento quanto para a inferência, os servidores UltraServers agilizam o tempo de introdução no mercado e ajudam a disponibilizar aplicações em tempo real impulsionadas pelos modelos de base de próxima geração com maior performance.

Benefícios

Os servidores UltraServers possibilitam o treinamento e a inferência de modelos com centenas de bilhões a trilhões de parâmetros de maneira eficiente, ao conectar um maior número de aceleradores por meio de uma interconexão de alta largura de banda e baixa latência, para fornecer mais capacidade de computação e memória do que as instâncias autônomas do EC2.

Os servidores UltraServers possibilitam a inferência em tempo real para modelos de grande porte que necessitam de recursos de memória e de largura de banda superiores aos oferecidos por uma única instância do EC2.

Os servidores UltraServers possibilitam uma comunicação coletiva mais eficiente para o paralelismo de modelo em comparação com as instâncias autônomas, ajudando a reduzir o tempo de treinamento.

Recursos

É possível iniciar instâncias em um servidor UltraServer e usar uma interconexão dedicada com alta largura de banda e baixa latência entre aceleradores nessas instâncias. Os servidores UltraServers possibilitam o acesso a um número superior de aceleradores conectados por essa interconexão dedicada, fornecendo muito mais capacidade de computação e memória em um único nó, em comparação com as instâncias autônomas do EC2.

Os servidores UltraServers do EC2 implantados em UltraClusters do EC2 são interconectados com uma rede do EFA em escala de petabit para aprimorar a performance de workloads de treinamento distribuído.

É possível usar os servidores UltraServers do EC2 em conjunto com soluções de armazenamento de alta performance, como o Amazon FSx para Lustre, um sistema de armazenamento compartilhado totalmente gerenciado, baseado no sistema de arquivos paralelo de alta performance mais utilizado. Você também pode usar o armazenamento econômico virtualmente ilimitado com o Amazon Simple Storage Service (Amazon S3).

Os servidores UltraServers do EC2 foram desenvolvidos usando o AWS Nitro System, uma coleção avançada de blocos de criação que transfere muitas das funções tradicionais de virtualização para hardware e software dedicados. O Nitro fornece alta performance, alta disponibilidade e alta segurança, reduzindo a sobrecarga de virtualização.

Instâncias com suporte

Instâncias Trn2

Equipadas com chips AWS Trainium2, as instâncias Trn2 em uma configuração Trn2 UltraServer (disponível em versão prévia) possibilitam aumentar a escala verticalmente até 64 chips do Trainium2 conectados usando o NeuronLink, a interconexão dedicada com elevada largura de banda e baixa latência para chips de IA da AWS. As instâncias Trn2 UltraServers fornecem uma performance revolucionária no Amazon EC2 para treinamento e inferência de IA generativa.

Saiba mais