Notebookcheck Logo

A xAI de Elon Musk coloca on-line o cluster de treinamento Colossus 100k H100

GPU Hopper H100 da Nvidia (Fonte da imagem: Nvidia)
GPU Hopper H100 da Nvidia (Fonte da imagem: Nvidia)
Ao final de um esforço de 122 dias, a equipe de desenvolvimento da xAI conseguiu colocar on-line o sistema de treinamento de IA mais poderoso do mundo até o momento. Por enquanto, ele tem 100 mil GPUs H100, mas Musk afirma que esse número dobrará em alguns meses. O Google chegou a 90 mil GPUs, enquanto o sistema de treinamento de IA top de linha da OpenAI tem 80 mil GPUs.

Lançada no final de setembro de 2022, a GPU Hopper H100 da Nvidia está atualmente alimentando os sistemas de treinamento de IA mais potentes do mundo. No último fim de semana, a empresa de IA de Elon Musk, xAI, ficou à frente de seus concorrentes graças ao sistema de treinamento Colossus 100k H100, que exigiu um esforço de 122 dias desde o início de sua implementação até a entrada em operação. Como o próprio nome sugere, ele usa nada menos que 100.000 GPUs H100. Seus principais concorrentes são o Google (90.000), a OpenAI (80.000) e a Meta (70.000). A Microsoft e a Nvidia ocupam os dois próximos lugares no topo, com 60.000 e 50.000 GPUs.

No entanto, essa conquista não é suficiente para Elon Musk, que já definiu os planos para o futuro da xAI. O gênio da tecnologia quer dobrar a potência do sistema de treinamento da xAI o mais rápido possível. Em sua postagem sobre o novo sistema de treinamento de IA Colossus, Musk mencionou que "ele dobrará de tamanho para 200 mil (50 mil H200s) em alguns meses", sem mencionar o objetivo dessa rápida expansão.

Em 2023, quando a xAI foi fundada, Elon Musk disse que o objetivo dessa empresa é "entender a verdadeira natureza do universo", e ainda não se sabe o que resultará de todo esse esforço. Os chips H200 que provavelmente serão usados na próxima onda de expansão da xAI já têm um sucessor, o Nvidia Blackwell. Em comparação com o H200, ele tem uma capacidade de ponta 36,2% maior e uma melhoria de 66,7% na largura de banda total.

Por enquanto, a xAI pode usar o sistema de treinamento de IA Colossus livremente, mas as coisas podem mudar a partir do próximo mês se o governador da Califórnia, Gavin Newsom, aprovar a lei de segurança de IA. Quem quiser saber mais sobre a segurança da IA deve dar uma olhada no livro Safeguarding Humanity, de Chris Ategeka : A Comprehensive Guide to AI Safety, de Chris Ategeka, disponível por US$ 19,99 em formato de livro de bolso.

Fonte(s)

Elon Musk (no Twitter/X)

Please share our article, every link counts!
> Análises e revisões de portáteis e celulares > Arquivo de notícias 2024 09 > A xAI de Elon Musk coloca on-line o cluster de treinamento Colossus 100k H100
Codrut Nistor, 2024-09- 4 (Update: 2024-09- 4)