A xAI lança o Grok 3 AI com desempenho de ponta e modelos de raciocínio beta

a xAI lança a família Grok 3 de IA de ponta. (Fonte da imagem: xAI)

Os modelos de linguagem grande mais recentes da xAI lideraram os gráficos de benchmark devido à sua capacidade de pesquisar informações na Internet, raciocinar sobre problemas complexos e processar entradas com uma janela de contexto de um milhão de tokens. Os modelos Grok 3 superaram o OpenAI GPT-4o e o DeepSeek-V3 na maioria dos benchmarks.

David Chien (traduzido por Ninh Duy), Publicado 02/21/2025 🇺🇸 🇩🇪 ...

AI Software Launch

A xAI de Elon Musk lançou a família Grok 3 de modelos de linguagem grande de IA de ponta que, em geral, superam outras IAs em benchmarks de IA padronizados.

Os modelos Grok 3 foram treinados no cluster de supercomputadores Colossus da empresa, que usa 100.000 GPUs Nvidia Hopper Tensor Core. Foram lançados dois modelos padrão e mini sem raciocínio (Grok 3 beta e Grok 3 mini beta), além de dois modelos com raciocínio (Grok 3 beta (Think) e Grok 3 mini beta (Think)).

Os modelos sem raciocínio geralmente superam o desempenho da IA anterior, como o OpenAI GPT-4o e o DeepSeek-V3. Um dos motivos é que eles têm uma janela de contexto de um milhão de tokens, o que permite que a IA use quantidades muito grandes de texto. Isso melhora a capacidade dos modelos de sintetizar a resposta correta a partir de uma variedade de fontes. Dito isso, os modelos beta do Grok 3 ainda respondem a perguntas de busca de fatos com menos de 50% de precisão (benchmark SimpleQA), portanto, os seres humanos ainda terão trabalho amanhã.

Os modelos de raciocínio pensam em prompts complexos passo a passo, permitindo que o usuário veja o processo de pensamento da IA. Isso permite que a IA resolva os problemas como um especialista faria, resolvendo partes menores do problema e combinando os resultados para obter uma resposta adequada. A seleção do agente DeepSearch, ou opção de pesquisa, dirá ao Grok 3 para pesquisar ampla e profundamente na Internet e usar intérpretes de código antes de gerar relatórios que resumam suas descobertas. Em geral, os modelos do Grok 3 (Think) são os melhores para resolver problemas de matemática, responder a perguntas de múltipla escolha em nível de pós-graduação e concluir tarefas de codificação em comparação com outras IAs.

a xAI espera continuar ajustando o Grok 3 para melhorar o desempenho nos próximos meses em um cluster de supercomputadores com 200.000 GPUs. O Grok 3 já está disponível para todos os usuários no X e no Grok.com. Os usuários gratuitos podem encontrar limites de uso, enquanto os usuários pagantes terão acesso a recursos avançados.