Notebookcheck Logo

DeepSeek lança modelo de IA V3 aprimorado três meses após o lançamento inicial

DeepSeek-V3-0324 lançado com desempenho e recursos aprimorados. (Fonte da imagem: DeepSeek)
DeepSeek-V3-0324 lançado com desempenho e recursos aprimorados. (Fonte da imagem: DeepSeek)
A versão DeepSeek-V3-0324 chega três meses após o lançamento inicial do DeepSeek V3 em dezembro de 2024. Esse modelo atualizado tem desempenho e recursos aprimorados, como a criação de páginas da Web atraentes e relatórios bem escritos em chinês.

A DeepSeek, uma empresa chinesa de IA, lançou o DeepSeek-V3-0324, uma versão atualizada de seu modelo de linguagem grande (LLM) de IA V3, que foi originalmente lançado em dezembro de 2024. O modelo V3 surpreendeu o mundo devido aos seus requisitos de hardware de treinamento muito mais baixos, tempo de treinamento mais curto e custos de API mais baixos, além do alto desempenho em relação à IA concorrente, como os modelos GPT da OpenAI.

O modelo V3 atualizado é um modelo de IA sem raciocínio, o que significa que ele tenta responder às perguntas rapidamente e não leva tempo extra para pensar em problemas difíceis, ao contrário do modelo R1 do DeepSeek. Seu tamanho de 685 bilhões de parâmetros o coloca entre os maiores LLMs disponíveis publicamente. O modelo mais recente está disponível para uso sob a licença MIT.

O DeepSeek-V3-0324 obteve uma pontuação de 5,3% a 19,8% maior em benchmarks de IA do que o V3 original. Seu desempenho é comparável ao de outras IAs de ponta, como GPT-4.5 e Claude Sonnet 3.7

O modelo atualizado também tem recursos aprimorados. Uma área de aprimoramento é sua capacidade refinada de criar páginas da Web e front-ends atraentes para jogos on-line. Outro aprimoramento é a capacidade de pesquisar, escrever e traduzir melhor em chinês.

Os leitores que quiserem experimentar o DeepSeek-V3-0324 685B completo precisarão de pelo menos 700 GB de espaço de armazenamento livre e várias GPUs Nvidia A100/H100. Versões destiladas e com parâmetros menores do modelo podem ser executadas em uma única GPU, como a Nvidia 3090(vendida aqui na Amazon).

A IA do DeepSeek-V3-0324 melhora o desempenho em comparação com a versão original, com pontuações de benchmark de IA mais altas. (Fonte da imagem: DeepSeek)
A IA do DeepSeek-V3-0324 melhora o desempenho em comparação com a versão original, com pontuações de benchmark de IA mais altas. (Fonte da imagem: DeepSeek)

Versão do DeepSeek-V3-0324

Grande aumento no desempenho do raciocínio

Habilidades de desenvolvimento front-end mais fortes

Recursos mais inteligentes de uso de ferramentas

Para tarefas de raciocínio não complexas, recomendamos o uso da V3 - basta desativar o "DeepThink"

O uso da API permanece inalterado

Os modelos agora são lançados sob a licença MIT, assim como o DeepSeek-R1!

Please share our article, every link counts!
Mail Logo
> Análises e revisões de portáteis e celulares > Arquivo de notícias 2025 03 > DeepSeek lança modelo de IA V3 aprimorado três meses após o lançamento inicial
David Chien, 2025-03-29 (Update: 2025-03-29)