Notebookcheck Logo

O DeepSeek, IA de código aberto e gratuito da China, é uma séria ameaça ao ChatGPT da OpenAI e a outros modelos de IA

O DeepSeek, IA de código aberto da China, é um concorrente do OpenAI (Fonte da imagem: Imagen3)
O DeepSeek, IA de código aberto da China, é um concorrente do OpenAI (Fonte da imagem: Imagen3)
A OpenAI, a empresa por trás do ChatGPT, planejou inicialmente desenvolver inteligência artificial com base em código aberto. No entanto, nenhum código-fonte dos modelos atuais da OpenAI foi disponibilizado até o momento. A DeepSeek, da China, adota uma abordagem completamente diferente e oferece o DeepSeek-R1 sob a licença MIT. Supostamente, esse novo modelo de IA está no mesmo nível do ChatGPT.

A partir de novembro de 2023, a empresa chinesa DeepSeek vem lançando modelos de IA em uma base de código aberto. Graças à licença MIT, qualquer pessoa pode usar e adaptar o modelo para seus próprios fins individuais. Isso torna os modelos transparentes e versáteis.

Além disso, eles permitem um desenvolvimento colaborativo e economizam dinheiro ao longo do processo. Os usuários podem visualizar e entender o código para ver como o modelo funciona. Eles podem adaptar o modelo às suas necessidades específicas e usá-lo para vários aplicativos. Portanto, a DeepSeek está comprometida com o código aberto e, assim, acrescenta inovação e concorrência ao campo da IA.

Essa empresa surgiu da Fire-Flyer, que é o ramo de aprendizagem profunda de um fundo de hedge chinês chamado High-Flyer. O objetivo inicial era entender, interpretar e prever melhor os dados financeiros no mercado de ações. Desde o spin-off da DeepSeek em 2023, a empresa tem se concentrado inteiramente em LLMs, que são modelos de IA capazes de gerar texto.

A empresa parece ter alcançado um grande avanço com os dois mais novos membros da família DeepSeek AI. De acordo com os benchmarks de IA amplamente utilizados, o DeepSeek-V3, o DeepSeek-R1 e o DeepSeek-R1-Zero frequentemente superam os concorrentes da Meta, OpenAI e Google em seus respectivos campos. Como um serviço on-line, eles também são significativamente mais baratos do que o ChatGPT, por exemplo.

Essa estratégia agressiva de preços pode ter um impacto em todos os preços do mercado de IA e tornar as ferramentas avançadas de IA acessíveis a um público mais amplo. A empresa pode se dar a esse luxo porque deseja gastar muito menos dinheiro no treinamento de seus modelos de IA do que outras empresas. Para ser mais preciso, isso pode ser alcançado por meio de programas de treinamento mais eficientes e muita automação.

Por outro lado, o DeepSeek-R1 e o DeepSeek-R1-Zero são modelos de raciocínio. Isso significa que eles primeiro desenvolvem um plano sobre a melhor forma de responder a uma pergunta e, em seguida, trabalham em pequenas etapas. Isso melhora a precisão dos resultados e exige menos potência de computação. No entanto, essa abordagem aumenta a demanda de espaço de armazenamento.

Como uma IA de código aberto, o DeepSeek pode ser executado diretamente no computador do usuário final. Os dados necessários do aplicativo podem ser acessados gratuitamente, pois os modelos podem ser baixados gratuitamente em Hugging Face. Isso é ainda mais fácil com programas como o LM Studioque pode baixar e instalar automaticamente todo o código do aplicativo.

Isso significa que não deve haver problemas com a segurança e a privacidade dos dados. Os prompts, os dados e as respostas não saem do computador. Além disso, o modelo pode ser usado off-line. Não é necessário hardware de alto desempenho, mas sim muita memória e armazenamento. Por exemplo, o DeepSeek-R1-Distill-Qwen-32B requer cerca de 20 GB de espaço de armazenamento no disco rígido.

De acordo com o DeepSeek V3, a IA trabalha com vários idiomas. Entre eles estão o chinês e o inglês, mas também o alemão, o francês e o espanhol. Em um breve bate-papo, os vários idiomas forneceram respostas satisfatórias.

Tudo o que resta são perguntas e dúvidas sobre a censura da China. O DeepSeek-R1 contém censura para determinados tópicos politicamente sensíveis. Os usuários que tentam perguntar sobre determinados eventos históricos não recebem nenhuma resposta ou recebem uma resposta "revisada". Por exemplo, o senhor não precisa necessariamente perguntar à IA sobre o que aconteceu na Praça Tiananmen nos dias 3 e 4 de junho de 1989.

Dito isso, o DeepSeek R1 pelo menos reconhece os protestos estudantis e uma operação militar. Mas outros modelos de IA também não respondem às perguntas políticas. O Gemini do Google se recusa terminantemente a responder perguntas que possam estar relacionadas à política. Portanto, a censura (autoimposta) pode ser encontrada em várias IAs.

Please share our article, every link counts!
Mail Logo
> Análises e revisões de portáteis e celulares > Arquivo de notícias 2025 01 > O DeepSeek, IA de código aberto e gratuito da China, é uma séria ameaça ao ChatGPT da OpenAI e a outros modelos de IA
Marc Herter, 2025-01-28 (Update: 2025-01-28)