Notebookcheck Logo

Gerador de vídeo de IA de código aberto Pyramid Flow agora disponível on-line

Imagem de um curta de texto para vídeo criado usando o Pyramid Flow (Fonte da imagem: Pyramid Flow no GitHub)
Imagem de um curta de texto para vídeo criado usando o Pyramid Flow (Fonte da imagem: Pyramid Flow no GitHub)
Proveniente da China, o Pyramid Flow é um modelo de IA de código aberto capaz de criar vídeos virtuais de alta resolução (768p). De acordo com a equipe por trás dele, esse modelo pode gerar um vídeo de 384p de cinco segundos em menos de um minuto. A licença MIT cobre o Pyramid Flow, que passou por treinamento em conjuntos de dados de código aberto.

Já se tornou popular em vídeos tutoriais do YouTubeo Pyramid Flow é um novo modelo de IA que foi treinado em conjuntos de dados de código aberto, que totalizam cerca de 10 milhões de vídeos. O trabalho de uma equipe que reúne pesquisadores de IA da Universidade de Pequim, da Kuaishou Technology e da Universidade de Correios e Telecomunicações de Pequim, o Pyramid Flow, por sua vez, é de código aberto. Coberto pelos termos da licença MITele pode gerar conteúdo de vídeo virtual de alta resolução (768p) e, obviamente, se destaca quando precisa lidar com 384p. De acordo com seus criadores, ele pode criar um vídeo de cinco segundos em menos de um minuto (usando a GPU A100 em uma configuração de hardware não revelada, aparentemente).

Em alguns cenários, o Pyramid Flow se destaca. No entanto, ao lidar com determinadas solicitações de texto, os resultados estão longe de ser satisfatórios. Como ainda é o caso de muitos aplicativos de IA generativa, o trabalho com essa ferramenta vem com uma certa dose de aleatoriedade. O lado positivo é que a abordagem desse modelo usa muito menos poder de computação do que seus concorrentes e, como seu código é de código aberto, ele pode ser usado em aplicativos locais ou em nuvem pelos interessados sem precisar se preocupar com a parte de licenciamento.

No entanto, os pesquisadores de IA que criaram o Pyramid Flow listaram todos os conjuntos de dados usados para treiná-lo, mas não mencionaram nada sobre os problemas de direitos autorais que podem surgir. Embora alguns criadores de conteúdo afirmem que os vídeos virtuais feitos com material de código aberto violam os direitos dos detentores dos direitos autorais, o Pyramid Flow pode ser útil para o ajuste fino desse tipo de conteúdo sem a necessidade de envolver terceiros.

Os interessados em IA de uma perspectiva de código aberto podem adquirir Open-Source AI: The Future of Data Research (IA de código aberto: o futuro da pesquisa de dados ) de J.D. TjonWolf na Amazon por US$ 9,99 (Kindle) ou US$ 12,99 (brochura).

Fonte(s)

Please share our article, every link counts!
> Análises e revisões de portáteis e celulares > Arquivo de notícias 2024 10 > Gerador de vídeo de IA de código aberto Pyramid Flow agora disponível on-line
Codrut Nistor, 2024-10-15 (Update: 2024-10-15)