Google apresenta a IA generativa Lumiere para criar imagens e vídeos mais realistas a partir de textos

O Google apresenta o Lumiere - a mais recente novidade em IA generativa que cria videoclipes realistas a partir de texto. (Fonte: Google Research)

O Google apresentou o Lumiere, o que há de mais moderno em geração realista de texto para imagem e texto para vídeo usando aprendizado de máquina. Uma inovação importante é a capacidade de criar movimentos realistas, como caminhar, com os quais as IAs generativas atuais têm dificuldade. O software faz isso criando todos os quadros de vídeo de uma só vez, em vez de usar quadros-chave e treinamento para aprender como os objetos em movimento devem aparecer.

David Chien (traduzido por Ninh Duy), Publicado 01/31/2024 🇺🇸 🇩🇪 ...

O Google apresentou o Lumiere, o que há de mais moderno em IA realista de texto para imagem e vídeo. O software aprimora bastante o movimento usando uma nova abordagem para a geração de quadros de vídeo que cria todos os quadros em uma única passagem para reduzir os erros de movimento.

A IA geradora de imagens cria imagens a partir de texto. Um fator importante que permite isso é a enorme quantidade de imagens e vídeos on-line disponíveis para treinamento. Outro é o desenvolvimento de métodos para associar todas as palavras de um idioma umas às outras por meio de vetores. Portanto, a IA pode entender como um par de palavras, ou em uma frase, "eu sou" é mais provável do que "eu unilateralmente". A IA de criação de imagens, como a Stable Diffusion, associa palavras a imagens de objetos. Essa IA entende que as palavras "residência real" estão mais associadas a uma imagem de "castelo" do que a uma imagem de "casa".

A IA de vídeo generativa amplia a IA de imagem para criar vídeos a partir de texto. Os concorrentes da Lumiere criam primeiro os quadros-chave e depois os quadros intermediários. É como se um mestre animador desenhasse as imagens do início e do fim de um arremesso de basquete e, em seguida, um assistente desenhasse as imagens intermediárias. O problema é que, muitas vezes, ocorrem erros de movimento porque as imagens intermediárias não são desenhadas corretamente, de modo que a Lumiere contorna esse problema criando todos os quadros de vídeo sem keyframes. Além disso, a Lumiere é treinada para saber como os objetos em movimento se parecem em vários tamanhos de imagem, de modo que seus vídeos têm uma aparência superior.

Tecnicamente, o Lumiere utiliza modelos probabilísticos de difusão para gerar imagens acopladas a uma U-Net espaço-temporal, uma arquitetura de U-net com escalonamento temporal para cima e para baixo, além de blocos de atenção adicionados ao escalonamento usual da resolução da imagem. O escalonamento para baixo temporalmente, simultaneamente à resolução, reduz significativamente as cargas de trabalho computacionais, enquanto o escalonamento para cima, associado a um modelo de super-resolução espacial com consciência temporal, gera o resultado de alta resolução. Ainda assim, a segmentação de quadros de imagem é necessária devido a limitações de memória, de modo que a multidifusão é usada em limites de segmentos de quadros sobrepostos para ajudar a atenuar os artefatos de movimento temporal.

O Lumiere pode ser acoplado a outras IAs para criar uma gama mais ampla de resultados. Isso inclui:

Cinemagraphs - uma seção de uma imagem é animada
Inpainting - um objeto em um vídeo é substituído por outro
Geração estilizada - a aparência é recriada em outro estilo de arte
Image-to-video (imagem para vídeo) - uma imagem desejada é animada
Vídeo para vídeo - os vídeos são recriados em outro estilo artístico

A duração do vídeo é limitada a 5 segundos, enquanto a capacidade de criar transições de vídeo e vários ângulos de câmera é inexistente. Os leitores interessados em fazer experiências com IA generativa em seus computadores desktop devem fazer upgrade para uma placa de vídeo potente(como esta da Amazon) para obter o melhor desempenho durante o treinamento.

O Lumiere pode criar imagens e vídeos a partir de texto, estilizados para combinar com outra arte, e até mesmo substituir objetos. (Fonte: Google Research)

O Lumiere pode animar uma parte de uma imagem e o resultado pode ser alimentado facilmente em outra IA. (Fonte: Google Research)

▶ load Youtube video

Fonte(s)

Pesquisa do Google - Lumiere, Inbar Mosseri no YouTube

Artigos Relacionados

O Vivo X100 pode ser encomendado com frete grátis na União Europeia. (Fonte da imagem: Vivo)

O Vivo X100 chega à Europa por menos do que o Google Pixel 8 e o Samsung Galaxy S24 por meio de um revendedor terceirizado 02/07/2024

o 'Bard' poderá em breve se tornar o 'Gemini' (Fonte da imagem: Google Blog)

O Google vai mudar a marca do Bard para 'Gemini' e lançar um aplicativo 02/05/2024

Uma imagem de "moda steampunk" criada por Bard. (Fonte: Google)

Google Bard atualiza para geração de imagens e bate-papo em mais idiomas 02/03/2024

O Pixel 8 Pro em sua nova opção de cor "Mint". (Fonte da imagem: Google)

Google lança novas opções de cores para o Pixel 8 e Pixel 8 Pro com bônus de lançamento 01/26/2024

O Pixel 8 Pro recebeu vários novos recursos com o Pixel Feature Drop deste mês. (Fonte da imagem: Notebookcheck)

Janeiro de 2024 O Pixel Feature Drop chega para os smartphones Google Pixel 5a e Pixel 6 em diante, com mudanças também para os smartwatches Pixel Watch e Pixel Watch 2 01/26/2024

O Pixel Watch 2 é um dos poucos smartwatches que rodam o Wear OS 4 sem nenhum problema. (Fonte da imagem: Notebookcheck)

Há rumores de que o Google e a Samsung estão desenvolvendo o Wear OS 5 com base em Android para Galaxy Watch7, Pixel Watch 3 e outros smartwatches 01/25/2024

O Pixel 9 pode ser o primeiro carro-chefe menor do Google com três câmeras traseiras. (Fonte da imagem: @OnLeaks)

Google Pixel 9 revelado com Apple elementos de design do iPhone, câmera com zoom periscópio e possível sensor de temperatura 01/25/2024

O novo módulo de câmera do Pixel 9 Pro se encaixa melhor em capas protetoras. (Imagem: Gizmochina)

Google Pixel 9 Pro: A capa protetora acentua o novo design do carro-chefe do Google 01/25/2024

O Pixel 7a está limitado a 18 W de carga. (Fonte: Google)

A embalagem vazada do Google Pixel 8a confirma o design e o carregamento aprimorado 01/24/2024

AYANEO FLIP é o primeiro dispositiv...

Ambiente de desktop Linux KDE Plasm...

Editor of the original article: David Chien - Tech Writer - 530 articles published on Notebookcheck since 2023

Translator: Ninh Ngoc Duy - Editorial Assistant - 522633 articles published on Notebookcheck since 2008

contact me via: Facebook

Please share our article, every link counts!

> Análises e revisões de portáteis e celulares > Arquivo de notícias 2024 01 > Google apresenta a IA generativa Lumiere para criar imagens e vídeos mais realistas a partir de textos

David Chien, 2024-01-31 (Update: 2024-08-15)