A ferramenta de IA DiffUHaul da Nvidia pode mover objetos em imagens
Pesquisadores da Nvidia publicaram um artigo sobre uma nova ferramenta de IA, a DiffUHaul, que pode compreender e mover objetos em uma imagem sem alterar o tamanho ou o plano de fundo. O artigo diz que a ferramenta "aproveita a compreensão espacial de um modelo localizado de texto para imagem para a tarefa de arrastar objetos"
Os modelos atuais de texto para imagem têm dificuldades com tarefas complexas de edição de imagens porque não possuem "raciocínio espacial" O DiffuHaul resolve esse problema incorporando isso ao modelo, permitindo que ele rastreie objetos em uma imagem, realocando-os "perfeitamente" sem alterar nada mais.
Para conseguir isso, a ferramenta mascara o objeto durante as etapas de redução de ruído, ajudando a entender sua localização e a separá-lo do plano de fundo. Em seguida, ela interpola a diferença entre a imagem original e a gerada para colocar o objeto em uma nova posição sem tocar no plano de fundo. Depois disso, os detalhes mais finos e os recursos da imagem original são movidos para a nova imagem para fins de consistência.
O DiffUHaul é baseado no BlobGENum modelo que usa a compreensão espacial para compor imagens a partir de solicitações complexas. O documento afirma que a ferramenta é livre de treinamento, o que significa que ela foi criada sem nenhum conjunto de dados e funciona imediatamente.
Os Top 10
» Os Top 10 Portáteis Multimídia
» Os Top 10 Portáteis de Jogos
» Os Top 10 Portáteis Leves para Jogos
» Os Top 10 Portáteis Acessíveis de Escritório/Empresariais
» Os Top 10 Portáteis Premium de Escritório/Empresariais
» Os Top 10 dos Portáteis Workstation
» Os Top 10 Subportáteis
» Os Top 10 Ultrabooks
» Os Top 10 Conversíveis
» Os Top 10 Tablets
» Os Top 10 Smartphones
» A melhores Telas de Portáteis Analisadas Pela Notebookcheck
» Top 10 dos portáteis abaixo dos 500 Euros da Notebookcheck
» Top 10 dos Portáteis abaixo dos 300 Euros