Publicidade
Economize: canal oficial do CT Ofertas no WhatsApp Entrar

IA vai permitir editar imagens usando apenas a função "clique e arraste"

Por| Editado por Douglas Ciriaco | 19 de Maio de 2023 às 14h50

Link copiado!

Alveni Lisboa/Canaltech
Alveni Lisboa/Canaltech

Uma inteligência artificial em desenvolvimento vai permitir a manipulação de imagens apenas ao clicar e arrastar elementos. A ideia lançar usar uma tecnologia capaz de entender o que a pessoa deseja fazer para otimizar a edição.

O modelo é chamado Drag Your Gan, ou apenas DragGAN, e combina o melhor das IAs generativas de imagens com um sistema de arrastar e soltar. A interface até lembra os apps de edição tradicionais, mas o funcionamento é totalmente diferente.

Continua após a publicidade

Em vez de trabalhar um pixel individualmente como ocorre hoje, o modelo cria um conjunto com semelhanças entre si para apresentar o resultado. Isso significa que a tecnologia consegue identificar um sorriso e movimentar todos os pixels da boca ao mesmo tempo.

Como funciona o DragGAN?

A IA transforma imagens chapadas na tela em modelos 3D para modificar a foto em diferentes tamanhos, formatos e estilos. Em um dos vídeos, é possível notar um ajuste no reflexo de montanhas em um lago em poucos segundos, o que seria extremamente trabalhoso se feito na mão.

Continua após a publicidade

Há várias tecnologias capazes de gerar imagens realistas ou artes únicas, mas todas carecem de precisão. As Generative Adversarial Networks (GAN), classe de IA que trabalha com geração de conteúdo que pode enganar os humanos, são ótimas para criar algo do zero, mas pecam por nem sempre exibir o que você deseja.

No caso do DragGAN, é como se você conseguisse otimizar o processo para gerar uma imagem ideal. Além de descrever o que precisa, você pode editar tudo antes de concluir o trabalho.

Imagine que o DALL-E ou Midjourney criou a imagem de um cachorro shih-tzu preto com a cabeça para frente, mas você queria que estivesse de lado. A promessa do modelo é fazer esse giro de maneira rápida, gradual e realista.

Continua após a publicidade

O que pode ser feito com o DragGAN?

Os vídeos dão uma boa demonstração das possibilidades. É possível alterar o tamanho de um carro, mudar um sorriso para uma expressão fechada, virar a cabeça de um leão e muitas outras coisas. A interface ainda é meio assustadora e um tanto técnica, mas pode ser ajustada em uma versão final.

Claro que tudo ainda está em fase de demonstração, então ninguém ainda testou a tecnologia efetivamente. Mesmo assim, é interessante ver uma das incríveis possibilidades que as IAs generativas podem alcançar.

Continua após a publicidade

A IA está em desenvolvimento por pesquisadores do Max Planck Institute e Saarbrücken Research Center, ambos da Alemanha, e do Massachusetts Institute of Technology (MIT) e Universidade da Pensilvânia, dos Estados Unidos. O site oficial (mpi-inf.mpg.de) tem mais vídeos e ainda oferece o estudo completo com mais detalhes sobre o funcionamento.

O projeto ainda está na fase de estudos e não há previsão de quando a modelagem será lançada. Para o usuário, fica a expectativa de algo tão incrível quanto chegar ao mercado para democratizar a edição de imagens.