Rede neural permite editar uma foto apenas digitando a alteração desejada

Por Gustavo Minari • Editado por Douglas Ciriaco | 13/09/2021 às 14:30

Compartilhe:

Uma equipe de pesquisadores da Universidade de Tel Aviv, em Israel, desenvolveu um sistema capaz de fazer mudanças realistas em fotografias, baseado em uma tecnologia conhecida como e Generative Adversarial Network (GAN), ou Redes Gerativas Adversárias em uma tradução livre.

Para gerar rostos reais de pessoas que não existem, o usuário precisa apenas digitar informações sobre determinada característica ou simplesmente modificar traços de fisionomia que já existem como tipo de cabelo, cor da pele, tamanho dos olhos e formato da boca, dando uma nova aparência a imagens originais.

Para mostrar o poder da ferramenta, os pesquisadores fizeram mudanças visuais engraçadas em fotografias atuais do CEO da Tesla, o bilionário Elon Musk. Eles usaram inteligência artificial (IA) para dar à pele de Musk um tom mais pálido ou bronzeado, trocaram o corte de cabelo e até deixaram o seu rosto com uma aparência mais feminina. As transformações foram compartilhadas no Twitter pelo youtuber Scott Manley.

O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia

Continua após a publicidade

GANs

As GANs são arquiteturas de redes neurais profundas de inteligência artificial, compostas por duas redes que são colocadas uma contra a outra. Para gerar as imagens de rostos reais, o sistema confronta duas bases de dados de fotografias e junta as características das duas em uma terceira imagem.

Um software é usado para controlar outras características como a pose e o formato do rosto. Detalhes mais finos, como formato do nariz e cor dos olhos também são analisados para deixar o resultado mais realista possível. O algoritmo utiliza uma interface baseada em dados de texto para criar a nova imagem em tempo real.

“Nós exploramos o poder do pré-treinamento de imagem para permitir a manipulação de fotografias baseadas em texto de maneira intuitiva, sem depender de tratamentos posteriores. O modelo baseia-se em 400 milhões de pares de imagem e texto colhidos na internet”, explica a estudante de ciência da computação Or Patashnik, autora principal do estudo.

Imagens quase reais

Os geradores de imagens usam canais de mapeamento autônomo e camadas de ruído baseados na aleatoriedade para produzir uma fotografia sintética. A produção da rede de mapeamento é um vetor que define as técnicas integradas em um determinado ponto do modelo, permitindo o controle sobre as características da imagem gerada.

Continua após a publicidade

Embora os GANs tenham mostrado resultados incríveis, sua capacidade de gerar imagens de alta qualidade é limitada pela quantidade de dados de treinamento disponíveis na rede. Por exemplo, seria quase impossível treinar um modelo partindo de um artista que ainda não foi reconhecido ou quando não há informações suficientes sobre a aparência dessa cena imaginária.

Como todo o sistema é alimentado com diversas fotos de pessoais reais, o software estuda e tenta criar suas próprias imagens de pessoas inexistentes, enquanto outra parte do dispositivo detecta quais dessas fotos podem ser usadas para compor a imagem final, mesclando características do banco de dados.

“Introduzimos novos métodos de manipulação de imagens, que combinam geradores poderosos e habilidades de codificação de conceito visual. Mostramos que você só precisa digitar “cabelos compridos” 2 ou “olhos redondos” para criar uma imagem totalmente nova. A manipulação orientada por texto se tornará uma ferramenta poderosa para edição de imagens no futuro”, encerra Or Patashnik.

Continua após a publicidade

Fonte: Tel Aviv University