Novo método aposta em inteligência artificial para criar imagens do zero

Por Gustavo Minari • Editado por Douglas Ciriaco | 06/06/2021 às 14:00

Compartilhe:

Pesquisadores da Universidade Estadual da Carolina do Norte, nos EUA, criaram um novo método para controlar como os sistemas de inteligência artificial (IA) geram imagens a partir de um conjunto específico de informações.

Na chamada “geração de imagem condicional'', os usuários podem especificar quais tipos de objetos querem que apareçam em determinados pontos da tela. É como um brinquedo infantil de montar, em que o céu é colocado no topo, o chão na parte de baixo, casas, árvores e animais no centro da imagem e assim por diante.

“Nossa abordagem é altamente reconfigurável, permitindo que os usuários façam com que o sistema gere uma imagem com base em um conjunto específico de condições. Além disso, ela permite que você retenha essa imagem e a acrescente. Por exemplo, os usuários podem fazer com que a IA crie uma cena de montanha e depois fazer com que o sistema adicione esquiadores a essa cena”, explica o coautor do estudo, professor Tianfu Wu.

O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia

Continua após a publicidade

Como funciona

O novo trabalho desenvolvido pela equipe do professor Wu baseia-se em técnicas de composição de imagens avançadas, para dar aos usuários um controle maior sobre o resultado final nos processos de geração de fotografias por meio de programas de inteligência artificial.

Algoritmos de aprendizagem de máquina compilam dados gerais sobre temas e objetos variados e combinam esses elementos em uma única imagem, obedecendo a critérios preestabelecidos pelo usuário. Isso faz com que novas imagens possam ser “montadas” de acordo com comandos diferentes.

Além disso, esse novo sistema permite que a IA manipule elementos específicos dentro de uma imagem, que podem ser movidos ou alterados pelo usuário. “Por exemplo, a IA pode criar uma série de imagens mostrando os esquiadores se virando em direção ao observador enquanto se movem pela paisagem”, acrescenta o professor Wu.

Aplicações

Para testar o novo sistema, os pesquisadores usaram o COCO-Stuff (Common Objects in Context) e o Visual Genome, que são conjuntos de dados utilizados para gerar uma base de conhecimento com o objetivo de conectar conceitos de imagens estruturadas à linguagem humana.

Continua após a publicidade

Com base no padrão de qualidade desses dois bancos de dados, os cientistas conseguiram criar técnicas avançadas de geração de imagens a partir de elementos comuns, que foram agrupados de forma sistemática, seguindo os padrões determinados pelos algoritmos de inteligência artificial.

“Uma aplicação para isso é ajudar os robôs autônomos a “imaginar” como seria o resultado final antes de começarem uma determinada tarefa. Você também pode usar o sistema para gerar imagens para o treinamento de IA. Em vez de compilar imagens de fontes externas, você pode usar esse banco de dados para criar imagens para treinar outros sistemas de inteligência artificial”, completa o professor Wu.

Fonte: NCSU