Nova inteligência artificial cria imagens artísticas a partir de qualquer texto

Por Gustavo Minari • Editado por Douglas Ciriaco | 24/06/2022 às 12:00

Compartilhe:

Pesquisadores da Universidade de Waterloo, no Canadá, e do Instituto Courant de Ciências Matemáticas de Nova York, nos Estados Unidos, desenvolveram uma ferramenta de inteligência artificial (IA) capaz de gerar imagens artísticas exclusivas automaticamente com base em descrições de texto.

Segundo os cientistas, o método consiste em uma rede adversária geradora de memória dinâmica (DM-GAN), que nada mais é do que um modelo com duas redes neurais artificiais que trabalham juntas para produzir imagens extremamente convincentes e próximas da realidade.

“Criamos um modelo que usa entradas de texto para gerar figuras conforme são descritas. Isso permite que pessoas com deficiências incapacitantes, ou que não são muito habilidosas para desenhar, possam produzir belas imagens artísticas”, explica o professor de engenharia Jean-Claude Franchitti, coautor do estudo.

O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia

Continua após a publicidade

Treinamento

Os pesquisadores usaram o modelo DM-GAN para gerar uma imagem realista que representasse uma descrição de texto. A partir daí, uma rede neural artificial com várias camadas chamada ResNet foi aplicada para classificar a figura produzida pelo sistema de inteligência artificial.

Essa imagem foi então elencada em um das categorias de gênero do conjunto de dados conhecido como WikiArt — uma base de código aberto contendo mais de 40 mil pinturas produzidas por 195 artistas, amplamente utilizada para treinar sistemas de aprendizado profundo.

“Depois de classificar a imagem produzida pelo DM-GAN em uma das categorias de gênero descritas pelo WikiArt, nosso modelo pode selecionar um estilo de pintura compatível com essa categoria de gênero e transferi-lo para a figura gerada, utilizando uma rede neural de estilização artística”, acrescenta Franchitti.

Resultados

Embora os primeiros resultados tenham sido bons do ponto de vista de utilização de uma inteligência artificial com capacidades artísticas, os pesquisadores pretendem melhorar o desempenho da rede neural, principalmente em relação ao método de entrada de dados, feito exclusivamente por meio de textos.

Continua após a publicidade

A ideia é que, no futuro, os usuários possam usar um módulo de reconhecimento de fala para gerar as imagens, possibilitando que pessoas com deficiências manuais consigam utilizar a própria voz sem ter que digitar caracteres descritivos para criar figuras artísticas.

“Seria fantástico se essa técnica fosse integrada em aplicativos gráficos ou de desenho, permitindo que qualquer pessoa pudesse produzir imagens de alta qualidade, independentemente de suas habilidades e talentos artísticos”, encerra o professor de ciência da computação Qinghe Tian, autor principal do estudo.