IA da Meta é capaz de criar imagens quase como um humano

Por Igor Almenara • Editado por Douglas Ciriaco | 15/06/2023 às 09:58 • Atualizado 15/06/2023 às 10:03

Compartilhe:

Nesta semana, a Meta apresentou uma nova IA capaz de gerar ou completar imagens quase como um humano faria. Chamado Image Joint Embedding Predictive Architecture (ou I-JEPA), o modelo usa "geração guiada por conhecimento" para complementar figuras de forma realista.

De acordo com a Meta, o modelo compara "representações abstratas" de imagens em vez de pixels. Como resultado, a IA entrega "forte desempenho" em várias tarefas de visão computacional e seria muito mais eficiente computacionalmente do que outros modelos do gênero.

O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia

Continua após a publicidade

a I-JEPA é a realização da visão do cientista-chefe de IA da Meta, Yann LeCun. Em 2022, ele propôs a criação de uma máquina capaz de aprender modelos internos de "como o mundo funciona" para acelerar o treinamento, possibilitar o raciocínio para conclusão de tarefas completas e garantir flexibilidade para cenários incomuns de inteligências artificiais.

IA da Meta foca na distinção de objetos

A nova IA da Meta foi treinada com uma infinidade de imagens e textos reais, o que garantiu a ela capacidade de distinguir objetos e cenários. Essa solução pode resolver problemas comuns para inteligências artificiais geradoras de imagens, como falhas na representação de mãos e objetos fisicamente impossíveis.

"Nosso trabalho nos modelos I-JEPA é baseado no fato de que os humanos aprendem uma enorme quantidade de conhecimento básico sobre o mundo apenas o observando passivamente", pontua a empresa no post de anúncio. "Foi levantada a hipótese de que essa informação de senso comum é a chave para permitir um comportamento inteligente, como a aquisição eficiente de novos conceitos, fundamentação e planejamento", complementa.

IA gera imagens a partir de rascunhos

O conhecimento da I-JEPA permite que a IA crie imagens a partir de rascunhos, usando seu conhecimento do mundo para preencher as lacunas e gerar uma figura realista. O modelo consegue preencher cores, ajustar detalhes de iluminação e compor um plano de fundo.

Atualmente, a I-JEPA está disponível como projeto de código aberto, portanto desenvolvedores podem explorar o potencial do modelo em soluções próprias, bem como estudar seu comportamento. A IA pode ser destrinchada no diretório oficial do Facebook Research no GitHub (github.com).