Publicidade

Apple cria IA que edita fotos com base em comando de texto

Por| Editado por Douglas Ciriaco | 09 de Fevereiro de 2024 às 16h01

Link copiado!

Tim Mossholder/Unsplash
Tim Mossholder/Unsplash
Tudo sobre Apple

Uma equipe de pesquisadores da Apple criou um novo modelo de inteligência artificial capaz de cortar, redimensionar, aplicar filtros, modificar objetos inteiros e fazer uma série de edições avançadas em fotos.

A novidade foi batizada de MLLM-Guided Image Editing (MGIE) e projetada em parceria com a Universidade da Califórnia, nos Estados Unidos. Essa é uma das primeiras iniciativas públicas envolvendo inteligência artificial “moderna” por parte da empresa.

Pedido simples, resultado complexo

Continua após a publicidade

Em tese, o MGIE não foge ao que tecnologias semelhantes como DALL-3 e Midjourney já conseguem entregar atualmente. Contudo, o diferencial do modelo de IA da Apple seria a sua alta capacidade de interpretação: ele consegue identificar e executar qualquer pedido do usuário — tornando-se acessível mesmo para quem jamais tocou em um programa de edição.

Explicando melhor, a inteligência artificial da Maçã combina dois diferentes modelos de linguagem multimodal, sendo o primeiro capaz de interpretar solicitações e o segundo voltado para “desvendar” o que a pessoa tem em mente, mesmo que a descrição enviada não tenha sido técnica o suficiente.

Por exemplo, se alguém pedir um “céu mais azul em uma foto”, o MGIE pode compreender que o brilho da foto deve ser aumentado. Ou se o usuário solicitar que a foto de uma pizza de calabresa aparente ser mais saudável, a IA pode substituir a carne por uma cobertura de legumes e vegetais.

O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia

Se o resultado não for o desejado, o usuário pode solicitar uma nova interpretação, cabendo à inteligência artificial generativa mexer em outros aspectos da imagem até que chegue em um resultado satisfatório.

Apesar de oferecer tal nível de precisão, a Gigante de Cupertino destaca que os prompts devem ser claros e detalhados, a fim de que as edições cheguem o mais próximo possível do resultado esperado.

Onde baixar o MGIE

Desenvolvedores e entusiastas de tecnologia já pode acessar o MGIE, que foi disponibilizado para download através do GitHub no endereço github.com/apple/ml-mgie. Outro repositório que conta com a novidade da Apple é o Hugging Face Spaces, disponível em huggingface.co.

Continua após a publicidade

A Big Tech não deu detalhes quanto à aplicação do novo modelo em seus produtos, abrindo brechas para uma infinidade de especulações —  quem sabe o MGIE não integre o iOS 18 e também venha equipado no iPhone 16 e no recém-lançado Apple Vision Pro. Resta aguardar para saber mais detalhes.