Apple desenvolve IA para animar imagens estáticas

Por Bruno De Blasi | Editado por Douglas Ciriaco | 15 de Fevereiro de 2024 às 09h57

Link copiado!

Tudo sobre Apple

Pesquisadores da Apple revelaram o Keyframer, um modelo de inteligência artificial (IA) para animar imagens estáticas sem depender de apps de edição avançada. O estudo foi assinado por Tiffany Tseng, Ruijia Cheng e Jeffrey Nichols e publicado no repositório arXiv no começo de fevereiro.

Animação de imagens estáticas

A solução ataca uma área que é pouco explorada por esse campo, segundo os pesquisadores: a animação. A ideia é aplicar um grande modelo de linguagem (LLM) para auxiliar o trabalho de artistas, designers, desenvolvedores e afins que atuam em diversas frentes, como publicidade, jogos e interfaces de usuário.

Continua após a publicidade

“Baseado em entrevistas com designers e engenheiros de animação profissionais, o Keyframer oferece suporte à exploração e ao refinamento de animações por meio da combinação de prompt e edição direta da saída gerada”, diz o estudo. “O sistema também permite que os usuários solicitem variantes de design, apoiando a comparação e a idealização.”

Apesar da prévia, a tecnologia ainda não tem um destino final definido neste momento. Por outro lado, o modelo tem o potencial de oferecer recursos do sistema operacional para apps de edição de imagens e de ilustrações desenvolvidos para iPad ou Mac, por exemplo.

Além disso, é um caminho diferente dos softwares que pegam fotos ou pinturas para transformá-las em vídeos. O Keyframer, na verdade, tem como foco ilustrações, ícones e similares guardados em arquivos de imagem no formato SVG.

O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia

Como funciona o Keyframer

O algoritmo utiliza o GPT-4, modelo de linguagem da OpenAI, para dar vida a arquivos SVG, que são compostos por vetores e garantem grande flexibilidade para edições sem perder a resolução e qualidade.

No estudo, a interface ainda é bem rudimentar, focada apenas na demonstração dos “motores” da ferramenta. Todavia, ela já dá uma noção de como a solução funcionaria no dia a dia.

Primeiro, o usuário precisa inserir o código da imagem SVG no Keyframer. De acordo com os pesquisadores, como o formato é baseado na linguagem XML, o modelo usa as descrições do código para identificar os objetos.

Continua após a publicidade

Ao enviar o código, basta inserir o prompt (comando do usuário) com o tipo de animação desejada. No exemplo dado, os pesquisadores utilizaram uma ilustração de um planeta e solicitaram uma animação para alterar a cor do céu.

O processamento é realizado pelo GPT-4, que analisa o pedido feito em linguagem natural e desenvolve o código CSS para animar o arquivo SVG. Depois, a ferramenta oferece a opção para ajustar a animação.

Para conferir os detalhes da pesquisa, acesse o repositório arXiv (arxiv.org/abs/2402.06071).

Continua após a publicidade

Apple vai focar em IA

O Keyframer ainda é um projeto em desenvolvimento sem expectativa de lançamento. Mesmo assim, é mais uma movimentação da Apple para correr atrás do tempo perdido, depois que Google, Microsoft e outras empresas do setor apostaram quase todas as suas fichas em inteligência artificial.

No começo de fevereiro, o CEO Tim Cook afirmou que a empresa vai continuar a “investir nessas e em outras tecnologias que moldarão o futuro”, incluindo IA. “Estamos entusiasmados em compartilhar os detalhes do nosso trabalho contínuo nessa área ainda neste ano”, complementou o executivo na época.

De lá para cá, alguns avanços vieram à tona, como o MLLM-Guided Image Editing (MGIE), modelo capaz de transformar texto em imagem e que segue os passos do DALL-E e o MidJourney.

Continua após a publicidade

A expectativa é de que os novos recursos sejam apresentados na WWDC 2024, junto com o futuro iOS 18.