Sora | Dona do ChatGPT anuncia IA para criar vídeo
Por Douglas Ciriaco | •
A OpenAI anunciou a chegada do Sora, uma inteligência artificial generativa para criar vídeos a partir de comandos de texto. A novidade é apresentada nesta quinta-feira (15) como algo capaz de “simular o mundo físico em movimento” e se junta às IAs para criar texto (ChatGPT) e imagens estáticas (DALL-E) da companhia liderada por Sam Altman.
- 10 IAs para criar vídeo a partir de fotos ou texto
- IA para criar vídeos Pika está disponível para todos
O Sora é capaz de criar vídeos de até um minuto de duração sem perder qualidade visual e permanecendo fiel aos parâmetros definidos pelo comando do usuário, garante a desenvolvedora. Os exemplos de vídeos criados com a IA publicados pela OpenAI são absolutamente incríveis e deixam no ar a ideia de uma tecnologia de ponta capaz de criar vídeos “do zero” de maneira impecável — confira os vídeos ao longo deste texto.
Apesar do alto potencial de despertar a curiosidade do público, o Sora por enquanto está disponível a um grupo restrito de testadores de segurança, digamos assim, que tentam identificar potenciais danos e riscos gerados pela IA. Além disso, a OpenAI avisa que já liberou a tecnologia a artistas visuais e cineastas a fim de obter feedback para tornar a ferramenta “o mais útil possível para profissionais criativos”
De texto para vídeo
Atualmente já existem algumas IAs capazes de criar vídeos de forma satisfatória, mas parece que a OpenAI quer ir além. A nova IA tecnologia seria capaz de entender a solicitação de quem digita um comando de forma contextualizada a fim de gerar um resultado avançado e coerente com o mundo real.
“O Sora pode gerar cenas complexas com diversos personagens, tipos específicos de movimento e detalhes precisos da cena principal e do plano de fundo”, explica a criadora do ChatGPT. “O modelo compreende não apenas o que o usuário pediu no prompt, mas também a forma como aquelas coisas existem no mundo real.”
Nesse sentido, o Sora promete ser capaz de criar diversas "capturas" de imagens com diferentes perspectivas a fim de alcançar o padrão solicitado pelo prompt.
Nem tudo são flores
Apesar de não poupar elogios a sua própria ferramenta, a OpenAI também alerta para as suas fraquezas. De acordo com a empresa, o Sora pode ter dificuldade em simular a física de efeitos mais complexos e em entender coisas muito específicas.
“Por exemplo, uma pessoa pode morder um pedaço de uma bolacha, mas, depois disso, a bolacha não tem uma marca de dentes”, explica a companhia.
Localizar no espaço a “câmera” que guia a perspectiva do espectador também pode ser um problema para o Sora. De acordo com a desenvolvedora, o modelo “pode sofrer com descrições precisas de eventos que acontecem ao longo do tempo, como seguir uma trajetória de câmera específica.”
E os riscos?
Em um mundo cada vez mais repleto de deepfakes eróticos de pessoas famosas ou não, uma IA poderosa para criar vídeos levanta algumas preocupações. A OpenAI parece ciente disso e de antemão reforça que seu novo modelo tem sido testado por especialistas de áreas chave como desinformação, conteúdo de ódio e preconceito.
“Nós também construímos ferramentas para ajudar a detectar o mau uso de conteúdo como um classificador que avisa quando um vídeo foi gerado pelo Sora”, completa a companhia. A dona do ChatGPT também informa que planeja incluir códigos de metadados C2PA, o mesmo que passou a usar recentemente em imagens geradas pelo DALL-E, a fim de facilitar a identificação de conteúdo gerado por IA.
Por fim, a OpenAI garante que trabalha junto a “legisladores, educadores e artistas do mundo” para compreender possíveis usos equivocados e prejudiciais da tecnologia.
Outro ponto crucial envolvendo IA generativa, a base de dados para treinar tais modelos não ganhou muito destaque da OpenAI no anúncio da ferramenta. A única menção a isso dá conta de que o Sora foi construído sobre “pesquisas anteriores com os modelos GPT e DALL-E”.
De qualquer forma, a empresa prometeu liberar o paper técnico com todos os detalhes da nova IA ainda nesta quinta.
https://youtu.be/xEXSJfLxlN8
Disponibilidade
A OpenAI não revelou quando o Sora (ou algum produto baseado nessa tecnologia) será liberado ao público geral.