Publicidade

Google lança o Gemini Omni, nova IA 'bombada' para criar vídeos

Por  |  • 

Compartilhe:
Divulgação/Google
Divulgação/Google

O Google revelou o novo modelo Gemini Omni, capaz de criar “qualquer coisa”, mas que inicialmente será usado para vídeos. A novidade foi anunciada durante a conferência I/O nesta terça-feira (19) e representa um salto na geração de clipes em comparação com o modelo Veo 3.1.

De acordo com a empresa, o Omni consegue combinar as habilidades para criar e raciocinar, além de contar com vasto conhecimento do mundo real sobre física e consistência dos elementos.

Na hora de enviar um pedido, é possível usar fotos, vídeos, áudios e prompt em texto para refinar o comando. O modelo consegue fazer edições pontuais nos vídeos, como mudar um estilo ou trocar o personagem, mas sem perder a base original daquele clipe — como se fosse uma versão “turbinada” do Veo.

Canaltech
O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia
Continua após a publicidade

O que muda com o Gemini Omni?

O Gemini Omni traz mais opções para editar e refinar vídeos. Confira os destaques:

  • Mudar pontos específicos de um vídeo, como um personagem, um estilo visual ou até um ângulo de filmagem;
  • Alterar as ações de um vídeo que já existe, sem perder consistência;
  • Melhorias na compreensão da física dos clipes, como gravidade e energia cinética, para criar resultados mais realistas;
  • Suporte a comandos de diferentes fontes de mídia;
  • Avatar de IA digital que simula a sua aparência e pode ser usado em diferentes criações.

Quem pode acessar a novidade?

O primeiro modelo liberado é o Omni Flash, disponível no Google Flow e no YouTube Shorts para assinantes dos planos pagos Google AI Pro e AI Ultra.

Mais IA no Google I/O

A inteligência artificial foi destaque mais uma vez durante a conferência I/O. Entre os destaques, a Gigante de Mountain View revelou um novo visual para o Gemini, o modelo 3.5 Flash para respostas mais rápidas e um novo recurso para criar documentos com comandos de voz.