Publicidade

Gemini 3.1 Flash Live chega para deixar a IA por voz do Google mais natural

Por  | 

Compartilhe:
Marcelo Salvatico/Canaltech
Marcelo Salvatico/Canaltech

O Google lançou o Gemini 3.1 Flash Live, seu modelo de voz mais avançado, desenvolvido para diálogos em tempo real mais naturais, rápidos e confiáveis. A novidade já está disponível no Gemini Live e Search Live para usuários comuns, desenvolvedores e empresas.

O modelo responde mais rápido e entende melhor detalhes da fala, como tom, ritmo e entonação. Ele consegue acompanhar conversas por duas vezes mais tempo que a versão anterior, mantendo o diálogo sem se perder, além de ajustar suas respostas ao perceber expressões de frustração ou confusão dos usuários.

O Gemini 3.1 Flash Live também também é multilíngue e funciona em mais de 200 países e territórios, e permite conversas multimodais no Search Live, utilizando o idioma preferida do usuário. Além disso, todo áudio gerado recebe uma marca d’água digital SynthID, que identifica conteúdo produzido por IA e ajuda a combater a desinformação

Canaltech
O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia
Continua após a publicidade

No benchmark ComplexFuncBench Audio, o Gemini 3.1 Flash Live atingiu 90,8%, mostrando que consegue executar tarefas em várias etapas. Já no teste Scale AI's Audio MultiChallenge, o modelo atingiu 36,1% com o recurso “thinking” ativado, que mede a habilidade da IA de seguir instruções complexas e manter o raciocínio a longo prazo, mesmo diante de interrupções e hesitações comuns em áudios.

Nos ambientes empresariais, o Gemini 3.1 Flash Live supera o modelo 2.5 Flash Native Audio no reconhecimento de nuances acústicas, ajustando suas respostas ao perceber frustração ou confusão dos usuários.

Como acessar o Gemini 3.1 Flash Live?

O Gemini 3.1 Flash Live está disponível para todos os usuários no Gemini Live e Search Live.

Já os desenvolvedores podem usar a versão prévia via API do Gemini Live no Google AI Studio, e as empresas conseguem acessar o modelo por meio do Gemini Enterprise for Customer Experience.