Google anuncia Gemini 1.5 com foco em tarefas mais complexas

Por Bruno De Blasi • Editado por Douglas Ciriaco | 15/02/2024 às 13:21

Compartilhe:

O Google apresentou, nesta quinta-feira (15), a atualização para o Gemini 1.5, nova versão do modelo de linguagem que é usado para processar informações do chatbot que leva o mesmo nome. O lançamento promete melhoria no desempenho e mais eficiência no processamento de informações.

Continua após a publicidade

A atualização vem a público poucos meses após o anúncio da primeira versão, em dezembro de 2023, que colocou o Google no páreo com a OpenAI, dona dos modelos de linguagem (LLM, em inglês) GPT-3 e GPT-4.

Mais desempenho

O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia

Continua após a publicidade

O pacote de novidades é completamente incremental, com foco em melhorias. Para isso, o Google explorou uma nova arquitetura conhecida como Mixture-of-Experts (MoE), que divide os modelos em pequenas redes neurais “especializadas” em vez de uma rede gigante.

Esse processo garante mais eficiência e ajuda a processar tarefas mais complexas com agilidade. A vantagem também é aplicada no treinamento do Gemini, que se tornou mais rápido com a atualização.

Não à toa, o Google afirma que o Gemini 1.5 Pro tem desempenho similar ao Ultra 1.0, o modelo mais avançado da companhia até o momento — vale lembrar que o modelo tem três tamanhos: Nano (nos celulares Pixel), Pro (disponível no chatbot Gemini) e Ultra (disponível no Gemini Advanced).

“Quando testado em um painel abrangente de avaliações de texto, código, imagem, áudio e vídeo, o 1.5 Pro supera o 1.0 Pro em 87% dos benchmarks usados para desenvolver nossos LLMs”, disse a companhia.

Mais tokens

A versão 1.5 também expandiu o tamanho da janela de contexto, que é o limite de informações que podem ser aplicadas simultaneamente no modelo. Essa fronteira é estabelecida a partir da quantidade máxima de tokens — ou seja, blocos usados para processar dados.

De 32 mil tokens da versão 1.0, o Gemini 1.5 passou a suportar até 1 milhão de tokens. Quantidade que, segundo o Google, permite a análise de 1h de vídeo, 11h de áudio, 30 mil linhas de código ou mais de 700 mil palavras.

Continua após a publicidade

A empresa chegou a usar o Gemini 1.5 para analisar o PDF com a transcrição da missão Apollo 11, que levou o homem à lua, como exemplo. Ao solicitar os momentos cômicos das falas, o algoritmo levou apenas segundos para ler as 402 páginas do documento e trazer resposta.

Gemini 1.5 ainda está em testes

Por enquanto, o Google vai liberar o Gemini 1.5 apenas para a versão Pro, mas ainda em fase de testes. A partir desta quinta-feira (15), os desenvolvedores e clientes corporativos conseguem experimentar a nova versão pelo AI Studio ou Vertex AI em um contexto limitado.

Continua após a publicidade

Além disso, a companhia oferece inicialmente o Gemini 1.5 Pro com suporte a apenas 128 mil tokens. Depois, com as melhorias do modelo, a empresa pretende apresentar outros planos para oferecer até 1 milhão de tokens.

“Os primeiros testadores podem experimentar a janela de contexto de 1 milhão de tokens sem nenhum custo durante o período de teste, embora devam esperar tempos de latência mais longos com esse recurso experimental”, complementou a empresa.

Não há previsão de lançamento do Gemini 1.5 para o público em geral, inclusive para o chatbot que tem o mesmo nome.