Publicidade

Nano Banana Pro chega ao Gemini com edição de estúdio para fotos e texto legível

Por  | 

Compartilhe:
Divulgação/Google
Divulgação/Google

O Google liberou, nesta quinta-feira (20), o Nano Banana Pro ao app Gemini. Com a atualização, a empresa reforça a sua tecnologia para gerar imagens com IA ao oferece edição com "qualidade de estúdio" e textos legíveis.

A atualização chega poucos dias após a estreia do Gemini 3. A nova geração oferece mais desempenho e amplia a criatividade do modelo de linguagem do Google embarcado no chatbot que leva o mesmo nome, no Google AI Studio e afins.

Mais conhecido como Nano Banana Pro, o Gemini 3 Pro Image sucede o Nano Banana revelado em agosto e oferece “controles criativos com qualidade de estúdio” para fotos.

Canaltech
O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia
Continua após a publicidade

Segundo a companhia, agora é possível refinar e transformar qualquer parte de uma imagem com uma edição localizada aprimorada, com a possibilidade de ajustar ângulos de câmera, opção para alterar o foco, aplicar gradação de cores sofisticada e transformar a iluminação da cena.

“Suas criações estão prontas para qualquer plataforma, das redes sociais à impressão, graças a uma variedade de proporções de tela disponíveis e resoluções 2K e 4K”, informou a companhia.

As alterações chegam por meio de prompts enviados no Gemini. Em um exemplo, o Google utilizou o comando “foque nas flores” ao enviar uma foto de uma pessoa em um campo para desfocar a modelo e os demais elementos ao fundo.

Também é possível ajustar uma foto de dia para criar um ambiente noturno ou fazer ajustes mais profundos. Para isso, basta fazer upload de uma imagem e enviar um prompt que detalhe as edições desejadas.

Outra vantagem gira em torno da renderização de textos, uma das maiores pontos fracos de plataformas de IA generativa. Com a atualização, o Gemini e outras ferramentas com acesso ao Nano Banana Pro conseguem gerar conteúdos legíveis e renderizados corretamente em diversos idiomas.

Mais precisão e consistência

Continua após a publicidade

A atualização promete, ainda, gerar imagens com maior precisão e riqueza em contexto. O avanço utiliza os modelos de raciocínio avançado do Gemini 3 e se conecta ao buscador para criar conteúdos com “conhecimentos do mundo” e em tempo real.

Por exemplo, ao utilizar prompts simples para montar infográficos com o passo a passo para fazer chá, a novidade também faz a busca por informações para o material. Você também pode solicitar à IA para pesquisar a previsão do tempo e gerar um pôster em pop-art, informou a empresa.

Além disso, o Nano Banana Pro promete manter a consistência e semelhança ao fazer combinações com até 14 imagens e fotos de até 5 pessoas.

Continua após a publicidade

Ainda na nota enviada nesta quinta, o Google enviou fotos de uma pessoa segurando uma roupa, um vestido, uma poltrona, duas imagens de plantas diferentes e um quadro. Depois, todo o conjunto foi reunido ao enviar um prompt para montar uma imagem cinemática.

“Seja transformando esboços em produtos ou plantas em estruturas 3D fotorrealistas, agora você pode preencher a lacuna entre o conceito e a criação. Aplique a aparência visual desejada aos seus mockups com facilidade, garantindo que sua marca permaneça impecável e consistente em todos os pontos de contato”, explicou a empresa.

Disponível no Gemini

Continua após a publicidade

O Nano Banana Pro já começou a ser distribuído ao NotebookLM e ao app Gemini, em todos os países. Para usá-lo no chatbot, basta ativar a opção para criar imagens e utilizar o modelo “Raciocínio”.

“Nossos usuários do plano gratuito receberão cotas gratuitas limitadas, após as quais retornarão ao modelo original do Nano Banana. Os assinantes do Google AI Plus, Pro e Ultra recebem cotas maiores”, informou o Google. “Para o Modo IA na Busca, o Nano Banana Pro está disponível nos EUA para assinantes do Google AI Pro e Ultra.”

Quem contratou o Google AI Ultra também poderá utilizar o Gemini 3 Pro Image pelo Flow.

A novidade também foi levada a outras plataformas, como o Google Ads e ao Google Apresentações e Vids, disponíveis no Google Drive, para assinantes do Workspace. Para empresas e desenvolvedores, o modelo foi disponibilizado à API do Gemini e ao AI Studio.

Continua após a publicidade

Leia mais:

VÍDEO: Chat GPT, Perplexity, Claude, Gemini: QUAL escolher?