Além de editar fotos: 7 coisas que você pode fazer no Gemini
Por Viviane França • Editado por Bruno De Blasi |

O Gemini não se limita a editar fotos. A IA do Google traz recursos que vão desde a criação de vídeos curtos até o aprendizado guiado, passando por revisão de textos, transcrição de áudios e geração de códigos.
A seguir, tire suas dúvidas sobre:
- 10 prompts para editar fotos no Gemini que você precisa conhecer
- Como fazer a foto de Polaroid abraçando com IA pelo Gemini
7 coisas que você pode fazer no Gemini
Veja 7 recursos do Gemini para além da geração e edição de imagens:
- Gerar vídeos
- Revisar textos
- Fazer buscas na web
- Transcrever áudios
- Gerar códigos
- Conversar por voz
- Estudar com Aprendizado Guiado
1. Gerar vídeos
Com o modelo Veo 3, o Gemini permite criar vídeos de oito segundos com áudio nativo usando descrições de texto. Também existe a opção “photo-to-video” (transformar uma foto em vídeo) para animar imagens com som ambiente ou efeitos.
2. Revisar textos
O Gemini consegue melhorar a escrita, revisar ortografia e gramática, além de sugerir ajustes de clareza e coesão. Ele também adapta o tom de acordo com a necessidade, seja em um e-mail profissional, seja em uma mensagem mais descontraída.
Nos aplicativos do Google Workspace, como Gmail e Documentos, essa capacidade já está integrada, o que permite melhorar o texto em tempo real sem depender de ferramentas externas.
3. Fazer buscas na web
O Deep Research no Gemini permite que o Gemini navegue por centenas de sites, filtre‐informações, reúna dados atualizados e apresente relatórios, inclusive com planos interativos e uploads de arquivos para guiar a pesquisa.
4. Transcrever áudios
O Gemini agora permite transcrever áudios, o que facilita registrar reuniões, aulas e outras gravações. A função está disponível na web e nos apps para Android e iOS.
No plano gratuito, é possível enviar arquivos de até 10 minutos e 100 MB, enquanto os planos pagos liberam áudios de até três horas. Também há suporte para vídeos, limitados a cinco minutos no plano grátis e até uma hora no pago.
5. Gerar códigos
O Gemini ajuda você a escrever, entender e corrigir códigos. Ele gera trechos a partir de descrições em linguagem natural, explica como um bloco funciona e sugere melhorias.
Também é possível enviar arquivos ou repositórios inteiros para que o modelo identifique erros e proponha soluções.
6. Conversar por voz
Com o Gemini Live, você consegue conversar “ao vivo” com o Gemini por voz, com opção de usar câmera ou tela, e as respostas são faladas.
Recentemente, o Google implementou melhorias na função para tornar a fala do Gemini mais natural, com ritmo, entonação e integração com apps do Google.
7. Estudar com Aprendizado Guiado
No Aprendizado Guiado, o Gemini se torna tutor que ajuda a aprofundar seu conhecimento sobre um tema.
Em vez de entregar respostas prontas, ele faz perguntas e oferece direcionamentos para que você descubra a solução sozinho. É bem semelhante ao modo socrático do ChatGPT.
Confira outros conteúdos do Canaltech:
- Gemini: o que muda entre a versão gratuita e a paga?
- 5 truques para criar a imagem perfeita usando o Gemini
- O que muda entre o Gemini 2.5 Flash e 2.5 Pro? Conheça as IAs do Google
VÍDEO: O Gemini é muito bom (e isso é um problema)