Publicidade

ChatGPT agora aceita comandos de voz e conversa com você

Por| Editado por Douglas Ciriaco | 25 de Setembro de 2023 às 13h07

Link copiado!

Matheus Bertelli/Pexels
Matheus Bertelli/Pexels

A nova atualização do ChatGPT inclui suporte a comandos por áudio ou imagens. As novidades foram anunciadas pela OpenAI em comunicado oficial nesta segunda-feira (25) e devem chegar aos assinantes do serviço Plus nas próximas duas semanas.

Conversas por voz com o ChatGPT

No caso dos prompts de áudio, o bot de IA generativa permite gravar mensagens pelo app para celulares, aí ele transcreve o conteúdo e pode ler a conversa em voz alta com cinco modelos de vozes diferentes. Entre os exemplos, a empresa menciona a possibilidade de criar uma história para dormir, resolver uma discussão em grupo ou obter uma receita.

Continua após a publicidade

A OpenAI recorreu a atores profissionais para gravar as vozes e usa a tecnologia da API Whisper para identificar a fala e transcrever os comandos em texto. A função estará disponível na aba “New Features”, dentro das configurações do app do ChatGPT para Android e iOS

Pesquisa por imagens

Continua após a publicidade

O chatbot de IA também consegue identificar os elementos presentes em uma imagem e fornecer respostas. Além da opção para combinar uma foto e uma legenda de texto, é possível enviar mais de um arquivo por prompt e ainda usar uma ferramenta nativa de desenho para destacar elementos importantes.

Graças à tecnologia multimodal dos modelos GPT-3.5 e GPT-4, o aplicativo identifica os elementos. Você pode usar o recurso para criar receitas com os itens presentes na geladeira, arrumar móveis e extrair dados de forma similar ao Google Lens, por exemplo.

Continua após a publicidade

Preocupações da OpenAI

A empresa ressaltou que as ferramentas possuem algumas limitações para garantir o uso seguro das novidades. As conversas em áudio podem ser um atalho para clonar vozes em fraudes, por exemplo, e o ChatGPT disponibiliza o recurso apenas para as conversas em áudio com os modelos disponíveis.

Com relação às imagens, a OpenAI afirma que limitou a capacidade do ChatGPT para analisar e criar comentários sobre pessoas, como forma de respeitar a privacidade individual.

Disponível para assinantes

Continua após a publicidade

Os dois novos recursos aparecerão no aplicativo móvel da IA nas próximas duas semanas e (ao menos por enquanto) são exclusivos para assinantes do ChatGPT Plus. Posteriormente, a empresa pretende lançar as funções para desenvolvedores no futuro.

Recentemente, o chat também ganhou uma integração com a nova versão do DALL-E para geração de imagens.