Publicidade

Estudantes criam aplicativo para traduzir diferentes sotaques em tempo real

Por| Editado por Douglas Ciriaco | 30 de Novembro de 2021 às 12h19

Link copiado!

maxxyustas/Envato
maxxyustas/Envato

Alunos de engenharia da Universidade Stanford, nos EUA, desenvolveram um programa de computador que “traduz” o sotaque de uma pessoa em tempo real. Esse tradutor de acento linguístico pode ser integrado a aplicativos como Zoom e WhatsApp ou usado em chamadas telefônicas.

Essa primeira versão do app faz com que duas pessoas que falam inglês possam se entender mutuamente, independente se usam o idioma com suas próprias pronúncias ou palavras exclusivas de cada região. A ideia é reduzir as barreiras de comunicação entre falantes da mesma língua por conta da falta de compreensão dos diversos tipos de sotaque.

“Sabíamos por vivência própria que forçar um sotaque diferente em você mesmo é desconfortável. Eu fui para uma escola secundária britânica e tentei forçar um sotaque britânico, o que se tornou uma experiência improdutiva, desgastante e difícil de digerir”, lembra o estudante de engenharia Andres Perez Soderi, um dos criadores do aplicativo.

Continua após a publicidade

Tradutor de sotaque

Em vez de tentar mudar a forma como as pessoas falam, os estudantes resolveram treinar um algoritmo para traduzir as variações de diferentes sotaques. Eles alimentaram o sistema com centenas de gravações com palavras e frases pronunciadas de maneiras distintas por nativos de várias regiões.

O tradutor de sotaque foi treinado para compreender cinco variações idiomáticas de falantes norte-americanos, britânicos, australianos, filipinos e espanhóis. Ele tem um atraso de 150 milissegundos (cerca de um sexto de segundo), sendo que essa demora na resposta também depende da ferramenta usada na comunicação.

Continua após a publicidade

“O Zoom, por exemplo, tem uma média de atraso de 50 milissegundos, então alguém usando o tradutor de sotaque com esse serviço experimentaria um atraso total de 200 milissegundos. No entanto, qualquer coisa abaixo de 300 milissegundos é quase imperceptível para quem está ouvindo”, explica Soderi.

Sanas

Os alunos de Stanford criaram uma startup chamada Sanas para dar seguimento ao projeto que pretende aumentar a eficácia da comunicação em conversas digitais. Em apenas um ano de existência, eles já conseguiram um financiamento de US$ 5 milhões (cerca de R$ 28 milhões na cotação atual) para aprimorar a tecnologia.

Continua após a publicidade

A ideia é expandir o uso do tradutor de sotaque para outros idiomas, como o espanhol falado em países diferentes, além de aperfeiçoar a rede neural para que ela possa aprender a mapear as variações dos sotaques durante a pronúncia de palavras semelhantes automaticamente, o que facilitaria a implantação em diversas áreas da comunicação.

“Esse tradutor pode ser uma bênção para muitas empresas, especialmente aquelas que fornecem atendimento ao cliente e suporte técnico por telefone. Existe também a possibilidade de usos criativos, como aqueles em entretenimento e mídia, em que os produtores podem tornar seus filmes e séries compreensíveis em diferentes partes do mundo, independente do sotaque”, encerra o CEO da Sanas, Maxim Serebryakov.

Fonte: Ieee Spectrum