Publicidade

Google anuncia codec para o Duo que permite uso de voz em redes 2G

Por| 02 de Março de 2021 às 20h20

Link copiado!

Google
Google
Tudo sobre Google

Os aplicativos de mensagens, bate-papos e videoconferências nunca foram tão utilizados quanto nesses tempos de pandemia e de distanciamento social. Segundo o Google, seus apps Duo e Meet hospedaram nada menos do que 1 trilhão de minutos de vídeo somente no ano passado. Embora esse número aponte para o sucesso, também indica uma grande pressão na infraestrutura da Internet de todo o mundo — e muitos dos métodos de videochamadas excluem usuários com conexões ruins.

Além disso, o próprio tráfego de informações no ecossistema do Google também é afetado por esse grande volume de informações. Por isso, a companhia desenvolveu um novo codec de áudio chamado Lyra, especificamente otimizado para “oferecer fala humana reconhecível, compreensível e com som natural no menor espaço possível”, com “alta qualidade e taxa de bits muito baixa, disponível mesmo na rede mais lenta”, diz o anúncio feito nesta terça-feira (2), no blog Google AI. Ou seja, com a novidade, é possível usar o Google Duo até mesmo em redes 2G.

Com ajuda do aprendizado de máquina e modelos de conversão de som menos robótica e mais natural obtidos com experiências de outros projetos (a exemplo do DeepMind), a companhia conseguiu chegar à tecnologia do codec Lyra, que consegue comprimir voz de um bate-papo a apenas 3 Kbps. Para ter uma ideia do que isso significa, um codec WebRTC ou VOIP (voz sobre o IP) pode transmitir um áudio original a 32 Kbps e o codec Opus até consegue diminuir essa banda para 6 Kbps, mas ao custo de grande redução da fidelidade. Com o Lyra, o Google propõe um som muito próximo ao de 32 Kbps a apenas 3 Kbps — uma grande otimização se pensarmos isso sendo executado na casa do trilhão de minutos.

Continua após a publicidade

O Google ainda complementa que o Lyra foi treinado com “milhares de horas de áudio em mais de 70 idiomas”. E, mesmo tão leve, a tecnologia parece ser eficiente o suficiente de funcionar em quaisquer redes, desde um servidor de nuvem de ponta a um smartphone de médio alcance com apenas 90 ms de latência.

Por enquanto, o Lyra deve ser utilizado somente com as conversas por voz do Google Duo, mirando locais como conexões discadas e áreas rurais da Índia e do Brasil. A companhia deve aprimorar e incorporar a novidade em seu ecossistema e abrir o código do codec para que outras empresas também possam usá-la em seus apps de mensagens.

Continua após a publicidade

Fonte: Google AI Blog