Google anuncia codec para o Duo que permite uso de voz em redes 2G
Por Claudio Yuge | 02 de Março de 2021 às 20h20
Os aplicativos de mensagens, bate-papos e videoconferências nunca foram tão utilizados quanto nesses tempos de pandemia e de distanciamento social. Segundo o Google, seus apps Duo e Meet hospedaram nada menos do que 1 trilhão de minutos de vídeo somente no ano passado. Embora esse número aponte para o sucesso, também indica uma grande pressão na infraestrutura da Internet de todo o mundo — e muitos dos métodos de videochamadas excluem usuários com conexões ruins.
- Google Duo: como fazer uma videoconferência pelo PC
- Google Duo agora suporta até 12 pessoas na videochamada e tem mais novidades
- Como o Google Duo pode ajudar no seu home office
Além disso, o próprio tráfego de informações no ecossistema do Google também é afetado por esse grande volume de informações. Por isso, a companhia desenvolveu um novo codec de áudio chamado Lyra, especificamente otimizado para “oferecer fala humana reconhecível, compreensível e com som natural no menor espaço possível”, com “alta qualidade e taxa de bits muito baixa, disponível mesmo na rede mais lenta”, diz o anúncio feito nesta terça-feira (2), no blog Google AI. Ou seja, com a novidade, é possível usar o Google Duo até mesmo em redes 2G.
Com ajuda do aprendizado de máquina e modelos de conversão de som menos robótica e mais natural obtidos com experiências de outros projetos (a exemplo do DeepMind), a companhia conseguiu chegar à tecnologia do codec Lyra, que consegue comprimir voz de um bate-papo a apenas 3 Kbps. Para ter uma ideia do que isso significa, um codec WebRTC ou VOIP (voz sobre o IP) pode transmitir um áudio original a 32 Kbps e o codec Opus até consegue diminuir essa banda para 6 Kbps, mas ao custo de grande redução da fidelidade. Com o Lyra, o Google propõe um som muito próximo ao de 32 Kbps a apenas 3 Kbps — uma grande otimização se pensarmos isso sendo executado na casa do trilhão de minutos.
O Google ainda complementa que o Lyra foi treinado com “milhares de horas de áudio em mais de 70 idiomas”. E, mesmo tão leve, a tecnologia parece ser eficiente o suficiente de funcionar em quaisquer redes, desde um servidor de nuvem de ponta a um smartphone de médio alcance com apenas 90 ms de latência.
Por enquanto, o Lyra deve ser utilizado somente com as conversas por voz do Google Duo, mirando locais como conexões discadas e áreas rurais da Índia e do Brasil. A companhia deve aprimorar e incorporar a novidade em seu ecossistema e abrir o código do codec para que outras empresas também possam usá-la em seus apps de mensagens.
Fonte: Google AI Blog