Colar inteligente reconhece comandos de voz silenciosos
Por Gustavo Minari • Editado por Douglas Ciriaco |

Pesquisadores da Universidade de Cornell, nos EUA, desenvolveram um colar inteligente capaz de reconhecer comandos de voz silenciosos em inglês e mandarim. O dispositivo identifica a fala inaudível usando imagens da deformação da pele do pescoço do usuário, capturadas por uma câmera infravermelha.
- Algoritmo imita o cérebro e deixa conversa com assistentes virtuais mais natural
- Robô usa aprendizagem de máquina para interagir com humanos naturalmente
Chamado de SpeeChin, o aparelho consegue “entender” as palavras que uma pessoa pronuncia mesmo que ela esteja sussurrando ou apenas simulando uma situação de fala sem emitir nenhum som. Ao contrário de assistentes pessoais como a Siri e a Alexa, o equipamento não precisa ouvir o dono para responder a um comando.
“Um colar é um objeto com o qual as pessoas estão acostumadas, ao contrário de dispositivos montados na orelha, que podem ser desconfortáveis. Mesmo que as pessoas já tenham aparelhos com reconhecimento de fala no computador ou celular, elas precisam vocalizar o som para eles funcionarem, e isso nem sempre é socialmente apropriado”, explica o professor Cheng Zhang, autor principal do estudo.
Fala silenciosa
O dispositivo impresso em 3D foi projetado para aprender os padrões de fala de uma pessoa sem que ela precise emitir som algum. A ideia é que o equipamento seja o mais discreto possível e permaneça pendurado no pescoço do usuário sem chamar atenção ou interferir nas atividades do dia a dia.
O aparelho é semelhante ao NeckFace, uma tecnologia que os pesquisadores desenvolveram no ano passado para rastrear expressões faciais e transformá-las em palavras compreensíveis usando câmeras infravermelhas para captar imagens do queixo e do rosto do usuário.
“Ao contrário do NeckFace, o SpeeChin preza pela conveniência e privacidade. Uma câmera montada na frente do seu rosto fotografa também o que está acontecendo atrás de você. Além disso, ninguém vai querer ter uma lente apontada para si mesmo o dia inteiro”, acrescenta Zhang.
Inglês e mandarim
Para testar a eficácia do equipamento, os cientistas contaram com 20 voluntários — dez falando em inglês e dez em mandarim. Medições para determinar a posição do queixo de cada participante ajudaram a gerar as imagens usadas no treinamento do dispositivo para reconhecer comandos mais simples.
As pessoas pronunciaram 54 frases em inglês, incluindo dígitos, pontuação e comandos de navegação. A mesma abordagem foi aplicada com 44 palavras e sentenças simples faladas no idioma chinês. O SpeeChin reconheceu comandos em inglês com uma precisão média de 90,5% e 91,6% em mandarim.
“Nossos testes mostraram que o equipamento funciona satisfatoriamente bem mesmo quando o usuário está caminhando e pronunciando palavras impossíveis de serem ouvidas em um ambiente aberto. Estamos introduzindo um hardware totalmente novo neste campo, com a fala audível se tornando um elemento secundário”, encerra o professor Cheng Zhang.
Fonte: Cornell University