Você consegue adivinhar se esses sons são reais ou feitos por IA?

Você consegue adivinhar se esses sons são reais ou feitos por IA?

Por Nathan Vieira | 17 de Agosto de 2020 às 14h02
Denisse Leon/Unsplash

Sabe aqueles efeitos sonoros que estão presentes em filmes, séries, games, e que a gente costuma ter muita curiosidade para saber como são produzidos? Bom, alguns pesquisadores norte-americanos foram além e desenvolveram simplesmente uma inteligência artificial capaz de criar esses sons. E eles ficaram tão convincentes que, ao fazer uma pesquisa com 53 participantes, 41 deles não souberam identificar se os sons eram reais ou produzidos pela inteligência artificial.

Na produção de filmes, o editor de áudio é responsável por criar uma trilha sonora que ajude o filme a ganhar vida para o público. Isso exige que o artista primeiro identifique os sons que irão aprimorar a experiência do ouvinte, reforçando assim a intenção do diretor para uma determinada cena. O profissional deve decidir qual áudio artificial captura a essência tanto do som quanto da ação representada na cena. Foi assim que os pesquisadores criaram AutoFoley, uma ferramenta que utiliza machine learning.

A ideia do AutoFoley é a utilização em aplicativos em que não há arquivo de áudio correspondente associado ao vídeo, por exemplo. Para avaliar o AutoFoley, os pesquisadores contam que criaram e introduziram um conjunto de dados de áudio e vídeo em grande escala, contendo uma variedade de sons frequentemente usados ​​como efeitos em filmes. Os experimentos mostraram que os sons sintetizados são retratados de forma realista com sincronização temporal precisa. 

Com isso, vamos fazer um teste: abaixo há alguns efeitos sonoros. Você consegue identificar quais deles foram produzidos pela inteligência artificial, ou quais deles foram produzidos verdadeiramente?

Se você tiver pensado que todos os três áudios foram feitos pela inteligência artificial, acertou. No entanto, pode ser que o vídeo do cavalo tenha sido um pouco mais fácil de adivinhar. Acontece que um desafio que os pesquisadores têm pela frente é descobrir como combinar o áudio com o vídeo real que ele supostamente representa. Para enganar o público, os efeitos sonoros precisam não apenas soar reais, mas também estar perfeitamente sincronizados com a ação do vídeo.

É por isso que os vídeos de chuva ou fogo crepitante são um pouco mais convincentes, mas o do cavalo correndo, onde o trote e o som claramente não se alinham, é uma farsa mais fácil de ser descoberta. Sendo assim, esses pesquisadores ainda têm uma longa caminhada a percorrer antes que esses sons produzidos por inteligência artificial virem regra.

Fonte: IEEE Xplore 

Gostou dessa matéria?

Inscreva seu email no Canaltech para receber atualizações diárias com as últimas notícias do mundo da tecnologia.