Pesquisadores anunciam sistema avançado de reconhecimento de imagem

Por Redação | 18 de Novembro de 2014 às 18h36

Enquanto você lê esta frase, pelo menos uma centena de imagens e quase meia hora de vídeo foram colocados na internet. O conteúdo não para de crescer e, na mesma medida, torna-se cada vez mais difícil encontrar aquilo que estamos procurando. É nesse cenário que entra a “computer vision”, uma tecnologia que promete melhorar a catalogação e localização de tais produções em meio ao mar de coisas que podemos encontrar navegando na web.

E foi justamente nesse campo que dois grupos de cientistas americanos conseguiram grandes avanços. Como conta uma reportagem publicada pelo jornal The New York Times, os pesquisadores atingiram um nível de detalhamento “virtual” tão complexo quanto o do olho humano, com computadores sendo capazes de descrever perfeitamente fotografias colocadas diante de si.

Os estudos estavam concentrados na percepção do “todo” pelas máquinas, que até agora eram capazes de perceber apenas elementos individuais. No entanto, diante de fotos de um time de rugby ou de uma manda de elefantes, os cientistas conseguiram obter descrições digitais bastante semelhantes às que um humano faria das imagens, com bastante precisão e riqueza de detalhes.

Uma das equipes faz parte da Universidade de Stanford, nos Estados Unidos, enquanto a outra contém funcionários do Google, trabalhando em um projeto de tecnologias de código aberto e inteligência artificial. É a gigante das buscas, inclusive, uma das principais interessadas nesse tipo de avanço, que pode revolucionar a forma como as pessoas realizam pesquisas na internet, uma vez que os motores de serviços do tipo não mais precisarão depender de textos presentes na mesma página que as imagens ou vídeos procurados pelos usuários.

Além disso, existem aplicações da “computer vision” também no campo da segurança. Empresas desse segmento estão interessadas no sistema devido à possibilidade de ele ser capaz de identificar determinados comportamentos. Ao lado de softwares de reconhecimento facial e câmeras de segurança, a inteligência artificial poderia ser capaz de localizar suspeitos rapidamente ou alertar autoridades sobre possíveis crimes antes mesmo que eles aconteçam.

Existem ainda sistemas de reconhecimento para veículos, instalados no para-brisas, capazes de localizar ciclistas e pedestres, impedindo o movimento do carro em caso de perigo. Ou uma iniciativa do próprio Google, que criou um sistema capaz de aprender com si mesmo a partir das buscas dos usuários. Todos estes detectam apenas um elemento ou aspecto da imagem, enquanto as pesquisas apresentadas nesta semana possuem uma compreensão mais completa.

Computadores pensantes

Ambos os estudiosos seguiram a linha das “redes neurais”, criando computadores cujo funcionamento seja semelhante ao do cérebro humano. Assim, eles seriam capazes de aprender por meio de coincidências, padrões e similaridades que nem mesmo as próprias pessoas seriam capazes de perceber, melhorando sua percepção e a identificação daquilo que está sendo procurado.

Assim, os pesquisadores quiseram criar uma rede conjunta, que unisse máquinas neurais baseadas em padrões de imagens e outras que tem como pé a linguagem. O resultado disso foi positivo, com os computadores sendo capazes de entender contexto e detalhar de forma mais acertada o que estava acontecendo nas fotografias, sem isolar elementos individuais, mas sim, enxergando a situação por completo.

Apesar dos resultados positivos, os dois grupos de cientistas admitem que há muito a ser descoberto e a pesquisa ainda está em seus estágios iniciais. O entendimento, apesar de dentro do esperado, ainda é pouco amplo e precisa de melhorias para que possa ser aplicada em uma situação real, com usuários demandando pesquisas e sistemas solicitando informações.

O trabalho agora segue com grupos maiores de imagens e situações diversas. Além disso, anotações feitas pelos próprios cientistas serão incluídas no sistema para que os computadores possam aprender mais. A situação é vista como semelhante ao estímulo dado por um professor ao aluno, com ele seguindo em frente com as próprias pernas. Os testes continuam e ainda não existe nenhuma data para aplicação prática, em um trabalho que ainda deve ser estender por pelo menos alguns anos.

Fique por dentro do mundo da tecnologia!

Inscreva-se em nossa newsletter e receba diariamente as notícias por e-mail.