Supercomputador do Baidu reconhece imagens melhor que o ser humano

Por Redação | 18 de Maio de 2015 às 17h45
photo_camera Divulgação

O combate entre Baidu e Google está acontecendo também no campo da inteligência artificial. A empresa chinesa apresentou nesta semana um estud qual afirma ter construído o melhor supercomputador do mundo para reconhecimento de imagens, tirando da gigante das buscas o índice de recordista em termos de acerto nesse quesito – e deixando os humanos ainda mais para trás. A máquina, batizada de Minwa, foi construída em Pequim, na China.

Usando um método chamado deep learning, a máquina é capaz de aprender com os estímulos que são dados a ela pelos pesquisadores. É nesse quesito que entra o reconhecimento de imagens, uma das principais características dos motores de busca online de hoje e, também, principal assunto da corrida por inteligências artificiais mais “espertas” e com maior versatilidade.

Apesar de envolver algoritmos, cálculos e diversos desenvolvimentos extremamente complexos, o método para se obter um índice de sucesso nesse quesito é relativamente simples de ser explicado. O “Desafio ImageNet de Classificação” consiste em fornecer ao computador um conjunto de 1,5 milhão de imagens separadas em mais de mil categorias diferentes. Após o fim de todo esse processamento, o supercomputador é apresentado a 100 mil fotos que nunca havia visto e deve separá-las de acordo com os mesmos critérios.

O resultado do teste foi uma taxa de erro de apenas 4,58%, abaixo dos 4,82% que foram relatados pelo Google em março. Outra empresa que também está nessa corrida é a Microsoft, que no começo do ano, afirmou ter um supercomputador com um índice de equívocos de apenas 4,94%. Apenas para fins de comparação, os humanos possuem um percentual de 5,1% no desafio.

Com 72 processadores de alta potência e 144 GPUs, o Minwa está entre os 300 supercomputadores mais potentes do mundo e, de acordo com o Baidu, é também o equipamento mais rápido voltado exclusivamente para o deep learning. É mais uma amostra, como afirma a própria companhia, de sua capacidade de competir com concorrentes não apenas locais, mas também ao redor do mundo, uma iniciativa de expansão de serviços que vem sendo intensificada cada vez mais nos últimos anos.

São tecnologias como estas que permitem não apenas que os motores de busca reconheçam as imagens que estamos procurando, mas também o funcionamento de soluções de busca por voz e reconhecimento de discurso. Tudo funciona por meio de uma arquitetura semelhante ao cérebro humano, com camadas neurais divididas de maneira hierárquica, que vão sendo treinadas com mais e mais estímulos e melhorando sua capacidade a cada nova iteração.

De acordo com o Baidu, os índices de aprendizado do Minwa foram expandidos não apenas por desenvolvimentos tecnológicos, mas também por um sistema que altera rapidamente as imagens inseridas. Ao virá-las de cabeça para baixo, cortá-las ou transformar suas cores, o computador foi ainda mais capaz de fazer o reconhecimento, o que pode gerar grandes avanços quando tais resultados forem aplicados aos usuários de internet.

Agora, o Baidu quer seguir em frente para novos desafios, aumentando a resolução das imagens e trabalhando com vídeos. Além disso, a ideia é adaptar os sistemas para que eles funcionem também com dispositivos móveis. Em fase de testes, por exemplo, está um aplicativo capaz de reconhecer raças de cães a partir de imagens, utilizando as tecnologias de deep learning e um banco de dados de milhões de fotos de animais.

Fonte: Technology Review

Canaltech no Facebook

Mais de 370K likes. Curta nossa página você!