Google DeepMind aprende a jogar Montezuma’s Revenge, do Atari 2600

Por Redação | em 10.06.2016 às 09h43

montezuma's revenge

Não é de hoje que a inteligência artificial da Google tem se mostrado particularmente capaz de encarar algumas das maiores pedreiras do saudoso Atari 2600. Entretanto, mesmo conseguindo boas performances em 49 títulos do velho sistema de 2015 para cá, a IA desenvolvida pela DeepMind não havia ido muito longe no punitivo Montezuma’s Revenge – pelo menos não até recentemente.

Isso ocorria porque a complexidade relativa dos cenários do velho templo asteca da segunda geração impunha tomadas de decisão demasiado elaboradas para a técnica. A solução? Assim como ocorreria com um ser humano, a DeepMind precisou se tornar mais “curioso”.

Deep mind

Recompensa baseada em novidades

Em termos computacionais, o que a equipe homônima fez foi acrescentar à DeepMind um sistema de recompensa “baseado em novidades” – de tal forma que o autômato “se interessasse” por desbravar o maior número possível de salas do jogo. A versão atual da IA, com algoritmo que implica “motivação intrínseca” (baseado em psicologia humana), conseguiu explorar 15 das 24 salas logo nas quatro primeiras tentativas.

Para efeitos de comparação, a do modelo anterior – em que não existia o incentivo adicional - havia ganhado apenas duas salas durante toda a jogatina. “[O novo sistema] melhorou significativamente a exploração em vários jogos difíceis, incluindo o infamemente complexo Montezuma’s Revenge”, escreveu a equipe da DeepMind em estudo publicado recentemente.

Ok, talvez as salas de Montezuma’s Revenge não lhe pareçam particularmente difíceis diante de outros carrascos do Atari 2600. Entretanto, em se tratando de uma inteligência artificial, o planejamento para evitar armadilhas acaba por ser muito mais difícil do que esboçar reações rápidas para evitar perigos imediatos.

Que venha Starcraft

Mas os pesquisadores pretendem ir além do traiçoeiro templo asteca. De fato, a ideia agora é fazer com que o DeepMind encare jogos como o Starcraft – eventualmente sendo capaz de competir contra humanos também nesses jogos, razoavelmente mais elaborados.

montezuma's revenge

Bem, considerando-se o feito anterior da IA do Google, a pretensão parece natural. Afinal, basta se lembrar de que foi o autômato que conseguiu levar a melhor em quatro de cinco partidas contra o campeão mundial de Go, o sul-coreano Lee Sedol. Ademais, caso algo dê errado, sempre se pode pressionar o botão de emergência.

Fontes: arXiv, YouTube.

Assine nosso canal e saiba mais sobre tecnologia!
Leia a Seguir

Comentários

Newsletter Canaltech

Receba nossas notícias por e-mail e fique
por dentro do mundo da tecnologia!

Baixe já nosso app Fechar

Novidade

Extensão Canaltech

Agora você pode ficar por dentro de todas as notícias, vídeos e podcasts produzidos pelo Canaltech.

Receba notificações e pesquise em nosso site diretamente de sua barra de ferramentas.

Adicionar ao Chrome