IA da DeepMind aprende jogando contra si mesma e não depende mais de humanos

Por Patrícia Gnipper | 07 de Dezembro de 2018 às 15h47
DeepMind

A inteligência artificial AlphaZero, desenvolvida pela DeepMind (subsidiária da Google), vem aprendendo a jogar como um profissional nos últimos anos, vencendo jogadores profissionais de Go em 2016 e, no ano seguinte, deixou o melhor jogador de Go no chinelo. Agora, o algoritmo campeão de Go e também mestre em xadrez comemora um novo marco, pois já é capaz de aprender jogando contra si mesmo, tornando-se o jogador mais forte de qualquer partida já testada.

A empresa fez uma avaliação completa da IA nesta semana, publicando os resultados na revista Science. O artigo descreve como a evolução mais recente do algoritmo aprende rapidamente a cada nova partida, ainda que comece do zero a cada vez, já que usa rede neurais profundas e é capaz de aprender por conta própria, dispensando os ensinamentos de humanos.

Ao começar com um jogo do zero, em branco, a rede neural não sabe nada sobre aquele game além das regras básicas as quais deve respeitar. E através de jogabilidade regular e independente, o sistema vai se incrementando de maneira autônoma, criando versões mais talentosas de si mesmo. "Essa capacidade de aprender cada jogo de novo, sem restrições pelas normas do jogo humano, resulta em um estilo de jogo distinto, pouco ortodoxo, mas criativo e dinâmico", conforme explica a equipe da DeepMind em seu blog oficial.

Participe do nosso GRUPO CANALTECH DE DESCONTOS do Whatsapp e do Facebook e garanta sempre o menor preço em suas compras de produtos de tecnologia.

O AlphaZero, em 2015, se tornou o primeiro programa de computador a vencer um jogador humano de Go, batendo seus próprios recordes nos anos subsequentes, e segue em constante evolução.

Fonte: Geek.com

Gostou dessa matéria?

Inscreva seu email no Canaltech para receber atualizações diárias com as últimas notícias do mundo da tecnologia.