IA da DeepMind vence os melhores jogadores de Combate do mundo

Por Alveni Lisboa | Editado por Douglas Ciriaco | 06 de Dezembro de 2022 às 18h15

Link copiado!

Uma inteligência artificial (IA) da DeepMind, empresa subsidiária da Alphabet (a proprietária do Google), aprendeu a vencer boa parte dos melhores jogadores de Stratego — conhecido como Combate, no Brasil — do planeta. A DeepNash, como foi chamada, desenvolveu sua habilidade a ponto de derrotar estrategistas humanos em 84% das vezes e bots em 97%.

Stratego é um jogo de tabuleiro e online de guerra no qual um precisa capturar a bandeira do outro. Os jogadores devem dispor suas 40 peças como preferir, deixando-as escondida do oponente. Cada uma tem um nível de força diferente, por isso é preciso muita estratégia não somente para posicionar o seu exército como também para movê-lo.

Continua após a publicidade

A DeepMind tem várias outras IAs que aprenderam a jogar games mais "simples", como Go, poker e xadrez, que dependem muito mais de matemática (cálculo de probabilidades). No caso de Combate, isso é muito mais difícil porque existem inúmeras variantes surpresas, assim o jogador precisará mudar seu estilo conforme a situação atual da partida.

Segundo a empresa, o nível de dificuldade pode ser mensurado conforme os chamados "estados de jogo", ou seja, a quantidade de situações aleatórias que podem ocorrer durante uma partida. Em Go, a quantidade de possibilidades é 10 elevado a 360, enquanto em Stratego é de 10 elevado a 535.

Como funciona a IA que superou adversários em Combate?

O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia

A DeepNash usa uma abordagem inovadora, baseada na teoria dos jogos e em aprendizagem profunda, sem um modelo delimitado. Isso significa que o computador sempre vai corrigir suas falhas a cada partida para se sair melhor nas próximas.

Não há como criar um modelo específico para o Stratego porque o jogo envolve uma centena de movimentos antes de um jogador vencer. São várias ações sequenciais (nem sempre lógicas) e fatores extras que não possuem ligação óbvia entre si para se chegar à vitória.

Em vez da modelagem, a IA é alimentada por uma nova ideia algorítmica da teoria do jogo chamada Regularized Nash Dynamics (R-NaD). O R-NaD direciona o comportamento de aprendizado da DeepNash para o que é conhecido como equilíbrio de Nash. De modo geral, significa dizer que nunca será criado um padrão, porque a inteligência vai sempre buscar soluções diferentes para situações específicas das partidas.

Por que a DeepNash é incrível?

Continua após a publicidade

A DeepNash teria se tornado tão boa em Combate que alcançou o top 3 de todos os tempos, derrotando especialistas humanos na Gravon, a maior plataforma do game no mundo. A IA teria desenvolvido uma estratégia um tanto quanto imprevisível para enganar o oponente com um chamariz.

Segundo relatos dos criadores, a máquina teria até aprendido a blefar jogando peças de baixo nível, como soldados, fingindo ser de alto nível, como coronéis ou generais. Essa é uma estratégia bastante usada pelos jogadores de carne e osso, mas surpreende pelo elevado nível de inteligência necessário para reproduzi-la.

“O nível de jogo da DeepNash me surpreendeu”, disse em comunicado o coautor de um novo artigo sobre a IA publicado na revista Science, Vincent de Boer, que também é ex-campeão mundial da Stratego. "Eu nunca tinha ouvido falar de um jogador artificial de Combate que chegasse perto do nível necessário para vencer uma partida contra um jogador humano experiente", explicou.

Continua após a publicidade

O algoritmo resultante dessa tecnologia deve ser aplicado futuramente para outros jogos de dois jogadores. Após testes em outros games, a ideia é trazer a IA para resolver problemas do mundo real em grande escala, já que o planeta está cheio de informações imperfeitas e espaços de estado inconstantes, como ocorre em Combate em menor grau.

Uma das aplicações seria na otimização da escala de gestão de tráfego, como forma de reduzir o tempo de viagem do motorista e as emissões associadas aos veículos. "Ao criar um sistema de IA generalizável que seja robusto diante da incerteza, esperamos trazer os recursos de resolução de problemas da IA ainda mais para o nosso mundo inerentemente imprevisível", concluiu a DeepMind em seu site.