Software conhecido como DeepStack pode vencer qualquer um no Poker

vencer-qualquer-um-no-poker
0 414

Cientistas da computação da Universidade de Alberta no Canadá relatam que seu programa, conhecido como DeepStack, derrotou os jogadores profissionais de poker, jogando 3.000 mãos contra cada um.

O programa não ganhou todas as mãos – às vezes a sorte do sorteio foi contra ele. Mas depois que os resultados foram computados, DeepStack bateu 10 de 11 tubarões do poker, os cientistas relataram hoje na Science. (DeepStack também venceu o 11º concorrente, mas essa vitória não foi estatisticamente significativa.)

“Este trabalho é muito impressionante”, diz o cientista de computação Dr. Murray Campbell, um dos criadores do Deep Blue, o computador que venceu o grande mestre de xadrez Garry Kasparov em 1997. DeepStack “teve uma enorme margem de vitória”, diz Campbell, da IBM Thomas J Centro de Pesquisa Watson em Yorktown Heights, NY

Da mesma forma, cientistas da computação liderados por Tuomas Sandholm da Carnegie Mellon University em Pittsburgh derrubaram recentemente quatro jogadores de elite noTexas Hold’em com um programa chamado Libratus. Cada participante jogou 30.000 mãos contra o programa durante um torneio realizado em janeiro em Pittsburgh. Libratus era “muito mais resistente do que qualquer outro ser humano que já joguei”, diz Jason Les, profissional do poker.

O poker

Nesse jogo de cartas, cada jogador recebe duas cartas voltadas para baixo e ambos os jogadores compartilham cinco cartas distribuídas de face para cima, com rodadas de apostas entre os estágios de negociação. Ao contrário de xadrez ou Go, onde ambos os jogadores podem ver todas as peças no tabuleiro, no poker, algumas informações estão escondidas – as duas cartas na mão de cada jogador. Esses jogos, conhecidos como jogos de informação imperfeita, são particularmente difíceis de dominar pelos computadores.

Para aperfeiçoar a técnica de DeepStack, os pesquisadores usaram o aprendizado profundo – um método de aprendizagem mecânica que formula um senso de intuição de quando segurá-los e quando dobrá-los. Quando é a vez do programa, ele classifica através de opções para suas próximas ações e decide o que fazer. Como resultado, a natureza de DeepStack “parece muito mais com seres humanos”, diz Bowling.

Libratus calcula uma estratégia para o jogo antes do tempo e atualiza-se como ele joga para corrigir falhas em suas táticas que seus oponentes humanos revelaram. Perto do final de um jogo, Libratus muda para o cálculo em tempo real, durante o qual ele aperfeiçoa ainda mais seus métodos. Libratus é tão computacionalmente exigente que exige um supercomputador para executar. (DeepStack pode ser executado em um laptop.)

Ensinar computadores a jogar jogos com informações ocultas, como o poker, pode eventualmente levar a aplicações na vida real. “Toda a área de jogos de informação imperfeita é um passo em direção à confusão do mundo real”, diz Campbell. Computadores que podem lidar com essa bagunça poderia ajudar com negociações comerciais ou leilões, e poderia ajudar a proteger contra riscos ocultos, em cibersegurança, por exemplo.

Fonte: Science

Deixe um comentário

Esse site utiliza cookies para melhorar sua experiência Aceitar Leia Mais