19 enero 2015

Un algoritmo que aprende jugando al póquer

Un programa informático, denominado Cepheus, es capaz de pasar una vida humana jugando al póquer sin que nadie logre vencerlo. Investigadores de la Universidad de Alberta (Canadá) han creado un algoritmo que permite resolver por primera vez juegos en forma extensiva y con información imperfecta, como la versión más extendida del póquer: Limit Texas Hold›em. Los resultados del estudio se han publicado en el último número de la revista Science.



Según la teoría de juegos, el póquer es un juego de información imperfecta, lo cual significa que los datos que manejan los jugadores no son conocidos por el resto, con el añadido de que incluso pueden ser falsos si el jugador se marca un farol.



“Cepheus ha creado y desarrollado su propia estrategia desde cero, únicamente conociendo las normas del juego. El resultado son más de 260 terabytes de información, 1.000 veces más que lo que ocupa la versión en inglés de la Wikipedia”, explica a Sinc Michael Bowling, investigador de la universidad canadiense y uno de los desarrolladores del programa.



Sin embargo, el algoritmo del programa incluye un novedoso método de compresión que permite que la información se almacene finalmente en solo 10 terabytes.



Lo que ha logrado el equipo “es que en una partida de dos jugadores, la posibilidad de una persona de ganar contra la máquina sea insignificante”, añade Bowling. Como entrenamiento, el programa jugó contra sí mismo en 4.000 computadoras durante dos meses.



Durante este tiempo acumuló información sobre cada combinación de cartas posibles que pueden ser repartidas y exploró todas las posibilidades que existen de jugar una mano. Teniendo en cuenta que cada computadora es capaz de analizar 6.000 millones de manos cada segundo, el entrenamiento de Cepheus incluyó más partidas de las que el ser humano ha jugado en la historia.



El algoritmo en el que se basa el programa, llamado CFR+, consiste en un conjunto de ecuaciones matemáticas “con una premisa relativamente simple: La inteligencia de Cepheus es fruto de su entrenamiento. Empieza actuando al azar y, partir de ahí, calcula el valor de todas las acciones posibles en todas las posibles situaciones” explica Bowling.

Los investigadores afirman que este tipo de programa podría ser útil para el tratamiento de otros problemas de información imperfecta en los ámbitos de la seguridad y ciberseguridad y en la toma de decisiones médicas. “El póquer puede tomarse como una representación a escala de las incertidumbres que se presentan en la vida real. Es un gran banco de pruebas para el desarrollo de algoritmos que pueden ser aplicados en importantes tomas de decisiones, incluso cuando no hay adversario aparente”, concluye Michael Bowling. (Fuente: SINC)

No hay comentarios:

Publicar un comentario