Jugadores profesionales de póker pierden ante la inteligencia artificial

Jugadores profesionales de póker pierden ante la inteligencia artificial

Poker, royal flush and gambling chips.
Getty Images

Previamente este año, más de una docena de jugadores profesionales de póker participaron en una poco usual competencia de Texas Hold’em —una modalidad de póker. Los jugadores veteranos se enfrentaron a un novato: un robot con inteligencia artificial construido por Facebook y la Universidad Carnegie Mellon.

La inteligencia artificial (AI) aplastó a los jugadores profesionales de ajedrez y Go, ambos juegos de mesa con reglas muy claras. El póker, también, tiene reglas claras. Pero es considerado más engañoso porque no puedes ver la mano del oponente y exige manipular emociones mediante tácticas como el bluff. La competencia agregó complejidad, ya que cada mano implicaba a seis jugadores, generando más escenarios posibles que la AI debía gestionar. 

Nada de eso detuvo al jugador de póker robótico Pluribus. El bot pasó por encima de sus competidores humanos, que incluían campeones de la Serie Mundial de Póker y del Tour Mundial de Póker. Los investigadores calificaron la actuación del robot como “sobrehumana” .

“Esta es la primera vez que un bot con AI ha probado ser capaz de derrotar a profesionales a cualquier juego establecido con más de dos jugadores (o dos equipos)”, publicó Facebook en su blog.

El dominio de Pluribus sobre los simples mortales representa un avance que podría conducir a aplicaciones de AI en situaciones del mundo real. Esto se debe a que solemos tratar con varias personas e información desconocida cuando se trata de campañas políticas, subastas en línea y amenazas de ciberseguridad. El grupo de investigación afirmó que la AI podría ayudar a las empresas a encontrar las mejores estrategias para manejar dichas situaciones.

“Estamos usando el póker como un punto de referencia para medir el progreso en estos retos más complicados de información oculta dentro de un ambiente más complejo con diversos participantes”, explicó Noam Brown, un científico de la investigación en AI de Facebook. El grupo de investigación, que trabaja con tecnología avanzada de AI, también está enseñando a caminar a un robot por sí solo. 

Brown construyó a Pluribus, cuyo nombre significa “más” en latín, junto con Tuomas Sandholm, un profesor de ciencia computacional de la Universidad Carnegie Mellon (CMU, por sus siglas en inglés) cuyo equipo ha estudiado el póker por computadora durante más de 16 años. Los descubrimientos de ambos fueron publicados en la revista Science el jueves 11 de julio.

Los investigadores desarrollaron dos experimentos, uno en el que un solo humano jugó cinco copias de Pluribus y otro en el que cinco humanos jugaron una sola copia del bot. En ambos casos, Pluribus claramente ganó.

En el primer experimento, Darren Elias y Chris “Jesus” Ferguson, ambos profesionales estadounidenses del póker, jugaron 5,000 manos cada uno contra cinco copias del bot de AI. Elias tiene el récord de la mayor cantidad de títulos del Tour Mundial de Póker y Ferguson ha ganado seis eventos de la Serie Mundial de Póker. Los humanos jugaban desde las computadoras de su casa.

A ambos jugadores se les ofreció US$2,000 para participar en el juego de Texas Hold’em. Para animarlos a jugar mejor, los jugadores podrían ganar US$2,000 adicionales si se desempeñan mejor en contra del robot de AI en comparación con el otro jugador humano de póker.

En general, Pluribus venció a los jugadores con un promedio de 32 milli big blinds (mbb) por juego. El big blind es una apuesta forzada en Texas Hold’em, y la milli big blinds es una medida utilizada para comparar el rendimiento.

En el otro experimento, 13 jugadores, que han ganado más de US$1 millón cada uno profesionalmente, desafiaron la AI del bot. Pluribus jugó contra cinco jugadores humanos a la vez durante 12 días y jugó 10,000 manos.

Pluribus ganó un promedio de 48 milli big blinds por juego. Si cada ficha hubiera valido US$1, el bot habría ganado US$1,000 por hora jugando contra cinco humanos, dijo la publicación del blog de Facebook. El índice de victorias indica que el bot es “más fuerte que los oponentes humanos”, según la investigación.

“En ocasiones, incluso si eres un mal jugador vas a ganarle al mejor jugador del mundo solo por probabilidades de haber tenido una mejor mano”, explicó Sandholm. “No queremos medir ese factor fortuito. Queremos medir el factor de capacidad real”.

Pluribus generó una estrategia para el Texas Hold’em de cero, solo jugando contra sí misma. El bot también utilizó un nuevo algoritmo que le permitía examinar sus opciones con algunos pasos de antelación en lugar de hacerlo hasta el final del juego.

El bot eliminó a su competencia humana utilizando prácticas que los humanos típicamente evitan. Por ejemplo, el bot colocó más “donk bets” que los humanos. La donk bet es una apuesta al inicio de una ronda luego que la partida anterior acabó cuando se pagó por ver.

“Su mayor fortaleza es su habilidad de mezclar estrategias. Es lo mismo que los humanos intentan hacer”, dijo Elias en un comunicado. “Es una cuestión de ejecución de los humanos —hacer esto de una manera perfectamente aleatoria y hacerlo consistentemente. La mayoría de gente simplemente no puede”.


Reproduciendo: Mira esto: Estas muñecas sexuales te pueden dar conversación


4:19

Comparta este artículo