Vocento 15 años 21 de Noviembre, 18:34 pm

Finanzas.com

Recordar mis datos | ¿Olvidaste tu contraseña?

Tecnología

El robot que iba de farol

Joshua Brustein

Los avances de la inteligencia artificial podrían complicar las cosas para los humanos en las partidas de póker online

Cuatro de los mejores jugadores profesionales de póker del mundo pasaron gran parte del mes de mayo en el Casino Rivers, de Pittsburgh, perdiendo. Llegaban a las 11 de la mañana con zapatillas modernas y pantalón de chándal y se sentaban delante de la pantalla. Los cuatro debían jugar 1.500 manos de poker Texas hold'em no-limit heads-up a diario antes de volver a su hotel. Esto suponía a menudo salir más tarde de las 22:00. A lo largo del día, se iban amontonando las tazas de Starbucks y las botellas de agua junto a los teclados de los jugadores y las bolsas de Chipotle, bajo sus pies. 

Su contrincante era un tipo de software llamado Libratus, dirigido desde el Pittsburgh Supercomputing Center, de Monroeville, un barrio de las afueras. Libratus jugaba ocho manos a la vez, dos contra cada oponente. La inteligencia artificial (IA) jugaba distinto que los humanos. Se tomaba pausas interminables en cuanto había algo de dinero en juego, y hacía de repente apuestas enormes de importes irregulares en intervalos extraños. Un comportamiento así, si viniera de un humano, habría resultado irritante, temerario y, a largo plazo, caro. Pero las cualidades de Libratus son inhumanas. 

El torneo de Rivers duró 20 días y terminó el 30 de enero. Para entonces, los profesionales habían perdido 1,8 millones de dólares frente a la inteligencia artificial diseñada por Tuomas Sandholm y Noam Brown, informáticos de la Universidad de Carnegie Mellon. (Los jugadores no tuvieron que pagar). Antes, ese mismo mes de enero, varios investigadores de la Universidad de Alberta habían publicado los resultados de un torneo en el que su software de IA, DeepStack, había vencido a 11 jugadores profesionales de póker en un partida de hold'em no-limit. DeepStack jugó con las mismas reglas específicas que Libratus: partidas de uno contra uno con reposición de fichas tras cada mano, y su margen de victorias resultó ser el triple que el de otros tipos de software.

DESPLUMADOS 

«Es el contrincante más duro contra el que he jugado, y no lo digo por ser generoso», afirmó Jason Les, jugador profesional de póker, en relación a Libratus, durante la última semana del torneo de Rivers. «Nos está desplumando». 

Si bien es cierto que Sandolm y Michael Bowling, profesor en Alberta, discrepan sobre quién debe llevarse el mérito de ser el primero en batir a los mejores humanos, sí coinciden en que la IA ha superado un umbral. Antes, los ordenadores eran capaces de vencer a jugadores mediocres al póker, pero ahora se han mostrado preparados para ganar a los mejores. La comunidad académica lleva más de una década intentando superar este reto. Al contrario de lo que ocurre en el ajedrez y las damas, el póker incluye el elemento de la suerte y de que los jugadores no sepan qué cartas tienen sus oponentes. Los juegos denominados de información imperfecta requieren un tipo de inteligencia más humana: la capacidad de engañar al oponente sin que te engañen a ti. 

«Tiene más consideración de arte que de ciencia», afirma Adam Kucharski, autor del libro The Perfect Bet: How Science and Math Are Taking the Luck Out of Gambling. «Se pensaba que este juego estaría mucho más tiempo a salvo de las máquinas». 

Sandholm y Bowling afirman que batir a los mejores jugadores humanos solo fue un hito más para la IA. «Estos algoritmos no son para el póker», afirma Sandholm, un antiguo windsurfista de alto nivel. Pero hay elementos de programas como Libratus o DeepStack que están pasando de mano en mano. Los programas de póker básicos llevan años jugando dinero online, y varios estudiantes de Bowling han entrado a trabajar en compañías de póker. Al menos uno ha comercializado programas empleados para jugar online. 

Richard Gibson, antiguo investigador de Alberta estaba acabando su doctorado en 2013, cuando un grupo de jugadores profesionales le ofreció dinero por un software que pudieran usar para entrenar. (Parte del acuerdo incluía mantener su anonimato). Gibson afirma que ganó cerca de 100.000 dólares con aquel proyecto en el mejor año, y sus clientes le pagaron entre 20.000 y 30.000 dólares más en tasas relacionadas con la potencia informática que adquirió para ejecutar el software. 

Gibson fundó Robot Shark Gaming, una compañía que diseña programas de IA para estudiar y jugar a juegos de estrategia, así como una compañía de deportes de fantasía llamada SportsBid. En una ocasión, afirma que un cliente le pagó decenas de miles de dólares para que se dedicara seis meses a diseñar un programa de póker básico. No preguntó mucho por los motivos, y tampoco quería saberlos, pero el diseño apuntaba a un uso específico. «Mis clientes querían un dispositivo autónomo que pudieran cargar en su ordenador portátil», afirma. «Supongo que están jugando online con él».

La investigación de la Universidad de Alberta había dejado de trabajar solamente en programas informáticos invencibles a las damas, afirma Darse Billings, una de las personas que contribuyeron a lanzar el programa a finales de los 90 y que ahora dirige la estrategia de póker en la compañía de juegos online Gamesys. Para tomar en cuenta el factor suerte y de información oculta del póker, los investigadores desarrollaron una estrategia basada en un concepto de la teoría de juegos llamado Equilibrio de Nash. La clave es jugar las manos con más potencial, manteniendo la impredictibilidad. «Al apostar con una mano fuerte, tiene que haber dudas», afirma Billing. Esta idea caló en los especialistas de la teoría de juegos, como Bowling, que entró en la facultad de Alberta en 2003, y Sandholm, que comenzó una investigación similar en Carnegie Mellon en 2004. Ambos programas han dado grandes pasos en los dos últimos años. En enero de 2015, el equipo de Bowling publicó un informe en el que demostraba haber desentrañado una versión limit de hold'em heads-up más simple que cualquier versión no-limit, por las restricciones sobre la forma de jugar los jugadores. Sandholm y Brown participaron en el primer torneo de humanos contra robots en el Casino Rivers varios meses después. 

Fallos

Por aquel entonces, su software no alcanzaba aún el nivel de los mejores humanos. El modelo de 2015, Claudico, perdió 732.000 dólares en 80.000 manos. Al contrario que Libratus, tendía a lanzar faroles en el momento equivocado y le costaba tomar en cuenta cómo cambiar las apuestas en función de las cartas que sabía que se habían quitado ya de la baraja. 

A la vista de los intereses cruzados entre la comunidad académica y el sector del juego, es inevitable que este tipo de trabajos acaben filtrándose al juego en el mundo real. Además del flujo constante de contratación de investigadores en el sector privado, el torneo Annual Computer Poker Competition, de Sandholm y Bowling, que nació en 2006, también ha contado con humanos que juegan por dinero. Bowling afirma que sus informes son muy populares en los foros de la gente que está diseñando programas. 

«Por supuesto que mucha gente en el sector del juego está preocupada ante la posibilidad de que acabe matando el juego por dinero, porque a la gente le preocupa que los robots acaben siendo tan buenos que al final no tengan ninguna oportunidad contra ellos», afirma Sandholm. «Es algo que podría pasar, pero en realidad no es mi problema». 

Pese a perder contra Libratus, Les, el profesional del póker, afirma que de momento no le preocupa la inteligencia artificial. Un robot dirigido por científicos y ejecutado por un superordenador es un concepto muy distinto del software con el que cuentan actualmente los sitios de póker online. 

«He jugado contra jugadores que estoy seguro de que eran robots, y les he ganado cantidades importantes de dinero», afirma Les. «Me encanta que exista gente así. Pero evidentemente, a medida que la tecnología vaya avanzando, iré cambiando de opinión».

publicidad
publicidad
publicidad