¿Vamos a jugar un juego?
mccool/Alamy
Una sola inteligencia artificial puede vencer a jugadores humanos en ajedrez, Go, póquer y otros juegos que requieren una variedad de estrategias para ganar. La IA, llamada Student of Games, fue creada por Google DeepMind, que dice que es un paso hacia una inteligencia artificial general capaz de realizar cualquier tarea con un rendimiento sobrehumano.
Martín Schmid, que trabajó en DeepMind en IA pero que ahora está en una nueva empresa llamada EquiLibre Technologies, dice que el modelo Student of Games (SoG) puede rastrear su linaje hasta dos proyectos. Uno fue pila profunda, la IA creada por un equipo que incluía a Schmid en la Universidad de Alberta en Canadá y que fue la primera en vencer a jugadores profesionales humanos en el póquer. El otro era mente profunda AlphaZero, que ha vencido a los mejores jugadores humanos en juegos como ajedrez y go.
La diferencia entre esos dos modelos es que uno se centra en juegos de conocimiento imperfecto (aquellos en los que los jugadores no conocen el estado de todos los demás jugadores, como sus manos en el póquer) y el otro se centra en juegos de conocimiento perfecto como el ajedrez, donde ambos Los jugadores pueden ver la posición de todas las piezas en todo momento. Los dos requieren enfoques fundamentalmente diferentes. DeepMind contrató a todo el equipo de DeepStack con el objetivo de construir un modelo que pudiera generalizarse en ambos tipos de juegos, lo que llevó a la creación de SoG.
Schmid dice que SoG comienza como un «modelo» sobre cómo aprender juegos y luego mejorarlos mediante la práctica. Este modelo inicial puede luego dejarse llevar por diferentes juegos y aprender a jugar contra otra versión de sí mismo, aprendiendo nuevas estrategias y volviéndose gradualmente más capaz. Pero mientras que el anterior AlphaZero de DeepMind podía adaptarse a juegos de conocimiento perfecto, SoG puede adaptarse tanto a juegos de conocimiento perfecto como a juegos de conocimiento imperfecto, lo que lo hace mucho más generalizable.
Los investigadores probaron SoG en ajedrez, Go, póquer Texas Hold’em y un juego de mesa llamado Scotland Yard, así como en póquer Leduc Hold’em y una versión personalizada de Scotland Yard con un tablero diferente, y descubrieron que podía vencer. varios modelos de IA existentes y actores humanos. Schmid dice que también debería poder aprender a jugar a otros juegos. «Hay muchos juegos que puedes lanzar y sería realmente bueno en eso».
Esta amplia capacidad tiene un ligero coste en rendimiento en comparación con los algoritmos más especializados de DeepMind, pero, no obstante, SoG puede vencer fácilmente incluso a los mejores jugadores humanos en la mayoría de los juegos que aprende. Schmid dice que SoG aprende a jugar contra sí mismo para mejorar en los juegos, pero también para explorar la variedad de escenarios posibles a partir del estado actual de un juego, incluso si se trata de uno con conocimientos imperfectos.
“Cuando estás en un juego como el póquer, es mucho más difícil de entender; ¿Cómo diablos voy a hacer la búsqueda? [for the best strategic next move in a game] ¿Si no sé qué cartas tiene el oponente? dice Schmid. «Así que hubo un conjunto de ideas provenientes de AlphaZero y un conjunto de ideas provenientes de DeepStack en esta gran combinación de ideas, que es Student of Games».
Michael Rovatsos de la Universidad de Edimburgo, Reino Unido, que no participó en la investigación, dice que, si bien es impresionante, aún queda un largo camino por recorrer antes de que se pueda considerar que una IA es inteligente en general, porque los juegos son escenarios en los que todas las reglas y los comportamientos están claramente definidos, a diferencia del mundo real.
«Lo importante a destacar aquí es que se trata de un entorno artificial, autónomo y controlado donde lo que significa todo y cuál es el resultado de cada acción está muy claro», afirma. «El problema es un problema de juguetes porque, aunque puede ser muy complicado, no es real».
Temas: