Crédito:CC0 Public Domain
El juego de cartas Hanabi ha sido asumido como un desafío por la IA de Facebook, y es todo un desafío teniendo en cuenta que están entrando en un reino donde jugar no es solo una cuestión de que un oponente derrote a otro, sino un juego de cartas "cooperativo" en el que un equipo en competencia se ayuda mutuamente.
Jonathan Vanian, Fortuna , guió a los lectores a través del juego como medio de presentación:
"...:los equipos de dos a cinco jugadores reciben cartas al azar de diferentes colores y números que representan puntos. El objetivo de los equipos es poner las cartas sobre una mesa, agrupados por color, en el orden numérico correcto. El problema, sin embargo, es que los jugadores no pueden ver sus propias cartas mientras que sus compañeros sí pueden. Un jugador puede dar pistas a otro, como hacer un comentario sobre cierto color, eso le indicaría al otro que haga algo como jugar o descartar una carta. El dilema es que el jugador debe deducir qué significa la pista de su compañero de equipo ".
Los líderes corporativos han mostrado una inclinación hacia Hanabi como una experiencia de aprendizaje de formación de equipos; ahora se ha ganado la atención de los investigadores de IA que están pensando en construir sistemas de IA destacados.
"Obtener puntajes casi perfectos en un oscuro juego de cartas francés es genial y todos, excepto Facebook, tienen planes más grandes para su IA cooperativa, " dijo Engadget .
Investigador de Facebook, Tom Lerer, fue citado en Engadget :"Lo que estamos viendo son agentes artificiales que pueden razonar mejor sobre interacciones cooperativas con humanos y chatbots que pueden razonar sobre por qué la persona con la que están chateando dijo lo que hicieron ... Chatbots que pueden razonar mejor sobre por qué la gente decir las cosas que hacen sin tener que enumerar todos los detalles de lo que piden es una aplicación muy sencilla de este tipo de técnica de búsqueda ".
¿Qué estrategias de IA pusieron en práctica los investigadores?
Vanian identificó una técnica de búsqueda utilizada previamente por DeepMind; permitió que varios bots de Hanabi evaluaran múltiples opciones de juego mientras compartían información entre ellos. Combinado con el aprendizaje por refuerzo, los bots de Facebook aprendieron a jugar a Hanabi entre ellos.
Los autores detrás de esta investigación escribieron un artículo discutiendo su trabajo y el artículo está en arXiv (publicado en el Inteligencia artificial diario). "The Hanabi Challenge:A New Frontier for AI Research" es el título del artículo, y los autores dijeron que tomaron a Hanabi como un "dominio de desafío con problemas novedosos que surgen de su combinación de juego puramente cooperativo e información imperfecta en un entorno de dos a cinco jugadores".
Los autores comentaron que se describe mejor como un tipo de solitario en equipo y la información imperfecta del juego surge de que cada jugador no puede ver sus propias cartas (las que tienen y sobre las que pueden actuar), cada uno de los cuales tiene un color y rango.
Para obtener resultados de investigación reproducibles, los autores lanzaron un entorno Hanabi RL de código abierto llamado Hanabi Learning Environment escrito en Python y C ++.
En otros lugares, pero relevantes para sus objetivos en la investigación reproducible, Jerome Pesenti, vicepresidente de IA en Facebook, estuvo en una reciente sesión de preguntas y respuestas con Will Knight en Cableado .
Knight le preguntó a Pesenti sobre la recreación de una investigación innovadora.
"Es algo que le apasiona a Facebook AI, ", dijo Pesenti." Cuando la gente hace cosas que no son reproducibles, crea muchos desafíos. Si no puede reproducirlo, es una gran pérdida de inversión ... La belleza de la IA es que, en última instancia, se trata de sistemas administrados por computadoras. Entonces es un candidato principal, como un subcampo de la ciencia, ser reproducible. Creemos que el futuro de la IA será algo en lo que sea reproducible casi de forma predeterminada. Intentamos abrir la mayor parte del código que producimos en IA, para que otras personas puedan construir sobre él ".
Los autores, en su papel, tener una sección con la cruceta "Hanabi:The Benchmark".
Este esfuerzo de investigación trata sobre el uso de Hanabi como un problema de referencia desafiante para la IA. Las propiedades únicas lo distinguen de otros puntos de referencia. "Es un problema de aprendizaje de múltiples agentes, diferente a, por ejemplo, el entorno de aprendizaje Arcade. También es un juego de información imperfecto, donde los jugadores tienen un conocimiento asimétrico sobre el estado del medio ambiente, lo que hace que el juego se parezca más al póquer que al ajedrez, chaquete, o ir."
Andrew Tarantola en Engadget recogido en este punto. La vida en el mundo real no es un juego de suma cero como el póquer o Starcraft, él dijo, "y necesitamos que la IA trabaje con nosotros, no contra nosotros ".
Dos Engadget Los comentarios de los lectores no mostraron asombro por lo que se ha logrado hasta ahora. "Estoy bastante seguro de que tener conocimiento de cómo los humanos suelen jugar un solo juego de cartas y un conocimiento general de las intenciones humanas son dos cosas muy diferentes, "dijo uno. Otro dijo que" identificar patrones de acción está muy lejos de la teoría de la mente ... Se podría argumentar si están intentando atribuir la teoría de la mente, su precisión necesita mejorar ".
© 2019 Science X Network