Pipeline completo para entrenar el modelo de evaluación. Crédito:arXiv:1907.08321 [cs.LG]
El ajedrez y la IA vuelven a ser noticia, esta vez en informes sobre un equipo que explora un modelo de ajedrez a través del procesamiento del lenguaje natural (PNL). El mecanismo de aprendizaje era la charla de ajedrez, charla bien escogida. Se entrenaron previamente en sentimientos de comentarios que estaban asociados con movimientos de ajedrez. Los sentimientos guiaron la toma de decisiones del agente.
Su algoritmo de ajedrez resultante fue diseñado para evaluar la calidad de los movimientos de ajedrez analizando la reacción de comentaristas expertos.
Los tres investigadores del University College London escribieron un artículo que describe sus métodos y resultados. Isaac Kamlish, Isaac Chocron y Nicholas McCarthy escribieron "SentiMATE:aprender a jugar al ajedrez a través del procesamiento del lenguaje natural, "y está actualizado en arXiv. El documento se envió el mes pasado.
"Presentamos SentiMATE, un novedoso modelo de aprendizaje profundo de un extremo a otro para el ajedrez, empleando el procesamiento del lenguaje natural que tiene como objetivo aprender una función de evaluación efectiva que evalúa la calidad del movimiento. Esta función está pre-entrenada en el sentimiento de los comentarios asociados con los movimientos de entrenamiento, y se utiliza para guiar y optimizar la toma de decisiones del agente en el juego ".
No invite a AlphaZero y este modelo de PNL a la misma fiesta; se quedarían en lados opuestos de la habitación. Los investigadores escribieron que AlphaZero de Deep Mind había tenido éxito "después de millones de iteraciones de auto-juego y usando miles de Unidades de Procesamiento Tensorial (TPU)". Ese no fue el caso en la nueva investigación.
En lugar de, ellos dijeron, tenían como objetivo "abordar la evaluación de la calidad de los movimientos individuales mediante el uso del procesamiento del lenguaje natural ... Se extrajeron datos de diferentes sitios web de ajedrez, que incluía información sobre los movimientos que se estaban realizando, y una evaluación cualitativa de los movimientos en sí en forma de comentario, escrito por una amplia gama de ajedrecistas; resultando en una gran base de datos de movimientos con comentarios anotados ".
"Evalúa la calidad de los movimientos de ajedrez analizando la reacción de comentaristas expertos, "dijo Will Knight, Revisión de tecnología del MIT .
Los investigadores eliminaron los comentarios que no se relacionaban con movimientos de alta calidad y ejemplos que eran demasiado ambiguos. añadió. "Luego utilizaron un tipo especial de red neuronal recurrente e incrustaciones de palabras (una técnica matemática que conecta las palabras en función de sus significados), entrenado en otro modelo de vanguardia para analizar el lenguaje ".
El algoritmo llamado SentiMATE, elaboró por sí mismo las reglas básicas del ajedrez, así como varias estrategias clave, incluido el bifurcación y el enroque.
El equipo descubrió que SentiMATE era capaz de evaluar movimientos de ajedrez "basándose en una función de evaluación de sentimientos previamente entrenada". Llegaron a la conclusión de que había pruebas sólidas que respaldaban el uso del procesamiento del lenguaje natural para entrenar una función de evaluación en los motores de ajedrez.
El rendimiento de su solución fue menos que espectacular. Knight dijo:"No logró vencer consistentemente a algunos bots de ajedrez convencionales". Ese, sin embargo, no debe distraerse del hecho de que SentiMATE funcionó, y la forma en que funcionó:
"SentiMATE sorprendió a los investigadores con su capacidad para resolver algunos de los principios básicos del ajedrez, así como varias estrategias clave, como bifurcación (cuando dos o más piezas están amenazadas simultáneamente) y enroque (cuando el rey y el enroque se mueven a una posición más defensiva en la parte posterior del tablero, "dijeron los autores.
La conclusión importante está en los esfuerzos por diseñar un programa de este tipo:¿puede el lenguaje servir para enseñar a jugar al ajedrez con menos datos de práctica requeridos que en los enfoques convencionales?
Tibi Puiu en Ciencia ZME Pensé en eso:
"Solo esta vez, su programa de aprendizaje automático no practicó millones de juegos para dominar el ajedrez, sino que analizó el lenguaje de comentaristas expertos. Algún día, los investigadores dicen que un enfoque similar podría permitir a las máquinas descifrar el lenguaje emocional y adquirir habilidades que de otro modo habrían sido inaccesibles a través de la 'fuerza bruta' ".
En cuanto a que el modelo no es un súper campeón de ajedrez, él dijo, "El rendimiento de alto nivel no era su objetivo, aunque. Donde brilla SentiMATE es en su capacidad de usar el lenguaje para adquirir una habilidad en lugar de practicarla ".
En su papel los autores hablaron sobre el importantísimo conjunto de datos para respaldar su investigación. "Al limpiar y clasificar el conjunto de datos según los comentarios, Bitificando los movimientos de Ajedrez, y aplicar el análisis de sentimiento al comentario, presentamos SentiChess un conjunto de datos de 15, 000 movimientos de ajedrez representados en formato de bits, junto con su evaluación de comentarios y sentimientos. Este conjunto de datos se ofrece con la esperanza de un mayor desarrollo del trabajo en torno a los modelos de ajedrez basados en sentimientos, y análisis estadístico de movimientos ".
Avanzando Will Knight dijo que la charla relacionada con el juego podría ayudar a los programas de IA a aprender a jugar el juego de una manera nueva. Y, más allá del ajedrez, "la misma técnica podría permitir a las máquinas utilizar el contenido emocional de nuestro lenguaje para dominar diversas tareas prácticas".
(Como el Revisión de tecnología del MIT el subtítulo lo puso, "Las máquinas que aprecian los movimientos de ajedrez 'brillantes' y 'tontos' podrían aprender a jugar y hacer otras cosas de manera más eficiente").
© 2019 Science X Network