• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • El enfoque del solucionador de DeepCube podría ir más allá del cubo hacia otras investigaciones

    Una ilustración de DeepCube. El proceso de formación y resolución se divide en ADI y MCTS. Primero, entrenamos iterativamente un DNN estimando el valor real de los estados de entrada utilizando la búsqueda en amplitud. Luego, usar el DNN para guiar la exploración, resolvemos cubos usando Monte Carlo Tree Search. Crédito:arXiv:1805.07470 [cs.AI]

    ¿Desencadenando formas para que una máquina resuelva el cubo de Rubik? Numerosos equipos pueden ponerse de pie y decir que he estado allí, hecho eso. Hemos visto muchos titulares también, sobre cómo registraron para establecer récords de tiempo. Entonces, ¿cuál es el problema con la última historia de cubos de resolución de máquinas?

    David Grossman en Mecánica popular comentó que los científicos de California llevaron las cosas a la tercera dimensión con un algoritmo que puede descubrir cómo resolver un cubo de Rubik.

    Un equipo de la Universidad de California en Irvine está detrás de un enfoque que atrajo especial atención. "Resolviendo el cubo de Rubik sin conocimiento humano" es el título de su artículo, que describe su exploración, y el documento está en arXiv.

    Stephen McAleer, Bosque Agostinelli, Alexander Shmakov y Pierre Baldi son los autores.

    "Presentamos la iteración autodidacta:un novedoso algoritmo de aprendizaje por refuerzo que es capaz de enseñarse a sí mismo cómo resolver el cubo de Rubik sin ayuda humana".

    Paul Lilly en HotHardware :Las máquinas suelen utilizar un método de autoaprendizaje basado en un sistema de recompensas. Los investigadores alimentan a la máquina con las reglas del juego, y luego utiliza un proceso de recompensas para determinar si un movimiento fue bueno o malo,

    Sin embargo, como escribieron los autores, "para muchos entornos de optimización combinatoria, las recompensas son escasas y no se garantiza que los episodios terminen ".

    Tomaron el camino de la iteración autodidacta. Ellos dijeron, "Para resolver el cubo de Rubik mediante el aprendizaje por refuerzo, el algoritmo aprenderá una política. La política determina qué movimiento tomar en un estado determinado ".

    Revisión de tecnología del MIT precisó cómo funciona. "Dado un cubo sin resolver, la máquina debe decidir si un movimiento específico es una mejora de la configuración existente. Para hacer esto, debe poder evaluar el movimiento. La iteración autodidacta hace esto comenzando con el cubo terminado y trabajando hacia atrás para encontrar una configuración que sea similar al movimiento propuesto ".

    Los autores escribieron que "DeepCube descubrió una cantidad notable de conocimiento del Cubo de Rubik durante su proceso de formación, incluido el conocimiento de cómo utilizar grupos de permutación complejos y estrategias similares a los mejores 'speed-cubers' humanos ".

    Su máquina de entrenamiento era un servidor Intel Xeon E5-2620 de 32 núcleos con tres GPU NVIDIA Titan XP. Llamaron a su solucionador DeepCube.

    Evaluación de Lilly:no es una solución perfecta para el problema, pero es impecable en términos de precisión.

    El equipo declaró en el resumen del artículo que "nuestro algoritmo es capaz de resolver el 100% de los cubos codificados aleatoriamente mientras logra una longitud mediana de resolución de 30 movimientos, menos o igual que los solucionadores que emplean el conocimiento del dominio humano".

    Por qué esto es importante:es una historia de resolución de cubos y más. El equipo mencionó metas adicionales.

    "Además de seguir trabajando con el cubo de Rubik, estamos trabajando en la extensión de este método para encontrar soluciones aproximadas a otros problemas de optimización combinatoria, como la predicción de la estructura terciaria de las proteínas. Muchos problemas de optimización combinatoria pueden considerarse problemas de toma de decisiones secuenciales, en cuyo caso podemos utilizar el aprendizaje por refuerzo ".

    Revisión de tecnología del MIT dijo que el nuevo enfoque abordó "un problema importante en la informática:cómo resolver problemas complejos cuando la ayuda es mínima".

    Idealmente, dijo Lilly, "podría conducir a encontrar curas para enfermedades, si el método es capaz de funcionar tan bien en cosas como lo hace con la resolución de un cubo de Rubik ".

    Revisión de tecnología del MIT :"La prueba real, por supuesto, Será la forma en que este enfoque se enfrenta a problemas más complejos, como el plegamiento de proteínas. Estaremos observando para ver cómo funciona ".

    © 2018 Tech Xplore




    © Ciencia https://es.scienceaq.com