Aquellos que saben lo difícil que es agarrar las manos de un robot, manejar y maniobrar hará más que mirar, mirar, más bien, en el video reciente que muestra el cubo de OpenAI Dactyl Rubik.
Trabajar con una mano robótica de cuatro dedos y pulgar nunca es trivial cuando el desafío es demostrar una destreza similar a la humana. La mano de OpenAI está ganando miradas apreciativas con sus hábiles manipulaciones con los dedos que una mano humana necesitaría para resolver el cubo.
Aquellos que estén familiarizados con el otro video de OpenAI publicado el año pasado ya conocerían sus avances, con el video titulado Learning Dexterity. El video trataba sobre cómo entrenaron a una mano robótica parecida a un humano para manipular objetos físicos. Incluso entonces sintieron que podían presumir de que la mano del robot podía hacer esto con una "destreza sin precedentes".
Así es como introdujeron su sistema, Dáctilo. Dijeron que Dactyl aprende desde cero utilizando un algoritmo y código de aprendizaje reforzado de propósito general. "Nuestros resultados muestran que es posible capacitar a los agentes en simulación y hacer que resuelvan tareas del mundo real, sin un modelado físicamente preciso del mundo ".
Un ingeniero de aprendizaje automático les dijo a los espectadores de video que la técnica se denominó aleatorización de dominio.
Aleatorizaron qué tan rápido se puede mover la mano, por ejemplo, y lo pesado que es el bloque, y la fricción entre el bloque y la mano.
Dos comentarios del video de hace un año pensaron que esto no era realmente IA:"'IA' es realmente solo algoritmos abstractos en este punto. Ni siquiera estamos cerca de entender qué es la inteligencia, y mucho menos cómo sintetizarlo ".
El otro comentario:"Esto no es más que una programación inteligente ... no hay inteligencia en absoluto. Esto es simplemente una máquina que hace lo que ha sido programado para hacer de una manera circular. Simplemente programe la cosa para que gire los bloques de la manera correcta". desde el principio y ahórrese algo de tiempo y esfuerzo ... Una computadora sólo hará lo que está programada para hacer ".
Todavía, Karen Hao en Revisión de tecnología del MIT pensó que la mano robótica del equipo era un paso importante hacia robots más ágiles para aplicaciones industriales y de consumo.
Avance rápido a su nuevo artículo, "Resolver el cubo de Rubik con una mano robótica".
Los autores explicaron que "Demostramos que los modelos entrenados solo en simulación pueden usarse para resolver un problema de manipulación de complejidad sin precedentes en un robot real. Esto es posible gracias a dos componentes clave:un algoritmo novedoso, lo que llamamos aleatorización automática de dominios (ADR) y una plataforma de robot creada para el aprendizaje automático ".
Hablaron sobre su rotación combinada de flip y top face.
"Una rotación corresponde a rotar una sola cara del cubo de Rubik en 90 grados en el sentido de las agujas del reloj o en el sentido contrario a las agujas del reloj. Un giro corresponde a mover una cara diferente del cubo de Rubik hacia la parte superior. Descubrimos que girar la cara superior es mucho más simple que rotar otras caras. Por lo tanto, en lugar de girar caras arbitrarias, combinamos un giro y una rotación de la cara superior para realizar la operación deseada. Estos subobjetivos se pueden realizar secuencialmente para eventualmente resolver el cubo de Rubik ".
Abordaron cualquier sospecha de que se habían dado una ventaja injusta con un cubo idealmente revuelto.
"La dificultad de resolver un cubo de Rubik obviamente depende de cuánto se haya codificado antes. Usamos el método de codificación oficial utilizado por la Asociación Mundial de Cubos para obtener lo que ellos denominan una codificación justa (alrededor de 20 movimientos que se aplican a un resolvió el cubo de Rubik para revolverlo).
¿Qué pensaron otros roboticistas sobre la mano del equipo de OpenAI en una racha con el rompecabezas de Rubik?
Hao citó a Dmitry Berenson, roboticista de la Universidad de Michigan.
"Este es un problema realmente difícil, ", dijo." El tipo de manipulación necesaria para rotar las partes del cubo de Rubik es en realidad mucho más difícil que rotar un cubo ".
Pero, ¿qué quiere decir el equipo cuando se refieren a modelos entrenados en simulación? Karen Hao en Revisión de tecnología del MIT dijo que construyen un modelo virtual de su robot. Lo entrenan virtualmente para hacer la tarea que tienen entre manos. "El algoritmo aprende en la seguridad del espacio digital y luego puede ser trasladado a un robot físico". Ahora, la clave de su éxito:Ho dijo que "el laboratorio codificó las condiciones simuladas en cada ronda de entrenamiento para hacer que el algoritmo sea más adaptable a las diferentes posibilidades".
Usaron la (1) Mano Shadow Dexterous E Series como mano robótica, (2) el sistema de captura de movimiento PhaseSpace para rastrear las coordenadas cartesianas de las yemas de los dedos y (3) se utilizaron tres cámaras RGB Basler para la estimación de la pose de visión.
¿Que sigue?
En un blog, Los miembros del equipo afirmaron que "Resolver el Cubo de Rubik con una mano de robot todavía no es fácil. Nuestro método actualmente resuelve el Cubo de Rubik el 20% del tiempo cuando se aplica una mezcla de máxima dificultad que requiere 26 rotaciones de caras. Para combinaciones más simples que requieren 15 rotaciones para deshacer, la tasa de éxito es del 60%.
Sin embargo, OpenAI no se trata de alejarse de la dificultad. "Creemos que la destreza a nivel humano está en el camino hacia la construcción de robots de uso general y estamos emocionados de seguir adelante en esta dirección".
© 2019 Science X Network