Crédito:openai
Una letra, bloque multicolor:una tarea trivial espera a los humanos para recogerlo, Voltealo, arrojarlo en la palma de nuestras manos. Para un experto en robots, aunque, esta es una tarea cuesta arriba que es difícil de escalar. La manipulación manual de robots siempre ha sido un desafío.
Entra Dactyl. Un video de OpenAI publicado el lunes, titulado Destreza de aprendizaje, mostró con orgullo su sistema de robot, Dáctilo, que ha sido creado para manipular objetos, de una manera excelente.
El acento está en la palabra destreza. Sus dedos manejan el bloque de una manera bastante notable, incluyendo girar hábilmente el bloque en sus diferentes lados. Aprendió a rotar el bloque en cualquier orientación que quisiera.
Entrenaron una red neuronal convolucional, dijo Espectro IEEE es Evan Ackerman, para controlar una mano de sombra para manipular objetos, en solo 50 horas.
Para estar seguro, la otra razón por la que su mano atrajo el interés fue que se trabajó en un tiempo más corto. Ackerman subrayó la importancia de las reducciones de tiempo para los equipos de robots. (Los números son humillantes. Espectro IEEE mencionó 50 manipulaciones exitosas de cubos como resultado de 6, 144 núcleos de CPU y 8 GPU que recopilan 100 años de experiencia en robots simulados en 50 horas).
Los humanos tardan años en alcanzar niveles "robustos" de manipulaciones manuales. Bien, robots, dijo Ackerman, "no tengo ese tipo de tiempo. Aprender a través de la práctica y la experiencia sigue siendo el camino a seguir para tareas complejas como esta, y el desafío es encontrar una manera de aprender más rápido y de manera más eficiente que simplemente darle a la mano de un robot algo para manipular una y otra vez hasta que aprenda qué funciona y qué no, lo que probablemente llevaría unos cien años ".
Reuters describió de manera similar por qué su trabajo es importante:"El entrenamiento físico lleva meses o años y tiene sus propios problemas, por ejemplo, si la mano de un robot deja caer una pieza de trabajo, un humano necesita recogerlo y guardarlo. Eso también es caro. Los investigadores han buscado recortar esos años de entrenamiento físico y distribuirlos a múltiples computadoras para una simulación de software que pueda hacer el entrenamiento en horas o días. sin ayuda humana ".
Stephen Nellis señaló otro aspecto interesante en el artículo de Reuters. "Los investigadores inyectaron ruido aleatorio en la simulación del software, haciendo que el mundo virtual de la mano del robot sea lo suficientemente desordenado como para que no se confunda con lo inesperado en el mundo real ".
Al elevar el listón de la manipulación manual, el equipo había logrado cubrir variabilidades que no se pueden modelar bien. Ackerman escribió:"Esto incluye la masa y las dimensiones del objeto, fricción tanto de la superficie del objeto como de las yemas de los dedos del robot, qué tan bien se amortiguan las articulaciones del robot, fuerzas del actuador, límites conjuntos, reacción y ruido del motor, y más."
En su publicación en el blog de OpenAI, el equipo dijo que entrenaron una mano de robot similar a un humano para manipular objetos físicos "con una destreza sin precedentes". Notaron cómo Dactyl fue entrenado completamente en simulación, "adaptándonos a la física del mundo real usando técnicas en las que hemos estado trabajando durante el año pasado. Dactyl aprende desde cero usando el mismo algoritmo y código de aprendizaje por refuerzo de propósito general que OpenAI Five".
Es posible capacitar a los agentes en simulación y hacer que resuelvan tareas del mundo real, ellos dijeron, sin un modelado físicamente preciso del mundo.
© 2018 Tech Xplore