Una descripción de cómo funciona el método:una cámara adquiere una transmisión de video en vivo de una escena, y las posiciones y relaciones de los objetos en la escena se infieren en tiempo real por un par de redes neuronales. Las percepciones resultantes se alimentan a otra red que genera un plan para explicar cómo recrear esas percepciones. Finalmente, una red de ejecución lee el plan y genera acciones para el robot, teniendo en cuenta el estado actual del mundo para garantizar la robustez a las perturbaciones externas. Crédito:NVIDIA
Los investigadores de NVIDIA se han propuesto enseñar a un robot a completar una tarea, aquí está el truco, simplemente observando las acciones de un humano. Las redes fueron capacitadas como se describe en un video. El sistema fue probado en el mundo real en un problema de escoger y colocar de apilar cubos de colores, y utilizaron un robot Baxter.
Un equipo de seis autores discutió este trabajo, "Redes neuronales entrenadas sintéticamente para aprender planes legibles por humanos a partir de demostraciones del mundo real". Su éxito involucró a un robot que pudo aprender una tarea de una sola demostración en el mundo real.
Por qué es importante:los planificadores exploran preguntas sobre cómo los humanos trabajarán junto con los robots:¿con qué seguridad y eficiencia se puede hacer esto? Los autores lo expresaron claramente. "Para que los robots realicen tareas útiles en entornos del mundo real, debe ser fácil comunicar la tarea al robot; esto incluye tanto el resultado final deseado como cualquier sugerencia sobre los mejores medios para lograr ese resultado ".
Frederic Lardinois en TechCrunch intervino:"Los robots industriales normalmente se tratan de repetir una tarea bien definida una y otra vez. Por lo general, eso significa realizar esas tareas a una distancia segura de los frágiles humanos que las programaron. Más y más, sin embargo, los investigadores ahora están pensando en cómo los robots y los humanos pueden trabajar en estrecha proximidad con los humanos e incluso aprender de ellos ".
Lardinois dijo Dieter Fox, el director senior de investigación en robótica de NVIDIA, le dijo que el equipo quería habilitar esta próxima generación de robots que pueden trabajar de manera segura en las proximidades de los humanos. Los robots deberán aprender cómo pueden ayudar a las personas, ya sea en entornos industriales o en los hogares de las personas.
El equipo mostró un sistema para inferir y ejecutar un programa legible por humanos a partir de una demostración del mundo real.
El sitio de desarrolladores de NVIDIA dijo que este era el primer sistema de aprendizaje profundo de su tipo que puede enseñar a un robot a completar una tarea con solo observar las acciones de un humano. "Con demostraciones, un usuario puede comunicar una tarea al robot y proporcionar pistas sobre cómo realizarla mejor ".
Su sistema involucró una serie de redes neuronales. Cómo trabajaron:los investigadores entrenaron una secuencia de redes neuronales para realizar tareas asociadas con la percepción, generación y ejecución de programas.
Su técnica:una cámara adquirió una transmisión de video en vivo de una escena donde las posiciones y relaciones de los objetos se infirieron en tiempo real por un par de redes neuronales. Estos se enviaron a otra red que generó un plan para explicar cómo recrear esas percepciones. Una red de ejecución leyó el plan y generó acciones para el robot.
¿Qué distingue su exploración de la investigación anterior? La diferencia radica en el entrenamiento de redes neuronales. Los enfoques actuales requieren grandes cantidades de datos de entrenamiento etiquetados, un "cuello de botella serio en estos sistemas, ", dijo el sitio de NVIDIA.
A diferencia de, "Con la generación de datos sintéticos, se puede producir una cantidad casi infinita de datos de entrenamiento etiquetados con muy poco esfuerzo ".
Lardinois en TechCrunch calificó su investigación como "un paso importante en este viaje general que nos permitirá enseñarle rápidamente a un robot nuevas tareas".
Dado el fuerte aspecto visual de este proceso de formación, el escribio, La experiencia de Nvidia en hardware de gráficos sin duda ayuda. TechSpot señaló cómo "Ejecutar todas esas redes neuronales requiere algunas capacidades informáticas importantes".
Los investigadores utilizaron GPU NVIDIA TITAN X.
Jonathan Tremblay, Gracias a Artem Molchanov, Stephen Tyree, Jan Kautz, Stan Birchfield es el equipo detrás del periódico.
© 2018 Tech Xplore