• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Un enfoque de aprendizaje por imitación para entrenar robots sin la necesidad de demostraciones humanas reales

    Figura que explica cómo funciona el enfoque de aprendizaje propuesto por los investigadores. Crédito:Bonardi, James y Davison.

    La mayoría de los seres humanos pueden aprender a completar una tarea determinada observando a otra persona realizarla solo una vez. Robots que están programados para aprender imitando a los humanos, sin embargo, Por lo general, es necesario capacitarlos en una serie de demostraciones humanas antes de que puedan reproducir de manera efectiva el comportamiento deseado.

    Recientemente, los investigadores pudieron enseñar a los robots a ejecutar nuevas tareas haciéndoles observar una única demostración humana, utilizando enfoques de metaaprendizaje. Sin embargo, Por lo general, estas técnicas de aprendizaje requieren datos del mundo real que pueden ser costosos y difíciles de recopilar.

    Para superar este desafío, Un equipo de investigadores del Imperial College de Londres ha desarrollado un nuevo enfoque que permite el aprendizaje de imitación de una sola vez en robots sin la necesidad de demostraciones humanas en el mundo real. Su enfoque presentado en un artículo publicado previamente en arXiv, utiliza algoritmos conocidos como redes de control integradas en tareas (TecNets), que permiten a los agentes artificiales aprender a realizar tareas a partir de una o varias demostraciones, así como datos de entrenamiento generados artificialmente.

    "Demostramos que con las redes de control integradas en tareas, podemos inferir políticas de control incorporando demostraciones humanas que pueden condicionar una política de control y lograr un aprendizaje de imitación de una sola vez, "escriben los investigadores en su artículo.

    El enfoque presentado por los investigadores no requiere ninguna interacción con humanos reales durante el entrenamiento del robot. El método utiliza TechNets para inferir políticas de control, incorporar demostraciones humanas que pueden condicionar una política de control determinada y, en última instancia, permitir el aprendizaje de imitación de una sola vez.

    Para eliminar la necesidad de demostraciones humanas en el mundo real durante el entrenamiento, los investigadores utilizaron un conjunto de datos de videos que simulaban demostraciones humanas, que generaron usando PyRep, un conjunto de herramientas lanzado recientemente para la investigación del aprendizaje de robots. Usando PyRep, los investigadores modelaron un brazo tridimensional similar a un humano y lo dividieron en formas para reproducir movimientos que se asemejan a los observados en humanos.

    Luego crearon un conjunto de datos compuesto por videos en los que este brazo simulado realizaba una serie de tareas y lo usaban para entrenar un sistema robótico. Por último, el robot pudo aprender a completar una tarea con solo analizar estos videos de simulación y una única demostración humana en el mundo real.

    "En tono rimbombante, no utilizamos un brazo humano real para realizar demostraciones durante el entrenamiento, sino que aproveche la aleatorización de dominios en una aplicación que no se ha visto antes:transferencia de simulador a real en humanos, "explican los investigadores en su artículo.

    El equipo evaluó el nuevo enfoque de aprendizaje de una sola vez tanto en simulaciones como en el mundo real, usándolo para entrenar a un robot para que complete tareas que implican colocar y empujar objetos. Notablemente, su método de aprendizaje logró resultados comparables a los logrados con un enfoque basado en el aprendizaje de imitación más convencional, a pesar de que implica entrenar a un robot en videos generados artificialmente en lugar de demostraciones humanas reales.

    Los investigadores escriben, "Pudimos lograr un rendimiento similar a un método alternativo de vanguardia que se basa en miles de demostraciones de capacitación recopiladas en el mundo real, sin dejar de ser robusto a los cambios en el dominio visual, como antecedentes sustancialmente diferentes ".

    El enfoque desarrollado por este equipo de investigadores podría permitir el aprendizaje de imitación de una sola vez para varios robots sin la necesidad de recopilar grandes cantidades de demostraciones humanas del mundo real. Esto podría ahorrarle mucho esfuerzo, recursos y tiempo para aquellos que intentan entrenar robots utilizando el aprendizaje por imitación. Los investigadores ahora planean investigar otras acciones en las que los robots podrían ser entrenados usando su enfoque.

    "Esperamos seguir investigando la variedad de acciones humanas que se pueden transferir de la simulación a la realidad, "escribieron los investigadores en su artículo". Por ejemplo, en este trabajo, hemos demostrado que se puede transferir un brazo humano, pero, ¿funcionaría el mismo método a partir de demostraciones que incluyan todo el torso de un humano? "

    © 2019 Science X Network




    © Ciencia https://es.scienceaq.com