• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Nuevo método propuesto para lograr un mejor autoaprendizaje de robots

    Investigadores que realizan experimentos en robots móviles. Crédito:HU Yanming

    Los seres humanos muestran una capacidad de adaptación asombrosa cuando se enfrentan a tareas complejas de la vida diaria. Esta adaptabilidad es la encarnación directa de la capacidad de aprendizaje individual, que permite a los seres humanos mejorar su propia capacidad de comportamiento de forma independiente e incremental.

    Por lo tanto, si los robots pueden tener esta habilidad, pueden generar automáticamente nuevos patrones de comportamiento de acuerdo con la adquisición de datos y casos en tiempo real. Esta habilidad muestra una inteligencia obvia, que se llama inteligencia conductual.

    Recientemente, el investigador del Instituto Shenyang de automatización de la Academia de Ciencias de China desarrolló un nuevo método desarrolló un nuevo método para mejorar la inteligencia conductual de los robots, los resultados relacionados fueron publicados en Transacciones IEEE sobre sistemas cognitivos y de desarrollo .

    El investigador propuso un nuevo marco de método de aprendizaje incremental basado en Q-Learning y modelo adaptativo kernel lineal (AKL). El marco permite al robot aprender nuevos comportamientos sin olvidar los anteriores. Bajo el nuevo método, Los comportamientos de los robots pueden evaluarse mediante el aprendizaje autónomo y el aprendizaje por imitación, y la estructura y los parámetros del modelo se pueden cambiar en tiempo real utilizando un nuevo algoritmo de mínimos cuadrados recursivos del núcleo de la norma L2 (L2-KRLS).

    Además, realizaron dos experimentos para validar el desempeño del nuevo método. Los resultados mostraron que el marco propuesto puede aprender comportamientos de manera incremental en diferentes entornos. El Q-learning basado en políticas y codicioso local es más rápido que los algoritmos de Q-learning existentes. En el presente, este logro se ha aplicado en la navegación autónoma de robots.


    © Ciencia https://es.scienceaq.com