Crédito:CC0 Public Domain
La práctica hace la perfección:es un adagio que ha ayudado a los humanos a volverse muy diestros y ahora es un enfoque que se está aplicando a los robots.
Los informáticos de la Universidad de Leeds están utilizando las técnicas de inteligencia artificial (IA) de planificación automatizada y aprendizaje por refuerzo para "entrenar" a un robot para que encuentre un objeto en un espacio desordenado. como un estante de un almacén o en un refrigerador, y muévalo.
El objetivo es desarrollar la autonomía robótica, para que la máquina pueda evaluar las circunstancias únicas que se presentan en una tarea y encontrar una solución, similar a un robot que transfiere habilidades y conocimientos a un nuevo problema.
Los investigadores de Leeds están presentando sus hallazgos hoy (lunes, 4 de noviembre) en la Conferencia Internacional sobre Robótica y Sistemas Inteligentes en Macao, Porcelana.
El gran desafío es que en un área confinada, es posible que un brazo robótico no pueda agarrar un objeto desde arriba. En su lugar, tiene que planificar una secuencia de movimientos para alcanzar el objeto objetivo, quizás manipulando otros elementos fuera del camino. La potencia de la computadora necesaria para planificar una tarea de este tipo es tan grande, el robot a menudo se detendrá durante varios minutos. Y cuando ejecuta el movimiento, a menudo fallará.
Desarrollar la idea de práctica hace perfecto, los informáticos de Leeds están reuniendo dos ideas de la IA.
Uno es la planificación automatizada. El robot puede "ver" el problema a través de un sistema de visión, en efecto, una imagen. El software del sistema operativo del robot simula la posible secuencia de movimientos que podría realizar para alcanzar el objeto objetivo.
Pero las simulaciones que han sido "ensayadas" por el robot no logran capturar la complejidad del mundo real y cuando se implementan, el robot no puede ejecutar la tarea. Por ejemplo, puede tirar objetos del estante.
Entonces, el equipo de Leeds combinó la planificación con otra técnica de inteligencia artificial llamada aprendizaje por refuerzo.
El aprendizaje por refuerzo involucra a la computadora en una secuencia de intentos de prueba y error, alrededor de 10, 000 en total:para alcanzar y mover objetos. A través de estos intentos de prueba y error, el robot "aprende" qué acciones ha planificado es más probable que terminen con éxito.
La computadora asume el aprendizaje por sí misma, comenzando seleccionando al azar un movimiento planificado que podría funcionar. Pero a medida que el robot aprende de prueba y error, se vuelve más hábil para seleccionar los movimientos planificados que tienen una mayor probabilidad de tener éxito.
Dr. Matteo Leonetti, de la Facultad de Informática, dijo:"La inteligencia artificial es buena para permitir que los robots razonen, por ejemplo, hemos visto robots involucrados en partidas de ajedrez con grandes maestros.
"Pero los robots no son muy buenos en lo que los humanos hacen muy bien:ser muy móviles y diestros. Esas habilidades físicas se han integrado en el cerebro humano, el resultado de la evolución y la forma en que practicamos y practicamos y practicamos.
"Y esa es una idea que estamos aplicando a la próxima generación de robots".
Según Wissam Bejjani, un doctorado estudiante que escribió el trabajo de investigación, el robot desarrolla la capacidad de generalizar, para aplicar lo que ha planeado a un conjunto único de circunstancias.
Dijo:"Nuestro trabajo es importante porque combina la planificación con el aprendizaje por refuerzo. Mucha de la investigación para probar y desarrollar esta tecnología se centra sólo en uno de esos enfoques.
"Nuestro enfoque ha sido validado por los resultados que hemos visto en el laboratorio de robótica de la Universidad.
"Con un problema, donde el robot tuvo que mover una gran manzana, primero fue al lado izquierdo de la manzana para alejar el desorden, antes de manipular la manzana.
"Hizo esto sin que el desorden cayera fuera del límite del estante".
Dr. Mehmet Dogar, Profesor Asociado de la Facultad de Informática, también participó en el estudio. Dijo que el enfoque había acelerado el tiempo de "pensamiento" del robot en un factor de diez:las decisiones que tomaban 50 segundos ahora toman 5 segundos.