Crédito:Garg et al.
Los avances en robótica e inteligencia artificial (IA) están permitiendo el desarrollo de agentes artificiales diseñados para ayudar a los humanos en una variedad de entornos cotidianos. Uno de los muchos usos posibles de estos sistemas podría ser escoltar a seres humanos o bienes valiosos que se están transfiriendo de un lugar a otro. defenderlos de amenazas o ataques.
Fascinado por esta idea, un equipo de investigadores de la Universidad de Nuevo México ha presentado recientemente una nueva solución de extremo a extremo para coordinar equipos robóticos de escolta que protegen cargas útiles o bienes de alto valor. La técnica que propusieron, presentado en un artículo publicado previamente en arXiv, se basa en el aprendizaje por refuerzo profundo (RL), lo que implica entrenar algoritmos para hacer predicciones efectivas mediante el análisis de datos.
"Se me ocurrió por primera vez la idea detrás de este estudio cuando pensaba en llevar mi maleta por un aeropuerto abarrotado, "Lydia Tapia, el investigador principal del estudio, dijo a TechXplore. "Pensé para mis adentros:¿Qué pasaría si pudiera ayudarme en la navegación al quedarse conmigo y vigilarme mientras camino?"
Antes de comenzar a desarrollar su solución para coordinar equipos de escolta defensivos, Tapia y su equipo revisaron literatura previa en busca de inspiración o enfoques similares. Desafortunadamente, sin embargo, no pudieron encontrar otros estudios en los que se utilizaran robots para predecir las amenazas entrantes e interceptarlas, proteger a los usuarios humanos y garantizar que lleguen a su destino de forma segura.
"Hay mucho trabajo en los asistentes de navegación, pero sobre todo funcionan haciendo sonar una alarma para evitar que una persona navegue cerca de una amenaza entrante, ", Explicó Tapia." Descubrimos que un equipo de escolta robótico podría tener varias otras aplicaciones en escenarios críticos para la seguridad, mucho más importante que mi maleta del aeropuerto, por eso, enfocamos este documento en la navegación de carga útil, que es una tarea común en la que los escoltas mantienen la carga útil segura mientras navegan ".
Tapia y sus colegas entrenaron su modelo de RL profundo para predecir posiciones y estrategias efectivas para interceptar posibles amenazas. Como otras técnicas de RL, durante el entrenamiento, su modelo pasó por una larga serie de juicios en los que tuvo que proponer acciones para interceptar amenazas y coordinar escoltas, recibir recompensas cuando la estrategia que proponía fue eficaz. Tiempo extraordinario, el modelo aprendió a generalizar lo aprendido durante el entrenamiento y aplicarlo a situaciones completamente nuevas.
"Actualmente no existen métodos inteligentes para resolver este problema, así que mostramos cómo se pueden utilizar agentes con una posición fija, "Dijo Tapia." Sin embargo, como puedes imaginar, necesitaría bastantes agentes defensivos colocados en posiciones regulares para proteger una carga útil de navegación ".
Los investigadores evaluaron su técnica RL en una serie de simulaciones en las que los agentes de escolta protegen a un objetivo específico de amenazas u obstáculos en el entorno circundante. Descubrieron que su modelo superó a los algoritmos de vanguardia para evitar obstáculos, aumentando el éxito de la navegación hasta en un 31 por ciento. Además, Se descubrió que los equipos de escolta coordinados utilizando su técnica protegían con éxito las cargas útiles con una tasa de éxito que era un 75 por ciento mayor que la obtenida por los equipos de escolta en formaciones estáticas.
"El hallazgo más significativo de nuestro trabajo fue poder representar el problema de una manera que sea factible para que el agente aprenda una solución que sea flexible, incluso en circunstancias inesperadas, como la eliminación o adición de agentes, ", Explicó Tapia.
En el futuro, El enfoque desarrollado por Tapia y su equipo en la Universidad de Nuevo México podría usarse para coordinar equipos que escoltan cargas útiles o viajeros humanos. Sin embargo, también podría tener otras aplicaciones, por ejemplo, ayudar al desarrollo de nuevas herramientas para ayudar y escoltar a las personas con discapacidad visual mientras viajan o navegan por entornos desconocidos.
"Estamos entusiasmados de investigar aplicaciones adicionales de este trabajo para nuevos problemas que aún no hemos resuelto, ", Dijo Tapia." Sería bueno ver también a nuestros agentes inteligentes demostrados en hardware ".
© 2019 Science X Network