Un modelo inventado por el MIT optimiza de manera eficiente y simultánea el control y el diseño de robots blandos para tareas específicas, que tradicionalmente ha sido una empresa monumental en computación. El modelo, por ejemplo, fue significativamente más rápido y más preciso que los métodos de vanguardia para simular cómo los robots cuadrúpedos (en la imagen) deberían moverse para llegar a los destinos de destino. Crédito:Andrew Spielberg, Daniela Rus, Wojciech Matusik, Allan Zhao, Tao Du, y Yuanming Hu
Los investigadores del MIT han inventado una forma de optimizar de manera eficiente el control y el diseño de robots blandos para tareas específicas. que tradicionalmente ha sido una empresa monumental en computación.
Los robots blandos tienen elásticos, flexible, Cuerpos elásticos que esencialmente pueden moverse en un número infinito de formas en un momento dado. Computacionalmente, esto representa una "representación estatal muy compleja, "que describe cómo se mueve cada parte del robot. Las representaciones de estados para robots blandos pueden tener potencialmente millones de dimensiones, lo que dificulta el cálculo de la forma óptima de hacer que un robot complete tareas complejas.
En la Conferencia sobre sistemas de procesamiento de información neuronal el próximo mes, los investigadores del MIT presentarán un modelo que aprende un compacto, o "de baja dimensión, "representación estatal detallada, basado en la física subyacente del robot y su entorno, entre otros factores. Esto ayuda a que el modelo co-optimice iterativamente el control de movimiento y los parámetros de diseño de materiales para tareas específicas.
"Los robots blandos son criaturas de dimensiones infinitas que se doblan de mil millones de formas diferentes en un momento dado, "dice el primer autor Andrew Spielberg, estudiante de posgrado en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL). "Pero, en verdad, Hay formas naturales en las que es probable que los objetos blandos se doblen. Encontramos que los estados naturales de los robots blandos se pueden describir de manera muy compacta en una descripción de dimensiones reducidas. Optimizamos el control y el diseño de robots blandos aprendiendo una buena descripción de los estados probables ".
En simulaciones, el modelo permitió a robots blandos 2-D y 3-D completar tareas, como moverse a ciertas distancias o alcanzar un punto objetivo, de manera más rápida y precisa que los métodos actuales de última generación. A continuación, los investigadores planean implementar el modelo en robots blandos reales.
Junto a Spielberg en el papel están los estudiantes graduados de CSAIL, Allan Zhao, Tao Du, y Yuanming Hu; Daniela Rus, director de CSAIL y el profesor Andrew y Erna Viterbi de Ingeniería Eléctrica e Informática; y Wojciech Matusik, profesor asociado del MIT en ingeniería eléctrica e informática y director del Grupo de Fabricación Computacional.
"Aprendizaje en el ciclo"
La robótica blanda es un campo de investigación relativamente nuevo, pero es prometedor para la robótica avanzada. Por ejemplo, los cuerpos flexibles podrían ofrecer una interacción más segura con los humanos, mejor manipulación de objetos, y más maniobrabilidad, entre otros beneficios.
El control de los robots en las simulaciones se basa en un "observador, "un programa que calcula variables que ven cómo se mueve el robot blando para completar una tarea. En trabajos anteriores, los investigadores descompusieron el robot blando en grupos de partículas simuladas diseñadas a mano. Las partículas contienen información importante que ayuda a reducir los posibles movimientos del robot. Si un robot intenta doblarse de cierta manera, por ejemplo, los actuadores pueden resistir ese movimiento lo suficiente como para ignorarlo. Pero, para robots tan complejos, elegir manualmente qué clústeres rastrear durante las simulaciones puede ser complicado.
Partiendo de ese trabajo, los investigadores diseñaron un método de "optimización del aprendizaje en el ciclo", donde todos los parámetros optimizados se aprenden durante un solo ciclo de retroalimentación en muchas simulaciones. Y, al mismo tiempo que aprende la optimización, o "en el ciclo", el método también aprende la representación del estado.
El modelo emplea una técnica llamada método de punto material (MPM), que simula el comportamiento de partículas de materiales continuos, como espumas y líquidos, rodeado por una cuadrícula de fondo. Al hacerlo, captura las partículas del robot y su entorno observable en píxeles o píxeles 3-D, conocidos como voxels, sin necesidad de ningún cálculo adicional.
En una fase de aprendizaje, esta información de cuadrícula de partículas sin procesar se alimenta a un componente de aprendizaje automático que aprende a ingresar una imagen, comprimirlo a una representación de baja dimensión, y descomprime la representación de nuevo en la imagen de entrada. Si este "codificador automático" retiene suficientes detalles al comprimir la imagen de entrada, puede recrear con precisión la imagen de entrada a partir de la compresión.
En el trabajo de los investigadores, Las representaciones comprimidas aprendidas del autocodificador sirven como representación del estado de baja dimensión del robot. En una fase de optimización, esa representación comprimida vuelve al controlador, que genera una actuación calculada de cómo debe moverse cada partícula del robot en el siguiente paso simulado por MPM.
Simultaneamente, el controlador usa esa información para ajustar la rigidez óptima de cada partícula para lograr el movimiento deseado. En el futuro, que la información material puede ser útil para los robots blandos de impresión 3D, donde cada punto de partícula puede imprimirse con una rigidez ligeramente diferente. "Esto permite crear diseños de robots adaptados a los movimientos del robot que serán relevantes para tareas específicas, ", Dice Spielberg." Al aprender estos parámetros juntos, mantiene todo lo más sincronizado posible para facilitar el proceso de diseño ".
Optimización más rápida
Toda la información de optimización es, Sucesivamente, retroalimentado al inicio del ciclo para entrenar el codificador automático. Durante muchas simulaciones, el controlador aprende el movimiento óptimo y el diseño del material, mientras que el codificador automático aprende la representación del estado cada vez más detallada. "La clave es que queremos que ese estado de baja dimensión sea muy descriptivo, "Dice Spielberg.
Después de que el robot llega a su estado final simulado durante un período de tiempo determinado, digamos, lo más cerca posible del destino objetivo:actualiza una "función de pérdida". Ese es un componente fundamental del aprendizaje automático, que intenta minimizar algún error. En este caso, minimiza, decir, a qué distancia se detuvo el robot del objetivo. Esa función de pérdida fluye de regreso al controlador, que utiliza la señal de error para ajustar todos los parámetros optimizados para completar mejor la tarea.
Si los investigadores intentaron alimentar directamente todas las partículas crudas de la simulación en el controlador, sin el paso de compresión, "el tiempo de ejecución y optimización explotaría, ", Dice Spielberg. Usando la representación comprimida, los investigadores pudieron disminuir el tiempo de ejecución para cada iteración de optimización de varios minutos a aproximadamente 10 segundos.
The researchers validated their model on simulations of various 2-D and 3-D biped and quadruped robots. They researchers also found that, while robots using traditional methods can take up to 30, 000 simulations to optimize these parameters, robots trained on their model took only about 400 simulations.
Deploying the model into real soft robots means tackling issues with real-world noise and uncertainty that may decrease the model's efficiency and accuracy. Pero, en el futuro, the researchers hope to design a full pipeline, from simulation to fabrication, for soft robots.