Un robot necesita aprender sobre su cuerpo y el medio ambiente. Prueba algunos movimientos diferentes y usa el algoritmo. Luego puede predecir lo que sucederá con movimientos más grandes y a velocidades más altas. Crédito:IST Austria / Birgit Rieger
Comprender cómo reaccionará un robot en diferentes condiciones es fundamental para garantizar su funcionamiento seguro. Pero, ¿cómo saber qué romperá un robot sin dañarlo realmente? Un nuevo método desarrollado por científicos del Instituto de Ciencia y Tecnología de Austria (IST Austria) y el Instituto Max Planck de Sistemas Inteligentes (MPI para Sistemas Inteligentes) es el primer método de aprendizaje automático que puede utilizar observaciones realizadas en condiciones seguras para realizar predicciones precisas. para todas las condiciones posibles regidas por la misma dinámica física. Especialmente diseñado para situaciones de la vida real, su método proporciona simple, descripciones interpretables de la física subyacente. Los investigadores presentarán sus hallazgos mañana en la prestigiosa Conferencia Internacional de Aprendizaje Automático (ICML) de este año.
En el pasado, el aprendizaje automático solo era capaz de interpolar datos:hacer predicciones sobre situaciones que están "entre" otros, situaciones conocidas. Fue incapaz de extrapolar (hacer predicciones sobre situaciones fuera de lo conocido) porque aprende a ajustar los datos conocidos lo más cerca posible a nivel local. independientemente de cómo se desempeñe fuera de estas situaciones. Además, La recopilación de datos suficientes para una interpolación eficaz requiere mucho tiempo y recursos, y requiere datos de situaciones extremas o peligrosas. Pero ahora, Georg Martius, ex postdoctorado de ISTFELLOW e IST Austria, y desde 2017 líder de grupo en MPI for Intelligent Systems en Tübingen, Subham S. Sahoo, un doctorado estudiante también en MPI para sistemas inteligentes, y Christoph Lampert, profesor en IST Austria, desarrolló un nuevo método de aprendizaje automático que aborda estos problemas, y es el primer método de aprendizaje automático que se extrapola con precisión a situaciones invisibles.
La característica clave del nuevo método es que se esfuerza por revelar la verdadera dinámica de la situación:toma datos y devuelve las ecuaciones que describen la física subyacente. "Si conoces esas ecuaciones, "dice Georg Martius, "entonces puedes decir lo que sucederá en todas las situaciones, incluso si no los has visto ". En otras palabras, esto es lo que permite al método extrapolar de manera confiable, haciéndolo único entre los métodos de aprendizaje automático.
El método del equipo también se distingue de otras formas. Primero, las aproximaciones finales producidas previamente durante el aprendizaje automático eran demasiado complejas para que un humano las entendiera o trabajara con ellas. En el nuevo método, las ecuaciones resultantes son mucho más simples:"Las ecuaciones de nuestro método son algo que verías en un libro de texto:simple e intuitivo, "dice Christoph Lampert. Esta última es otra diferencia clave:otros métodos de aprendizaje automático no brindan información sobre la relación entre las condiciones y los resultados y, por lo tanto, ninguna intuición sobre si el modelo es siquiera plausible. "En todas las demás áreas de investigación, esperamos modelos que tengan sentido físico, que nos diga por qué, ", añade Lampert." Esto es lo que deberíamos esperar del aprendizaje automático, y lo que ofrece nuestro método ". Finalmente, para garantizar la interpretabilidad y optimizar para situaciones físicas, el equipo basó su método de aprendizaje en un tipo de marco diferente. Este nuevo diseño es más simple que los métodos anteriores, lo que en la práctica significa que se necesitan menos datos para obtener los mismos o mejores resultados.
Y no todo es teoría:"En mi grupo, de hecho, estamos trabajando en el desarrollo de un robot que utilice este tipo de aprendizaje. En el futuro, el robot experimentaría con diferentes movimientos, luego, podrá utilizar el aprendizaje automático para descubrir las ecuaciones que gobiernan su cuerpo y movimiento, permitiéndole evitar acciones o situaciones peligrosas, "añade Martius. Si bien los robots son un área activa de investigación, el método se puede utilizar con cualquier tipo de datos, de los sistemas biológicos a las energías de transición de rayos X, y también se puede incorporar a redes de aprendizaje automático más grandes.