• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Conoce a Jaco y Baxter, robots de aprendizaje automático que cocinan salchichas perfectas

    Crédito:CC0 Public Domain

    ¿Te apetece un bocado de un estadio de béisbol frank recién asado? Dos robots llamados Jaco y Baxter pueden servir uno. Los ingenieros de la Universidad de Boston han dado un salto en el uso del aprendizaje automático para enseñar a los robots a realizar tareas complejas, un marco que podría aplicarse a una serie de tareas, como identificar manchas cancerosas en mamografías o comprender mejor los comandos hablados para reproducir música. Pero primero, como prueba de concepto, han aprendido a preparar el perrito caliente perfecto.

    Los investigadores aún no comprenden completamente cómo los algoritmos de aprendizaje automático, bueno, aprender. Ese punto ciego dificulta la aplicación de la técnica a complejos, tareas de alto riesgo como la conducción autónoma, donde la seguridad es una preocupación. En un paso adelante publicado en Ciencia Robótica , Calin Belta, un profesor de la Facultad de Ingeniería de la BU, e investigadores de su laboratorio enseñaron a cocinar a dos robots, armar, y sirva los hot dogs juntos. Su método combina técnicas de aprendizaje automático y métodos formales, un área de la informática que se utiliza normalmente para garantizar la seguridad, se utiliza principalmente en software de aviónica o ciberseguridad. Estas técnicas dispares son difíciles de combinar matemáticamente y de unirlas en un lenguaje que un robot pueda entender.

    Belta, un profesor de mecánica, sistemas e ingeniería eléctrica e informática, y su equipo empleó una rama del aprendizaje automático conocida como aprendizaje por refuerzo. Cuando una computadora completa una tarea correctamente, recibe una recompensa que guía su proceso de aprendizaje. Aunque los pasos de la tarea se describen en un algoritmo de "conocimiento previo", cómo exactamente realizar esos pasos no lo es. Cuando el robot mejora en la ejecución de un paso, su recompensa aumenta, creando un mecanismo de retroalimentación que empuja al robot a aprender la mejor manera de, por ejemplo, coloque un hot dog en un bollo.

    Crédito:Universidad de Boston

    La integración del conocimiento previo con el aprendizaje por refuerzo y los métodos formales es lo que hace que esta técnica sea novedosa. Combinando estas tres técnicas, el equipo puede reducir la cantidad de posibilidades que los robots tienen que atravesar para aprender a cocinar, armar, y sírvase un hot dog de forma segura. Belta ve este trabajo como una demostración de prueba de concepto de su marco general, y espera que en el futuro se pueda aplicar a otras tareas complejas, como la conducción autónoma.


    © Ciencia https://es.scienceaq.com