• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Los investigadores logran avances con un nuevo algoritmo de conducción automatizada

    rom izquierda, Investigadores de la U of T Wenjie Luo, Profesora Asociada Raquel Urtasun, y Bin Yang del Grupo de Tecnologías Avanzadas (ATG) de Uber en Toronto. Crédito:Ryan Perez

    Un vehículo autónomo debe detectar objetos, rastrearlos a lo largo del tiempo, y predecir dónde estarán en el futuro para planificar una maniobra segura. Por lo general, estas tareas se entrenan de forma independiente unas de otras, lo que podría resultar en desastres si falla alguna tarea.

    Investigadores del departamento de informática de la Universidad de Toronto y el Grupo de Tecnologías Avanzadas (ATG) de Uber en Toronto han desarrollado un algoritmo que analiza en conjunto todas estas tareas, el primero en reunirlas todas. En tono rimbombante, su solución toma tan solo 30 milisegundos por cuadro.

    "Intentamos optimizar en su conjunto para poder corregir errores entre cada una de las tareas en sí, "dice Wenjie Luo, un doctorado estudiante de informática. "Cuando se hace en conjunto, la incertidumbre se puede propagar y la computación se puede compartir ".

    Luo y Bin Yang, un doctorado estudiante de informática, junto con su supervisor graduado, Raquel Urtasun, profesor asociado de informática y director de Uber ATG Toronto, presentará su trabajo, Rápido y furioso:detección 3D de extremo a extremo en tiempo real, Seguimiento y pronóstico de movimiento con una única red convolucional, en la conferencia Computer Vision and Pattern Recognition (CVPR) de esta semana en Salt Lake City, el principal evento anual de visión por computadora.

    Para comenzar, Uber recopiló un conjunto de datos a gran escala de varias ciudades de América del Norte utilizando escáneres Li-DAR montados en el techo que emiten rayos láser para medir distancias. El conjunto de datos incluye más de un millón de fotogramas, recogido de 6, 500 escenas diferentes.

    Urtasun dice que la salida del LiDAR es una nube de puntos en un espacio tridimensional que debe ser entendida por un sistema de inteligencia artificial (IA). Estos datos no están estructurados por naturaleza, y, por lo tanto, es considerablemente diferente de los datos estructurados que normalmente se introducen en los sistemas de inteligencia artificial, como imágenes.

    "Si la tarea detecta objetos, puede intentar detectar objetos en todas partes, pero hay demasiado espacio libre, por lo que se realizan muchos cálculos en vano. A vista de pájaro los objetos que tratamos de reconocer se sientan en el suelo y, por lo tanto, es muy eficiente razonar sobre dónde están las cosas, "dice Urtasun.

    Para manejar grandes cantidades de datos no estructurados, Doctor. El estudiante Shenlong Wang e investigadores de Uber ATG desarrollaron una herramienta especial de inteligencia artificial.

    "Una imagen es una cuadrícula 2-D. Un modelo 3-D es un montón de mallas 3-D. Pero aquí, lo que capturamos [con Li-DAR] son ​​solo un montón de puntos, y están esparcidos en ese espacio, que para la IA tradicional es muy difícil de manejar, "dice Wang (en la foto a la izquierda).

    Urtasun explica que hay una razón por la que la IA funciona muy bien con las imágenes. Las imágenes son objetos rectangulares, compuesto por píxeles diminutos, también rectangular, por lo que los algoritmos funcionan bien en el análisis de estructuras en forma de cuadrícula. Pero los datos LiDAR no tienen una estructura regular, lo que dificulta el aprendizaje de los sistemas de IA.

    Sus resultados para procesar puntos dispersos directamente no se limitan a la conducción autónoma, pero cualquier dominio donde haya datos no estructurados, incluyendo química y redes sociales.

    Se presentarán nueve artículos en CVPR del laboratorio de Urtasun. Mengye Ren, un doctorado estudiante de informática, Andrei Pokrovsky, un ingeniero de software de personal en Uber ATG, Yang y Urtasun también buscaron una computación más rápida y desarrollaron SBNet:Sparse Blocks Network para Fast Inference.

    "Queremos que la red sea lo más rápida posible para que pueda detectar y tomar decisiones en tiempo real, basado en la situación actual, "dice Ren". Por ejemplo, los humanos observamos ciertas regiones que creemos que es importante percibir, así que aplicamos esto a la conducción autónoma ".

    Para aumentar la velocidad de todo el cálculo, dice Ren, han ideado un cálculo escaso basado en qué regiones son importantes. Como resultado, su algoritmo demostró ser hasta 10 veces más rápido en comparación con los métodos existentes.

    "El coche lo ve todo, pero centra la mayor parte de su cálculo en lo que es importante, ahorro de cálculo, "dice Urtasun.

    "Entonces, cuando hay muchos autos [en la carretera], el cálculo no se vuelve demasiado escaso, para que no perdamos ningún vehículo. Pero cuando es escaso cambiará adaptativamente el cálculo, "dice Ren.

    Los investigadores lanzaron el código SBNet, ya que es muy útil para mejorar el procesamiento de dispositivos pequeños. incluidos los teléfonos inteligentes.

    Urtasun dice que el impacto general de la investigación de su grupo ha aumentado significativamente cuando han visto sus algoritmos implementados en la flota autónoma de Uber. en lugar de residir únicamente en trabajos académicos.

    "Estamos tratando de resolver la conducción autónoma, "dice Urtasun, "que es uno de los problemas fundamentales de este siglo".


    © Ciencia https://es.scienceaq.com