Los investigadores utilizaron el aprendizaje profundo para crear un nuevo sistema basado en láser que puede obtener imágenes alrededor de las esquinas en tiempo real. Los sistemas podrían algún día permitir que los autos autónomos 'miren' alrededor de autos estacionados o intersecciones concurridas no solo para ver los autos sino también para leer las matrículas. Crédito:Felix Heide, Universidad de Princeton
Los investigadores han aprovechado el poder de un tipo de inteligencia artificial conocida como aprendizaje profundo para crear un nuevo sistema basado en láser que puede obtener imágenes alrededor de las esquinas en tiempo real. Con un mayor desarrollo, el sistema puede permitir que los autos autónomos "miren" alrededor de autos estacionados o intersecciones con mucho tráfico para ver peligros o peatones. También podría instalarse en satélites y naves espaciales para tareas como capturar imágenes dentro de una cueva en un asteroide.
"En comparación con otros enfoques, nuestro sistema de imágenes sin línea de visión proporciona resoluciones y velocidades de imagen excepcionalmente altas, ", dijo el líder del equipo de investigación Christopher A. Metzler de la Universidad de Stanford y la Universidad de Rice." Estos atributos permiten aplicaciones que de otro modo no serían posibles, como leer la matrícula de un automóvil oculto mientras conduce o leer una placa que lleva alguien que camina al otro lado de una esquina ".
En Optica , La revista de la Optical Society para investigaciones de alto impacto, Metzler y colegas de la Universidad de Princeton, Universidad Metodista del Sur, y la Universidad de Rice informan que el nuevo sistema puede distinguir detalles submilimétricos de un objeto oculto a 1 metro de distancia. El sistema está diseñado para obtener imágenes de objetos pequeños a resoluciones muy altas, pero se puede combinar con otros sistemas de imágenes que producen reconstrucciones del tamaño de una habitación de baja resolución.
"Las imágenes sin línea de visión tienen aplicaciones importantes en imágenes médicas, navegación, robótica y defensa, ", dijo el coautor Felix Heide de la Universidad de Princeton." Nuestro trabajo da un paso hacia la habilitación de su uso en una variedad de tales aplicaciones ".
El sistema de imágenes sin línea de visión utiliza un algoritmo de aprendizaje profundo para reconstruir objetos ocultos a partir de un patrón de moteado creado por el láser. Crédito:Felix Heide, Universidad de Princeton
Resolviendo un problema de óptica con aprendizaje profundo
El nuevo sistema de imágenes utiliza un sensor de cámara disponible comercialmente y un potente pero por lo demás estándar, fuente láser que es similar a la que se encuentra en un puntero láser. El rayo láser rebota en una pared visible hacia el objeto oculto y luego vuelve a la pared, creando un patrón de interferencia conocido como patrón de motas que codifica la forma del objeto oculto.
Reconstruir el objeto oculto a partir del patrón de moteado requiere resolver un problema computacional desafiante. Los tiempos de exposición cortos son necesarios para obtener imágenes en tiempo real, pero producen demasiado ruido para que funcionen los algoritmos existentes. Para resolver este problema, los investigadores recurrieron al aprendizaje profundo.
"En comparación con otros enfoques para la obtención de imágenes sin visibilidad directa, Nuestro algoritmo de aprendizaje profundo es mucho más resistente al ruido y, por lo tanto, puede funcionar con tiempos de exposición mucho más cortos. ", dijo la coautora Prasanna Rangarajan de la Universidad Metodista del Sur." Al caracterizar con precisión el ruido, pudimos sintetizar datos para entrenar el algoritmo a fin de resolver el problema de reconstrucción utilizando el aprendizaje profundo sin tener que capturar costosos datos de entrenamiento experimental ".
Viendo alrededor de las esquinas
Los investigadores probaron la nueva técnica reconstruyendo imágenes de letras y números de 1 centímetro de alto escondidos detrás de una esquina utilizando una configuración de imágenes a aproximadamente 1 metro de la pared. Usando una duración de exposición de un cuarto de segundo, el enfoque produjo reconstrucciones con una resolución de 300 micrones.
La investigación es parte del programa de mejora revolucionaria de la visibilidad de DARPA mediante la explotación de campos de luz activos (REVEAL), que está desarrollando una variedad de técnicas diferentes para crear imágenes de objetos ocultos en las esquinas. Los investigadores ahora están trabajando para hacer que el sistema sea práctico para más aplicaciones al extender el campo de visión para que pueda reconstruir objetos más grandes.