Crédito:Ozcan Lab @ UCLA
El aprendizaje profundo es uno de los métodos de aprendizaje automático de más rápido crecimiento que se basa en redes neuronales artificiales de varias capas. Tradicionalmente, Los sistemas de aprendizaje profundo se implementan para ser ejecutados en una computadora para aprender digitalmente la representación y abstracción de datos. y realizar tareas avanzadas, comparable o incluso superior al desempeño de los expertos humanos. Las aplicaciones recientes y exitosas del aprendizaje profundo incluyen el análisis de imágenes médicas, reconocimiento de voz, traducción de idiomas, clasificación de imágenes, así como abordar tareas más específicas, como resolver problemas de imágenes inversas.
En contraste con las implementaciones tradicionales de aprendizaje profundo, en un artículo reciente publicado en Ciencias , Los investigadores de UCLA han introducido un mecanismo físico para implementar el aprendizaje profundo utilizando una red neuronal profunda difractiva totalmente óptica (D2NN). Este nuevo marco da como resultado estructuras impresas en 3D, diseñado por aprendizaje profundo, que demostraron realizar con éxito diferentes tipos de tareas de clasificación e imágenes sin el uso de ningún poder, excepto el haz de luz de entrada. Esta red neuronal profunda totalmente óptica puede funcionar, a la velocidad de la luz, Varias funciones complejas que las redes neuronales basadas en computadoras pueden implementar, y encontrará aplicaciones en el análisis de imágenes totalmente ópticas, detección de características y clasificación de objetos, también permite nuevos diseños de cámaras y componentes ópticos que pueden aprender a realizar tareas únicas.
Esta investigación fue dirigida por el Dr. Aydogan Ozcan, el profesor del canciller de ingeniería eléctrica e informática en UCLA y un profesor del HHMI en el Instituto Médico Howard Hughes.
Los autores validaron la efectividad de este enfoque mediante la creación de redes difractivas impresas en 3D que tuvieron éxito en la resolución de problemas de muestra. como la clasificación de las imágenes de dígitos escritos a mano (de 0 a 9) y productos de moda, además de realizar la función de una lente de imagen en un espectro de terahercios.
"Utilizando componentes pasivos que se fabrican capa por capa, y conectar estas capas entre sí a través de la difracción de luz creó una plataforma totalmente óptica única para realizar tareas de aprendizaje automático a la velocidad de la luz, ", dijo el Dr. Ozcan. Al usar datos de imágenes, los autores diseñaron decenas de miles de píxeles en cada capa que, junto con las otras capas, realizar colectivamente la tarea para la que la red fue capacitada. Después de su entrenamiento, que se hace usando una computadora, el diseño se imprime en 3D o se fabrica para formar una pila de capas que utilizan difracción óptica para ejecutar la tarea aprendida.
Además de las tareas de clasificación de imágenes que los autores han demostrado utilizando dígitos escritos a mano y productos de moda, Esta arquitectura de red neuronal difractiva también se utilizó para diseñar una lente multicapa que opera en un espectro de terahercios. crear una imagen de un objeto de entrada arbitrario en la salida de la red, sin ningún conocimiento de las leyes físicas asociadas con la formación de imágenes. Dicho diseño se creó utilizando solo datos de imagen que se utilizaron para entrenar los valores de los píxeles en diferentes capas para formar un sistema de imágenes en forma de red difractiva.
Este trabajo de prueba de concepto destaca algunas oportunidades únicas que permite el aprendizaje profundo para el diseño de componentes ópticos basados en datos de imagen, en lugar de principios físicos o intuición de ingeniería. Basado en este nuevo enfoque, Se pueden diseñar componentes ópticos más avanzados basados en datos, potencialmente superando el rendimiento de los componentes tradicionales.
Los otros autores de este trabajo, todos de la Escuela de Ingeniería Samueli de UCLA, incluyen a los becarios postdoctorales Xing Lin; Yair Rivenson, y Nezih T. Yardimci; los estudiantes de posgrado Muhammed Veli y Yi Luo; y Mona Jarrahi, Profesor de UCLA de ingeniería eléctrica e informática.
Este trabajo fue apoyado por NSF y HHMI.