El aprendizaje profundo ha revolucionado la forma en que percibimos y utilizamos los datos. Sin embargo, a medida que crecen los conjuntos de datos y aumentan las demandas computacionales, necesitamos formas más eficientes de manejar, almacenar y procesar datos. En este sentido, la computación óptica se considera la próxima frontera de la tecnología informática. En lugar de utilizar señales electrónicas, la informática óptica se basa en las propiedades de las ondas de luz, como la longitud de onda y la polarización, para almacenar y procesar datos.
Redes neuronales profundas difractivas (D 2 NN) utilizan varias propiedades de las ondas de luz para realizar tareas como el reconocimiento de imágenes y objetos. Estas redes constan de conjuntos de píxeles bidimensionales como capas difractivas. Cada píxel sirve como un parámetro ajustable que afecta las propiedades de las ondas de luz que lo atraviesan. Este diseño único permite a las redes realizar tareas computacionales manipulando información contenida en ondas de luz. Hasta ahora, D 2 Las NN han aprovechado las propiedades de las ondas de luz, como la intensidad, la fase, la polarización y la longitud de onda.
Ahora, en un estudio publicado en Advanced Photonics Nexus , investigadores de la Universidad Minzu de China, la Universidad de Pekín y la Universidad de Shanxi en China han desarrollado tres D 2 NN con capas difractivas que pueden reconocer objetos utilizando información contenida en el momento angular orbital (OAM) de la luz. Estos incluyen un detector único con codificación OAM D 2 NN para clasificación de tareas únicas y multitarea, y D 2 con codificación OAM multidetector NN para clasificación multitarea repetible.
¿Pero qué es OAM? Es una propiedad de las ondas luminosas relacionada con su movimiento de rotación o torsión. Puede adoptar un número infinito de valores independientes, cada uno de los cuales corresponde a un modo de luz diferente. Debido a su amplia gama de estados o modos posibles, OAM puede transportar información espacial como la posición, disposición o estructura de un objeto. En la propuesta D 2 En el marco NN, los haces OAM que contienen información que ilumina dígitos escritos a mano se combinan en un único haz de vórtice. Este haz, que contiene múltiples modos OAM, cada uno asociado con una torsión o rotación específica de ondas de luz, pasa a través de cinco capas difractivas entrenadas para reconocer las características de los dígitos escritos a mano de los modos OAM.
Una característica notable del D 2 codificado en OAM NN es su capacidad para discernir la secuencia de dígitos repetidos. Para lograr esto, los investigadores emplearon múltiples detectores para procesar información OAM de múltiples imágenes simultáneamente.
Cuando se prueba en el conjunto de datos MNIST, un conjunto de datos comúnmente utilizado para el reconocimiento de dígitos escritos a mano, el D 2 NN predijo correctamente dígitos de un solo dígito en las imágenes aproximadamente el 85,49 % de las veces, un nivel de precisión comparable a D 2 Modelos NN que aprovechan las propiedades de longitud de onda y polarización de la luz.
La utilización de modos OAM para codificar información es un paso importante hacia el avance de las capacidades de procesamiento paralelo y beneficiará a las aplicaciones que requieren procesamiento en tiempo real, como el reconocimiento de imágenes o tareas con uso intensivo de datos.
De hecho, este trabajo logra un gran avance en la clasificación paralela al utilizar el grado de libertad OAM, superando a otros D 2 existentes. Diseños NN. En particular, D 2 codificado en OAM Las NN proporcionan un marco poderoso para mejorar aún más la capacidad de clasificación paralela totalmente óptica y tareas de visión artificial basadas en OAM y se espera que abran direcciones de investigación prometedoras para D 2 NN.
Más información: Kuo Zhang et al, Clasificación totalmente óptica avanzada utilizando redes difractivas codificadas por momento angular orbital, Advanced Photonics Nexus (2023). DOI:10.1117/1.APN.2.6.066006
Proporcionado por SPIE