Una red neuronal de Fourier masivamente paralela de amplitud solamente. Crédito:Universidad George Washington
Investigadores de la Universidad George Washington, junto con investigadores de la Universidad de California, Los Angeles, y la empresa emergente de tecnología profunda Optelligence LLC, han desarrollado un acelerador de red neuronal convolucional óptico capaz de procesar grandes cantidades de información, del orden de petabytes, por segundo. Esta innovación, que aprovecha el enorme paralelismo de la luz, presagia una nueva era de procesamiento de señales ópticas para el aprendizaje automático con numerosas aplicaciones, incluso en vehículos autónomos, Redes 5G, centros de datos, diagnósticos biomédicos, seguridad de datos y más.
La demanda mundial de hardware de aprendizaje automático está superando drásticamente las fuentes de alimentación informáticas actuales. Hardware electrónico de última generación, como unidades de procesamiento de gráficos y aceleradores de unidades de procesamiento de tensor, ayudar a mitigar esto, pero están intrínsecamente desafiados por el procesamiento de datos en serie que requiere procesamiento de datos iterativo y encuentra retrasos debido a restricciones de cableado y circuito. Las alternativas ópticas al hardware electrónico podrían ayudar a acelerar los procesos de aprendizaje automático al simplificar la forma en que se procesa la información de forma no iterativa. Sin embargo, El aprendizaje automático basado en fotones suele estar limitado por la cantidad de componentes que se pueden colocar en los circuitos integrados fotónicos. limitando la interconectividad, mientras que los moduladores de luz espacial de espacio libre están restringidos a velocidades de programación lentas.
Para lograr un gran avance en este sistema óptico de aprendizaje automático, los investigadores reemplazaron los moduladores de luz espacial con tecnología digital basada en espejos, desarrollando así un sistema 100 veces más rápido. La sincronización no iterativa de este procesador, en combinación con una programación rápida y una paralelización masiva, permite que este sistema óptico de aprendizaje automático supere incluso a las unidades de procesamiento de gráficos de primera línea en más de un orden de magnitud, con espacio para una mayor optimización más allá del prototipo inicial.
A diferencia del paradigma actual en hardware de aprendizaje automático electrónico que procesa la información de forma secuencial, este procesador utiliza la óptica de Fourier, un concepto de filtrado de frecuencia que permite realizar las convoluciones requeridas de la red neuronal como multiplicaciones de elementos mucho más simples utilizando la tecnología de espejo digital.
"Este procesador óptico de Fourier de amplitud masiva en paralelo solo está anunciando una nueva era para el procesamiento de información y el aprendizaje automático. Demostramos que el entrenamiento de esta red neuronal puede explicar la falta de información de fase, "dice Volker Sorger, profesor asociado de ingeniería eléctrica e informática en la Universidad George Washington.
"La óptica permite procesar matrices a gran escala en un solo paso de tiempo, lo que permite nuevos vectores de escala para realizar convoluciones ópticamente. Esto puede tener un potencial significativo para las aplicaciones de aprendizaje automático, como se demuestra aquí, "dice Puneet Gupta, profesor y vicepresidente de ingeniería informática en la Universidad de California, Los Angeles.
"Esta demostración de prototipo muestra una ruta comercial para aceleradores ópticos listos para una serie de aplicaciones como procesamiento de borde de red, centros de datos y sistemas informáticos de alto rendimiento, "dice Hamed Dalir, cofundador, Optelligence LLC.
El papel, "Red neuronal de Fourier de amplitud masivamente paralela" se publicó hoy en la revista Optica .