Los investigadores han demostrado que una red neuronal se puede entrenar utilizando un circuito óptico (rectángulo azul en la ilustración). En la red completa habría varios de estos vinculados entre sí. Las entradas láser (verde) codifican la información que se transporta a través del chip mediante guías de ondas ópticas (negro). El chip realiza operaciones cruciales para la red neuronal artificial utilizando divisores de haz sintonizables, que están representados por las secciones curvas en las guías de ondas. Estas secciones acoplan dos guías de ondas adyacentes y se sintonizan ajustando la configuración de los desfasadores ópticos (objetos brillantes rojos y azules), que actúan como "perillas" que se pueden ajustar durante el entrenamiento para realizar una tarea determinada. Crédito:Tyler W. Hughes, Universidad Stanford
Los investigadores han demostrado que es posible entrenar redes neuronales artificiales directamente en un chip óptico. El avance significativo demuestra que un circuito óptico puede realizar una función crítica de una red neuronal artificial basada en la electrónica y podría conducir a menos costosos, Formas más rápidas y energéticamente eficientes para realizar tareas complejas como el reconocimiento de voz o imágenes.
"El uso de un chip óptico para realizar cálculos de redes neuronales de manera más eficiente de lo que es posible con las computadoras digitales podría permitir resolver problemas más complejos, ", dijo el líder del equipo de investigación Shanhui Fan de la Universidad de Stanford." Esto mejoraría la capacidad de las redes neuronales artificiales para realizar las tareas necesarias para los coches autónomos o para formular una respuesta adecuada a una pregunta hablada, por ejemplo. También podría mejorar nuestras vidas de formas que no podemos imaginar ahora ".
Una red neuronal artificial es un tipo de inteligencia artificial que utiliza unidades conectadas para procesar información de una manera similar a la forma en que el cerebro procesa la información. Usando estas redes para realizar una tarea compleja, por ejemplo reconocimiento de voz, requiere el paso crítico de entrenar los algoritmos para categorizar las entradas, como palabras diferentes.
Aunque las redes neuronales artificiales ópticas se demostraron recientemente de forma experimental, el paso de entrenamiento se realizó utilizando un modelo en una computadora digital tradicional y luego se importaron los ajustes finales al circuito óptico. En Optica , La revista de la Optical Society para la investigación de alto impacto, Investigadores de la Universidad de Stanford informan sobre un método para entrenar estas redes directamente en el dispositivo mediante la implementación de un análogo óptico del algoritmo de 'retropropagación'. que es la forma estándar de entrenar redes neuronales convencionales.
"El uso de un dispositivo físico en lugar de un modelo de computadora para el entrenamiento hace que el proceso sea más preciso, "dijo Tyler W. Hughes, primer autor del artículo. "También, debido a que el paso de entrenamiento es una parte muy costosa desde el punto de vista computacional de la implementación de la red neuronal, realizar este paso de forma óptica es clave para mejorar la eficiencia computacional, velocidad y consumo de energía de las redes artificiales ".
Una red basada en la luz
Aunque el procesamiento de redes neuronales se realiza normalmente con una computadora tradicional, Existen importantes esfuerzos para diseñar hardware optimizado específicamente para la informática de redes neuronales. Los dispositivos basados en ópticas son de gran interés porque pueden realizar cálculos en paralelo utilizando menos energía que los dispositivos electrónicos.
En el nuevo trabajo los investigadores superaron un desafío significativo para implementar una red neuronal totalmente óptica mediante el diseño de un chip óptico que replica la forma en que las computadoras convencionales entrenan las redes neuronales.
Se puede pensar en una red neuronal artificial como una caja negra con varios botones. Durante el paso de entrenamiento, cada uno de estos botones se gira un poco y luego se prueba el sistema para ver si el rendimiento de los algoritmos mejoró.
"Nuestro método no solo ayuda a predecir en qué dirección girar las perillas, sino también cuánto debe girar cada perilla para acercarse al rendimiento deseado, ", dijo Hughes." Nuestro enfoque acelera significativamente el entrenamiento, especialmente para redes grandes, porque obtenemos información sobre cada botón en paralelo ".
Entrenamiento en chip
El nuevo protocolo de entrenamiento opera en circuitos ópticos con divisores de haz sintonizables que se ajustan cambiando la configuración de los desfasadores ópticos. Los rayos láser que codifican la información que se va a procesar se disparan al circuito óptico y son transportados por guías de ondas ópticas a través de los divisores de haz. que se ajustan como perillas para entrenar los algoritmos de la red neuronal.
En el nuevo protocolo de entrenamiento, el láser se alimenta primero a través del circuito óptico. Al salir del dispositivo, se calcula la diferencia con el resultado esperado. Esta información se utiliza luego para generar una nueva señal luminosa, que se envía de vuelta a través de la red óptica en la dirección opuesta. Midiendo la intensidad óptica alrededor de cada divisor de haz durante este proceso, los investigadores mostraron cómo detectar, en paralelo, cómo cambiará el rendimiento de la red neuronal con respecto a la configuración de cada divisor de haz. La configuración del cambiador de fase se puede cambiar en función de esta información, y el proceso puede repetirse hasta que la red neuronal produzca el resultado deseado.
Los investigadores probaron su técnica de entrenamiento con simulaciones ópticas al enseñar un algoritmo para realizar funciones complicadas, como seleccionar características complejas dentro de un conjunto de puntos. Descubrieron que la implementación óptica funcionaba de manera similar a una computadora convencional.
"Nuestro trabajo demuestra que se pueden utilizar las leyes de la física para implementar algoritmos informáticos, ", dijo Fan." Al entrenar estas redes en el dominio óptico, muestra que los sistemas de redes neuronales ópticas podrían construirse para llevar a cabo ciertas funcionalidades utilizando únicamente la óptica ".
Los investigadores planean optimizar aún más el sistema y quieren usarlo para implementar una aplicación práctica de una tarea de red neuronal. El enfoque general que diseñaron podría usarse con varias arquitecturas de redes neuronales y para otras aplicaciones, como la óptica reconfigurable.