Aprender con la luz:el nuevo sistema permite el aprendizaje profundo óptico

Crédito:Instituto de Tecnología de Massachusetts

Sistemas informáticos de "aprendizaje profundo", basado en redes neuronales artificiales que imitan la forma en que el cerebro aprende a partir de una acumulación de ejemplos, se han convertido en un tema candente en la informática. Además de habilitar tecnologías como el software de reconocimiento facial y de voz, Estos sistemas podrían rastrear grandes cantidades de datos médicos para encontrar patrones que pudieran ser útiles para el diagnóstico, o escanear fórmulas químicas en busca de posibles nuevos productos farmacéuticos.

Pero los cálculos que deben realizar estos sistemas son muy complejos y exigentes, incluso para las computadoras más potentes.

Ahora, un equipo de investigadores en el MIT y en otros lugares ha desarrollado un nuevo enfoque para tales cálculos, usando luz en lugar de electricidad, lo que, según dicen, podría mejorar enormemente la velocidad y la eficiencia de ciertos cálculos de aprendizaje profundo. Sus resultados aparecen hoy en la revista Fotónica de la naturaleza en un artículo del postdoctorado del MIT Yichen Shen, estudiante de posgrado Nicholas Harris, los profesores Marin Soljacic y Dirk Englund, y otros ocho.

Soljacic dice que muchos investigadores a lo largo de los años han hecho afirmaciones sobre las computadoras basadas en óptica, pero que "la gente prometió demasiado y resultó contraproducente ". Si bien muchos usos propuestos de tales computadoras fotónicas resultaron no ser prácticos, un sistema de red neuronal basado en la luz desarrollado por este equipo "puede ser aplicable para el aprendizaje profundo para algunas aplicaciones, " él dice.

Las arquitecturas informáticas tradicionales no son muy eficientes cuando se trata de los tipos de cálculos necesarios para ciertas tareas importantes de la red neuronal. Tales tareas normalmente implican multiplicaciones repetidas de matrices, que puede ser muy intensivo desde el punto de vista informático en chips de CPU o GPU convencionales.

Después de años de investigación, el equipo del MIT ha ideado una forma de realizar estas operaciones de forma óptica. "Este chip, una vez que lo sintonizas, puede realizar la multiplicación de matrices con, en principio, energía cero, casi al instante, "Dice Soljacic." Hemos demostrado los bloques de construcción cruciales, pero aún no el sistema completo ".

A modo de analogía, Soljacic señala que incluso una lente de anteojos ordinaria realiza un cálculo complejo (la llamada transformada de Fourier) sobre las ondas de luz que la atraviesan. La forma en que los haces de luz realizan cálculos en los nuevos chips fotónicos es mucho más general, pero tiene un principio subyacente similar. El nuevo enfoque utiliza múltiples haces de luz dirigidos de tal manera que sus ondas interactúan entre sí, producir patrones de interferencia que transmitan el resultado de la operación prevista. El dispositivo resultante es algo que los investigadores llaman un procesador nanofotónico programable.

El resultado, Shen dice, es que los chips ópticos que utilizan esta arquitectura podrían, en principio, realizar cálculos realizados en algoritmos típicos de inteligencia artificial mucho más rápido y utilizando menos de una milésima de energía por operación que los chips electrónicos convencionales. "La ventaja natural de utilizar la luz para realizar la multiplicación de matrices juega un papel importante en la aceleración y el ahorro de energía, porque las multiplicaciones de matrices densas son la parte que más energía consume y consume más tiempo en los algoritmos de IA ", dice.

El nuevo procesador nanofotónico programable, que fue desarrollado en el laboratorio de Englund por Harris y colaboradores, utiliza una serie de guías de ondas que están interconectadas de una manera que se puede modificar según sea necesario, programar ese conjunto de vigas para un cálculo específico. "Puede programar en cualquier operación matricial, Harris dice. El procesador guía la luz a través de una serie de guías de ondas fotónicas acopladas. La propuesta completa del equipo requiere capas intercaladas de dispositivos que apliquen una operación llamada función de activación no lineal, en analogía con el funcionamiento de las neuronas en el cerebro.

Para demostrar el concepto, el equipo configuró el procesador nanofotónico programable para implementar una red neuronal que reconoce cuatro sonidos vocales básicos. Incluso con este sistema rudimentario, pudieron lograr un nivel de precisión del 77 por ciento, en comparación con aproximadamente el 90 por ciento de los sistemas convencionales. No existen "obstáculos sustanciales" para ampliar el sistema para lograr una mayor precisión, Dice Soljacic.

Englund agrega que el procesador nanofotónico programable también podría tener otras aplicaciones, incluido el procesamiento de señales para la transmisión de datos. "El procesamiento de señales analógicas de alta velocidad es algo que esto podría administrar" más rápido que otros enfoques que primero convierten la señal a formato digital, ya que la luz es un medio inherentemente analógico. "Este enfoque podría realizar el procesamiento directamente en el dominio analógico, " él dice.

El equipo dice que todavía tomará mucho más esfuerzo y tiempo hacer que este sistema sea útil; sin embargo, una vez que el sistema se haya ampliado y esté en pleno funcionamiento, puede encontrar muchos casos de usuario, como centros de datos o sistemas de seguridad. El sistema también podría ser de gran ayuda para los vehículos autónomos o los drones. dice Harris, o "siempre que necesite hacer muchos cálculos pero no tenga mucha energía o tiempo".

Esta historia se vuelve a publicar por cortesía de MIT News (web.mit.edu/newsoffice/), un sitio popular que cubre noticias sobre la investigación del MIT, innovación y docencia.

Los físicos utilizan la memoria cuántica para demostrar la comunicación directa segura cuántica

Los investigadores informan sobre la primera aleación superelástica de tamaño nanométrico

Física