Crédito:CC0 Public Domain
Mediante el uso innovador de una red neuronal que imita el procesamiento de imágenes del cerebro humano, un equipo de investigación informa sobre la reconstrucción precisa de imágenes transmitidas a través de fibras ópticas para distancias de hasta un kilómetro.
En la revista de la Optical Society para investigaciones de alto impacto, Optica , Los investigadores informan que enseñan un tipo de algoritmo de aprendizaje automático conocido como red neuronal profunda para reconocer imágenes de números a partir del patrón de motas que crean cuando se transmiten al extremo más alejado de una fibra. El trabajo podría mejorar las imágenes endoscópicas para el diagnóstico médico, aumentar la cantidad de información transportada a través de las redes de telecomunicaciones de fibra óptica, o aumentar la potencia óptica entregada por fibras.
"Utilizamos arquitecturas modernas de redes neuronales profundas para recuperar las imágenes de entrada de la salida codificada de la fibra, "dijo Demetri Psaltis, Instituto Federal Suizo de Tecnología, Lausana, quien dirigió la investigación en colaboración con su colega Christophe Moser. "Demostramos que esto es posible para fibras de hasta 1 kilómetro de largo", agregó. calificando el trabajo de "un hito importante".
Descifrando el desenfoque
Las fibras ópticas transmiten información con luz. Las fibras multimodo tienen una capacidad de transporte de información mucho mayor que las fibras monomodo. Sus muchos canales, conocidos como modos espaciales porque tienen diferentes formas espaciales, pueden transmitir diferentes flujos de información simultáneamente.
Si bien las fibras multimodo son adecuadas para transportar señales basadas en luz, transmitir imágenes es problemático. La luz de la imagen viaja a través de todos los canales y lo que sale por el otro extremo es un patrón de motas que el ojo humano no puede decodificar.
Para abordar este problema, Psaltis y su equipo recurrieron a una red neuronal profunda, un tipo de algoritmo de aprendizaje automático que funciona de forma muy similar a como lo hace el cerebro. Las redes neuronales profundas pueden brindar a las computadoras la capacidad de identificar objetos en fotografías y ayudar a mejorar los sistemas de reconocimiento de voz. La entrada se procesa a través de varias capas de neuronas artificiales, cada uno de los cuales realiza un pequeño cálculo y pasa el resultado a la siguiente capa. La máquina aprende a identificar la entrada reconociendo los patrones de salida asociados con ella.
"Si pensamos en el origen de las redes neuronales, que es nuestro propio cerebro, el proceso es simple, "explica Eirini Kakkava, un estudiante de doctorado que trabaja en el proyecto. "Cuando una persona mira fijamente un objeto, las neuronas del cerebro se activan, que indica el reconocimiento de un objeto familiar. Nuestro cerebro puede hacer esto porque se entrena a lo largo de nuestra vida con imágenes o señales de la misma categoría de objetos. que cambia la fuerza de las conexiones entre las neuronas ". Para entrenar una red neuronal artificial, los investigadores siguen esencialmente el mismo proceso, Enseñar a la red a reconocer determinadas imágenes (en este caso, dígitos escritos a mano) hasta que pueda reconocer imágenes en la misma categoría que las imágenes de entrenamiento que no ha visto antes.
Aprendiendo por los números
Para entrenar su sistema, los investigadores recurrieron a una base de datos que contenía 20, 000 muestras de números escritos a mano, 0 a 9. Seleccionaron 16, 000 para usar como datos de entrenamiento, y se mantuvo a un lado 2, 000 para validar el entrenamiento y otros 2, 000 para probar el sistema validado. Usaron un láser para iluminar cada dígito y enviaron el haz de luz a través de una fibra óptica, que tenía aproximadamente 4, 500 canales, a una cámara en el otro extremo. Una computadora midió cómo variaba la intensidad de la luz de salida a lo largo de la imagen capturada, y recopilaron una serie de ejemplos para cada dígito.
Aunque los patrones de motas recopilados para cada dígito parecían iguales para el ojo humano, la red neuronal pudo discernir diferencias y reconocer patrones de intensidad asociados con cada dígito. Las pruebas con las imágenes apartadas mostraron que el algoritmo logró una precisión del 97,6 por ciento para las imágenes transmitidas a través de una fibra de 0,1 metros de largo y una precisión del 90 por ciento con una longitud de fibra de 1 kilómetro.
Un método más simple
Navid Borhani, un miembro del equipo de investigación, dice que este enfoque de aprendizaje automático es mucho más simple que otros métodos para reconstruir imágenes pasadas a través de fibras ópticas, que requieren realizar una medición holográfica de la salida. La red neuronal también pudo hacer frente a distorsiones causadas por perturbaciones ambientales de la fibra, como fluctuaciones de temperatura o movimientos causados por corrientes de aire que pueden agregar ruido a la imagen, una situación que empeora con la longitud de la fibra.
"Se espera que la notable capacidad de las redes neuronales profundas para recuperar información transmitida a través de fibras multimodo beneficie a los procedimientos médicos como las aplicaciones de endoscopia y comunicaciones, ", Dijo Psaltis. Las señales de telecomunicaciones a menudo tienen que viajar a través de muchos kilómetros de fibra y pueden sufrir distorsiones, que este método podría corregir. Los médicos podrían usar sondas de fibra ultradelgada para recolectar imágenes de los tractos y arterias dentro del cuerpo humano sin necesidad de grabadoras holográficas complejas o sin preocuparse por el movimiento. "Los movimientos leves debido a la respiración o la circulación pueden distorsionar las imágenes transmitidas a través de una fibra multimodo, ", Dijo Psaltis. Las redes neuronales profundas son una solución prometedora para hacer frente a ese ruido.
Psaltis y su equipo planean probar la técnica con muestras biológicas, para ver si funciona tan bien como leer números escritos a mano. Esperan realizar una serie de estudios utilizando diferentes categorías de imágenes para explorar las posibilidades y los límites de su técnica.