Imágenes específicas de la clase de objetos utilizando una cámara difractiva. a Ilustración de una cámara difractiva de tres capas entrenada para generar imágenes específicas de clases de objetos con borrado totalmente óptico instantáneo de las otras clases de objetos en su FOV de salida. b La configuración experimental para la prueba de la cámara difractiva utilizando iluminación THz coherente. Crédito:eLight (2022). DOI:10.1186/s43593-022-00021-3
Durante la última década, las cámaras digitales se han adoptado ampliamente en varios aspectos de nuestra sociedad y se están utilizando de forma masiva en teléfonos móviles, vigilancia de seguridad, vehículos autónomos y reconocimiento facial. A través de estas cámaras, se generan enormes cantidades de datos de imágenes, lo que genera una creciente preocupación sobre la protección de la privacidad.
Algunos métodos existentes abordan estas preocupaciones mediante la aplicación de algoritmos para ocultar información confidencial de las imágenes adquiridas, como el desenfoque o el cifrado de imágenes. Sin embargo, dichos métodos aún corren el riesgo de exponer datos confidenciales porque las imágenes sin procesar ya se capturan antes de que se sometan a procesamiento digital para ocultar o cifrar la información confidencial. Además, el cálculo de estos algoritmos requiere un consumo de energía adicional. También se hicieron otros esfuerzos para buscar soluciones a este problema mediante el uso de cámaras personalizadas para degradar la calidad de la imagen para que se pueda ocultar la información identificable. Sin embargo, estos enfoques sacrifican la calidad general de la imagen para todos los objetos de interés, lo que no es deseable, y siguen siendo vulnerables a los ataques de los adversarios para recuperar la información confidencial que se registra.
Un nuevo artículo de investigación publicado en eLight demostró un nuevo paradigma para lograr imágenes que preservan la privacidad mediante la construcción de un tipo fundamentalmente nuevo de generador de imágenes diseñado por IA. En su artículo, los investigadores de la UCLA, dirigidos por el profesor Aydogan Ozcan, presentaron un diseño de cámara inteligente que captura solo ciertos tipos de objetos deseados, mientras que instantáneamente borra otros tipos de objetos de sus imágenes sin necesidad de ningún procesamiento digital.
Este nuevo diseño de cámara consta de superficies transmisivas sucesivas, cada una compuesta por decenas de miles de características de difracción a la escala de la longitud de onda de la luz. La estructura de estas superficies transmisivas se optimiza mediante el aprendizaje profundo para modular la fase de los campos ópticos transmitidos de modo que la cámara solo tome imágenes de ciertos tipos/clases de objetos deseados y borre los demás. Después de su diseño (entrenamiento) basado en el aprendizaje profundo, las capas resultantes se fabrican y ensamblan en 3D, formando la cámara inteligente. Después de su ensamblaje, cuando los objetos de entrada de las clases de objetos de destino aparecen frente a él, forman imágenes de alta calidad en la salida de la cámara, como se desee. Por el contrario, cuando los objetos de entrada frente a la misma cámara pertenecen a otras clases no deseadas, se borran ópticamente, formando patrones no informativos y de baja intensidad similares al ruido aleatorio.
Dado que la información característica de las clases de objetos no deseadas se borra ópticamente en la salida de la cámara a través de la difracción de la luz, esta cámara diseñada por IA nunca graba sus imágenes directas. Por lo tanto, la protección de la privacidad se maximiza ya que un ataque adversario que tenga acceso a las imágenes grabadas de esta cámara no puede recuperar la información. Esta característica también puede reducir el almacenamiento de datos y la carga de transmisión de las cámaras, ya que las imágenes de los objetos no deseados no se graban.
Para demostrar experimentalmente esta cámara única de datos específicos, el equipo de investigación de la UCLA la diseñó para obtener una imagen específica y selectiva de solo una clase de dígitos escritos a mano, y fabricó la cámara diseñada mediante impresión 3D. Esta cámara impresa en 3D se probó utilizando ondas de terahercios que iluminan dígitos escritos a mano. Siguiendo los principios básicos de su diseño, la cámara inteligente pudo capturar selectivamente los objetos de entrada solo si eran dígitos escritos a mano "2", mientras borraba instantáneamente todos los demás dígitos escritos a mano de las imágenes de salida, produciendo características similares al ruido de baja intensidad. .
Además de los dígitos escritos a mano, los investigadores de la UCLA también demostraron otra variación del mismo diseño de cámara específico de clase mediante la captura de imágenes selectivas de un tipo de producto de moda (por ejemplo, pantalones), mientras borraban instantáneamente otros productos de moda de la salida de la cámara. El equipo de investigación probó rigurosamente el diseño de su cámara bajo diversas condiciones de iluminación que nunca se incluyeron en su capacitación y demostró que esta cámara inteligente es resistente a las variaciones de iluminación.
Más allá de las imágenes específicas de la clase de datos, este diseño de cámara basado en IA también se utilizó para construir cámaras de encriptación, proporcionando una capa adicional de seguridad y protección de la privacidad. Una cámara de encriptación de este tipo, diseñada con capas de difracción optimizadas por IA, realiza ópticamente una transformación lineal seleccionada, exclusivamente para los objetos objetivo de interés. Only those with access to the decryption key (i.e., the inverse linear transformation in this case) can recover the original image of the target objects. On the other hand, the information of the other undesired objects is irreversibly lost since the AI-designed camera all-optically erases them at the output. Therefore, even if the decryption key is applied to the recorded images, it yields noise-like, unrecognizable features for other classes of undesired objects.
Except for the illumination light, this smart camera does not require any external power for its computation and operates at the speed of light. Therefore, it is fast, data- and energy-efficient, making it especially suitable for task-specific, privacy-aware, and power-limited imaging applications. The core teachings of this diffractive camera design can inspire future imaging systems that consume orders of magnitude less computing and data transmission power.
This research was led by Professor Aydogan Ozcan, the associate director of the California NanoSystems Institute (CNSI) and the Volgenau Chair for Engineering Innovation at the Electrical and Computer Engineering (ECE) department at UCLA, along with Professor Mona Jarrahi, the Northrop Grumman Endowed Chair and the director of the Terahertz Electronics Laboratory at UCLA ECE. The other authors of this work include graduate students Bijie Bai, Yi Luo, Tianyi Gan, Yuhang Li, Yifan Zhao, Deniz Mengu and post-doctoral researcher Dr. Jingtian Hu, all with the ECE department at UCLA. All-optical phase recovery and quantitative phase imaging performed instantly without a computer