a, Ilustración de la matriz de fotodiodos ANN. Todos los subpíxeles del mismo color están conectados en paralelo para generar M corrientes de salida. B, Diagrama de circuito de un solo píxel en la matriz de fotodiodos. C, D, Esquemas del clasificador (c) y el codificador automático (d). Debajo de la ilustración del codificador automático, se muestra un ejemplo de codificación / decodificación de una letra de 28 × 28 píxeles de la base de datos de dígitos manuscritos MNIST. La imagen original se codifica en 9 neuronas de capa de código y luego se vuelve a decodificar en una imagen. Crédito: Naturaleza (2020). DOI:10.1038 / s41586-020-2038-x
Al aplicar la computación en sensor de datos analógicos, un equipo de investigadores del Instituto de Fotónica de la Universidad Tecnológica de Viena ha desarrollado una forma de acelerar la visión artificial. En su artículo publicado en la revista Naturaleza , el grupo describe su diseño y qué tan bien funcionó durante las pruebas. Yang Chai, de la Universidad Politécnica de Hong Kong, ha publicado un artículo de News &Views en el mismo número de la revista que describe el trabajo del equipo.
Con la tecnología actual, La visión artificial se lleva a cabo mediante un sistema básico que involucra un dispositivo con un sensor de imagen que responde a la luz. Los datos del sensor de imagen se convierten de una señal analógica a una digital con otro dispositivo. Los datos digitales son luego procesados por otro dispositivo, ya sea localmente o en la nube. Este sistema funciona razonablemente bien para las aplicaciones actuales, pero no será adecuado para aquellos en el futuro debido al retraso que implica la lectura y el procesamiento de grandes cantidades de datos de imágenes. En este nuevo esfuerzo, los investigadores han propuesto un nuevo tipo de sensor de imagen que puede procesar datos analógicos de forma limitada.
El sensor de imagen previsto por el equipo en Austria consiste en incrustar tríos de fotodiodos en un chip de forma que permita aumentar o disminuir su sensibilidad a la luz utilizando un voltaje aplicado. una configuración que permite ajustar o ponderar cada diodo individualmente. En tal configuración, los diodos actúan de manera similar a los nervios del ojo humano. A medida que se presentan imágenes al dispositivo, todos los diodos reaccionan en función de su sintonización:juntos, sirven como un procesador de visión en red. Cuando la luz llega al sensor, se procesa sumando la intensidad de luz de cada una de las columnas y filas que componen la matriz de sensores. Luego, la matriz de diodos se entrena para una tarea ajustando cada miembro individualmente según el resultado deseado. La etapa de aprendizaje inicial toma una pequeña cantidad de tiempo, pero una vez que la red ha sido entrenada, el procesamiento ocurre a una velocidad igual al tiempo de reacción de los fotodiodos.
El dispositivo imaginado por los investigadores no estaba destinado a producir imágenes. En lugar de, filtra los datos innecesarios y realiza una clasificación inicial. Para probarlo, los investigadores enseñaron a su dispositivo a clasificar tres letras simplificadas. También lo usaron para realizar una codificación automática muy básica basada en las características clave de una imagen determinada. Señalan que su diseño y dispositivo aún se encuentran en la etapa de prueba de concepto, pero dicen que sus hallazgos hasta ahora son alentadores.
© 2020 Science X Network