La investigación de IA logra una tecnología líder en el mundo para el reconocimiento visual de las personas

Crédito:CC0 Public Domain

La IA se utiliza cada vez más para ayudar a los operadores humanos a manejar cantidades masivas de imágenes de CCTV y otras fuentes de seguridad. La reidentificación de persona (ReID) es un método en el que una IA puede reconocer imágenes de la misma persona tomadas desde diferentes cámaras o en diferentes ocasiones. Esto ayuda a rastrear sospechosos a través de una red de CCTV que cubre un gran espacio público, como una red subterránea. ReID es un desafío para las máquinas, ya que deben considerar y diferenciar a la misma persona bajo diferentes fuentes de luz, poses y cambios en la apariencia, como la ropa.

En un documento que se presentará en la Conferencia Internacional de Visión por Computadora de este año en Seúl, Corea del Sur, la conferencia más prestigiosa en IA visual, expertos del Centro de Visión de Surrey, El procesamiento de voz y señal (CVSSP) detalla cómo han desarrollado un sistema único llamado OSNet que ha superado a muchos sistemas de identificación populares que ya están en uso.

El equipo CVSSP ha demostrado que OSNet puede profundizar en la información de una variedad de escalas espaciales para ayudar a realizar una reidentificación con precisión, desde los detalles más pequeños, como el logotipo de una camiseta, hasta otros, factores más importantes, como el tipo de abrigo que lleva el sospechoso.

Increíblemente, OSNet solo necesita 2,2 millones de parámetros, un número muy pequeño en el contexto de modelos de redes neuronales profundas, para superar a muchos de sus competidores construidos sobre la popular infraestructura ResNet50 que usa 24 millones de parámetros, lo que sugiere que OSNet podría convertirse en el estándar en tecnología de reconocimiento visual. Un tamaño de parámetro tan pequeño significa que el modelo se puede implementar "en el borde, "lo que significa que la pesada carga computacional se puede realizar en la propia cámara en lugar de en un centro de datos remoto, Ahorro de ancho de banda para transmitir grandes cantidades de datos de video desde las cámaras a los servidores de datos.

Tao Xiang, Profesor distinguido de visión artificial y aprendizaje automático en CVSSP, dijo:"Con OSNet, Nos propusimos desarrollar una herramienta que pueda superar muchos de los problemas de reidentificación de personas que enfrentan otras configuraciones, pero los resultados superaron con creces nuestras expectativas. La precisión de ReID lograda por OSNet ha superado claramente a la de los operadores humanos.

"OSNet no solo demuestra que es capaz de superar a sus homólogos en muchos problemas de reidentificación, pero los resultados son tales que creemos que podría usarse como una tecnología de reconocimiento visual independiente por derecho propio ".

Profesor Adrian Hilton, Director de CVSSP, dijo:"Este es un logro considerable del profesor Xiang y su equipo en el logro de la tecnología de reidentificación líder en el mundo. Su trabajo en OSNet tiene el potencial de ser innovador y podría ayudar a dar forma al campo del reconocimiento visual en los próximos años. es un gran ejemplo de IA y percepción de máquinas para el beneficio de la sociedad que proporciona tecnología habilitadora para espacios públicos más seguros ".

La hoja artificial produce con éxito gas limpio

ExaNoDe construye un innovador prototipo de unidad de cómputo 3D para exaescala

Electrónica