Enfoque propuesto de recuperación de personas utilizando la altura, color y género de la tela. Crédito:arXiv:1810.05080 [cs.CV] https://arxiv.org/abs/1810.05080
Un enfoque de búsqueda especial le permite encontrar personas en videos de vigilancia basándose únicamente en su descripción. El titular de RT decía:"El algoritmo de IA puede encontrarlo en imágenes de CCTV sin usar el reconocimiento facial". ¿Pero cómo? Altura, género, ropa, no rasgos faciales, son los obsequios, a través de un algoritmo de inteligencia artificial.
El trabajo refleja el potencial de las técnicas de aprendizaje profundo. RT hace un punto útil para aquellos que aún pueden difuminar el concepto de aprendizaje profundo con el aprendizaje automático.
RT escribió que en los esfuerzos de los investigadores, el aprendizaje profundo viajó "más allá del aprendizaje automático (donde los patrones se establecen en algoritmos y requieren supervisión) al incorporar el 'autoaprendizaje', para entrenar una red neuronal convolucional (CNN) para reconocer la biometría blanda mediante la visión por computadora".
RT y otros sitios informaron sobre el equipo de investigadores que crearon la herramienta que encuentra personas en imágenes de CCTV.
Hiren Galiyawala, Kenil Shah, Vandit Gajjar y Mehul S. Raval describieron su trabajo en su artículo, "Recuperación de personas en video de vigilancia usando la altura, Color y género, "enviado en septiembre y ahora en arXiv. Las afiliaciones de los autores incluyen la Escuela de Ingeniería y Ciencias Aplicadas, Universidad de Ahmedabad y L. D. College of Engineering, ambos en la India.
Atributos como estos:altura, construir, ropa — color de la tela, el tipo de tela y el género se denominan biometría suave. "La tarea de recuperar personas en el video es muy desafiante debido a la oclusión, condición de luz, calidad de la cámara, pose, y zoom. Sin embargo, atributos como la altura, color de la tela, El género se puede deducir a partir de un video de vigilancia de baja calidad a distancia sin la cooperación del sujeto. Estos atributos se conocen como biometría suave, "escribieron los autores.
Tristan Greene, TNW, ofreció un ejemplo, esa es una solicitud para las mujeres con camisas rojas que miden 153 cm de altura. El resultado sería un videoclip que se ha reducido a fotogramas con personas que cumplen con ese criterio.
¿Cuáles fueron los resultados? RT y otros sitios dijeron que el algoritmo identificó correctamente a 28 personas de 41 en un conjunto de datos con atributos biométricos suaves y que los investigadores dijeron, con solo algunos ajustes menores, que la precisión podría mejorarse sustancialmente.
Los autores del resumen dijeron que los modelos de color y género se ajustaron con AlexNet. Esta última es una red neuronal convolucional (CNN) que recibe su nombre de su diseñador, Alex Krizhevsky. AlexNet está capacitado en más de 1 millón de imágenes de la base de datos ImageNet, dijo MathWorks.
"La red tiene 8 capas de profundidad y puede clasificar imágenes en 1000 categorías de objetos, como el teclado, ratón, lápiz, y muchos animales. Como resultado, la red ha aprendido representaciones de características ricas para una amplia gama de imágenes ".
Tristan Greene en TNW presentó un caso de por qué su investigación es importante.
Greene encontró su trabajo emocionante por sus implicaciones en la búsqueda de personas desaparecidas o en el rastreo de presuntos delincuentes.
Pero, él agregó, "Quizás tan importante es el hecho de que esta es una respuesta legítima al problema de la vigilancia ubicua". Una alternativa a lo "ubicuo" sería solo lo relevante.
Greene dijo que "este paradigma implicaría el uso de computadoras para buscar en las imágenes de archivo solo los datos que son al menos algo relevantes. Es una distinción menor, pero uno que podría marcar la diferencia entre el voyerismo del gobierno y la protección ciudadana ".
Greene también pensó, "si pudiéramos enviar video a una red neuronal y dejar que se reduzca a unas pocas horas de metraje compilado, sería posible rastrear con precisión a los humanos a través de múltiples canales de vigilancia ".
© 2018 Science X Network