• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Una red de atención guiada por máscara de varias partes del cuerpo para la reidentificación de la persona

    Imagen 1:Podemos prestar más atención al cuerpo humano, parte superior del cuerpo y parte inferior del cuerpo. Crédito:Cai, Wang y Cheng.

    La reidentificación de personas implica la identificación automatizada de la misma persona en múltiples imágenes de diferentes cámaras y con diferentes antecedentes. ángulos o posiciones. A pesar de los recientes avances en el campo de la inteligencia artificial (IA), La reidentificación de la persona sigue siendo una tarea muy desafiante. particularmente debido a las muchas variaciones en la pose de una persona, así como otras diferencias asociadas con la iluminación, oclusión, desalineación y desorden de fondo.

    Investigadores del Suning R&D Center en los EE. UU. Han desarrollado recientemente una nueva técnica para la reidentificación de personas basada en una red de atención guiada por máscara de múltiples partes del cuerpo (MMGA). Su papel prepublicado en arXiv, se presentará durante la presentación destacada del taller CVPR 2019 en junio.

    "La reidentificación de personas se está convirtiendo en una tarea cada vez más importante debido a su amplia gama de aplicaciones potenciales, como una investigación criminal, seguridad pública y recuperación de imágenes, "Honglong Cai, uno de los investigadores que realizó el estudio, dicho TechXplore . "Sin embargo, sigue siendo una tarea desafiante, debido a la oclusión, desalineación variación de poses y desorden de fondo. En nuestro estudio reciente, nuestro equipo trató de desarrollar un método para superar estos desafíos ".

    En lugar de centrarse en imágenes completas, Cai y sus colegas desarrollaron un modelo de reidentificación de personas que solo presta atención a la persona de interés, ignorando el fondo. Llevando esta idea un paso más allá, su modelo analiza diferentes partes del cuerpo de la persona en una imagen determinada.

    "Para implementar nuestra idea, propusimos creativamente una red de atención guiada por máscara de partes del cuerpo de múltiples escalas, ", Dijo Cai." Aplicamos máscaras corporales para guiar el entrenamiento de nuestro modelo para que pueda prestar más atención al cuerpo humano en la imagen. Nuestro modelo contiene dos partes:un extractor de funciones y un módulo de atención ".

    Los 5 primeros resultados de recuperación de imágenes de consulta son correctos. Crédito:Cai, Wang y Cheng.

    El componente extractor de características del modelo ideado por Cai y sus colegas puede extraer características discriminatorias de los cuerpos de las personas a partir de imágenes. El módulo de atención del modelo, por otra parte, guía la red MMGA, resaltando áreas de la imagen (es decir, píxeles) a las que debería prestar más atención.

    Los investigadores utilizaron máscaras corporales para guiar el entrenamiento del módulo de atención de su modelo. ya que esto le permite distinguir los cuerpos humanos de la información de fondo. Además, dividen las máscaras corporales en máscaras para la parte superior e inferior del cuerpo, para que el módulo de atención pueda aprender a distinguir entre las partes superior e inferior del cuerpo de una persona.

    "A diferencia de la mayoría de los métodos actuales de reidentificación de personas, que dividen las imágenes en diapositivas fijas, nuestro modelo puede decir exactamente dónde están la parte superior y la parte inferior del cuerpo, "Explicó Cai." Además, las máscaras corporales solo se utilizan en la fase de entrenamiento, y no necesitamos máscaras corporales en la fase de inferencia, lo que hace que nuestro modelo sea muy eficiente en aplicaciones prácticas ".

    Para evaluar su modelo, Cai y sus colegas llevaron a cabo una serie de experimentos para probar su rendimiento en dos conjuntos de datos, a saber, los conjuntos de datos Market-1501 y DukeMTMC-reID. Descubrieron que su modelo puede reducir los efectos negativos de las variaciones en la pose de una persona, desalineación y desorden de fondo, superando los métodos de reidentificación de última generación.

    Los hallazgos recopilados por los investigadores sugieren que los mecanismos de atención pueden mejorar significativamente la precisión de las redes de reidentificación de personas. Es más, su estudio introdujo un método de entrenamiento de la atención de la guía de la máscara que puede mejorar aún más esta precisión.

    "En nuestro trabajo reciente, Las máscaras de la parte superior del cuerpo y las máscaras de la parte inferior del cuerpo se utilizan para guiar el entrenamiento del módulo de atención. "Dijo Cai." En el futuro, nos gustaría intentar dividir las máscaras corporales en detalles más finos, como la cabeza, mano, brazo, pierna, etc., ya que esto podría mejorar aún más la precisión de la reidentificación de personas ".

    © 2019 Science X Network




    © Ciencia https://es.scienceaq.com