Crédito:Liu et al.
Un equipo de investigadores de la Universidad de Geociencias de China y Wuhan WXYZ Technologies en China propuso recientemente una nueva técnica basada en el aprendizaje automático para localizar los ojos de las personas en imágenes de sus rostros. Esta tecnica, presentado en un artículo publicado en la revista de Elsevier Neurocomputación , podría tener varias aplicaciones útiles. Por ejemplo, podría usarse para detectar somnolencia en personas que conducen un automóvil o realizan tareas que requieren cierto grado de alerta y atención.
La somnolencia puede afectar en gran medida la capacidad de toma de decisiones de las personas, así como su atención y memoria. La somnolencia al conducir o al completar una tarea importante puede provocar una disminución significativa de la eficiencia. y en algunos casos, incluso causar accidentes potencialmente mortales.
Una de las formas más efectivas de estimar los niveles de somnolencia en humanos es mirar sus ojos, que en las personas somnolientas suelen estar más cerradas o fatigadas. Analizar automáticamente los ojos de las personas mediante métodos computacionales, sin embargo, en primer lugar implica ubicarlos en imágenes o videos en tiempo real.
"Nuestro trabajo reciente es una parte de nuestra investigación sobre la estimación de la somnolencia, "los investigadores que llevaron a cabo el estudio dijeron a TechXplore por correo electrónico". En nuestros trabajos anteriores, propusimos un modelo de servicio de iniciativa para el robot de servicio que es diferente del servicio pasivo (es decir, el robot debe esperar las instrucciones de un usuario al brindar servicio). Y lo que es más, seleccionamos un robot de servicio de bebidas como ejemplo para verificar la efectividad del modelo de servicio de iniciativa ".
Inicialmente, los investigadores se propusieron desarrollar una técnica para la estimación de la somnolencia que podría mejorar la practicidad de una plataforma robótica que sirve bebidas a los humanos. El primer paso en esta dirección fue crear un método automático para localizar los ojos de las personas en tiempo real mediante el análisis de imágenes de sus rostros.
Estructura general de WBCCNN para la localización ocular. Crédito:Liu et al.
El método de localización del ojo propuesto por los investigadores se basa en una técnica de aprendizaje automático conocida como red neuronal convolucional en cascada de binarización de peso (WBCCNN). El WBCCNN que desarrollaron predice la posición de los ojos de las personas de gruesa a fina, lo que mejora el rendimiento del modelo. Además, el componente binario de la red ayuda a reducir el tamaño de almacenamiento del modelo y agiliza sus operaciones.
Los investigadores evaluaron su modelo WBCCNN para la localización de los ojos en una serie de experimentos que utilizaron imágenes de Caras etiquetadas en la naturaleza (LFW), Conjuntos de datos de BioID y partes de la cara etiquetadas en la naturaleza (LFPW). Su método logró resultados notables y superó a otras técnicas de localización ocular. logrando un error de detección promedio del 0,66 por ciento en la localización del ojo izquierdo y del 0,71 por ciento en el ojo derecho.
Según los investigadores, el logro más significativo de su estudio fue el desarrollo de un WBCCNN en el que el peso está limitado por la binarización. Esta característica de diseño única permite ahorros en la capacidad de almacenamiento del modelo, al mismo tiempo que reduce sus costos computacionales. En el futuro, el nuevo modelo WBCCNN podría ayudar al desarrollo de herramientas efectivas para estimar la somnolencia de las personas, así como otras emociones o estados que pueden detectarse analizando los ojos de las personas.
"Es necesaria una localización ocular fiable para estimar la somnolencia, por lo tanto, ahora intentaremos aplicar el método de localización de ojos propuesto al servicio de iniciativa de robots para la estimación de la somnolencia, diseñado para ayudar a aumentar la eficiencia del trabajo de las personas, ", dijeron los investigadores.
© 2019 Science X Network