Crédito:CC0 Public Domain
Puede ser más difícil para las computadoras encontrar a Wally, un personaje esquivo que se esconde entre las multitudes en una popular serie de libros para niños, de lo que es para los humanos.
Ahora, Una investigadora de A * STAR y sus colegas han desarrollado un programa de inspiración biológica que podría permitir a las computadoras identificar Waldos de la vida real y otros objetivos de manera más eficiente.
El análisis de imágenes informáticas se utiliza habitualmente en medicina, seguridad, y rescate. La velocidad suele ser fundamental en estos esfuerzos, dice Mengmi Zhang, un científico informático en el Instituto de Investigación de Infocomm de A * STAR, quien dirigió el estudio. Ella cita el uso de computadoras para ayudar a encontrar víctimas de desastres naturales, como terremotos.
Pero estos esfuerzos a menudo se ven obstaculizados porque las computadoras carecen de la intuición humana. Una persona puede detectar rápidamente a un perro en un espacio lleno de gente, por ejemplo, incluso si nunca antes habían visto a ese perro en particular. Un ordenador, por el contrario, necesita ser entrenado usando miles de imágenes de diferentes perros, y aún entonces, pueden vacilar cuando buscan un nuevo perro cuya imagen no han encontrado previamente.
Esta debilidad podría ser particularmente problemática al buscar armas, dice Zhang. Una computadora entrenada para buscar cuchillos y pistolas, podría pasar por alto otro objeto afilado. "Si hay un palo de metal afilado que no se ha visto en el conjunto de entrenamiento, no significa que el pasajero deba poder llevarlo a bordo del avión, "dice Zhang.
Las búsquedas informáticas actuales también tienden a ser lentas porque la computadora debe escanear cada parte de una imagen en secuencia, prestando la misma atención a cada parte. Humanos sin embargo, cambiar rápidamente su atención entre varias ubicaciones diferentes en una imagen para encontrar su objetivo. Zhang y sus colegas querían comprender cómo los humanos hacen esto de manera tan eficiente. Presentaron a 45 personas imágenes abarrotadas y les pidieron que buscaran un objetivo, decir, una oveja. Monitorearon cómo los ojos de los sujetos se movían alrededor de la escena, fijándose brevemente en diferentes lugares de la imagen. Ellos encontraron que de media, la gente podía localizar a la oveja en unos 640 milisegundos. Esto correspondía a cambiar la ubicación de su mirada, de media, poco más de dos veces y media.
Luego, el equipo desarrolló un modelo informático para implementar esta estrategia de búsqueda más parecida a la humana en la búsqueda de un perro. En lugar de buscar un objetivo que fuera idéntico a una imagen de un perro dada de antemano, el modelo fue entrenado para buscar algo que tuviera características similares a la imagen de ejemplo. Esto permitió que el modelo generalizara a partir de una sola imagen de perro, al "concepto general de perro, "y seleccionar rápidamente otros perros que no había visto antes, explica Zhang.
Los investigadores probaron qué tan efectivo era el nuevo modelo de búsqueda visual por computadora midiendo la cantidad de veces que la computadora tuvo que fijarse en diferentes ubicaciones en una escena antes de encontrar su objetivo. "Lo que nos sorprende es que al utilizar nuestro método, las computadoras pueden buscar imágenes tan rápido como los humanos, incluso al buscar objetos que nunca antes habían visto, "dice Zhang. La computadora era tan buena como los humanos para encontrar a Wally.
El equipo ahora está programando su modelo con una mejor comprensión del contexto. Por ejemplo, los humanos comprenden naturalmente que es más probable que una taza esté sentada sobre una mesa que flotando en el aire. Una vez implementado, esto debería mejorar aún más la eficiencia del modelo, dice Zhang, agregando, "Wally no puede esconderse más".