Martin Schrimpf. Crédito:Kris Brewer
Cuando abrimos los ojos por la mañana y contemplamos la primera escena del día, no pensamos mucho en el hecho de que nuestro cerebro está procesando los objetos dentro de nuestro campo de visión con gran eficiencia y que está compensando la falta de información sobre nuestro entorno, todo para permitirnos realizar nuestras actividades diarias. funciones. El vaso de agua que dejó en la mesita de noche cuando se preparaba para ir a la cama ahora está parcialmente bloqueado de su línea de visión por su reloj despertador, sin embargo, sabes que es un vaso.
Esta capacidad aparentemente simple para que los humanos reconozcan objetos parcialmente ocluidos, definida en esta situación como el efecto de un objeto en un espacio 3-D que bloquea la vista de otro objeto, ha sido un problema complicado para la comunidad de visión por computadora. Martin Schrimpf, estudiante de posgrado en el laboratorio DiCarlo en el Departamento de Ciencias Cerebrales y Cognitivas del MIT, explica que las máquinas se han vuelto cada vez más hábiles para reconocer elementos completos de forma rápida y segura, pero cuando algo cubre parte de ese elemento de la vista, esta tarea se vuelve cada vez más difícil para los modelos reconocer con precisión el artículo.
"Para que los modelos, desde la visión por computadora, funcionen en la vida cotidiana, necesitan poder digerir los objetos ocluidos tan bien como los completos; después de todo, cuando miras a tu alrededor la mayoría de los objetos están parcialmente ocultos detrás de otro objeto, "dice Schrimpf, coautor de un artículo sobre el tema que se publicó recientemente en el procedimientos de la Academia Nacional de Ciencias ( PNAS ).
En el nuevo estudio, él dice, "Investigamos los cálculos subyacentes en el cerebro y luego usamos nuestros hallazgos para construir modelos computacionales. Al recapitular el procesamiento visual en el cerebro humano, por lo tanto, esperamos mejorar también los modelos en visión por computadora ".
¿Cómo podemos nosotros, como seres humanos, hacer repetidamente esta tarea diaria sin poner mucho pensamiento y energía en esta acción? identifica escenas completas de forma rápida y precisa después de ver solo piezas? Los investigadores del estudio comenzaron con la corteza visual humana como modelo de cómo mejorar el rendimiento de las máquinas en este entorno. dice Gabriel Kreiman, un afiliado del MIT Center for Brains, Mentes y Máquinas. Kreinman es profesor de oftalmología en el Boston Children's Hospital y la Escuela de Medicina de Harvard y fue el investigador principal principal del estudio.
En su papel "Cálculos recurrentes para completar patrones visuales, "el equipo mostró cómo desarrollaron un modelo computacional, inspirado por limitaciones fisiológicas y anatómicas, que fue capaz de capturar las observaciones conductuales y neurofisiológicas durante la finalización del patrón. En el final, el modelo proporcionó información útil para comprender cómo hacer inferencias a partir de información mínima.
Esta historia se vuelve a publicar por cortesía de MIT News (web.mit.edu/newsoffice/), un sitio popular que cubre noticias sobre la investigación del MIT, innovación y docencia.