Un equipo de Duke entrenó una computadora para identificar hasta 200 especies de aves con solo una foto. Dada una foto de un pájaro misterioso (arriba), el A.I. escupe mapas de calor que muestran qué partes de la imagen son más similares a las características típicas de las especies que ha visto antes. Crédito:Universidad de Duke
Pueden ser necesarios años de experiencia en la observación de aves para diferenciar una especie de la siguiente. Pero utilizando una técnica de inteligencia artificial llamada aprendizaje profundo, Investigadores de la Universidad de Duke han entrenado una computadora para identificar hasta 200 especies de aves a partir de solo una foto.
La verdadera innovación, sin embargo, es que el A.I. herramienta también muestra su pensamiento, de una manera que incluso alguien que no sepa un pingüino de un frailecillo puede entender.
El equipo entrenó su red neuronal profunda, algoritmos basados en la forma en que funciona el cerebro, alimentándolo 11, 788 fotos de 200 especies de aves de las que aprender, que van desde patos nadadores hasta colibríes revoloteando.
Los investigadores nunca le dijeron a la red "esto es un pico" o "estas son plumas de alas". Dada una foto de un pájaro misterioso, la red puede identificar patrones importantes en la imagen y adivinar al comparar esos patrones con los rasgos típicos de las especies que ha visto antes.
En el camino, escupe una serie de mapas de calor que básicamente dicen:"Esto no es una curruca cualquiera. Es una reinita encapuchada, y aquí están los rasgos, como su cabeza enmascarada y su vientre amarillo, que lo delatan ".
Doctorado en Ciencias de la Computación de Duke el estudiante Chaofan Chen y el estudiante universitario Oscar Li dirigieron la investigación, junto con otros miembros del equipo del Laboratorio de Análisis de Predicciones dirigido por la profesora de Duke Cynthia Rudin.
Descubrieron que su red neuronal es capaz de identificar las especies correctas hasta el 84% del tiempo, a la par con algunas de sus contrapartes con mejor rendimiento, que no revelan cómo son capaces de decirlo, decir, un gorrión del siguiente.
Rudin dice que su proyecto es más que nombrar pájaros. Se trata de visualizar lo que las redes neuronales profundas están viendo realmente cuando miran una imagen.
Se utiliza tecnología similar para etiquetar personas en sitios de redes sociales, detectar a los presuntos delincuentes en las cámaras de vigilancia, y entrenar coches autónomos para detectar cosas como semáforos y peatones.
El problema, Rudin dice:es que la mayoría de los enfoques de aprendizaje profundo de la visión por computadora son notoriamente opacos. A diferencia del software tradicional, El software de aprendizaje profundo aprende de los datos sin estar programado explícitamente. Como resultado, No siempre está claro exactamente cómo "piensan" estos algoritmos cuando clasifican una imagen.
Rudin y sus colegas están tratando de demostrar que A.I. no tiene por qué ser así. Ella y su laboratorio están diseñando modelos de aprendizaje profundo que explican el razonamiento detrás de sus predicciones. dejando en claro exactamente por qué y cómo se les ocurrieron sus respuestas. Cuando tal modelo comete un error, su transparencia incorporada permite ver por qué.
Para su próximo proyecto, Rudin y su equipo están utilizando su algoritmo para clasificar áreas sospechosas en imágenes médicas como mamografías. Si funciona, su sistema no solo ayudará a los médicos a detectar bultos, calcificaciones y otros síntomas que podrían ser signos de cáncer de mama. También mostrará en qué partes de la mamografía se dirige, revelando qué características específicas se parecen más a las lesiones cancerosas que ha visto antes en otros pacientes.
De ese modo, Rudin dice:su red está diseñada para imitar la forma en que los médicos hacen un diagnóstico. "Es un razonamiento basado en casos, ", Dijo Rudin." Esperamos poder explicar mejor a los médicos o pacientes por qué su imagen fue clasificada por la red como maligna o benigna ".
El equipo presentará un documento sobre sus hallazgos en la trigésima tercera conferencia sobre sistemas de procesamiento de información neuronal (NeurIPS 2019) en Vancouver el 12 de diciembre.