Evaluación del conjunto de pruebas. Comparación de la evaluación del radiólogo interpretador original con la evaluación del modelo de aprendizaje profundo (DL) para (a) clasificación binaria y (c) de densidad mamaria mamográfica de cuatro vías. (B, d) Ejemplos correspondientes de mamografías con evaluaciones concordantes y discordantes por parte del radiólogo y con el modelo DL. Crédito:Sociedad Radiológica de Norteamérica
Investigadores del MIT y del Hospital General de Massachusetts han desarrollado un modelo automatizado que evalúa el tejido mamario denso en mamografías, que es un factor de riesgo independiente para el cáncer de mama, con la misma fiabilidad que los radiólogos expertos.
Esta es la primera vez que un modelo de aprendizaje profundo de este tipo se utiliza con éxito en una clínica en pacientes reales. según los investigadores. Con amplia implementación, los investigadores esperan que el modelo pueda ayudar a brindar una mayor confiabilidad a las evaluaciones de densidad mamaria en todo el país.
Se estima que más del 40 por ciento de las mujeres estadounidenses tienen tejido mamario denso, que por sí solo aumenta el riesgo de cáncer de mama. Es más, el tejido denso puede enmascarar cánceres en la mamografía, dificultando la detección. Como resultado, 30 estados de EE. UU. Exigen que se notifique a las mujeres si sus mamografías indican que tienen senos densos.
Pero las evaluaciones de la densidad mamaria se basan en una evaluación humana subjetiva. Debido a muchos factores, los resultados varían, a veces dramáticamente, entre los radiólogos. Los investigadores del MIT y MGH entrenaron un modelo de aprendizaje profundo en decenas de miles de mamografías digitales de alta calidad para aprender a distinguir diferentes tipos de tejido mamario. de graso a extremadamente denso, basado en evaluaciones de expertos. Dado una nueva mamografía, el modelo puede entonces identificar una medición de densidad que se alinea estrechamente con la opinión de los expertos.
"La densidad mamaria es un factor de riesgo independiente que impulsa la forma en que nos comunicamos con las mujeres sobre su riesgo de cáncer. Nuestra motivación fue crear una herramienta precisa y consistente, que se pueden compartir y utilizar en todos los sistemas de atención de la salud, "dice el segundo autor Adam Yala, un doctorado estudiante del Laboratorio de Informática e Inteligencia Artificial del MIT (CSAIL).
Los otros coautores son la primera autora Constance Lehman, profesor de radiología en la Escuela de Medicina de Harvard y director de imágenes de mama en el MGH; y la autora principal Regina Barzilay, el profesor Delta Electronics en CSAIL y el Departamento de Ingeniería Eléctrica y Ciencias de la Computación en MIT.
Densidad cartográfica
El modelo se basa en una red neuronal convolucional (CNN), que también se utiliza para tareas de visión por computadora. Los investigadores entrenaron y probaron su modelo en un conjunto de datos de más de 58, 000 mamografías seleccionadas al azar de más de 39, 000 mujeres examinadas entre 2009 y 2011. Para la formación, usaron alrededor de 41, 000 mamografías y, para las pruebas, alrededor de 8, 600 mamografías.
Cada mamografía del conjunto de datos tiene una clasificación de densidad mamaria estándar del Sistema de datos e informes de imágenes de mama (BI-RADS) en cuatro categorías:grasa, disperso (densidad dispersa), heterogéneo (mayormente denso), y denso. Tanto en el entrenamiento como en las pruebas de mamografías, alrededor del 40 por ciento se evaluó como heterogéneo y denso.
Durante el proceso de formación, el modelo recibe mamografías aleatorias para analizar. Aprende a mapear la mamografía con calificaciones de densidad de radiólogos expertos. Senos densos por ejemplo, contienen tejido conectivo glandular y fibroso, que aparecen como redes compactas de líneas blancas gruesas y manchas blancas sólidas. Las redes de tejido graso parecen mucho más delgadas, con zona gris en todas partes. En prueba, el modelo observa nuevas mamografías y predice la categoría de densidad más probable.
Evaluaciones coincidentes
El modelo se implementó en la división de imágenes mamarias del MGH. En un flujo de trabajo tradicional, cuando se realiza una mamografía, se envía a una estación de trabajo para que lo evalúe un radiólogo. El modelo de los investigadores está instalado en una máquina separada que intercepta las exploraciones antes de que lleguen al radiólogo. y asigna a cada mamografía una clasificación de densidad. Cuando los radiólogos realizan un escaneo en sus estaciones de trabajo, verán la calificación asignada al modelo, que luego aceptan o rechazan.
"Toma menos de un segundo por imagen ... [y se puede] escalar fácil y económicamente en los hospitales". Dice Yala.
En más de 10, 000 mamografías en MGH de enero a mayo de este año, el modelo logró un 94 por ciento de acuerdo entre los radiólogos del hospital en una prueba binaria, determinando si los senos eran heterogéneos y densos, o graso y esparcido. En las cuatro categorías de BI-RADS, coincidió con las evaluaciones de los radiólogos en un 90 por ciento. "MGH es un centro de imágenes de mama superior con un alto acuerdo entre radiólogos, y este conjunto de datos de alta calidad nos permitió desarrollar un modelo sólido, "Dice Yala.
En las pruebas generales con el conjunto de datos original, el modelo coincidió con las interpretaciones originales de expertos humanos en un 77 por ciento en cuatro categorías BI-RADS y, en pruebas binarias, coincidió con las interpretaciones en un 87 por ciento.
En comparación con los modelos de predicción tradicionales, los investigadores utilizaron una métrica llamada puntuación kappa, donde 1 indica que las predicciones coinciden siempre, y cualquier valor inferior indica menos casos de acuerdos. Los puntajes Kappa para los modelos de evaluación de densidad automáticos disponibles comercialmente obtienen un puntaje máximo de aproximadamente 0,6. En la aplicación clínica, el modelo de los investigadores obtuvo una puntuación kappa de 0,85 y, en pruebas, anotó un 0,67. Esto significa que el modelo hace mejores predicciones que los modelos tradicionales.
En un experimento adicional, los investigadores probaron el acuerdo del modelo con el consenso de cinco radiólogos de MGH de 500 mamografías de prueba aleatorias. Los radiólogos asignaron densidad mamaria a las mamografías sin conocimiento de la evaluación original, o las evaluaciones de sus pares o del modelo. En este experimento, el modelo alcanzó una puntuación kappa de 0,78 con el consenso del radiólogo.
Próximo, los investigadores tienen como objetivo escalar el modelo a otros hospitales. "Sobre la base de esta experiencia traslacional, Exploraremos cómo hacer la transición de los algoritmos de aprendizaje automático desarrollados en el MIT a una clínica que beneficie a millones de pacientes. ", Dice Barzilay." Esta es una carta del nuevo centro en el MIT, la Clínica Abdul Latif Jameel para el Aprendizaje Automático en Salud en el MIT, que se lanzó recientemente. Y estamos entusiasmados con las nuevas oportunidades que abre este centro ".