Los investigadores del MIT describen un algoritmo de aprendizaje automático que puede registrar exploraciones cerebrales y otras imágenes tridimensionales más de 1, 000 veces más rápido utilizando técnicas de aprendizaje novedosas. Crédito:Instituto de Tecnología de Massachusetts
El registro de imágenes médicas es una técnica común que implica superponer dos imágenes, como las imágenes por resonancia magnética (IRM), para comparar y analizar las diferencias anatómicas con gran detalle. Si un paciente tiene un tumor cerebral, por ejemplo, los médicos pueden superponer una exploración del cerebro de hace varios meses con una exploración más reciente para analizar pequeños cambios en el progreso del tumor.
Este proceso, sin embargo, a menudo puede tardar dos horas o más, ya que los sistemas tradicionales alinean meticulosamente cada uno de potencialmente un millón de píxeles en los escaneos combinados. En un par de artículos de la próxima conferencia, Los investigadores del MIT describen un algoritmo de aprendizaje automático que puede registrar exploraciones cerebrales y otras imágenes tridimensionales más de 1, 000 veces más rápido utilizando técnicas de aprendizaje novedosas.
El algoritmo funciona "aprendiendo" mientras registra miles de pares de imágenes. Al hacerlo, adquiere información sobre cómo alinear imágenes y estima algunos parámetros de alineación óptimos. Después de entrenar, utiliza esos parámetros para asignar todos los píxeles de una imagen a otra, de repente. Esto reduce el tiempo de registro a uno o dos minutos usando una computadora normal, o menos de un segundo usando una GPU con una precisión comparable a la de los sistemas de última generación.
"Las tareas de alinear una resonancia magnética cerebral no deberían ser tan diferentes cuando se alinea un par de resonancias magnéticas cerebrales u otro, "dice el coautor de ambos artículos Guha Balakrishnan, estudiante de posgrado en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL) y en el Departamento de Ingeniería y Ciencias de la Computación (EECS). "Hay información que debería poder transferir sobre cómo realiza la alineación. Si puede aprender algo del registro de imágenes anterior, puedes hacer una nueva tarea mucho más rápido y con la misma precisión ".
Los trabajos se presentan en la Conferencia sobre Visión por Computador y Reconocimiento de Patrones (CVPR), celebrada esta semana, y en la Conferencia sobre Computación de Imágenes Médicas e Intervenciones Asistidas por Computadora (MICCAI), celebrada en septiembre. Los coautores son:Adrian Dalca, un postdoctorado en el Hospital General de Massachusetts y CSAIL; Amy Zhao, estudiante de posgrado en CSAIL; Mert R. Sabuncu, un ex postdoctorado de CSAIL y ahora profesor en la Universidad de Cornell; y John Guttag, el profesor Dugald C. Jackson de Ingeniería Eléctrica en el MIT.
Retención de información
Las imágenes por resonancia magnética son básicamente cientos de imágenes bidimensionales apiladas que forman imágenes tridimensionales masivas, llamados "volúmenes, "que contiene un millón o más de píxeles tridimensionales, llamados "voxels". Por lo tanto, lleva mucho tiempo alinear todos los vóxeles del primer volumen con los del segundo. Es más, los escaneos pueden provenir de diferentes máquinas y tener diferentes orientaciones espaciales, lo que significa que hacer coincidir vóxeles es aún más complejo computacionalmente.
"Tienes dos imágenes diferentes de dos cerebros diferentes, ponlos uno encima del otro, y comienzas a mover uno hasta que uno encaja con el otro. Matemáticamente, este procedimiento de optimización lleva mucho tiempo, "dice Dalca, autor principal del artículo CVPR y autor principal del artículo MICCAI.
Este proceso se vuelve particularmente lento cuando se analizan escaneos de grandes poblaciones. Neurocientíficos que analizan las variaciones en las estructuras cerebrales en cientos de pacientes con una enfermedad o afección en particular. por ejemplo, potencialmente podría llevar cientos de horas.
Eso es porque esos algoritmos tienen un defecto importante:nunca aprenden. Después de cada registro, descartan todos los datos relacionados con la ubicación del vóxel. "Esencialmente, comienzan desde cero con un nuevo par de imágenes, "Balakrishnan dice." Después de 100 registros, debería haber aprendido algo de la alineación. Eso es lo que aprovechamos ".
El algoritmo de los investigadores, llamado "VoxelMorph, "funciona con una red neuronal convolucional (CNN), un enfoque de aprendizaje automático que se usa comúnmente para el procesamiento de imágenes. Estas redes constan de muchos nodos que procesan imágenes y otra información a través de varias capas de computación.
En el documento CVPR, los investigadores entrenaron su algoritmo en 7, 000 exploraciones cerebrales de resonancia magnética disponibles públicamente y luego lo probó en 250 exploraciones adicionales.
Durante el entrenamiento, Los escáneres cerebrales se introdujeron en el algoritmo por parejas. Usando una CNN y una capa de cálculo modificada llamada transformador espacial, el método captura similitudes de vóxeles en una resonancia magnética con vóxeles en la otra exploración. Al hacerlo, el algoritmo aprende información sobre grupos de vóxeles, como formas anatómicas comunes a ambos escaneos, que utiliza para calcular parámetros optimizados que se pueden aplicar a cualquier par de escaneos.
Cuando se alimentan dos nuevas exploraciones, una "función" matemática simple utiliza esos parámetros optimizados para calcular rápidamente la alineación exacta de cada vóxel en ambos escaneos. En breve, El componente CNN del algoritmo obtiene toda la información necesaria durante el entrenamiento para que, durante cada nuevo registro, todo el registro se puede ejecutar utilizando uno, evaluación de funciones fácilmente computable.
Los investigadores descubrieron que su algoritmo podía registrar con precisión todos sus 250 escáneres cerebrales de prueba, los registrados después del conjunto de entrenamiento, en dos minutos utilizando una unidad de procesamiento central tradicional. y en menos de un segundo usando una unidad de procesamiento de gráficos.
En tono rimbombante, el algoritmo "no está supervisado, "lo que significa que no requiere información adicional más allá de los datos de imagen. Algunos algoritmos de registro incorporan modelos de CNN pero requieren una" verdad básica, "lo que significa que primero se ejecuta otro algoritmo tradicional para calcular registros precisos. El algoritmo de los investigadores mantiene su precisión sin esos datos.
El artículo de MICCAI desarrolla un algoritmo de VoxelMorph refinado que "dice qué tan seguros estamos de cada registro, "Balakrishnan dice. También garantiza el registro" suavidad, "lo que significa que no produce pliegues, agujeros o distorsiones generales en la imagen compuesta. El artículo presenta un modelo matemático que valida la precisión del algoritmo usando algo llamado puntaje de Dice, una métrica estándar para evaluar la precisión de las imágenes superpuestas. En 17 regiones del cerebro, el algoritmo refinado de VoxelMorph obtuvo la misma precisión que un algoritmo de registro de última generación de uso común, al tiempo que proporciona mejoras metodológicas y de tiempo de ejecución.
Más allá de los escáneres cerebrales
The speedy algorithm has a wide range of potential applications in addition to analyzing brain scans, dicen los investigadores. MIT colleagues, por ejemplo, are currently running the algorithm on lung images.
The algorithm could also pave the way for image registration during operations. Various scans of different qualities and speeds are currently used before or during some surgeries. But those images are not registered until after the operation. When resecting a brain tumor, por ejemplo, surgeons sometimes scan a patient's brain before and after surgery to see if they've removed all the tumor. If any bit remains, they're back in the operating room.
With the new algorithm, Dalca says, surgeons could potentially register scans in near real-time, getting a much clearer picture on their progress. "Hoy dia, they can't really overlap the images during surgery, because it will take two hours, and the surgery is ongoing" he says. "However, if it only takes a second, you can imagine that it could be feasible."
Esta historia se vuelve a publicar por cortesía de MIT News (web.mit.edu/newsoffice/), un sitio popular que cubre noticias sobre la investigación del MIT, innovación y docencia.