Una nueva investigación describe una única red neuronal que puede recopilar datos faltantes de un paciente y agregarlos a su historial. Crédito:MIT News
Los investigadores del MIT han desarrollado un modelo que puede asimilar múltiples tipos de datos de salud de un paciente para ayudar a los médicos a tomar decisiones con información incompleta.
El campo de la "analítica predictiva" es prometedor para muchas aplicaciones de atención médica. Los modelos de aprendizaje automático se pueden entrenar para buscar patrones en los datos del paciente para predecir el riesgo de enfermedad o muerte de un paciente en la UCI. para ayudar en el cuidado de la sepsis, o diseñar regímenes de quimioterapia más seguros.
El proceso implica predecir variables de interés, como el riesgo de enfermedad, a partir de variables conocidas, como los síntomas, Información biométrica, pruebas de laboratorio, y exploraciones corporales. Sin embargo, que los datos de los pacientes pueden provenir de varias fuentes diferentes y, a menudo, están incompletos. Por ejemplo, puede incluir información parcial de encuestas de salud sobre el bienestar físico y mental, mezclado con datos muy complejos que comprenden mediciones de la función cardíaca o cerebral.
El uso del aprendizaje automático para analizar todos los datos disponibles podría ayudar a los médicos a diagnosticar y tratar mejor a los pacientes. Pero la mayoría de los modelos no pueden manejar datos sumamente complejos. Otros no logran captar el alcance completo de las relaciones entre diferentes variables de salud, por ejemplo, cómo los patrones de respiración ayudan a predecir las horas de sueño o los niveles de dolor.
En un documento que se presentará en la Conferencia AAAI sobre Inteligencia Artificial la próxima semana, Los investigadores del MIT describen una única red neuronal que toma como entrada tanto datos simples como altamente complejos. Usando las variables conocidas, la red puede completar todas las variables que faltan. Dados los datos de, decir, la señal de electrocardiografía (ECG) de un paciente, que mide la función cardíaca, y el nivel de fatiga autoinformado, el modelo puede predecir el nivel de dolor de un paciente, que el paciente podría no recordar o informar correctamente.
Probado en un conjunto de datos de estudio del sueño real, que contenía encuestas de salud, y ECG y otras señales complejas:la red logró una precisión del 70 al 80 por ciento en la predicción de cualquiera de las ocho variables faltantes, basado en las otras siete variables conocidas.
La red funciona uniendo varios submodelos, cada uno diseñado para describir una relación específica entre variables. Los submodelos comparten datos mientras hacen predicciones, y finalmente generar una variable objetivo prevista. "Tenemos una red de modelos que se comunican entre sí para predecir lo que no sabemos, utilizando la información que conocemos de estos diferentes tipos de datos, "dice el autor principal, Hao Wang, un postdoctorado en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL). "Si usted tiene, decir, ocho tipos diferentes de datos, y tengo información completa sobre un paciente de siete, la comunicación entre los modelos nos ayudará a llenar los vacíos que faltan en el octavo tipo de datos de los otros siete tipos ".
Junto a Wang en el papel están Chengzhi Mao, estudiante de pregrado en la Universidad de Tsinghua; CSAIL Ph.D. los estudiantes Hao He y Mingmin Zhao; Dina Katabi, el Profesor Andrew y Erna Viterbi de Ingeniería Eléctrica y Ciencias de la Computación en el MIT y director del Centro del MIT para Redes Inalámbricas y Computación Móvil; y Tommi S. Jaakkola, el profesor Thomas Siebel en el Departamento de Ingeniería Eléctrica e Informática y el Instituto de Datos, Sistemas y Sociedad.
Predicciones bidireccionales
Usar modelos tradicionales de aprendizaje automático para analizar la cantidad de variables que la red de investigadores puede manejar es prácticamente inviable, porque el número de modelos escala exponencialmente con el número de variables.
"Preguntamos, '¿Es posible diseñar un modelo único que pueda usar todos estos grupos de datos, ¿a pesar de que en cada grupo tenemos información diferente? '”, dice Wang.
La innovación clave fue dividir la red en submodelos individuales, cada uno de ellos diseñado para adaptarse a un tipo diferente de datos de entrada. Una red neuronal es una red interconectada de nodos que trabajan juntos para procesar datos complejos. Un nodo realiza cálculos relativamente simples antes de enviar la salida al siguiente nodo. En redes con submodelos, sin embargo, cada nodo puede funcionar como una red separada que puede manejar cálculos más complejos. Los submodelos pueden ser mucho más eficientes, dependiendo de la aplicación.
En su trabajo, los investigadores crearon un submodelo probabilístico para cada salida variable. También desarrollaron una técnica para permitir que los submodelos se comuniquen entre sí mientras hacen predicciones, llamadas redes de inferencia bidireccionales (BIN). Esta técnica aprovecha una técnica de entrenamiento de redes neuronales conocida como retropropagación. Entrenando, La retropropagación envía errores informáticos a través de los nodos para actualizar los valores de los parámetros de la red. Pero esta técnica nunca se usa en pruebas, especialmente cuando hay dependencias condicionales complejas involucradas. En lugar de, en pruebas tradicionales, los datos ingresados se procesan de nodo a nodo en una dirección, hasta que un nodo final al final de la secuencia genere una predicción.
Los investigadores programaron su red para utilizar tanto el método tradicional como la retropropagación durante las pruebas. En este contexto, la retropropagación consiste básicamente en tomar una salida variable, luego, prediciendo una entrada de esa salida, y enviar el valor de entrada hacia atrás a un nodo anterior. Esto crea una red en la que todos los submodelos trabajan juntos y son co-dependientes entre sí, para generar una probabilidad objetivo.
Llenar los espacios en blanco
Los investigadores capacitaron a su red en el conjunto de datos del Estudio de salud cardíaca del sueño 2 (SHHS2) del mundo real. Los datos incluyen lecturas de electroencefalografía (EEG), que miden la función cerebral; ECG; y señales de patrón de respiración. También incluye información de una encuesta de salud para medir ocho variables de salud, incluido el bienestar emocional, funcionamiento social, y energía / fatiga, clasificados en una escala de 0 a 100.
Entrenando, la red aprende patrones de cómo cada variable puede afectar a otra. Por ejemplo, si alguien aguanta la respiración durante mucho tiempo, pueden estar tensos, lo que puede indicar dolor físico. En prueba, la red es capaz de analizar las relaciones para predecir cualquiera de las ocho variables, basado en cualquier otra información, con una precisión del 70 al 80 por ciento.
La red podría ayudar a cuantificar variables de salud a veces ambiguas para pacientes y médicos, tales como niveles de dolor y fatiga. Cuando los pacientes duermen después de la cirugía, por ejemplo, pueden despertarse en medio de la noche con dolor, pero es posible que no recuerde un nivel de dolor adecuado al día siguiente.
Próximo, los investigadores esperan implementar la red como un componente de software para un dispositivo que construyeron, llamado EQ Radio, que puede rastrear la respiración y la frecuencia cardíaca de alguien utilizando solo señales inalámbricas. En la actualidad, el dispositivo analiza esa información para inferir si alguien está contento, enfadado, o triste. Con la red, el dispositivo podría potencialmente hacer predicciones actualizadas continuamente sobre la salud de un paciente, pasivamente, dado sólo información parcial. "Esto podría ser muy útil en las instalaciones de vida asistida, donde los médicos pueden monitorear las dimensiones emocionales y físicas de la salud de un paciente durante todo el día, cotidiano, "Dice Wang.
Esta historia se vuelve a publicar por cortesía de MIT News (web.mit.edu/newsoffice/), un sitio popular que cubre noticias sobre la investigación del MIT, innovación y docencia.