• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • La red neuronal aprende patrones de habla que predicen la depresión en entrevistas clínicas

    Los investigadores del MIT han desarrollado un modelo de red neuronal que puede analizar texto sin procesar y datos de audio de entrevistas para descubrir patrones de habla indicativos de depresión. Este método podría usarse para desarrollar ayudas de diagnóstico para los médicos que pueden detectar signos de depresión en una conversación natural. Crédito:Instituto de Tecnología de Massachusetts

    Para diagnosticar la depresión, los médicos entrevistan a los pacientes, haciendo preguntas específicas sobre, decir, enfermedades mentales pasadas, estilo de vida, y estado de ánimo, e identificar la afección en función de las respuestas del paciente.

    En años recientes, El aprendizaje automático se ha defendido como una ayuda útil para el diagnóstico. Modelos de aprendizaje automático, por ejemplo, Se han desarrollado que pueden detectar palabras y entonaciones del habla que pueden indicar depresión. Pero estos modelos tienden a predecir si una persona está deprimida o no, basado en las respuestas específicas de la persona a preguntas específicas. Estos métodos son precisos, pero su dependencia del tipo de pregunta que se hace limita cómo y dónde se pueden utilizar.

    En un artículo presentado en la conferencia Interspeech, Los investigadores del MIT detallan un modelo de red neuronal que se puede desatar en texto sin procesar y datos de audio de entrevistas para descubrir patrones de habla indicativos de depresión. Dado un nuevo tema, puede predecir con precisión si el individuo está deprimido, sin necesidad de otra información sobre las preguntas y respuestas.

    Los investigadores esperan que este método se pueda utilizar para desarrollar herramientas para detectar signos de depresión en una conversación natural. En el futuro, el modelo podría, por ejemplo, potencia las aplicaciones móviles que monitorean el texto y la voz de un usuario en busca de angustia mental y envían alertas. Esto podría ser especialmente útil para aquellos que no pueden acudir a un médico para un diagnóstico inicial. debido a la distancia, costo, o la falta de conciencia de que algo puede estar mal.

    "Los primeros indicios que tenemos de que una persona es feliz, emocionado, triste, o tiene alguna condición cognitiva grave, como la depresión, es a través de su discurso, "dice el primer autor Tuka Alhanai, investigador del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL). "Si desea implementar modelos [de detección de depresión] de manera escalable ... desea minimizar la cantidad de restricciones que tiene sobre los datos que está utilizando. Desea implementarlos en cualquier conversación regular y que el modelo se recupere, de la interacción natural, el estado del individuo ".

    La tecnología aún podría, por supuesto, ser utilizado para identificar la angustia mental en conversaciones casuales en consultorios clínicos, añade el coautor James Glass, un científico investigador senior en CSAIL. "Cada paciente hablará de manera diferente, y si el modelo ve cambios, tal vez sea una señal para los médicos, ", dice." Este es un paso adelante para ver si podemos hacer algo de ayuda para ayudar a los médicos ".

    El otro coautor del artículo es Mohammad Ghassemi, miembro del Instituto de Ingeniería y Ciencias Médicas (IMES).

    Modelado sin contexto

    La innovación clave del modelo radica en su capacidad para detectar patrones indicativos de depresión, y luego mapear esos patrones a nuevos individuos, sin información adicional. "Lo llamamos 'sin contexto, 'porque no está imponiendo restricciones a los tipos de preguntas que está buscando y el tipo de respuestas a esas preguntas, "Dice Alhanai.

    Otros modelos se proporcionan con un conjunto específico de preguntas, y luego se dan ejemplos de cómo responde una persona sin depresión y ejemplos de cómo responde una persona con depresión, por ejemplo, la consulta sencilla, "¿Tiene antecedentes de depresión?" Utiliza esas respuestas exactas para luego determinar si un nuevo individuo está deprimido cuando se le hace exactamente la misma pregunta. "Pero no es así como funcionan las conversaciones naturales, "Dice Alhanai.

    Los investigadores, por otra parte, utilizó una técnica llamada modelado de secuencias, se utiliza a menudo para el procesamiento del habla. Con esta técnica, alimentaron las secuencias modelo de datos de texto y audio a partir de preguntas y respuestas, de individuos deprimidos y no deprimidos, uno a uno. A medida que las secuencias se acumulaban, el modelo extrajo patrones de habla que surgieron para personas con o sin depresión. Palabras como decir, "triste, " "bajo, "o" abajo, "pueden combinarse con señales de audio que son más planas y monótonas. Las personas con depresión también pueden hablar más lento y usar pausas más largas entre las palabras. Estos identificadores de texto y audio para la angustia mental se han explorado en investigaciones anteriores. En última instancia, dependía del modelo para determinar si algún patrón era predictivo de depresión o no.

    "El modelo ve secuencias de palabras o estilo de habla, y determina que es más probable que estos patrones se vean en personas deprimidas o no deprimidas, "Dice Alhanai". Entonces, si ve las mismas secuencias en nuevos sujetos, puede predecir si también están deprimidos ".

    Esta técnica de secuencia también ayuda al modelo a ver la conversación como un todo y notar las diferencias entre la forma en que las personas con y sin depresión hablan a lo largo del tiempo.

    Detectando depresión

    Los investigadores entrenaron y probaron su modelo en un conjunto de datos de 142 interacciones del Corpus de entrevistas de análisis de angustia que contiene audio, texto, y entrevistas en video de pacientes con problemas de salud mental y agentes virtuales controlados por humanos. Cada sujeto se califica en términos de depresión en una escala de 0 a 27, utilizando el Cuestionario de salud personal. Las puntuaciones por encima de un límite entre moderado (10 a 14) y moderadamente grave (15 a 19) se consideran deprimidas, mientras que todos los demás por debajo de ese umbral se consideran no deprimidos. De todos los sujetos del conjunto de datos, 28 (20 por ciento) están etiquetados como deprimidos.

    En experimentos, el modelo se evaluó utilizando métricas de precisión y recuerdo. Mide con precisión cuáles de los sujetos deprimidos identificados por el modelo fueron diagnosticados como deprimidos. Recall mide la precisión del modelo en la detección de todos los sujetos que fueron diagnosticados como deprimidos en todo el conjunto de datos. En precisión el modelo obtuvo una puntuación del 71 por ciento y, en recuerdo, obtuvo un 83 por ciento. La puntuación combinada promedio de esas métricas, considerando cualquier error, fue del 77 por ciento. En la mayoría de las pruebas, El modelo de los investigadores superó a casi todos los demás modelos.

    Una idea clave de la investigación, Alhanai señala, es eso, durante los experimentos, the model needed much more data to predict depression from audio than text. With text, the model can accurately detect depression using an average of seven question-answer sequences. With audio, the model needed around 30 sequences. "That implies that the patterns in words people use that are predictive of depression happen in shorter time span in text than in audio, " Alhanai says. Such insights could help the MIT researchers, y otros, further refine their models.

    This work represents a "very encouraging" pilot, Glass says. But now the researchers seek to discover what specific patterns the model identifies across scores of raw data. "Right now it's a bit of a black box, " Glass says. "These systems, sin embargo, are more believable when you have an explanation of what they're picking up. … The next challenge is finding out what data it's seized upon."

    The researchers also aim to test these methods on additional data from many more subjects with other cognitive conditions, such as dementia. "It's not so much detecting depression, but it's a similar concept of evaluating, from an everyday signal in speech, if someone has cognitive impairment or not, "Dice Alhanai.

    Esta historia se vuelve a publicar por cortesía de MIT News (web.mit.edu/newsoffice/), un sitio popular que cubre noticias sobre la investigación del MIT, innovación y docencia.




    © Ciencia https://es.scienceaq.com