Datos multimodales. Para cada entrevista clínica, los investigadores utilizan:(a) video de escaneos faciales en 3D, (b) grabación de audio, visualizado como un espectrograma log-mel, y (c) transcripción de texto del habla del paciente. El modelo predice la gravedad de los síntomas depresivos utilizando las tres modalidades. Crédito:Haque et al.
Investigadores de Stanford han explorado recientemente el uso del aprendizaje automático para medir la gravedad de los síntomas depresivos mediante el análisis del lenguaje hablado y las expresiones faciales tridimensionales de las personas. Su método multimodelo, descrito en un artículo publicado previamente en arXiv, logró resultados muy prometedores, con una sensibilidad del 83,3 por ciento y una especificidad del 82,6 por ciento.
En la actualidad, más de 300 millones de personas en todo el mundo padecen trastornos depresivos en diversos grados. En casos extremos, la depresión puede llevar al suicidio, con un promedio de aproximadamente 800, 000 personas que se suicidan cada año.
Los trastornos de salud mental se diagnostican actualmente tras un examen cuidadoso por parte de una amplia gama de proveedores de atención médica. incluidos los médicos de atención primaria, psicólogos clínicos y psiquiatras. Sin embargo, detectar enfermedades mentales es a menudo mucho más desafiante que diagnosticar enfermedades físicas.
Varios factores, incluido el estigma social, costo y disponibilidad del tratamiento, podría evitar que las personas afectadas busquen ayuda. En la actualidad, Los investigadores estiman que el 60 por ciento de los afectados por enfermedades mentales no reciben tratamiento.
El desarrollo de métodos que puedan detectar automáticamente los síntomas depresivos podría mejorar la precisión y disponibilidad de las herramientas de diagnóstico. conduciendo a intervenciones más rápidas y eficientes. Un equipo de investigadores de Stanford ha investigado recientemente el uso del aprendizaje automático para medir la gravedad de los síntomas depresivos.
"En este trabajo, presentamos un método de aprendizaje automático para medir la gravedad de los síntomas depresivos, "escribieron los investigadores en su artículo." Nuestro método multimodal utiliza expresiones faciales tridimensionales y lenguaje hablado, comúnmente disponible en teléfonos móviles modernos ".
Aprendiendo una inserción de oraciones multimodal. En general, el modelo es una CNN causal. La entrada para el modelo es:audio, Exploraciones faciales en 3D, y texto. La incrustación de oraciones multimodales se alimenta a un clasificador de depresión y un modelo de regresión PHQ (no se muestra arriba). Crédito:Haque et al.
Los individuos deprimidos suelen presentar una serie de síntomas verbales y no verbales, incluyendo tono monótono, tasa de articulación reducida, volúmenes de conversación más bajos, menos gestos, y más miradas hacia abajo. Una de las pruebas más comunes para evaluar la gravedad de los síntomas de depresión es el cuestionario de salud del paciente (PHQ).
El método ideado por los investigadores analiza las pistas de audio de la voz de los pacientes, Video en 3-D de sus expresiones faciales, y transcripciones de texto de sus entrevistas clínicas. Basado en estos datos, el modelo produce una puntuación PHQ o una etiqueta de clasificación que indica un trastorno depresivo mayor.
En una evaluación inicial, el modelo logró un error promedio de 3.67 puntos (15.3 por ciento relativo), en la escala PHQ, detectar el trastorno depresivo mayor con un 83,3 por ciento de sensibilidad y un 82,6 por ciento de especificidad. Los investigadores optaron por recopilar los datos utilizados en su estudio a través de entrevistas de persona a computadora, en lugar de los de humano a humano.
"En comparación con un entrevistador humano, La investigación ha demostrado que los pacientes informan menos miedo a la revelación y muestran más intensidad emocional cuando conversan con un avatar. "escribieron los investigadores". Además, las personas experimentan beneficios psicológicos al revelar experiencias emocionales a los chatbots ".
En el futuro, este nuevo método de aprendizaje automático podría implementarse en teléfonos inteligentes en todo el mundo, Contribuir a la misión de hacer que la atención de la salud mental sea más barata y accesible. Según los investigadores, su modelo está diseñado para aumentar y complementar los métodos clínicos existentes, en lugar de emitir diagnósticos formales.
"Presentamos un método de aprendizaje automático multimodal que combina técnicas de reconocimiento de voz, visión por computador, y procesamiento del lenguaje natural, ", escribieron los investigadores. Esperamos que este trabajo inspire a otros a construir herramientas basadas en inteligencia artificial para comprender los trastornos de salud mental más allá de la depresión".
© 2018 Science X Network