Comparación de las funciones espectrales iniciales A (ω) (líneas continuas) con la predicción Aˆ (ω) calculada utilizando el enfoque MaxEnt (líneas discontinuas de puntos naranjas) y el modelo ANN propuesto (líneas discontinuas azules) a diferentes niveles de ruido η para tres ejemplos de funciones de densidad espectral que no están presentes en el conjunto de datos de entrenamiento. El comportamiento de ANN es tan bueno como el de MaxEnt con un nivel de ruido bajo, pero el comportamiento es mucho mejor que el de MaxEnt con un nivel de ruido alto. Crédito:EPFL
Simulaciones numéricas, generalmente basado en ecuaciones que describen un modelo dado y en datos iniciales, se están aplicando en una gama cada vez mayor de disciplinas científicas para aproximar procesos en puntos determinados en el tiempo y el espacio. Con los llamados problemas inversos, faltan estos datos críticos; los investigadores deben reconstruir aproximaciones de los datos de entrada o del modelo subyacente a los datos observables para generar las predicciones deseadas.
Si bien ya existen técnicas para hacerlo, están mal definidos, incapaz de asignar interpretaciones o valores únicos a un punto dado. Como ejemplo, en el método más comúnmente utilizado para resolver tales problemas, el llamado enfoque de máxima entropía (MaxEnt), El conocimiento previo se agrega especificando una distribución predeterminada que corresponde a los resultados esperados en ausencia de datos. El algoritmo busca iterativamente una distribución que maximice la entropía con respecto a esta distribución predeterminada mientras que también genera una función cercana a los datos existentes. El enfoque incluye un parámetro utilizado para sopesar la importancia relativa entre la entropía y los términos de error. Existen varios métodos para solucionarlo que a menudo producen resultados diferentes cuando se aplican en la práctica.
En el artículo Enfoque de red neuronal artificial para el problema de continuación analítica, QuanSheng Wu, un científico y Romain Fournier, estudiante de maestría en el C3MP de EPFL, dirigido por el profesor Oleg Yazyev, y su colega, el profesor Lei Wang, del instituto de física de la Academia de Ciencias de China, presentan un enfoque de aprendizaje supervisado del problema. Basado en una red neuronal artificial (ANN), altamente versátil gracias a la capacidad de aproximar funciones continuas bajo suposiciones leves y debido a bibliotecas poderosas que permiten la implementación eficiente de diferentes arquitecturas ANN que se pueden adaptar para aprovechar las estructuras de datos. El método parece ser tan preciso como MaxEnt y considerablemente más económico computacionalmente.
En una primera prueba del marco ANN, los investigadores optaron por examinar un sistema que tiene una solución analítica, pero es difícil de resolver con MaxEnt, es decir, la función de correlación de tiempo del operador de posición para un oscilador armónico acoplado linealmente a un entorno ideal. El hamiltoniano, u operador generalmente correspondiente a la energía total del sistema, se conoce en este caso, y los datos de interés, la función de correlación de tiempo imaginario, se pueden generar mediante simulaciones cuánticas de Monte Carlo (QMC).
La solución analítica proporciona la relación del espectro de potencia con una función de correlación de tiempo imaginario y, como tal, proporcionó datos de entrenamiento físicamente relevantes para el modelo ANN. Los investigadores entrenaron a la ANN con los datos generados y luego la probaron obteniendo la función de correlación de tiempo imaginario calculada en el paso anterior por QMC. El modelo entrenado en todo el conjunto de datos mostró una concordancia casi perfecta con la solución analítica. MaxEnt no pudo dar resultados precisos, aunque los investigadores señalaron que probablemente se habrían obtenido mejores resultados calculando la función de correlación en un mayor número de puntos.
Para probar más el modelo de una manera práctica, los investigadores buscaron recuperar la densidad espectral de una sola partícula de electrones en el dominio de la frecuencia real a partir de la función de Green en el dominio del tiempo imaginario. Si bien los modelos ANN y MaxEnt pudieron predecir con precisión las funciones espectrales iniciales para el nivel más bajo de ruido, MaxEnt tendía a suprimir los picos en la función espectral predicha con el aumento de ruido en el sistema. Estos resultados muestran que el modelo ANN es versátil y robusto frente a datos ruidosos.
El nuevo método también es computacionalmente más eficiente. ANN permitió el mapeo directo entre las funciones de Green y las densidades espectrales y, en ese sentido, puede resolver el problema directamente. MaxEnt, por otro lado, es iterativo y genera funciones de prueba hasta que se alcanza la convergencia. Con la configuración computacional utilizada en el artículo, el tiempo necesario para convertir un número determinado de pares a un nivel de ruido determinado fue de 5 segundos en el caso de ANN en comparación con los 51 minutos que habría necesitado MaxEnt con la misma configuración.
Los investigadores dijeron que es probable que tales RNA puedan resolver otros problemas inversos, siempre que los conjuntos de datos relevantes, derivados, por ejemplo, utilizando los resultados experimentales disponibles combinados con técnicas de aumento de datos. Los modelos entrenados resultantes del trabajo se pueden obtener de un repositorio público en GitHub aquí:github.com/rmnfournier/ACANN.