Topología de la red neuronal XC. Consta de dos partes:NN-E predice εxc y NN-V predice vxc . Cada parte de la red neuronal consta de 4 capas cada una de 100 neuronas. Para ambas partes se necesita información sobre la densidad local y sus derivados. Crédito:Informes científicos (2022). DOI:10.1038/s41598-022-18083-1
Investigadores del Centro de Tecnologías de Materiales de Skoltech han entregado una demostración de prueba de concepto de un método impulsado por redes neuronales para crear una interpolación funcional de correlación de intercambio precisa, que es el componente central de la teoría funcional de la densidad. DFT, a su vez, es el principal método numérico utilizado en la física de la materia condensada y la química cuántica para calcular la reactividad de los compuestos, la estructura zonal de las moléculas, la durabilidad de los materiales y otras propiedades cruciales para la búsqueda de nuevos materiales, fármacos y más. La prometedora arquitectura de redes neuronales se presentó y analizó en Scientific Reports .
Como lo describe la ecuación multielectrónica de Schrödinger, los movimientos de los electrones en la materia determinan las propiedades de la estructura electrónica. Por ejemplo, el enlace químico, un concepto central de toda la química, es un movimiento complejo correlacionado de electrones gobernado por las leyes de la mecánica cuántica.
El problema con la ecuación multielectrónica de Schrödinger es que, si bien es relativamente fácil de establecer, no se ha encontrado una solución analítica y la solución numérica es muy compleja y desafiante. Aquí, uno de los enfoques principales es el método de campo medio (densidad), que describe la compleja interacción de los electrones en términos de un potencial efectivo.
"La teoría funcional de la densidad simplifica las cosas al usar la noción de una nube de electrones caracterizada por cierta densidad local en lugar de considerar electrones individuales", explicó el primer autor del estudio, el ingeniero de investigación de Skoltech, Alexander Ryabov.
“Sin embargo, esta teoría tiene un importante valor desconocido, llamado funcional de correlación de intercambio. Hasta hace poco, la tendencia era aproximarla analíticamente. Es decir, los coeficientes en la forma funcional se determinaban en base a varios principios físicos conocidos sin recurrir a redes neuronales. . Nuestro método es el primero en utilizar una red neuronal de dos componentes para esto. Las redes neuronales se han empleado activamente en esta tarea, pero nuestro equipo es pionero en esta área en Rusia".
Según los investigadores, lo que los diferencia de los enfoques de la competencia es que el entrenamiento ocurre en dos etapas:primero, se entrena una red y se congelan sus pesos. Luego se enseña otro.
"Anteriormente, las personas usaban una red neuronal para aproximar el funcional de correlación de intercambio, después de lo cual se tenían que tomar derivados computacionalmente intensivos para encontrar el potencial de correlación de intercambio correspondiente. Estos son derivados de un tipo que a menudo resulta difícil de calcular con una precisión decente usando una red neuronal", agregó el científico investigador sénior de Skoltech, Petr Zhilyaev, investigador principal del estudio. "En nuestro trabajo, una red neuronal de dos componentes aproxima tanto el potencial como el funcional, por lo que no se involucran derivados complicados y la carga computacional se reduce".
"Para ejecutar los experimentos informados en nuestro artículo, implementamos la red neuronal en el paquete de software Octopus para química cuántica", dijo Ryabov. "También investigamos cómo el proceso de entrenamiento se ve afectado por densidades no autoconsistentes. Después de agregar tales densidades al conjunto de datos de entrenamiento, observamos un mejor rendimiento en las moléculas para las que la red neuronal produjo previamente los peores resultados". Los científicos dudan de que la IA de DeepMind sea tan buena para los sistemas de carga fraccionaria como parece