Relación entre los sistemas de prueba BBB y los atómicos de carga fraccionaria del conjunto de entrenamiento. Crédito:Michael Medvedev (Instituto Zelinsky de Química Orgánica de RAS)
En su artículo publicado en Science en diciembre de 2021, un equipo de DeepMind mostró cómo se pueden usar las redes neuronales para describir las interacciones de electrones en sistemas químicos con mayor precisión que los métodos existentes. Un equipo de investigadores de Skoltech, el Instituto Zelinsky de Química Orgánica, la Universidad HSE, Yandex y la Universidad Nacional de Kyungpook muestran en su comentario en Science que la capacidad de DeepMind AI para generalizar el comportamiento de dichos sistemas no se deriva de los resultados publicados y requiere revisión.
Saber dónde están los electrones dentro de una molécula puede ayudar mucho a explicar su estructura, sus propiedades y su reactividad. Los químicos utilizan métodos de la teoría funcional de la densidad (DFT), aproximaciones a la ecuación de Schrödinger, para crear modelos precisos y computacionalmente eficientes de moléculas y materiales. Pero hay circunstancias bien conocidas en las que fallan las herramientas DFT. Uno es predecir cómo los átomos comparten electrones; en un ejemplo famoso, los métodos DFT predicen incorrectamente que incluso cuando un átomo de cloro y uno de sodio están infinitamente separados, el átomo de cloro retiene una fracción de uno de los electrones del átomo de sodio.
Errores como ese surgen porque las ecuaciones DFT son solo aproximaciones de la realidad física. Los investigadores del proyecto de aprendizaje automático DeepMind dicen que su red neuronal elimina ese error de parte de un electrón y hace predicciones más precisas que los métodos DFT tradicionales
"En esencia, DFT es un método para resolver la ecuación de Schrödinger. Su precisión está determinada por su parte de correlación de intercambio, que, lamentablemente, se desconoce. Hasta la fecha, se propusieron más de 400 aproximaciones distintas para esta parte", dice Petr Zhyliaev. , científico investigador sénior de Skoltech.
"Una forma de construir una buena parte de correlación de intercambio es transferir información sobre ella desde métodos numéricos más 'avanzados' que la teoría funcional de la densidad, que son, sin embargo, órdenes de magnitud menos eficientes desde el punto de vista computacional. En su trabajo, DeepMind usó un sistema neuronal red como un interpolador universal para aprender la parte de intercambio-correlación del funcional. Su intento no fue el primero, pero es uno de los más ambiciosos".
DeepMind construyó un funcional de densidad basado en redes neuronales designado como DM21, entrenado en sistemas de electrones fraccionarios, como un átomo de hidrógeno con medio electrón. Para demostrar su superioridad, los autores probaron DM21 en un conjunto de dímeros estirados (llamado conjunto BBB), por ejemplo, dos átomos de hidrógeno a una gran distancia con un total de un electrón.
Como era de esperar, el funcional DM21 muestra un rendimiento excelente en el conjunto de prueba BBB, superando con creces a todos los funcionales DFT clásicos probados y DM21m, entrenado de manera idéntica a DM21 pero sin los sistemas de electrones fraccionarios en el conjunto de entrenamiento.
Aunque esto puede parecer que DM21 ha entendido la física detrás de los sistemas de electrones fraccionarios, una mirada más cercana muestra que todos los dímeros en el conjunto BBB se vuelven muy similares a los sistemas en el conjunto del tren. De hecho, en virtud de la localidad de las interacciones electrodébiles, las interacciones atómicas son fuertes solo a distancias cortas, fuera de las cuales los dos átomos se comportan esencialmente como si no estuvieran interactuando (ver la figura anterior).
"De alguna manera, las redes neuronales son como los humanos:prefieren obtener la respuesta correcta por la razón equivocada y luego al revés. Por lo tanto, no es tan difícil entrenar una red neuronal, como lo es probar que es ha aprendido las leyes físicas en lugar de memorizar las respuestas correctas. Probar una red neuronal en los sistemas que ha visto durante el entrenamiento es similar a examinar a un niño con una tarea que ha visto resolver a un maestro hace solo cinco minutos", explica Michael Medvedev, el líder de Grupo de Química Teórica del Instituto Zelinsky de Química Orgánica de la Academia Rusa de Ciencias.
Por lo tanto, el conjunto de prueba BBB no es adecuado:no prueba la comprensión de DM21 de los sistemas de electrones fraccionarios:DM21 puede salirse con la suya fácilmente memorizando. Un análisis exhaustivo de las otras cuatro evidencias del manejo de DM21 de dichos sistemas tampoco condujo a una conclusión decisiva:solo su buena precisión en el conjunto SIE4x4 puede ser confiable, aunque incluso allí una clara tendencia de crecimiento de errores con la distancia sugiere que DM21 no está completamente libre de problemas con los sistemas de electrones fraccionarios.
El uso de sistemas de electrones fraccionarios en el conjunto de entrenamiento no es la única novedad en el trabajo de DeepMind. Es probable que su idea de introducir las restricciones físicas en una red neuronal a través del conjunto de entrenamiento, así como el enfoque para imponer el sentido físico a través del entrenamiento en el potencial químico correcto, se utilice ampliamente en la construcción de funciones DFT de redes neuronales en el futuro. Simulación de materia a nanoescala con IA