Los científicos normalmente están felices de encontrar regularidades y correlaciones en sus datos, pero sólo si pueden explicarlas. De lo contrario, les preocupa que esos patrones puedan estar revelando algún defecto en los datos mismos, los llamados artefactos experimentales.
Eso es lo que preocuparon a los científicos del grupo de Nicola Marzari en el Instituto Federal Suizo de Tecnología en Lausana (EPFL) cuando notaron un patrón inesperado en dos bases de datos de estructuras electrónicas ampliamente utilizadas, la base de datos Materials Project (MP) y la Materials Cloud tridimensional. Base de datos 'fuente' de estructuras cristalinas (MC3Dsource).
Las dos colecciones incluyen más de 80.000 estructuras electrónicas de materiales experimentales y predichos y, en principio, todos los tipos de estructuras deberían estar igualmente representados. Sin embargo, los científicos notaron que alrededor del 60 por ciento de las estructuras en ambas bases de datos tienen celdas unitarias primitivas (la celda más pequeña posible en una estructura cristalina) compuestas de un múltiplo de 4 átomos. Los científicos llamaron a esta recurrencia la "Regla de los Cuatro" y comenzaron a buscar una explicación.
"Una primera razón intuitiva podría provenir del hecho de que cuando una celda unitaria convencional (una celda más grande que la primitiva, que representa la simetría completa del cristal) se transforma en una celda primitiva, el número de átomos generalmente se reduce cuatro veces. ", dice Elena Gazzarini, ex becaria de INSPIRE Potentials en el Laboratorio de Teoría y Simulación de Materiales (THEOS) de la EPFL y ahora del CERN en Ginebra.
"La primera pregunta que hicimos fue si el software utilizado para 'primitivizar' la celda unitaria lo había hecho correctamente, y la respuesta fue sí."
Desde el punto de vista químico, otro posible sospechoso era el número de coordinación del silicio (el número de átomos que pueden unirse a su átomo), que es cuatro. "Podríamos esperar encontrar que todos los materiales que siguen esta Regla de Cuatro incluyan silicio", dice Gazzarini. "Pero nuevamente, no lo hicieron".
Las energías de formación de los compuestos tampoco podían explicar la Regla de Cuatro. "Los materiales más abundantes en la naturaleza deberían ser los más favorecidos energéticamente, es decir, los más estables, aquellos con energía de formación negativa", afirma Gazzarini. "Pero lo que vimos con los métodos computacionales clásicos fue que no había correlación entre la Regla de Cuatro y las energías de formación negativas."
Debido a que el espacio de materiales cubierto por las dos bases de datos es enorme, desde pequeñas unidades hasta células muy grandes con docenas de especies químicas diferentes, todavía existía la posibilidad de que un análisis más refinado que busque una correlación entre las energías de formación y las propiedades químicas pueda proporcionar una explicación.
Así, en el equipo participó Rose Cernosky, experta en aprendizaje automático de la Universidad de Wisconsin, quien desarrolló un algoritmo para agrupar estructuras según sus propiedades atómicas y observar las energías de formación dentro de clases de materiales que comparten algunas similitudes químicas. Pero nuevamente, este método no proporcionó una manera de distinguir los materiales que cumplían con la Regla de Cuatro de los que no cumplían.
De manera similar, la abundancia de múltiplos de cuatro ni siquiera se correlaciona con estructuras altamente simétricas sino más bien con simetrías bajas y disposiciones poco empaquetadas.
Al final, el artículo resultante en npj Computational Materials Es el raro ejemplo de un artículo científico que describe un resultado negativo:los investigadores sólo pudieron describir el fenómeno y descartar varias causas posibles, sin encontrar ninguna.
Pero los resultados negativos pueden ser tan importantes como los positivos para el avance científico, porque apuntan a problemas difíciles, razón por la cual los científicos a menudo se quejan de que las revistas deberían publicar más estudios de este tipo.
El hecho de no encontrar una explicación convincente no impidió que el grupo predijera, mediante un algoritmo de Random Forest, con una precisión del 87% si un determinado compuesto seguirá la Regla de Cuatro o no. "Esto es interesante porque el algoritmo utiliza sólo descriptores de simetría locales en lugar de globales, lo que sugiere que puede haber pequeños grupos químicos en las células (aún por encontrar) que pueden explicar la Regla de Cuatro", dice Gazzarini.
Más información: Elena Gazzarrini et al, La regla de cuatro:distribuciones anómalas en las estequiometrías de compuestos inorgánicos, npj Computational Materials (2024). DOI:10.1038/s41524-024-01248-z
Proporcionado por el Centro Nacional de Competencia en Investigación (NCCR) MARVEL