El aprendizaje automático proporciona un mapa codificado por colores de los datos de rayos X en función de la dependencia de la temperatura de cada región. X-TEC identificó las ubicaciones de dos conjuntos de picos nítidos (cuadrados amarillos y verdes) en los datos, así como halos de dispersión difusa a su alrededor (rojo y azul). Crédito:Laboratorio Nacional de Argonne
La codificación por colores hace que los mapas aéreos sean mucho más fáciles de entender. A través del color podemos saber de un vistazo dónde hay una carretera, un bosque, un desierto, una ciudad, un río o un lago.
En colaboración con varias universidades, el Laboratorio Nacional Argonne del Departamento de Energía de EE. UU. (DOE) ha ideado un método para crear gráficos codificados por colores de grandes volúmenes de datos del análisis de rayos X. Esta nueva herramienta utiliza la clasificación de datos computacionales para encontrar grupos relacionados con propiedades físicas, como una distorsión atómica en una estructura cristalina. Debería acelerar en gran medida la investigación futura sobre los cambios estructurales a escala atómica inducidos por la temperatura variable.
El equipo de investigación publicó sus hallazgos en Proceedings of the National Academy of Sciences en un artículo titulado "Aprovechamiento del aprendizaje automático interpretable y no supervisado para abordar los grandes datos de la difracción de rayos X moderna".
"Nuestro método utiliza el aprendizaje automático para analizar rápidamente inmensas cantidades de datos de difracción de rayos X", dijo Raymond Osborn, físico senior de la división de Ciencias de los Materiales de Argonne. "Lo que podría habernos llevado meses en el pasado ahora toma alrededor de un cuarto de hora, con resultados mucho más detallados".
Durante más de un siglo, la difracción de rayos X (o XRD) ha sido uno de los métodos científicos más fructíferos para analizar materiales. Ha proporcionado información clave sobre la estructura atómica 3D de innumerables materiales tecnológicamente importantes.
En las últimas décadas, la cantidad de datos que se producen en los experimentos XRD ha aumentado drásticamente en grandes instalaciones como Advanced Photon Source (APS), una instalación para usuarios de la Oficina de Ciencias del DOE en Argonne. Sin embargo, faltan con urgencia métodos de análisis que puedan hacer frente a estos inmensos conjuntos de datos.
El equipo llama a su nuevo método Agrupamiento de temperatura de rayos X, o XTEC para abreviar. Acelera los descubrimientos de materiales a través de la agrupación rápida y la codificación por colores de grandes conjuntos de datos de rayos X para revelar cambios estructurales previamente ocultos que ocurren a medida que aumenta o disminuye la temperatura. Un gran conjunto de datos típico sería de 10 000 gigabytes, equivalente a aproximadamente 3 millones de canciones de música en streaming.
XTEC se basa en el poder del aprendizaje automático no supervisado, utilizando métodos desarrollados para este proyecto en la Universidad de Cornell. Este aprendizaje automático no depende del entrenamiento inicial y del aprendizaje con datos ya bien estudiados. En cambio, aprende encontrando patrones y grupos en grandes conjuntos de datos sin tal entrenamiento. Estos patrones se representan luego mediante un código de colores.
"Por ejemplo, XTEC podría asignar rojo al grupo de datos uno, que está asociado con una determinada propiedad que cambia con la temperatura de una manera particular", dijo Osborn. "Entonces, el grupo dos sería azul y estaría asociado con otra propiedad con una dependencia de temperatura diferente, y así sucesivamente. Los colores indican si cada grupo representa el equivalente de una carretera, un bosque o un lago en un mapa aéreo".
Como caso de prueba, XTEC analizó datos de la línea de luz 6-ID-D en el APS, tomados de dos materiales cristalinos que son superconductores a temperaturas cercanas al cero absoluto. A esta temperatura ultrabaja, estos materiales pasan a un estado superconductor, sin ofrecer resistencia a la corriente eléctrica. Más importante para este estudio, otras características inusuales surgen a temperaturas más altas relacionadas con cambios en la estructura del material.
Al aplicar XTEC, el equipo extrajo una cantidad de información sin precedentes sobre los cambios en la estructura atómica a diferentes temperaturas. Estos incluyen no solo distorsiones en la disposición ordenada de los átomos en el material, sino también fluctuaciones que ocurren cuando ocurren tales cambios.
"Gracias al aprendizaje automático, podemos ver el comportamiento de los materiales que no son visibles por XRD convencional", dijo Osborn. "Y nuestro método es aplicable a muchos problemas de big data no solo en superconductores, sino también en baterías, células solares y cualquier dispositivo sensible a la temperatura".
El APS está experimentando una actualización masiva que aumentará el brillo de sus haces de rayos X hasta 500 veces. Junto con la actualización vendrá un aumento significativo en los datos recopilados en el APS, y las técnicas de aprendizaje automático serán esenciales para analizar esos datos de manera oportuna. Aprovechar el aprendizaje automático para analizar material cuántico