Un ejemplo de datos de difracción de rayos X 3D que pasan por una transición de fase al enfriarse. La gráfica magenta muestra puntos especiales asociados con la formación de ondas de densidad de carga tal como fueron revelados por el algoritmo de aprendizaje automático X-TEC. Crédito:Krishna Mallayya/Provisto
Los electrones y su comportamiento plantean preguntas fascinantes para los físicos cuánticos, y las innovaciones recientes en fuentes, instrumentos e instalaciones permiten a los investigadores acceder potencialmente a una mayor cantidad de información codificada en materiales cuánticos.
Sin embargo, estas innovaciones de investigación están produciendo volúmenes de datos sin precedentes y, hasta ahora, indescifrables.
"El contenido de información en una pieza de material puede superar rápidamente el contenido de información total en la Biblioteca del Congreso, que es de unos 20 terabytes", dijo Eun-Ah Kim, profesora de física en la Facultad de Artes y Ciencias, que se encuentra en la vanguardia tanto de la investigación de materiales cuánticos como del aprovechamiento del poder del aprendizaje automático para analizar datos de experimentos con materiales cuánticos.
"La capacidad limitada del modo de análisis tradicional, en gran parte manual, se está convirtiendo rápidamente en un cuello de botella crítico", dijo Kim.
Un grupo dirigido por Kim ha utilizado con éxito una técnica de aprendizaje automático desarrollada con científicos informáticos de Cornell para analizar cantidades masivas de datos del metal cuántico Cd2 Re2 O7 , resolviendo un debate sobre este material en particular y sentando las bases para el futuro conocimiento asistido por aprendizaje automático en nuevas fases del material.
El documento, "Aprovechamiento del aprendizaje automático interpretable y no supervisado para abordar los grandes datos de la difracción de rayos X moderna", publicado el 9 de junio en Proceedings of the National Academy of Sciences .
Físicos e informáticos de Cornell colaboraron para crear un algoritmo de aprendizaje automático no supervisado e interpretable, XRD Temperature Clustering (X-TEC). Luego, los investigadores aplicaron X-TEC para investigar los elementos clave del metal de óxido de pirocloro, Cd2. Re2 O7 .
X-TEC analizó ocho terabytes de datos de rayos X, que abarcan 15 000 zonas de Brillouin (celdas definidas de forma única), en minutos.
"Usamos algoritmos de aprendizaje automático no supervisados, que encajan perfectamente para traducir datos de alta dimensión en grupos que tienen sentido para los humanos", dijo Kilian Weinberger, profesor de informática en Cornell Ann. Facultad de Informática y Ciencias de la Información de S Bowers.
Gracias a este análisis, los investigadores descubrieron importantes conocimientos sobre el comportamiento de los electrones en el material, detectando lo que se conoce como el modo pseudo-Goldstone. Intentaban comprender cómo los átomos y los electrones se posicionan de manera ordenada para optimizar la interacción dentro de la "comunidad" astronómicamente grande de electrones y átomos.
"En materiales cristalinos complejos, una estructura específica de múltiples átomos, la celda unitaria, se repite en un arreglo regular como en un complejo de apartamentos de gran altura", dijo Kim. "El reposicionamiento que descubrimos ocurre a escala de cada unidad de apartamento, en todo el complejo".
Debido a que la disposición de las unidades sigue siendo la misma, dijo, es difícil detectar este reposicionamiento observando desde el exterior. Sin embargo, el reposicionamiento rompe casi espontáneamente una simetría continua, lo que resulta en un modo pseudo-Goldstone.
"La existencia del modo pseudo-Goldstone puede revelar las simetrías secretas en el sistema que pueden ser difíciles de ver de otra manera", dijo Kim. "Nuestro descubrimiento fue habilitado por X-TEC".
Este descubrimiento es significativo por tres razones, dijo Kim. Primero, muestra que el aprendizaje automático se puede utilizar para analizar datos voluminosos de difracción de rayos X en polvo (XRD), sirviendo como prototipo para aplicaciones de X-TEC a medida que se amplía. X-TEC, disponible para los investigadores como un paquete de software, se integrará en el sincrotrón como herramienta de análisis en la Fuente de fotones avanzada y en la Fuente de sincrotrón de alta energía de Cornell.
En segundo lugar, el descubrimiento resuelve un debate sobre la física del Cd2 Re2 O7 .
"Hasta donde sabemos, esta es la primera instancia de detección de un modo Goldstone usando XRD", dijo Kim. "Esta visión a escala atómica de las fluctuaciones en un material cuántico complejo será solo el primer ejemplo de respuesta a preguntas científicas clave que acompañan a cualquier descubrimiento de nuevas fases de la materia... utilizando datos de difracción voluminosos ricos en información".
En tercer lugar, el descubrimiento muestra lo que puede lograr la colaboración entre físicos e informáticos.
"El funcionamiento matemático interno de los algoritmos de aprendizaje automático a menudo no es diferente a los modelos en física, pero se aplica a datos de alta dimensión", dijo Weinberger. "Trabajar con físicos es muy divertido, porque son muy buenos modelando el mundo natural. Cuando se trata de modelado de datos, realmente se ponen manos a la obra". La teoría sugiere que las computadoras cuánticas deberían ser exponencialmente más rápidas en algunas tareas de aprendizaje que las máquinas clásicas