Impresión artística de la arquitectura de aprendizaje automático que codifica explícitamente la simetría de calibre para una teoría de campo de celosía 2D. Crédito:colaboración MIT-DeepMind.
El modelo estándar de física de partículas describe todas las partículas elementales conocidas y tres de las cuatro fuerzas fundamentales que gobiernan el universo; todo excepto la gravedad. Estas tres fuerzas:electromagnéticas, fuerte, y débiles:gobiernan cómo se forman las partículas, cómo interactúan, y cómo decaen las partículas.
Estudiar la física nuclear y de partículas dentro de este marco, sin embargo, es difícil, y se basa en estudios numéricos a gran escala. Por ejemplo, muchos aspectos de la fuerza fuerte requieren simular numéricamente la dinámica en la escala de 1/10 a 1/100 del tamaño de un protón para responder preguntas fundamentales sobre las propiedades de los protones, neutrones, y núcleos.
"Por último, estamos limitados computacionalmente en el estudio de la estructura nuclear y de protones usando la teoría del campo reticular, ", dice la profesora asistente de física Phiala Shanahan." Hay muchos problemas interesantes que sabemos cómo abordar en principio, pero simplemente no tenemos suficiente computación, a pesar de que utilizamos las supercomputadoras más grandes del mundo ".
Para superar estas limitaciones, Shanahan lidera un grupo que combina la física teórica con modelos de aprendizaje automático. En su artículo "Muestreo basado en flujo equivariante para la teoría del medidor de celosía, "publicado este mes en Cartas de revisión física , muestran cómo la incorporación de las simetrías de las teorías de la física en el aprendizaje automático y las arquitecturas de inteligencia artificial puede proporcionar algoritmos mucho más rápidos para la física teórica.
"Utilizamos el aprendizaje automático para no analizar grandes cantidades de datos, pero para acelerar la teoría de los primeros principios de una manera que no comprometa el rigor del enfoque, ", Dice Shanahan." Este trabajo en particular demostró que podemos construir arquitecturas de aprendizaje automático con algunas de las simetrías del Modelo Estándar de física nuclear y de partículas incorporadas, y acelerar el problema de muestreo al que nos dirigimos en órdenes de magnitud ".
Shanahan lanzó el proyecto con el estudiante graduado del MIT Gurtej Kanwar y con Michael Albergo, que está ahora en NYU. El proyecto se expandió para incluir a los postdoctorados del Centro de Física Teórica Daniel Hackett y Denis Boyda, Profesor de NYU Kyle Cranmer, y científicos de aprendizaje automático expertos en física de Google Deep Mind, Sébastien Racanière y Danilo Jimenez Rezende.
El artículo de este mes es uno de una serie cuyo objetivo es facilitar estudios en física teórica que actualmente son intratables desde el punto de vista computacional. "Nuestro objetivo es desarrollar nuevos algoritmos para un componente clave de los cálculos numéricos en física teórica, ", dice Kanwar." Estos cálculos nos informan sobre el funcionamiento interno del Modelo Estándar de física de partículas, nuestra teoría más fundamental de la materia. Tales cálculos son de vital importancia para compararlos con los resultados de los experimentos de física de partículas, como el Gran Colisionador de Hadrones del CERN, tanto para restringir el modelo con mayor precisión como para descubrir dónde se rompe el modelo y debe extenderse a algo aún más fundamental ".
El único método conocido sistemáticamente controlable de estudiar el Modelo Estándar de física de partículas en el régimen no perturbativo se basa en una muestra de instantáneas de fluctuaciones cuánticas en el vacío. Midiendo las propiedades de estas fluctuaciones, una vez se pueden inferir las propiedades de las partículas y las colisiones de interés.
Esta técnica viene con desafíos, Kanwar explica. "Este muestreo es caro, y buscamos utilizar técnicas de aprendizaje automático inspiradas en la física para extraer muestras de manera mucho más eficiente, ", dice." El aprendizaje automático ya ha avanzado mucho en la generación de imágenes, incluso, por ejemplo, trabajo reciente de NVIDIA para generar imágenes de rostros 'soñados' por redes neuronales. Pensando en estas instantáneas del vacío como imágenes, creemos que es bastante natural recurrir a métodos similares para nuestro problema ".
Agrega Shanahan, "En nuestro enfoque para muestrear estas instantáneas cuánticas, optimizamos un modelo que nos lleva de un espacio que es fácil de muestrear al espacio de destino:dado un modelo entrenado, el muestreo es entonces eficiente, ya que solo necesita tomar muestras independientes en el espacio de fácil muestreo, y transformarlos a través del modelo aprendido ".
En particular, el grupo ha introducido un marco para la construcción de modelos de aprendizaje automático que respetan exactamente una clase de simetrías, llamado "simetrías de calibre, "crucial para el estudio de la física de altas energías.
Como prueba de principio, Shanahan y sus colegas utilizaron su marco para entrenar modelos de aprendizaje automático para simular una teoría en dos dimensiones, dando como resultado ganancias de eficiencia de órdenes de magnitud sobre las técnicas más modernas y predicciones más precisas de la teoría. Esto allana el camino para una investigación significativamente acelerada sobre las fuerzas fundamentales de la naturaleza utilizando el aprendizaje automático basado en la física.
Los primeros artículos del grupo como una colaboración discutieron la aplicación de la técnica de aprendizaje automático a una teoría de campo de celosía simple, y desarrolló esta clase de enfoques en compacto, variedades conectadas que describen las teorías de campo más complicadas del Modelo Estándar. Ahora están trabajando para escalar las técnicas a cálculos de última generación.
"Creo que hemos demostrado durante el año pasado que es muy prometedor combinar el conocimiento de la física con las técnicas de aprendizaje automático, ", dice Kanwar." Estamos pensando activamente en cómo abordar las barreras restantes en la forma de realizar simulaciones a gran escala utilizando nuestro enfoque. Espero ver la primera aplicación de estos métodos a los cálculos a escala en los próximos años. Si somos capaces de superar los últimos obstáculos, esto promete ampliar lo que podemos hacer con recursos limitados, y sueño con realizar pronto cálculos que nos den nuevas ideas sobre lo que se encuentra más allá de nuestra mejor comprensión de la física actual ".
El equipo también conoce esta idea de aprendizaje automático basado en la física como "IA ab-initio, "un tema clave del Instituto Nacional de la Fundación Científica de Inteligencia Artificial e Interacciones Fundamentales (IAIFI), recientemente lanzado en el MIT, donde Shanahan es coordinador de investigación para la teoría de la física.