• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Física
    Tecnología de aprendizaje automático para rastrear eventos extraños entre los datos del LHC

    Una colisión CMS simulada en la que se produce una partícula de larga duración junto con otros chorros "regulares". La partícula de larga vida viaja una corta distancia antes de desintegrarse, creando partículas que parecen desplazadas desde el punto donde chocaron los rayos del LHC. Crédito:CERN

    Hoy en día, Las redes neuronales artificiales tienen un impacto en muchas áreas de nuestra vida cotidiana. Se utilizan para una amplia variedad de tareas complejas, como conducir coches, realizar reconocimiento de voz (por ejemplo, Siri Cortana, Alexa), sugiriendo artículos de compra y tendencias, o mejorar los efectos visuales en las películas (p. ej., personajes animados como Thanos de la película Guerra infinita por Marvel).

    Tradicionalmente, los algoritmos están hechos a mano para resolver tareas complejas. Esto requiere que los expertos dediquen una cantidad significativa de tiempo a identificar las estrategias óptimas para diversas situaciones. Las redes neuronales artificiales, inspiradas por neuronas interconectadas en el cerebro, pueden aprender automáticamente de los datos una solución cercana a la óptima para el objetivo dado. A menudo, el aprendizaje automatizado o la "formación" necesaria para obtener estas soluciones se "supervisa" mediante el uso de información complementaria proporcionada por un experto. Otros enfoques son "no supervisados" y pueden identificar patrones en los datos. La teoría matemática detrás de las redes neuronales artificiales ha evolucionado durante varias décadas, sin embargo, solo recientemente hemos desarrollado nuestra comprensión de cómo capacitarlos de manera eficiente. Los cálculos requeridos son muy similares a los que realizan las tarjetas gráficas de video estándar (que contienen una unidad de procesamiento de gráficos o GPU) al renderizar escenas tridimensionales en videojuegos. La capacidad de entrenar redes neuronales artificiales en un período de tiempo relativamente corto es posible gracias a la explotación de las capacidades de computación masivamente paralelas de las GPU de propósito general. La floreciente industria de los videojuegos ha impulsado el desarrollo de las GPU. Este avance, junto con el progreso significativo en la teoría del aprendizaje automático y el volumen cada vez mayor de información digitalizada, ha ayudado a marcar el comienzo de la era de la inteligencia artificial y el "aprendizaje profundo".

    En el campo de la física de altas energías, el uso de técnicas de aprendizaje automático, como redes neuronales simples o árboles de decisión, han estado en uso durante varias décadas. Más recientemente, las comunidades teóricas y experimentales están recurriendo cada vez más a las técnicas más modernas, como arquitecturas de redes neuronales "profundas", para ayudarnos a comprender la naturaleza fundamental de nuestro Universo. El modelo estándar de la física de partículas es una colección coherente de leyes físicas, expresadas en el lenguaje de las matemáticas, que gobiernan las partículas y fuerzas fundamentales, que a su vez explican la naturaleza de nuestro Universo visible. En el CERN LHC, muchos resultados científicos se centran en la búsqueda de nuevas partículas "exóticas" que no son predichas por el modelo estándar. Estas partículas hipotéticas son las manifestaciones de nuevas teorías que tienen como objetivo responder preguntas como:¿por qué el Universo está compuesto predominantemente de materia en lugar de antimateria? o cuál es la naturaleza de la materia oscura?

    • Figura 1:Esquema de la arquitectura de la red. Las secciones superiores (naranja y azul) del diagrama ilustran los componentes de la red que se utilizan para distinguir los chorros producidos en las desintegraciones de partículas de larga duración de los chorros producidos por otros medios. entrenado con datos simulados. La parte inferior (verde) del diagrama muestra los componentes que se entrenan utilizando datos de colisión reales. Crédito:CERN

    • Figura 2:una ilustración del rendimiento de la red. Las curvas coloreadas representan el rendimiento de diferentes modelos supersimétricos teóricos. El eje horizontal proporciona la eficiencia para identificar correctamente una desintegración de partículas de larga duración (es decir, la tasa de verdaderos positivos). El eje vertical muestra la tasa de falsos positivos correspondiente, que es la fracción de chorros estándar identificados erróneamente como originados por la desintegración de una partícula de vida larga. Como ejemplo, utilizamos un punto de la curva roja donde la fracción de partículas genuinas de larga duración que se identifican correctamente es 0,5 (es decir, 50%). Este método identifica erróneamente solo un chorro regular de cada mil como originario de una desintegración de partículas de larga duración. Crédito:CERN

    Recientemente, Las búsquedas de nuevas partículas que existen durante más de un momento fugaz en el tiempo antes de descomponerse en partículas ordinarias han recibido una atención especial. Estas partículas de "larga vida" pueden viajar distancias medibles (fracciones de milímetros o más) desde el punto de colisión protón-protón en cada experimento del LHC antes de descomponerse. A menudo, Las predicciones teóricas asumen que la partícula de larga duración es indetectable. En ese caso, solo las partículas de la desintegración de la partícula no descubierta dejarán rastros en los sistemas detectores, lo que lleva a la firma experimental bastante atípica de partículas que aparentemente aparecen de la nada y se desplazan desde el punto de colisión.

    Un aspecto novedoso de este estudio implica el uso de datos de eventos de colisión reales, así como eventos simulados, entrenar la red. Este enfoque se utiliza porque la simulación, aunque muy sofisticada, no reproduce de forma exhaustiva todos los detalles de los datos de colisión reales. En particular, Los chorros que surgen de la desintegración de partículas de larga duración son difíciles de simular con precisión. El efecto de aplicar esta técnica, denominada "adaptación de dominio, "es que la información proporcionada por la red neuronal está de acuerdo con un alto nivel de precisión para los datos de colisiones reales y simuladas. Este comportamiento es un rasgo crucial para los algoritmos que se utilizarán en las búsquedas de procesos raros de nueva física, ya que los algoritmos deben demostrar solidez y confiabilidad cuando se aplican a los datos.

    Figura 3:Histogramas de los valores de salida de la red neuronal para datos de colisión protón-protón reales (marcadores circulares negros) y simulados (histogramas rellenos de color) sin (panel izquierdo) y con (panel derecho) la aplicación de adaptación de dominio. Los paneles inferiores muestran las relaciones entre los números de datos reales y eventos simulados obtenidos de cada intervalo de histograma. Las relaciones están significativamente más cerca de la unidad para el panel derecho, lo que indica una mejor comprensión del rendimiento de la red neuronal para datos de colisiones reales, lo cual es crucial para reducir los resultados científicos falsos positivos (¡y falsos negativos!) en la búsqueda de nuevas partículas exóticas. Crédito:CERN

    La Colaboración CMS desplegará esta nueva herramienta como parte de su búsqueda continua de exóticos, partículas de larga duración. Este estudio es parte de un Esfuerzo coordinado en todos los experimentos del LHC para utilizar técnicas de máquinas modernas para mejorar la forma en que los detectores registran las muestras de datos grandes y el análisis de datos posterior. Por ejemplo, El uso de la adaptación de dominios puede facilitar la implementación de modelos robustos de aprendizaje automático como parte de los resultados futuros. La experiencia obtenida de este tipo de estudios aumentará el potencial físico durante la Ejecución 3, desde 2021, y más allá con el LHC de alta luminosidad.


    © Ciencia https://es.scienceaq.com