• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Física
    El aprendizaje automático cambia cualitativamente la búsqueda de nuevas partículas

    Figura 1:Diagrama que ilustra la construcción de muestras mixtas para entrenar a un clasificador CWoLa débilmente supervisado en el bump hunt. En la búsqueda de ATLAS, la característica resonante (mres) es la masa dijet y las otras características (y) son las masas de los dos chorros. Crédito:Colaboración ATLAS / CERN

    La Colaboración ATLAS en el CERN está explorando formas novedosas de buscar nuevos fenómenos. Junto con un extenso programa de investigación, a menudo inspirado por modelos teóricos específicos, que van desde los agujeros negros cuánticos hasta la supersimetría, los físicos están aplicando nuevos métodos independientes del modelo para ampliar sus búsquedas. ATLAS acaba de lanzar la primera búsqueda independiente del modelo de nuevas partículas utilizando una técnica novedosa llamada "supervisión débil".

    Las búsquedas de nuevas partículas suelen comenzar con un modelo teórico específico. Dada la fenomenología y los parámetros del modelo, Los físicos simularán cómo se producirían y descompondrían nuevas partículas en el detector ATLAS. Luego, simulan los procesos de fondo del modelo estándar para desarrollar clasificadores (con o sin aprendizaje automático) que separan las señales del fondo. Estos clasificadores determinan la mejor región de espacio de fase de los datos a estudiar, donde se espera enriquecer una señal hipotética. Finalmente, los físicos compararán los datos y la predicción de fondo en busca de anomalías.

    La nueva búsqueda de ATLAS utiliza clasificadores de aprendizaje automático (redes neuronales) desarrollados directamente sobre datos para reducir su dependencia de un modelo específico. Esta es una desviación significativa de los métodos estándar porque los datos no están etiquetados:no se sabe si un evento particular de colisión protón-protón es de fondo o señal. Este método, conocido como "supervisión débil", explota estructuras en los datos sin necesidad de etiquetas por evento.

    Junto con este método, la nueva búsqueda ATLAS utiliza una de las estrategias de detección de anomalías independientes de la simulación más tradicionales:la "búsqueda de golpes". El objetivo de una búsqueda de protuberancias es buscar una "protuberancia" localizada sobre un fondo uniforme. Tales protuberancias son una característica genérica de muchos modelos de partículas nuevas, donde el golpe ocurre en la masa de la nueva partícula. La nueva búsqueda se basa en esta sólida base para mejorar la sensibilidad a una amplia variedad de partículas hipotéticas sin especificar sus propiedades con anticipación.

    La combinación de bump hunt y supervisión débil da como resultado un análisis que está mayormente libre de dependencia del modelo de señal y del modelo de fondo.

    Figura 2:La salida de la red neuronal en un contenedor de masa dijet. Como función bidimensional, la salida se puede visualizar fácilmente como una imagen, donde la intensidad corresponde a la eficiencia de la salida de la red en el contenedor de masa dijet. El gráfico de la izquierda no tiene señal inyectada y el gráfico de la derecha muestra la salida cuando se agrega a los datos una partícula hipotética a 3 TeV que se descompone en otras dos partículas a 200 GeV. Crédito:Colaboración ATLAS / CERN

    Detectar anomalías con supervisión débil

    Los físicos de ATLAS entrenaron redes neuronales en datos utilizando una técnica llamada "Clasificación sin etiquetas" (CWoLa, pronunciado "Koala"). En este enfoque, Los físicos construyen dos conjuntos de datos mixtos compuestos de fondo y potencialmente también de señal. Estos son idénticos excepto por las proporciones relativas de la señal potencial. Si bien se desconocen las etiquetas de señal frente a fondo para cada evento, las redes neuronales se pueden entrenar para diferenciar entre los dos conjuntos de datos. Con suficientes datos y un clasificador lo suficientemente potente, esto es realmente óptimo para distinguir la señal del fondo.

    El método CWoLa se combina con un bump hunt al crear los conjuntos de datos mixtos anteriores, como se muestra en la Figura 1. Los eventos de señal se caracterizarían por una región de resonancia localizada y una región de banda lateral. Estas regiones tendrían otras características (y) que también se pueden usar para entrenar las redes neuronales. Si no hay señal, una red neuronal no aprendería nada y si hay una señal, puede que aprenda a distinguirlo del fondo.

    La nueva búsqueda ATLAS es la primera aplicación de detección de anomalías mejorada por aprendizaje automático totalmente basada en datos. La búsqueda examinó eventos con estados finales hadrónicos, utilizando la masa invariante de pares de "chorros" de partículas como característica resonante y las masas de los chorros individuales como características para entrenar el clasificador CWoLa. Usando este conjunto restringido de funciones, Los físicos han establecido con éxito el procedimiento y han descubierto que ya es sensible a una amplia gama de nuevas partículas.

    Los físicos pudieron entrenar las redes neuronales mientras evitaban un factor de ensayos estadísticos que reduciría la sensibilidad de la búsqueda del entrenamiento y las pruebas con los mismos datos. La red neuronal (Figura 2) se asigna a una eficiencia. Por ejemplo, 10% significa que el 90% de los eventos tienen una salida de red inferior a este valor. En ausencia de la señal, la red no debería aprender nada (ya que los dos conjuntos de datos mixtos deberían ser iguales), pero debe haber una región de baja eficiencia por diseño. El gráfico de la derecha de la Figura 2 muestra que la red es capaz de identificar la señal inyectada, ¡aunque no se le dijo dónde buscar de antemano!

    Figura 3:Se simulan señales particulares y luego se agregan a los datos para establecer límites. Los modelos elegidos aquí representan una partícula pesada A (con una masa de 3 TeV) que se descompone en otras dos nuevas partículas B y C con masas escritas en el eje horizontal. El eje vertical es el límite; los números más bajos indican límites más fuertes. La nueva búsqueda se compara con dos resultados existentes de ATLAS:la búsqueda de dijet inclusiva (triángulos rojos) y una búsqueda dedicada de chorros producidos a partir de los bosones W y Z (cruz gris). Crédito:Colaboración ATLAS / CERN

    Aportando nueva precisión

    La nueva búsqueda no resultó en evidencia significativa de nuevas partículas y cuantificar lo que no se encontró fue su propio desafío. Generalmente, Los físicos pueden simplemente preguntar cuánta señal debería agregarse para registrar un exceso significativo, y luego esa cantidad de señal se declara excluida ya que no se observó exceso. El logro de exclusiones similares para este análisis requirió que todas las redes neuronales fueran reentrenadas para cada tipo de señal modelada y cantidad de señal.

    Los límites resultantes se presentan en la Figura 3. La producción de esta gráfica requirió entrenamiento alrededor de 20, 000 redes neuronales! Algunas señales eran más difíciles de encontrar para las redes neuronales que otras, con aquellos en regiones con muchos antecedentes resultando particularmente desafiantes. Para otras señales, los nuevos límites son más fuertes que los límites anteriores y mejoran las búsquedas anteriores en un espacio de fase similar.

    Mirando hacia el futuro

    Este nuevo enfoque adoptado por ATLAS tiene muchas posibilidades de ampliación. La búsqueda de golpes débilmente supervisada podría aplicarse a topologías de eventos adicionales y podrían agregarse más funciones para ampliar la sensibilidad a nuevas partículas. Es posible que se necesiten redes neuronales más complejas para acomodar espacios de características de mayor dimensión y esto requerirá recursos computacionales exigentes. Los físicos de ATLAS también están considerando una variedad de técnicas alternativas de detección de anomalías, que puede complementar la búsqueda basada en CWoLa. Es probable que ningún método cubra todo; se necesitarán múltiples enfoques para garantizar robusto, y fuerte sensibilidad a nuevas partículas.


    © Ciencia https://es.scienceaq.com