• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Los cosmólogos del laboratorio de Berkeley son los principales contendientes en el desafío del aprendizaje automático

    Logotipo de los Juegos Olímpicos LHC 2020. Crédito:Gregor Kasieczka, Benjamin Nachman, David Shih

    En la búsqueda de nuevas partículas, los físicos pueden apoyarse en predicciones teóricas que sugieren algunos buenos lugares para buscar y algunas buenas formas de encontrarlos:es como que les dieran un boceto aproximado de una aguja escondida en un pajar.

    Pero las búsquedas a ciegas son mucho más complicadas, como cazar en un pajar sin saber lo que busca.

    Para encontrar lo que los científicos y los algoritmos informáticos convencionales pueden pasar por alto en el enorme volumen de datos recopilados en los experimentos de colisionadores de partículas, la comunidad de física de partículas está recurriendo al aprendizaje automático, una aplicación de inteligencia artificial que puede aprender por sí misma a mejorar sus habilidades de búsqueda mientras examina un pajar de datos.

    En un desafío de aprendizaje automático denominado Juegos Olímpicos del Gran Colisionador de Hadrones (LHC) 2020, Un equipo de cosmólogos del Laboratorio Nacional Lawrence Berkeley (Laboratorio de Berkeley) del Departamento de Energía de EE. UU. desarrolló un código que identificaba mejor una señal simulada oculta en datos simulados de colisión de partículas.

    ¿Cosmólogos? Eso es correcto.

    "Fue totalmente inesperado para nosotros desempeñarnos tan bien, "dijo George Stein, un investigador postdoctoral de Berkeley Lab y UC Berkeley que participó en el desafío con Uros Seljak, un cosmólogo del laboratorio de Berkeley, Profesor de UC Berkeley, y codirector del Centro de Física Cosmológica de Berkeley, del cual Stein es miembro.

    Diez equipos, compuesto principalmente por físicos de partículas, compitió en la competencia, que se desarrolló desde el 19 de noviembre 2019, al 12 de enero, 2020.

    Stein dirigió la adaptación de un código que otros dos estudiantes investigadores habían desarrollado bajo la dirección de Seljak. La competencia fue lanzada por los organizadores de la conferencia Machine Learning for Jets 2020 (ML4Jets2020). Los chorros son conos estrechos de partículas producidas en experimentos de colisión de partículas que los físicos de partículas pueden rastrear para medir las propiedades de sus fuentes de partículas.

    Los resultados de la competencia se anunciaron durante la conferencia, que se llevó a cabo en la Universidad de Nueva York del 15 al 17 de enero.

    Ben Nachman, un investigador postdoctoral del Berkeley Lab que forma parte de un grupo que trabaja en ATLAS, un gran detector en el LHC del CERN, actuó como uno de los organizadores del evento y el concurso. David Shih, un profesor de física y astronomía en la Universidad de Rutgers ahora en un año sabático en Berkeley Lab, y Gregor Kasieczka, profesor de la Universidad de Hamburgo en Alemania, fueron coorganizadores.

    Si bien algunas competencias informáticas permiten a los participantes enviar y probar sus códigos varias veces para evaluar si se están acercando a los resultados correctos, La competencia de los Juegos Olímpicos del LHC de 2020 les dio a los equipos solo una oportunidad para presentar una solución.

    "Lo bueno es que no usamos una herramienta estándar, ", Dijo Seljak." Usamos una herramienta que habíamos desarrollado para nuestra investigación ".

    El lo notó, "En mi grupo, habíamos estado trabajando en el aprendizaje automático sin supervisión. La idea es que desee describir datos donde los datos no tienen etiquetas".

    La herramienta que utilizó el equipo se llama transporte óptimo iterativo en rodajas. "Es una forma de aprendizaje profundo, sino una forma en la que no optimizamos todo a la vez, "Dijo Seljak." En cambio, lo hacemos de forma iterativa, " en etapas.

    El código es tan eficiente que puede ejecutarse en una simple computadora de escritorio o portátil. Fue desarrollado para un enfoque estadístico conocido como evidencia bayesiana.

    Seljak dijo:"Suponga que está observando anomalías en el tiempo de tránsito de un planeta, "el tiempo que tarda el planeta en pasar frente a un objeto más grande desde su punto de vista, como observar desde la Tierra cómo Mercurio se mueve frente al sol.

    "Una solución requiere que haya un planeta adicional, " él dijo, "y la otra solución requiere una luna adicional, y ambos se ajustan bien a los datos, pero tienen parámetros muy diferentes. ¿Cómo comparo estas dos soluciones? "

    El enfoque bayesiano consiste en calcular la evidencia para ambas soluciones y ver qué solución tiene una mayor probabilidad de ser cierta.

    "Este tipo de ejemplo surge todo el tiempo, "Seljak dijo, y el código de su equipo está diseñado para acelerar los complejos cálculos requeridos por los métodos convencionales. "Estábamos tratando de mejorar algo no relacionado con la física de partículas, y nos dimos cuenta de que esto podría usarse como una herramienta general de aprendizaje automático ".

    Él agregó, "Nuestra solución es particularmente útil para la llamada detección de anomalías:buscar señales muy pequeñas en los datos que de alguna manera son diferentes a sus otros datos".

    En la competencia de los Juegos Olímpicos del LHC de 2020, los participantes primero recibieron un conjunto de datos de muestra que llamaba a los datos de la señal de partículas de algunos datos de fondo, tanto la aguja como el pajar, que les permitía probar sus códigos.

    Luego recibieron los datos reales del concurso de la "caja negra":solo el pajar. Se les asignó la tarea de encontrar un tipo de señal de partículas diferente y completamente desconocido oculto en los datos de fondo, y para describir específicamente los eventos de señal que sus métodos revelaron.

    Los coorganizadores de la competencia, Shih y Nachman, señalaron que habían estado trabajando personalmente en un método de detección de anomalías que utiliza un enfoque muy similar (llamado "estimación de densidad condicional") a la técnica desarrollada por Seljak y Stein que se inscribió en la competencia.

    Seljak y Stein consultaron con varios físicos de partículas en el laboratorio, incluyendo a Nachman, Shih, y el estudiante graduado Patrick McCormack. Ellos discutieron, entre otros temas, cómo la comunidad de física de alta energía normalmente analiza conjuntos de datos como los que se utilizan en la competencia, pero para el desafío real de la "caja negra", Seljak y Stein estaban solos.

    A medida que la competencia se acercaba a su fin, Stein dijo:"Pensamos que habíamos encontrado algo una semana antes de la fecha límite".

    Stein y Seljak presentaron sus resultados unos días antes de la conferencia, "pero como no somos físicos de partículas, no estábamos planeando participar en la conferencia, "Dijo Seljak.

    Luego, Stein recibió un correo electrónico de los organizadores de la conferencia, quien le pidió que volara y presentara una charla sobre la solución del equipo más tarde esa semana. Los organizadores no compartieron los resultados de la competencia hasta que todos los ponentes presentaron sus resultados.

    "Mi charla fue originalmente la primera, y luego, poco antes del inicio de la sesión, me trasladaron a la última. No sabía si eso era algo bueno "Dijo Stein.

    El código que ingresó el equipo de Berkeley Lab recogió aproximadamente 1, 000 eventos, con un margen de error de más o menos 200, y la respuesta correcta fue 843 eventos. Su código fue el claro ganador en esa categoría.

    Varios equipos estuvieron cerca en la estimación del nivel de energía, o "masa de resonancia, "de la señal, y el equipo de Berkeley Lab fue el más cercano en su estimación de la masa de resonancia para una señal secundaria derivada de la señal principal.

    En la conferencia, Stein señaló, "Hubo un gran interés en el enfoque general que tomamos. Hizo olas".

    Oz Amram, otro competidor en el concurso, bromeó en una publicación de Twitter, "El resultado de las Olimpiadas del LHC ... es que los cosmólogos son mejores en nuestro trabajo que nosotros". Pero los organizadores del concurso no anunciaron formalmente al ganador.

    Najman, uno de los organizadores del evento, dijo, "Aunque George y Uros superaron claramente a los demás competidores, al final, es probable que ningún algoritmo cubra todas las posibilidades, por lo que necesitaremos un conjunto diverso de enfoques para lograr una sensibilidad amplia ".

    Él agregó, "La física de partículas ha entrado en una época interesante en la que todas las predicciones de nuevas partículas que hemos probado en el Gran Colisionador de Hadrones hasta ahora no se han realizado en la naturaleza, excepto el Modelo Estándar de física de partículas. Si bien es esencial continuar con el programa de búsquedas basadas en modelos, también tenemos que desarrollar un programa paralelo para ser independientes del modelo. Esa es la motivación de este desafío ".

    Seljak dijo que su equipo planea publicar un artículo que detalla su código de aprendizaje automático.

    "Definitivamente estamos planeando aplicar esto a muchos problemas de astrofísica, ", dijo." Buscaremos aplicaciones interesantes, cualquier cosa con fallas o transitorios, nada anómalo. Trabajaremos para acelerar el código y hacerlo más poderoso. Este tipo de enfoques realmente pueden ayudar ".


    © Ciencia https://es.scienceaq.com