• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Física
    CMS libera más de un petabyte de datos abiertos

    Un evento de colisión registrado por CMS en 2012 que muestra un "candidato de Higgs", disponible en el portal CERN Open Data con la última versión de CMS Open Data. Crédito:Tom McCauley / CMS / CERN

    La Colaboración CMS en el CERN acaba de hacer públicos alrededor de la mitad de los datos recopilados en 2012 por el detector CMS en el Gran Colisionador de Hadrones. Esta versión incluye conjuntos utilizados para descubrir el bosón de Higgs, y se comparte a través del portal de datos abiertos del CERN.

    Esta es la tercera versión de CMS Open Data de alto nivel, tras la publicación de los datos de 2010 en 2014, y datos de 2012 en 2016. Este lote contiene más de 550 terabytes de datos de colisión protón-protón registrados a una energía de centro de masa de 8 TeV, así como alrededor de 510 terabytes de datos de simulación de Monte Carlo.

    Los datos del LHC son complicados y grandes. Los investigadores de CMS han registrado petabytes de datos de colisiones en el LHC y hasta ahora han publicado cientos de artículos científicos con ellos. Al publicar los datos en el dominio público, los investigadores fuera de la Colaboración CMS tienen la oportunidad de realizar investigaciones novedosas con ellos.

    "Nuestros datos son un elemento importante del rico legado científico de CMS Collaboration, "dice el portavoz de CMS, Joel Butler. "Nos gustaría asegurarnos de que no solo se conserven a largo plazo, sino que también estén disponibles para el público, para que tanto los miembros de la CMS como los investigadores externos puedan volver a examinarlos en el futuro. Esto es parte de nuestro compromiso con la apertura y la preservación de datos a largo plazo ".

    Animación que muestra un evento "Candidato a Higgs", registrado por CMS en 2012 y disponible en el portal CERN Open Data con la última versión de CMS Open Data. Crédito:Tom McCauley y Achintya Rao CMS / CERN

    Recientemente, Los dos primeros trabajos de investigación de este tipo fueron publicados por un equipo de teóricos del MIT interesados ​​en realizar una medición que los científicos de CMS no habían hecho:específicamente, querían medir subestructuras particulares en grupos de partículas conocidas como "chorros" producidos en colisiones protón-protón.

    La última versión de CMS Open Data también conlleva la fascinante posibilidad de permitir que las personas repitan el análisis que condujo al descubrimiento de Higgs mediante el estudio de los mismos datos utilizados por los científicos de CMS para anunciar la existencia de la partícula en 2012. Como prueba de concepto, La estudiante de doctorado de CMS Nur Zulaiha Jomhari analizó CMS Open Data y produjo gráficos similares a algunos de los que se muestran cuando se anunció el descubrimiento de Higgs. Este análisis es mucho menos sofisticado que el CMS oficial y no es examinado por la comunidad de expertos de CMS en general. pero demuestra el potencial de CMS Open Data.

    Izquierda:La trama oficial de CMS para el canal "Higgs a cuatro leptones", mostrado el día del anuncio del descubrimiento de Higgs. Derecha:una trama similar producida por Nur Zulaiha Jomhari et al. utilizando CMS Open Data de 2011 y 2012. Aunque las gráficas parecen similares, El análisis con CMS Open Data utiliza más datos (a 8 TeV y en general) que el CMS oficial del descubrimiento original, pero es mucho menos sofisticado y no es examinado por la comunidad de expertos de CMS en general. Crédito:CMS / CERN

    Además de los propios conjuntos de datos, El equipo de datos abiertos y preservación de datos de CMS también ha reunido una colección completa de materiales complementarios, incluyendo código de ejemplo para realizar análisis relativamente simples, así como metadatos como información sobre cómo se seleccionaron los datos y cuáles fueron las condiciones de funcionamiento del LHC durante el momento de la recopilación de datos.

    En este momento, CMS se ha comprometido a publicar hasta el 50% de los datos registrados de cada año unos años después de su recopilación, una vez que los científicos de CMS terminen la mayor parte de su análisis de estos conjuntos de datos. "Ver nuestros datos abiertos en uso fuera de CMS ha sido muy gratificante, "dice Kati Lassila-Perini, el coordinador de Preservación de Datos y Acceso Abierto de CMS. "Ha sido una gran motivación para nosotros y esperamos continuar con nuestros esfuerzos pioneros para publicar datos abiertos con calidad de investigación del LHC en los próximos años".

    © Ciencia https://es.scienceaq.com