• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Física
    Tecnología de estado sólido para big data en física de partículas

    Cuando los científicos necesitan acceder a los archivos almacenados para realizar análisis, un largo brazo robótico desciende del techo, selecciona una cinta, y transfiere los datos que almacena a un disco duro. Crédito:Reidar Hahn, Fermilab

    En el Gran Colisionador de Hadrones del CERN, Se producen hasta 40 millones de colisiones de partículas en el lapso de un solo segundo dentro de los más de 80 millones de canales de detección del detector de partículas CMS. Estas colisiones crean una enorme huella digital, incluso después de que las computadoras lo reduzcan a los datos más significativos. El simple hecho de recuperar información puede significar luchar contra cuellos de botella.

    Físicos de CMS en el Laboratorio del Acelerador Nacional Fermi del Departamento de Energía de EE. UU., que almacena una gran parte de los datos del LHC, ahora están experimentando con el uso de NVMe, o memoria no volátil express, tecnología de estado sólido para determinar la mejor manera de acceder a los archivos almacenados cuando los científicos necesitan recuperarlos para su análisis.

    El problema con los terabytes

    Los resultados del experimento CMS en el CERN tienen el potencial de ayudar a responder algunas de las preguntas abiertas más importantes de la física. como por qué hay más materia que antimateria en el universo y si hay más de tres dimensiones físicas.

    Antes de que los científicos puedan responder a tales preguntas, sin embargo, necesitan acceder a los datos de colisión registrados por el detector CMS, gran parte del cual se construyó en Fermilab. El acceso a los datos no es una tarea trivial. Sin poda de datos en línea, el LHC generaría 40 terabytes de datos por segundo, suficiente para llenar los discos duros de 80 computadoras portátiles normales. Un proceso de selección automatizado mantiene solo lo importante, colisiones interesantes, recortar el número de eventos guardados de 40 millones por segundo a solo 1, 000.

    "Nos preocupamos solo por una fracción de esas colisiones, por lo que tenemos una secuencia de criterios de selección que deciden cuáles conservar y cuáles desechar en tiempo real, "dijo el científico del Fermilab Bo Jayatilaka, quien lidera el proyecto NVMe.

    Todavía, incluso con poda selectiva, Decenas de miles de terabytes de datos del detector CMS solo deben almacenarse cada año. No solo eso, pero para asegurarse de que ninguna información se pierda o destruya, deben guardarse dos copias de cada archivo. Una copia se almacena en su totalidad en el CERN, mientras que la otra copia se divide entre instituciones asociadas de todo el mundo. Fermilab es la principal instalación de almacenamiento designada en los EE. UU. Para el experimento CMS, con aproximadamente el 40% de los archivos de datos del experimento almacenados en cinta.

    Una solución de estado sólido

    El Centro de Computación Feynman en Fermilab alberga tres grandes bibliotecas de datos llenas de filas y filas de cintas magnéticas que almacenan datos de los propios experimentos de Fermilab. así como de CMS. Si tuviera que combinar toda la capacidad de almacenamiento en cinta de Fermilab, tendría aproximadamente la capacidad de almacenar el equivalente a 13, 000 años de imágenes de TV HD.

    "Tenemos racks llenos de servidores que tienen discos duros, y son el medio de almacenamiento principal al que los científicos leen y escriben datos desde y hacia, "Dijo Jayatilaka.

    Pero los discos duros, que se han utilizado como dispositivos de almacenamiento en computadoras durante los últimos 60 años, tienen una cantidad limitada de datos que pueden cargar en las aplicaciones en un tiempo determinado. Esto se debe a que cargan datos recuperándolos de discos giratorios, que es el único punto de acceso a esa información. Los científicos están investigando formas de implementar nuevos tipos de tecnología para ayudar a acelerar el proceso.

    Con ese fin, Fermilab instaló recientemente un solo rack de servidores lleno de unidades NVMe de estado sólido en su Centro de Computación Feynman para acelerar los análisis de física de partículas.

    En un intento por acelerar los análisis en la investigación de la física de altas energías, Fermilab instaló recientemente un solo bastidor de servidores lleno de unidades de estado sólido llamado NVMe. Crédito:Bo Jayatilaka, Fermilab

    Generalmente, Las unidades de estado sólido utilizan circuitos eléctricos compactos para transferir datos rápidamente. NVMe es un tipo avanzado de unidad de estado sólido que puede manejar hasta 4, 000 megabytes por segundo. Para poner eso en perspectiva, la capacidad media de los discos duros ronda los 150 megabytes por segundo, haciendo del estado sólido la opción obvia si la velocidad es su objetivo principal.

    Pero los discos duros aún no han sido relegados a la antigüedad. Lo que les falta en velocidad, compensan en capacidad de almacenamiento. En el presente, el límite de almacenamiento medio en unidades de estado sólido es de 500 gigabytes, que es la cantidad mínima de almacenamiento que normalmente se encuentra disponible en los discos duros modernos. Por lo tanto, determinar si Fermilab debe reemplazar una mayor parte de su almacenamiento de memoria de disco duro con unidades de estado sólido requerirá un análisis cuidadoso de costos y beneficios.

    Realización de un análisis

    Cuando los investigadores analizan sus datos utilizando grandes servidores informáticos o supercomputadoras, Por lo general, lo hacen recuperando secuencialmente partes de esos datos del almacenamiento, una tarea adecuada para discos duros.

    "Hasta ahora, hemos podido usar discos duros en la física de alta energía porque tendemos a manejar millones de eventos analizando cada evento uno a la vez, "Dijo Jayatilaka." Así que en un momento dado, sólo solicita unos pocos datos de cada disco duro individual ".

    Pero las técnicas más nuevas están cambiando la forma en que los científicos analizan sus datos. Aprendizaje automático, por ejemplo, se está volviendo cada vez más común en la física de partículas, especialmente para el experimento CMS, donde esta tecnología es responsable del proceso de selección automatizado que mantiene solo a la pequeña fracción de datos que los científicos están interesados ​​en estudiar.

    Pero en lugar de acceder a pequeñas porciones de datos, Los algoritmos de aprendizaje automático necesitan acceder a la misma pieza de datos repetidamente, ya sea que estén almacenados en un disco duro o en una unidad de estado sólido. Esto no sería un gran problema si solo hubiera unos pocos procesadores tratando de acceder a ese punto de datos, pero en cálculos de física de alta energía, hay miles de procesadores que compiten por acceder a ese punto de datos simultáneamente.

    Esto puede causar rápidamente cuellos de botella y velocidades lentas cuando se utilizan discos duros tradicionales. El resultado final son tiempos de computación más lentos.

    Los investigadores de Fermilab están probando actualmente la tecnología NVMe por su capacidad para reducir el número de estos cuellos de botella de datos.

    El futuro de la informática en Fermilab

    La capacidad de almacenamiento y computación de Fermilab son mucho más que una potencia para el experimento CMS. El esfuerzo de I + D en computación de CMS también está sentando las bases para el éxito del próximo programa de LHC de alta luminosidad y habilitando el internacional, Experimento de neutrinos subterráneos profundos alojados en Fermilab, ambos comenzarán a tomar datos a fines de la década de 2020.

    El trabajo de Jayatilaka y su equipo también permitirá a los físicos priorizar dónde deben ubicarse principalmente las unidades NVMe, ya sea en Fermilab o en las instalaciones de almacenamiento de otras instituciones asociadas al LHC.

    Con los nuevos servidores en la mano, el equipo está explorando cómo implementar la nueva tecnología de estado sólido en la infraestructura informática existente en Fermilab.


    © Ciencia https://es.scienceaq.com