Cintas magnéticas, recuperado por brazos robóticos, se utilizan para almacenamiento a largo plazo. Crédito:Julian Ordan / CERN
Este año, el centro de datos del CERN rompió su propio récord, cuando recopiló más datos que nunca.
Durante octubre de 2017, el centro de datos almacenó la colosal cantidad de 12,3 petabytes de datos. Para poner esto en contexto, un petabyte equivale a la capacidad de almacenamiento de alrededor de 15, 000 teléfonos inteligentes de 64 GB. La mayoría de estos datos provienen de los experimentos del Gran Colisionador de Hadrones, por lo que este récord es un resultado directo del excelente desempeño del LHC, el resto se compone de datos de otros experimentos y copias de seguridad.
"Durante los últimos diez años, el volumen de datos almacenados en cinta en el CERN ha ido creciendo a un ritmo casi exponencial. A finales de junio ya habíamos superado un hito de almacenamiento de datos, con un total de 200 petabytes de datos archivados permanentemente en cinta, "explica German Cancio, quien lidera la cinta, sección de almacenamiento de archivos y copias de seguridad en el departamento de TI del CERN.
El centro de datos del CERN está en el corazón de la infraestructura de la Organización. Aquí se recopilan los datos de cada experimento en el CERN, se realiza la primera etapa en la reconstrucción de esos datos, y las copias de todos los datos de los experimentos se archivan en una cinta de almacenamiento a largo plazo.
La mayoría de los datos recopilados en el CERN se almacenarán para siempre. los datos físicos son tan valiosos que nunca se borrarán y deben conservarse para las generaciones futuras de físicos.
"Una característica importante del archivo de datos del CERN es su longevidad, Cancio agrega. "Incluso después de que termina un experimento, todos los datos registrados deben permanecer disponibles durante al menos 20 años, pero por lo general más. Algunos de los archivos de almacenamiento producidos por experimentos CERN anteriores se han migrado a diferentes hardware, generaciones de software y medios durante más de 30 años. Para archivos como el CERN, que no solo conservan los datos existentes, sino que también continúan creciendo, nuestra preservación de datos es particularmente desafiante ".
Si bien las cintas pueden parecer un modo de almacenamiento obsoleto, en realidad, son la tecnología más confiable y rentable para el archivo de datos a gran escala, y siempre se han utilizado en este campo. Una copia de datos en una cinta se considera mucho más confiable que la misma copia en un disco.
Actualmente, el CERN gestiona el archivo de datos científicos más grande en el dominio de Física de Altas Energías (HEP) y sigue innovando en el almacenamiento de datos. "concluye Cancio.