Crédito:CC0 Public Domain
En la reunión de otoño de AGU, la preeminente reunión internacional de ciencias de la Tierra y el espacio, Los investigadores dieron a conocer la base de datos más grande del mundo de datos de frecuencia extremadamente baja (ELF) / muy baja frecuencia (VLF). La base de datos de acceso abierto se llama WALDO, que significa Archivo Mundial de Datos y Observaciones de Baja Frecuencia. Los investigadores podrán acceder a casi 1000 terabytes (TB) de datos para promover los esfuerzos científicos en campos como el clima espacial, teledetección ionosférica, previsión de terremotos, y prospección subterránea. Los efectos del clima espacial pueden producir cualquier cosa, desde hermosas auroras en el cielo nocturno hasta efectos destructivos en redes eléctricas y satélites, de modo que tanto los científicos como los ingenieros están motivados para comprenderlos y, en última instancia, predecirlos.
El trabajo para preservar cientos de terabytes de mediciones de ondas electromagnéticas ELF / VLF y abrirlo a los investigadores de todo el mundo es un proyecto conjunto de la Universidad de Stanford. Georgia Institute of Technology y la Universidad de Colorado Denver con el apoyo de la National Science Foundation y el Departamento de Defensa.
"Es emocionante que hayamos guardado estos datos todos estos años porque ahora es el momento en que se están volviendo más valiosos con los avances en la potencia informática, Algoritmos de Big Data e inteligencia artificial, "dijo Mark Golkowski, Doctor., profesor de Ingeniería Eléctrica, Colegio de Ingenieria, Diseño y Computación, CU Denver.
Golkowski y Morris Cohen, Doctor., El profesor asociado de la Escuela de Ingeniería Eléctrica e Informática de Georgia Tech inició el proyecto WALDO como la culminación de un legado que comenzó en Stanford después de la Segunda Guerra Mundial. El profesor Robert Helliwell fue pionero en el campo y en el uso de grandes antenas para capturar ondas de radio de baja frecuencia en lugares remotos como la Antártida y Alaska para estudiar la compleja física del espacio cercano a la Tierra. Helliwell en Stanford finalmente pasó la antorcha al profesor Umran Inan, quien se desempeñó como asesor de Golkowski y Cohen cuando eran estudiantes en su programa de investigación.
"Si hay algo que nuestro asesor nos inculcó, fue la santidad de las observaciones científicas de alta calidad y la importancia de preservarlas ", dice Golkowski." Desafortunadamente, este tipo de trabajo de archivo a menudo se deja en un segundo plano y solo más tarde la gente dice:'si tan solo tuviéramos datos de hace 10 años, sabríamos si se trataba de una anomalía o no. Perder datos es como quemar la biblioteca de Alexandria. Cuando se haya ido se fue."
Durante años, Los investigadores han transferido datos de cintas magnéticas a CD y DVD a medida que la tecnología avanzada y los métodos de almacenamiento obsoletos amenazaban los datos. La llegada del almacenamiento masivo en la nube tiene el beneficio adicional de hacer que los datos sean accesibles para los investigadores de todo el mundo.
Gracias a los esfuerzos de Golkowski y Cohen y sus estudiantes, casi 80, Se están cargando 000 DVD de datos en la nube. En el momento de la reunión, Se cargan 200 TB de datos, con otros 800 TB restantes.
Si bien la mayoría de los datos son de los últimos 20 años, algunas grabaciones se remontan a los años setenta y ochenta.
WALDO también será un repositorio vivo, capturar datos en curso que están siendo recopilados por Georgia Tech y la Universidad de Colorado en Denver. Por ejemplo, Los datos recopilados durante el Gran Eclipse Solar Estadounidense de 2017 estarán disponibles públicamente.
"Las grabaciones capturan una instantánea de la atmósfera y el entorno espacial rápidamente cambiantes de la Tierra, razón por la cual el esfuerzo por mantener los datos que ya tenemos es crucial para futuras investigaciones. "Me ha mostrado el esfuerzo necesario como civilización para no perder el pasado, "dice Cohen." Si bien no hay duda de que los datos de WALDO son un registro del pasado del planeta y pueden informar sobre su presente, Cualquiera con experiencia en el análisis de datos sabe que a menudo hay que revisar mucho ruido y observaciones mediocres para encontrar la gema que hará avanzar el conocimiento ".
"Esta fue la inspiración para el nombre 'WALDO' basado en el personaje de dibujos animados de los niños que siempre se esconde entre las masas con su característico suéter, "dice Golkowski.
Golkowski y Cohen esperan que la apertura de la base de datos inspire nuevos descubrimientos y nuevos usos para los conjuntos de datos. Sin duda, la mejora constante de la potencia computacional y los algoritmos de datos desempeñarán un papel.
"Tenemos una idea de las incógnitas conocidas. Pero quién sabe cuántas incógnitas desconocidas todavía existen. Al hacer públicos estos datos, nuestra esperanza es que otros investigadores utilicen estos conjuntos de datos de formas que aún no hemos imaginado, "dijo Cohen, que aplicó datos de WALDO y descubrió que las señales a 60 Hz y sus armónicos, el ruido molesto que proviene de las redes eléctricas, se pueden utilizar como diagnóstico para las redes eléctricas y los sistemas de ciberseguridad.
En CU Denver, Golkowski ha utilizado observaciones ELF de rayos para diagnosticar la atmósfera superior inferior, lo que eventualmente podría mejorar los sistemas de comunicación.
"¡Finalmente!", bromeó Cohen, "Tenemos una respuesta a la pregunta" ¿Dónde está WALDO? "