Los satélites de ciencia de la Tierra de última generación que se lanzarán en un futuro próximo generarán cantidades sin precedentes de datos sobre los signos vitales de nuestro planeta. La computación en la nube ayudará a los investigadores a aprovechar al máximo esos tesoros de información. Crédito:Observatorio de la Tierra de la NASA
A medida que los satélites recopilan cantidades cada vez mayores de datos, ingenieros e investigadores están implementando soluciones para gestionar estos enormes aumentos.
Los satélites de ciencia de la Tierra de vanguardia que se lanzarán en los próximos años brindarán vistas más detalladas de nuestro planeta que nunca. Podremos rastrear características oceánicas a pequeña escala como corrientes costeras que mueven nutrientes vitales para las redes tróficas marinas, controlar la cantidad de agua dulce que fluye a través de lagos y ríos, y detectar movimiento en la superficie de la Tierra de menos de media pulgada (un centímetro). Pero estos satélites también producirán una avalancha de datos que hará que ingenieros y científicos establezcan sistemas en la nube capaces de procesar, almacenamiento y analizar toda esa información digital.
"Hace unos cinco o seis años, se dio cuenta de que las futuras misiones terrestres iban a generar un gran volumen de datos y que los sistemas que estábamos usando se volverían inadecuados muy rápidamente, "dijo Suresh Vannan, gerente del Centro de Archivos Activos Distribuidos de Oceanografía Física con sede en el Laboratorio de Propulsión a Chorro de la NASA en el sur de California.
El centro es uno de varios bajo el programa Earth Science Data Systems de la NASA responsable del procesamiento, archivar, documentando y la distribución de datos de los satélites de observación de la Tierra y los proyectos de campo de la agencia. El programa ha estado trabajando durante varios años en una solución al desafío del volumen de información al mover sus datos y sistemas de manejo de datos de los servidores locales a la nube:software y servicios informáticos que se ejecutan en Internet en lugar de localmente en la máquina de alguien.
Parte de la carga útil de los instrumentos científicos del satélite FODA se encuentra en una sala limpia en el Laboratorio de Propulsión a Chorro de la NASA durante el montaje. Midiendo la altura del agua en el océano del planeta, lagos y ríos, los investigadores pueden rastrear el volumen y la ubicación del recurso finito en todo el mundo. Crédito:NASA / JPL-Caltech
El satélite Sentinel-6 Michael Freilich, parte de la misión Estados Unidos-Europa Sentinel-6 / Jason-CS (Continuidad del servicio), es el primer satélite de la NASA en utilizar este sistema de nubes, aunque la cantidad de datos que envía la nave espacial no es tan grande como los datos que devolverán muchos satélites futuros.
Dos de esas próximas misiones, DAFO y NISAR, juntos producirán aproximadamente 100 terabytes de datos al día. Un terabyte es aproximadamente 1, 000 gigabytes:suficiente almacenamiento digital para aproximadamente 250 películas de larga duración. EMPOLLÓN, abreviatura de agua superficial y topografía oceánica, producirá unos 20 terabytes de datos científicos al día, mientras que la misión NISAR (radar de apertura sintética de la NASA y la Organización de Investigación Espacial de la India) generará aproximadamente 80 terabytes diarios. Los datos de FODA se archivarán con el Centro de Archivo Activo Distribuido de Oceanografía Física, mientras que los datos de NISAR serán manejados por el Centro de Archivo Activo Distribuido de Alaska Satellite Facility. El archivo actual de datos de ciencia de la Tierra de la NASA es de alrededor de 40 petabyes (1 petabyte es 1, 000 terabytes), pero para 2025, un par de años después del lanzamiento de FODA y NISAR, se espera que el archivo contenga más de 245 petabytes de datos.
Tanto NISAR como SWOT utilizarán instrumentos basados en radar para recopilar información. Con el objetivo de un lanzamiento en 2023, NISAR monitoreará la superficie del planeta, recopilar datos sobre las características ambientales, incluidos los cambios en la tierra asociados con terremotos y erupciones volcánicas, cambios en las capas de hielo y los glaciares de la Tierra, y fluctuaciones en las actividades agrícolas, humedales, y el tamaño de los bosques.
Parte del satélite NISAR descansa en una cámara de vacío térmico en el Laboratorio de Propulsión a Chorro de la NASA en agosto de 2020. El satélite de la Tierra rastreará cambios sutiles en la superficie del planeta tan pequeños como 0.4 pulgadas. Crédito:NASA / JPL-Caltech
Programado para un lanzamiento en 2022, FODA controlará la altura del agua superficial del planeta, tanto de mar como de agua dulce, y ayudará a los investigadores a compilar el primer estudio del agua dulce y las corrientes oceánicas a pequeña escala del mundo. El DAFO está siendo desarrollado conjuntamente por la NASA y la agencia espacial francesa Centre National d'Etudes Spatial.
"Esta es una nueva era para las misiones de observación de la Tierra, y la enorme cantidad de datos que generarán requiere una nueva era para el manejo de datos, "dijo Kevin Murphy, director de datos científicos de la Dirección de Misiones Científicas de la NASA. "La NASA no solo está trabajando en toda la agencia para facilitar el acceso eficiente a una infraestructura de nube común, también estamos capacitando a la comunidad científica para que acceda, analizar, y utilizar esos datos ".
Descargas más rápidas
En la actualidad, Los satélites de las ciencias de la tierra envían datos a las estaciones terrestres donde los ingenieros convierten la información en bruto de unos y ceros en medidas que las personas pueden usar y comprender. El procesamiento de los datos sin procesar aumenta el tamaño del archivo, pero para misiones más antiguas que envían cantidades de información relativamente más pequeñas, esto no es un gran problema. Luego, las mediciones se envían a un archivo de datos que mantiene la información en los servidores. En general, cuando un investigador quiere utilizar un conjunto de datos, inician sesión en un sitio web, descargar los datos que quieran, y luego trabajar con él en su máquina.
Sin embargo, con misiones como FODA y NISAR, eso no será factible para la mayoría de los científicos. Si alguien quisiera descargar la información de un día de FODA en su computadora, necesitarían 20 laptops, cada uno capaz de almacenar un terabyte de datos. Si un investigador quisiera descargar datos de cuatro días de NISAR, tomaría alrededor de un año funcionar con una conexión a Internet doméstica promedio. Trabajar con datos almacenados en la nube significa que los científicos no tendrán que comprar discos duros enormes para descargar los datos o esperar meses mientras se descargan numerosos archivos grandes en su sistema. "El procesamiento y el almacenamiento de grandes volúmenes de datos en la nube permitirá una enfoque eficiente para el estudio de problemas de big data, "dijo Lee-Lueng Fu, Científico del proyecto JPL para FODA.
Las limitaciones de la infraestructura no serán una gran preocupación, cualquiera, ya que las organizaciones no tendrán que pagar para almacenar cantidades alucinantes de datos o mantener el espacio físico para todos esos discos duros. "Simplemente no tenemos el espacio de servidor físico adicional en JPL con suficiente capacidad y flexibilidad para admitir tanto NISAR como FODA, "dijo Hook Hua, un arquitecto de sistemas de datos científicos JPL para ambas misiones.
Los ingenieros de la NASA ya han aprovechado este aspecto de la computación en la nube para un producto de prueba de concepto utilizando datos de Sentinel-1. El satélite es una misión de la ESA (Agencia Espacial Europea) que también analiza los cambios en la superficie de la Tierra, aunque utiliza un tipo de instrumento de radar diferente a los que utilizará NISAR. Trabajar con datos de Sentinel-1 en la nube, Los ingenieros produjeron un mapa coloreado que muestra el cambio en la superficie de la Tierra de áreas con más vegetación a desiertos. "Se necesitó una semana de computación constante en la nube, utilizando el equivalente a miles de máquinas, "dijo Paul Rosen, Científico del proyecto JPL para NISAR. "Si intenta hacer esto fuera de la nube, habría tenido que comprar todos esos miles de máquinas ".
La computación en la nube no reemplazará todas las formas en que los investigadores trabajan con conjuntos de datos científicos, pero al menos para las ciencias de la Tierra, ciertamente está ganando terreno, dijo Alex Gardner, miembro del equipo científico de NISAR en JPL que estudia los glaciares y el aumento del nivel del mar. Él prevé que la mayoría de sus análisis se realizarán en otro lugar en el futuro cercano en lugar de en su computadora portátil o servidor personal. "Espero que en cinco a diez años, No tendré mucho disco duro en mi computadora y estaré explorando la nueva fuente de datos en la nube, " él dijo.