Las nubes vienen en todas las formas y tamaños, y ahora un modelo de aprendizaje profundo puede ayudar a detectar los detalles más finos en los datos de la nube. Crédito:Adriel Kloppenburg en Unsplash
Los niños acostados de espaldas en un campo de hierba pueden escanear las nubes en busca de imágenes, tal vez un conejito esponjoso aquí y un dragón ardiente allá. A menudo, Los científicos atmosféricos hacen lo contrario:buscan imágenes de datos de las nubes como parte de su investigación para comprender los sistemas terrestres.
Etiquetar manualmente las imágenes de datos píxel a píxel requiere mucho tiempo, por lo que los investigadores se basan en técnicas de procesamiento automático, como los algoritmos de detección de nubes. Pero el resultado de los algoritmos no es tan exacto como los científicos quieren.
Recientemente, Los investigadores del Laboratorio Nacional del Noroeste del Pacífico del Departamento de Energía se unieron para averiguar si el aprendizaje profundo, un subconjunto distinto del aprendizaje automático, puede hacer un mejor trabajo en la identificación de nubes en datos LIDAR que los algoritmos actuales basados en la física. La respuesta:un claro "sí". El nuevo modelo está mucho más cerca de las respuestas a las que llegan los científicos, pero en solo una fracción del tiempo.
Lidar es un instrumento de detección remota que emite un láser pulsado y recoge la señal de retorno dispersada por las gotas de nubes o aerosoles. Esta señal de retorno proporciona información sobre la altura y la estructura vertical de las características atmosféricas, como nubes o capas de humo. Estos datos de lidars terrestres son una parte importante del pronóstico global.
La científica de la tierra Donna Flynn notó que, en algunos casos, lo que los algoritmos detectaron como nubes en las imágenes lidar no coincidía bien con lo que vio su ojo experto. Los algoritmos tienden a sobreestimar los límites de las nubes.
"El algoritmo actual identifica las nubes mediante pinceladas amplias, "dice Flynn, un co-investigador principal del proyecto. "Necesitamos determinar con mayor precisión la verdadera parte superior y la base de la nube y distinguir múltiples capas de nubes".
Actualización iniciada
Hasta hace poco, redes neuronales artificiales con capacidad de cómputo limitada, un tipo de modelo de aprendizaje profundo, a un pequeño número de capas computacionales. Ahora, con una mayor potencia informática disponible a través de clústeres de supercomputación, los investigadores pueden utilizar más cálculos, cada uno basado en el anterior, en una serie de capas. Cuantas más capas tenga una red neuronal artificial, cuanto más poderosa es la red de aprendizaje profundo.
Averiguar cuáles son esos cálculos es parte del entrenamiento del modelo. Para comenzar, los investigadores necesitan imágenes de datos LIDAR debidamente etiquetadas, o datos de "verdad fundamental", para el entrenamiento y prueba del modelo. Entonces, Flynn pasó muchas horas etiquetando imágenes a mano píxel a píxel:nube o no nube. Su ojo puede distinguir los límites de las nubes y las nubes frente a una capa de aerosol. Le tomó 40 horas, el equivalente a una semana de trabajo completa, para etiquetar aproximadamente 100 días de datos lidar recopilados en el observatorio atmosférico de las Grandes Llanuras del Sur, parte de la instalación del usuario de Medición de Radiación Atmosférica del DOE, en Oklahoma.
Dado el tiempo y la mano de obra que requiere el proceso de etiquetado manual, Erol Cromwell, científico computacional e investigador co-principal de PNNL, utilizó métodos de aprendizaje que requerían datos mínimos de verdad.
El modelo aprende a través de la auto-retroalimentación. Compara su propio rendimiento con los resultados etiquetados a mano y ajusta sus cálculos en consecuencia, explica Cromwell. Recorre estos pasos, mejorando cada vez.
Cromwell presentará los hallazgos del equipo en la Conferencia de Invierno del Instituto de Ingenieros Eléctricos y Electrónicos sobre Aplicaciones de Visión por Computadora en enero.
Objetivo alcanzado
Con el entrenamiento el modelo de aprendizaje profundo supera a los algoritmos actuales. La precisión del modelo es casi el doble y mucho más cercana a la que encontraría un experto humano, pero en una fracción del tiempo.
Los siguientes pasos son evaluar el rendimiento del modelo en los datos LIDAR recopilados en diferentes ubicaciones y en diferentes estaciones. Las pruebas iniciales con datos del observatorio ARM en Oliktok Point en Alaska son prometedoras.
"Una ventaja del modelo de aprendizaje profundo es el aprendizaje por transferencia, ", dice Cromwell." Podemos entrenar más el modelo con datos de Oliktok para que su rendimiento sea más sólido ".
"Reducir las fuentes de incertidumbre en las predicciones de modelos globales es especialmente importante para la comunidad científica atmosférica, "dice Flynn." Con su precisión mejorada, el aprendizaje profundo aumenta nuestra confianza ".
Ella agrega:"Además, ¡Nos da más tiempo para estar afuera mirando nubes reales! "