La nube de plataforma de una tormenta se acerca al campus del estado de Iowa. Crédito:Bill Gallus
Se sabe que Bill Gallus persigue una o dos tormentas de verano. Pero no tuvo que ir tras este.
El 17 de julio 2019, una tormenta se acercó al campus de la Universidad Estatal de Iowa. Galo profesor de ciencias geológicas y atmosféricas, se dirigió al techo sobre su oficina en el Edificio Agronomía. Y no se olvidó de una cámara.
Una de sus fotos muestra una nube de plataforma que marca el borde de fuertes vientos de tormenta. La línea distintiva de la nube divide la foto en dos, bajo, agudo e imponente, no hay esponjosidad aquí. El Osborn Drive, que suele estar muy concurrido, fuera de su oficina, está casi vacío; algunas personas en la calle giran hacia el noroeste, mirando la tormenta.
"La suavidad y baja elevación de una nube de plataforma hace que sea una vista impresionante de observar, "Gallus escribió en una descripción de la foto." Se forma cuando el aire frío que se mueve rápidamente dentro de una tormenta se extiende, levantando rápidamente el aire cálido y húmedo por encima de él ".
Todos hemos visto decenas de tormentas eléctricas. Y el Servicio Meteorológico Nacional mantiene debidamente registros de cada uno y clasifica su fuerza en su base de datos de informes de tormentas. Para que una tormenta se marque como "severa, " por ejemplo, debe producir un tornado, granizo de más de 1 pulgada de diámetro o vientos de más de 58 mph.
Pero la mayoría de las tormentas eléctricas no retumban sobre instrumentos de viento. Entonces, los meteorólogos han hecho estimaciones del viento basadas en los daños causados por tormentas, como árboles caídos, techos volados o cobertizos derribados. Y la mayor parte del tiempo cuando se reportó ese tipo de daño por viento, Las tormentas eléctricas simplemente se clasificaron como severas, sin medidas reales que respalden la designación.
Ese es un problema para investigadores como Gallus, que necesitan buenos datos que les ayuden a desarrollar mejores formas de predecir casos graves. tormentas eléctricas localizadas.
Un problema de big data
Cuando Gallus escuchó a los colegas del campus del grupo de investigación de ciencia de datos teóricos y aplicados del estado de Iowa hablar sobre el aprendizaje automático, pensó que las capacidades de análisis de datos de la tecnología podrían ayudarlo a estudiar y analizar la base de datos de Storm Reports. ¿Quizás las computadoras podrían encontrar relaciones o conexiones en los informes que podrían conducir a nuevas herramientas de pronóstico?
Bien, no tan rapido, dijeron científicos de la Administración Nacional Oceánica y Atmosférica (NOAA).
La base de datos de tormentas severas existente mantenida por los Centros Nacionales de Información Ambiental no sería de mucha utilidad para Gallus u otros investigadores que buscan datos de viento. Los informes de viento no eran fiables. Los informes debían limpiarse antes de que pudieran ser útiles para estudios de vientos severos.
Así que eso es lo que van a hacer Gallus y un equipo de científicos de datos del estado de Iowa. Apoyado por un período de tres años, $ 650, 000 subvención NOAA, usarán computadoras y herramientas de aprendizaje automático para rastrear los informes e identificar la probabilidad de que cada uno realmente describa una tormenta con vientos fuertes.
No es una tarea pequeña:Gallus dijo que los científicos comenzarán con 12 años de informes de tormentas eléctricas severas. Eso es alrededor de 180, 000 de ellos.
"Y el 90 por ciento de esos 180, 000 informes contienen estimaciones de viento, "Dijo Gallus." No se basan en datos de estaciones meteorológicas. La mayoría de ellos dice árboles o ramas caídas; alguien llamó y dijo:"Mi árbol se derrumbó".
La clasificación de esos informes plantea todo tipo de desafíos para los investigadores de datos, dijo Eric Weber, colaborador del proyecto y profesor de matemáticas del estado de Iowa.
Primero, dijo que los informes están llenos de datos recopilados por personas, no con instrumentos precisos y sofisticados. Los informes también contienen natural, lengua común. Hay modismos giros de frases e incluso errores tipográficos que deben ser analizados por el software de aprendizaje automático.
Y segundo, Las tormentas eléctricas son muy complejas. Hay muchas variables:temperatura del aire ascendente, condensación, lluvia, relámpagos y más, que deben ser recolectados, cuantificado y analizado para comprender las tormentas.
Weber, que describe el aprendizaje automático como una red neuronal artificial que "establece conexiones basadas en la información que tiene disponible", dijo que el software de computadora puede manejar grandes cantidades de datos de tormenta que abrumarían a los equipos de personas.
El software de aprendizaje automático también lo hace de una manera muy no humana.
"Cuando miramos los datos, tratamos de entenderlos como seres humanos, ", Dijo Weber." Traemos nuestras percepciones y prejuicios. Una de las principales razones por las que el aprendizaje automático se utiliza con tanto éxito ahora es que no aporta nociones preconcebidas al análisis de los datos.
"Puede encontrar relaciones potenciales que los humanos no pueden debido a sus ideas preconcebidas".
Hacia una mejor previsión
A medida que las computadoras avanzan con los informes de tormentas, Gallus dijo que proporcionará actualizaciones y demostraciones en la reunión anual de NOAA, banco de pruebas de tiempo peligroso de una semana en Norman, Oklahoma. Los bancos de pruebas son durante la temporada de tornados de mayo y son una oportunidad para que los investigadores y pronosticadores utilicen las últimas ideas de predicción. herramientas y tecnologías.
Gallus espera mostrar el progreso del estudio de vientos de tormenta. Recopilará comentarios y sugerencias. Y todo eso podría eventualmente conducir a una nueva herramienta de pronóstico que predice la probabilidad de que una tormenta produzca vientos fuertes.
"La principal necesidad de NOAA en este momento es limpiar la base de datos para una mejor investigación, ", Dijo Gallus." Pero nos hemos dado cuenta de que si este proyecto va bien con el aprendizaje automático, pudimos ver cómo podría funcionar como herramienta de predicción ".