Crédito:CC0 Public Domain
"La predicción es muy difícil, especialmente si se trata del futuro, "Dijo una vez el premio Nobel Niels Bohr.
La investigadora de Argonne, Julie Bessac, y su colega francés Philippe Naveau están de acuerdo, y han realizado un estudio para quizás aliviar la dificultad en la evaluación de la predicción del tiempo. Su papel titulado "Evaluación de pronóstico con observaciones imperfectas y modelos imperfectos, "se centra en nuevas métricas de evaluación de la calidad, reglas de puntuación, para tener en cuenta los errores en las observaciones y los pronósticos.
Los esquemas de puntuación clásicos generalmente implican comparar diferentes pronósticos con observaciones. Pero tales observaciones casi siempre tienen errores:debido, por ejemplo, a problemas de registro de datos o deficiencias de los instrumentos. En efecto, Un estudio reciente mostró que la puntuación de logaritmo clásico utilizada por tales esquemas es engañosa al seleccionar el mejor pronóstico cuando hay errores de observación. y que la distribución probabilística de los datos de verificación debería depender del modelado de los procesos físicos subyacentes que no se observan.
Sobre la base de los resultados de ese estudio, Bessac y Naveau han propuesto un nuevo modelo de puntuación que combina pronósticos y distribuciones de observación para corregir una puntuación cuando hay errores en los datos de verificación y en el pronóstico. También han destacado la necesidad de investigar más estadísticas que la puntuación media que se utiliza habitualmente en la práctica.
El equipo comparó / formuló su nuevo enfoque con dos modelos populares. El primer modelo ayuda a comprender el papel y el impacto de los errores de observación con respecto al estado real no observado de la atmósfera X, pero no incorpora la idea de error de pronóstico. En el segundo modelo, tanto las observaciones Y como los pronósticos Z se modelan como versiones con errores del estado de la atmósfera X, que de nuevo no se observa.
"Distinguir entre la verdad no observada (procesos ocultos) y los datos de verificación observados (pero incorrectos) es fundamental para comprender el impacto de las observaciones imperfectas en el modelado de pronósticos, "dijo Bessac, como asistente de estadística computacional en la División de Matemáticas y Ciencias de la Computación en Argonne.
El nuevo modelo ofrece varias ventajas:(1) propone un marco simple para contabilizar errores en los datos de verificación y en el pronóstico; (2) destaca la importancia de explorar la distribución de puntuaciones en lugar de centrarse únicamente en la media; y (3) muestra la importancia de tener en cuenta los errores en los datos de verificación que pueden ser potencialmente engañosos.
El modelo se probó en dos casos en los que se supone que se conocen los parámetros de las distribuciones involucradas. Si bien estos fueron casos idealizados, los investigadores enfatizaron que los resultados de la prueba resaltan la importancia de investigar la distribución de puntajes cuando los datos de verificación se consideran una variable aleatoria.