• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Astronomía
    Cómo aplicaron los científicos el algoritmo de recomendación para anticipar los tiempos de llegada de las CME

    Arriba:De izquierda a derecha, instantáneas del evento CME que ocurrió el 16 de agosto de 2006 a las 16 : 30 UT. Crédito:SOHO LASCO C2. Abajo:De izquierda a derecha, instantáneas del evento CME que ocurrió el 7 de abril de 1997 a las 14 : 27 UT. Crédito:Espacio:ciencia y tecnología

    Las eyecciones de masa coronal (CME) son eventos solares eruptivos. A menudo se asocian con erupciones solares y filamentos. Las CME pueden causar eventos meteorológicos espaciales como tormentas geomagnéticas, tormentas de electrones de alta energía, inyección de plasma caliente, tormentas ionosféricas y aumento de la densidad en la atmósfera superior.

    Los grandes eventos de CME pueden afectar las comunicaciones, los sistemas de navegación, las actividades de aviación e incluso las redes eléctricas. Para evitar posibles daños y pérdidas de activos, es necesario predecir con precisión la llegada de las CME en dos partes. ¿La CME "golpeará" o "fallará" la tierra? Si la predicción es "acertada", entonces la siguiente pregunta es ¿cuál es la hora de llegada esperada de la CME?

    En un artículo de investigación publicado recientemente en Space:Science &Technology , Yurong Shi del Centro Nacional de Ciencias Espaciales de la Academia de Ciencias de China, aplicó el algoritmo de recomendación, que podría usarse para recomendar el evento CME histórico similar para los pronosticadores, para anticipar el tiempo de llegada de las CME y demostró que el algoritmo de recomendación y la regresión logística podrían actuar juntos para proporcionar a los pronosticadores una opción para mejorar los resultados de la predicción.

    En primer lugar, se prepararon los datos y la metodología. El autor seleccionó muestras de un total de 30,321 eventos de CME que se recolectaron del catálogo de CME de SOHO/LASCO, de 1996 a 2020. Se utilizó sobremuestreo para resolver los datos desbalanceados y se obtuvieron 181 muestras positivas (CME que llegaron a la tierra) y 3486 muestras negativas (CME que no llegaron a tierra).

    Además, se recopilan 8 parámetros característicos mediante la selección de parámetros característicos, incluido el ancho angular, el ángulo de posición central (CPA), el ángulo de posición de medición (MPA), la velocidad lineal, la velocidad inicial, la velocidad final, la velocidad a 20 radios solares, la masa. Se configuró y preparó un conjunto de datos adimensionales completo y unificado de los 8 parámetros característicos para facilitar el desarrollo del modelo de predicción. Además, para buscar el evento histórico más similar al evento CME especificado, los autores adoptan dos distancias comúnmente utilizadas en el aprendizaje automático y la inteligencia artificial informática:la distancia del coseno y la distancia euclidiana, que demostraron tener un buen rendimiento durante el experimento.

    Posteriormente se diseñó el experimento, un ensayo controlado. La primera etapa es el muestreo de datos. Un total de 3667 muestras que incluyen 8 parámetros característicos se dividen aleatoriamente en dos subgrupos iguales. Uno (1.833 muestras) es para entrenamiento con pesas y el otro (1.834 muestras) es para la prueba de recomendación posterior. Durante la etapa de entrenamiento con pesas, el autor utilizó 1.466 muestras de entrenamiento que sirvieron como conjunto de entrenamiento para entrenar pesas siguiendo tanto el procedimiento de regresión logística como el algoritmo de recomendación, mientras que el resto (367 muestras) sirvió como conjunto de validación.

    En resumen, se realizan un total de 6 experimentos para entrenar pesos y, por lo tanto, se obtienen 6 conjuntos de coeficientes de peso con 4 del algoritmo de regresión logística y 2 del algoritmo de recomendación. Se adoptaron dos marcos de regresión logística para la comparación. Una era la función logit proporcionada en el módulo statsmodels basado en Python y denominada "sm.logit". El otro también basado en Python fue el clasificador LogisticRegression proporcionado en la biblioteca scikit-learn (sklearn) y denominado "sk.LR".

    Al comparar todos los modelos, el modelo sm.logit se desempeñó mejor tanto en el conjunto de validación como en el conjunto de prueba. Fue apropiado elegir los pesos de sm.logit como los pesos óptimos en la siguiente etapa de este trabajo en particular. Además, se puede ver que usar los algoritmos de recomendación para entrenar los pesos de los parámetros característicos requería mucho tiempo, pero era más fácil obtener los pesos por regresión logística. Por tanto, un nuevo intento fue aplicar los pesos obtenidos por la regresión logística al algoritmo de recomendación. La factibilidad de tal operación fue probada durante la etapa final, etapa de prueba de recomendación.

    En resumen, el autor primero calculó los pesos de los parámetros característicos de las CME en función de la regresión logística y luego los introdujo en el algoritmo de recomendación para proporcionar los eventos históricos más similares como referencia para el pronóstico de la efectividad de las CME. Se puede encontrar que en cada puntaje de habilidad, el modelo que aplicaba los pesos de la regresión logística al algoritmo de recomendación era mejor que el que usaba solo el algoritmo de recomendación, por lo que este modelo híbrido era factible. Tal tratamiento evitó entrenar los pesos de recomendación para ahorrar tiempo y recursos informáticos.

    En la actualidad, la aplicación del algoritmo de recomendación a la predicción de CME es muy poco frecuente en la literatura. El autor demostró que una vez que el modelo de regresión logística confirma la eficacia de una CME, el algoritmo de recomendación se puede utilizar para recomendar eventos históricos similares. Recomendar eventos históricos similares como una referencia vívida para los pronosticadores es una gran mejora para el servicio de pronóstico en contraste con el pronóstico binario de "sí" o "no" proporcionado solo por el modelo de regresión logística. Los pronosticadores del clima espacial pueden hacer uso de este método para ejecutar un análisis comparativo. + Explora más

    Un nuevo enfoque para la predicción de fallas de software mediante la selección de funciones




    © Ciencia https://es.scienceaq.com