Casiopea A, o Cas A, es un remanente de supernova ubicado 10, 000 años luz de distancia en la constelación de Casiopea, y es el remanente de una estrella que alguna vez fue masiva y que murió en una violenta explosión hace aproximadamente 340 años. Esta imagen en capas de infrarrojos, visible, y datos de rayos X para revelar estructuras filamentosas de polvo y gas. Cas A se encuentra entre el 10 por ciento de supernovas que los científicos pueden estudiar de cerca. El nuevo proyecto de aprendizaje automático de CfA ayudará a clasificar miles, y eventualmente millones, de supernovas potencialmente interesantes que de otro modo nunca se estudiarían. Crédito:NASA / JPL-Caltech / STScI / CXC / SAO
La inteligencia artificial está clasificando explosiones de supernovas reales sin el uso tradicional de espectros, gracias a un equipo de astrónomos del Centro de Astrofísica | Harvard y Smithsonian. Los conjuntos de datos completos y las clasificaciones resultantes están disponibles públicamente para uso abierto.
Al entrenar un modelo de aprendizaje automático para categorizar supernovas según sus características visibles, los astrónomos pudieron clasificar datos reales del estudio Pan-STARRS1 Medium Deep Survey para 2, 315 supernovas con una tasa de precisión del 82 por ciento sin el uso de espectros.
Los astrónomos desarrollaron un programa de software que clasifica diferentes tipos de supernovas en función de sus curvas de luz, o cómo cambia su brillo con el tiempo. "Tenemos aproximadamente 2, 500 supernovas con curvas de luz de Pan-STARRS1 Medium Deep Survey, y de esos, 500 supernovas con espectros que se pueden utilizar para la clasificación, "dijo Griffin Hosseinzadeh, investigador postdoctoral en la CfA y autor principal del primero de dos artículos publicados en El diario astrofísico . "Entrenamos al clasificador usando esas 500 supernovas para clasificar las supernovas restantes donde no pudimos observar el espectro".
Edo Berger, un astrónomo de la CfA explicó que al pedirle a la inteligencia artificial que responda preguntas específicas, los resultados se vuelven cada vez más precisos. "El aprendizaje automático busca una correlación con las 500 etiquetas espectroscópicas originales. Le pedimos que compare las supernovas en diferentes categorías:color, tasa de evolución, o brillo. Al alimentarlo con el conocimiento real existente, conduce a la mayor precisión, entre el 80 y el 90 por ciento ".
Aunque este no es el primer proyecto de aprendizaje automático para la clasificación de supernovas, Es la primera vez que los astrónomos han tenido acceso a un conjunto de datos reales lo suficientemente grande como para entrenar a un clasificador de supernovas basado en inteligencia artificial. haciendo posible la creación de algoritmos de aprendizaje automático sin el uso de simulaciones.
"Si crea una curva de luz simulada, significa que está haciendo una suposición sobre cómo se verán las supernovas, y su clasificador también aprenderá esas suposiciones, "dijo Hosseinzadeh." La naturaleza siempre arrojará algunas complicaciones adicionales en las que usted no tuvo en cuenta, lo que significa que su clasificador no funcionará tan bien con datos reales como lo hizo con datos simulados. Debido a que usamos datos reales para entrenar a nuestros clasificadores, significa que nuestra precisión medida es probablemente más representativa de cómo se comportarán nuestros clasificadores en otros estudios ". A medida que el clasificador categoriza las supernovas, dijo Berger, "Podremos estudiarlos tanto en retrospectiva como en tiempo real para seleccionar los eventos más interesantes para un seguimiento detallado. Usaremos el algoritmo para ayudarnos a seleccionar las agujas y también a mirar el pajar".
El proyecto tiene implicaciones no solo para los datos de archivo, sino también para los datos que serán recopilados por futuros telescopios. Se espera que el Observatorio Vera C. Rubin entre en funcionamiento en 2023, y conducirá al descubrimiento de millones de nuevas supernovas cada año. Esto presenta tanto oportunidades como desafíos para los astrofísicos, donde el tiempo limitado del telescopio conduce a clasificaciones espectrales limitadas.
"Cuando el Observatorio Rubin esté en línea, aumentará nuestra tasa de descubrimiento de supernovas en 100 veces, pero nuestros recursos espectroscópicos no aumentarán, "dijo Ashley Villar, Simons Junior Fellow en la Universidad de Columbia y autor principal del segundo de los dos artículos, agregando que mientras aproximadamente 10, 000 supernovas se descubren actualmente cada año, los científicos solo toman espectros de alrededor del 10 por ciento de esos objetos. "Si esto es cierto, significa que sólo el 0,1 por ciento de las supernovas descubiertas por el Observatorio Rubin cada año recibirán una etiqueta espectroscópica. El 99,9 por ciento restante de los datos no se podrá utilizar sin métodos como el nuestro ".
A diferencia de los esfuerzos pasados, donde los conjuntos de datos y las clasificaciones han estado disponibles solo para un número limitado de astrónomos, Los conjuntos de datos del nuevo algoritmo de aprendizaje automático se pondrán a disposición del público. Los astrónomos han creado software accesible, y también publicó todos los datos de Pan-STARRS1 Medium Deep Survey junto con las nuevas clasificaciones para su uso en otros proyectos. Hosseinzadeh dijo:"Para nosotros era muy importante que estos proyectos fueran útiles para toda la comunidad de supernovas, no solo para nuestro grupo. Hay tantos proyectos que se pueden hacer con estos datos que nunca podríamos hacerlos todos nosotros mismos ". Berger agregó:"Estos proyectos son datos abiertos para ciencia abierta".