Impresión artística de Euclides. Crédito:ESA/ATG medialab (nave espacial); NASA, ESA, CXC, C. Ma, H. Ebeling y E. Barrett (U. Hawaii/IfA), et al. y STScI (fondo)
La clasificación de los objetos celestes es un problema de larga data. Con fuentes a distancias casi inimaginables, a veces es difícil para los investigadores distinguir entre objetos como estrellas, galaxias, cuásares o supernovas.
Los investigadores del Instituto de Astrofísica e Ciências do Espaço (IA) Pedro Cunha y Andrew Humphrey intentaron resolver este problema clásico creando SHEEP, un algoritmo de aprendizaje automático que determina la naturaleza de las fuentes astronómicas. Andrew Humphrey (IA y Universidad de Oporto, Portugal) comenta:"El problema de clasificar los objetos celestes es muy desafiante, en términos de números y complejidad del universo, y la inteligencia artificial es una herramienta muy prometedora para este tipo de tarea. "
El primer autor del artículo, ahora publicado en la revista Astronomy &Astrophysics , Pedro Cunha, Ph.D. estudiante de IA y del Departamento de Física de la Universidad de Oporto, dice:"Este trabajo nació como un proyecto paralelo a mi tesis de maestría. Combinó las lecciones aprendidas durante ese tiempo en un proyecto único".
Andrew Humphrey, asesor de maestría de Pedro Cunha y ahora Ph.D. El coasesor dice:"Fue genial obtener un resultado tan interesante, especialmente de una tesis de maestría".
SHEEP es una canalización de aprendizaje automático supervisado que estima los desplazamientos al rojo fotométricos y utiliza esta información para clasificar posteriormente las fuentes como una galaxia, un cuásar o una estrella. "La información fotométrica es la más fácil de obtener y, por lo tanto, es muy importante para proporcionar un primer análisis sobre la naturaleza de las fuentes observadas", dice Pedro Cunha.
"Un paso novedoso en nuestra tubería es que antes de realizar la clasificación, SHEEP primero estima los desplazamientos al rojo fotométricos, que luego se colocan en el conjunto de datos como una característica adicional para el entrenamiento del modelo de clasificación".
El equipo descubrió que incluir el corrimiento al rojo y las coordenadas de los objetos permitía que la IA los entendiera dentro de un mapa 3D del universo, y lo usaron junto con la información de color para hacer mejores estimaciones de las propiedades de la fuente. Por ejemplo, la IA aprendió que hay una mayor probabilidad de encontrar estrellas más cerca del plano de la Vía Láctea que en los polos galácticos. Humphrey agregó:"Cuando permitimos que la IA tuviera una vista en 3D del universo, esto realmente mejoró su capacidad para tomar decisiones precisas sobre qué era cada objeto celeste".
Los estudios de área amplia, tanto terrestres como espaciales, como el Sloan Digital Sky Survey (SDSS), han producido grandes volúmenes de datos, revolucionando el campo de la astronomía. Estudios futuros, llevados a cabo por el Observatorio Vera C. Rubin, el Instrumento Espectroscópico de Energía Oscura (DESI), la misión espacial Euclid (ESA) o el Telescopio Espacial James Webb (NASA/ESA) seguirán dándonos más detalles. formación de imágenes Sin embargo, analizar todos los datos utilizando métodos tradicionales puede llevar mucho tiempo. La IA o el aprendizaje automático serán cruciales para analizar y hacer el mejor uso científico de estos nuevos datos.
Este trabajo es parte del esfuerzo del equipo para explotar la avalancha esperada de datos que provendrán de esas encuestas, mediante el desarrollo de sistemas de inteligencia artificial que clasifiquen y caractericen de manera eficiente miles de millones de fuentes.
Mapa 3D del Universo, realizado por la colaboración eBOSS en SDSS. Crédito:EPFL
Pedro Cunha dice:"Una de las partes más emocionantes es ver cómo el aprendizaje automático nos ayuda a comprender mejor el universo. Nuestra metodología nos muestra un camino posible, mientras se crean otros nuevos a lo largo del proceso. Es un momento emocionante para la astronomía". "
Los estudios espectroscópicos y de imágenes son uno de los principales recursos para la comprensión del contenido visible del universo. Los datos de estos estudios permiten estudios estadísticos de estrellas, cuásares y galaxias, y el descubrimiento de objetos más peculiares.
El investigador principal, Polychronis Papaderos, dice:"El desarrollo de algoritmos avanzados de aprendizaje automático, como SHEEP, es un componente integral de la estrategia coherente de IA hacia la explotación científica de grandes conjuntos de datos fotométricos sin precedentes para miles de millones de galaxias con la misión espacial Euclid de la ESA, cuyo lanzamiento está programado en 2023".
Euclid proporcionará una cartografía detallada del universo y arrojará luz sobre la naturaleza de la enigmática materia oscura y la energía oscura. Los astrónomos producen el mayor catálogo tridimensional de galaxias