Ubicación de tres campos ZTF analizados en este trabajo con candidatos de anomalía marcados. Crédito:Maria Pruzhinskaya (2020)
El equipo SNAD, una red internacional formada por investigadores de Rusia, Francia y EE. UU., ha desarrollado una tubería para encontrar objetos raros y exóticos entre los montones de datos de estudios astronómicos.
Dado el tamaño cada vez mayor de los conjuntos de datos astronómicos, incluso si nuestros telescopios detectan fenómenos astronómicos interesantes e inesperados, es muy poco probable que seamos capaces de reconocerlos en medio de millones o incluso miles de millones de observaciones. La solución radica en herramientas automáticas diseñadas específicamente para reconocer comportamientos inusuales ocultos entre miles de millones de mediciones. Algunas de estas herramientas ya existen y se utilizan, por ejemplo, para identificar actividades fraudulentas de tarjetas de crédito entre millones de transacciones todos los días. Sin embargo, su adaptación a los datos científicos no es sencilla debido a las complicaciones derivadas de la naturaleza de las observaciones en astronomía. El equipo de SNAD trabaja desde hace 3 años en el desarrollo y adaptación de este tipo de soluciones al contexto de la astronomía.
Durante su última reunión anual, el grupo centró sus esfuerzos en objetos cuyo brillo varía en el tiempo. La canalización combina las fortalezas de los algoritmos de aprendizaje automático y el conocimiento irremplazable de los expertos humanos para construir una herramienta robusta de detección de anomalías. El artículo describe los resultados de la aplicación de este marco a la tercera publicación de datos de Zwicky Transient Facility. Su proceso de tres etapas involucró la extracción de características en curvas de luz (que rastrea el brillo de los objetos a lo largo del tiempo), Busque candidatos con anomalías utilizando varios algoritmos de aprendizaje automático y el filtrado manual de candidatos por parte de un experto humano. Esta última etapa también incluyó la realización de observaciones con otros telescopios siempre que fuera posible. En este estudio, Se utilizaron 4 algoritmos de aprendizaje automático para señalar 277 candidatos a anomalías para la investigación humana, de un conjunto de datos inicial de 2,25 millones de objetos.
El grupo también desarrolló una interfaz web especialmente diseñada que permitió la visualización inmediata y el cruce de cada candidato con los catálogos astronómicos existentes. Este fue construido para facilitar el trabajo de los expertos que necesitan correlacionar los candidatos de anomalía con cualquier otra información disponible públicamente sobre las coordenadas del cielo bajo investigación.
De los 277 objetos considerados anómalos por la máquina, Se encontró que 188 (68%) mostraban características inusuales debido a efectos no astrofísicos (incluidos defectos debido a la línea de sustracción de imágenes de ZTF), 66 (24%) eran objetos ya catalogados anteriormente y 23 (8%) eran objetos previamente desconocidos. La primera categoría incluye algunas curiosidades divertidas y los dos últimos casos de interés científico. Por ejemplo, un objeto marcado como anomalía por la máquina era en realidad la ocultación de una estrella de fondo por el asteroide de Barcelona, que desde el punto de vista de un observador de la Tierra se detectó como una fuente puntual variable cuando en realidad ni la estrella ni el asteroide realmente cambiaron de brillo. Los autores también caracterizaron los artefactos de sustracción de imágenes exóticos y recurrentes que interfieren con el análisis de la curva de luz y pueden engañar a una tubería de detección de anomalías para que piense que es real, objeto anómalo. Para ayudar a clasificar rápidamente la primera clase de los candidatos restantes, pudieron identificar una relación bidimensional simple que se puede utilizar para ayudar a filtrar curvas de luz potencialmente falsas en estudios futuros.
Entre la segunda y tercera categorías, los autores encontraron cuatro candidatos a supernovas, seis binarios eclipsantes previamente no clasificados, cuatro candidatos previos a la secuencia principal, una posible llamarada de enana roja, y confirmó espectroscópicamente una estrella RS Canum Venaticorum, entre otros candidatos a anomalía.
La separación rápida y sin esfuerzo de los artefactos de los candidatos a anomalías interesantes es crucial para los observatorios actuales y de próxima generación de la próxima generación. como el Legacy Survey of Space and Time (LSST) del Observatorio Vera Rubin. LSST generará aproximadamente 10 millones de fuentes transitorias por noche; se necesitarán algoritmos sofisticados y robustos para examinar todos esos datos de manera que no se pierdan objetos inesperados e interesantes. y los científicos pueden comprender mejor estas rarezas espaciales.
El autor principal Konstantin Malanchev, investigador de la Universidad de Illinois en Urbana-Champaign (EE. UU.) y del instituto astronómico Sternberg del Lomonosov Moscú (Rusia), dice, "El diseño de herramientas específicamente dedicadas a la búsqueda de anomalías astrofísicamente interesantes es nuestra única opción para garantizar la explotación completa de los conjuntos de datos que tanto luchamos por adquirir. El equipo de SNAD está totalmente comprometido a ayudar a la comunidad astronómica a explorar todo el potencial de los conjuntos de datos futuros. . "
El artículo ha sido aceptado para su publicación en Avisos mensuales de la Royal Astronomical Society y también está disponible públicamente como una preimpresión. El código fuente y los resultados. incluyendo una lista completa de objetos con potencial aplicación científica, así como las técnicas de canalización, están abiertos al público para beneficio y verificación de la comunidad astronómica.