La inteligencia artificial y el aprendizaje automático se han vuelto omnipresentes, con aplicaciones que van desde el análisis de datos, la ciberseguridad, el desarrollo farmacéutico, la composición musical y las representaciones artísticas.
En los últimos años también han surgido grandes modelos de lenguaje (LLM), que añaden la interacción humana y la escritura a la larga lista de aplicaciones. Esto incluye ChatGPT, un LLM que ha tenido un profundo impacto desde su introducción hace menos de dos años. Esta aplicación ha provocado un considerable debate (y controversia) sobre los posibles usos e implicaciones de la IA.
La astronomía también se ha beneficiado enormemente, donde se utiliza el aprendizaje automático para clasificar volúmenes masivos de datos para buscar señales de tránsitos planetarios, corregir interferencias atmosféricas y encontrar patrones en el ruido. Según un equipo internacional de astrofísicos, esto puede ser sólo el comienzo de lo que la IA podría hacer por la astronomía.
En un estudio reciente, el equipo ajustó un modelo de Transformador Generativo Preentrenado (GPT) utilizando observaciones de objetos astronómicos. En el proceso, demostraron con éxito que los modelos GPT pueden ayudar eficazmente en la investigación científica.
El estudio fue realizado por el Centro Internacional de Red de Astrofísica Relativista (ICRANet), un consorcio internacional formado por investigadores del Centro Internacional de Astrofísica Relativista (ICRA), el Instituto Nacional de Astrofísica (INAF), la Universidad de Ciencia y Tecnología de China, el Instituto de Física de Altas Energías de la Academia China de Ciencias (CAS-IHEP), la Universidad de Padua, la Universidad Tecnológica de Isfahán y la Universidad de Ferrera.
Su artículo, "¿Puede la IA entender nuestro universo? Prueba de ajuste fino de GPT mediante datos astrofísicos", se publicó recientemente en arXiv. servidor de preimpresión.
Como se mencionó, los astrónomos dependen en gran medida de algoritmos de aprendizaje automático para clasificar los volúmenes de datos obtenidos por los telescopios e instrumentos modernos. Esta práctica comenzó hace aproximadamente una década y desde entonces ha crecido a pasos agigantados hasta el punto en que la IA se ha integrado en todo el proceso de investigación. Como dijo el presidente de ICRA y autor principal del estudio, Yu Wang, a Universe Today por correo electrónico:
"La astronomía siempre ha estado impulsada por los datos y los astrónomos son algunos de los primeros científicos en adoptar y emplear el aprendizaje automático. Ahora, el aprendizaje automático se ha integrado en todo el proceso de investigación astronómica, desde la fabricación y el control de dispositivos terrestres y espaciales. telescopios (por ejemplo, optimizar el rendimiento de los sistemas de óptica adaptativa, mejorar el inicio de acciones específicas (disparadores) de satélites bajo ciertas condiciones, etc.), hasta el análisis de datos (por ejemplo, reducción de ruido, imputación de datos, clasificación, simulación, etc.) , y el establecimiento y validación de modelos teóricos (por ejemplo, probar la gravedad modificada, restringir la ecuación de estado de las estrellas de neutrones, etc.)".
El análisis de datos sigue siendo la más común entre estas aplicaciones, ya que es el área más fácil donde se puede integrar el aprendizaje automático. Tradicionalmente, decenas de investigadores y cientos de científicos ciudadanos analizaban los volúmenes de datos producidos por una campaña de observación.
Sin embargo, esto no es práctico en una época en la que los telescopios modernos recopilan terabytes de datos diariamente. Esto incluye estudios de todo el cielo como el Very Large Array Sky Survey (VLASS) y las numerosas fases realizadas por el Sloan Digital Sky Survey (SDSS).
Hasta la fecha, los LLM solo se han aplicado esporádicamente a la investigación astronómica, dado que son una creación relativamente reciente. Pero según defensores como Wang, ha tenido un tremendo impacto social y tiene un potencial de límite inferior equivalente a una "revolución industrial".
En cuanto al límite superior, Wang predice que podría variar considerablemente y tal vez podría resultar en la "iluminación o destrucción" de la humanidad. Sin embargo, a diferencia de la Revolución Industrial, el ritmo del cambio y la integración es mucho más rápido para la IA, lo que plantea dudas sobre hasta dónde llegará su adopción.
Para determinar su potencial para el campo de la astronomía, dijo Wang, él y sus colegas adoptaron un modelo GPT previamente entrenado y lo ajustaron para identificar fenómenos astronómicos:
"OpenAI proporciona modelos previamente entrenados, y lo que hicimos fue un ajuste fino, lo que implica alterar algunos parámetros basados en el modelo original, permitiéndole reconocer datos astronómicos y calcular resultados a partir de estos datos. Esto es algo así como OpenAI que nos proporciona un estudiante de pregrado, a quien luego capacitamos para convertirse en un estudiante de posgrado en astronomía.
"Proporcionamos datos limitados con una resolución modesta y entrenamos el GPT menos veces en comparación con los modelos normales. Sin embargo, los resultados son impresionantes, logrando una precisión de alrededor del 90%. Este alto nivel de precisión es atribuible a la sólida base del GPT, que ya comprende el procesamiento de datos y posee capacidades de inferencia lógica, así como habilidades de comunicación."
Para perfeccionar su modelo, el equipo introdujo observaciones de diversos fenómenos astronómicos derivados de varios catálogos. Esto incluyó 2.000 muestras de quásares, galaxias, estrellas y quásares de línea de absorción amplia (BAL) del SDSS (500 cada uno). También integraron observaciones de estallidos de rayos gamma (GRB) cortos y largos, galaxias, estrellas y simulaciones de agujeros negros. Cuando se probó, su modelo clasificó con éxito diferentes fenómenos, distinguió entre tipos de cuásares, infirió su distancia basándose en el corrimiento al rojo y midió el giro y la inclinación de los agujeros negros.
"Este trabajo al menos demuestra que los LLM son capaces de procesar datos astronómicos", afirmó Wang. "Además, la capacidad de un modelo para manejar varios tipos de datos astronómicos es una capacidad que no poseen otros modelos especializados. Esperamos que los LLM puedan integrar varios tipos de datos y luego identificar principios subyacentes comunes que nos ayuden a comprender el mundo. Por supuesto , esta es una tarea desafiante y no una que los astrónomos puedan realizar solos."
Por supuesto, el equipo reconoce que el conjunto de datos con el que experimentaron era muy pequeño en comparación con los datos producidos por los observatorios modernos. Esto es particularmente cierto en instalaciones de próxima generación como el Observatorio Vera C. Rubin, que recientemente recibió su cámara LSST, ¡la cámara digital más grande del mundo!
Una vez que Rubin esté operativo, llevará a cabo el Legacy Survey of Space and Time (LSST) de 10 años, que se espera que produzca 15 terabytes de datos por noche. Satisfacer las demandas de futuras campañas, afirma Wang, requerirá mejoras y colaboración entre los observatorios y las empresas profesionales de IA.
Sin embargo, es una conclusión inevitable que habrá más aplicaciones de LLM para astronomía en el futuro cercano. Este no sólo es un avance probable, sino necesario considerando los grandes volúmenes de datos que los estudios astronómicos están generando en la actualidad. Y dado que es probable que esto aumente exponencialmente en el futuro cercano, la IA probablemente se volverá indispensable para el campo de estudio.
Más información: Yu Wang et al, ¿Puede la IA comprender nuestro universo? Prueba de ajuste fino de GPT mediante datos astrofísicos, arXiv (2024). DOI:10.48550/arxiv.2404.10019
Información de la revista: arXiv
Proporcionado por Universe Today