CosmoGAN:Entrenando una red neuronal para estudiar la materia oscura

Mapas de convergencia de lentes débiles para el modelo cosmológico ΛCDM. Mapas seleccionados al azar del conjunto de datos de validación (arriba) y ejemplos generados por GAN (abajo). Crédito:Berkeley Lab

A medida que los cosmólogos y astrofísicos profundizan en los rincones más oscuros del universo, su necesidad de herramientas de observación y computación cada vez más poderosas se ha expandido exponencialmente. Desde instalaciones como el Instrumento espectroscópico de energía oscura hasta supercomputadoras como el sistema Cori del Laboratorio Nacional Lawrence Berkeley en la instalación de Computación Científica de Investigación en Energía Nacional (NERSC), están en una búsqueda para recolectar, simular, y analizar cantidades cada vez mayores de datos que pueden ayudar a explicar la naturaleza de las cosas que no podemos ver, así como los que podemos.

Hacia este final, La lente gravitacional es una de las herramientas más prometedoras que tienen los científicos para extraer esta información, dándoles la capacidad de sondear tanto la geometría del universo como el crecimiento de la estructura cósmica. La lente gravitacional distorsiona las imágenes de galaxias distantes de una manera que está determinada por la cantidad de materia en la línea de visión en una determinada dirección, y proporciona una forma de ver un mapa bidimensional de materia oscura, según Deborah Bard, Líder de grupo para el grupo de participación de ciencia de datos en el Centro Nacional de Computación Científica de Investigación de Energía de Berkeley Lab (NERSC).

"La lente gravitacional es una de las mejores formas que tenemos de estudiar la materia oscura, lo cual es importante porque nos dice mucho sobre la estructura del universo, ", dijo." La mayor parte de la materia en el universo es materia oscura, que no podemos ver directamente, así que tenemos que utilizar métodos indirectos para estudiar cómo se distribuye ".

Pero a medida que crecen los conjuntos de datos experimentales y teóricos, junto con las simulaciones necesarias para obtener imágenes y analizar estos datos, ha surgido un nuevo desafío:estas simulaciones son cada vez más, incluso prohibitivamente, computacionalmente costosas. Así que los cosmólogos computacionales a menudo recurren a modelos sustitutos computacionalmente más baratos, que emulan costosas simulaciones. Más recientemente, sin embargo, "Los avances en modelos generativos profundos basados en redes neuronales abrieron la posibilidad de construir modelos sustitutos más robustos y menos diseñados a mano para muchos tipos de simuladores, incluidos los de cosmología, "dijo Mustafa Mustafa, ingeniero de aprendizaje automático en NERSC y autor principal de un nuevo estudio que describe uno de estos enfoques desarrollado por una colaboración que involucra a Berkeley Lab, Investigación de Google, y la Universidad de KwaZulu-Natal.

Se está investigando una variedad de modelos generativos profundos para aplicaciones científicas, pero el equipo dirigido por Berkeley Lab está tomando un rumbo único:redes generativas de adversario (GAN). En un artículo publicado el 6 de mayo, 2019 en Astrofísica y cosmología computacional , discuten su nueva red de aprendizaje profundo, apodado CosmoGAN, y su capacidad para crear alta fidelidad, mapas de convergencia de lentes gravitacionales débiles.

"Un mapa de convergencia es efectivamente un mapa 2-D de la lente gravitacional que vemos en el cielo a lo largo de la línea de visión, "dijo Bard, un coautor en el Astrofísica y cosmología computacional papel. "Si tiene un pico en un mapa de convergencia que corresponde a un pico en una gran cantidad de materia a lo largo de la línea de visión, eso significa que hay una gran cantidad de materia oscura en esa dirección ".

Las ventajas de las GAN

¿Por qué optar por GAN en lugar de otros tipos de modelos generativos? Rendimiento y precisión, según Mustafa.

"Desde una perspectiva de aprendizaje profundo, hay otras formas de aprender a generar mapas de convergencia a partir de imágenes, pero cuando comenzamos este proyecto, las GAN parecían producir imágenes de muy alta resolución en comparación con los métodos de la competencia, sin dejar de ser eficiente desde el punto de vista computacional y del tamaño de la red neuronal, " él dijo.

"Buscábamos dos cosas:ser precisos y ser rápidos, "agregó la coautora Zaria Lukic, un científico investigador en el Centro de Cosmología Computacional en Berkeley Lab. "Las GAN ofrecen la esperanza de ser casi tan precisas en comparación con las simulaciones físicas completas".

El equipo de investigación está particularmente interesado en construir un modelo sustituto que reduciría el costo computacional de ejecutar estas simulaciones. En el Astrofísica y cosmología computacional papel, describen una serie de ventajas de las GAN en el estudio de grandes simulaciones físicas.

"Se sabe que las GAN son muy inestables durante el entrenamiento, especialmente cuando llega al final de la capacitación y las imágenes comienzan a verse bien, es entonces cuando las actualizaciones de la red pueden ser realmente caóticas, "Dijo Mustafa." Pero debido a que tenemos las estadísticas resumidas que usamos en cosmología, pudimos evaluar las GAN en cada paso de la capacitación, lo que nos ayudó a determinar el generador que pensamos que era el mejor. Este procedimiento no se suele utilizar en la formación de GAN ".

Usando la red de generadores CosmoGAN, el equipo ha podido producir mapas de convergencia que se describen, con alta confianza estadística, las mismas estadísticas resumidas que los mapas completamente simulados. Este alto nivel de acuerdo entre mapas de convergencia que son estadísticamente indistinguibles de los mapas producidos por modelos generativos basados en la física ofrece un paso importante hacia la construcción de emuladores a partir de redes neuronales profundas.

"La gran ventaja aquí fue que el problema que estábamos abordando era un problema de física que tenía métricas asociadas, "Dijo Bard." Pero con nuestro enfoque, existen métricas reales que le permiten cuantificar la precisión de su GAN. Para mí, eso es lo realmente emocionante de esto:cómo este tipo de problemas físicos pueden influir en los métodos de aprendizaje automático.

En última instancia, estos enfoques podrían transformar la ciencia que actualmente se basa en simulaciones físicas detalladas que requieren miles de millones de horas de cómputo y ocupan petabytes de espacio en disco, pero aún queda mucho trabajo por hacer. Los datos de cosmología (y los datos científicos en general) pueden requerir mediciones de muy alta resolución, como imágenes de telescopio de cielo completo.

"Las imágenes bidimensionales consideradas para este proyecto son valiosas, pero las simulaciones físicas reales son 3-D y pueden variar en el tiempo? e irregulares, produciendo un rico, estructura de características similar a una web, "dijo Wahid Bhmiji, arquitecto de big data en el grupo de servicios de datos y análisis de NERSC y coautor del Astrofísica y cosmología computacional papel. "Además, el enfoque debe extenderse para explorar nuevos universos virtuales en lugar de los que ya han sido simulados, construyendo en última instancia un CosmoGAN controlable ".

"La idea de hacer GAN controlables es esencialmente el Santo Grial de todo el problema en el que estamos trabajando:para poder emular verdaderamente los simuladores físicos, necesitamos construir modelos sustitutos basados en GAN controlables, "Agregó Mustafa." En este momento estamos tratando de entender cómo estabilizar la dinámica de entrenamiento, dados todos los avances en el campo que se han producido en los últimos años. Estabilizar el entrenamiento es extremadamente importante para poder hacer lo que queremos hacer a continuación ".

El equipo de New Horizons publica los primeros resultados científicos del sobrevuelo del cinturón de Kuiper

Galaxia resplandece con nuevas estrellas nacidas de un encuentro cercano

Astronomía