Interrupción del plasma en un experimento con JET, izquierda, y experimento sin interrupciones en JET, Derecha. El entrenamiento de la red neuronal FRNN para predecir interrupciones requiere asignar pesos al flujo de datos a lo largo de las conexiones entre nodos. Luego, los datos de los nuevos experimentos se transfieren a la red, que predice "interrupción" o "no interrupción". El objetivo final es al menos un 95 por ciento de predicciones correctas de eventos disruptivos. Crédito:Eliot Feibush.
Antes de que los científicos puedan capturar y desplegar eficazmente la energía de fusión, deben aprender a predecir las principales interrupciones que pueden detener las reacciones de fusión y dañar las paredes de los dispositivos de fusión en forma de rosquilla llamados tokamaks. Predicción oportuna de interrupciones, la repentina pérdida de control del calor, plasma cargado que alimenta las reacciones, será vital para poner en marcha medidas para evitar o mitigar estos eventos a gran escala.
Hoy dia, Investigadores del Laboratorio de Física del Plasma de Princeton (PPPL) del Departamento de Energía de EE. UU. (DOE) y de la Universidad de Princeton están empleando inteligencia artificial para mejorar la capacidad predictiva. Investigadores dirigidos por William Tang, un físico de PPPL y un conferencista con el rango y título de profesor en la Universidad de Princeton, están desarrollando el código de predicciones para ITER, el experimento internacional en construcción en Francia para demostrar la practicidad de la energía de fusión.
Forma de "aprendizaje profundo"
El nuevo software predictivo, llamado el código Fusion Recurrent Neural Network (FRNN), es una forma de "aprendizaje profundo":una versión más nueva y poderosa del software moderno de aprendizaje automático, una aplicación de inteligencia artificial. "El aprendizaje profundo representa una nueva y emocionante vía hacia la predicción de interrupciones, ", Dijo Tang." Esta capacidad ahora puede manejar datos multidimensionales ".
FRNN es una arquitectura de aprendizaje profundo que ha demostrado ser la mejor manera de analizar datos secuenciales con patrones de largo alcance. Los miembros del equipo de aprendizaje automático de la Universidad de Princeton y PPPL son los primeros en aplicar sistemáticamente un enfoque de aprendizaje profundo al problema de la predicción de interrupciones en los plasmas de fusión de tokamak.
El arquitecto jefe de FRNN es Julian Kates-Harbeck, estudiante de posgrado en la Universidad de Harvard y becario de posgrado en ciencias computacionales del DOE-Office of Science. Aprovechando la experiencia adquirida al obtener una maestría en ciencias de la computación en la Universidad de Stanford, ha liderado la construcción del software FRNN.
Predicciones más precisas
Usando este enfoque, el equipo ha demostrado la capacidad de predecir eventos disruptivos con mayor precisión que los métodos anteriores. Al extraer de la enorme base de datos de la instalación Joint European Torus (JET) ubicada en el Reino Unido, el tokamak más grande y poderoso en funcionamiento, los investigadores han mejorado significativamente las predicciones de interrupciones y reducido el número de falsos positivos alarmas. EUROfusion, el Consorcio Europeo para el Desarrollo de la Energía de Fusión, gestiona la investigación JET.
El equipo ahora tiene como objetivo alcanzar los desafiantes objetivos que requerirá el ITER. Estos incluyen producir predicciones correctas en un 95 por ciento cuando ocurren interrupciones, al tiempo que proporciona menos del 3 por ciento de falsas alarmas cuando no hay interrupciones. "En los conjuntos de datos de prueba examinados, el FRNN ha mejorado la curva para predecir verdaderos positivos y reducir los falsos positivos, "dijo Eliot Feibush, un científico computacional en PPPL, refiriéndose a lo que se llama la curva "Característica operativa del receptor" que se usa comúnmente para medir la precisión del aprendizaje automático. "Estamos trabajando para incorporar más datos de entrenamiento para hacerlo aún mejor".
Muy exigente
El proceso es muy exigente. "El entrenamiento de redes neuronales profundas es una tarea computacionalmente intensiva que requiere la participación de hardware informático de alto rendimiento, "dijo Alexey Svyatkovskiy, un investigador de big data de la Universidad de Princeton. "Es por eso que una gran parte de lo que hacemos es desarrollar y distribuir nuevos algoritmos en muchos procesadores para lograr una computación paralela altamente eficiente. Dicha computación manejará el tamaño cada vez mayor de los problemas derivados de la base de datos relevante para la interrupción de JET y otros tokamaks". "
El código de aprendizaje profundo se ejecuta en unidades de procesamiento gráfico (GPU) que pueden calcular miles de copias de un programa a la vez, mucho más que las unidades centrales de procesamiento (CPU) más antiguas. Pruebas realizadas en clústeres de GPU modernos, y en máquinas de clase mundial como Titan, actualmente, la supercomputadora estadounidense más rápida y poderosa en Oak Ridge Leadership Computing Facility, una instalación para usuarios de la Oficina de Ciencias del DOE en el Laboratorio Nacional de Oak Ridge, han demostrado una escala lineal excelente. Este escalado reduce el tiempo de ejecución computacional en proporción directa al número de GPU utilizadas, un requisito importante para un procesamiento paralelo eficiente.
Cúmulo de tigres de Princeton
El clúster Tiger de GPU modernas de la Universidad de Princeton fue el primero en realizar pruebas de aprendizaje profundo, utilizando FRNN para demostrar la capacidad mejorada de predecir las interrupciones de la fusión. Desde entonces, el código se ha ejecutado en Titan y otros grupos de GPU de supercomputación líderes en los Estados Unidos. Europa y Asia, y han seguido mostrando un excelente escalado con la cantidad de GPU activadas.
Avanzando, los investigadores buscan demostrar que este potente software predictivo puede ejecutarse en tokamaks de todo el mundo y, finalmente, en ITER. También se planifica la mejora de la velocidad del análisis de interrupciones para los crecientes tamaños de problemas asociados con los conjuntos de datos más grandes antes del inicio de un evento disruptivo. El apoyo para este proyecto ha venido principalmente hasta la fecha de los fondos de Investigación y Desarrollo Dirigidos por Laboratorio proporcionados por PPPL.