Representación de la investigación de la fusión en un tokamak con forma de rosquilla mejorado por inteligencia artificial. Crédito:Eliot Feibush / PPPL y Julian Kates-Harbeck / Universidad de Harvard
Inteligencia artificial (IA), una rama de la informática que está transformando la investigación científica y la industria, ahora podría acelerar el desarrollo de seguros, energía de fusión limpia y prácticamente ilimitada para generar electricidad. Se está dando un paso importante en esta dirección en el Laboratorio de Física del Plasma de Princeton (PPPL) del Departamento de Energía de EE. UU. (DOE) y en la Universidad de Princeton. donde un equipo de científicos que trabaja con un estudiante graduado de Harvard está aplicando por primera vez el aprendizaje profundo, una nueva y poderosa versión de la forma de inteligencia artificial de aprendizaje automático, para pronosticar interrupciones repentinas que pueden detener las reacciones de fusión y dañar los tokamaks en forma de rosquilla que albergan las reacciones.
Nuevo capítulo prometedor en la investigación de la fusión
"Esta investigación abre un nuevo capítulo prometedor en el esfuerzo por llevar energía ilimitada a la Tierra, "Steve Cowley, director de PPPL, dicho de los hallazgos, que se informan en la edición actual de Naturaleza revista. "La inteligencia artificial está explotando en todas las ciencias y ahora está empezando a contribuir a la búsqueda mundial de energía de fusión".
Fusión, que impulsa el sol y las estrellas, es la fusión de elementos ligeros en forma de plasma:el calor, estado cargado de la materia compuesta de electrones libres y núcleos atómicos, que genera energía. Los científicos buscan replicar la fusión en la Tierra para obtener un suministro abundante de energía para la producción de electricidad.
Para demostrar la capacidad del aprendizaje profundo para pronosticar interrupciones (la pérdida repentina del confinamiento de partículas de plasma y energía) ha sido fundamental el acceso a enormes bases de datos proporcionadas por dos importantes instalaciones de fusión:la Instalación Nacional de Fusión DIII-D que General Atomics opera para el DOE en California, la instalación más grande de los Estados Unidos, y el Joint European Torus (JET) en el Reino Unido, la instalación más grande del mundo, gestionado por EUROfusion, el Consorcio Europeo para el Desarrollo de la Energía de Fusión. El apoyo de los científicos de JET y DIII-D ha sido fundamental para este trabajo.
Las vastas bases de datos han permitido predicciones fiables de interrupciones en tokamaks distintos de aquellos en los que se entrenó el sistema, en este caso desde el DIII-D más pequeño hasta el JET más grande. El logro es un buen augurio para la predicción de interrupciones en el ITER, un tokamak mucho más grande y potente que tendrá que aplicar las capacidades aprendidas en las instalaciones de fusión actuales.
El código de aprendizaje profundo, llamada Red neuronal recurrente de fusión (FRNN), también abre posibles vías para controlar y predecir las interrupciones.
El área más intrigante del crecimiento científico
"La inteligencia artificial es el área más intrigante del crecimiento científico en este momento, y casarlo con la ciencia de la fusión es muy emocionante, "dijo Bill Tang, un físico investigador principal en PPPL, coautor del artículo y conferencista con rango y título de profesor en el Departamento de Ciencias Astrofísicas de la Universidad de Princeton que supervisa el proyecto de IA. "Hemos acelerado la capacidad de predecir con alta precisión el desafío más peligroso para la energía de fusión limpia".
A diferencia del software tradicional, que lleva a cabo las instrucciones prescritas, el aprendizaje profundo aprende de sus errores. Logrando esta aparente magia son las redes neuronales, capas de nodos interconectados (algoritmos matemáticos) que están "parametrizados, "o ponderado por el programa para dar forma a la salida deseada. Para cualquier entrada dada, los nodos buscan producir una salida especificada, como la identificación correcta de un rostro o pronósticos precisos de una interrupción. El entrenamiento se activa cuando un nodo no logra esta tarea:los pesos se ajustan automáticamente para obtener datos nuevos hasta que se obtiene la salida correcta.
Una característica clave del aprendizaje profundo es su capacidad para capturar datos de alta dimensión en lugar de unidimensionales. Por ejemplo, mientras que el software que no es de aprendizaje profundo puede considerar la temperatura de un plasma en un solo punto en el tiempo, la FRNN considera perfiles de la temperatura que se desarrolla en el tiempo y el espacio. "La capacidad de los métodos de aprendizaje profundo para aprender de datos tan complejos los convierte en un candidato ideal para la tarea de predicción de interrupciones, "dijo el colaborador Julian Kates-Harbeck, estudiante de posgrado en física en la Universidad de Harvard y becario de posgrado en ciencias computacionales del DOE-Office of Science, quien fue el autor principal del artículo de Nature y el arquitecto principal del código.
El entrenamiento y la ejecución de redes neuronales se basan en unidades de procesamiento de gráficos (GPU), chips de computadora diseñados por primera vez para renderizar imágenes en 3-D. Dichos chips son ideales para ejecutar aplicaciones de aprendizaje profundo y las empresas los utilizan ampliamente para producir capacidades de inteligencia artificial, como comprender el lenguaje hablado y observar las condiciones de la carretera en automóviles autónomos.
Kates-Harbeck entrenó el código FRNN en más de dos terabytes (1012) de datos recopilados de JET y DIII-D. Después de ejecutar el software en el clúster Tiger de GPU modernas de la Universidad de Princeton, el equipo lo colocó en Titán, una supercomputadora en Oak Ridge Leadership Computing Facility, una instalación para usuarios de la Oficina de Ciencias del DOE, y otras máquinas de alto rendimiento.
Una tarea exigente
Distribuir la red a través de muchas computadoras fue una tarea exigente. "El entrenamiento de redes neuronales profundas es un problema computacionalmente intensivo que requiere la participación de clústeres de computación de alto rendimiento, "dijo Alexey Svyatkovskiy, un coautor del artículo de Nature que ayudó a convertir los algoritmos en un código de producción y ahora está en Microsoft. "Colocamos una copia de toda nuestra red neuronal en muchos procesadores para lograr un procesamiento paralelo altamente eficiente, " él dijo.
El software demostró además su capacidad para predecir verdaderas interrupciones dentro del marco de tiempo de 30 milisegundos que requerirá el ITER. reduciendo al mismo tiempo el número de falsas alarmas. El código ahora se está acercando al requisito de ITER de predicciones correctas del 95 por ciento con menos del 3 por ciento de falsas alarmas. Si bien los investigadores dicen que solo la operación experimental en vivo puede demostrar los méritos de cualquier método predictivo, su artículo señala que las grandes bases de datos de archivo utilizadas en las predicciones, "cubren una amplia gama de escenarios operativos y, por lo tanto, proporcionan evidencia significativa sobre las fortalezas relativas de los métodos considerados en este documento".
De la predicción al control
El siguiente paso será pasar de la predicción al control de las interrupciones. "En lugar de predecir las interrupciones en el último momento y luego mitigarlas, Idealmente, usaríamos futuros modelos de aprendizaje profundo para alejar suavemente el plasma de las regiones de inestabilidad con el objetivo de evitar la mayoría de las interrupciones en primer lugar. ", Dijo Kates-Harbeck. Destacando este próximo paso está Michael Zarnstorff, quien recientemente pasó de subdirector de investigación en PPPL a director científico del laboratorio. "El control será esencial para los tokamaks posteriores al ITER, en los que evitar las interrupciones será un requisito esencial, "Señaló Zarnstorff.
Pasar de predicciones precisas habilitadas por IA a un control de plasma realista requerirá más de una disciplina. "Combinaremos el aprendizaje profundo con lo básico, física de primer principio en computadoras de alto rendimiento para concentrarse en mecanismos de control realistas en la quema de plasmas, "dijo Tang." Por control, uno significa saber qué 'botones girar' en un tokamak para cambiar las condiciones y evitar interrupciones. Eso está en nuestra mira y es hacia donde nos dirigimos ".