HAL, Summit y las canciones de los agujeros negros - Calendae | Informática, Electrónica, CMS, Ciberseguridad

HAL, Summit y las canciones de los agujeros negros

Hola y mil gracias por leerme. Soy Simón Sánchez y esta vez te voy a contar sobre HAL, Summit y las canciones de los agujeros negros

La idea de ondas gravitacionales ondulando a través de la estructura del espacio-tiempo se había propuesto durante casi un siglo antes de que las ondas sin luz de una colisión entre dos agujeros negros aparecieran finalmente en los detectores del Observatorio de ondas gravitacionales del interferómetro láser (LIGO) en 2015. Desde entonces, la comunidad de la astrofísica ha buscado identificar más ondas gravitacionales, comprenderlas mejor y utilizar los datos resultantes para hacer inferencias sobre otros elementos del universo. Ahora, un equipo del Centro Nacional de Aplicaciones de Supercomputación (NCSA) está utilizando supercomputadoras para entrenar redes neuronales para comprender las ondas gravitacionales a una fracción del costo computacional.

En NCSA, el Dr. Eliu Huerta dirige el Grupo Gravity y el Centro de Innovación en Inteligencia Artificial. Huerta y sus colegas han pasado los últimos años utilizando técnicas innovadoras para procesar la enorme cantidad de datos producidos por cada una de las más de cincuenta observaciones de ondas gravitacionales de LIGO desde 2015.

Las canciones de los agujeros negros

«Exploramos el uso de la IA para estudiar los ruidos de los agujeros negros», dijo Huerta en una entrevista con Calendae. “Puedes pensar en ellos como canciones o música muy contaminadas por el ruido. La pregunta que tenemos ahora es: … ¿qué podemos aprender de estas señales? Una de las cosas importantes es de dónde vienen: ¿se originaron a partir de la explosión de una estrella … o estos agujeros negros se forman por fusiones con otros agujeros negros? Y una forma de entender esto es medir la velocidad a la que giran «.

Visualización científica de la colisión de dos agujeros negros, simulada numéricamente por código abierto, relatividad numérica, software comunitario, Einstein Toolkit. Video cortesía de Roland Haas y Eliu Huerta.

«Este es un desafío computacional para estudiar este parámetro», continuó. «Necesitas … muchas formas de onda para describir diferentes escenarios, como» los dos agujeros negros tienen la misma masa «,» uno es más pesado que el otro «,» uno gira más rápido que el otro » , etc. Por lo tanto, se necesitan muchas señales modales diferentes para estudiar este tipo de escenario. Ahora, usando enfoques tradicionales, esto es muy desafiante computacionalmente. Entonces comenzamos un programa en NCSA donde combinamos IA y computación de alto para un tipo de análisis acelerado «.

Desde 2017, el equipo de Huerta ha sugerido que las redes neuronales eran ideales para reconstruir ondas gravitacionales debido a su escalabilidad y espacio de parámetros de alta dimensión. Con el advenimiento de la computación acelerada por GPU, dijo Huerta, «fue una gran oportunidad para demostrar que nuestras afirmaciones eran ciertas».

Pruebe los límites de la escalabilidad

Con el objetivo de entrenar una red neuronal para determinar las propiedades de la fusión de agujeros negros, el equipo comenzó su trabajo en HAL, un clúster NCSA interno con 16 nodos IBM, cada uno equipado con dos CPU IBM Power9, 256 GB de memoria. y cuatro GPU Nvidia V100. Huerta estima que el equipo dedicó «miles» de horas de nodo en HAL, eventualmente escalando su implementación a las 64 GPU en el clúster y entrenando el modelo en el transcurso de 12 horas.

La supercomputadora Summit.

Luego, el equipo dio un paso más: a Summit, la supercomputadora más poderosa de los 4.608 nodos IBM de la Cumbre de EE. UU., Cada uno con dos CPU IBM Power9 y seis GPU Nvidia Volta, que proporciona 148.6 petaflop Linpack de potencia informática. . Al recibir aproximadamente 10,000 horas de nodo de tiempo Summit a través de la asignación discrecional de un director del Laboratorio Nacional de Oak Ridge (ORNL), el equipo comenzó a expandir su trabajo en la enorme supercomputadora, primero a 128 nodos, luego a 256 nodos.

“Usando más de 1.500 GPU, terminamos de entrenar estas redes neuronales en aproximadamente una hora”, dijo Huerta. “¿Por qué es emocionante, podrías pensar? Número uno: mostramos que podemos utilizar de forma eficaz sistemas personalizados a gran escala para la investigación de la IA «. Además, explicó,» los modelos que proponemos ya no son modelos ingenuos en los que se propone una única arquitectura y, con suerte, lo mejor «. Ahora codificamos el conocimiento del dominio en la arquitectura de las redes neuronales y la forma en que las entrenamos, esto es realmente único. Y lo que es más, podemos limitar la velocidad de rotación de los dos agujeros negros de una manera que ningún otro algoritmo puede lograr en este momento «.

El equipo también demostró una gran escalabilidad hasta 1.024 nodos, lo que, en Summit, equivale a más de 6.000 GPU. Huerta comparó los flujos de trabajo: entrenar una red neuronal en solo una hora en Summit, luego procesar miles de señales por segundo usando el modelo entrenado, versus procesar «solo un puñado» de señales por segundo con algoritmos existentes.

“Tuvimos éxito porque nuestros colegas de Oak Ridge, que colaboran con expertos de IBM y Nvidia, estuvieron dispuestos a ayudarnos a configurar todo en la máquina”, dijo Huerta.

El equipo de ORNL también reconoció la idoneidad de Summit para el trabajo de Huerta. «Las capacidades de liderazgo y la arquitectura compatible con IA de Summit fueron ideales para permitir que el equipo creciera y acelerara la exploración», dijo Arjun Shankar, líder del Grupo de flujo de trabajo y datos avanzados en Oak Ridge. Instalación de Computación de Liderazgo (OLCF), en un entrevista con Katie Bethea de ORNL.

Que sigue

Aunque todas las 10,000 horas de nodo del equipo en Summit se han agotado, Huerta espera volver al automóvil pronto. «El siguiente paso es volver a jugar a este juego», dijo, «pero ahora incluyendo todas estas correcciones adicionales a la forma de onda». Estas formas de onda, explicó, eran demasiado exigentes desde el punto de vista computacional para ser incluidas en la ronda de entrenamiento inicial en Summit, pero si se agregan, aumentarán la dimensionalidad de la red neuronal. La red neuronal también se actualiza y mejora cada pocas horas con nuevas observaciones de LIGO, que se incorporan mediante el aprendizaje por transferencia sin necesidad de un reentrenamiento completo del modelo.

Puedes compartir en en tu Twitter y Facebook para que tus colegas lo flipen

??? ? ? ???

Comparte