Los problemas de Aurora mueven a Frontier a la posición Pole Exascale - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Los problemas de Aurora mueven a Frontier a la posición Pole Exascale

Hola, ¿qué tal colega?. Soy Simón Sánchez y esta vez te voy a contar sobre Los problemas de Aurora mueven a Frontier a la posición Pole Exascale

El retraso del nodo de 7 nm de Intel generó dudas sobre el estado de la supercomputadora Aurora que se instalaría en el Laboratorio Nacional Argonne el próximo año. Aurora estaba en la carrera para ser la primera supercomputadora de exaescala en los Estados Unidos, aunque estaba en una línea de tiempo contemporánea con la supercomputadora Frontier de Oak Ridge National Lab (con ambos sistemas programados para su entrega en 2021).

Con un año de retraso del nodo Intel de 7 nm que es una parte integral del motor de GPU de Aurora (el Ponte Vecchio basado en Intel Xe), ¿contrataría Intel una fundición externa para fabricar la GPU dura? ¿Y cuál sería el impacto en las velocidades, los avances y los tiempos de entrega de Aurora?

Aún no tenemos todas esas respuestas, pero hemos recibido una extensa confirmación de la terminación de la Oficina de Ciencias del DOE.

Hay indicios de que Aurora se retrasará, pero Frontier en el Laboratorio Nacional de Oak Ridge está en camino, así como el Proyecto de Computación Exascale, dijo Barb Helland, directora asociada de la Oficina de Ciencias para la Investigación de Computación Científica Avanzada (ASCR). durante una Reunión Avanzada del Comité Asesor de Informática Científica (ASCAC), celebrada la semana pasada (24-25 de septiembre).

Diseño de nodo Aurora, presentado en SC19 por Raja Koduri de Intel

«No es inesperado que cuando contratemos las supercomputadoras más avanzadas del mundo, entre cuatro y cinco años antes de su lanzamiento, habrá algunos retrasos en la programación», dijo Helland. «Por esta razón, incorporamos tanto los costos de planificación como las contingencias en los presupuestos de nuestros proyectos».

La Oficina de Ciencias del DOE no estaba lista para brindar más detalles en este momento, pero dijo que trabaja en estrecha colaboración con Intel.

“Sí, tenemos indicios de que el sistema Aurora sufrirá retrasos. Pero Argonne está trabajando actualmente con Intel para mitigar las consecuencias no solo para Argonne, sino también para el Exascale Computing Project y los usuarios de computación de alto rendimiento del país «.

Si bien pareció restar importancia al revés, Helland reiteró que la máquina Oak Ridge Frontier está en camino de ser entregada en el año calendario 2021 y que el proyecto ECP también está en camino de completarse a tiempo (para el cuarto trimestre del año fiscal 24 fuera).

«Estoy seguro de que seremos capaces de superar esto de una manera que resuelva el problema en beneficio del país y del programa», dijo Chris Fall, director de la Oficina de Ciencias. “Todavía estamos conversando y tratando de averiguar los detalles, pero me siento muy cómodo. Creo que llegaremos a donde tenemos que llegar en esto. «

Es razonable que los sistemas que superan los límites del alcance y la escala se encuentren con circunstancias imprevistas que afecten los hitos objetivo, pero Aurora ya se ha redefinido significativamente después de retrasos y cancelaciones anteriores en las hojas de ruta de Intel. Originalmente concebida como una supercomputadora de pre-exaescala que se admitirá en Argonne en 2018, Aurora se reformuló en 2017 como la primera máquina de exaescala del país con un objetivo para 2021.

Parece que la supercomputadora Frontier de Oak Ridge National Lab está ahora lista para ser el primer sistema de exaescala del país. El DOE está trabajando con Oak Ridge, HPE y AMD para respaldar la frontera de 1,5 exaflop (pico mínimo) a fines de 2021. El sistema El Capitan de Lawrence Livermore Lab (se espera que proporcione 2 picos exaflop con tecnología HPE y AMD) se espera para aproximadamente un año después (entrega a principios de 2023). La pregunta es, ¿dónde encajará Aurora en la línea de tiempo?

La supercomputación HPE Cray EX es la base de los tres sistemas de exaescala planificados. HPE es el contratista principal en Frontier y El Capitan, mientras que Intel es el principal en Aurora.

En una declaración proporcionada a Calendae, Intel dijo que «sigue comprometido a proporcionar la supercomputadora Aurora al Laboratorio Nacional Argonne y permitir el liderazgo a exaescala en el Departamento de Energía de Estados Unidos».

No te olvides compartir en una historia de tu Instagram para que tus colegas lo vean

??? ? ? ???

Comparte