El líder de Los Alamos comparte los avances y velocidades de "Trinity" - Calendae | Informática, Electrónica, CMS, Ciberseguridad

El líder de Los Alamos comparte los avances y velocidades de «Trinity»

Hola de nuevo. Te escribe Simón Sánchez y en esta ocasión te voy a hablar sobre El líder de Los Alamos comparte los avances y velocidades de «Trinity»

Hemos estado esperando las noticias sobre la supercomputadora Trinity durante algún tiempo y hoy nos sentimos honrados con la noticia de que Cray entregará la máquina en dos etapas y la etapa final se completará en 2016. Para el trasfondo original, la primera ejecución de la historia se puede encontrar aquí. .

Desde ese momento esta mañana, pudimos tener una discusión en profundidad con uno de los pensadores clave en el centro de adquisiciones, el líder de la división de HPC de Los Alamos National Labs, Gary Grider. Su trabajo fundamental sobre los búferes de ráfagas (un término que él acuñó) aparece en la otra mitad de la adquisición, el sistema NERSC «Cori», pero también fue fundamental para tomar decisiones en todo el sistema para la supercomputadora Trinity. NNSA de misión crítica, junto con una gran cantidad de asistencia de los socios del proyecto en Sandia.

Grider nos dijo que el equipo de Los Alamos ya está ocupado instalando la energía y el enfriamiento adicionales necesarios para preparar el espacio dentro del Complejo de Computación Estratégica existente en el laboratorio con 45,000 pies cuadrados de espacio para el nuevo sistema. Los aproximadamente 270 racks Cray XC de próxima generación no ocuparán todo el espacio, dice Grider, pero los 10,000 pies cuadrados que necesita estarán preparados con la infraestructura de enfriamiento de agua caliente necesaria para mantener frescos los nodos basados ​​en Haswell y Knights. Aterrizando, mientras se alimenta con agua reciclada que no está en los estantes en humedales protegidos, compensando así algunas de las preocupaciones sobre los 8-10 MW que probablemente consuma el nuevo súper. Sin embargo, en el panorama general, Los Alamos está pensando en el futuro: la instalación en sí se está preparando para manejar mucho más en términos de energía y enfriamiento con una capacidad de 30 MW a la vista.

Esta mañana no pudimos decir qué tan grande era el auto, pero comenzamos a juntar las cosas con cierta información disponible. Sabemos que la cantidad de núcleos Haswell de próxima generación caerá en algún lugar en el rango de 14-18 (posiblemente hasta 24; lo descubriremos en los próximos anuncios de Intel, probablemente este trimestre) y con chips Knights Landing adicionales, que serán memoria deportiva en la caja. y entre 60 y 72 núcleos, según los datos que tenemos disponibles. Finalmente, Grider confirmó que el sistema superará (con mucho) los objetivos de rendimiento originales en 30 petaflops, pero no está seguro de qué tan lejos superará el límite para el automóvil. Hay algunas matemáticas especulativas sobre esto … pero incluso si la mitad del auto es solo el Xeon … wow.

Como señalamos hoy, haremos los cálculos una vez que los últimos recuentos de núcleos Haswell y el rendimiento / térmicos esperados estén disponibles pronto, y lo agregaremos a lo que Intel quiera compartir más adelante este año sobre su rendimiento futuro. Parte de aterrizaje autohospedado de Knights.

Para aquellos que mantienen el puntaje de supercomputación (y Grider no es uno de ellos; no les importan los FLOPS, les importa obtener entre 6 y 8 veces el rendimiento de su máquina «Sky» del trabajo a casa) recuerden que esto pondría a la Supercomputadora 2015 NNSA de 2016 en torno al sistema n. 1 en el mundo durante 2 años consecutivos: el chino Tianhe-2. Esto no es poca cosa, pero Grider dice que no están planeando LINPACK a menos que los proveedores se lo pidan. Y si Cray pensaba que ese aumento en el precio de sus acciones era interesante hoy, tener noticias dos veces al año sobre otro súper top no vendría mal.

Las dos fases del proyecto significan que los primeros núcleos en tocar el piso serán los Haswell porque la estructura no puede esperar a que Knights ‘Landing entre en juego. Él dice que para el otro lado del abastecimiento en NERSC, han tenido más flexibilidad a la hora de esperar los chips porque tienen la capacidad suficiente para mantener las máquinas y los investigadores de la Oficina de Ciencia en funcionamiento. El problema con la NNSA, sin embargo, es que necesitan más potencia informática de inmediato. Completarán la instalación del primer conjunto de máquinas basadas en Haswell en el verano de 2015, pero el retraso solo está relacionado con las instalaciones. Necesitan asegurar su infraestructura de energía y enfriamiento antes de poder ingresar, dijo, y señaló que no se esperan demoras de Intel para el primer componente.

La configuración precisa de los nodos en la máquina Trinity no se ha revelado, pero parece que habrá nodos de cómputo con múltiples procesadores Haswell Xeon E5 v3 en ellos, así como nodos de cómputo que tienen múltiples procesadores Knights Landing Xeon Phi en ellos. Todos estos dispositivos se vincularán mediante la interconexión Aries XC en su topología de libélula.

No está claro exactamente cómo se conectarán los procesadores a la interconexión Aries, pero el chip Aries actual es un enrutador de 48 puertos que tiene cuatro carriles PCI-Express 3.0 conectados a cuatro nodos Xeon de dos sockets. El chip Aries también tiene tres grados diferentes de conectividad: el rango 1 va al backplane, el rango 2 es una red de cobre para conectar seis gabinetes XC juntos y el rango 3 es una red óptica que conecta varios pares de racks juntos. Cada nodo de servidor tiene cuatro servidores de dos sockets y Aries se interconectan en el diseño actual. Conceptualmente, podría poner Xeon E5s y Xeon Phis en el mismo factor de forma de servidor. Lo importante es que la interconexión de Aries permite que todos los nodos del sistema se comuniquen entre sí. El sistema tiene lo que Cray llama enrutamiento adaptativo, haciendo uso de múltiples rutas en la red para evitar la congestión, lo que implica que el sistema puede comenzar con procesadores Xeon y luego agregar chips Xeon Phi con relativa facilidad.

Una pequeña nota sobre la elección arquitectónica se remonta a una falta real de elección. Grider dice que ha estado siguiendo de cerca los esfuerzos de OpenPower, pero están impulsados ​​por una misión en la NNSA y necesitan la potencia y el ancho de banda ahora. La hoja de ruta de OpenPower, aunque presenta algunas características interesantes, era demasiado larga para considerarla.

Las GPU discretas no eran una opción por las mismas razones, dijo Grider, y señaló que “probablemente la hubiéramos considerado una opción si hubiera una GPU autohospedada de algún tipo o más ancho de banda que un bus PCI. Nuevamente, si observa el momento en que estábamos tomando estas decisiones y los chips estuvieron disponibles durante el período de tiempo, verá que realmente no hay nada más disponible en este momento. «

Si bien algunos ya cuestionan la elección arquitectónica por ser más conservadora de lo esperado, hay algunas cosas a tener en cuenta. A diferencia de los centros de ciencia abiertos (incluido NERSC), las solicitudes de solicitud tienen un alcance limitado. Grider dice que hay menos de una docena de códigos configurados para trabajar en el monstruo, pero estos han sido refinados y bendecidos a lo largo de muchos años. No bromeemos cuando se trata de nuestras instalaciones nucleares. Esto significa que reorganizar los códigos para que se ajusten a las cajas arquitectónicas no es práctico y, además, tienen un sentido muy definido de exactamente lo que necesitan. Las opciones de arquitectura, aunque muy conservadoras, fueron las únicas opciones.

Pero no es como si nada interesante estuviera sucediendo aquí. Por ejemplo, Grider, el creador del término búfer de ráfagas y las primeras investigaciones, dijo que buscarán el mayor rendimiento posible de su matriz flash, utilizando la tecnología de búfer de ráfagas por primera vez en una máquina a gran escala en 2015 para ver cómo se suma a sus objetivos de utilización y confiabilidad del 90%. Y desde el punto de vista de la memoria, no hay nada que estornudar: con 2-3 petabytes de memoria principal, ese equipo flash de 7 petabytes para admitir la ráfaga de búfer y 82 petabytes de disco, es bastante potente en general, e incluso conservador para un búfer de ráfagas hasta que vean exactamente cómo funciona el almacenamiento por niveles de Cray en acción.

“El búfer de ráfagas podría estar entre 5 y 7 TB / seg y el sistema de disco es de 1-2 TB / seg. Los modelos muestran que es posible mantener el objetivo del 90% con un ancho de banda de disco más bajo, aproximadamente 10 veces menos que el búfer de ráfagas BW en lugar del 4-5x en esta máquina. Esta fue una elección deliberada debido a la inmadurez espacial de la solución de explosión tampón. Esta es la primera solución de búfer de ráfagas implementada y también es una implementación a gran escala, por lo que hay motivos para ser un poco cautelosos. Si hubiéramos tenido plena confianza en las soluciones de búfer de ráfagas a esta escala, podríamos haber ahorrado dinero comprando menos BW de disco. Las máquinas del futuro pueden ser más agresivas en esta área ”, dijo Grider.

Pero existen riesgos, incluso con una arquitectura conservadora. Cuando se le preguntó qué le importa más la implementación y el uso tempranos, Grider dijo que existe la preocupación de que la arquitectura se desvíe del enfoque heterogéneo en el que tenían una máquina completa potente y un procesador potente (como con el AMD de Roadrunner) donde se conectó la red.

“Dado que Knights Landing es una arquitectura tan plana, donde es solo un grupo de procesadores de tamaño equivalente que son más pequeños y débiles, mientras que los procesos calientes quieren un procesador más fuerte, tendremos que pensar”, dijo. En el próximo mes, Grider agregó que atraerán más soporte a largo plazo de Intel y pondrán sus códigos en las primeras máquinas Knights Landing para abordar estas preocupaciones.

Nuestras felicitaciones a Cray y la NNSA – esta será una gran historia para ver desarrollarse….

Recuerda compartir en tus redes sociales para que tus colegas lo disfruten

??? ? ? ???

Comparte