Los procesadores Petascale - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Los procesadores Petascale

Hola, un placer verte por aquí. En el teclado Simón Sánchez y en el día de hoy te voy a hablar sobre Los procesadores Petascale

Mientras que las supercomputadoras digeridas debaten cómo se verá una máquina a exaescala al final de esta década, la historia reciente sugiere que habrá una diversidad de diseño saludable, al menos en lo que respecta a la arquitectura del procesador. A partir de esta semana, se han implementado 20 sistemas de petaescala conocidos, que colectivamente incluyen cinco variedades diferentes de microprocesadores. Y ese nivel de diversidad no muestra signos de reversión.

De las 20 supercomputadoras petascale actualmente en funcionamiento, ocho utilizan exclusivamente CPU x86 (AMD Opterons o Intel Xeons); siete usan una combinación x86 / GPU; dos se basan en las CPU SPARC64 de Fujitsu; se utiliza el procesador chino ShenWei SW1600; uno funciona con la CPU PowerPC 450 de IBM, y el sistema final utiliza PowerXCell 8i junto con CPU AMD x86.

A continuación se muestran los sistemas actuales que han logrado al menos un petaflop de rendimiento máximo. No todos están en la última lista TOP500, ya que algunos de ellos se han instalado o actualizado desde que se actualizaron las clasificaciones en noviembre de 2011.

Sistema Nación Procesador Interconexión Petaflops
K Computadora Japón Fujitsu SPARC64 tofu 11.28
Tianhe-1A China GPU Intel x86 / NVIDIA Galaxia 4,70
Nebulosas China GPU Intel x86 / NVIDIA InfiniBand 2,98
Jaguar NOSOTROS AMD x86 Geminis 2,33
TSUBAME 2 Japón GPU Intel x86 / NVIDIA InfiniBand 2,29
CURIE Francia GPU Intel x86 / NVIDIA InfiniBand 2,00
Helios Japón Intel x86 InfiniBand 1,50
Correcaminos NOSOTROS AMD x86 / PowerXCell InfiniBand 1,37
Lomonosov Rusia GPU Intel x86 / NVIDIA InfiniBand 1,37
Cielo NOSOTROS AMD x86 Geminis 1,36
Tianhe-1A Hunan China GPU Intel x86 / NVIDIA Galaxia 1,34
Pléyades NOSOTROS Intel x86 InfiniBand 1,32
Tolva NOSOTROS AMD x86 Geminis 1,29
Tera-100 Francia Intel x86 InfiniBand 1,25
Kraken NOSOTROS AMD x86 Estrella de mar 1,17
Oakleaf-FX Japón Fujitsu SPARC64 tofu 1,13
Luz azul Sunway China China ShenWei SW1600 InfiniBand 1.07
ERMITAÑO Alemania AMD x86 Geminis 1.04
Mole 8.5 China GPU Intel x86 / NVIDIA InfiniBand 1.01
JUGENE Alemania PowerPC 450 Personalizado 1,00

Como puede ver, más de un tercio de los superpetascales actuales se basan únicamente en CPU x86, AMD Opterons o Intel Xeons. Pero los sistemas combinados x86 / GPU son casi tan numerosos. De hecho, dado que el sistema Jaguar exclusivo de Opteron en Oak Ridge National Lab ahora se está transformando en la máquina Titan x86 / GPU, esta disposición híbrida se está convirtiendo en la configuración más popular. Cabe señalar que la mitad de las máquinas petaflop x86 / GPU se distribuyen actualmente en China.

Las CPU x86 más rápidas (en este caso, las Sandy Bridge Xeons de gama alta de 8 núcleos) pueden ofrecer alrededor de 160 gigaflops, consumiendo de 130 a 135 vatios. Por otro lado, la pieza Tesla de gama alta de NVIDIA (la M2090) puede alcanzar 665 gigaflops, consumiendo 225 vatios. Si bien es más difícil de programar que las CPU, el mayor rendimiento y el rendimiento / vatios de las GPU están impulsando la rápida adopción de estos procesadores gráficos en la informática de alto rendimiento.

El nuevo sistema petascale es Oakleaf-FX, una supercomputadora Fujitsu basada en sus servidores PRIMEHPC FX10. Ese coche se completó la semana pasada para la Universidad de Tokio. La Universidad de Kyushu también ordenó un sistema con servidores PRIMEHPC FX10, aunque en este caso es una máquina de subpetaescala (691 teraflops) y obtiene tres cuartas partes de sus flops de los nodos PRIMERGY CX400 adyacentes basados ​​en x86.

Oakleaf-FX es la primera supercomputadora instalada con las últimas CPU SPARC64 IXfx de Fujitsu. Su precursor, el SPARC64 VIIIfx, alimenta la computadora K-petaflop de más de 10 de RIKEN, que actualmente es el actual campeón TOP500. El SPARC64 VIIIfx es un chip de 8 núcleos y 2,00 GHz proporciona 128 gigaflops, mientras que el nuevo SPARC64 IXfx, a 1,85 GHz, contiene 16 núcleos y ofrece 236,5 gigaflops de pico. Fujitsu afirma que un clúster PRIMEHPC FX10 puede escalar hasta 23,2 petaflops, lo que daría como resultado un sistema con alrededor de 100.000 de estas CPU.

Los chips de la serie SPARC64 fx de Fujitsu se han diseñado específicamente con HPC en mente, algo que tienen en común con el procesador chino ShenWei SW1600 desarrollado en el Jiangnán Computing Research Lab. Al igual que el SPARC64 IXfx, el SW1600 es un procesador RISC de 16 bits. core, aunque funciona un poco más lento que su contraparte japonesa. A 1 GHz, el chip chino ofrece alrededor de 140 gigaflops.

El único sistema implementado actualmente con silicio SW1600 (que conocemos) es Sunway Blue Light, una máquina de un petaflop ubicada en el Centro Nacional de Supercomputación de Jinan. Anunciada en octubre de 2011, la máquina Sunway representa la primera supercomputadora china construida con procesadores de diseño interno.

Actualmente solo hay una supercomputadora Blue Gene de petaescala en el campo, JUGENE, un sistema Blue Gene / P de una petaflop en Forschungszentrum Jülich que funciona con más de 73,000 CPU PowerPC 450. La arquitectura PowerPC, que tiene sus raíces en el espacio de computación embebida, es fue elegido principalmente por su rendimiento de eficiencia energética. A 850 MHz, el chip ofrece unos modestos 13,6 gigaflops, pero solo consume alrededor de 25 vatios de potencia.

El extraño es el PowerXCell 8i, una variante del procesador IBM Cell diseñado para el servicio HPC. El PowerXCell 8i debutó en el primer sistema petaflop del mundo, Roadrunner, que comenzó en 2008. Ese sistema usaba el procesador como acelerador junto con las CPU AMD Opteron, utilizando el servidor blade QS22 de IBM. Cada PowerXCell 8i consta de un elemento de procesamiento de energía y ocho elementos de procesamiento sinérgico (SPE) que juntos proporcionan 102,4 gigaflops, una cantidad enorme para un procesador de la era de 2008.

Desafortunadamente para IBM, GPU Computing estaba entrando en escena justo cuando el PowerXCell 8i estaba debutando. Gracias a un esfuerzo concertado de NVIDIA para construir aceleradores de GPU para HPC, sin mencionar un modelo comercial más favorable para procesadores gráficos, IBM decidió deshacerse de cualquier seguimiento de PowerXCell 8i (en un momento se rumoreaba que IBM tenía una PowerXCell de 32 SPE en la mesa de dibujo). Roadrunner sería la primera y última supercomputadora basada en un procesador Cell.

Si bien el diseño de PowerXCell ha muerto prematuramente, hay algunos procesadores nuevos en el horizonte que tomarán su lugar. El más conocido es el chip Many Integrated Core (MIC) de Intel, una arquitectura de muchos núcleos x86 basada en el prototipo «Larrabee». Se espera que la primera implementación, conocida como Knights Corner, proporcione más de un teraflop de rendimiento de punto flotante de doble precisión cuando se introduzca a finales de 2012 o principios de 2013.

La supercomputadora Stampede, que se instalará en el Centro de Computación Avanzada de Texas (TACC) a finales de este año, utilizará piezas de Knights Corner y Xeon como base para el cálculo. Se espera que ese sistema alcance los 10 petaflops principales cuando entre oficialmente en producción a principios de 2013.

Dos supercomputadoras Blue Gene / Q multi-petaflop, impulsadas por las nuevas CPU Power A2, se pondrán en funcionamiento a finales de año. Sequoia, una supercomputadora de 20 petaflop, se instalará en el Laboratorio Nacional Lawrence Livermore, y Mira, una máquina de 10 petaflop se instalará en Argonne. Se espera que ambos entren en producción a finales de año. El Laboratorio Daresbury del Reino Unido también está Online para un sistema Blue Gene / Q petaflop-plus, aunque no se ha fijado la fecha de implementación.

Un derivado de la arquitectura PowerPC que estaba detrás de los ASIC Blue Gene / L y Blue Gene / P, el Power A2 es un chip mucho más potente. En lugar de los escasos 4 núcleos del PowerPC 450, el nuevo silicio alberga 18 núcleos: 16 para la aplicación, 1 para el sistema operativo y uno de repuesto. E incluso a unos modestos 55 vatios (1,5 GHz), el Power A2 ofrece 204,8 gigaflops. Gracias a la excelente eficiencia energética del chip, los sistemas Blue Gene / Q son actualmente los sistemas número 1 y 2 en la última lista Green500, aunque ambos son máquinas subpetaflop.

Otras supercomputadoras de petaescala que se espera que aparezcan en 2012 incluyen el ya mencionado Titan en Oak Ridge (10 a 20 petaflops), Blue Waters en NCSA (11.5 petaflops), el sistema SuperMUC en Leibniz Supercomputer Center (3 petaflops). Los dos primeros utilizarán la configuración híbrida x86 / GPU con CPU Opteron y las próximas GPU NVIDIA Kepler. SuperMUC es todo Xeon x86.

También se espera que el procesador Godson-3C diseñado en China aparezca en algunos sistemas de petascala, aunque no este año. Se dice que el chip de 16 núcleos ofrecerá 512 gigaflops y se espera que se lance en 2013. Según Weiwu Hu, diseñador principal del procesador Godson, los chips 3C se utilizarán para alimentar una supercomputadora petaescala construida por Dawning (ahora Sugon).

También está el procesador FeiTeng, desarrollado por la Universidad Nacional de Tecnología de Defensa de China. Si bien no se ha anunciado ningún sistema de petaescala basado en estos chips, ofrece a China otra opción para construir supercomputadoras nativas en el futuro.

Entonces, ¿qué significa esto para la exaescala? Si la historia se repite, los primeros sistemas de este tipo serán impulsados ​​por procesadores exóticos, pero eventualmente el silicio más básico se hará cargo. El consumo de energía es la mayor restricción para las grandes supercomputadoras ahora, por lo que es muy posible que veamos otras arquitecturas de procesadores como ARM en primer plano. Y con los chinos desarrollando su propio establo de procesadores HPC, todo el juego de la supercomputación podría cambiar antes de que termine la década.

Deberías compartir en tus redes sociales para que tus colegas lo vean

??? ? ? ???

Comparte