Las GPU transformarán el Jaguar de ORNL en un Titan de 20 Petaflop

Hola, un placer verte por aquí. Yo soy Simón Sánchez y en esta ocasión te voy a contar sobre Las GPU transformarán el Jaguar de ORNL en un Titan de 20 Petaflop

Los días de Jaguar como una supercomputadora solo con CPU están contados. Durante el próximo año, la máquina 2.3 petaflop en el Laboratorio Nacional Oak Ridge (ORNL) del Departamento de Energía será actualizada por Cray con las nuevas GPU NVIDIA «Kepler», produciendo un sistema con aproximadamente 10 veces el rendimiento máximo de Jaguar. . La supercomputadora transformada pasará a llamarse Titán y se espera que produzca cerca de 20 picos de petaflop a finales de 2012.

El sistema actual de Jaguar, que ya se ha actualizado en numerosas ocasiones desde que se implementó por primera vez en 2009, ocupa actualmente el tercer lugar en la lista TOP500 con una lectura Linpack de 1,76 petaflops. Titan definitivamente mantendrá a la máquina en el top 5, incluso si las máquinas con docenas de petaflops comenzarán a abrirse camino en grandes laboratorios en los próximos años.

Titan también representará la entrada de Estados Unidos en las filas de la supercomputación acelerada por GPU de primer nivel. En la actualidad, tres de los cinco sistemas principales están acelerados por GPU: Tianhe-1A y Nebulae en China y TSUBAME 2.0 en Japón. La mejor máquina GPU actual en los EE. UU. Es Edge, un clúster Appro de 240 teraflop en el Laboratorio Nacional Lawrence Livermore. Rusia, Alemania e Italia también tienen sistemas más grandes.

Según Steve Scott, el nuevo director de tecnología de la Unidad de Negocios Tesla de NVIDIA, el hecho de que ORNL esté haciendo un compromiso tan significativo con la computación GPU es un gran apoyo para la arquitectura. No es ningún secreto que la HPC ahora está limitada por el consumo de energía. La ley de Moore logró reducir las geometrías de los transistores, pero la pared de energía se convirtió en el límite máximo para los aumentos de rendimiento. «Se trata de eficiencia energética», dijo Scott a Calendae, «por eso creemos que la historia de la GPU es tan convincente».

Aunque las GPU no son procesadores verdaderamente genéricos, su capacidad para realizar cálculos paralelos a los datos de una manera mucho más eficiente en términos de energía que las CPU las ha puesto en el centro de atención en el ámbito de la HPC. «Es difícil exagerar la importancia del cambio radical que se ha producido en la informática de alto rendimiento», señala Scott. «Este maravilloso viaje que hemos realizado durante los últimos 30 años, cada vez que reducimos a la mitad el tamaño del transistor, el voltaje cae, la potencia permanece igual y el rendimiento mejora exponencialmente, ha sido fantástico, pero se hizo».

Aunque EE. UU., En general, se ha retrasado un poco en la adopción de la tecnología GPU para HPC, la supercomputadora Titan ha estado en la mesa de dibujo en Oak Ridge durante al menos un par de años. Pero la tecnología necesaria para implementar esa máquina solo ahora cumple con estos requisitos.

A partir de este otoño, la mayoría de los 18.688 nudos XT5 actuales de Jaguar se actualizarán con las nuevas palas XK6 de Cray, que la compañía presentó en mayo. El resultado inmediato es que los nodos AMD Opteron de seis núcleos y dos sockets actuales serán reemplazados por un único nodo de CPU «Interlagos» de 16 núcleos y la interconexión se actualizará de SeaStar 2 a Gemini. Cada blade XK6 comprende cuatro nodos de cómputo, con un Opteron en cada uno y la capacidad de conectar cada una de estas CPU a una GPU Tesla en una tarjeta secundaria PCIe.

Inicialmente, 960 de esos nodos XK6 estarán equipados con GPU Tesla M2090 de clase Fermi, y los otros 17,000 restantes permanecerán como blades solo para CPU por ahora. Se espera que esta primera fase de Titán se complete a finales de año. Luego, en la segunda mitad de 2012, todos los 18,688 nudos, incluidas las palas originales equipadas con Fermi, se poblarán con el Tesla Kepler de próxima generación de NVIDIA.

NVIDIA no ha proporcionado especificaciones detalladas sobre las GPU de Kepler, pero según Scott, su rendimiento por vatio será más del doble que el de las piezas de Fermi, sin dejar de estar dentro de la misma envolvente de potencia. Dado que las tarjetas Fermi Tesla actuales (GPU más memoria) proporcionan 665 gigaflops, la nueva GPU Kepler debería producir al menos 1330 gigaflops.

Por ahora, Oak Ridge solo promete de 10 a 20 petaflops para el sistema final, aunque el rendimiento máximo podría aumentar drásticamente. Según Buddy Bland, director de proyectos en la Instalación de Computación de Liderazgo de ORNL, actualmente no tienen el dinero en la mano para actualizar todos los nodos de 18K. La escala real de la construcción de Titán dependerá del «presupuesto disponible».

Sin embargo, teóricamente, si todos los nodos existentes están poblados con las nuevas partes de Kepler, el sistema debería entregar al menos 24,8 petaflops de potencia de GPU. Un número igual de CPU de Interlagos debería contribuir con más de dos petaflops adicionales más allá de eso. Cuando todo el polvo se haya asentado, Titán podría estar a 30 petaflops de distancia.

También se desconoce la cantidad de energía que consumirá el nuevo sistema, pero ciertamente tendrá una mejor relación de rendimiento por vatio que el Jaguar, que absorbe casi 7 MW para sus 2.33 petaflops máximos. Por el contrario, el sistema japonés TSUBAME acelerado por Fermi utiliza solo 1,4 MW para sus 2,29 petaflops. Dado que la nueva máquina de ORNL utilizará las GPU Kepler más eficientes, su eficiencia debería ser significativamente mejor. «Vemos a Titán como el indicador principal de hacia dónde se dirigen las personas mientras intentan resolver los desafíos energéticos durante los próximos cinco a diez años», dice Scott.

Queda por ver cómo todos esos picos de fracaso se traducen en el rendimiento real de la aplicación. Extraer altos niveles de computación sostenida de estas máquinas de múltiples petaflop es notoriamente difícil, con solo un puñado de códigos capaces de lograr más de un petaflop de rendimiento. Agregar GPU a la mezcla hizo que todo fuera más difícil, al menos a corto plazo.

En este sentido, Oak Ridge, con uno de los laboratorios de computación más importantes del planeta, tiene muchas posibilidades de superar los límites. Utilizando grupos de GPU más pequeños, los científicos informáticos de ORNL y otros lugares han estado ocupados trayendo seis códigos científicos líderes a CUDA, incluido Wang-Landau / LSMS para ciencia de materiales; S3D para motores de combustión; PFLOTRAN para el secuestro subterráneo de C02 y para la contención subterránea de contaminantes; Denovo por el código de transporte de radiación en ingeniería nuclear; CAM-SE para la modelización del cambio climático; y LAMMPS, un código de simulación de dinámica molecular. Scott dice que ORNL, Cray y NVIDIA han trabajado juntos para adaptar estos códigos científicos para la computación heterogénea, de modo que estén listos cuando comience Titan.

Se espera que esta primera fase de Titan genere más de $ 60 millones en ingresos para Cray, que podrían terminar en manos de la empresa antes de fin de año. Durante la vigencia del contrato, Cray busca recaudar más de $ 97 millones, aunque si se ejercen las opciones de actualización, ese número podría aumentar drásticamente.

Puedes compartir en tu Facebook para que tus amigos lo consulten

??? ? ? ???

Comparte