La segunda venida de TSUBAME - Calendae | Informática, Electrónica, CMS, Ciberseguridad

La segunda venida de TSUBAME

Hola, un placer verte por aquí. Te habla Simón Sánchez y en esta ocasión te voy a hablar sobre La segunda venida de TSUBAME

Cuando la supercomputadora TSUBAME 2.0 se abra oficialmente en diciembre, será declarada oficialmente la supercomputadora más rápida de Japón. Sin embargo, no es solo la velocidad lo que separa a esta máquina; Con un rendimiento bruto de 2,4 petaflops, el nuevo TSUBAME supera la capacidad total de FLOPS de todas las demás supercomputadoras gubernamentales y académicas de Japón en la actualidad. Este tipo de fuerza computacional la convertirá en la plataforma preferida para algunas de las aplicaciones científicas más poderosas del planeta.

El otro reclamo de TSUBAME a la fama es que es parte de la vanguardia de una nueva generación de supercomputadoras basadas en GPGPU que se abren camino en las grandes instituciones de investigación de todo el mundo. China parece particularmente entusiasmada con la tecnología y ya ha instalado tres supercomputadoras equipadas con GPU: Nebulae (2,98 petaflops), Mole-8.5 (1,14 petaflops) y Tianhe-1 (0,56 petaflops). Francia, Australia y Estados Unidos también se están preparando para desplegar grandes clústeres acelerados por GPU durante los próximos 18 meses, y otros países sin duda seguirán su ejemplo.

Tokyo Tech, sin embargo, ha estado en el campo de GPGPU durante un par de años. Después de coquetear con los aceleradores ClearSpeed ​​con TSUBAME 1.0 en 2006, se dieron cuenta en 2008 de que las GPU estaban destinadas a convertirse en procesadores vectoriales modernos para HPC. Ese año, el instituto agregó 170 servidores NVIDIA Tesla S1070 (680 GPU) como parte de la actualización TSUBAME 1.2, que aumentó el rendimiento máximo de la máquina de 80 a 141 teraflops. Esta encarnación 1.2 también demostró ser la primera supercomputadora con tecnología GPGPU en ganar un lugar en la lista TOP500.

Estas máquinas TSUBAME de primera generación se construyeron con equipos de Sun Microsystems, basados ​​en servidores x4600 basados ​​en AMD Opteron. La segunda generación es un animal bastante diferente. La disolución de la hoja de ruta de HPC de Sun bajo el régimen de Oracle significó que Tokyo Tech tuvo que encontrar un proveedor de sistemas diferente para el futuro. Ese proveedor resultó ser HP (que, por cierto, también será el principal OEM para la supercomputadora Keeneland GPGPU financiada por NSF en los EE. UU.). HP, junto con NEC, co-diseñó el sistema de segunda generación, y NEC también proporcionó integración en el sitio y optimización de software.

Como se señaló en la cobertura de la semana pasada del nuevo equipo GPGPU de HP, TSUBAME 2.0 utilizará el servidor ProLiant SL390s G7 más reciente de la compañía para su infraestructura informática. Específicamente, los 2,4 petaflops de potencia informática se derivarán de 1.442 nodos informáticos: 1.408 de los cuales son los nuevos nodos G7 SL390, cada uno equipado con dos CPU Intel Westmere EP (6 núcleos, 2,93 GHz) y tres módulos NVIDIA M2050 «Fermi». El sistema también incluirá 34 nodos basados ​​en Nehalem EX conectados a 34 servidores Tesla S1070 Serie 10. La capacidad de memoria total para el sistema es 80,6 TB de DRAM, más 12,7 TB de memoria GDDR local en dispositivos GPU.

Cada nodo también estará equipado con 120 GB, 240 GB o 480 GB de almacenamiento en disco de estado sólido (SSD) local para un total de poco menos de 174 TB. El almacenamiento externo es proporcionado por más de 7 PB de equipos de DataDirect Networks, incluida una partición Lustre de 6 PB más otro petabyte de disco basado en NFS / iSCSI. Un sistema de cintas Sun SL8500 de 8 PB es el nivel final de la infraestructura de almacenamiento de TSUBAME.

Todo el clúster está entrelazado con QDR InfiniBand, en una arquitectura de árbol gordo de bisección completa. Voltaire suministra el equipo de red, incluidos conmutadores de 12 núcleos (Grid Director 4700) y 179 conmutadores de borde (Grid Director 4036). Los nodos G7 del SL390 usarán InfiniBand de doble riel, usando silicona Mellanox en la placa base y una tarjeta adaptadora para el segundo riel. Se instalaron media docena de conmutadores de 10 GbE, también suministrados por Voltaire, para conectar la máquina al sistema de cinta Sun.

En comparación con la supercomputadora Jaguar de Oak Ridge, que tiene esencialmente el mismo rendimiento máximo (2,3 petaflops), el TSUBAME 2.0 tiene solo una cuarta parte de su tamaño y utilizará aproximadamente una cuarta parte de la potencia. De hecho, el TSUBAME de 44 bastidores ocupa solo 200 metros cuadrados de espacio y consume solo un megavatio de energía, lo que ayuda a explicar por qué la computación GPU se ha vuelto tan popular en esta nación insular con recursos terrestres y energéticos limitados.

En la reciente Conferencia de Tecnología de GPU de NVIDIA, el profesor Satoshi Matsuoka, quien lidera el esfuerzo de TSUBAME, informó que el sistema se instaló durante el verano y ahora está en funcionamiento. Actualmente se está sometiendo a pruebas de resistencia, que incluyen la evaluación comparativa de Linpack. Matsuoka dijo que esperan obtener entre 1.2 y 1.4 petaflops en Linpack, lo que lo colocaría en el número 2 en la lista TOP500 de hoy, detrás del puntaje de 1.7 petaflops de Jaguar.

Sin embargo, donde Matsuoka espera que el sistema brille realmente son las aplicaciones del mundo real en el pronóstico del tiempo y el clima, modelado biomolecular, simulaciones de tsunamis, códigos CFD y una serie de otros códigos científicos. Los usuarios de Tokyo Tech TSUBAME ya han estado desarrollando software CUDA durante un par de años en el sistema de la generación anterior. En unas pocas semanas, el primer lote de códigos CUDA de segunda generación se reunirá con sus GPU de segunda generación y en una verdadera plataforma de petaescala.

Una de las aplicaciones más interesantes es ASUCA, un código de pronóstico del tiempo japonés similar al modelo de Investigación y Pronóstico del Tiempo (WRF) con sede en EE. UU. Desarrollado por NCAR y otros. ASUCA, sin embargo, se ha portado en su totalidad a GPU y se espera que alcance los 150 teraflops en el nuevo TSUBAME. Para dar un poco de perspectiva, el récord actual de rendimiento del pronóstico del tiempo es de alrededor de 50 teraflops con WRF ejecutándose en el Jaguar de ORNL. El ASUCA acelerado por GPU representa una mejora de 80 veces con respecto a una implementación de solo CPU.

Según Matsuoka, aunque la apertura oficial de TSUBAME 2.0 es en diciembre, el sistema estará disponible para los usuarios a principios de noviembre. Esto incluye a más de 2.000 investigadores del mundo académico, el gobierno y la industria, incluidos algunos fuera de Japón. Y hasta que la supercomputadora japonesa «K» de 10 petaflop esté operativa en 2012, TSUBAME será la máquina número uno del país. Además de eso, un TSUBAME 3.0 de 30 petaflop ya está en la mesa de dibujo y se espera que se lance en 2014 o 2015.

Mientras tanto, Tokyo Tech está a punto de convertirse en un semillero de procesamiento de GPU a petaescala para la comunidad científica abierta. Matsuoka ha sido un firme defensor de la tecnología y ha logrado atraer a una vibrante comunidad de desarrolladores de software a la misión TSUBAME. Si bien Tokyo Tech no puede competir en términos de presupuesto y tamaño de las instalaciones con los institutos de investigación más talentosos del mundo, lo compensó con su entusiasmo y claridad de propósito.

Puedes compartir en tus redes sociales para que tus amigos lo consulten

??? ? ? ???

Comparte