China se une al Petaflop Club - Calendae | Informática, Electrónica, CMS, Ciberseguridad

China se une al Petaflop Club

Hola y mil gracias por leerme. Soy Simón Sánchez y esta vez te voy a hablar sobre China se une al Petaflop Club

China aparentemente se ha convertido en el tercer país en construir una supercomputadora petaflop. Agencia de noticias Xinhua informó El jueves, el país presentó «Tianhe», una máquina petaflop con un máximo de 1.206 impulsada por una combinación de 6.144 CPU Intel y 5.120 GPU AMD. Sorprendentemente, el precio fue de solo 88,24 millones de dólares. El sistema está instalado en la Universidad Nacional de Tecnología de Defensa (NUDT) en Changsha, capital de la provincia central china de Hunan.

En el sentido de TOP500, Tianhe no se consideraría un verdadero sistema petaflop. Según informes Online, la máquina solo alcanza (!) 563,1 teraflops con Linpack. Si ese número se mantiene, es casi seguro que Tianhe le otorgue un lugar en el top 10 de la próxima lista TOP500. Hoy en día, solo hay tres sistemas que rompen la barrera de los 500 teraflop en Linpack: Roadrunner en el Laboratorio Nacional de Los Alamos, Jaguar en el Laboratorio Nacional de Oak Ridge y JUGENE en el Centro de Supercomputación Jülich. El primer sistema chino en la lista actual es la supercomputadora «Magic Cube» de Dawning, ubicada en el Centro de Supercomputación de Shanghai. Con una calificación Linpack de 180,6 teraflops, la máquina Dawning se ubica en el puesto 15.

En una fecha futura, se espera que NUDT agregue «cientos o miles de CPU de fabricación china a la máquina y mejore su rendimiento Linpack a más de 800 teraflops», según Zhou Xingming, académico de la Academia de Ciencias de China y profesor de NUDT.

El artículo de Xinhua, así como otros informes iniciales de fuentes chinas, no proporcionan muchos detalles sobre la arquitectura del sistema. Específicamente, no se proporcionó información sobre el tipo de CPU Intel y las piezas de la GPU AMD utilizadas, ni sobre las CPU de fabricación china que se conectarán más adelante. En el momento de la publicación, no se pudo contactar a NUDT para obtener más aclaraciones sobre la composición de Tianhe, y AMD se negó a ofrecer más detalles.

Si tuviera que especular, diría que los chips Intel son Nehalem EP y las partes AMD son FireStream 9270. Presumiblemente, la mayoría de los FLOPS provienen de GPU. De hecho, solo 5.000 9270 representarían 1,2 petaflops de doble precisión. Es probable que las futuras CPU chinas sean del Ahijado-3 variedad, que se espera que debuten en 2010. Tenga en cuenta que Godson-3 es una arquitectura MIPS, pero también tiene la capacidad de emular instrucciones x86.

Aparte de los detalles inexactos sobre la arquitectura, no se ha mencionado el conjunto de aplicaciones a las que se dirigirá la máquina. NUDT es administrado conjuntamente por el Ministerio de Defensa Nacional y el Ministerio de Educación, lo que le da una idea de sus áreas de interés. Según la universidad Sitio web, el instituto se dedica a las ciencias básicas, ingeniería, ciencias militares, administración, economía, filosofía, literatura, educación, derecho e historia.

Por impresionante que pueda parecer, la eficiencia Linpack bastante baja de Tianhe (Rmax / Rpeak) puede limitar su aplicabilidad. Linpack generalmente representa un punto de referencia nominal para el tipo de rendimiento que probablemente obtendrá de aplicaciones intensivas en matemáticas. La máquina NUDT ni siquiera podía alcanzar el 50% de eficiencia, solo 563 de 1206 teraflops posibles. La mayoría de los Supers tienen una eficiencia de Linpack por encima del 75 por ciento, incluso solo para los grupos básicos de GigE. El nuevo Earth Simulator de Japón cuenta con una cifra del 93,4%.

Sin duda, el problema está relacionado con la extracción de Linpack FLOPS de las GPU. Si bien podría pensar que estos procesadores gráficos de propósito general se destacarían en este tipo de matemáticas vectoriales, el rendimiento óptimo de Linpack también depende de un caché generoso. Las CPU modernas las tienen en abundancia, pero las GPU solo contienen cachés internos limitados. Esto significa que el chip gráfico tendría que acceder a la memoria GDDR integrada relativamente más lenta para actualizar sus datos o, peor aún, cruzar el bus PCIe para obtener más datos de la memoria de la CPU. El próximo procesador Fermi de NVIDIA será la primera GPU con una verdadera jerarquía de caché (sin mencionar un rendimiento de doble precisión mucho mejor), así que supongo que los resultados de Linpack en esta arquitectura deberían ser mucho más impresionantes.

Mientras tanto, Tianhe proporcionará un interesante banco de pruebas para una supercomputadora híbrida CPU-GPU, una arquitectura que probablemente se volverá más común en los próximos años. También indica la intención de China de convertirse en un actor importante en el campo de la supercomputación. Dadas las enormes reservas de efectivo del país y la voluntad del gobierno de invertir en alta tecnología, no hay mucho que pueda detenerlo.

Recuerda compartir en tu Facebook para que tus colegas lo consulten

??? ? ? ???

Comparte