Dell construirá una supercomputadora de 10 petaflop para la ciencia

Hola, ¿qué tal colega?. En el teclado Simón Sánchez y en el día de hoy te voy a contar sobre Dell construirá una supercomputadora de 10 petaflop para la ciencia

El Centro de Computación Avanzada de Texas (TACC) tiene revelado planea implementar una supercomputadora de petaescala de última generación a través de un premio NSF de 27,5 millones de dólares. Construido por Dell, el sistema constará de 2 petaflops de procesadores Sandy Bridge-EP con un impulso de 8 petaflops de los coprocesadores Many Integrated Core (MIC) de Intel. Se espera que la máquina se ponga en marcha a finales de 2012 y esté lista para la producción en enero de 2013.

Este no solo es el primer sistema petascale de Dell, al menos el primero anunciado públicamente, sino que probablemente será el primero en implementar la tecnología MIC comercial de Intel. En este caso, los chips en cuestión son versiones de preproducción de Knights Corner, la primera parte comercial de esa línea de productos. Estos primeros chips serán idénticos a las piezas de producción futuras.

Stampede, como se llamará el sistema, está destinado a servir tanto a las aplicaciones HPC tradicionales que procesan números como a las aplicaciones de análisis basadas en datos dentro de la comunidad de usuarios eXtreme Digital (XD) de NSF. XD incluye el proyecto Extreme Science and Engineering Discovery Environment (XSEDE), el sucesor de TeraGrid que incluye más de una docena de universidades y dos laboratorios de investigación. Con 10 teraflops, Stampede será el recurso más poderoso para los usuarios de XD.

Según Jay Boisseau, director de proyectos Stampede de TACC y PI, se espera que el sistema tenga varios cientos de proyectos en ejecución desde el primer día. «Queremos involucrar a los usuarios con grandes conjuntos de datos que realizan análisis a gran escala, así como tipos de simulaciones de usuarios», dijo a Calendae.

Las aplicaciones científicas intensivas en datos incluyen las tradicionales como la bioinformática, pero también los códigos de las geociencias y la astronomía, dominios de aplicación que ya están acumulando grandes cantidades de datos digitales. Boisseau cree que casi la mitad de los recursos de Stampede se dedicarán a este tipo de aplicaciones.

El soporte intensivo en datos traerá un nuevo grupo de usuarios, muchos de los cuales no tienen tanta experiencia con HPC como la gente de simulación tradicional. Para ello, Boisseau planea desarrollar un entorno de software mucho más rico para este grupo, incluidos nuevos portales y puertas de enlace de aplicaciones, como se inició como parte del proyecto TeraGrid. Además, buscarán involucrar a expertos en estadística, minería de datos, gestión de datos, etc., para respaldar el dominio de la aplicación basada en datos.

Algunas de las habilidades y recursos de software ya están integrados en el proyecto a través de colaboraciones universitarias. Además de la Universidad de Texas en Austin, las escuelas asociadas incluyen la Universidad de Clemson, la Universidad de Colorado en Boulder, la Universidad de Cornell, la Universidad de Indiana, la Universidad Estatal de Ohio y la Universidad de Texas en El Paso.

Desde una perspectiva de hardware, la base de Stampede es un clúster de 2 petaflop con 6,400 nodos de cómputo x86, enlazados con InfiniBand FDR (56 Gbps) de Mellanox. Cada nodo albergará dos Intel Xeon E5 de 8 núcleos (también conocido como Sandy Bridge-EP) y 32 GB de DRAM.

Stampede también incluirá 16 grandes nodos de memoria, cada uno con 1 terabyte de DRAM y 2 GPU NVIDIA. Desde la perspectiva de la memoria, no está exactamente en el territorio SGI Altix UV, pero es una capacidad respetable para grandes aplicaciones SMP. Boisseau dice que también están considerando la solución SMP virtual de ScaleMP para construir un entorno de memoria compartida en 16 TB. El subgrupo de memoria compartida está destinado a ser utilizado para algunas de las aplicaciones de análisis de big data que alojará Stampede.

El clúster también se conectará a los nodos de almacenamiento Lustre, también suministrados por Dell. Consistirá en 14 PB de disco y proporcionará un ancho de banda agregado de 150 GB / segundo. “Durante la vida del proyecto, esperamos que crezca sustancialmente tanto en capacidad como en ancho de banda durante la vida del sistema”, dijo Boisseau.

El sistema Dell fue desarrollado por su división de soluciones para centros de datos, con nombre en código Zeus. Aunque la tecnología debutará en Stampede, la compañía planea hacer que el producto Zeus esté disponible para la supercomputación «hiperescala» en 2012.

El clúster central y los nodos de almacenamiento de Stampede representan la mayor parte de los fondos de NSF con $ 25 millones. Los $ 2.5 millones restantes se destinarán a 8 petaflops de coprocesadores MIC, que se conectarán a nodos x86 a través de enlaces PCIe 3.0. MIC es la arquitectura HPC de muchos núcleos basada en x86 de Intel dirigida a un código altamente paralelo y compite de frente con Tesla de NVIDIA y GPUS Firestream de AMD.

Sin embargo, los entusiastas de GPGPU no fueron completamente ignorados. Además de las GPU en los nodos de memoria compartida, 128 de los 6,400 nodos regulares estarán equipados con las GPU Kepler de próxima generación de NVIDIA para admitir la visualización remota. Kepler es el sucesor de Fermi, la actual arquitectura de GPU de NVIDIA. Se espera que las implementaciones de Tesla de Kepler destinadas a servidores HPC comiencen a distribuirse en 2012.

Intel no ha anunciado una fecha de lanzamiento oficial para el producto Knights Corner MIC, pero generalmente debería estar disponible en 2013, o quizás a finales de 2012 si la tecnología de proceso de 22 nm de Intel se desarrolla más rápidamente. El recuento real de MIC en Stampede no es público, pero Intel les ha prometido lo suficiente para ofrecer 8 petaflops máximos.

Usando algunas matemáticas rápidas, cada chip MIC probablemente necesitará entregar al menos 1.3-1.5 teraflops de doble precisión para alcanzar el objetivo de 8 petaflops. Casualmente, también se espera que la GPU Kepler de NVIDIA entregue de 1,3 a 1,5 teraflops con doble precisión. Tenga en cuenta que las primeras piezas MIC se implementarán con tecnología Intel Tri-Gate 22nm, mientras que las GPU Kepler se fabricarán con tecnología estándar de 28nm.

En este punto, Boisseau espera recibir todos los coprocesadores Intel MIC este otoño, quizás a tiempo para una ejecución de Linpack en el TOP500 de noviembre. En ese momento, todos los nodos de cómputo de Sandy Bridge deberían estar completamente implementados. Si todo va según lo planeado, los usuarios de acceso temprano deberían poder comenzar a ejecutar códigos en la máquina para diciembre de 2012.

Aunque MIC admitirá varios modelos de computación en paralelo, el más simple es OpenMP. Esto será especialmente beneficioso para los usuarios con códigos híbridos MPI-OpenMP. La idea sería descargar los bloques OpenMP a los coprocesadores para paralelizar esos bucles. Los usuarios con códigos MPI directos deberán trabajar más para aprovechar la aceleración MIC.

Ya hay una versión actualizada de Stampede en el tablero de dibujo. Aproximadamente dos años después de iniciado el proyecto, TACC planea implementar coprocesadores MIC de segunda generación, con otro lote (más pequeño) de chips. El objetivo es agregar otros 5 petaflops al sistema, llevando el total general a 15 petaflops a mediados de la década.

NSF financiará Stampede durante al menos cuatro años. Además del desembolso inicial de 27,5 millones de dólares para construir e instalar el sistema, se esperan pronto 24 millones de dólares adicionales para la operación y soporte del sistema, lo que eleva la inversión total de Stampede a más de 50. Millones de dolares. El proyecto también incluye una opción de renovación en 2017, que implicaría la implementación de una máquina aún más grande y potente hacia finales de la década.

No te olvides compartir en en tu Twitter y Facebook para que tus amigos opinen

??? ? ? ???

Comparte