Intel traza su futuro multinúcleo y múltiple para HPC - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Intel traza su futuro multinúcleo y múltiple para HPC

Hola otra vez. Te habla Simón Sánchez y esta vez hablaremos sobre Intel traza su futuro multinúcleo y múltiple para HPC

Gran parte de la discusión en la Conferencia de Supercomputación de este año se dedicó a muchas arquitecturas centrales y computación a exaescala, dos temas que parecen ir de la mano. Pero a medida que la comunidad se apresura hacia el hito exaflop, ha quedado claro que la evolución natural de las CPU x86 multinúcleo no llevará a la industria muy lejos hacia ese objetivo. Muchas GPGPUs, por otro lado, parecen ser un camino viable para el procesamiento a exaescala. Entonces, ¿dónde se queda Intel sin GPU?

En pocas palabras, la respuesta de Intel a las GPGPU es su nueva arquitectura Many Integrated Core (MIC). MIC, que se presentó en la Conferencia Internacional de Supercomputación (ISC’10) este verano en Alemania, es la tecnología Larrabee reciclada que Intel desarrolló originalmente para los mercados de gráficos y pantallas de alta gama. Cuando quedó claro que el esfuerzo no produciría una alternativa competitiva a las GPU establecidas de NVIDIA y AMD, Intel abandonó el proyecto y reformuló la tecnología como un acelerador HPC.

Para obtener más información sobre la estrategia HPC de Intel, Calendae habló con Rajeeb Hazra, gerente general del grupo de Computación de alto rendimiento de Intel. Hazra, un veterano de 15 años en Intel, asumió el puesto de GM HPC de manos de Richard Dracott en julio de este año. Anteriormente, Hazra fue directora del grupo de Arquitectura y planificación de supercomputación (SAP), que se centra en el diseño de arquitecturas para las plataformas de gama alta, a saber, informática petaflop y exaflop.

Su experiencia en el grupo de supercomputación fue fortuita, ya que es probable que el mayor desafío de Intel en el mercado de servidores sea ofrecer productos para la élite de la informática de alto rendimiento. En la actualidad, Intel es el proveedor líder de procesadores para todas las plataformas HPC, desde las 10 mejores supercomputadoras hasta clústeres y clientes de alto rendimiento. El plan es seguir haciéndolo. «Nuestro objetivo es llevar las innovaciones que impulsan esencialmente todo el HPC, desde la supercomputación de muy alta gama hasta las estaciones de trabajo de gran volumen y el mercado de las computadoras de alto rendimiento», dijo Hazra a Calendae.

La arquitectura MIC de Intel es una parte importante de esto. Hazra dice que será la base del diseño de su procesador de muchos núcleos durante la próxima década y más allá. Pero primero tienen que alcanzar un objetivo en movimiento. El rápido aumento de las GPU de uso general a la computación de alto rendimiento en los últimos tres años le ha dado a NVIDIA y, en menor medida, a AMD una ventaja formidable.

En octubre, el superordenador más rápido del mundo, el Tianhe-1A, es un híbrido GPU-CPU. Esa máquina ofrece 2,5 petaflops en Linpack, y la gran mayoría de esos FLOPS los proporcionan las GPU. Hay un puñado de otras 100 supercomputadoras con tecnología GPU de primer nivel, y hay más en camino. Si Intel no tiene una alternativa viable al gigante GPGPU, sus chips quedarán relegados al papel de soporte del jugador en muchas supercomputadoras futuras, sin mencionar los clústeres tradicionales y las estaciones de trabajo de alto rendimiento.

Aunque MIC es una implementación x86 modificada y es una arquitectura completamente diferente de las GPGPU, su objetivo es resolver el mismo problema, es decir, obtener una gran cantidad de rendimiento de punto flotante en un paquete muy eficiente energéticamente. (Para una comparación detallada entre MIC y la GPU Fermi de última generación, consulte el análisis en profundidad de Michael Wolfe). También está diseñado para usarse de la misma manera que una GPU, es decir, como un acelerador de punto flotante conectado a un procesador x86 convencional. . El hilo común es que ambas arquitecturas usan un alto grado de paralelismo y núcleos simples para extraer mucho rendimiento por vatio.

Este es un atributo valioso para cualquier plataforma HPC, pero es fundamental para la próxima generación de supercomputadoras multi-petaflop. Hazra señala que el aumento en el rendimiento en las 100 principales supercomputadoras durante los últimos 10 años se ha logrado principalmente a través del modelo de escalamiento horizontal: la adición de más procesadores y más nodos. Las nuevas arquitecturas de CPU han cambiado ligeramente la pendiente de la curva de rendimiento por vatio, pero los sistemas generalmente se han vuelto más grandes, consumiendo así más energía.

No puede continuar por más de unos pocos años. No es práctico construir un sistema de 500 petaflop que consuma 300 megavatios. La sabiduría convencional sugiere que la energía se limitará a algo entre 20 y 40 megavatios para una sola máquina. Por lo tanto, no puede simplemente conducir la curva de rendimiento de Xeon u Opteron existentes y esperar ofrecer el rendimiento requerido para estos sistemas futuros. «Al observar los próximos cinco a diez años, estos sistemas tienen algunos puntos de inflexión fundamentales», admite Hazra.

Si bien Intel tiene la intención de proporcionar un rendimiento por vatio similar al de una GPGPU, lo hará en un marco x86. Hazra dice que esto permitirá que las aplicaciones pasen de un código de un solo subproceso a un código altamente paralelo sin cambiar el modelo subyacente. Intel proporcionará soporte de software de tiempo de ejecución y compilador para el producto, y si se convierte en un éxito comercial, sin duda otros proveedores agregarán sus productos también. Intel también proporcionará un conjunto común de herramientas de desarrollo para su uso entre los productos Xeon y MIC, de modo que las diferencias entre las dos arquitecturas queden encapsuladas en las herramientas. El objetivo es poder recompilar cualquier fuente x86 y hacer que escupe automáticamente declaraciones MIC.

La idea, por supuesto, es maximizar la productividad del programador, y no solo para el código nuevo, sino para los códigos heredados que representan años o incluso décadas de inversión. Intel parece tener una ventaja aquí. Si bien una combinación Xeon-MIC sigue siendo una plataforma heterogénea, será mucho más homogénea, al menos desde el punto de vista del conjunto de instrucciones, que una plataforma Xeon-GPGPU. Hazra cree que el camino que están siguiendo con la arquitectura Intel x86 en ambos lados les permitirá ofrecer un sistema heterogéneo más equilibrado. Si Intel realmente puede ofrecer una transición de software mínimamente dolorosa de Xeons multinúcleo a MIC de muchos núcleos, tendrá una oferta atractiva de aceleradores HPC. «Creemos que la arquitectura MIC se convertirá en el caballo de batalla a medida que más y más aplicaciones y algoritmos puedan aprovechar el paralelismo», dijo Hazra.

El primer producto MIC, cuyo nombre en código es «Knights Corner», se construirá con la tecnología de proceso de 22 nm del fabricante de chips. Dado que los fabs de 22 nm probablemente se usarán para arrancar chips de mayor volumen, probablemente no veremos el primer MIC hasta 2012. Se espera que Knights Corner sea un chip de 50 núcleos, pero Intel aún no ha proporcionado ninguna métrica. de rendimientos estimados.

Mientras tanto, el fabricante de chips continuará desarrollando su línea Xeon multinúcleo que cubre el mercado HPC empresarial y de «volumen». No todas las aplicaciones HPC necesitarán aceleraciones de muchos núcleos y para aquellos códigos que están más alineados con un paralelismo grueso o que están particularmente orientados al rendimiento de un solo subproceso, Xeons será el chip de elección.

La línea Xeon continuará desarrollándose utilizando la cadencia tic-tac de 12 meses de Intel, una reducción del proceso seguida de una actualización de microarquitectura, que se utiliza para sus procesadores x86 tradicionales. Sin embargo, según Hazra, la cadencia de MIC será más lenta, más como una cadencia de 18-24 meses, aunque en este caso cada actualización del procesador podría encapsular cambios arquitectónicos más significativos. Este programa está Online con el ritmo que NVIDIA y AMD han establecido con sus ofertas de GPGPU, y es más o menos lo que esperaría de un acelerador de volumen relativamente bajo.

La gran incógnita es si Intel puede entregar los productos a tiempo para revertir el impulso de la GPGPU. NVIDIA y AMD tienen una ventaja de tres años, que se extenderá a cinco años desde el momento en que los primeros chips MIC comerciales salgan a la calle. Intel, como empresa, no necesita depender del éxito de este producto de muchos núcleos para su éxito, pero sus aspiraciones de HPC parecen estar ligadas a él. 2012 promete ser un año interesante.

Recuerda compartir en en tu Twitter y Facebook para que tus amigos opinen

??? ? ? ???

Comparte