Hoja de ruta del servidor AMD: núcleos, muchos de ellos

Hola, ¿qué tal colega?. Te escribe Simón Sánchez y en esta ocasión hablaremos sobre Hoja de ruta del servidor AMD: núcleos, muchos de ellos

Si bien SC09 fue una fiesta extrovertida para la computación con GPU, las CPU son la base de la computación de alto rendimiento. La arquitectura x86, en particular, continúa dominando el espacio, con Intel claramente como dueño de la mayoría del mercado de servidores HPC. Ese dominio probablemente se mantendrá en el futuro previsible. La hoja de ruta de los servidores de AMD en los próximos años puede frenar parte del impulso de su rival, pero no hay soluciones mágicas en el arsenal de la compañía.

En el Día del Analista Financiero de AMD el 11 de noviembre, la compañía dio a conocer la hoja de ruta del producto 2010-2011 en todos sus mercados. Este año, la compañía se ha centrado mucho más en sus productos del lado del cliente, con cierto énfasis en su estrategia de chip CPU-GPU «Fusion» (más sobre esto más adelante). A corto plazo, los procesadores Opteron de AMD llevarán la carga de HPC.

A principios de 2010, la familia de procesadores «Magny-Cours» de 45nm lanzará la serie Opteron 6000, utilizando la nueva plataforma «Maranello» y el zócalo G34. Magny-Cours atenderá los mercados de servidores 2P y 4P / 8P y se posiciona como el chip Opteron de «alto rendimiento». Como tal, se espera que atraiga a la mayoría de la adopción de servidores HPC, aunque en algunos casos se pueden usar chips Opteron 4000 Series 1P y 2P de bajo consumo. Magny-Cours vendrá con 8 o 12 núcleos, duplicando los procesadores de la generación anterior de Shanghai y Estambul, respectivamente. Del mismo modo, los canales de memoria se duplican de 2 a 4, solo para mantener equilibrados los núcleos y el ancho de banda de la memoria. Otras mejoras incluyen soporte de memoria DDR3 y un estado C1 mejorado (C1E) para reducir el consumo de energía bajo cargas parciales.

Nada de esto es nuevo. AMD ha estado hablando de Magny-Cours durante un tiempo. Sin embargo, la compañía ha ofrecido algunos detalles nuevos sobre «Interlagos», la secuela de Magny-Cours programada para su lanzamiento en 2011. Interlagos estará en el nodo de proceso de 32 nm y estará disponible en versiones de 12 y 16 núcleos. Pero es más que una adición básica habilitada por una reducción de proceso. Interlagos se basará en la arquitectura central «Bulldozer» de próxima generación, que resulta ser un diseño bastante único.

Según AMD, cada módulo «Bulldozer» consta de dos «núcleos» completos más una unidad de punto flotante (FPU) que incluye dos FMAC de 128 bits. Cada núcleo y FPU tiene su propio programador de instrucciones. La misma FPU puede dedicarse a uno de los núcleos completos o compartirse entre los dos. En la superficie, parece que AMD ha estado ahorrando en la ejecución de punto flotante a favor de la ejecución completa, pero hasta que se revelen más detalles sobre cómo funciona Bulldozer bajo cargas de trabajo reales, probablemente sea mejor no juzgar.

Aparentemente, AMD está contando los núcleos enteros como núcleos reales, por lo que un procesador Interlagos de 16 núcleos constaría de 8 módulos Bulldozer. En realidad, cada módulo aparece como un solo núcleo para el software, pero puede transportar dos subprocesos en forma SMT. Parece que AMD ha confundido innecesariamente la semántica aquí. Probablemente hubiera sido mejor llamar a cada módulo Bulldozer un núcleo, con la explicación adicional de que hay hardware dedicado para servir dos subprocesos de control simultáneamente.

Mientras AMD hace feliz al núcleo, Intel hará lo habitual TIC Tac rutina. La reducción «Westmere» de 32 nanómetros de Nehalem está programada para 2010, con el EP de seis núcleos de Westmere programado para la primera mitad del año. En 2011, los nuevos productos de microarquitectura “Sandy Bridge” aparecerán para enfrentarse a Bulldozer de frente. Intentar luchar contra Intel en el campo de las CPU será difícil para AMD. Intel está aproximadamente un año por delante de su rival más pequeño en tecnología de procesos de semiconductores y tiene un esfuerzo de investigación y desarrollo mucho mayor para impulsar la innovación en ingeniería.

Donde AMD tiene la ventaja es su tecnología GPU, cortesía de su división ATI. Es por eso que el objetivo principal de la compañía para los próximos años será construir su llamada estrategia Fusion de integrar CPU e IP GPU en el mismo dado. Es algo que Intel y, en menor medida, NVIDIA centrado en CPU están persiguiendo, pero sin el beneficio de tecnologías avanzadas en ninguna área.

La idea es crear una arquitectura de chip heterogénea que combine la fuerza de la CPU en el procesamiento secuencial con las capacidades superiores de procesamiento de datos en paralelo de la GPU. AMD llama a esta nueva arquitectura APU (para unidad de procesamiento acelerado). Las aplicaciones que combinan video, audio y gráficos en aplicaciones más tradicionales serán los principales beneficiarios, pero eso representa una gran parte del contenido relacionado con la Web en el corazón de la informática actual. «Creo que Fusion traerá el siguiente paso para el negocio de las computadoras», dijo el CEO de AMD, Dirk Meyer, en un reciente Financial Analyst Day.

Desafortunadamente para los usuarios de HPC, todos los esfuerzos de AMD Fusion están del lado del cliente por ahora. Se espera que la primera APU, llamada Llano, se dé a conocer en 2011. El rendimiento de la GPU de estos chips heterogéneos no rivaliza con los dispositivos gráficos discretos, ya que, obviamente, los bienes raíces deben compartirse con los recursos de la CPU. Entonces, al menos a corto plazo, AMD continuará ofreciendo productos de GPU independientes para usuarios de gráficos de alta gama y, presumiblemente, usuarios de HPC a través de sus productos FireStream. La única sugerencia de que las APU podrían extenderse más allá del espacio del cliente se ofreció en una diapositiva en la hoja de ruta del servidor de AMD, que predijo la aparición de un procesamiento heterogéneo después de 2012.

El enfoque de AMD en el procesamiento de clientes es comprensible, ya que ahí es donde existen la mayoría de las oportunidades de crecimiento, aunque con márgenes más bajos que el espacio del servidor. Incluso en este último mercado, AMD se centra en las necesidades comerciales tradicionales. Según ellos, su segmento de «clústeres de rendimiento» representa sólo el 5% de su mercado total de servidores, lo que les da pocos incentivos para crear productos especializados de alta gama. De hecho, es más probable que Intel sea aventurero, ya que puede aprovechar una mayor economía de escala que su competidor más pequeño. El reciente anuncio del fabricante de chips de una nueva colaboración con NEC es un ejemplo de cómo Intel persigue HPC para propósitos especiales.

A pesar del dominio de Intel, se espera que la mayoría de los proveedores de sistemas HPC continúen ofreciendo hardware basado en Opteron. Ciertamente, la devoción de AMD por la actualización ha facilitado un poco la vida como proveedor de sistemas. Y en cualquier caso, nadie quiere volver a un mundo x86 desde una sola fuente.

Cray es un caso especial. En SC09, la compañía anunció la supercomputadora XT6 (y XT6m de rango medio), que incorporará el procesador Magny-Cours, cumpliendo así el compromiso de Cray de permanecer con AMD hasta al menos 2010. Como AMD presentará Interlagos compatible con G34 en el 2011, se puede suponer que el XT6 se podrá actualizar por socket durante al menos otro año. Más allá de eso, o quizás incluso antes de que el XT6 haya seguido su curso, Cray podría ejercer su opción Intel. Cuando el fabricante de supercomputadoras presentó Intel en 2008, ciertamente tenía más en mente que usar silicio Xeon para su sistema de escritorio CX1. Espero ver una línea de supercomputadoras de gama alta con procesadores Intel introducidas en los próximos años.

El comodín es NVIDIA. Si más cálculos de alto rendimiento durante los próximos años comienzan a depender de las GPU NVIDIA (o incluso las GPU AMD / ATI) para aumentar el rendimiento, su elección de CPU se calcula de manera diferente. En este caso, los problemas de costo y potencia tenderían a pesar más que el rendimiento, poniendo a los Opterons en un campo de juego más suave con sus contrapartes Xeon. Y si AMD y NVIDIA pueden trabajar juntos en algún tipo de acuerdo de CPU Opteron / Fermi GPU mutuamente beneficioso, eso podría representar un desafío interesante para la preeminencia de Intel en HPC.

Puedes compartir en tu Facebook para que tus colegas opinen

??? ? ? ???

Comparte