Intel aumenta los núcleos y la memoria con las nuevas CPU Westmere EX

Hola, ¿qué tal colega?. Soy Simón Sánchez y hoy hablaremos sobre Intel aumenta los núcleos y la memoria con las nuevas CPU Westmere EX

Esta semana Intel lanzó su nueva línea Westmere EX, los últimos Xeons para servidores de varios sockets con gran memoria. Los nuevos chips están disponibles en versiones de 6, 8 y 10 núcleos y se venderán con el nombre Xeon E7. Según Intel, estas últimas CPU ofrecen un rendimiento un 40% mayor que los procesadores Nehalem EX (Xeon 7500 y 6500) de la generación anterior, al tiempo que mantienen el mismo consumo de energía.

En comparación con la línea Nehalem EX de 45 nm, el silicio E7 utiliza tecnología de proceso de 32 nm, lo que les permitió agregar un par de núcleos adicionales y 6 MB adicionales de caché L3 al chip de gama alta. A pesar de esto, Intel solo incrementó modestamente el número de transistores, de 2.3 mil millones a 2.6 mil millones. El objetivo era hacer que los núcleos fueran más inteligentes y eficientes en sus trabajos, no depender de la fuerza bruta de la Ley de Moore.

Los E7 son un 42% más rápidos que sus antepasados ​​Nehalem, al menos a pleno rendimiento (utilizando el punto de referencia SPECint_rate_base2006). Quizás se pregunte cómo Intel logró esto, ya que aumentó la cantidad de núcleos y la caché L3 en solo un 25% cada uno. Aparentemente, el 11% del aumento de rendimiento es el resultado de optimizaciones en el último compilador Intel XE2011. El resto del aumento de rendimiento probablemente se pueda atribuir al reloj más rápido del E7. (Intel comparó un E7-4870 de 2.4GHz con un Nehalem X7560 de 2.26GHz en las pruebas de referencia). El rendimiento de punto flotante (SPECfp_rate_base2006) aumentó en un 32 por ciento más modesto.

Utilizando la prueba de rendimiento OpenMP (SPEC OMP2001) para el rendimiento de la memoria compartida, el E7-4870 solo proporcionó un aumento del 18% sobre el Nehalem X7560. Sin embargo, en algunas cargas de trabajo HPC con uso intensivo de memoria, el rendimiento estuvo a la par con los resultados de FP y números enteros. Por ejemplo, Intel informó que el rendimiento mejoró entre un 21 y un 37 por ciento al practicar los E7 en una variedad de herramientas de análisis de EDA. Queda por ver cómo funcionan los otros códigos HPC de memoria grande en el nuevo hardware.

Además del mayor número de núcleos, la otra característica notable del E7 es el soporte para una mayor capacidad de memoria. Para un servidor de cuatro sockets, el E7 escalará hasta 2GB de RAM y 102GB / segundo de ancho de banda, el doble que el de Nehalem EX. Intel logró esto agregando soporte para chips DIMM de 32GB. (El E7 todavía se basa en las mismas 16 ranuras DIMM por zócalo). Sin embargo, estos DIMM de 32 GB tienden a ser bastante costosos y, hasta ahora, los OEM de servidores solo ofrecen sistemas E7 con DIMM de 16 GB. Pero 1TB en una caja de cuatro sockets es bastante útil por sí solo y podrá manejar algunas bases de datos en memoria bastante grandes.

Quizás lo más importante es que los chips E7 se pueden emparejar con módulos de memoria de bajo voltaje (LV DIMM) para reducir el consumo de energía, especialmente en configuraciones DRAM del tamaño de una teraescala. Intel también ha agregado búferes de memoria incorporados para reducir aún más el consumo de energía.

A diferencia de la línea Nehalem EX, la familia E7 se divide en tres series de procesadores diferentes según la compatibilidad con zócalos de chip. La serie E7-2800 está diseñada para sistemas de dos zócalos, mientras que la serie E7-4800 está diseñada para máquinas con cuatro CPU. La configuración de cuatro sockets es probablemente el punto ideal para la familia E7, ya que cuatro CPU en un servidor tienden a ser menos costosas que dos cajas de dos sockets; también tiene el doble de margen de memoria. La serie E7-8800 es para ocho máquinas de enchufe. Estas CPU tienen un precio elevado, pero si está buscando una máquina SMP x86 con hasta 80 núcleos (160 subprocesos) y varios terabytes de memoria, esta es la CPU para usted.

En el lanzamiento, 19 fabricantes de servidores anunciaron plataformas basadas en E7, incluidos los sospechosos habituales como IBM, HP, Dell, Cisco y Oracle. El objetivo principal de estos chips serán los servidores empresariales de misión crítica, el segmento que Intel ha perseguido de manera prominente por primera vez con su línea Nehalem EX. Para perseguir ese espacio de aplicaciones, Intel ha incorporado una serie de nuevas características de seguridad y RAS que, según ellos, ponen su última oferta x86 a la par con las CPU RISC e incluso su propio chip Itanium. Se estima que la informática empresarial de misión crítica tiene un valor aproximado de $ 18 mil millones al año, aproximadamente el doble que el mercado de servidores HPC.

Pero varios proveedores, SGI, Cray, Supermicro y AMAX, hasta ahora, también están utilizando los E7 para construir máquinas HPC a gran escala. SGI, por ejemplo, se ha conectado con los E7 para actualizar sus productos de memoria compartida Altix UV. El Altix UV 10 de gama baja y el Altix UV 100 de gama media se beneficiaron de los núcleos adicionales y la capacidad de memoria.

Por ejemplo, el UV 100 ahora es escalable hasta 960 núcleos y 12 TB de memoria compartida en solo dos racks. El Altix UV 1000 de gama alta también puede usar las nuevas CPU E7, pero por razones arquitectónicas y limitaciones del sistema operativo, aún supera los 2.048 núcleos y 16 TB de memoria. Sin embargo, aún puede aprovechar los E7 de 8 y 10 núcleos de mejor rendimiento, por lo que un UV 1000 puede exprimir más FLOPS por vatio que antes y puede escalar más de 20 teraflops de rendimiento máximo.

El CX1000-S de Cray también se ofrece con chips E7. Aunque Cray no ha anunciado configuraciones específicas, como en el Altix UV, los E7 de mayor rendimiento harían que esta caja SMP sea más rápida y / o más eficiente energéticamente.

Finalmente, tanto Supermicro como AMAX han creado servidores basados ​​en E7 de cuatro y ocho sockets (estos pueden ser en realidad el mismo hardware). Las ofertas de gama alta ofrecen hasta 80 núcleos y 2 TB de memoria en un factor de forma de 5U, mientras que los servidores de cuatro sockets proporcionan la mitad de escalabilidad, pero en un paquete de 1U, 2U o 4U. Las ofertas de 8 vías pueden equiparse con hasta cuatro GPU NVIDIA si desea emparejar las partes del E7 con aceleración vectorial adicional. Si bien estos sistemas Supermicro y AMAX están orientados a HPC, al menos las versiones sin GPU también están posicionadas para grandes cargas de trabajo empresariales.

Como puede ver en el gráfico anterior, estas CPU de gama alta tienen el precio correspondiente. El E7-8870 de 130 vatios de alta gama supera los $ 4,600 en miles de cantidades. Más E7 de rango medio funcionarán a la mitad, y el chip de 10 núcleos para sistemas de doble socket también cuesta más de $ 2,500. Aparentemente, Intel cree que valen la pena, y dado que estos chips vienen combinados con una gran cantidad de DRAM y software costosos, la CPU en sí es probablemente uno de los componentes más populares en estos servidores de memoria compartida de alta gama.

Independientemente, las partes de E7 serán menos costosas que RISC, Itanium o cualquier CPU patentada. En el otro extremo del espectro de precios, Intel tendrá que competir con AMD, que planea lanzar su CPU «Interlagos» de clase Bulldozer en el tercer trimestre. Estos chips están disponibles en versiones de 12 y 16 núcleos y pueden ocupar cuatro servidores de socket. Entonces, para los usuarios con cargas de trabajo SMP que están consumiendo terabytes de datos, la arquitectura x86 parece un poco más tentadora.

Deberías compartir en tu Facebook para que tus colegas lo flipen

??? ? ? ???

Comparte