Intel lanza Sandy Bridge Into the Wild CPU de servidor - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Intel lanza Sandy Bridge Into the Wild CPU de servidor

Hola de nuevo. Soy Simón Sánchez y hoy te voy a contar sobre Intel lanza Sandy Bridge Into the Wild CPU de servidor

Intel lanzó oficialmente su nueva familia de procesadores Xeon E5-2600 el martes, meses después de que los chips se implementaron en supercomputadoras en varios sitios importantes de HPC en todo el mundo. La nueva CPU representa la última oferta de Xeon de la compañía para servidores de doble socket y cuenta con una serie de nuevas características que incluyen un rendimiento mejorado, un nuevo conjunto de instrucciones de punto flotante en AVX y E / S integradas. El procesador será un competidor formidable en la batalla de chips de servidor con AMD.

Intel promueve un 80% más de rendimiento para las CPU E5-2600 (también conocido como Sandy Bridge-EP) que las piezas anteriores del Xeon 5600 (Westmere-EP) y también promete una mejor eficiencia energética. De hecho, según Diane Bryant, la nueva vicepresidenta, gerente general de Intel, Datacenter y Connected Systems Group, la familia E5-2600 está en la cima cuando se trata de operaciones que comienzan en vatios. «Seguimos ofreciendo el mejor rendimiento por vatio», dijo a una multitud de reporteros y analistas en el lanzamiento de E5 el martes.

AMD podría cuestionar eso, sin mencionar a NVIDIA, Fujitsu, Tilera e IBM, que también ofrecen chips que consumen energía para el espacio del servidor. Para ofrecer fracasos sin procesar, el Blue Gene / Q ASIC de IBM es posiblemente el chip más eficiente en energía del planeta en este momento. Aparte de eso, en el universo de servidores x86, el nuevo Xeon será difícil de superar.

El E5-2600 representa una actualización de microarquitectura para la línea Xeon, que reemplaza los chips de arquitectura Nehalem con el nuevo diseño Sandy Bridge, un «tock» en el tic-tac vernáculo. El número máximo de núcleos se ha aumentado a 8, con ofertas de 2, 4 y 6 núcleos. El reloj más rápido se logra con el E5-2643 de cuatro núcleos, que funciona a 3,3 GHz. En realidad, es un retroceso de las CPU Xeon 5600 más antiguas, que alcanzaron los 3,6 GHz, pero gracias a la tecnología Turbo Boost, las frecuencias los relojes máximos están prácticamente a la par.

También se ha mejorado el subsistema de memoria. Para aumentar el ancho de banda, Intel agregó un cuarto canal de memoria y soporte para módulos de memoria más rápidos (1600 MHz). El diseño también permite hasta 12 DIMM por zócalo, y debido a que se ha agregado soporte DIMM de 32 GB, un servidor de doble zócalo podría equiparse con hasta 768 GB. Los viejos servidores Westmere de dos sockets excedían los 288GB.

Por supuesto, con los microprocesadores modernos, el objetivo es mantener la mayor cantidad de datos posible en la caché para evitar que la CPU se atasque al acceder a la memoria principal. Con esto en mente, Intel ha aumentado la capacidad de caché tanto en términos absolutos como por núcleo.

Las nuevas piezas E5-2600 de 8 núcleos vienen con 20 MB de caché de último nivel en comparación con los 12 MB de los 5600 Xeons de 6 núcleos. En general, Intel usó una relación caché / núcleo de 2.5: 1 para el diseño E5-2600: las CPU de 6, 4 y 2 núcleos vienen con 15 (o 12), 10 y 5 MB de caché , respectivamente. Esto no significa necesariamente que los Xeons más nuevos tengan más caché de todos modos. Aún puede comprar algunos productos Xeon 5600 de cuatro núcleos con 12 MB de caché, lo que equivale a 3 MB por núcleo.

En cuanto a la E / S, Intel ha hecho algo de consolidación aquí, trayendo lo que eran chips discretos al procesador. Por ejemplo, el nuevo Xeon integra 40 carriles PCIe 3.0 en la matriz. 3.0 no solo duplica el ancho de banda de PCIe 2.0, sino que debido a que Intel ha incorporado la funcionalidad en el chip, la latencia de comunicación de dispositivo a procesador se reducirá en gran medida.

El E5-2600 también coloca el concentrador de E / S en la CPU, que ahora incluye algo llamado «E / S directa de datos», una capacidad que permite a los adaptadores Ethernet e InfiniBand enrutar el tráfico directamente a la caché, evitando el viaje a la memoria principal. Según Intel, esta configuración reduce la latencia de E / S hasta en un 30 por ciento, al tiempo que reduce el consumo de energía.

Para aumentar el rendimiento del punto flotante (FP), Intel ha creado Advanced Vector Extensions (AVX), un conjunto de instrucciones de 256 bits que duplica efectivamente el rendimiento de FP. Esto será particularmente útil para códigos HPC como simulaciones científicas y análisis financiero, pero también para aplicaciones en procesamiento de imágenes, audio y video para reconocimiento de patrones y procesamiento de señales.

Sin embargo, los códigos heredados no realizan automáticamente mejoras en el rendimiento de AVX. Como mínimo, será necesario volver a compilar el código fuente, con suerte con un compilador de vectorización automática capaz de manejar vectores de doble ancho. En algunos casos, sin embargo, será necesario modificar el código en sí para obtener el máximo rendimiento de AVX.

El objetivo detrás de todas estas mejoras de hardware (más núcleos, memoria y caché, AVX y E / S integradas) es proporcionar un chip mucho más rápido. Como se mencionó anteriormente, Intel afirma que el E5-2600 ofrece un rendimiento un 80% mejor que los Xeon anteriores. Sin embargo, esa métrica se basa en el punto de referencia de punto flotante SPECfp_rate_base2006, por lo que obviamente su millaje variará.

DreamWorks Animation, por ejemplo, ha visto un aumento del 35% en la velocidad de su aplicación de renderizado sobre la antigua tecnología Xeon, según Derek Chan, quien dirige las operaciones digitales de DreamWorks. Los nuevos servidores E5-2600 se utilizan para desarrollar la última función de DreamWorks, Madagascar 3, que según Chan tomará más de 60 millones de horas de CPU para renderizar. Para DreamWorks, la renderización más rápida no solo ahorra tiempo y dinero, sino que también brinda a los artistas más espacio creativo.

Los códigos que son más intensivos en FP, como LS-DYNA, (un paquete de software que incluye análisis estructural y simulación de fluidos para fabricación, automoción / aeroespacial, biotecnología e investigación científica) deben hazlo aún mejor. El equipo de evaluación comparativa de AnandTech ejecutó dos códigos LS-DYNA con algunos de los chips E5-2600 y informó que los nuevos Xeons eran los mejores en el campo x86.

Según AnandTech, un Xeon E5-2690 era aproximadamente el doble de rápido que el antiguo Xeon 5650 en ambos puntos de referencia LS-DYNA y era aproximadamente un 50% más rápido que el nuevo CPU Opteron 6276 («Interlagos») de AMD. Tenga en cuenta que en comparación con el chip AMD, la nueva oferta de Intel parecía beneficiarse principalmente de su reloj más rápido (2,9 GHz para el Xeon frente a 2,3 GHz para el Opteron), pero también del chip E5-2660, un poco más lento, en 2 , 2 GHz, superó al Opteron 6276 de mayor velocidad. AMD tendrá otra oportunidad en Intel este año con «Abu Dhabi», el Opteron de próxima generación de la compañía, que planea lanzar en la segunda mitad de 2012.

Mientras tanto, Intel seguirá dominando el espacio del servidor x86. Según Bryant, el E5-2600 ya tiene 400 diseños ganadores, distribuidos en servidores, almacenamiento y cajas de red. En el espacio del servidor HPC, todos los sospechosos habituales han adquirido los nuevos Xeons, incluidos IBM, HP, Dell, SGI, Bull, Appro, Fujitsu, Supermicro, NEC, Inspur, Lenovo, Acer, ASUS y AMAX.

HP, Appro y Bull ya enviaron un total de diez supercomputadoras de clase TOP500 el año pasado basadas en las partes E5-2600, antes de que las CPU tuvieran incluso su nombre oficial. Estas nuevas máquinas incluyen la nueva supercomputadora Gordon de SDSC, la máquina Helios desplegada en el Centro Internacional de Investigación de Energía de Fusión de Japón y un gran clúster de Amazon EC2. El más grande es el sistema «Zin» del Lawrence Livermore National Lab, que está equipado con 5.776 de los nuevos chips y está justo por debajo del pico de 1 petaflop *.

El precio de los chips oscila entre $ 294 por un par de piezas de cuatro núcleos, hasta $ 2,057 por el modelo superior E5-2690, una CPU de 135 W de 8 núcleos a 2,9 GHz. Por cierto, ninguno de las supercomputadoras mencionadas anteriormente utilizaron el E5-2690; todos han sido equipados con componentes de 8 núcleos a 2,6 GHz o 2,7 GHz, que cuestan entre 300 y 500 dólares menos y funcionan de 5 a 20 vatios menos. En este punto, estos Xeons son posiblemente la mejor relación calidad-precio y rendimiento / vatio para HPC.

* Actualización: actualmente hay dos sistemas petascale equipados con los procesadores Xeon E5-2600. Helios, que está en producción en el Centro Internacional de Investigación de Energía de Fusión (IFERC) en Japón, ahora está en pleno funcionamiento y está equipado con 8.820 CPU; y la supercomputadora Curie en GENCI en Francia, contiene 10.080 procesadores Sandy Bridge.

Puedes compartir en tus redes sociales para que tus amigos lo consulten

??? ? ? ???

Comparte