Análisis profundo del rendimiento de Haswell-EP - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Análisis profundo del rendimiento de Haswell-EP

Hola, un placer verte por aquí. Te escribe Simón Sánchez y en el día de hoy hablaremos sobre Análisis profundo del rendimiento de Haswell-EP

Una publicación de blog reciente de Microway ofrece una visión detallada del rendimiento de los nuevos procesadores Intel Xeon E5-2600v3 «Haswell-EP» para aplicaciones HPC.

“Los procesadores Xeon E5-2600v3 presentan el rendimiento más alto hasta la fecha disponible en una CPU con socket. Por primera vez, una sola CPU es capaz de soportar más de la mitad de un TeraFLOPS (500 GFLOPS) «, señala el mandar. «Esto es posible mediante el uso de AVX2 con instrucciones FMA3».

Aquí hay una actualización sobre algunos de los cambios más importantes:

  • Hasta 18 núcleos de procesador por socket (con opciones para 4, 6, 8, 10, 12, 14 y 16 núcleos)
  • Admite velocidades de memoria DDR4 ECC de cuatro canales de hasta 2133 MHz
  • Advanced Vector Extensions versión 2.0 (instrucciones AVX2)
  • Eficiencia energética mejorada con estados P por núcleo y control de frecuencia sin núcleo independiente

Microway informa que los nuevos chips Haswell son más rápidos en casi todos los parámetros, por lo que los usuarios pueden esperar un aumento de rendimiento de al menos un 10% por núcleo, excluyendo las nuevas instrucciones. El siguiente cuadro muestra el rendimiento máximo teórico de las nuevas CPU Haswell-EP con las nuevas instrucciones.


Si bien estas son velocidades máximas teóricas, los puntos de referencia SPEC CPU2006, también revisados ​​en el blog, reflejan un conjunto de aplicaciones del mundo real. Con la nueva memoria y las nuevas instrucciones, el cambio de SKU v2 a v3 vio mejoras netas en el rango del 20-30%.

De todas las mejoras en la nueva línea, las velocidades de reloj solo se han incrementado ligeramente. Vale la pena señalar que Turbo Boost en conjunto con instrucciones que no son AVX puede permitir un aumento de 100 MHz a 200 MHz en la velocidad de reloj más alta. Sin embargo, dado que AVX2 permite operaciones de 256 bits para números enteros y de coma flotante, es probable que los usuarios de HPC operen en modo AVX la mayor parte del tiempo.

No te olvides compartir en tu Facebook para que tus amigos lo lean

??? ? ? ???

Comparte