Chip en la mesa: Sandy Bridge vs.Westmere - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Chip en la mesa: Sandy Bridge vs.Westmere

Hola, ¿qué tal colega?. Te escribe Simón Sánchez y esta vez hablaremos sobre Chip en la mesa: Sandy Bridge vs.Westmere

Andrey Vladimirov, de la Universidad de Stanford, ejecutó una serie de evaluaciones comparativas aritméticas para el proveedor de sistemas HPC Colfax International, comparando la nueva CPU Sandy Bridge Xeon de Intel con su predecesora Westmere. Aunque la mayoría de las pruebas muestran mejoras de rendimiento para el nuevo Xeon, algunas actividades han mostrado pocos o ningún cambio. Los resultados se proporcionan en un archivo papel blanco en el sitio web de Colfax.

El estudio adoptó un enfoque de bajo nivel para comprender las capacidades específicas de cada chip. Vladimirov se centró en explicar cuánto rendimiento esperar de cada modelo de CPU y cómo los usuarios podían obtener esos números sin profundizar en el código ensamblador.

Los puntos de referencia compararon una CPU Sandy Bridge de 2,7 GHz de 8 núcleos con un procesador Westmere de 6 núcleos a 3,46 GHz. A continuación, se muestra el equipo utilizado en los puntos de referencia:

Sistema

Westmere

Sandy Bridge

Procesador

6 núcleos X5690

8 núcleos E5-2680

Frecuencia

3,46 GHz

2,70 GHz

Frecuencia turbo

3,73 GHz

3,50 GHz

Memoria

12 GB

64 GB

Módulos de memoria

6 x 2 GB

8 x 8 GB

Todas las pruebas se realizaron utilizando los puntos de referencia Linpack y CIAO (operaciones aritméticas individuales de Colfax), con la excepción de la prueba «Copiar a / desde RAM», medida utilizando el punto de referencia STREAM. Ambos sistemas se probaron en operaciones escalares y conjuntos de instrucciones SSE2, el sistema Sandy Bridge también se probó con su nuevo conjunto de instrucciones AVX (Advanced Vector Extensions). El código se compiló utilizando el compilador C ++ de Intel.

Con un solo núcleo, Sandy Bridge proporcionó 24,6 gigaflops para LINPACK frente a 12,7 gigaflops para el chip Westmere. Usando todos los núcleos de CPU para LINPACK, Sandy Bridge superó al Westmere de 157,7 gigaflops a 71,8 gigaflops, respectivamente. Los códigos enteros también se desempeñaron mejor en la CPU Sandy Bridge, por un factor de entre 1.5 y 3.0, lo que aparentemente fue una sorpresa ya que la aritmética de enteros no puede usar la función AVX.

Vladimirov señaló que las mejoras de rendimiento proporcionadas por el procesador Sandy Bridge dependen del tipo de código de la aplicación. En general, el conjunto de instrucciones AVX, con sus registros vectoriales de doble ancho, es responsable de muchas de las ganancias de rendimiento de punto flotante en Sandy Bridge. Además, hay un rendimiento adicional disponible gracias a la memoria caché más grande y al mayor ancho de banda de RAM. Notablemente, sin embargo, se encontró que las operaciones de división y raíz cuadrada en realidad funcionan ligeramente peor que el chip Westmere.

Siempre que el código fuente esté disponible y se haya escrito teniendo en cuenta la autovectorización, los usuarios deberían poder transferir sus códigos aritméticos a Sandy Bridge con bastante facilidad. Y, a menos que el algoritmo dependa en gran medida de las operaciones de división y raíz cuadrada, se debe esperar al menos algún aumento del rendimiento. En los casos en los que el código puede aprovechar al máximo AVX y el subsistema de memoria mejorado, las ganancias de rendimiento de la aplicación podrían fácilmente estar en el rango de dos dígitos.

Puedes compartir en en tu Twitter y Facebook para que tus colegas lo lean

??? ? ? ???

Comparte