Las nuevas instrucciones de Haswell aprovechan el rendimiento de FEA - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Las nuevas instrucciones de Haswell aprovechan el rendimiento de FEA

Hola de nuevo. Te escribe Simón Sánchez y en el día de hoy te voy a hablar sobre Las nuevas instrucciones de Haswell aprovechan el rendimiento de FEA

Intel lanzó recientemente un estudio de caso que demuestra los beneficios de la familia de productos Intel Xeon E5-2600 v3 para ejecutar cargas de trabajo de ingeniería, utilizando el software Abaqus / Standard de la marca SIMULIA de Dassault Systèmes. Abaqus / Standard es un software de análisis de elementos finitos de propósito general (FEA), que funciona diseccionando un objeto en una gran cantidad de elementos finitos, cada uno representado por una ecuación. A medida que se resuelven e integran las ecuaciones individuales, todo el objeto se modela matemáticamente.

los escríbelo El ingeniero de software de Intel Khang señala que Abaqus / Standard incluye muchas capacidades de análisis y, según el literatura del producto «Ideal para eventos estáticos y dinámicos de baja velocidad donde las soluciones de estrés de alta precisión son de suma importancia». Los ejemplos citados por el proveedor de software incluyen la presión de sellado en una junta de empaquetadura, el balanceo en estado estable de un neumático o la propagación de grietas en el fuselaje de un avión compuesto.

“Dentro de una sola simulación, puede analizar un modelo en dominios de tiempo y frecuencia”, continúa el resumen de la página del producto Abaqus / Standard. “Por ejemplo, puede comenzar realizando un análisis de montaje de la cubierta del motor no lineal que incluye una mecánica de sellado sofisticada. Después del análisis del ensamblaje, es posible extraer las frecuencias naturales preesforzadas de la cubierta o examinar la respuesta mecánica y acústica en el dominio de frecuencia de la cubierta pretensada a las vibraciones inducidas por el motor. «

Para el componente de integración de tiempo, los solucionadores Abaqus / Standard utilizan una función llamada DGEMM (Multiplicación de matriz general de doble precisión), que se encuentra en las bibliotecas Intel Math Kernel (Intel MKL). En la actualización 5 de Intel MKL, versión 11 y posteriores, DGEMM se ha optimizado para utilizar las nuevas extensiones Intel AVX2 introducidas en la microarquitectura Haswell de Intel. Esta optimización proporciona muchas cargas de trabajo con más ganancias de rendimiento que las mejoras de hardware por sí solas.

“El análisis de las cargas de trabajo de Abaqus utilizando herramientas de supervisión del rendimiento, como Intel VTune, mostró que un número significativo de ellos gasta del 40% al 50% de su tiempo de ejecución en DGEMM. Un análisis más detallado de la función DGEMM mostró que hace un uso extensivo de la operación de multiplicación-suma ya que DGEMM es, básicamente, una multiplicación de matrices ”, explica Khang.

“Una de las nuevas instrucciones en Intel AVX2 es la multiplicación-suma fusionada de tres operandos (FMA3). Al implementar la operación de adición múltiple combinada en hardware, la velocidad de esta operación mejora enormemente. «

El estudio de caso documenta la mejora del rendimiento lograda con esta nueva implementación de DGEMM que aprovecha Intel AVX2. Se utilizaron dos plataformas, una con Intel Xeon E5-2697 v3 a 2.6 GHz y la otra con Intel Xeon E5-2697 v2 a 2.7 GHz. El sistema operativo es Red Hat Enterprise Linux Server versión 6.4 y el La aplicación es Abaqus / Standard benchmarks versión 6.13-1. Las pruebas se midieron en segundos.

Se utilizaron cuatro puntos de referencia de Abaqus / Standard: s2a, s3a, s3b y s4b.

  • S2a es un análisis estático no lineal de un volante con carga centrífuga.
  • S3 extrae las frecuencias naturales y las formas modales de una rueda de turbina.
  • S3a es un 360.000 grados de libertad (DOF) que utiliza la versión Eigensolver de Lanczos.
  • S3b es un 1,100,000 grados de libertad (DOF) usando la versión Eigensolver de Lanczos.
  • S4 es un punto de referencia que simula atornillar una culata de cilindros en un bloque de motor.
  • S4b es un 5.000.000 grados de libertad (DOF) que utiliza la versión de solucionador directo.

Los investigadores ejecutaron los cuatro puntos de referencia en el sistema Xeon E5-2697 v2, el sistema E5-2697 v3 con AVX2 habilitado y nuevamente en el sistema E5-2697 v3 pero con AVX2 deshabilitado.

Aquí están los resultados:


Comparación de Intel Xeon E5-2697 v3 y E5-2697 v2: mejora del rendimiento debido al hardware mejorado y rangos de Intel AVX2 de 1,11X a 1,39X.


Comparación de los puntos de referencia en Xeon E5-2697 v3 con Intel AVX2 habilitado y deshabilitado: el aumento en el rendimiento debido al Intel AVX2 solo varía de 1.03X a 1.11X.

Aunque se esperaban los beneficios de este título, se afirma que tiene los números difíciles proporcionados por el estudio. Hubiera sido interesante ver un tercer gráfico que muestra el rendimiento relativo de las tres configuraciones (esencialmente una superposición de los dos gráficos anteriores) para ilustrar qué porcentaje del aumento total del rendimiento (como se muestra en el primer gráfico) se debe a AVX2.

La conclusión para los usuarios de este software que se han actualizado a la familia de productos “Haswell” Xeon E5 v3 es asegurarse de que están utilizando las bibliotecas más recientes.

«El rendimiento del software de simulación es muy crítico, ya que puede reducir significativamente los tiempos de desarrollo y análisis del modelo», concluye el

Recuerda compartir en tus redes sociales para que tus amigos lo sepan

??? ? ? ???

Comparte