Las CPU superan a las GPU en el benchmark de los mercados financieros - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Las CPU superan a las GPU en el benchmark de los mercados financieros

Hola de nuevo. En el teclado Simón Sánchez y esta vez hablaremos sobre Las CPU superan a las GPU en el benchmark de los mercados financieros

Una evaluación comparativa reciente realizada por el Securities Technology Analysis Center (STAC) está ayudando a disipar el mito de que las GPU son los principales impulsores responsables de aumentar las velocidades de computación a nuevos niveles. De hecho, el estudio indica que estos «aceleradores» de GPU en realidad están ralentizando las cosas.

Intel recientemente le pidió a STAC que usara su Prueba comparativa STAC-A2 suite para probar dos servidores de caja blanca de dos sockets, ambos con procesador Intel Xeon serie E5-2600 v3 (nombre en código Haswell EP), uno con y el otro sin Intel Xeon Phi placa del coprocesador.

STAC-A2 es un estándar de referencia desarrollado por quanta y tecnólogos de algunos de los bancos más grandes del mundo. Basado en el análisis de riesgo financiero, el índice de referencia informa el rendimiento, la escalabilidad, la calidad y la eficiencia de los recursos de cualquier pila de tecnología que pueda manejar las cargas de trabajo masivas involucradas en estas transacciones. Esto incluye el cálculo «griego», una serie de sensibilidades al riesgo designadas con letras griegas que miden la sensibilidad del precio de la opción a cambios en los mercados subyacentes, como las tasas de interés o la volatilidad.

Los bancos más grandes tienen redes HPC que realizan estos cálculos continuamente. Las instituciones financieras, que tradicionalmente se ejecutan en modo por lotes durante la noche, están presionando para lograr el objetivo del procesamiento en tiempo real: tiempos de respuesta de un segundo o menos.

Una combinación de tecnología de CPU avanzada y software en paralelo es la respuesta.

El procesador Haswell (HSW) de doble zócalo utilizado en el benchmark STAC es una generación más reciente que un sistema anterior que ejecuta el benchmark STAC A2 que usaba un procesador Xeon EP de doble zócalo (Ivy Bridge o IVB). El nuevo sistema basado en HSW se comparó un 30% más rápido que el sistema basado en IVB previamente medido con el mismo código fuente. Tanto el sistema basado en HSW como el sistema basado en IVB, que no usaba una tarjeta aceleradora, ejecutan el benchmark STAC A2 más rápido que un sistema que usa una CPU de dos sockets y una GPU K20. El sistema basado en HSW era solo un 12% más lento que el sistema de doble socket, dos GPU, demostrando un 46% más de capacidad de activos.

Los resultados publicados por el STAC incluyeron un archivo caja blanca con dos CPU Intel Xeon E5-2699 v3 2.30 GHz (Haswell EP) y una placa de coprocesador Intel Xeon Phi 7120A (Knights Corner). Este fue el más rápido de todos los sistemas publicados hasta la fecha con el índice de referencia griego de extremo a extremo. En el mismo punto de referencia, este sistema era un 22% más rápido que un sistema con una CPU de dos sockets más dos GPU. También tenía un 46% más de capacidad de activos y un 53% más de capacidad de ruta que el sistema basado en GPU.

«Las mejoras de rendimiento que son posibles al ejecutar la CPU Haswell con o sin el coprocesador Xeon Phi son realmente impresionantes», dijo Robert Geva, ingeniero principal de Intel y gerente del «Wall Street Lab» de Intel. “El secreto es paralelizar el software. En algunos casos, hemos logrado mejoras de rendimiento de hasta 180 veces. Esto significa que un cálculo que ahora toma tres horas se puede realizar en un minuto o menos, cumpliendo con los criterios de tiempo real requeridos por la industria de los mercados financieros.

«El hecho de que un sistema con una CPU y un solo coprocesador Xeon Phi pueda superar a un sistema con una CPU y dos GPU es un testimonio del poder del modelo de programación, específicamente, la programación común entre Xeon y Xeon Phi», sigue así. “El benchmark STAC-A2 es una aplicación no trivial, diseñada para ejecutar varios algoritmos en paralelo, con cálculos paralelos dentro de cada uno de ellos. Esta complejidad le da a la CPU la oportunidad de brillar. Los desarrolladores de Intel han elegido Intel Threading Building Blocks (TBB) como sustrato para la paralelización. TBB está diseñado para el paralelismo anidado y su disponibilidad en Xeon y Xeon Phi ha permitido a los desarrolladores flexibilidad en la codificación «.

Geva señala que el paralelismo de código arcano es un proceso difícil y costoso, pero vale la pena darse cuenta de los excelentes resultados computacionales que pueden marcar la diferencia en la industria financiera altamente competitiva.

Sin embargo, los beneficios de la paralelización de código combinados con la potencia de la CPU Haswell se extienden más allá de las aplicaciones financieras exploradas en la prueba de referencia STAC-A2. Este enfoque se puede aplicar a muchos otras aplicaciones financierasasí como aplicaciones de HPC en otros dominios como las ciencias biológicas y la creación de contenido digital.

El mito de que se necesitan GPU para acelerar la computación está refutado por datos reales. Dice Geva: «La realidad es que una CPU construida para ejecutar software en paralelo ofrece un rendimiento excepcional. Y el uso del coprocesador Xeon Phi hace que el cálculo sea aún más rápido».

Para más información:

Recuerda compartir en una historia de tu Instagram para que tus colegas lo lean

??? ? ? ???

Comparte