El brazo apunta a HPC con las nuevas plataformas Neoverse - Calendae | Informática, Electrónica, CMS, Ciberseguridad

El brazo apunta a HPC con las nuevas plataformas Neoverse

Hola, un placer verte por aquí. En el teclado Simón Sánchez y hoy te voy a contar sobre El brazo apunta a HPC con las nuevas plataformas Neoverse

Arm, una empresa de diseño de semiconductores con sede en el Reino Unido, reveló hoy los detalles de su hoja de ruta Neoverse, presentando V1 (con nombre en código Zeus) y N2 (con nombre en código Perseus), la plataforma de la serie N de segunda generación de Arm. . El proveedor de chips IP dijo que las nuevas plataformas ofrecerán un 50% y un 40% más de rendimiento de un solo subproceso, respectivamente, que el Neoverse N1.

La gran noticia para los observadores de HPC es el soporte de Neoverse V1 para Scalable Vector Extensions (SVE), implementado como dos vectores de 256 bits de ancho, que permite la ejecución de instrucciones SIMD enteras, bfloat16 o de punto flotante en múltiples unidades vectoriales. grande. SVE está diseñado para ser independiente del ancho de la unidad, por lo que las aplicaciones compiladas para SVE en una plataforma se ejecutarán en cualquier implementación SVE válida, que puede usar anchos de 128 bits a 2048 bits (en incrementos de 128 bits).

«Con SVE, estamos asegurando la portabilidad y longevidad del código de software, junto con una ejecución eficiente», dijo Chris Bergey, vicepresidente senior y gerente general de la línea de negocios de infraestructura en Arm.

Mejoras de rendimiento esperadas. Los vectores más grandes ofrecen un mayor rendimiento de la aplicación. Fuente: Arm

Las nuevas capacidades SVE para el núcleo Neoverse V1 se basan en la experiencia de Arm de trabajar con Fujitsu en la plataforma A64FX, el procesador habilitado para SVE que está en el corazón de Fugaku, la primera supercomputadora del mundo y basada en Arm.

Algunos socios de Arm están desarrollando soluciones basadas en Neoverse V1 destinadas al análisis de datos y cargas de trabajo informáticas de alto rendimiento. notado Brent Gorda, director comercial de Arm’s HPC. Uno de ellos es SiPearl, que ha seleccionado el núcleo Zeus para alimentar su procesador de servidor de primera generación, que apuntala los planes de exaescala de Europa.

Además de la supercomputación, Gorda cita aplicaciones para EVS en procesamiento multimedia, cifrado / descifrado, procesamiento de red y entornos de borde.

En una sesión informativa previa celebrada para los medios de comunicación la semana pasada, Arm presentó los primeros resultados de la emulación para V1 mostrando una velocidad de nivel de implementación más rápida que N1 (ver gráficos de barras arriba).

Los socios de silicio tendrán control total sobre las transiciones de voltaje y frecuencia de la SVE, dijo Bergey. Esto les permite funcionar a máxima frecuencia mientras ejecutan código SVE, como es capaz de hacerlo la CPU A64FX de Fujitsu.

Bergey dijo que Arm continúa avanzando en su hoja de ruta de interconexión con inversiones tanto en CCIX como en CXL.

CCIX se usa para comunicaciones bidireccionales consistentes y hay mucha flexibilidad en cómo se usa, dijo Bergey.

Si bien el caso clásico es el procesamiento de múltiples sockets, existe un caso de uso emergente para chiplets. «Ha escuchado los beneficios: el tamaño del molde disminuye, el rendimiento aumenta, los costos disminuyen y le permite seguir aumentando el número de núcleos y el rendimiento», dijo Bergey.

Arm también está explorando cálculos heterogéneos estrechamente acoplados. «A medida que la escala de la ley de Moore se ralentiza, existe interés en el emparejamiento de chip a chip de CPU ARM complejas con una variedad de aceleradores y memoria», dijo Bergey.

Comparación de la serie N, la serie V y la serie E (fuente: brazo)

La empresa también tiene planes para CXL, que proporciona un vínculo coherente con la memoria. Bergey destaca los casos de uso, «los más esperados [being] agrupación y expansión de memoria. «

Permite «compartir una gran cantidad de memoria entre un conjunto de nodos conectados o simplemente podría significar adjuntar una gran cantidad de memoria emergente a un solo nodo», dijo, destacando los beneficios de entrenamiento e inferencia del aprendizaje automático. .

Mientras que V1 enfatiza el rendimiento óptimo para las cargas de trabajo más exigentes, N2 aborda el rendimiento de escalamiento horizontal. «No tendrá el rendimiento por subproceso de V1, pero admitirá múltiples núcleos a un TDP constante», dijo Bergey.

Agregó que si bien no hay límite para la cantidad de núcleos por CPU, los clientes tienen un TDP alrededor del cual quieren optimizar, que se relaciona con los objetivos de recuento de núcleos.

“Estamos optimizando el rendimiento por potencia y el rendimiento por área. Y esto le permite poner más núcleos por TDP. Ya sea un SOC en la nube de 250 vatios o una estación base 5G de 20 vatios «, dijo.

Arm espera que su IP V1 se implemente en nodos de proceso de 7 nm y 5 nm con diferentes clientes que aprovechen cualquiera de estos dos nodos según su tiempo.

Bergey señala que las mejoras de rendimiento que están proyectando para V1 y N2 están basadas en IPC y no relacionadas con los nodos.

La tracción para los chips de servidor Arm sigue creciendo. AWS debutó el año pasado con su procesador Graviton2 basado en N1. Ampere probará sus procesadores N1 de 128 núcleos (Altra Max) a finales de este año. Fugaku aprovechó una plataforma Arm personalizada (A64FX, desarrollada por Fujitsu y Riken) para establecer más récords de evaluación comparativa y ayudar en la lucha contra COVID-19. Marvell ha tenido cierto éxito con su implementación Arm ThunderX (reclamando el primer sistema Arm de petascale en 2018 y acumulando muchas otras grandes victorias de diseño), pero recientemente anunció un pin para semi-personalizado.

El impulso de la construcción ha llamado especialmente la atención de la empresa de chips y centros de datos Nvidia. Habiendo profundizado ya en el soporte para las plataformas Arm, Nvidia decidió perseguir a la propia empresa. A la espera de la aprobación regulatoria, Nvidia adquirirá el brazo de chips IP de la empresa matriz, Softbank, por 40.000 millones de dólares.

Recuerda compartir en en tu Twitter y Facebook para que tus colegas lo vean

??? ? ? ???

Comparte