Cray logra el equilibrio con la supercomputadora XC40 de próxima generación - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Cray logra el equilibrio con la supercomputadora XC40 de próxima generación

Hola y mil gracias por leerme. Te escribe Simón Sánchez y en el día de hoy te voy a hablar sobre Cray logra el equilibrio con la supercomputadora XC40 de próxima generación

Esta mañana, Cray dio a conocer todos los detalles de su supercomputadora de próxima generación para seguir los pasos de la familia XC30, que sirve como columna vertebral para varios sistemas Top 500, incluida la máquina «Piz Daint» top ten.

El XC40 recién anunciado ya sirve como base para el enorme sistema Trinity en el Laboratorio Nacional de Los Alamos, la próxima máquina NERSC-8 «Cori» y muchos otros sistemas de lanzamiento temprano instalados en iVEC y otras ubicaciones. Si bien el anuncio del sistema no es inesperado ya que los centros antes mencionados ya han compartido que están instalando sistemas Cray de «próxima generación», la carne está en los detalles. Por ejemplo, sabíamos de un componente de «búfer de ráfagas» en estas máquinas, pero sabíamos poco sobre el nivel de caché de E / S diseñado por Cray, y mucho menos sobre las opciones de configuración en términos de ajuste en el nuevo (y futuro) futuro de Haswell. chips, aceleradores o coprocesadores.

Jay Gould de Cray nos arrojó algo de luz sobre el XC40, señalando los primeros éxitos del automóvil y lo que esperan que sea su trayectoria de gama alta. Gould dice que muchos de los primeros clientes de barcos a gran escala están utilizando las opciones de configuración ofrecidas para construir sistemas de alta frecuencia con una gran cantidad de núcleos que aprovechan las opciones de memoria DDR4 y la nueva oferta de aceleración de E / S DataWarp integrada en XC40.

Si bien los primeros clientes estaban ansiosos por aprovechar los núcleos disponibles con los nuevos procesadores Haswell, Cray no ofrece la gama completa de SKU que Intel lanzó recientemente con sus innovaciones Haswell. Mientras todavía estamos esperando una lista de lo que está por venir, señaló que hay muchos perfiles centrales, de frecuencia y térmicos para elegir, lo cual es solo una parte de su historia de personalización y configurabilidad. Con una duplicación de las mejoras de rendimiento y escalabilidad demostradas hasta ahora con respecto al XC30, Gould dice que ajustar un XC40 para las necesidades de rendimiento de la aplicación no es diferente al XC30 y han tratado de simplificar las actualizaciones (incluyendo la capacidad de conectar nuevas tarjetas Broadwell a medida que llegan) y ofrecer nuevas mejoras, incluida la memoria DDR4.

Gould dijo que cuando se les ocurrió la cifra que ofrecía con una mejora de rendimiento 2X sobre el XC30, esto se basó en la parte de Intel de 16 núcleos y 2.6Ghz (2693 v3), aunque podría haber sido más alta. con la variante de 18 núcleos. La razón, como habrás adivinado, tiene que ver con el calor. Incluso con los sistemas refrigerados por líquido, los chips de 18 núcleos se sobrecalentaron, aunque afirma que los chips de 16 núcleos ofrecen un punto óptimo entre el rendimiento y los problemas térmicos. Cray ofrece una versión simplificada del XC40 refrigerado por aire y 16 hojas en lugar de las 48 hojas del XC40 en una carcasa refrigerada por líquido que los usuarios ya están aprovechando para demostrar sus aplicaciones antes de actualizar a una máquina XC40 completa, aunque el Aquí también se ofrecerán los mismos SKU para el XC40, a pesar de la densidad reducida y el mejor flujo de aire.

Pero dejando de lado las opciones de configuración, esta máquina ofrece mucho más de lo que parece, comenzando por el nivel de diseño de la hoja. Con la llegada de la nueva serie Xeon E5 v3, Cray ha comenzado a repensar el diseño de la hoja existente para asegurarse de que puedan equilibrar todo ese cálculo con más memoria. Han cambiado a DIMM de mayor capacidad en DDR4, lo que proporciona más ancho de banda de memoria por hoja y algunas opciones de memoria, ofreciendo hasta 64-256 GB por nodo.

Sin embargo, la característica más exclusiva del XC40 es una combinación de hardware y software. Cray creó una tercera capa para satisfacer las altas demandas de E / S llamada DataWarp. Esencialmente, es una tecnología de E / S de aplicación doméstica diseñada para abordar los desequilibrios que continúan afectando a los sistemas a gran escala que tienen un abismo de rendimiento y eficiencia que separa los nodos de computación, la memoria local y los archivos sistemas paralelos y discos rotativos. Actualmente, muchos sitios terminan aprovisionando en exceso el almacenamiento para abordar la actividad máxima de E / S, que es costosa, ineficiente y se puede abordar con el concepto de «búfer de ráfagas». El enfoque de Cray implica lo que ve a continuación con SSD en una «hoja de E / S» que se puede conectar a un banco de nodos de cómputo, proporcionando acceso instantáneo a la caché de E / S de nivel de cómputo sin ponerlos todos. datos a través de la red para cumplir con el sistema de archivos y el almacenamiento.

Esto se puede utilizar en el sentido del búfer de ráfagas que Gary Grider, uno de los primeros usuarios del sistema y esta función, describió en detalle no hace mucho tiempo. Sin embargo, este es solo uno de los posibles casos de uso con la capa DataWarp, de ahí el hecho de que Cray evita llamarlo un búfer de ráfagas real en cualquiera de sus primeras publicaciones en el sistema. El punto es que impulsa «70.000 a 40 millones de IOPS» por sistema, lo que supone una mejora de rendimiento 5 veces superior a un sistema basado en disco al mismo precio. Al encontrar el equilibrio adecuado entre procesamiento y memoria y el nuevo disco DataWarp y E / S, podemos reequilibrar estos niveles y ofrecer el rendimiento más rápido ”, dijo Gould.

Esperamos seguir a otros usuarios con anticipación para explorar en un artículo específico algunos de los otros casos de uso de la función DataWarp, incluido NERSC, que lo usa para la aceleración de aplicaciones y el punto de control / reinicio. También esperamos noticias de otras distribuciones de esta máquina en algunos centros globales además de los públicos, incluidos Trinity, Cori y el sistema iVec.

Recuerda compartir en tu Facebook para que tus amigos lo sepan

??? ? ? ???

Comparte