El sistema emergente sienta las bases para la ciencia a exaescala - Calendae | Informática, Electrónica, CMS, Ciberseguridad

El sistema emergente sienta las bases para la ciencia a exaescala

Hola y mil gracias por leerme. Te escribe Simón Sánchez y en esta ocasión te voy a contar sobre El sistema emergente sienta las bases para la ciencia a exaescala

Hoy damos la bienvenida a un nuevo sistema a gran escala en el redil de la informática de alto rendimiento con el anuncio formal de Cori, un nuevo conjunto de supercomputadoras que se instalará en NERSC a mediados de 2016. Conocido en sus etapas de RFP como NERSC-8, la nueva máquina contará con más de 9,300 nodos, con la arquitectura Knights Landing de próxima generación alojada en un entorno Cray XC.

En solicitud original para las aportaciones de los proveedores al sistema, NERSC dijo que necesitaba un nuevo entorno de HPC para respaldar la amplia gama de proyectos científicos realizados en el centro. Este sistema debía «ofrecer una mejora significativa en las capacidades informáticas, con al menos un aumento de diez veces en el rendimiento sostenido sobre el sistema Hopper NERSC-6 en una serie de puntos de referencia representativos». Con 3 teraflops de rendimiento máximo de doble precisión por nodo que se espera de la máquina Cray Cori basada en Knight’s Landing, se espera una mejora notable de 10x (o más). La adición de más de 400 GbS de ancho de banda de E / S y 28 petabytes de disco lo convierten en una verdadera potencia, pero nuevamente, el énfasis real no está en los picos o capacidades, sino en el verdadero rendimiento de la aplicaciones y en el camino hacia el uso de nuevas arquitecturas y enfoques para la ciencia de próxima generación.

Lo interesante de la nueva supercomputadora es que ha sido diseñada como una especie de banco de pruebas para algunas de las barreras clave en el frente de la computación a exaescala, incluida la resiliencia, la programación para explotar enormes niveles de paralelismo y el soporte para aplicaciones de computación científica. datos intensivos en software, hardware, memoria y sistemas de almacenamiento. La clave para explorar soluciones alrededor de estas barreras son la arquitectura multinúcleo autohospedada de Knight’s Landing y los enfoques más nuevos para extender la confiabilidad y el rendimiento con la memoria flash. El propósito del sistema, al igual que la gente de NERSC con la que hablamos antes del anuncio constantemente repetido, era servir a las cargas de trabajo altamente diversas de más de 5,000 usuarios que usarán el sistema … no apelar a los puntos de referencia basados ​​en computadoras. como LINPACK, incluso si ese sentimiento no es nuevo en estos días.

Si bien a menudo hemos escuchado variables sobre si aparecerán núcleos de procesador Knight’s Landing en este sistema, Katie Antypas, jefa del departamento de servicio de NERSC, dijo que habrá «más de sesenta núcleos» en cada una de las tarjetas. Pero como Antypas repitió varias veces durante nuestra conversación sobre Cori, el atractivo real tiene mucho menos que ver con la potencia informática que con los requisitos reales de la aplicación. Acceder a la memoria de paquetes de gran ancho de banda con la parte Intel de próxima generación es el verdadero atractivo, señaló. «Esto es fundamental para nuestras cargas de trabajo porque hemos descubierto que la mayoría de nuestras aplicaciones no están limitadas por la computación, sino que están retenidas por el ancho de banda de la memoria». Si bien el rendimiento y la eficiencia son clave, «para los usuarios, tener esta arquitectura autohospedada significa que no tienen que preocuparse por mover datos dentro y fuera de un coprocesador».

Antypas señala que incluso con un entorno de programación familiar y menos énfasis en los desafíos de movimiento de datos dentro del nodo, todavía hay un gran desafío de optimización por abordar. «Sabemos que será un desafío para algunos de nuestros usuarios, ya que tendrán que encontrar más paralelismo para llevar sus aplicaciones a una nueva arquitectura». Sin embargo, dice, «sabíamos que a largo plazo para cumplir con nuestra misión de proporcionar más capacidad de procesamiento para nuestros usuarios, teníamos que ir por la ruta de muchos núcleos y más eficiente».

Hay otro elemento único que el equipo observará antes de la ola de sistemas de exaescala. El contrato incluía una opción para la tecnología de búfer de ráfagas. Básicamente, esta es una capa de NVRAM que se encuentra entre la memoria y el disco para acelerar la E / S en el sistema. Esta es una parte fundamental de lo que Nick Wright, Jefe del Grupo de Tecnologías Avanzadas de NERSC, observará una vez que esté en funcionamiento, tanto en términos de cómo puede abordar algunos problemas clave de confiabilidad como para explorar cómo puede mejorar. las capacidades IOPS cada vez más importantes de la máquina.

Wright dice que su equipo está investigando la opción de búfer de ráfagas para el procesamiento intensivo de datos y abordar la resistencia de HPC tradicional gracias a sus capacidades de reinicio del punto de control. «Para las aplicaciones con uso intensivo de datos, uno de los aspectos de la memoria flash es que tiene IOPS significativamente más altas que el disco giratorio normal; estamos viendo que muchas de las aplicaciones con uso intensivo de datos están limitadas a IOPS y ancho de banda. En general, queremos explorar qué nuevas habilidades en informática científica podemos habilitar «.

Para esta pieza del sistema, Cray trabajará con el lado del software, pero todavía está considerando quién será el proveedor de la pieza de hardware de la ráfaga de búfer. Wright dice que quieren integrar tanta tecnología como sea posible, pero hay una ventaja en esperar. No se espera que la máquina se entregue por un tiempo, por lo que esto les permite superar la caída del precio flash por un tiempo hasta que estén realmente listos para saltar, en lugar de invertir ahora en tecnología para la que aún no están listos. utilizar.

Como dijo Antypas, «Flash proporciona un ancho de banda más barato, por lo que para dar a los usuarios el ancho de banda que necesitan, la gente como nosotros en NERSC ha comprado grandes sistemas de archivos paralelos. Pero el precio del flash ha llegado al punto en que parece mucho más prometedor para nuestro super. Puede ser un aumento significativo en el ancho de banda y acelerar el IO y dedicar más tiempo al procesamiento es lo que queremos hacer «.

Antypas y Wright están de acuerdo en que el búfer de ráfagas, tanto como un punto de control como un reinicio del mercanismo para hacer retrocesos y puntos de control mucho más rápidos y eficientes, así como para impulsar la ciencia intensiva en datos, es algo que esperan ver. en sistemas de exaescala. Esperan compartir las lecciones aprendidas para los sistemas futuros, pero por ahora se están enfocando en la evolución de aplicaciones basadas en la arquitectura de muchos núcleos disponible, lo que representa una buena visión del futuro.

Como resumió Sudip Dosanjh, director del Centro Nacional de Computación Científica de Investigación Energética en el Laboratorio Nacional Lawrence Berkeley, “Cori proporcionará un aumento significativo en las capacidades para nuestros usuarios y proporcionará una plataforma para la transición de nuestra gran comunidad de usuarios a muchas arquitecturas. Básico. Trabajaremos con Cray para asegurarnos de que Cori satisfaga las necesidades informáticas y de datos de la comunidad científica del DOE «.

«Estamos entusiasmados de trabajar con Cray para llevar al mercado la próxima generación de supercomputadoras altamente paralelas basadas en el procesador Intel Xeon Phi, cuyo nombre en código es Knights Landing», dijo Charles Wuischpard, vicepresidente del grupo de centros de datos y gerente general de Intel, Workstation. y cálculo de alto rendimiento. «Trabajando en estrecha colaboración con Cray, implementaremos la arquitectura Many Integrated Core (MIC) en la supercomputadora Cray XC de próxima generación, brindando más de 3 teraflops de rendimiento por nodo de socket único para alimentar un gran conjunto de aplicaciones y dar un paso importante y factible. hacia Exascale «.

Para leer algo importante, consulte el punto de referencia aquí—¡Gracias a nuestros amigos de NERSC y su nueva incorporación!

Deberías compartir en tus redes sociales para que tus colegas lo vean

??? ? ? ???

Comparte