Todos los detalles descubiertos en la supercomputadora china - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Todos los detalles descubiertos en la supercomputadora china

Hola de nuevo. Soy Simón Sánchez y en el día de hoy hablaremos sobre Todos los detalles descubiertos en la supercomputadora china

A fines de mayo, un grupo internacional de investigadores de computación de alto rendimiento se reunió en el Foro Internacional HPC en Changsha, China. Una de las conversaciones detalló las especificaciones para el nuevo sistema Tianhe-2, que como informamos la semana pasada se espera que encabece la lista Top 500 de las supercomputadoras más rápidas del mundo.

Representación artística del sistema tal como aparecerá una vez que se implemente finalmente en su destino final.

Como se señaló anteriormente, el sistema se alojará en el Centro Nacional de Supercomputación en Guangzhou y su objetivo era proporcionar una plataforma abierta para la investigación y la educación y proporcionar un servicio informático de alto rendimiento para el sur de China.

El Dr. Jack Dongarra de la Universidad de Tennessee y el Laboratorio Nacional de Oak Ridge, uno de los fundadores de Top500, estuvo presente en el evento en China y compartió un borrador de documento que ofrece detalles en profundidad sobre la gama completa del Tianhe-2, que, salvo sorpresas completamente inesperadas, superará con creces al Titán construido por Cray.

El Tianhe-2 de 16.000 nodos construido por Inspur se basa en Ivy Bridge (32.000 sockets) y 48.000 tarjetas Xeon Phi, para un total de 3.120.000 núcleos. Cada nodo tiene 2 sockets Ivy Bridge y 3 tarjetas Phi.

Según Dongarra, hay algunos resultados nuevos y notables de LINPACK:

Se me enviaron resultados que mostraban una ejecución de referencia de HPL con 14.336 nodos, que se realizó con 50 GB de memoria de cada nodo y logró 30,65 petaflops en un pico teórico de 49,19 petaflops o una eficiencia del 62,3% del pico teórico que tarda poco más de 5 horas en completarse.El resultado más rápido que se mostró fue el uso del 90% de la máquina. Esperan realizar mejoras y aumentar la cantidad de nodos utilizados en la prueba.

Esto ciertamente parece confirmar que este será el mejor sistema en la lista de junio de este mes. Pero echemos un vistazo más de cerca a algunos elementos arquitectónicos para contextualizar estos números …

Curiosamente, cada una de las tarjetas Phi tiene 57 núcleos en lugar de 61. Esto se debe a que estaban al principio del ciclo de producción en ese momento y el rendimiento era un problema. Sin embargo, cada uno de los 57 núcleos puede presumir de 4 hilos de ejecución, y cada hilo puede alcanzar 4 flops por ciclo. Según la estimación de Dongarra, el tiempo de ciclo de 1,1 GHz produce un pico teórico de 1,003 teraflops para cada elemento Phi.

Cada nodo está cargado con 64 GB de memoria, cada uno de los elementos Phi viene con 8 GB de memoria para un total de 88 GB de memoria por nodo para un total de 1,404 petabytes de memoria completa del sistema. No hay muchos detalles sobre la infraestructura de almacenamiento, pero hay un sistema de almacenamiento paralelo compartido global con 12,4 petabytes.

Según Dongarra, hay «2 nodos por tarjeta, 16 tarjetas por marco, 4 marcos por rack y 125 racks componen el sistema». Dice que la placa de cálculo tiene dos nodos de cálculo y se compone de dos mitades: CPM y APM. La parte CPM de la tarjeta contiene los 4 procesadores Ivy Bridge, memoria y 1 tarjeta Xeon Phi, mientras que la mitad CPM contiene las 5 tarjetas Xeon Phi.

También hay 5 conexiones horizontales ciegas push-pull en el borde; las conexiones de los Ivy Bridges a cada uno de los coprocesadores se realizan a través de PCI-E 2, que tiene 16 carriles y 10 Gbps cada uno. Dongarra señala que el diseño y la implementación reales de la tarjeta son para PCI-E 3.0, pero Phi solo es compatible con PCI0E 2. También hay una conexión PCI-E a la NIC.

Ya sabíamos que era un sistema de la empresa china de TI Inspur. Según Dongarra, «Inspur ha contribuido a la producción de placas de circuitos impresos y también contribuye a la instalación y prueba del sistema». En este punto, el sistema aún se está ensamblando y probando en la Universidad Nacional de Tecnología de Defensa antes de ser instalado en su ubicación permanente.

Como sabemos por el sistema Tianhe-1A original, NUDT trabajó duro en sus interconexiones. En el TH-2, están usando su red de interconexión TH Express-2, que se basa en una topología de árbol grueso con 13 conmutadores, cada uno con 576 puertos en el nivel superior.

Como señala Dongarra, “Esta es una tecnología de transporte híbrida optoelectrónica y opera una red patentada. La interconexión utiliza su propio conjunto de chips. El enrutador ASIC de alta resolución llamado NRC tiene un tamaño de 90 nm con una tuerca de 17,16 × 17,16 mm y 2577 pines. «

Afirma que “el rendimiento de un solo NRC es de 2,56 Tbps. La interfaz de red ASIC llamada NIC tiene el mismo tamaño y paquete que las características de la NIC, el tamaño del troquel es 10,76 × 10,76 mm, 675 pines y utiliza PCI-E G2 16X. Una operación de transmisión a través de MPI se estaba ejecutando a 6.36 GB / sy la latencia medida con 64K de datos dentro de 12,000 nodos es de aproximadamente 85 us.

Dongarra dice que la huella de 720 pies cuadrados significa un espacio bastante limitado y no está distribuido de manera óptima. Sin embargo, esto es solo temporal, ya que cuando llegue a su ubicación permanente en Guangzhou, se distribuirá de manera más eficiente, como se ve en la interpretación del sistema por parte del artista al comienzo del artículo.

El consumo máximo de energía bajo carga para el sistema es de 17,6 MW, pero esto es solo para los procesadores, la memoria y la red de interconexión. Cuando se agrega agua helada junto con las operaciones personalizadas de la unidad de enfriamiento de agua líquida, el consumo total es de 24 MW. Dongarra afirma tener una alta capacidad de enfriamiento de 80 KW y una vez instalado en su sitio de origen, utilizará el agua de la ciudad como fuente. La carga actual es monitoreada por una serie de luces en las puertas del gabinete.

Para obtener más detalles sobre estos y otros aspectos del sistema Tianhe-2, consulte el extenso informe del Dr. Dongarra …

http://www.netlib.org/utk/people/JackDongarra/PAPERS/tianhe-2-dongarra-report.pdf

Puedes compartir en tu Facebook para que tus amigos lo flipen

??? ? ? ???

Comparte