Appro agrega GPU "Fermi" a la cartera de HPC - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Appro agrega GPU «Fermi» a la cartera de HPC

Hola y mil gracias por leerme. Yo soy Simón Sánchez y esta vez te voy a contar sobre Appro agrega GPU «Fermi» a la cartera de HPC

Los nuevos productos «Fermi» de la serie Tesla 20 de NVIDIA están a punto de salir a la carretera y los proveedores de HPC están haciendo cola para recibir las últimas novedades sobre GPU en sus máquinas. Esta semana, el fabricante de clústeres HPC Appro lanzó dos sistemas basados ​​en Fermi: una oferta GreenBlade actualizada con aceleración de GPU y un servidor 1U completamente nuevo que pone 2 CPU y 4 GPU en la misma caja.

Lanzado es quizás una palabra demasiado fuerte. Según John Lee, vicepresidente de soluciones de tecnología avanzada de Appro, los nuevos productos no se enviarán hasta finales de mayo o principios de junio, cuando los chips Fermi finalmente comenzarán a enviarse por fábricas de TSMC en volumen. Pero Appro ya está tomando pedidos para los nuevos sistemas y espera que el hardware CUDA de tercera generación de NVIDIA encienda un incendio en el negocio de aceleración de GPU.

Como especialista en HPC, Appro ha seguido el auge de la computación con GPU NVIDIA con gran interés. Fermi es el primer procesador de gráficos en traer memoria ECC, soporte de hardware para C ++ y más de medio teraflops de doble precisión en el ámbito de la computación GPU. Con el procesador vectorial a punto de debutar, lo que alguna vez fue una rivalidad de dos CPU entre Intel y AMD es ahora una carrera a tres bandas mucho más interesante. «Creo que es un hito bastante importante para la informática de alto rendimiento», dice Lee.

Ambas nuevas ofertas de Appro utilizarán los módulos Tesla M2050 de NVIDIA, que están integrados en las placas base del sistema en lugar de conectarse como una tarjeta independiente que se conecta a una ranura PCIe. Aparentemente, los dispositivos de la serie M son los únicos que NVIDIA certificará para la implementación del centro de datos. Según Lee, el fabricante de GPU no admite tarjetas de la serie C en factores de forma de montaje en rack. Aquellos están destinados a estaciones de trabajo y sistemas de escritorio únicamente. El M2050 viene con 3GB de memoria GDDR5 y ofrece alrededor de 515 gigaflops de doble precisión por GPU, o un poco más de un teraflop si su aplicación puede salirse con la suya con punto flotante de precisión simple.

La opción Fermi de Appro en GreenBlade se basa en un emparejamiento uno a uno de CPU y GPU. El gabinete de 5U consta de 5 blades de CPU dual conectados a 5 blades de expansión de GPU dual mediante un enlace PCIe. Las CPU pueden ser AMD Opterons o Intel Xeons del modelo más nuevo, pero la mayoría de los FLOPS son proporcionados por GPU. Un gabinete completamente configurado ofrece más de 5 teraflops sin procesar de bondad de doble precisión.

GreenBlade de Fermi está dirigido a implementaciones en clúster de GPU de tamaño pequeño a mediano para usuarios que necesitan un equilibrio de recursos de CPU y GPU o que de otra manera pueden verse limitados por configuraciones de GPU más densas debido a la falta de energía disponible. Una ventaja de la separación de CPU y GPU es la capacidad de actualizar componentes individualmente. Dado que las CPU son GPU con diferentes ciclos de actualización y, en general, la cadencia para la actualización de la GPU es un poco más rápida, debería ser posible insertar nuevos blades cada vez que Intel, AMD o NVIDIA lanzan la próxima generación de su silicio.

El segundo producto de Appro es un nuevo servidor de 1U que contiene cuatro GPU Tesla M2050 más dos CPU (procesadores Xeon 5600 u Opteron 6100). Llamado Tetra – 4 GPU, ¿entiendes? – Appro afirma ser la combinación CPU-GPU más densa de la industria. Cada caja de 1U ofrece dos teraflops de doble precisión, además de cambio. Para el almacenamiento externo, hay soporte para hasta seis unidades SATA de 3TB.

Como puede imaginar, se necesita mucha energía para que Tetra funcione. El servidor viene con una fuente de alimentación de 1400 vatios y 12 ventiladores de refrigeración.

Según Lee, Tetra atiende a dos grupos de clientes: 1) clientes que de otro modo podrían optar por los servidores de cuatro GPU de la serie S de NVIDIA y 2) aquellos que buscan implementar GPU a gran escala y desean maximizar la densidad de punto flotante. en el centro de datos.

Las cajas Tesla 1U de NVIDIA, la generación anterior S1060 y las próximas S2050 y S2070 basadas en Fermi, ofrecen 4 GPU por servidor, pero deben conectarse a una caja de CPU host a través de un cable PCI Express. Al integrar CPU y GPU en el mismo gabinete de 1U, Appro cree que Tetra puede usurpar una parte de este mercado.

El otro mercado de Tetra es para sistemas realmente grandes donde los códigos se escalan particularmente bien en la GPU: aplicaciones de petróleo y gas y todo tipo de códigos científicos que tienen un apetito insaciable por las matemáticas matriciales. «Con este producto en particular, teóricamente es posible colocar alrededor de 80 teraflops de rendimiento de doble precisión en un solo bastidor», dice Lee. «Estamos muy cerca de alcanzar esos mágicos 100 teraflops por rack».

Si bien Appro no está lanzando precios específicos para Tetra, Lee dice que cree que la nueva plataforma será una solución muy asequible para los usuarios que buscan maximizar el FLOP / dólar de doble precisión. Él estima que un servidor Tetra de nivel de entrada costaría alrededor de $ 11-12,000, mientras que un sistema con una configuración más rica podría costar $ 15-16,000.

Las opciones de configuración más importantes para ambos sistemas nuevos son el tipo de CPU y la capacidad de memoria. Estas selecciones dependerán principalmente de la cantidad de código que se envíe (o pueda) a la GPU, ya que las aplicaciones no transferidas se limitarán a ejecutarse en el hardware del host de la CPU.

Appro ha proporcionado convenientemente un control inteligente de energía para estos sistemas, de modo que cuando partes de la GPU están inactivas, se pueden apagar. Dado que cada módulo M2050 consume 225 vatios, el ahorro de energía aumentará rápidamente cuando estos sistemas estén en modo solo de CPU. Obviamente, una vez que haya hecho el gasto de comprar todos estos Fermis, habrá muchos incentivos para migrar tantos códigos de producción a la GPU como sea posible, especialmente considerando que el rendimiento por vatio puede ser un orden de magnitud mejor en la GPU que en su contraparte de CPU.

Lee dice que el fruto más bajo de la aceleración de la GPU es el sector energético y los grandes laboratorios gubernamentales, con las empresas de biotecnología y las instituciones financieras en segundo lugar. Una de las primeras instalaciones para el equipo Fermi de Appro será en el Instituto Politécnico de Virginia y la Universidad Estatal. Se espera que el sistema se implemente en julio. La compañía también tiene un pedido de una compañía de petróleo y gas, que permanecerá en el anonimato.

Aunque Appro es uno de los primeros proveedores de clústeres en salir con las nuevas ofertas de Fermi (el proveedor de HPC ODM, AMAX, presentó una vista previa de sus ofertas de la serie Tesla 20 el mes pasado), Supermicro también anunció su nuevo equipo Fermi. semana. Espere que más proveedores de sistemas HPC, grandes y pequeños, desplieguen su última maquinaria acelerada Tesla en las próximas semanas.

Deberías compartir en una historia de tu Instagram para que tus amigos opinen

??? ? ? ???

Comparte