T-Platforms se basa en la interconexión de supercomputación sin conmutador - Calendae | Informática, Electrónica, CMS, Ciberseguridad

T-Platforms se basa en la interconexión de supercomputación sin conmutador

Hola de nuevo. Soy Simón Sánchez y hoy te voy a contar sobre T-Platforms se basa en la interconexión de supercomputación sin conmutador

El fabricante ruso de supercomputadoras T-Platforms continúa su impulso hacia el extremo de élite del mercado de HPC. El lunes, la compañía dio a conocer una empresa conjunta con un grupo de la Universidad de Heidelberg para desarrollar una nueva interconexión ultrarrápida para supercomputación de alta gama. El objetivo es llevar la tecnología al mercado en forma de ASIC, que se puede incorporar a un controlador de interfaz de red (NIC) para servidores HPC.

La tecnología, llamada EXTOLL, para interconexión de latencia extrema baja, nació de un proyecto de investigación dirigido por el profesor Ulrich Brüning en el Grupo de Arquitectura de Computación de la universidad. El equipo ha creado un prototipo funcional basado en FPGA con fines de demostración y desarrollo de software, pero el objetivo final es desarrollar un ASIC para producción comercial.

En pocas palabras, EXTOLL es una interconexión sin interruptores diseñada para una latencia extremadamente baja, un ancho de banda alto y una escalabilidad extrema. Este último atributo es particularmente crítico para construir máquinas HPC a gran escala, que pueden contener decenas de miles de servidores informáticos. Según Anton Korzh, arquitecto de hardware de T-Platforms, la implementación inicial de EXTOLL admitirá hasta 64.000 nodos y al menos cien núcleos por nodo. Incluso con la generación actual de procesadores, esto permitiría a los sistemas llegar bien al ámbito de múltiples petaflop.

Ya existe una implementación del software EXTOLL MPI, que se ha desarrollado y probado en el prototipo FPGA. Dado que esta tecnología está destinada a supercomputación a petascala, también se está trabajando en la compatibilidad con entornos de lenguaje PGAS (Global Address Space). Es necesario incorporar algo de soporte en el sistema operativo, y T-Platforms planea incorporar el conocimiento EXTOLL en su propio sistema operativo HPC personalizado, ClustrX. En general, la pila de software propietario sería el principal obstáculo para un uso más amplio de la tecnología.

Desde el punto de vista de la latencia, EXTOLL apunta a un territorio de menos de un microsegundo. Los investigadores de Heidelberg creen que pueden alcanzar 500 nanosegundos (ns), de NIC a NIC. No se requieren conmutadores externos (la lógica del conmutador es parte del NIC ASIC) y cada salto en la red agrega solo 60 ns de retraso. Entonces, incluso la peor latencia de transmisión para una supercomputadora de 10,000 nodos sería de alrededor de 3 microsegundos, asumiendo un diseño de red toroidal 3D, que es lo que T-Platforms tiene en mente para su implementación.

El ancho de banda también está dirigido al extremo superior del espectro. Cada una de las seis conexiones EXTOLL en la NIC podrá transferir 120 gigabits / segundo, lo que equivale a aproximadamente 90 GB / seg para un solo dispositivo. Esto es aproximadamente 2,5 veces la velocidad de la generación QDR InfiniBand actual y la coloca en el ámbito de la interconexión Cray Gemini de 160 GB / s utilizada en las últimas supercomputadoras XE6 «Baker» de la compañía.

El diseño original de EXTOLL se basó en el protocolo HyperTransport, que limitaría efectivamente su uso en supercomputación a servidores basados ​​en AMD Opteron. T-Platforms convenció a los investigadores de la universidad para que también incorporaran compatibilidad con PCI-Express (PCIe), para que puedan construir hardware con silicio Intel. La hoja de ruta actual incluirá soporte para PCIe 3.0 e HyperTransport 3.0. Vale la pena señalar que el futuro sistema de interconexión de Cray, denominado «Aries», también admitirá PCIe, y por la misma razón. La tecnología Aries es la continuación de la interconexión Gemini y se utilizará en las próximas supercomputadoras de clase Cascade.

Si bien es difícil comenzar a comparar las plataformas T con Cray, el proveedor ruso parece estar siguiendo el modelo de Cray de colocar una interconexión patentada en la parte superior de las partes básicas x86 para sus supercomputadoras de primera línea. La gran diferencia es que T-Platforms adquirió la tecnología en lugar de desarrollarla internamente. El acuerdo entre T-Platforms y la Universidad de Heidelberg otorga a la empresa una posición de participación en la empresa conjunta. A cambio, T-Platforms está invirtiendo una suma no revelada en el proyecto para ayudar a trasladar la tecnología a la fabricación comercial.

La idea es que el fabricante de supercomputadoras obtenga los primeros datos sobre la nueva interconexión para que pueda incorporarse en un futuro producto blade dirigido al extremo superior del mercado de HPC. T-Platforms tiene la intención de mantener su blade basado en InfiniBand, incluso para aquellos sistemas que no requieren una escalabilidad extrema. Según Korzh, la compañía tiene la intención de pasar a un diseño de hoja más modular para que la tecnología de interconexión (o incluso ambas) se pueda adaptar en la misma placa base.

La oferta basada en EXTOLL ya está en desarrollo y se espera que se lance en el cuarto trimestre de 2011, cuando comenzará la producción de los NIC ASIC. los Grupo EXTOLL también está interesado en producir un producto independiente que presumiblemente tomaría la forma de un adaptador de red basado en PCIe que podría conectarse a servidores estándar. Eso sería una configuración bastante buena para, digamos, una supercomputadora de tamaño mediano. Aunque las NIC EXTOLL seguramente serán más caras que sus InfiniBand o Ethernet comunes, el hecho de que se pueda eliminar la conmutación externa podría crear un modelo de clúster de escalamiento horizontal atractivo.

Sin embargo, hacer despegar la tecnología no será barato. Los costos típicos para el desarrollo de ASIC por sí solos pueden ascender fácilmente a millones de dólares. Convenientemente, T-Platforms anunció recientemente una inyección de dinero del «Banco de Desarrollo y Asuntos Económicos Exteriores» (Vneshekonombank), administrado por el estado, y aunque no se convocó ningún proyecto específico, el propósito declarado de la inversión era «expandir T – Los esfuerzos de investigación y desarrollo de supercomputación de las plataformas, además de brindar apoyo para la expansión de la compañía en el mercado global de HPC «. Estas maniobras parecen estar diseñadas como parte de una estrategia concertada para expandir el alcance de la compañía rusa en la Unión Europea y más allá.

Por el momento, sin embargo, Europa parece ser el principal objetivo de las aspiraciones de supercomputación de T-Platforms. El mercado de supercomputadoras de alta gama de Rusia (y de la ex Unión Soviética) es demasiado pequeño, mientras que el mercado estadounidense, representado principalmente por laboratorios del DOE, centros de investigación del Departamento de Defensa y centros de supercomputación de la NSF, tiene el mandato implícito de comprar estadounidenses. Dicho esto, una oferta diferenciada de alta gama de T-Platforms podría sacudir las posiciones de los actores del mercado europeo establecidos como Bull, Cray e IBM, en particular, y crear un conjunto más diverso de opciones de supercomputación que los estados también disfrutan. Unido.

No te olvides compartir en una historia de tu Instagram para que tus colegas lo vean

??? ? ? ???

Comparte