Evaluación integral de los beneficios de costos de la nube HPC - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Evaluación integral de los beneficios de costos de la nube HPC

Hola, un placer verte por aquí. Te escribe Simón Sánchez y hoy vamos a hablar sobre Evaluación integral de los beneficios de costos de la nube HPC

HP Labs ha colaborado plenamente con la Universidad de Illinois en Champaign-Urbana para evaluar la viabilidad de ejecutar aplicaciones de alto rendimiento en la nube. La investigación se propuso responder a muchas preguntas, incluida la pregunta de cómo funcionan las aplicaciones de HPC en la nube en comparación con las supercomputadoras (utilizaron las máquinas Ranger y Taub para esas pruebas), qué aplicaciones eran las más adecuadas para la implementación en la nube y cuáles. fueron los beneficios económicos para que ciertas organizaciones mantengan sus necesidades de alto rendimiento en una nube.

A continuación se muestra una cuadrícula de todas las plataformas utilizadas para probar sus diversas aplicaciones. Como puede ver, los sistemas Ranger y Taub están presentes junto con las instancias de nube pública y privada.

Es importante tener en cuenta el enfoque adoptado por el equipo de investigación al configurar sus sistemas en la nube. Si bien podrían haber creado una instancia dedicada que funcionaría más cerca de los estándares de supercomputación, pensaron que tal instancia sería poco probable en el escenario de una empresa mediana o startup que busca comprar recursos de HPC a pedido. .

Dicho esto, todavía han tomado medidas para optimizar el rendimiento. “Para obtener el máximo rendimiento de las máquinas virtuales, hemos evitado compartir núcleos físicos entre núcleos virtuales. En el caso de la nube, la implementación más común de la tenencia múltiple no es compartir núcleos físicos individuales, sino más bien a nivel de nodo, o incluso más burdo. Esto es aún más cierto a medida que aumenta el número de núcleos por servidor «.

Probaron esos sistemas en la nube y supercomputadoras de control en una variedad de aplicaciones, incluido Jacobi2D, utilizado para simulación científica y procesamiento de imágenes, NAMD, una aplicación de dinámica molecular, ChaNGa, utilizado para simulación cosmológica, y el problema NQueens entre otros.

Los gráficos anteriores muestran cómo se ha escalado el rendimiento de las distintas máquinas con respecto a las diversas aplicaciones. Las aplicaciones que supuestamente encontraron problemas con la escalabilidad fueron las de comunicación intensiva. “IS es un punto de referencia de comunicación intensiva e implica la reorganización y la permutación de datos para su clasificación. Sweep3D también muestra una escala débil y débil después de 4-8 núcleos en la nube. Otras aplicaciones de comunicación intensiva como LU, NAMD y ChaNGa también interrumpen el escalado de la nube privada alrededor de 32 núcleos ”, señala el informe.

En todos los casos, excepto en la nube pública, las aplicaciones EP, Jacobi2D y NQueens aumentaron a 256 núcleos, mientras que la nube pública impuso penalizaciones de rendimiento una vez que se utilizaron más de cuatro núcleos.

Una vez que se estableció la caída en el rendimiento de las nubes, lo cual no fue sorprendente en absoluto, la siguiente tarea fue determinar exactamente qué tipo de penalización se tomó, de modo que pudiéramos correlacionarlo con el costo de compartir esos sistemas en el proceso de determinación. si la nube es realmente un medio rentable de proteger los recursos de HPC.

Para cuantificar la cantidad de variabilidad en la nube y compararla con una supercomputadora, calculamos el coeficiente de variación (desviación estándar / media) para el tiempo de ejecución de ChaNGa en 5 ejecuciones «, indica el informe. Según el equipo de investigación, la cantidad de variabilidad aumenta a medida que aumentan debido a la disminución de la granularidad «. Para el caso de 256 núcleos en la nube pública, la desviación estándar es la mitad de la media, lo que implica que en promedio los valores se distribuyen entre 0,5 veces el promedio es 1.5 veces el promedio, lo que resulta en una baja predictibilidad del rendimiento entre sesiones. En contraste, la nube privada exhibe menos variabilidad «.

En general, la latencia y el ancho de banda en la nube fueron un par de órdenes de magnitud más bajos que los de sus máquinas Ranger y Taub, como se muestra en los gráficos logarítmicos a continuación.

Estos problemas de ancho de banda y latencia dificultan las aplicaciones de comunicación intensiva mencionadas anteriormente, donde obviamente el contacto entre núcleos y nodos para completar un problema es crítico.

Una vez más, los investigadores señalan que una instancia de nube pública dedicada resolvería muchos de estos problemas. Sin embargo, una instancia de este tipo probablemente costaría más y, por lo tanto, sería menos factible para las empresas medianas y las nuevas empresas que la usarían. La configuración de la nube de tenencia múltiple hace que muchas aplicaciones de alto rendimiento sean insostenibles. “El rendimiento de muchas aplicaciones de HPC es muy sensible a la interconexión, como demostramos en nuestra evaluación experimental. En particular, los requisitos de baja latencia son típicos de las aplicaciones HPC que requieren una comunicación sustancial. Esto contrasta con la red Ethernet comercial (1 Gbps ahora equivale a 10 Gbps) que se implementa normalmente en la infraestructura de la nube ”, señala el informe.

Dicho esto, sigue siendo prudente que esas pymes contraten servicios HPC basados ​​en la nube, como muestra el análisis de costos a continuación.

Incluso las aplicaciones de comunicación intensiva funcionan bien hasta una cierta cantidad de núcleos, una cantidad de núcleos que difícilmente será superada por una institución mediana. «La capacidad de aprovechar una gran variedad de arquitecturas diferentes (con diferentes interconexiones, tipos de procesadores, tamaños de memoria, etc.) puede resultar en una mejor utilización a escala global, en comparación con las opciones limitadas disponibles en cualquier organización», el relación sostenida. A continuación se muestra un ejemplo de cómo se vería una arquitectura de este tipo que se basa solo en máquinas basadas en la nube de cuatro núcleos.

El informe continúa afirmando que las instancias dedicadas serían beneficiosas para las grandes instituciones que buscan capacidades explosivas, un concepto que se ha discutido aquí.

Deberías compartir en en tu Twitter y Facebook para que tus amigos opinen

??? ? ? ???

Comparte