Preocupado por la exaescala - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Preocupado por la exaescala

Hola, ¿qué tal colega?. Te habla Simón Sánchez y esta vez hablaremos sobre Preocupado por la exaescala

Es casi seguro que cualquier evento de HPC al que asista este año prestará mucha atención al impulso hacia la exaescala. La conferencia de HPCC en Newport, Rhode Island esta semana no fue una excepción. Además del tema del «centro faltante», que cubrí en mi publicación anterior, el cálculo a exaescala fue probablemente el mayor objetivo del HPCC este año. Tiene sentido, dado que la multitud de supercomputadoras siempre se inclina hacia adelante, y la exaescala es obviamente la próxima gran novedad.

¿O es eso? Después de escuchar tanto sobre la exaescala durante los últimos dos años, empiezo a preguntarme cuál es la lógica de poner tanto esfuerzo en lo que es esencialmente un hito arbitrario basado en la nomenclatura de nuestro sistema de numeración decimal. ¿Por qué no pensar en los desafíos de los sistemas de 100 petaflops o incluso de 10 petaflops?

Después de todo, ¿por qué no dedicar más recursos a comprender cómo hacer que los sistemas de un solo petaflop y de varios teraflop de hoy sean fundamentalmente mejores? Actualmente, solo hay un puñado de aplicaciones que pueden usar un petaflop de procesamiento. Y solo una pequeña cantidad de sitios pueden incluso instalar una máquina petaflop, dado su costo (más de $ 100 millones) y gasto de energía (varios millones de dólares al año). En 10 años, las máquinas exaflop serán igualmente raras y infrautilizadas.

Lograr que las aplicaciones aprovechen al máximo las supercomputadoras de última generación siempre ha sido particularmente difícil. Nuestra experiencia en la preparación de software, a nivel de aplicación o sistema, para sistemas 10 años después es bastante pobre. Sin embargo, no estoy seguro de qué más podemos esperar. Las características del hardware de los sistemas no nacidos son, por definición, difíciles de anticipar.

Para mitigar este problema, los digestores de HPC están recurriendo al «co-diseño» (es decir, desarrollando hardware junto con software) para proyectos de exaescala. Parece una idea maravillosa, pero sería difícil pensar en historias de éxito utilizando este enfoque. Hay una razón por la que el hardware es lo primero: es la base básica sobre la que se crean las abstracciones superiores del software. Hasta cierto punto, el co-diseño parece querer enseñarle al bebé mientras aún está en el útero.

En el HPCC, cuatro de las 18 sesiones se centraron casi exclusivamente en la exaescala, y muchas otras al menos tocaron el tema. Sin embargo, lo que más me llamó la atención fue el panel de UHPC que discutió el trabajo en desarrollo para el programa de Computación ubicua de alto rendimiento de DARPA. El panel hizo que los directores de cada uno de los cuatro proyectos de UHPC (Angstrom, Runnemede, X-Caliber y Echelon) hablaran sobre sus respectivos enfoques y brindaran una actualización sobre su trabajo.

El propósito de este artículo no me permite desarrollar aquí los detalles de cada esfuerzo de UHPC (pero observe este espacio para obtener cobertura adicional en el futuro). En este contexto, mi principal interés es señalar que UHPC – como señaló el moderador del panel Thomas Sterling – no es un programa a exaescala, per se. La RFP de DARPA que definió este compromiso se centró en la «computación extrema» y el desarrollo de hardware, pilas de software, sistemas operativos y entornos de programación energéticamente eficientes que pueden escalar tanto hacia abajo como hacia arriba.

Uno de los objetivos de UHPC es producir una arquitectura que proporcione un petaflop en gabinete, con una absorción máxima de 57 KW. Son estos sistemas del tamaño de un gabinete los que probablemente sean populares en el Departamento de Defensa de EE. UU. (Y en otros lugares) para fines de la década. Por el contrario, los sistemas de exaescala serán raros e inicialmente servirán como máquinas de propósito especial, al igual que los sistemas de petaescala actuales.

Desarrollar un mejor software y hardware para el nivel actual de supercomputación es un objetivo loable. Hay mucho por hacer en este sentido, por eso creo que el viaje a la exaescala será más importante que su destino.

Éstas son las buenas noticias. La mala noticia es que existe la preocupación de que se pueda reducir la financiación de UHPC. Hubo rumores en la HPCC de que el dinero para apoyar este esfuerzo no llegaría. Esto se planteó durante la sesión del panel, y aunque todos los asistentes parecían conscientes de las incertidumbres sobre la financiación, nadie sabía cómo podría resultar.

De hecho, la angustia presupuestaria del gobierno de EE. UU. Fue un tema de discusión en la conferencia de HPCC y hubo mucho pesimismo. El consenso general fue que, dado el clima político, la HPC financiada por el gobierno podría estar al borde de su propia recesión. El pronóstico de InterSect360 presentado en la conferencia predijo que el HPC del gobierno crecería modestamente este año, pero ese pronóstico podría cambiar rápidamente si los presupuestos federales y locales comienzan a recortar los programas de ciencia y tecnología.

El clima político actual será particularmente problemático para el trabajo a exaescala. La comunidad nunca ha hecho un gran trabajo al explicar el beneficio social de la computación de alto rendimiento que generaría urgencia para aquellos en el gobierno. Ya es bastante difícil destilar el valor de HPC en fragmentos sónicos, pero dado que el HPC a exaescala es particularmente difícil de explicar a tipos no científicos, ese trabajo será especialmente difícil de vender. El plazo de varios años para la exaescala es otro gran inconveniente dadas las perspectivas a corto plazo de la mayoría de los políticos en esta época de dificultades económicas.

Teniendo esto en cuenta, HPC puede entrar en un período de apoyo público limitado. Si es así, es posible que la comunidad deba reorientar sus prioridades, por muy desagradable que parezca. La exaescala ocurrirá inevitablemente. La ley de Moore, las arquitecturas heterogéneas y las interconexiones ópticas se encargarán de ello. Pero podemos terminar a la deriva en exaescala en lugar de conducirlo.

No te olvides compartir en en tu Twitter y Facebook para que tus amigos lo disfruten

??? ? ? ???

Comparte