Una vista previa del sistema operativo Exascale de próxima generación - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Una vista previa del sistema operativo Exascale de próxima generación

Hola y mil gracias por leerme. Te habla Simón Sánchez y en el día de hoy te voy a hablar sobre Una vista previa del sistema operativo Exascale de próxima generación

Hay varias piezas esparcidas por la pila de software de exaescala que se está desarrollando y haciendo clic en todo el mundo. En el corazón de este rompecabezas se encuentra el posible sistema operativo para alimentar tales máquinas.

Esta semana, el Departamento de Energía invirtió $ 9,75 millones para ayudar a completar la imagen de cómo se verá el sistema operativo. La subvención fue para Argonne National Lab para un proyecto multiinstitucional (incluidos los laboratorios Pacific Northwest y Lawrence Livermore, así como otras universidades) para desarrollar un prototipo de un sistema operativo a exaescala y software de tiempo de ejecución asociado.

Para comprender mejor «Argo», el esfuerzo del sistema operativo a exaescala, hablamos con Pete Beckman, director del Instituto de Computación y Tecnología a exaescala y arquitecto en jefe del proyecto Argo. Beckman dice que si bien esperamos las capacidades de estas máquinas a escala, la administración de energía, la enorme competencia y heterogeneidad, así como la capacidad de recuperación general, pueden abordarse a nivel del sistema operativo.

Estas no son preocupaciones inusuales, pero pegarlas al sistema operativo ofrece algunos beneficios, argumenta Beckman. Por ejemplo, puede ajustar el control y la administración de energía en el nivel de carga de trabajo y operación básica con un sistema operativo pequeño, especialmente diseñado y optimizado para HPC.

Fuera del poder, el equipo describe la «tolerancia a la competencia masiva, [met by] una estructura jerárquica para la administración de energía y fallas, así como un mecanismo «insignia» que permite a los administradores y optimizadores de recursos comunicarse y controlar la plataforma.

Beckman y el equipo describen esta jerarquía como un «enclave»: en este modelo, el sistema operativo es de naturaleza más jerárquica de lo que tradicionalmente se piensa. En otras palabras, es fácil pensar en un sistema operativo a nivel de nodo: con Argo hay un sistema operativo global que se ejecuta en la máquina. Esto, combinado con el diseño independiente de la plataforma de Argo, lo hará lo suficientemente flexible como para ser modificado arquitectónicamente y manejable tanto en el sistema como en los niveles de carga de trabajo, todo incluido en un paquete familiar de Linux.

Como se muestra arriba, estos «enclaves» se definen como un conjunto de recursos dedicados a un servicio en particular y capaces de auto-introspección y respuesta. Como describe Argonne, «Pueden modificar la configuración del sistema de nodos y la asignación de energía a diferentes nodos o migrar datos o cálculos de un nodo a otro». En el frente de la confiabilidad, los enclaves que enfrentan fallas pueden hacerlo «a través del reinicio global y otros enclaves que apoyan una recuperación de nivel más precisa».

El reconocible núcleo de Linux de Argo se habrá mejorado y modificado para satisfacer las necesidades de aplicaciones más dinámicas de próxima generación. Mientras el desarrollo de estas aplicaciones prototipo está en marcha, Beckman y el equipo distribuido planean probar la capacidad de Argo para sumergirse en una serie de aplicaciones HPC comunes. Nuevamente, todo esto será al estilo Linux, pero con un shell HPC que reduce el enfoque en los problemas en cuestión.

Como nota al margen, aprovechar los elementos positivos de Linux e incorporar solidez y un ojo para incorporar funciones críticas de administración de energía, simultaneidad y resiliencia parece una buena idea. Si la tendencia se mantiene, el propio Linux seguirá siendo la parte del león (con mucho, el 96% según los informes de ayer) del mercado de sistemas operativos en el Top500.

Se trata más de perfeccionar el papel de Linux que de reconstruirlo, explica Beckman. Si bien Linux actualmente tiene la tarea de administrar el equilibrio de múltiples usuarios y programas con sus recursos, distribuyéndolos de manera justa, el enfoque de Argo se centraría en las partes del código que necesitan llamarse, eliminando algunas de las funciones de equilibrio de recursos. «Podemos reescribir algunos de esos bits y diseñar sistemas de tiempo de ejecución que estén diseñados específicamente para ejecutar esos bits de código rápidamente y no intentar administrar el equilibrio de muchos usuarios y muchos programas».

La idea es tener una parte del chip capaz de ejecutar el kernel de Linux para lo básico; cosas como sistemas de control, inicio, funciones de comando e interfaz, depuración y similares, pero como dice Beckman, «para la parte de HPC, podemos especializarnos y tener un componente especial que reside en el chip».

Si es así, hay algunas piezas de middleware ocultas dentro de Argo. Beckman dijo que el software se acercará más al sistema operativo. Y justo cuando eso suceda, más software estará vinculado a los chips, pase lo que pase en un futuro lejano (digamos 2020 para ser justos). Todo esto es dominio de Argonne: fueron uno de los laboratorios líderes que trabajaron en la unión del procesador y el sistema de archivos, los tiempos de ejecución, la transmisión de mensajes y otras operaciones de software. Beckman espera una fusión de muchas líneas: middleware y sistema operativo y, por supuesto, ambos con el procesador.

«La combinación de estas múltiples vistas y los componentes de software correspondientes a través de un enfoque de sistema completo distingue nuestra estrategia de los diseños existentes», dijo Beckman. «Creemos que es esencial abordar los principales desafíos a exaescala del poder, el paralelismo, la jerarquía de la memoria y la resiliencia».

En la actualidad, numerosos grupos están trabajando en varias piezas del rompecabezas del poder en particular. Este es un tema particularmente importante para el futuro. Si bien el consumo de energía siempre ha sido un problema, Beckman dice que el enfoque ahora es optimizar los sistemas por adelantado, «encender la energía y aceptar que extraerán lo que extraigan». Además de todo el trabajo realizado dentro de la pila para crear súper eficiencias, el sistema operativo tiene un papel que desempeñar en la orquestación del uso «inteligente» de la energía para algunas partes de la computación o partes de la máquina.

Artículos relacionados

Linux Foundation revisa Unix a Linux Seachange en el Top500

Green Flash anuncia un avance potencial en el modelado climático, Exascale Design

Consideraciones sobre la selección de la red del clúster de HPC

Recuerda compartir en tu Facebook para que tus colegas lo flipen

??? ? ? ???

Comparte