Motores y agitadores HPC: Thomas Sterling

Hola y mil gracias por leerme. Yo soy Simón Sánchez y esta vez te voy a contar sobre Motores y agitadores HPC: Thomas Sterling

Ah, Nueva Orleans. The Big Easy. Qué gran selección para la Conferencia de Supercomputación de este año. De hecho, fue en Nueva Orleans donde conocí a Thomas Sterling. Thomas, o «Tron» para sus amigos, amablemente me invitó a unirme a un pequeño grupo para cenar una noche en una conferencia de IEEE el verano pasado. Cenamos en uno de los suntuosos restaurantes del barrio, por supuesto. Fue durante la cena de esa cálida noche de verano cuando descubrí que este hombre muy respetado, el «padre de las uvas de Beowulf», tiene un ingenio agudo y un sentido del humor irreprimible que encontré absolutamente irresistible. No tenía dudas sobre quién sería mi próximo artículo mientras nos dirigíamos a la sede de la Universidad Estatal de Luisiana para SC10.

Calendae: Thomas, me encanta tu apodo, «Tron». ¿Cómo llegaste a ese mango?

Thomas: Tenía la sensación de que estaba a punto de plantear este problema. Mi apodo Tron se remonta a mis días en la Marina, donde era un «tweet», o técnico de aviónica, reparando la aviónica de aviones F4 Phantom. Cuando algo realmente salió mal con la electrónica, los chicos de la tienda culparon al «dios tron». Ahora bien, puede que no haya sido el calamar más motivado en la «navegación», pero cuando había un problema realmente difícil, generalmente era yo quien lo abordaba. De ahí es de donde viene «tron»; alguna asociación con este dios tron ​​ficticio. Es una especie de cumplido, supongo. Más tarde, cuando me desempeñaba como editor del periódico de mi escuela, usé «Tron» como seudónimo, luego como inicio de sesión en el MIT, así como una dirección de correo electrónico para la torpe ARPAnet. Se ha quedado conmigo desde entonces. Como pudo haber escrito Herman Melville, «Llámame Tron».

Calendae: Hablando de nombres, usted es muy considerado como «el padre de los clústeres de Beowulf» y por su investigación sobre la arquitectura informática petaflops. Recuerdo que Woody Allen dijo una vez que nunca debes tomar una clase en la que te obligaran a leer «Beowulf». (Risas) Sin embargo, en serio, ¿por qué eligió ese nombre para su enfoque de los grupos de productos básicos?

Thomas: (Riéndose) El nombre era, me avergonzaría admitirlo, un completo accidente. Estaba sentado en mi oficina en el Goddard Space Flight Center y el director del programa me llamó para decirme que estaban enviando los documentos para mi nuevo proyecto y que necesitaban un nombre para él. Lo he estado posponiendo durante casi un mes. Dijo que no colgaría hasta obtener un nombre, de lo contrario no habría un proyecto.

Respondo bien a las amenazas. Necesitaba inspiración y miré a mi alrededor con desesperación cuando noté la vieja copia de Beowulf de mi madre encima de una pila de libros. Recuerdo haberle dicho al Primer Ministro, y esto es una cita: “Oh, diablos, simplemente llámalo ‘Beowulf’; ¡Nadie se enterará nunca de eso! «Y en serio, así es como sucedió. Alguien en la prensa comenzó a llamar a nuestros clústeres de Linux» sistemas de clase Beowulf «, por lo que ellos, quienesquiera que fueran, se llevan el mérito de darles ese nombre a los clústeres.

Creo que hay una lección aquí; No estoy seguro de qué es.

Calendae: ¿Cuál es su posición en la memoria compartida en relación con la memoria distribuida? ¿Continuaremos construyendo computadoras a petaescala con memoria compartida global, similar a los productos heredados de Sun o SGI, o cree que la programación será diferente?

Thomas: Este es un tema importante y refleja la diversidad de experiencias que impulsan la perspectiva y por ende el conflicto. Uno de los principales problemas es nuestra terminología; nuestras palabras no nos proporcionan un léxico eficaz para considerar todas las posibilidades. Por ejemplo: «memoria distribuida». ¿Significa esto separar físicamente con distancia intermedia los bloques de memoria que no comparten un espacio de nombres unificado, ambos, o algo más? Cuando los tiempos de acceso a la memoria no están dominados por el tiempo de ciclo de la DRAM sino por la latencia de la comunicación, se trata de memoria distribuida. Espero que este sea el caso de las máquinas más grandes del futuro. También espero que se requiera soporte de hardware para el espacio de direcciones global y los espacios de nombres unificados para la eficiencia, la capacidad de programación y la escalabilidad. Parece «memoria compartida». Pero ahora está el último problema: ¿es coherente la caché? Y la respuesta es: no, no en el sentido común. ¡Pero la explicación completa es demasiado larga para una breve entrevista!

Calendae: Hablando de eso, todavía hay personas que anhelan los días en que las supercomputadoras estaban especializadas, diseños personalizados no construidos con productos electrónicos de consumo como los clústeres de Beowulf. ¿Qué le dices a esa gente? ¿Volveremos alguna vez a utilizar la tecnología creada específicamente para HPC?

Thomas: Soy de los que creen que el diseño basado en requisitos de HPC es esencial para avanzar en el campo hacia Exascale. Sin embargo, estos mismos cambios también serán útiles para la computadora genérica y comercial.

Muchas ideas realizadas inicialmente en proyectos de HPC «especializados» han migrado al microprocesador genérico común de hoy en día. Mi expectativa es que continuaremos usando dispositivos genéricos, pero cambiarán según las necesidades de escalabilidad, eficiencia y programabilidad paralela.

Calendae: He oído que también se refiere a nuevos «patrones de ejecución». Qué significa eso? ¿Qué pasa con los modelos de ejecución actuales?

Thomas: Un modelo de ejecución es un conjunto de principios rectores que guían el co-diseño y el funcionamiento de las muchas capas interoperables de un sistema informático. Permite el uso de la noción de «cadena de decisiones» que reconoce un conjunto de influencias contribuyentes. Comprender la cadena de decisiones ayuda a determinar por qué se realizó la operación dónde y cuándo se realizó.

Durante la extraordinaria evolución de la supercomputación, que abarca doce órdenes de magnitud en una sola vida, las tecnologías avanzadas han requerido ajustes en la forma en que organizamos las estructuras y los métodos de operación. Por ejemplo, un cambio en el equilibrio entre el ancho de banda y la capacidad. Al menos cinco veces hemos visto una revolución en la supercomputación. Se espera un «cambio de sexta fase», que se representa mejor como un nuevo modelo de cálculo.

HPC se encuentra en medio de un cambio de fase de este tipo porque ya hemos visto que las tecnologías requieren diferentes formas de organizar sistemas, como aceleradores de múltiples núcleos y GPU. CSP y MPI no satisfarán las necesidades de todas las aplicaciones en todas las clases de sistemas.

Calendae: Entonces, está de acuerdo con las personas que piensan que MPI se acabó y necesitamos algo nuevo pronto. ¿Estás trabajando en modelos de programación alternativos?

Thomas: MPI no está cerca del final de su cuerda, pero necesitamos algo nuevo pronto. MPI, incluso en su forma actual, servirá para muchas aplicaciones en muchos sistemas durante muchos años.

Calendae: Uno de sus amigos de Caltech me invitó a preguntarle esto; ¿Qué extrañas de Caltech?

Thomas: No hay duda, Caltech es un lugar especial e incluso después de cinco años me da nostalgia de vez en cuando. Existe la mentalidad de que cualquier cuestión fundamental en ciencia o ingeniería puede ser investigada por mentes brillantes para revelar algunos, si no todos, sus secretos. Es el derecho a luchar, a superar, a comprender, lo que más extraño. Ah, y limonadas de fresa en el Ateneo, claro.

Calendae: Entonces, ¿hay cosas que pueda hacer en LSU que sean más fáciles que si todavía estuviera en Caltech?

Thomas: ¡Unirme a la facultad de LSU fue un riesgo, tanto para LSU como para mí! Una gran escuela estatal es un entorno muy diferente a los círculos intelectuales boutique como Caltech, y eso me preocupó. Nunca antes había trabajado como profesor titular y esto también era un riesgo para LSU. Querían que alguien expandiera rápidamente su programa de investigación al área de sistemas HPC con una alta exposición nacional. LSU, con el apoyo del estado de Louisiana, estableció el Centro de Computación y Tecnología que integró las capacidades de los departamentos académicos al proporcionar un entorno de investigación interdisciplinario avanzado para promover los objetivos tanto de LSU como de Louisiana. Esta resultó ser una gran elección y tanto LSU como yo nos beneficiamos de esta nueva relación.

Calendae: ¿Qué puede compartir con nosotros sobre la investigación que está haciendo en LSU con «ParalleX»?

Thomas: La investigación que hemos realizado en LSU es arriesgada y está guiada por la premisa de que el campo de HPC se encuentra en ese sexto cambio de fase, como se discutió anteriormente. El modelo de ejecución de ParalleX es una nueva síntesis de una colección de construcciones abstractas, relaciones y mecanismos funcionales para abordar el hambre, la latencia, la sobrecarga y la contención en sistemas que comprenden más de mil millones de entidades que se ejecutan simultáneamente con latencias en el caso. peor que el orden de cien mil ciclos. Recientemente, el grupo LSU se asoció con Guang Gao en la Universidad de Delaware, un experto en muchos campos relacionados, para expandir y mejorar el producto de esta investigación bajo los auspicios del programa DARPA UHPC, el equipo X-Caliber dirigido por Sandia, y el equipo Runnemede dirigido por Intel.

Calendae: Esta es mi pregunta de «vive tu sueño»: si pudieras agitar una varita mágica y cambiar algo en la forma en que HPC es hoy, ¿qué sería?

Thomas: (pausa) Básicamente, se trata de tener núcleos diseñados para funcionar de manera eficiente en el contexto de mil millones de otros núcleos similares en un solo problema computacional, lo que nos devuelve a la noción de una sola computadora en lugar de una gran colección suelta de núcleos utilizando software I / O administrado.

Quizás esto suene como algo salido directamente de Hogwarts.

Calendae: He experimentado de primera mano su incontenible sentido del humor. ¿Qué es lo más divertido que has visto en esta industria?

Thomas: (Risas) Siempre me meto en problemas cuando pienso que algo es gracioso, pero el humor a menudo se pierde en los demás. Una vez, durante un discurso en Los Alamos, hablé sobre la primera computadora de bajo consumo, «Green Destiny» que, lamentablemente, no funcionó bien, al menos inicialmente. Comenté: “No entiendo. ¿Por qué no simplemente desconectan? ¡Ahorrarían aún más energía y obtendrían casi el mismo rendimiento! «Nunca me han invitado a regresar.

En un panel en la conferencia de Supercomputación de un año, un miembro de la audiencia preguntó sobre el multiproceso y yo (sin pensar en las consecuencias) comenté que «podemos agradecer a Intel por asociar la palabra ‘hiper’ con el número ‘2’».

No me invitaron a una sola sesión de Whisper Suite ese año.

Calendae: ¿Puede compartir conmigo dos o tres cosas interesantes sobre usted que relativamente pocos (o ninguno) de sus colegas o amigos conocen?

Thomas: Tratar de encontrar mi lado humano puede ser una empresa inútil. Puede que no exista, y dudo que sus lectores encuentren algo más que mis contribuciones de interés. Sin embargo, aquí va. Uno: me encanta navegar; Tenía un balandro J-105 llamado «No Compromise». Dos: me fascina la historia de las culturas de la Edad del Bronce y cómo las tecnologías emergentes las guían hacia estructuras de civilización cada vez más complejas. Tres: disfruté del kayak de río de larga distancia en el Ártico; y sigo practicando kayak hoy, aunque no tanto como antes.

Calendae: Finalmente, ¿cuál considera su mayor logro personal?

Thomas: No quiero ser trivial, pero no creo que lo haya hecho todavía. Espero contribuir a la nueva clase de sistemas que ofrecen rendimiento Exaflops y gráficos dinámicos efectivos para el cálculo simbólico. Creo que estas contribuciones tomarán la forma del nuevo modelo computacional como ParalleX, como una abstracción guía y su manifestación como una nueva estructura de software del sistema y una nueva arquitectura básica para operaciones simbióticas entre miles de millones de elementos ejecutivos. Si puedo contribuir de alguna manera a esta «6ª etapa de HPC», la consideraré mi mejor logro personal.

Acerca de

Un ávido observador de HPC y un profesional establecido en marketing de tecnología; Caroline reside en el Área de la Bahía de California y recientemente se unió al equipo de Calendae como editora colaboradora. Puedes contactarla en [email protected].

Deberías compartir en tu Facebook para que tus colegas lo disfruten

??? ? ? ???

Comparte