El sistema HPC heredado logró la excelencia en supercomputación en UT Dallas - Calendae | Informática, Electrónica, CMS, Ciberseguridad

El sistema HPC heredado logró la excelencia en supercomputación en UT Dallas

Hola, ¿qué tal colega?. En el teclado Simón Sánchez y hoy te voy a contar sobre El sistema HPC heredado logró la excelencia en supercomputación en UT Dallas

¿Qué sucede con las supercomputadoras al final de su vida productiva en un centro de investigación académica?

La pregunta surge a menudo cuando la gente escucha que la edad promedio de una supercomputadora insignia al jubilarse es de alrededor de cinco años. Tenga la seguridad: los sistemas no solo se están demoliendo. En cambio, se donan a organizaciones e instituciones que pueden utilizar su hardware de alto rendimiento.

Un ejemplo reciente es Estampida1, una de las supercomputadoras más poderosas de los Estados Unidos para la investigación científica abierta de 2013 a 2017. Stampede1 manejó más de ocho millones de trabajos y proporcionó más de tres mil millones de horas de computación a la comunidad de investigación nacional.

Un sistema Intel / Dell que alguna vez fue el sexto más rápido del mundo, Stampede1 fue retirado del Texas Advanced Computing Center (TACC) de la Universidad de Texas en Austin en 2017 y donado a varias instituciones. Entre ellos se encontraba la Universidad de Texas en Dallas (UT Dallas), recientemente designada como la universidad de investigación «R1», que buscaba aumentar su capacidad y competencia de procesamiento avanzado.

Chris S. Simmons, director de infraestructura cibernética y servicios de investigación en la Oficina de Tecnología de la Información de UT Dallas.

Históricamente, los recursos informáticos de investigación habían sido casi inexistentes en el campus. En 2017, cuando Frank Feagans se unió a UT Dallas como Director de Información, comenzó a construir un equipo de infraestructura de TI central e invirtió en tecnologías centrales. Luego, en 2018, a través de la iniciativa UT Research Cyberinfrastructure (UTRC), un programa que brinda capacidades de procesamiento avanzadas a las 14 instituciones del sistema de la Universidad de Texas, UT Dallas recibió 20 racks Stampede1.

Estos formaron la columna vertebral informática de Ganimedes – un clúster de 4,786 núcleos que aumentó significativamente la experiencia de computación de alto rendimiento (HPC) en UT Dallas. Chris S. Simmons fue contratado como director de apoyo para investigadores de infraestructura cibernética de UT Dallas en 2018. Había usado supercomputadoras en UT Austin desde 1997, «antes de que TACC fuera TACC» y rápidamente hizo que Stampede1 fuera útil nuevamente para investigadores del campus.

Si lo construyes

Además de construir el sistema, Simmons llevó a cabo una campaña de relaciones públicas para convencer a los investigadores de que anteriormente no utilizaban la informática avanzada en su investigación para hacerlo.

“Cuando me uní a UT Dallas, el campus tenía unas pocas docenas de usuarios de supercomputadoras”, recuerda Simmons. «Al 1 de enero de 2020, teníamos 500 usuarios en Ganímedes y otros 500 en otros sistemas específicos de grupos de investigación».

Ganímedes ayudó a los usuarios que podrían haberse sentido intimidados por la transición del TACC a recursos a gran escala. «Una vez que han usado Ganímedes, nueve de cada diez veces pueden copiar su código en TACC y ejecutarlo sin modificaciones», dijo Simmons. «Utilizan Ganimedes como herramienta de formación y, en última instancia, como trampolín para TACC u otros recursos nacionales».

Los datos lo respaldan: UT Dallas es el segundo mayor consumidor de bicicletas entre las 14 instituciones del sistema UT y tiene más usuarios de TACC que cualquier otra universidad de Texas que no sea UT Austin. En total, los investigadores de UT Dallas utilizaron 30 millones de horas nudos en 2019.

Los proyectos que utilizan Ganímedes han acogido los esfuerzos para enseñar ciencia de datos a estudiantes de negocios en la Escuela de Administración Naveen Jindal para la investigación de imágenes sísmicas.

Georgia Stuart, estudiante de doctorado en matemáticas que estudia geofísica, dijo que su computadora de escritorio tomaría 1,000 días de computación para resolver un problema.

«En Ganímedes, puedo reducir el tiempo de cálculo a solo 10 segundos por rango de velocidad, o solo 5 días de tiempo de cálculo, y puedo ejecutar varias partes del experimento a la vez. Ganimedes crea un proceso que requiere mucho tiempo y mi trabajo de doctorado, posible «.

Construyendo sobre el éxito

Basado en el uso generalizado de Ganymede, UT Dallas anunció recientemente que está construyendo un segundo sistema, Ganymede 2, un sistema basado en Intel que todavía está en desarrollo temprano. UT Dallas se ha comprometido con el nuevo sistema y formó una junta asesora para comenzar a hacer planes para inversiones a largo plazo en informática de investigación. UT System proporcionará energía y enfriamiento gratuitos al centro de datos UT System / UTRC.

Los geocientíficos de UT Dallas utilizaron datos de terremotos y una técnica computacionalmente intensiva en el cúmulo de Ganímedes para crear imágenes en 3D de la geometría de las placas subductoras (cuerpos verdes) y los flujos de manto inducidos (flechas amarillas) debajo del ‘Centroamérica y el Mar Caribe a una profundidad de 500 kilómetros. (Crédito: Hejun Zhu, UT Dallas)

Los bastidores Stampede de Ganímedes 1 entrarán en un recurso «nuevo» llamado Europa. Europa será un clúster de computación de alto rendimiento de 12,800 núcleos que brindará acceso basado en la web a investigadores y estudiantes de UT Dallas, UT Arlington y UT San Antonio.

«Las tres universidades tendrán acceso a Europa y, a largo plazo, tenemos la intención de utilizar Europa como una tubería para que TACC retire los sistemas que luego se retroalimentarán en el ecosistema de investigación cibernética del sistema UT», dijo Simmons.

No es todo. Después de ver el impacto de HPC local a través de Ganymede, Ciencias Naturales y Mathematica junto con UT Dallas invertirán fuertemente en una actualización de Ganymede que traerá GPGPU y sistemas de aprendizaje automático / IA al campus.

«Antes de las donaciones de Ganymede y Stampede1, UT Dallas no tenía HPC en nuestro radar», dijo Simmons. “Nuestro enfoque fue simplemente enviar a todos a TACC. Al construir Ganímedes y mostrar una necesidad en el campus, construimos suficiente boca a boca y apoyamos la necesidad de más recursos dedicados en el campus «.

UT Dallas celebrará su primera reunión del Comité Asesor de Computación de Investigación en agosto para desarrollar un plan sostenible para la Computación de Investigación de UT Dallas y establecer metas para cinco y 10 años. «Sin TACC y el legado de Stampede1, esto no habría sido posible», dijo Simmons.

Siembra de líderes HPC

La visión de Simmons de promover la excelencia informática en UT Dallas y mejorar la cartera de científicos computacionales va más allá.

Recientemente recibió un Subvención de $ 1.4 millones por la National Science Foundation para desarrollar un nuevo programa postdoctoral para capacitar a facilitadores de investigación computacional, individuos que comprendan las necesidades de los científicos de la industria y centros de HPC de alto nivel como TACC.

«No hay suficientes profesionales de infraestructura de TI para satisfacer las necesidades nacionales», dijo Simmons. «TACC y otros centros siempre tienen vacantes».

La razón es simple. La informática de investigación no existe desde hace mucho tiempo como una disciplina separada. Simmons se encuentra entre la primera generación de estudiantes de doctorado que utiliza HPC en sus tesis. La computación paralela, señala, aún no se enseña como disciplina formal, excepto en un puñado de instituciones.

Simmons espera identificar estudiantes de HPC con experiencia en una escuela de posgrado que no quieran ingresar a la academia y tomarlos antes de ingresar a la industria. Su «Cyberteam» contratará a tres becarios postdoctorales de tres áreas de dominio: química computacional, biología computacional y ciencia de datos / aprendizaje automático. Estos postdoctorados se incorporarán a múltiples grupos de investigación y serán parte de un esfuerzo de múltiples campus para proporcionar niveles más profundos de facilitación y apoyo a la investigación. En lugar de escribir artículos científicos, desarrollarán contenido tutorial para las principales conferencias de supercomputación y contribuirán a proyectos científicos de código abierto.

El esfuerzo es parte de TRECIS, los servicios de ciberinfraestructura de investigación y educación de Texas nube. Durante los próximos tres años, su objetivo es unir los recursos de capacidad más antiguos de TACC con facilitadores de investigación postdoctoral y brindarlos como un servicio para todo el sistema de UT.

Con sistemas TACC adicionales como Lonestar5 y Wrangler que se cerrarán en los próximos años, Simmons espera desarrollar una capacidad aún mayor para capacitar y capacitar a científicos computacionales en todo el estado.

«El objetivo es desarrollar la próxima generación de facilitadores de investigación de infraestructura cibernética avanzada para la nación, abordando nuestras necesidades de apoyo a corto plazo en múltiples campus en áreas de dominio clave», dijo.

Título de la imagen del encabezado: Europa, un «nuevo» clúster de computación de alto rendimiento en UT Dallas con 12,800 núcleos, proporcionará acceso basado en la web a investigadores y estudiantes de UT Dallas, UT Arlington y UT San Antonio.

Acerca de

Aaron Dubrow es un escritor de ciencia y tecnología en el Grupo de Comunicaciones, Medios y Diseño del Centro de Computación Avanzada de Texas.

No te olvides compartir en una historia de tu Instagram para que tus amigos lo vean

??? ? ? ???

Comparte