El ojo de una "tormenta roja" en el horizonte suizo - Calendae | Informática, Electrónica, CMS, Ciberseguridad

El ojo de una «tormenta roja» en el horizonte suizo

Hola, un placer verte por aquí. Soy Simón Sánchez y hoy vamos a hablar sobre El ojo de una «tormenta roja» en el horizonte suizo

Con varias ventas nuevas recientemente en Italia y Francia, Cray Inc. está restableciendo una presencia significativa en el mercado europeo de computadoras HPC. La última venta es una computadora Cray XT3 en el Swiss National Supercomputing Center (CSCS). Este artículo utiliza el anuncio de Cray (http://news.tgc.com/msgget.jsp?mid=363011) como punto de partida e intercalado con comentarios de los clientes, incluidas opiniones y análisis, para revisar este sistema relativamente nuevo.

Para aquellos que no están familiarizados con las estructuras e instituciones de TI suizas, CSCS es el Centro Nacional de Supercomputación de Suiza, que proporciona, desarrolla y promueve servicios técnicos y científicos para la comunidad de investigación suiza en los campos de alto rendimiento y alta rendimiento. Fue creado en 1991 para proporcionar computación líder en su clase para la ciencia de alto nivel en todo el país y para respaldar la ciencia innovadora, las asociaciones académicas y la conectividad de clase mundial.

El Paul Scherrer Institut (PSI), con sede en Villigen, Suiza, es un centro de investigación multidisciplinario para las ciencias naturales y la tecnología. PSI colabora con universidades nacionales e internacionales, otros institutos de investigación e industria en los campos de investigación del estado sólido y ciencias de los materiales, física de partículas y astrofísica, ciencias de la vida, investigación energética e investigación ambiental.

El ETH Zurich (Instituto Federal Suizo de Tecnología en Zurich) alberga a 18.000 personas de 80 países. Casi 360 profesores enseñan principalmente en ciencias de la ingeniería y arquitectura, ciencias orientadas a sistemas, matemáticas y ciencias naturales, y llevan a cabo investigaciones muy apreciadas en todo el mundo. Distinguido por los logros de 21 premios Nobel, ETH Zurich se compromete a brindar a sus estudiantes una educación sin precedentes y habilidades de liderazgo excepcionales.

Para contextualizar este anuncio de compra, el verano pasado escuché una presentación de Marie-Christine Sawley sobre la hoja de ruta (2004-2011) para la provisión de un servicio de TI nacional suizo que permita un fuerte liderazgo en el desarrollo científico. Su misión es proporcionar la infraestructura y la gestión para servir a la comunidad científica, permitiéndoles ofrecer una mejor ciencia. Las fuerzas cibernéticas impulsoras identificadas por su encuesta de usuarios fueron:

  • poder de cómputo: una mayor calidad científica requiere recursos intensos;

  • sostenibilidad del servicio: una línea clara en la prestación de funciones de servicio y beneficios derivados de la economía de escala; es

  • flexibilidad, la capacidad de evolucionar las estructuras de TI para seguir el ritmo de los avances tecnológicos.

Algunos de los problemas científicos del «Gran Desafío» que están estudiando los científicos suizos incluyen la física del plasma, las ciencias de los materiales, la meteorología / clima y la astronomía / cosmología (muchos problemas del cuerpo). Otra área es la biología computacional. Por ejemplo, la simulación de un modelo de células del músculo cardíaco utilizando un millón de células y 30 millones de ecuaciones requiere de dos a tres años de potencia informática, incluso cuando se ejecuta en una computadora que proporciona 1 Tflop / s de rendimiento sostenido. .

El análisis de bioinformática molecular es, en general, intensivo en datos, mientras que la simulación de átomos y moléculas es, en general, intensiva en computación. Al integrar estas dos actividades juntas, tiene una receta para un sistema enorme. En el caso de CSCS, se identificó la necesidad de un aumento de 10 veces en el rendimiento sostenido y un aumento de 5 veces en el rendimiento en comparación con los sistemas actuales. Los criterios de adquisición del sistema incluían cumplir con los requisitos del usuario, el precio de compra, evaluar la capacidad de un proveedor para cumplir lo prometido en el contrato, los costos de preparación del sitio, los costos operativos y el costo total. propiedad (TCO) durante 5 años. El sistema ofrecido debía ser de producción, no de desarrollo. «Con Horizon, CSCS implementará un componente importante de su estrategia Roadmap presentada en noviembre de 2003. Esto se logra poniendo los primeros sistemas de nuevas y poderosas arquitecturas de supercomputación a disposición de la comunidad de investigación nacional y colaboradores internacionales como herramientas científicas avanzadas», dijo Sawley. , después de finalizar el pedido del Cray XT3.

“Esta nueva herramienta científica de vanguardia nos permitirá simular problemas complejos que solo recientemente se consideraban intratables. Los problemas que antes tomaban meses en completarse ahora tomarán horas o minutos ”, dijo Andreas Adelmann, el iniciador del proyecto Horizon.

De las declaraciones anteriores, el mensaje es claro. Horizon es un sistema de capacidad altamente escalable para aplicaciones de investigación de ingeniería y ciencia computacional de alta gama. El sistema está diseñado para admitir una amplia gama de aplicaciones y posiciona a CSCS como un proveedor de recursos de TI de primer nivel para la comunidad de investigación suiza. También está posicionado para atraer colaboraciones internacionales altamente visibles y de valor agregado.

CSCS planea colaborar en asociaciones con los principales sitios de supercomputación de EE. UU. Pittsburgh Supercomputing Center, Oak Ridge National Laboratory y Sandia National Laboratories para madurar la tecnología Cray XT3 para un amplio espectro de trabajos de fabricación científica.

Estos centros ya han iniciado la colaboración y han formado el consorcio SOS. Se llevó a cabo un seminario SOS del 21 al 23 de marzo en Davos, Suiza, al que asistieron únicamente por invitación. El tema del seminario fue «Ciencia y supercomputadoras». La sabiduría percibida es que «Hoy en día la ciencia está habilitada por supercomputación, pero mañana los avances científicos serán impulsados ​​por supercomputadoras». El seminario exploró lo que se necesita para prepararse para una época en la que la manipulación de enormes conjuntos de datos y la simulación de fenómenos físicos complejos se utilizan regularmente para predecir y explicar nuevos fenómenos científicos. El taller también analizó las características computacionales necesarias para facilitar esta transición y cómo se pueden abordar las arquitecturas de supercomputadoras existentes y emergentes para ayudar a la ciencia. Para obtener más detalles, visite el sitio web de CSCS: www.cscs.ch/form/SOS.php.

CSCS también está estableciendo un programa de desarrollo conjunto con Cray para desarrollar y optimizar aplicaciones y hacer contribuciones a la tecnología de software específica de Cray XT3. Por lo tanto, además del sistema Horizon base, CSCS recibirá un rack Cray XT3 adicional con dos gabinetes de cómputo en abril. Esto se utilizará para una asociación de desarrollo entre CSCS y Cray.

¿Qué hace diferente al sistema Cray XT3? Bill Camp, Director de Informática de Sandia Laboratories, quien en la mejor tradición de innovación, se arriesgó y persiguió su visión de desarrollar conjuntamente (por Sandia y Cray) la tecnología original de Red Storm, hizo la siguiente observación el pasado mes de junio. en la Conferencia Internacional de Supercomputadoras en Europa.

«Para la mayoría de las grandes aplicaciones de ciencia e ingeniería, el rendimiento está más determinado por el escalado paralelo y menos por la velocidad de las CPU individuales», dijo Camp. “Tiene que haber un equilibrio entre el procesador, la interconexión y el rendimiento de E / S para lograr un rendimiento general. Hasta la fecha, solo unos pocos sistemas informáticos en paralelo estrechamente acoplados han podido demostrar un alto nivel de escalabilidad en un amplio conjunto de aplicaciones científicas y de ingeniería «.

«Una vez que el paralelismo requiere más de 64-128 procesadores, la arquitectura MPP es más rentable», continuó Camp. «Para los cinco códigos que utilizan más del 80 por ciento de los ciclos de la computadora de Sandia, el índice de eficiencia promedio fue 1,4 veces mayor que el de los clústeres».

La filosofía de Camp es utilizar materias primas en casi todas partes, ya que la personalización tiende a aumentar los costos.

«Earth Simulator y Cray X-1 son sistemas vectoriales paralelos totalmente personalizados con un buen equilibrio», dijo Camp. “Esto determina su alto costo inicial (y su alto rendimiento). Los clústeres son casi en su totalidad de gran volumen sin partes realmente personalizadas, lo que da como resultado su bajo costo (y escasa escalabilidad). Red Storm usa piezas personalizadas solo cuando son críticas para el rendimiento y la confiabilidad. Esto da como resultado una alta escalabilidad a un costo / rendimiento mínimo «.

«Al comparar las configuraciones principales, una versión 100Tflop / s de Cray XT3 (Red Storm) con la versión 360Tflop / s de IBM Blue Gene / L, puede ver que aunque la velocidad del nodo es la misma, muchos de los otros componentes del sistema se diferencian por dar a Red Storm una ventaja en el equilibrio arquitectónico ”, dijo Camp. «Por ejemplo, la memoria por nodo es de 4 a 16 veces mayor, la latencia de la red es aproximadamente 3 veces menor, el ancho de banda de la red por enlace es aproximadamente 25 veces más rápido, el ancho de banda (bytes / flop) es unas 25 veces mejor y la bi-sección (byte / flop) es 20 veces mejor en el sistema Cray XT3 (Red Storm) que en el Blue Gene / L. »

Si bien IBM Blue Gene / L tiene un rendimiento muy alto en Linpack, es compacto y tiene un bajo consumo de energía, espera ver cómo funciona «bien» en las pruebas de referencia de HPCC más equilibradas.

Según un informe reciente que leí, el ancho de banda del Cray XT3 también es excelente en comparación con otros sistemas basados ​​en productos básicos. Por ejemplo, en relación con IBM P4 + Federation e IBM P5-595, el ancho de banda de Cray XT3 para una tríada de flujos (bytes / flops) es aproximadamente 5 veces y 2,7 ​​veces más rápido, respectivamente.

Según Cray Inc., el sistema Cray XT3 está diseñado para ofrecer la máxima fiabilidad a sus usuarios, con un gran tiempo medio entre interrupciones (MTBI) para cualquier proceso de usuario. Basado en la tecnología Red Storm desarrollada conjuntamente por Sandia National Laboratories y Cray (con una fuerte referencia a las arquitecturas Cray T3E y ASCI Red anteriores), el Cray XT3 incluye características técnicas para nuevos niveles de escalabilidad y rendimiento sostenido de las aplicaciones. La interconexión SeaStar 3D-torus proporciona al Horizon un ancho de banda de bisección máxima de 14,1 terabytes / s. Un micro-kernel «especial» en el nodo de computación minimiza la sobrecarga del sistema operativo y la fluctuación del sistema operativo, lo que evita que las aplicaciones de computación en clústeres grandes escalen a miles de CPU.

Como se informó en mi artículo de enero (http://news.taborcommunications.com/msgget.jsp?mid=328047&xsl=story.xsl), los resultados de rendimiento de la prueba de rendimiento de HPC Challenge muestran claramente la solidez de los sistemas altamente integrados con gran ancho de banda, memoria de baja latencia y subsistemas de red. El Cray XT3, con su interconexión SeaStar 3D-torus especialmente diseñada, es solo un ejemplo.

(Las marcas comerciales, los nombres y las marcas comerciales son propiedad de sus respectivos dueños). Copyright: Christopher Lazou, HiPerCom Consultants, Ltd., Reino Unido. Abril de 2005

Puedes compartir en tu Facebook para que tus amigos lo disfruten

??? ? ? ???

Comparte