La Universidad de Duke espera $ 100,000 o más por año en ahorros de energía al aumentar la potencia de procesamiento. - Calendae | Informática, Electrónica, CMS, Ciberseguridad

La Universidad de Duke espera $ 100,000 o más por año en ahorros de energía al aumentar la potencia de procesamiento.

Hola de nuevo. Yo soy Simón Sánchez y en esta ocasión te voy a contar sobre La Universidad de Duke espera $ 100,000 o más por año en ahorros de energía al aumentar la potencia de procesamiento.

La Universidad de Duke espera $ 100,000 o más por año en ahorros de energía al aumentar la potencia de procesamiento.

El procesamiento de grandes cantidades de datos es un componente crucial de la vida académica moderna. En los campus universitarios, todos, desde químicos e ingenieros hasta sociología, economía e incluso investigadores de literatura, necesitan acceso a la informática de alto rendimiento (HPC). En la Universidad de Duke, Duke Shared Cluster Resource (DSCR) respalda estas necesidades de profesores de todo el espectro.

El DSCR sirve a 650 usuarios finales en 70 grupos de búsqueda diferentes. Una de las principales áreas de investigación que aborda el DSCR es la comunidad bioinformática. «Muchos de nuestros profesores están haciendo comparaciones genómicas», dice John Pormann, director de computación escalable de Duke. “Algunos investigadores están construyendo modelos que establecen probabilidades de cuándo surgieron ciertos genes y cuándo se destacaron especies con un ancestro común. Uno está tratando de desarrollar el árbol de la vida para una variedad de hongos observando la genética «.

Muchos investigadores de bioinformática tienen que procesar un volumen de datos sin precedentes. «Uno de nuestros profesores está trabajando con una agencia de subvenciones que proporciona a los beneficiarios de las subvenciones la máquina de secuenciación de genes más reciente y rápida, en lugar de ofrecer una gran cantidad de dinero», dice Pormann. “Los profesores reciben un secuenciador genético de última generación, que emite enormes cantidades de datos. Dependen del DSCR para proporcionar un entorno de HPC que respalde sus necesidades de análisis de datos «.

Investigación de vanguardia con poderes limitados

En sus esfuerzos por satisfacer estas necesidades, el DSCR se enfrenta a importantes desafíos logísticos. El edificio del centro de datos se construyó para albergar las aulas, no una granja de servidores. El centro de datos ya se ha quedado sin la cantidad de electricidad que puede pasar a través del conducto del edificio. El piso está elevado solo 12 pulgadas y la última instalación de aire acondicionado involucró las unidades aéreas porque los instaladores no estaban convencidos de que pudieran empujar suficiente aire a través del piso para mantener fresco todo el equipo.

“Si excedemos la capacidad de nuestra unidad de aire acondicionado actual, tenemos que volver a la mesa de dibujo”, dice Pormann. “Agregar energía a nuestra ubicación actual sería costoso porque tendríamos que introducir nuevas líneas eléctricas desde la calle, cavando aceras y estacionamientos en el proceso. Mudarse a un nuevo centro de datos le costaría mucho más de seis cifras. Nos gustaría quedarnos donde estamos, pero eso significa que necesitamos usar la energía y el enfriamiento en esa habitación de la manera más eficiente posible. Mantener constantes nuestros recursos de energía y refrigeración es fundamental cuando ampliamos nuestra potencia informática «.

168 vatios menos por servidor

El DSCR debe maximizar la relación entre la potencia de procesamiento y el consumo de energía de los servidores de su clúster HPC. El clúster incluye 729 servidores, desde servidores blade Dell PowerEdge M610 con procesador Intel Xeon serie 5600 hasta cajas montadas en bastidor de siete años de antigüedad. Oracle Grid Engine entrega dinámicamente cargas de trabajo de aplicaciones a los recursos más apropiados en el clúster.

Para obtener información sobre el equilibrio de la potencia de procesamiento y el consumo de energía y los recursos de refrigeración del DSCR, Pormann se embarcó en su propia investigación. Estudió la correlación entre la utilización de la CPU y el consumo de energía en el clúster. Durante más de un año, ha estado recopilando datos sobre la energía consumida por los servidores primarios del clúster, todas las máquinas Dell de doble CPU y cuatro núcleos, que ejecutan su carga de trabajo normal.

La comparación entre máquinas con una utilización de CPU del 100% es asombrosa: cada uno de los servidores montados en bastidor Dell PowerEdge 1950 en el centro de datos con procesador Intel Xeon X5355 usa 369 vatios. Sus servidores blade Dell PowerEdge M600 con procesador Intel Xeon E5420 usan 221 vatios cada uno. Y sus blades PowerEdge M610 con procesador Intel Xeon E5520 usan 201 vatios. En tres generaciones, los servidores PowerEdge redujeron el consumo de energía en 168 vatios, o un 46%, utilizando el 100% de la CPU.

«En general, desde el rendimiento inactivo hasta el 100% de utilización de la CPU, estamos viendo caídas significativas en el consumo de energía en los nuevos servidores blade de Dell», informa Pormann. «El factor de forma en sí mismo reduce los requisitos de energía porque los blades tienen menos fuentes de alimentación, más grandes y más eficientes, y esto es claramente un factor en la fuerte caída en el consumo de energía que vemos entre los servidores PowerEdge 1950 y los blades PowerEdge M610».

La comparación de los blades Dell PowerEdge M600 con el procesador Intel Xeon E5420 y los blades PowerEdge M610 con el procesador Intel Xeon E5520 muestra la diferencia que puede hacer un procesador más eficiente. «La caída general de unos 20 vatios se debe principalmente a las mejoras de la CPU», dice Pormann. “Esto sugiere que todas las cargas de trabajo verían mejoras significativas en el ahorro de energía simplemente cambiando a nuevas CPU. Independientemente de la carga colocada en el sistema, deberíamos ver reducciones significativas en el uso de energía «.

Más de $ 100,000 por año en ahorros de costos de energía

Además de ayudar al DSCR a mantenerse en su posición actual, reducir el consumo de energía de los servidores, ya sea directamente o reduciendo el uso de aire acondicionado, ahorra dinero a la universidad constantemente. “Incluso con costos de energía por debajo del promedio de Carolina del Norte, estamos viendo ahorros de $ 100,000 o más por año simplemente reduciendo nuestro consumo de energía”, dice Pormann.

A medida que disminuye el consumo de energía, la potencia de procesamiento aumenta drásticamente con cada nueva generación de blades Dell. «Cada vez que agregamos un blade Dell PowerEdge M610, podemos extraer los nodos más antiguos del clúster y mantener la misma potencia de procesamiento», dice Pormann. «Cuando compramos equipo nuevo, nuestros usuarios siempre se sorprenden de la rapidez con la que realizan su trabajo. Pero no podemos calcular directamente cuántos nodos más antiguos se comparan con un nuevo blade. Para un investigador, un nuevo blade podría reemplazar ocho servidores más. de edad, pero para otro investigador la proporción podría ser de 12 a 1. «

DSCR acaba de lanzar seis nuevos blades PowerEdge M610 de 12 núcleos de CPU con procesador Intel Xeon serie 5600 y 96 gigabytes de memoria por blade. «No podemos esperar a ver qué pueden hacer», dice Pormann. “Nuestros primeros datos indican que ya no consumen más energía que nuestros blades PowerEdge M610 de 8 núcleos con procesador Intel Xeon E5520. Así que deberíamos ver un aumento del 50% en la capacidad informática con un aumento cero en el consumo de energía «.

La capacidad disponible en el clúster HPC indica que los nuevos blades Dell PowerEdge le están dando al clúster un aumento sustancial en la potencia de procesamiento. Históricamente, el DSCR ha operado alrededor del 70% de su capacidad total. Después de las recientes adiciones de blades de Dell, la utilización se ha reducido a alrededor del 50%, por lo que la capacidad no utilizada del clúster ha aumentado hasta en un 30%. «Debido a que tenemos más espacio para la cabeza, tenemos la capacidad de que los investigadores realicen diferentes tipos de experimentación», dice Pormann. “Ya no tienen que preocuparse por desperdiciar capacidad. Aprecian que siempre que necesiten más potencia informática, es aquí «.

Pormann atribuye las ganancias de rendimiento de los últimos servidores Dell a los avances, en parte, en la gestión de su memoria. «Cada vez más usuarios preguntan sobre configuraciones de memoria grandes», dice. “Parece que los proyectos de investigación empiezan a verse limitados por el rendimiento y la capacidad de memoria de los nodos. Durante los últimos nueve meses, tres profesores diferentes involucrados en bioinformática me han preguntado si pueden obtener 256 o 512 gigabytes de memoria en una sola hoja. Uno de ellos está trabajando con imágenes, cada una de las cuales es del orden de un terabyte. Les dije que los sistemas con esas configuraciones de memoria están en la hoja de ruta de Dell. El controlador de memoria integrado y la arquitectura Intel QuickPath brindan a los blades de Dell un tremendo ancho de banda para el procesamiento de la memoria «.

DSCR mejora aún más el rendimiento dentro del clúster mediante el uso de Intel Compiler Suite. «Estamos aprovechando los compiladores de Intel tanto como sea posible», dice Pormann. “Lo que hemos visto hasta ahora es que los compiladores de Intel, en comparación con los compiladores de código abierto, proporcionan una mejora del rendimiento del 20 al 50 por ciento. Ejecute exactamente el mismo código C a través del compilador Intel y el ejecutable es más rápido. Los compiladores de Intel parecen aprovechar al máximo estos nuevos procesadores Intel «.

Las herramientas de gestión del servidor aportan eficiencias adicionales

Ahora Pormann está buscando mejores formas de utilizar las herramientas a su disposición para administrar la energía de los servidores del clúster. El DSCR utiliza Dell Chassis Management Controller (CMC) para monitorear el consumo de energía de los blades. Luego, IPMItool, una utilidad de código abierto, exporta estos datos a Oracle Grid Engine. «Dell tiene sus propios complementos para IPMItool», dice Pormann. «Pudimos hablar con el equipo de ingeniería de Dell, que nos proporcionó información sobre interfaces de línea de comandos que podríamos utilizar para recopilar estos datos para Grid Engine».

Pormann y su equipo pueden utilizar actualmente Dell CMC para controlar de forma remota el uso de energía dentro del clúster. «Dell CMC debería permitirnos apagar fácilmente las máquinas inactivas y los grupos de máquinas para reducir la carga térmica general del clúster», dice Pormann.

El siguiente paso es automatizar el proceso de apagado del servidor a través de Oracle Grid Engine. «Una máquina inactiva todavía usa más de 100 vatios», dice Pormann. “La limitación de la CPU puede reducir el consumo de energía, pero debe usarse junto con el apagado de las máquinas que no se utilizan. Y nuestros sistemas deberían poder apagar automáticamente las máquinas para que nadie tenga que presionar botones 24 × 7. Saber que tenemos este potencial en las hojas nos ayuda a justificar nuestros continuos esfuerzos para desarrollar estas herramientas «.

Mapear el futuro del clúster

Duke compra la mayor parte del hardware del clúster de Dell por varias razones. Uno es la hoja de ruta del producto de Dell e Intel. «Nos gusta el historial de Dell de poner siempre los últimos equipos de Intel en su hardware», dice Pormann. “Cuando Intel anuncia un nuevo chip, sabemos que pronto lo veremos en los equipos Dell. Saber lo que está sucediendo en esas hojas de ruta nos permite gastar nuestro dinero de manera muy inteligente «.

Quizás la razón más importante por la que DSCR sigue comprándole a Dell es que Pormann siempre ha estado contento con el apoyo que ha recibido. «Siempre que tenemos un problema de hardware, Dell nos proporciona los componentes y nos da acceso a los ingenieros», dice Pormann. «Mientras Dell e Intel sigan trabajando en la eficiencia en la relación entre la potencia de procesamiento y el consumo de energía, podremos seguir aumentando la potencia informática, incluso si permanecemos en nuestro centro de datos actual».

Para más información visite Dell.

Recuerda compartir en una historia de tu Instagram para que tus colegas lo disfruten

??? ? ? ???

Comparte