La hoja de ruta de servidores de AMD traza un camino para HPC - Calendae | Informática, Electrónica, CMS, Ciberseguridad

La hoja de ruta de servidores de AMD traza un camino para HPC

Hola y mil gracias por leerme. Soy Simón Sánchez y hoy te voy a contar sobre La hoja de ruta de servidores de AMD traza un camino para HPC

Nuestra cobertura reciente del Día del Analista Financiero de AMD describió la estrategia general del servidor del fabricante de chips para los próximos años, pero dejó mucho a la imaginación en cuanto a cómo podría funcionar todo esto en el espacio de la computación de alto rendimiento. La presentación para los analistas apenas reconoció el mercado de HPC, y en cambio enfatizó los principales objetivos de AMD en los principales segmentos de clientes y servidores. En una conversación más reciente con John Fruehe, director de marketing de productos de AMD para el servidor y el grupo integrado, pudimos tener una mejor idea de cómo ve la empresa sus perspectivas de HPC para 2010 y más allá.

Quizás se esté preguntando cuánto piensa AMD, o Intel, en realidad, sobre el mercado de HPC en estos días. A pesar de una mejor tasa de crecimiento que el mercado de servidores convencional, HPC solo representa entre el 2 y el 10 por ciento de los ingresos por chips de servidor, dependiendo de con quién hable. En el negocio de los chips de productos básicos, este es un segmento demasiado pequeño para inspirar diseños de procesadores separados, pero demasiado grande para ignorarlo. «La belleza de HPC», dice Fruehe, «es que tiene la oportunidad de vender una gran cantidad de procesadores de una sola vez». Según él, esta es razón suficiente para permanecer en el juego.

Y, en cualquier caso, muchas aplicaciones comerciales tradicionales requieren esencialmente las mismas características de rendimiento que las cargas de trabajo HPC: una gran cantidad de núcleos rápidos y un gran ancho de banda de memoria. El próximo Magny-Cours Opteron de 45 nm tiene 8 o 12 núcleos y cuatro canales de memoria. Ese diseño, dice Fruehe, es adecuado para cargas de trabajo de HPC y cree que les ayudará a captar una mayor parte del mercado de servidores en 2010. La competencia actual de Magny-Cours es el Nehalem EP de cuatro núcleos, que tiene tres canales. de memoria y el Nehalem EX de 8 núcleos que puede admitir hasta ocho sockets. La idea es que Magny-Cours supere a Nehalem EP en términos de ancho de banda de memoria y supere a Nehalem EX en términos de precio y consumo de energía.

Magny-Cours Opteron representa la serie 6000 de gama alta de AMD (socket G34) y está dirigida a servidores 2P y 4P. Los chips de esta serie enfatizan el rendimiento y la escalabilidad, por lo que tienden a ser la primera opción para HPC. AMD cree que la combinación de soporte 2P y 4P en una sola plataforma fomentará las ventas de múltiples servidores de 4 sockets, que hasta ahora representaban solo alrededor del 5% de las ventas de servidores de la compañía. El problema era que la sobrecarga de los chips 4P significaba que la economía de dos servidores 2P generalmente tenía más sentido, incluso si la aplicación era mejor en una configuración de cuatro sockets. Los chips G34 cambian ese cálculo. Si la aplicación no está limitada por el rendimiento de la interconexión del clúster (es decir, más intensiva en computación que la E / S), el usuario debería poder ahorrar dinero al eliminar los conmutadores y tarjetas adaptadoras adicionales que requieren los nodos adicionales. El consejo de AMD es que si una aplicación HPC no satura la interconexión InfiniBand, un grupo de nodos de cuatro sockets podría ser el camino a seguir.

En el segundo trimestre de 2010, se espera que AMD lance chips Opteron “Lisbon” de 4 y 6 núcleos, que representan la serie 4000 de gama baja (socket C32), que admite servidores 1P y 2P. Este último está dirigido más hacia aplicaciones empresariales de nivel web e infraestructura en la nube, donde la eficiencia energética y los nodos de clúster menos densos en computación son la regla. Pero Fruehe dice que la serie 4000 también es adecuada para lo que él llama «HPC empresarial»: bancos, compañías automotrices y similares, donde predominan los clústeres de 32 a 128 nodos. En ese mundo, los procesadores más eficientes energéticamente pero menos potentes suelen ser la respuesta.

En 2011, AMD cambiará a la arquitectura «Bulldozer», los primeros productos de servidor serán «Interlagos» de 16 núcleos y «Valencia» de 8 núcleos. Estos chips son compatibles con los enchufes G34 y C32 respectivamente, por lo que pueden ser reemplazos inmediatos para los clientes de HPC que desean realizar actualizaciones de solo procesador. Probablemente el mayor cambio en Bulldozer es la relación entre unidades enteras y de coma flotante. Hasta ahora, cada núcleo completo de un Opteron se asignaba a una única FPU de 128 bits. Pero al menos en la primera implementación de Bulldozer, dos núcleos completos se emparejan con una unidad de punto flotante de doble ancho (256 bits). El objetivo aquí es hacer que el procesamiento de FP sea más flexible. Con el diseño Bulldozer, un solo núcleo completo puede reclamar toda la FPU y programar operaciones de FP de 256 bits o, alternativamente, cada núcleo puede realizar operaciones de 128 bits. Fruehe dice que también planean revelar otras mejoras de FPU diseñadas para impulsar el rendimiento.

La otra pieza importante de la historia de Bulldozer es su diseño modular, que permite construir chips con diferentes núcleos a partir del mismo diseño de silicio. Intel introdujo su arquitectura modular en su arquitectura Nehalem, pero para AMD, la modularidad tiene un significado especial, ya que puede comenzar a pensar en agregar módulos GPU ATI a la matriz. Fruehe insinuó que AMD está reconsiderando las funciones de las FPU y las GPU en el procesamiento genérico y podría conducir a diseños de chips en los que la capacidad de FP se mejore o incluso se reemplace por completo por módulos de GPU. «Creemos que, en el camino, verá más clientes utilizando una GPU como una forma de mejorar el rendimiento del punto flotante», dice.

Es un poco prematuro para AMD hablar sobre la modularidad de la GPU, al menos en el contexto del servidor. Actualmente no hay planes públicos para mezclar silicio GPU ATI con CPU Opteron. Los chips CPU-GPU «Fusion» en la hoja de ruta existente de AMD son para el procesamiento del lado del cliente y utilizan una arquitectura conocida como Unidad de Procesamiento Acelerado (APU). Los grandes obstáculos para la integración de GPU de gama alta con CPU de gama alta son la falta de espacio y las limitaciones de energía. Hasta que AMD cambie al nodo de proceso de 22 nm, será difícil obtener GPU de grado teraflop que compartan silicio en los chips del servidor.

A corto plazo, el objetivo de AMD es encontrar una manera de acercar la GPU a la CPU para un mejor rendimiento. Si bien Fruehe no explica cómo podría implementarse esto, la compañía básicamente tiene dos opciones: HyperTransport y PCIe. La ruta PCIe sería más fácil desde la perspectiva de la GPU, ya que las tarjetas gráficas existentes ya son compatibles con PCIe. Hacer que las CPU sean más íntimas con PCIe podría implicar cambios en el diseño del zócalo y el chip o, más simplemente, la adición de un puente de túnel HyperTransport a PCIe en la tarjeta. La opción de solo HyperTransport probablemente involucraría el diseño de una GPU compatible con socket Opteron, que luego puede actuar como un coprocesador nativo de la misma manera que lo hizo XtremeData con su coprocesador FPGA.

De cualquier manera, tiene sentido que AMD maximice la sinergia entre sus ofertas de GPU y CPU, ya que es el único fabricante de chips que tiene una cartera completa en ambas arquitecturas. Hasta que Intel resucite su línea de productos Larrabee o NVIDIA decida que no puede prescindir de una oferta de CPU, AMD permanecerá en esa posición única. Desde el punto de vista de Fruehe, esta es una ventaja mucho mayor que la de todos sus rivales.

Por supuesto, Intel puede presumir de una alta posición en la tecnología de procesos de semiconductores, lo que indica su ventaja de 6 a 12 meses sobre AMD. Esta semana, Intel estrenó sus primeras partes Westmere de 32 nm: «Clarksdale» para PC de escritorio y «Arrandale» para computadora portátil, y se espera que lance el servidor de chips Westmere EP a finales de este año, posiblemente en marzo. La destreza de fabricación de la empresa le otorga algunas ventajas en términos de costes de fabricación y, en general, un mejor rendimiento bruto. Pero eso no compensa la falta de un producto gráfico de alta gama. «Intel está muy por detrás de nosotros en tecnología GPU de lo que nosotros estamos detrás de ellos en tecnología de procesos», señala Fruehe. Como Intel descubrió recientemente, construir un motor gráfico de alta gama es mucho más difícil que reducir los transistores.

Puedes compartir en una historia de tu Instagram para que tus colegas lo sepan

??? ? ? ???

Comparte