El próximo movimiento de procesamiento de GPU de AMD - Calendae | Informática, Electrónica, CMS, Ciberseguridad

El próximo movimiento de procesamiento de GPU de AMD

Hola y mil gracias por leerme. Te escribe Simón Sánchez y en el día de hoy vamos a hablar sobre El próximo movimiento de procesamiento de GPU de AMD

Para una empresa que posee alrededor de la mitad de la propiedad intelectual de GPU del mundo, AMD sigue siendo un distante segundo lugar después de NVIDIA en el campo de la computación de GPU. Esto es más el resultado de la hoja de ruta de la tecnología agresiva de NVIDIA que una deficiencia fundamental por parte del equipo de diseño de gráficos de AMD. Pero con la llegada de la arquitectura Cayman de AMD, las perspectivas de procesamiento de la GPU de la empresa pueden mejorar.

Cayman es la última arquitectura de GPU de AMD que se ha incorporado a los últimos procesadores gráficos de alta gama del fabricante de chips: Radeon 6950 HD 6970 y 6950. Aunque la compañía aún no habla de sus ofertas de GPU FireStream de próxima generación. para el procesamiento de alto rendimiento, presumiblemente esos productos se derivarán de la tecnología Cayman. Desde el punto de vista del rendimiento, estos dispositivos del futuro deberían combinarse muy bien con los productos Tesla HPC de la generación Fermi de NVIDIA.

Puede encontrar una mirada más cercana a las capacidades de la arquitectura de Cayman en David Kanter. ultimo articulo en tecnologías del mundo real. Como de costumbre, Kanter realiza un análisis en profundidad de la tecnología y sus perspectivas comerciales, y presta especial atención a cómo el nuevo diseño de GPU está más orientado a la computación genérica que las arquitecturas de GPU anteriores de AMD. «Cayman representa un paso en la dirección de la computación GPU, pero una mejora modesta y evolutiva en la programabilidad, en lugar de una revolución total», escribe Kanter.

Un área que se ha mejorado es el paralelismo de instrucciones, tanto de tareas como de datos. El nuevo diseño permite que múltiples aplicaciones se ejecuten simultáneamente en el procesador. Las GPU AMD anteriores permitían múltiples flujos, pero tenían que serializarse para que solo se pudiera ejecutar un flujo de comandos a la vez. La configuración de Cayman es mucho más amigable para la computación general y es especialmente importante para soportar el paralelismo a nivel de tarea en aplicaciones OpenCL.

Incluso a nivel educativo, Cayman ofrece un VLIW rediseñado y más generalizado. A diferencia del proyecto Cypress de la generación anterior, que utilizaba una unidad de tubería especial para manejar trascendentales y conversiones de tipos de datos, en Cayman cada tubería puede manejar todas las operaciones. Según Kanter, este nuevo VLIW ha sido rediseñado para «coincidir más estrechamente con las cargas de trabajo genéricas y dar un paso más allá del enfoque singular en los gráficos».

El diseño más monolítico de VLIW dejó espacio para más unidades SIMD en el molde y, por lo tanto, más FLOPS. La Radeon 6970 de gama alta disponible hoy para los jugadores ávidos de gráficos ofrece 2,7 teraflops de rendimiento de precisión simple y 683 gigaflops de precisión doble.

Sin embargo, el legado gráfico sigue siendo dominante. La jerarquía de memoria de Cayman ha evolucionado un poco, pero no es tan similar a la CPU y programable como el diseño Fermi de NVIDIA. Y aunque el rendimiento del punto flotante es impresionante (cada unidad SIMD ofrece 128 FLOP de precisión simple o 32 FLOP de precisión doble por ciclo), su relación de precisión simple: doble es de 4: 1, en comparación con NVIDIA Fermi en 2: 1. Además, AMD no ha mencionado ningún soporte para la memoria ECC, una tecnología esencial para muchas cargas de trabajo de cómputo, aunque Kanter cree que el producto de cómputo GPU basado en Cayman puede incluir esta funcionalidad.

En general, el Cayman tiene mucho que ofrecer al entusiasta potencial de la computación GPU, pero con algunas salvedades. Kanter resume:

El Cayman proyectado tiene un ancho de banda de memoria un 17% más alto, aproximadamente 2,5 veces el FLOP / sy una precisión bruta simple y una precisión bruta doble de FLOP / s un 26% más alta que el Tesla C2070. Sin embargo, la microarquitectura VLIW de AMD es inherentemente menos eficiente y la jerarquía de la memoria también es increíblemente sensible a la carga de trabajo. Incluso en el caso de una aplicación con ancho de banda limitado, el Cayman estará a la par o ligeramente por delante del Tesla. Sin embargo, para obtener una precisión doble, es probable que Fermi sea la opción de mayor rendimiento.

Más allá del hardware, Kanter cree que el verdadero desafío para Cayman será el software, y este es ciertamente el caso de todos los futuros productos de procesamiento de GPU. En este caso, AMD ha apostado por OpenCL, una API estándar abierta, pero que está un par de años por detrás de CUDA de NVIDIA en madurez general. Kanter cree que AMD necesita seguir invirtiendo en el ecosistema de software para seguir siendo competitivo.

A esto, agregaría que AMD tiene un par de problemas aún más fundamentales cuando se trata de computación GPU: enfoque y visión. Si AMD va a ofrecer una alternativa viable a NVIDIA en esta área, debe convertir a FireStream en un ciudadano de primera clase. Hoy en día, esas ofertas ni siquiera figuran en su conjunto de productos de servidor (que se encuentran en Productos de estaciones de trabajo), y los últimos productos FireStream 9350 y 9370, anunciados en junio de 2010, no se encuentran en ninguna parte. El lanzamiento estaba programado para el tercer trimestre del año pasado, pero no pude encontrar ninguna evidencia de que AMD alguna vez los haya liberado.

La compañía también necesita ofrecer algún tipo de estrategia que vincule sus productos FireStream GPU Computing a sus futuras APU «Fusion» que terminarán en servidores y presumiblemente supercomputadoras. La tecnología CPU-GPU de AMD es un área en la que la empresa puede afirmar estar a la vanguardia. La compañía solo necesita idear algún tipo de hoja de ruta que muestre cómo se moverán sus APU a lo largo de la cadena alimentaria de la computación GPU.

Finalmente, AMD debe tragarse su orgullo y desarrollar un puerto CUDA para sus chips gráficos. Eso no significa que deba renunciar a su compromiso a largo plazo con OpenCL. Solo tiene que reconocer que CUDA es actualmente la API de facto para la computación GPU, particularmente HPC, y es probable que lo siga siendo al menos a corto plazo. La adopción de CUDA contribuiría en gran medida a nivelar el campo de juego en la computación GPU y le daría a su mayor rival, Intel, algo en qué pensar.

Hasta la fecha, el tímido compromiso de AMD con la computación GPU no ha dado sus frutos. Si se toma este mercado en serio, especialmente en el ámbito de la HPC, ya no podrá sentarse y ver cómo NVIDIA solidifica su control. Cayman parece un paso positivo en esa dirección, pero necesita hacer mucho más.

Deberías compartir en tu Facebook para que tus amigos lo disfruten

??? ? ? ???

Comparte