NVIDIA lanza las primeras GPU Kepler para jugadores; Versión HPC Waiting in the Wings

Hola y mil gracias por leerme. En el teclado Simón Sánchez y hoy hablaremos sobre NVIDIA lanza las primeras GPU Kepler para jugadores; Versión HPC Waiting in the Wings

NVIDIA presentó esta semana su GPU Kepler tan discutida, que promete mucho mejor rendimiento y eficiencia energética que los productos basados ​​en Fermi de la generación anterior. Las primeras ofertas son tarjetas gráficas de rango medio destinadas al corazón del mercado de computadoras de escritorio y portátiles, pero la GPU Kepler de segunda generación más potente para computación de alto rendimiento ya está en proceso.

Según NVIDIA, los dos nuevos productos presentados esta semana, la GeForce GTX 680 para sistemas de escritorio y las GPU para portátiles GeForce 600M, son dos veces más eficientes energéticamente que sus homólogos basados ​​en Fermi. Y aunque representan procesadores gráficos más potentes que la generación anterior, el tema principal de diseño de la nueva arquitectura es el rendimiento por vatio, en lugar del rendimiento por milímetro cuadrado. Según Sumit Gupta, director senior de NVIDIA de la unidad de negocios Tesla GPU Computing, este es un cambio fundamental en la estrategia arquitectónica de la compañía. «Esta es la primera vez que la energía es una preocupación de orden más alto que el área», dice.

Esto se debe a que, como casi todos los fabricantes de chips del planeta, el segmento de mercado de más rápido crecimiento de NVIDIA es el espacio móvil y portátil / ultrabook. Este énfasis arquitectónico en la eficiencia energética también se integra bastante bien con el mercado de la computación GPU, donde el consumo de energía también es un factor importante. Esto es especialmente cierto en las partes de la GPU Tesla que terminan en servidores HPC que consumen mucha energía. «Todos los mercados en los que nos encontramos se han vuelto sensibles al poder», dice Gupta.

El aumento de la eficiencia energética en Kepler se basó en gran medida en una técnica probada, a saber, aumentar el número de núcleos al reducir la velocidad del reloj. Pero la arquitectura es ligeramente diferente. Bajo las sábanas, los núcleos están reunidos en lo que NVIDIA llama sus multiprocesadores de transmisión (SM). En la versión de Fermi solo había 32 núcleos por SM. En la implementación de Kepler, redujeron la lógica de control de manera desproporcionada y pudieron comprimir 192.

Aumentar el número de núcleos fue muy sencillo, ya que estaban pasando de la tecnología de proceso de 40 nm con Fermi al nodo de 28 nm de Kepler. En el caso de la GeForce GTX 680, por ejemplo, hay 1536 núcleos, tres veces más que las GPU Fermi de gama alta, que superaron los 512 núcleos. Al mismo tiempo, redujeron la frecuencia de reloj de 1,5 GHz en el chip Fermi a poco más de 1 GHz. Aunque cada núcleo ahora está haciendo menos trabajo, a medida que hay más, la productividad aumenta y lo hace con menos. consumo de energía.

Los fabricantes de chips de CPU también han utilizado esta estrategia. Pero debido a la mayor complejidad de los núcleos de CPU individuales y su dependencia del ancho de banda de memoria limitado, los aumentos en el recuento de núcleos están comenzando a estancarse (ninguna CPU triplica la cantidad de núcleos en una generación). Además, dado que muchas aplicaciones dependen del rendimiento de un solo subproceso, los fabricantes de chips de CPU intentan mantener la línea en la velocidad del reloj tanto como sea posible. Reducir la velocidad del reloj en un tercio, como lo hizo NVIDIA aquí, es algo inaudito para un producto de CPU.

Para Kepler, NVIDIA afirma duplicar el rendimiento por vatio sobre la GeForce GTX 580 de generación Fermi. Para aplicaciones de juegos reales, los nuevos productos Kepler están logrando un rendimiento de 1,1 a 2 veces mayor por vatio. En algunos casos, sin embargo, puede hacerlo incluso mejor.

Por ejemplo, NVIDIA usó el suyo Demostración de samaritano, que ilustra juegos fotorrealistas, para mostrar un aumento de rendimiento de 3 veces. Hasta esta semana, esa demostración requería tres tarjetas GeForce GTX 580, para un total de 732 vatios. Ahora puede funcionar con una única GeForce GTX 680 de 195 vatios.

Para admitir todo el rendimiento adicional, se ha aumentado significativamente el ancho de banda de la memoria. La interfaz de la GTX 680 admite 6.0 Gbps, que es un 50 por ciento más que los 4.0 Gbps disponibles en la GTX 580. Según Gupta, este es el ancho de banda de memoria más alto para cualquier chip basado en productos, NVIDIA o de otro tipo.

Todos estos cambios arquitectónicos (más núcleos, relojes más lentos y más ancho de banda de memoria) se trasladarán a la segunda versión de la GPU Kepler, un diseño de gama alta que se enfocará principalmente en aplicaciones de procesamiento de GPU. Esto es en lo que se basarán los productos Tesla de próxima generación y lo que inicialmente terminará en dos de las supercomputadoras más poderosas del mundo: Blue Waters en NCSA y Titan en ORNL.

Según Gupta, la segunda implementación de Kepler incluirá muchas características que no se encuentran en estos primeros productos orientados al juego. En particular, tendrá muchas más capacidades de doble precisión (que no se requieren para la mayoría de las aplicaciones gráficas) e incluirá nuevas funciones específicas de computación. Y, por supuesto, la potencia bruta de estos chips será un poco más alta que la versión de gráficos de rango medio presentada esta semana.

Si bien la compañía aún no proporciona ninguna de las velocidades y se alimenta del segundo Kepler, uno esperaría que el recuento de núcleos y el rendimiento máximo de doble precisión fueran dos o tres veces más altos y que el ancho de banda de la memoria logre al menos un impulso. 50%. Es casi seguro que las velocidades de reloj se reducirán desde los 1.3 GHz actuales en el Tesla M2090, pero tal vez no tan agresivamente como en estas primeras partes de juegos de Kepler.

Es de suponer que NVIDIA mantendrá su envolvente de potencia de 225 vatios para la gama Tesla, por lo que los ingenieros solo necesitan equilibrar el recuento de núcleos y el reloj para aterrizar en ese punto de diseño térmico. A medida que aumenta el límite de potencia y el número de núcleos, NVIDIA debería poder ofrecer una GPU Tesla con entre 1,3 y 1,5 teraflops de rendimiento de doble precisión. Por otro lado, probablemente haya una razón para ofrecer también piezas de menor rendimiento que consuman menos energía.

En cualquier caso, lo sabremos pronto. Es probable que NVIDIA haga su lanzamiento impreso de HPC Kepler en la Conferencia de Tecnología GPU de la compañía en mayo. Y según Gupta, la compañía está en camino de poner esta versión en producción en el cuarto trimestre. Si eso va de acuerdo con el plan, las nuevas GPU de Kepler estarán en funcionamiento en supercomputadoras para fin de año.

Artículos relacionados

NVIDIA ejecuta la GPU Tesla

Las GPU transformarán el Jaguar de ORNL en un Titan de 20 Petaflop

NCSA se inscribe con Cray para Blue Waters Redo

Puedes compartir en en tu Twitter y Facebook para que tus colegas lo disfruten

??? ? ? ???

Comparte