Intel levanta el telón sobre Larrabee - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Intel levanta el telón sobre Larrabee

Hola otra vez. Soy Simón Sánchez y hoy vamos a hablar sobre Intel levanta el telón sobre Larrabee

En una conferencia de prensa el viernes, los representantes de Intel revelaron algunos detalles arquitectónicos del procesador Larrabee del que tanto se habla de la compañía. El nuevo diseño es la primera plataforma x86 de muchos núcleos del fabricante de chips y representa lo que podría describirse como un procesador vectorial x86 de propósito general, que combina las capacidades de GPU y CPU. La arquitectura es la culminación de más de tres años de investigación y desarrollo llevados a cabo bajo el programa de investigación de terascala de Intel. La compañía presentará un artículo en la conferencia SIGGRAPH 2008 la semana que viene en Los Ángeles, que explicará el diseño del procesador y su modelo de programación.

La idea de Larrabee era pasar a la vanguardia de la capacidad de programación de GPU, al tiempo que proporciona un procesador vectorial x86 que se puede aplicar a una amplia gama de aplicaciones de alto rendimiento. La aplicabilidad de la nueva arquitectura a la computación visual es el resultado de su idoneidad general para aplicaciones HPC en lugar de cualquier capacidad de GPU específica. De hecho, Intel caracteriza a Larrabee como un procesador genérico de alto rendimiento, en lugar de una GPU. Larry Seiler, el ingeniero principal senior del proyecto, describió las intenciones de Intel para la nueva arquitectura, dijo que «Larrabee revolucionará el procesamiento de gráficos y la supercomputación».

En su mayor parte, el informe del viernes omitió los planes de producto para el nuevo procesador. No se mencionaron ni la cantidad de núcleos, ni la velocidad del reloj, ni el consumo de energía y las fechas de lanzamiento del producto solo se discutieron en el período de tiempo general de «2009 o 2010.» Gran parte de la discusión se ha centrado en el papel de Larrabee como una GPU de PC de gama alta, su mercado objetivo inicial. Al ingresar al espacio de gráficos de alto volumen, Intel espera extender su sólida posición en el mercado de GPU móviles a los juegos de escritorio.

Si tiene éxito allí, es casi seguro que Intel empujará la plataforma al mercado HPC, donde sus capacidades vectoriales y compatibilidad x86 la convertirían en un competidor instantáneo frente a otros aceleradores de gama alta como los productos Tesla de NVIDIA (y otras GPU compatibles con CUDA). ), La oferta de GPU FireStream de AMD, sistemas de procesador Cell, coprocesadores ClearSpeed ​​e incluso aceleradores FPGA. Pero en el caso de Larrabee, no se requerirá un procesador de host externo ya que la lógica de la CPU ya está en el chip.

A diferencia de la GPU típica actual, Larrabee tiene una serie de diferencias importantes. El diseño general del chip consta de varios núcleos x86 conectados entre sí a través de un bus de anillo de alta velocidad de 512 bits de ancho en cada dirección. Los núcleos se derivan del procesador Pentium de Intel, con sus líneas de ejecución cortas y ordenadas. En este caso, sin embargo, cada núcleo ejecuta hasta cuatro subprocesos a la vez y contiene una unidad escalar y vectorial, y esta última es capaz de realizar 16 operaciones de 32 bits por tic de reloj. Dado que Larrabee es básicamente una arquitectura de CPU, se incorporan funciones como el cambio de contexto, la multitarea preventiva, la memoria virtual y el intercambio de páginas. Y debido a que la gestión de subprocesos se realiza en software, la latencia se puede ocultar con técnicas de paralelización convencionales.

Cada núcleo contiene instrucciones de nivel 1 y caché de datos, y el chip también incluye caché de nivel 2. La caché L2 se comparte entre los núcleos, con 256 KB asignados a cada uno. A diferencia de las GPU, la consistencia de la caché se mantiene en toda la jerarquía de la caché, lo que permite un marco de software amigable para la comunicación entre procesadores, un mecanismo eficiente para compartir datos entre subprocesos de aplicaciones. Los controladores de memoria (o controladores) también están integrados en el chip, al igual que las unidades de función fija específicas de la aplicación.

Sin embargo, en general, un procesador Larrabee destinado a la carga de trabajo de gráficos utiliza muy poco hardware de función fija. Casi todo el procesamiento debe realizarse con software en núcleos x86. En algunos casos, especialmente en el sombreador de texturas, Intel ha agregado hardware de función fija para aumentar el rendimiento de los gráficos. La racionalización para una tubería de software principalmente de gráficos es que los requisitos para varias unidades funcionales (sombreado de vértices, rasterización, sombreado de píxeles, etc.) pueden variar mucho de una aplicación a otra. Por lo tanto, el equilibrio de la carga de trabajo será más fácil de lograr con silicio más software de propósito general, en lugar de hardware dedicado. Esto también significa que el rendimiento de la aplicación debe escalar de manera más uniforme a medida que se colocan núcleos adicionales en la matriz.

Para igualar el campo de juego en el espacio de gráficos, Intel admitirá DirectX y OpenGL para que las aplicaciones existentes se puedan portar más fácilmente. También se proporcionará una API específica de Larrabee para los programadores más aventureros interesados ​​en aprovechar al máximo las capacidades del procesador. El acceso al conjunto de instrucciones vectoriales, que aún no se ha descrito, estará disponible a través de intrínsecos del lenguaje C. La unidad vectorial admitirá operaciones de coma flotante de precisión simple y doble IEEE, así como enteros de 32 bits.

Aunque Larrabee se caracteriza por ser un chip de muchos núcleos, es probable que las primeras versiones tengan docenas de núcleos en lugar de los cientos de núcleos que se encuentran actualmente en las GPU NVIDIA y AMD (ATI). Dependiendo de la velocidad del reloj, el rendimiento bruto de Larrabee también podría ser inferior al de las GPU tradicionales. Por ejemplo, incluso con las impresionantes 16 operaciones de precisión simple por reloj (por núcleo), un chip Larrabee de 1.0 GHz necesitaría 62 núcleos para igualar el rendimiento de las últimas GPU teraflop de NVIDIA y AMD que se enviarán este año. . Es de suponer que Intel encontrará la fórmula que al menos iguale el desempeño de la competencia. Pero su pretensión de capacidad de programación superior puede resonar más que el rendimiento en bruto, especialmente con los proveedores de software que buscan más flexibilidad para desarrollar nuevos tipos de aplicaciones, gráficos o de otro tipo.

La introducción de una nueva arquitectura en un mercado maduro es siempre una propuesta arriesgada, que la propia Intel ha aprendido de su empresa Itanium. Pero el proveedor de chips es una fuerza enorme en la industria y tiene más de un año para alinear el soporte de ISV y OEM para Larrabee. Su éxito en el espacio de los gráficos probablemente determinará si el procesador se convierte en una parte central de HPC. En cierto modo, es una pena, ya que se puede decir que Larrabee es una mejor solución para la informática técnica de alta gama que el dominio más estrecho de la informática visual. En cualquier caso, la competencia entre Intel, AMD y NVIDIA seguramente se volverá más interesante.

Deberías compartir en en tu Twitter y Facebook para que tus amigos lo sepan

??? ? ? ???

Comparte