Pico Computing adopta un enfoque de ampliación de las FPGA

Hola otra vez. Te habla Simón Sánchez y en el día de hoy vamos a hablar sobre Pico Computing adopta un enfoque de ampliación de las FPGA

A medida que los proveedores de computación de alto rendimiento perfeccionan sus carteras de servidores y estaciones de trabajo con las últimas maravillas de CPU multinúcleo y GPGPU, Computación Pico está abriéndose camino silenciosamente en el espacio de aplicaciones HPC con sus plataformas basadas en FPGA. Al elegir dónde tiene más sentido la computación reconfigurable, la compañía busca aprovechar su tecnología FPGA escalable para lograr el máximo efecto.

Pico, con sede en Seattle, fue fundada en noviembre de 2004 por el fundador Robert Trout. Utilizando financiación interna, la puesta en marcha dedicó un par de años al desarrollo de productos y, posteriormente, empezó a comercializar sus plataformas de procesamiento FPGA basadas en Xilinx en 2007 y 2008. Fiel a su nombre, Pico es una pequeña empresa, con una docena de empleados a tiempo completo. Como entidad privada, no están obligados a publicar los resultados financieros, pero según Mark Hur, director de ventas y marketing de Pico, la empresa es rentable hoy.

La compañía ofrece actualmente una gama de plataformas desde una sola placa FPGA hasta «clústeres» FPGA a gran escala que contienen más de 100 dispositivos en un chasis de 4U. La placa insignia E-16 Virtex-5 FPGA de la compañía fue lanzada en 2007. «Hasta la fecha, este ha sido el producto más exitoso que hemos lanzado hasta ahora», dice Hur. Según él, ahora hay más grupos E-16 en el mercado.

Recientemente, Pico demostró un sistema de recuperación de contraseña utilizando un grupo de 77 FPGA Virtex-5, alojado en un gabinete de 4U y consumiendo menos de 900 vatios de energía. Según la compañía, el sistema proporciona el equivalente computacional de alrededor de 1,000 CPU de doble núcleo (Intel Core 2 Duo) para varios algoritmos de recuperación, entre los que destacan FileVault, Acceso protegido Wi-Fi (WPA) y Privacidad equivalente por cable (WEP). . De hecho, para el algoritmo WEP, el clúster Pico proporcionó una mejora del rendimiento de 4,620 veces y una reducción de 1,000 veces en el consumo de energía en comparación con la implementación de CPU de doble núcleo.

Este nivel de rendimiento y densidad de procesamiento para aplicaciones criptográficas ayuda a explicar por qué el mercado más querido de Pico es la seguridad de datos. Las agencias federales de tres letras en el gobierno de los EE. UU. Son los principales clientes aquí y compran productos estándar y personalizados de la empresa. La seguridad sigue representando la mayor parte del negocio de Pico en la actualidad, aunque es poco probable que vea un estudio de caso de descifrado de códigos de la NSA en el sitio web de la empresa en el corto plazo.

Otras áreas de aplicación preferidas para Pico incluyen bioinformática, análisis financiero, procesamiento de imágenes y algunos otros tipos de computación científica. La razón por la que los FPGA son tan hábiles en este tipo de aplicaciones, tanto desde la perspectiva del rendimiento como del consumo de energía, es su capacidad para transformar sus estructuras de hardware para que coincidan con los operadores y los tipos de datos de un algoritmo determinado. Esto es especialmente cierto cuando los algoritmos subyacentes no se basan en los típicos tipos de datos enteros o de punto flotante.

En aplicaciones genómicas, por ejemplo, muchos algoritmos se basan en las cuatro bases nucleosídicas fundamentales (adenina, timina, guanina, citosina) que componen el ARN y el ADN. Entonces, un tipo de datos de nucleósidos solo tendría dos bits de ancho. Y a diferencia de la CPU y la GPU, puede asignar recursos FPGA para que coincidan exactamente con el tamaño de los datos. «No se necesitan operadores y rutas de datos completos de 32 o 64 bits», afirma David Pellerin, director de marketing estratégico de Pico. «Es un desperdicio». Es por eso que algunas aplicaciones que obtienen una aceleración 100x de una GPU pueden obtener 1000x de una FPGA, en comparación con una CPU.

Pellerin, quien era el director de tecnología de Impulse Accelerated Technologies, los creadores del lenguaje de programación Impulse C FPGA, se incorporó a Pico para impulsar la historia de marketing de la compañía y respaldar algunos de los lanzamientos de nuevos productos que se han realizado. lanzado en los últimos meses. Las últimas ofertas se basan en el último hardware Spartan-6 y Virtex-6 del fabricante de FPGA Xilinx. La última incorporación de Pico, los módulos de la serie M, permite a los clientes crear tarjetas PCIe de tamaño completo con hasta 12 FPGA.

Las tarjetas insignia de la serie E de Pico, por otro lado, se conectan a las ranuras PCIe en un sistema de escritorio. Pero al igual que la serie M, también se pueden escalar en múltiples configuraciones de FPGA para construir un clúster de FPGA denso en computación dentro de un solo nodo de computación. Específicamente para cargas de trabajo HPC, se pueden conectar hasta siete de las últimas tarjetas E-18 a una tarjeta portadora PCIe, y se pueden instalar varias tarjetas portadoras en un chasis montado en bastidor de 4U. La idea es que los clientes comiencen el desarrollo con una sola tarjeta conectada a una computadora portátil o de escritorio, y cuando sea el momento de implementar la configuración completa, se pueden conectar varias tarjetas a la placa posterior PCIe e instalarlas en un servidor o dispositivo montado. en rejilla.

Desde la perspectiva del software, Pico tiene un conjunto coherente de API que se aplican a todo el conjunto de productos, y estas interfaces son accesibles desde un código Verilog de bajo nivel o un lenguaje C compatible con FPGA, como Impulse C. de los clientes de Pico que escriben aplicaciones criptográficas utilizan Verilog, pero Impulse C tiende a ser más popular en bioinformática y códigos HPC más tradicionales.

A diferencia de otros fabricantes de placas FPGA, donde uno o dos dispositivos están emparejados con un procesador host, Pico construye dispositivos modulares y placas posteriores para que se puedan conectar hasta 177 FPGA a una sola CPU. Este nivel de escalabilidad significa que los clientes pueden colocar una gran cantidad de hardware informático en contenedores muy pequeños. Dado que el núcleo de la mayoría de estos algoritmos es solo aritmética de bits altamente paralelizada, el papel de la CPU se limita a controlar la parte secuencial de la aplicación. “Para muchas aplicaciones, ciertamente en áreas como la criptografía y la bioinformática, cuantas más FPGA se puedan lanzar al problema, mejor”, dice Pellerin.

No te olvides compartir en una historia de tu Instagram para que tus colegas opinen

??? ? ? ???

Comparte