Cabezales de búsqueda acelerados FPGA para la corriente principal - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Cabezales de búsqueda acelerados FPGA para la corriente principal

Hola otra vez. Yo soy Simón Sánchez y hoy te voy a contar sobre Cabezales de búsqueda acelerados FPGA para la corriente principal

Ahora que los volúmenes de datos superan la ley de Moore, hay un movimiento para mirar más allá de las herramientas de hardware y software convencionales. Los aceleradores como las GPU y la arquitectura Intel MIC tienen objetivos de rendimiento extendidos para muchas cargas de trabajo de clase HPC. Si bien los arreglos de puertas programables en campo (FPGA) no han tenido el mismo nivel de adopción para las cargas de trabajo HPC tradicionales, un subconjunto de aplicaciones de big data ha demostrado ser adecuado para el tipo de procesador.

El área donde las FPGA han brillado más es en las aplicaciones basadas en investigación. Específicamente, Microsoft está implementando nodos acelerados por FPGA para su servicio Bing, y el gigante web asiático Baidu ha implementado un enfoque similar para el reconocimiento de patrones e imágenes.

Ahora estamos viendo el debut de un dispositivo basado en FPGA que está acelerando ciertas cargas de trabajo de análisis y dando a los clústeres de Hadoop y Spark una carrera por su dinero. Ryft, una empresa que ha prestado servicios al sector gubernamental durante más de una década, está ingresando al espacio de análisis comercial con la implementación de Ryft ONE, un dispositivo de análisis de 1U que combina FPGA de Xilinx, backplanes de servidores paralelos gemelos y hasta 48 TB de SSD: base de almacenamiento con primitivas de software personalizadas que ocultan la complejidad del hardware subyacente. Según la empresa puntos de referencia, la plataforma Ryft ONE es capaz de analizar datos a velocidades de hasta 10 Gigabytes por segundo y más, de 100 a 200 veces más rápido que los servidores de CPU de 4 núcleos / 15 GB de RAM más rápidos.

Bill Dentinger, vicepresidente de productos de Ryft, explica que están apuntando a aplicaciones de clientes que requieren información en tiempo real de los conjuntos de datos históricos y de transmisión, en muchos casos simultáneamente. Después de diez años de trabajar en conjuntos de datos complejos con el gobierno, Ryft aprovechó esa experiencia para crear una solución especialmente diseñada que parece un servidor Linux genérico pero que se comporta como una computadora de alto rendimiento.

Pat McGarry, vicepresidente de ingeniería, dice que Ryft One fue diseñado para superar los cuellos de botella de velocidad y rendimiento de los clústeres x86 tradicionales. Cada caja de 1U tiene ocho unidades y cada una puede acomodar seis unidades de estado sólido estándar para un total de 48 unidades intercambiables en caliente, lo que proporciona hasta 48 TB de almacenamiento SSD. Los SSD son RAID juntos en hardware. Los datos se adquieren con dos tarjetas 10GE.

Detrás de la pieza de almacenamiento frontal está la salsa secreta de Ryft, un conjunto de lógicas centrales integradas en Ryft Analytics Cortex (RAC) destinadas a resolver problemas específicos. McGarry explica que en lugar de usar procesadores secuenciales, como x86, ARM, DSP y similares, implementaron matrices sistólicas en una estructura FPGA, una arquitectura de procesamiento masivamente paralelo bit a bit. La transición a este modelo que no es de von Neumann es donde Ryft difiere.

Aunque los FPGA no tienen la facilidad de programación y la familiaridad de los clústeres de Linux x86, el uso de primitivas codificadas de forma rígida evita estas limitaciones al extraer las complejidades internas, utilizando una API de lenguaje C estándar para invocar una función. Ryft se lanza con tres primitivas: búsqueda, búsqueda difusa y operaciones de frecuencia de términos (el equivalente al recuento de palabras), con planes para expandir su biblioteca de componentes de algoritmos prediseñados según las demandas del cliente y del mercado. .

Las primitivas de software personalizadas iniciales están diseñadas para abordar cargas de trabajo analíticas específicas en áreas donde las cadenas de texto deben encontrarse y combinarse a la velocidad del rayo. El aprendizaje automático, la detección de fraudes y la secuenciación de genes son áreas en las que esperan que la plataforma tenga el mayor impacto inicialmente.

Cuando se trata de resultados de evaluación comparativa, McGarry revela que una caja Ryft 1U supera significativamente a los servidores x86 de cuatro núcleos, como se detalla en el siguiente gráfico:


Además, al reemplazar cientos de servidores básicos, el dispositivo reduce los costos de mantenimiento y operación hasta en un 70%.

Si los clientes necesitan más de una caja, se puede utilizar un enfoque de partición horizontal para escalar el sistema, pero la compañía dice que lo que ven es que la mayoría de los clientes no se están quedando sin almacenamiento. Se encuentran con tamaños de datos en el ámbito de los terabytes inferiores, con muy pocos por encima de los 20 terabytes, fuera de algunos requisitos gubernamentales.

Las versiones alojadas y en las instalaciones de Ryft One estarán disponibles a principios del segundo trimestre. El costo del primer año de $ 200,000 incluye una tarifa de integración de $ 80,000. A partir de entonces, el precio cae a $ 120,000 por año.

Deberías compartir en en tu Twitter y Facebook para que tus colegas lo flipen

??? ? ? ???

Comparte