BGI acelera el análisis del genoma con GPU - Calendae | Informática, Electrónica, CMS, Ciberseguridad

BGI acelera el análisis del genoma con GPU

Hola, ¿qué tal colega?. En el teclado Simón Sánchez y esta vez hablaremos sobre BGI acelera el análisis del genoma con GPU

El diluvio de datos en las ciencias de la vida no es más agudo que en la potencia genómica BGI de China, que probablemente secuencia más ADN que cualquier otra organización del mundo. Para convertir estos datos en algo significativo para los investigadores de genómica, el instituto comenzó a utilizar HPC acelerado por GPU para reducir significativamente los tiempos de procesamiento. Al hacerlo, BGI pudo aumentar el rendimiento computacional en un orden de magnitud o más.

En la Conferencia de Tecnología de GPU en Beijing esta semana, el Dr. BingQiang Wang, quien dirige el grupo HPC en BGI, describió la abrumadora tarea de mantener el análisis computacional Online con la rápida acumulación de datos genómicos. En BGI, dice, actualmente son capaces de secuenciar 6 billones de pares de bases por día y tienen una base de datos almacenada que totaliza 20 PB.

El problema del diluvio de datos se debe a un desequilibrio entre la tecnología de secuenciación de ADN y la tecnología informática. Según el Dr. Wang, utilizando máquinas de secuenciación de segunda generación, los genomas ahora se pueden mapear 50.000 veces más rápido que hace solo una década. La tecnología en la pista aumentará aproximadamente 10 veces cada 18 meses. Esta es cinco veces la tasa de la ley de Moore, y aquí radica el problema.

Por supuesto, no sería práctico actualizar su infraestructura computacional a esa velocidad, por lo que BGI recurrió a las GPU NVIDIA para acelerar el final del análisis del flujo de trabajo. La arquitectura de la GPU es particularmente adecuada para la compresión de datos de ADN, gracias a sus muchos núcleos simples y su gran ancho de banda de memoria. Animado por la aceleración de los resultados de tipos similares de programas de datos paralelos, BGI ha desarrollado tres aplicaciones de análisis del genoma (SOAP3, GSNP y GAMA) para aprovechar la potencia de procesamiento de muchos núcleos del procesador gráfico.

Desarrollado en 2011, SOAP3 es un programa de alineación de oligonucleótidos cortos habilitado para GPU que alinea lecturas cortas con una secuencia de ADN de referencia. Gracias a la aceleración de la GPU y algo de capacidad de memoria adicional en el lado de la CPU, SOAP3 es de 10 a 30 veces más rápido que su predecesor de solo CPU, SOAP2. Al ejecutar SOAP3 en un clúster Xeon utilizando el módulo Tesla C2070 de NVIDIA, BGI pudo aumentar el rendimiento 10 veces para un genoma humano, 16 veces si se reducen los tiempos de carga de datos de la CPU a la GPU.

La herramienta de detección de SNP, GSNP, es la versión de SOAPsnp habilitada para GPU, que detecta las diferencias de un polimorfismo de un solo nucleótido (SNP) en el ADN. Los SNP representan variaciones genéticas que pueden asociarse con rasgos como la resistencia a enfermedades y la respuesta a fármacos. Con GSNP, BGI pudo reducir los tiempos de procesamiento en aproximadamente 7 veces durante una ejecución típica, de 4 días a 14 horas.

GAMA es otro código de variación genética que se utiliza para estimar las frecuencias de las variantes genéticas. Para calcular las frecuencias de 1.000 individuos, la versión original de GAMA podría tardar un año o más. La versión acelerada por GPU podría hacer lo mismo en solo dos días.

Usando herramientas aceleradas por GPU, BGI pudo reducir la parte computacional de su flujo de trabajo estándar de alrededor de 11 días a 23 horas. Pero los tiempos de manipulación de datos para el archivo solo se redujeron en un 50% más modesto. Como resultado, el componente de manipulación de datos del flujo de trabajo pasó del 8% del tiempo total al 25%.

La solución fue la compresión de datos, que se realizó dentro de la GPU. BGI implementa un algoritmo de compresión basado en Hoffman que proporciona una relación de compresión de aproximadamente el 24 por ciento. La tasa de compresión es un respetable 1 GB / segundo, con descompresión a 1,5 GB / segundo.

La mayor parte del trabajo que se describe aquí se realizó en un clúster de servidores de 20 GPU propiedad de BGI, utilizando partes de NVIDIA Tesla. Según Wang, tienen dos de esos grupos, uno en su instalación principal en Shenzhen y otro en su oficina de Hong Kong. El almacenamiento lo proporciona Isilon y consta de varios sistemas para albergar su base de datos de 20 PB (y en crecimiento).

Aunque los clústeres de HPC son los caballos de batalla utilizados para la mayoría de las herramientas de análisis BGI, la genómica más exigente requiere mucha más potencia de procesamiento que una máquina de 20 GPU. Por ejemplo, BGI tiene una aplicación que estima la frecuencia de alelos menores (MAF) en una población. MAF se refiere a la frecuencia con la que se producen alelos menos comunes en una población determinada. Es útil para estudiar la variación genética a escala geográfica.

Estimar los resultados de MAF incluso para una población pequeña es muy costoso desde un punto de vista computacional. Por ejemplo, usando solo 1.024 genomas humanos, se necesitarían 10 años en una sola CPU y 0.5 años en una sola GPU para generar resultados MAF. Para ejecutar una aplicación de este tipo, se necesitan miles de CPU o cientos de GPU.

Para obtener una estimación de la población de MAF, BGI se asoció con el Centro de Supercomputación de Tianjin para utilizar su Tianhe-1A equipado con GPU, la mejor supercomputadora de China y el segundo sistema más poderoso del mundo. Usando 256 de las 7.168 GPU de la máquina y empleando MPI para comunicarse entre nodos, el MAF realizado para esa población de 1.024 solo tomó 13 horas.

Hasta la fecha, todo el esfuerzo de transferencia de GPU para aplicaciones de análisis se ha realizado bajo CUDA, lo que requiere un esfuerzo de desarrollo serio por parte del equipo de BGI. Al Dr. Wang le gustaría hacer que el esfuerzo de desarrollo sea más productivo y está intrigado por el modelo de programación OpenACC recientemente anunciado, que permitiría a los desarrolladores insertar directivas similares a OpenMP en código de serie que no sea CUDA para exponer el paralelismo.

El Dr. Wang dice que la codificación de aplicaciones de GPU requería tanto ingenieros informáticos con experiencia en GPU como biólogos que tuvieran un conocimiento profundo del dominio de la aplicación genómica. Para desarrollar este tipo de aplicaciones, los científicos deben trabajar en conjunto. Idealmente, un desarrollador debería comprender ambas áreas de especialización, dice Wang. Pero, agrega, «no existe tal persona».

Recuerda compartir en en tu Twitter y Facebook para que tus colegas lo disfruten

??? ? ? ???

Comparte