NVIDIA apunta a la aceleración de GPU para aplicaciones de ciencias biológicas

Hola y mil gracias por leerme. Te escribe Simón Sánchez y esta vez vamos a hablar sobre NVIDIA apunta a la aceleración de GPU para aplicaciones de ciencias biológicas

NVIDIA anunció Tesla Bio Workbench, un nuevo programa diseñado para reunir los componentes computacionales necesarios para ejecutar aplicaciones de biociencia aceleradas por GPU. La lógica es la misma que ha promovido NVIDIA desde que entró en el negocio de la informática de alto rendimiento: aprovechar el rendimiento superior de la GPU para reducir el punto de entrada para HPC. En este caso, ensamblaron un banco de trabajo centrado en la GPU diseñado específicamente para investigadores y científicos de ciencias de la vida.

En pocas palabras, el Banco de trabajo Tesla Bio incluye una serie de códigos de biociencia compatibles con GPU, un sitio web comunitario para descargar los códigos y proporcionar un foro para intercambiar información y, por supuesto, recomendaciones para estaciones de trabajo y clústeres equipados con GPU NVIDIA Tesla. La estrategia es educar a la comunidad biotecnológica de que las aplicaciones y el hardware están aquí y al alcance de más investigadores que nunca.

Durante los últimos dos años, el conjunto de aplicaciones de código de biología computacional compatibles con GPU ha crecido enormemente, principalmente gracias a los puertos CUDA de las versiones de CPU del software. Esto ha dado lugar a una gran cantidad de paquetes de software de química cuántica y dinámica molecular populares que ahora pueden ejecutarse en GPU NVIDIA. Estos incluyen códigos como AMBER, GROMACS, NAMD, TeraChem y VMD, entre otros. También se encuentran disponibles numerosos códigos de bioinformática, como CUDA-SW ++ (Smith-Waterman), GPU-HMMER y MUMmerGPU. Todos estos se pueden descargar a través de Tesla Bio Workbench desde sus respectivos sitios patentados. Muchos de estos se pueden obtener de forma gratuita, especialmente si su uso se limita a la investigación académica.

La razón detrás de todo esto es el reconocimiento de NVIDIA de que la biología computacional es uno de los frutos menos pendientes de la aceleración de la GPU. Los aumentos de rendimiento del orden de 10x a 100x en una CPU son bastante típicos para este tipo de código. Esto no pasó desapercibido. “El tipo de impulso en torno a las GPU en este dominio ha sido quizás el más grande y orgánico que hemos visto”, dice Sumit Gupta, gerente senior de productos de NVIDIA para Tesla Group. Según él, muchos biólogos han recurrido a las GPU sin el apoyo de NVIDIA. La razón de esto, piensa, es que para muchos proyectos de investigación biológica de tamaño pequeño a mediano, el costo y la complejidad de la computación de alto rendimiento se han convertido en un verdadero problema.

El sector de las ciencias de la vida ya es uno de los mercados más grandes para la informática de alto rendimiento. En 2008, el 29% de los ciclos de supercomputación en TeraGrid se dedicaron a aplicaciones de biociencia, mientras que otro 19% ejecutó códigos relacionados en la investigación de la química y la ciencia de los materiales. En el ámbito comercial, la demanda de HPC está impulsada por las empresas farmacéuticas y la industria de la genómica emergente en su búsqueda de mejores fármacos y tratamientos. La firma de analistas IDC estima que la vertical de biociencia vale más de $ 1.5 mil millones para los proveedores de HPC y se expande a una tasa compuesta anual del 2.6%. Por cierto, la cifra de CAGR es posterior a la recesión; en 2008, IDC esperaba una tasa de crecimiento del 9,3%. Sin embargo, las perspectivas para HPC en este sector son significativas.

El descubrimiento de fármacos, en particular, es un área en la que la HPC promete reducir los costos y acelerar el ritmo de la investigación. En la actualidad, la síntesis física de compuestos de fármacos y las pruebas subsiguientes en el cribado de fármacos de alto rendimiento son costosas y requieren mucho tiempo, lo que generalmente representa un ciclo de investigación y desarrollo de cinco años. En los sistemas HPC modernos, gran parte de este trabajo se puede simular con códigos de dinámica molecular y química cuántica, reemplazando esencialmente los costosos costos de mano de obra y materiales con ciclos de CPU baratos.

O ciclos de GPU, según corresponda. El punto de NVIDIA con Tesla Bio Workbench es que las GPU pueden hacer de la biociencia computacional una propuesta mucho menos costosa que nunca. Debido a las capacidades de procesamiento de datos en paralelo del procesador de gráficos moderno, para muchas aplicaciones científicas, una estación de trabajo equipada con GPU puede reemplazar a un pequeño grupo de CPU, mientras que un grupo de GPU de tamaño moderado puede reemplazar a una supercomputadora de gama alta. Esto reduce los costos iniciales de hardware, el consumo de energía durante la vida útil del sistema y el espacio del centro de datos.

Por ejemplo, una pequeña simulación del virus satélite del mosaico del tabaco (STMV) utilizando NAMD, un código de dinámica molecular para simulaciones biomoleculares, se puede ejecutar en un clúster moderno de 16 CPU basado en tecnología x86 de cuatro núcleos. Pero según Gupta de NVIDIA, una estación de trabajo de 4 GPU con una versión CUDA de NAMD superará a ese grupo y con solo una fracción del consumo de energía. Desde la perspectiva del investigador individual, «todo lo que mantiene el trabajo en la estación de trabajo es bueno», dice Gupta.

Por supuesto, las simulaciones más grandes requieren más potencia computacional de la que puede proporcionar una estación de trabajo. Pero dado que estos códigos tienden a escalar muy bien, un clúster de GPU es el camino natural hacia la cima. «La clave para la aceptación aquí será el hecho de que es fácil simular moléculas grandes», explica Gupta. «No tienes que dedicar tiempo a una supercomputadora, porque es demasiado restrictiva». Para una empresa farmacéutica, esto significa que cada investigador puede tener una estación de trabajo GPU para sus pequeños experimentos y puede compartir un clúster de GPU cuando necesite ejecutar un problema mayor.

Los productos comerciales derivados de la biología computacional basada en GPU aún no han aparecido. En este punto, el uso de estos métodos para el descubrimiento de fármacos en las empresas farmacéuticas es esporádico. Y dada la duración de los ensayos clínicos que deben pasar por el proceso de diseño y descubrimiento del fármaco, Gupta cree que probablemente no comenzaremos a escuchar historias de éxito hasta dentro de cinco años más o menos. Para NVIDIA, el desafío inmediato es convencer a la industria biotecnológica de que estas plataformas y herramientas informáticas GPU ya están listas.

Deberías compartir en tus redes sociales para que tus amigos lo sepan

??? ? ? ???

Comparte