De origen desconocido: diagnóstico de cáncer en la nube - Calendae | Informática, Electrónica, CMS, Ciberseguridad

De origen desconocido: diagnóstico de cáncer en la nube

Hola, ¿qué tal colega?. Yo soy Simón Sánchez y en el día de hoy te voy a contar sobre De origen desconocido: diagnóstico de cáncer en la nube

A medida que se acerca la recesión económica, HPC parece enfrentarse a un período difícil durante al menos los próximos 18 meses. Pero incluso cuando los presupuestos para gastos de capital de HPC se reducen o congelan, el alquiler de ciclos de HPC en la nube nunca se había visto tan bien y los clientes están comenzando a ganar impulso.

Uno de esos clientes es Pathwork Diagnostics, una startup de biotecnología de seis años que se especializa en productos para el diagnóstico del cáncer. Pathwork combina la tecnología de microarrays de ADN con software de aprendizaje automático para ayudar a identificar los tipos de cáncer. Como una empresa relativamente pequeña con 35 empleados, Pathwork está limitado por cuánto puede gastar en infraestructura de TI. Pero la aparición de la computación en la nube comercial, junto con la última tecnología de chips genéticos, abre nuevas oportunidades para este tipo de empresas.

Hasta hace poco, los chips de microarrays se usaban generalmente para la investigación genómica. Pero la aplicación de la tecnología al tejido tumoral proporciona una visión detallada del perfil de expresión genética de un cáncer. Ejecutar ese perfil a través del software Pathwork permite a los científicos clasificar el origen del cáncer: pulmón, riñón, mama, próstata, etc. – con la idea de aplicar estos conocimientos al tratamiento clínico.

La mayoría de los cánceres no requieren una tecnología tan sofisticada, aunque no se trata simplemente de encontrar un tumor con una resonancia magnética y concluir que el sitio local es el origen del cáncer. Por ejemplo, el cáncer de hígado en realidad puede originarse como cáncer de pulmón, debido a metástasis. Aun así, a veces el examen visual del tejido de la biopsia no es suficiente para la identificación. En ese caso, se pueden usar diagnósticos más sofisticados como la inmunohistoquímica (IHC). Las pruebas de IHC son capaces de detectar proteínas en el tejido tumoral que se pueden asignar a tipos específicos de cáncer. Sin embargo, a veces, incluso estas pruebas no proporcionan una respuesta definitiva. Aproximadamente el 5-10% de todos los cánceres entran en esta categoría.

Aquí es donde entra en juego la solución Pathwork. La prueba «Tissue of Origin» de la compañía mide el patrón de expresión de ARN de una muestra de más de 1.500 genes. Los datos resultantes se procesan mediante algoritmos de aprendizaje automático, que comparan el perfil de expresión con 15 tipos de tejido conocidos para ayudar a determinar el origen del cáncer.

El resultado del diagnóstico es una tabla simple de números que clasifica la probabilidad del tipo de cáncer. Por ejemplo, la aplicación podría puntuar cáncer de pulmón de 80, cáncer de mama 10, cáncer de riñón 5 y así sucesivamente. El científico jefe de Pathwork, Ljubomir Buturovic, dice que normalmente obtienen una puntuación de 70 a 80 para la compatibilidad de tejidos más probable, lo que proporciona una buena base para el tratamiento. En estudios clínicos, afirma que han logrado un 89% de precisión en la identificación de la fuente del cáncer.

«Así que nuestro producto es esencialmente un clasificador», explica Buturovic, «que toma medidas de la expresión génica de un tumor y produce una puntuación que predice la probabilidad de que el cáncer se haya originado en un órgano o tipo de tejido en particular». Buturovic dice que esta información puede ayudar al oncólogo a recomendar un tratamiento dirigido correspondiente al cáncer específico.

Como puede imaginar, el software del algoritmo de identificación del cáncer requiere una gran cantidad de potencia informática. Pathwork mantuvo su clúster de 120 núcleos, que consta de nodos de cómputo x86 de socket único y doble, tanto para el trabajo de diagnóstico como para la investigación. Pero, inevitablemente, la compañía descubrió que necesitaba más capacidad de procesamiento para manejar el creciente número de trabajos. Después de examinar el gasto de capital para expandir su capacidad de procesamiento internamente frente a los ciclos de arrendamiento de un proveedor de servicios, estaba convencido de que el modelo de servicio tenía mucho más sentido para la empresa.

Buturovic dice que el factor decisivo fue que Pathwork tuvo un pico en la demanda de procesamiento aproximadamente una vez cada tres meses, lo que habría requerido un gasto de capital «prohibitivo» para una empresa de su tamaño. Además, algunos algoritmos que emplea son muy exigentes cuando se aplican a sus conjuntos de datos y tardarían meses en ejecutarse en el clúster interno. Por lo tanto, transferir este tipo de trabajo a un clúster más grande ahorraría mucho tiempo.

Debido a que Pathwork ya estaba utilizando Sun Grid Engine (SGE) de código abierto de Sun Microsystems para el equilibrio de carga del clúster, la empresa consideró inicialmente usar la red informática de la utilidad Network.com de Sun. 1 hora por CPU era demasiado alta para Pathwork. En un momento, se enteró de la plataforma en la nube Elastic Cloud (EC2) de Amazon, con su precio más «asequible» de solo $ 0.10 / hora de CPU. Posiblemente la plataforma de computación en la nube más conocida del mundo, EC2 proporciona computación de utilidad escalable para una amplia gama de tipos de aplicaciones.

El camino llegó a Univa UD cuando se enteró de que la solución UniCloud de la compañía era compatible con Sun Grid Engine en la nube de Amazon. Introducido en diciembre de 2008, UniCloud permite el aprovisionamiento de un clúster en la infraestructura de Amazon EC2 como una extensión del programador de trabajos UniCluster de Univa. UniCloud puede extender un clúster local en la nube de Amazon o simplemente proporcionar un clúster independiente completamente en hardware de Amazon. En el caso de Pathwork, la empresa eligió este último modelo.

Con la plataforma UniCloud / EC2, las aplicaciones Pathwork ahora se ejecutan en hasta 500 núcleos en la nube de Amazon y han logrado un aumento de velocidad de 4-5 veces. Debido a que algunos de los trabajos más importantes de Pathwork pueden tardar meses en realizarse internamente, la utilización de recursos de Amazon reduce el tiempo a unas pocas semanas, dice Buturovic.

Basándose en el modelo de uso de Pathwork, la compañía calculó que se ahorraría dos tercios del costo ejecutando sus aplicaciones insignia en la nube de Amazon en lugar de construir y mantener el sistema equivalente internamente. Amortizando el costo del sistema en cinco años y tomando en cuenta los costos de la CPU EC2 más los servicios de consultoría pagados a Univa UD, se lograron ahorros de aproximadamente $ 177,000 por año.

Pathwork puede terminar comprando aún más ciclos en Amazon tan pronto como descubra cómo escalar su software más allá de los 500 núcleos. A 10 centavos por hora de CPU, el costo incremental para una mayor capacidad de procesamiento es bastante bajo en comparación con los posibles ahorros de tiempo de respuesta para su trabajo de investigación y diagnóstico.

Univa tampoco está sentado. Si bien la primera versión de UniCloud se limita a Amazon EC2, Univa ya está en conversaciones con otros proveedores de la nube para extender el software a más plataformas informáticas de servicios públicos.

Puedes compartir en en tu Twitter y Facebook para que tus amigos lo sepan

??? ? ? ???

Comparte