La genómica se ahoga en datos - Calendae | Informática, Electrónica, CMS, Ciberseguridad

La genómica se ahoga en datos

Hola de nuevo. Soy Simón Sánchez y en esta ocasión te voy a hablar sobre La genómica se ahoga en datos

El salto adelante en la tecnología genómica promete cambiar la atención médica tal como la conocemos. La secuenciación de un genoma humano que costaba millones de dólares hace apenas unos años ahora cuesta miles. Y la perspectiva de mapear un genoma por menos de mil dólares está en el horizonte.

Pero la secuenciación de genes barata, per se, no marcará el comienzo de una revolución en la salud. UN artículo en el New York Times esta semana señala que convertir esos genomas secuenciados en algo útil es el verdadero cuello de botella. A los médicos les gustaría poder usar el genoma de sus pacientes para determinar su susceptibilidad a enfermedades específicas o para diseñar tratamientos personalizados para las condiciones que ya padecen.

La secuenciación de todos los pares de bases de ADN es realmente la parte más sencilla del problema. Simplemente refleja el orden de estas bases – adenina (A), timina (T), guanina (G), citosina (C) – en los cromosomas. El software bioinformático necesario para extraer información útil de este alfabeto biomolecular de bajo nivel es mucho más complejo y, por tanto, caro, y requiere una buena cantidad de potencia informática.

Según David Haussler, director del Centro de Ciencia e Ingeniería Biomolecular de la Universidad de California, Santa Cruz, esta es la razón por la que cuesta más analizar un genoma que secuenciarlo, y se espera que esa discrepancia aumente a medida que disminuya el costo de secuenciación. . .

El artículo del NYT informa que el costo de secuenciar un genoma humano se ha reducido más de 800 veces desde 2007, mientras que los costos de procesamiento solo se han reducido en un factor de cuatro. Esto resultó en una enorme acumulación de datos no analizados generados por todos los equipos de secuenciación de bajo costo.

Según el artículo, la capacidad actual de secuenciadores de todo el mundo es capaz de alcanzar 13 billones de pares de bases de ADN al año. Solo para este año, se estima que se secuenciarán 30.000 genomas humanos, una cifra que se espera aumente a millones en unos pocos años.

No solo hay demasiados datos para agregar, también es demasiado difícil compartir ese volumen de datos entre investigadores. Incluso las redes comerciales más rápidas son demasiado lentas para enviar más terabytes de información en menos de unas pocas semanas. Es por eso que el Instituto de Genómica de Beijing (BGI), el instituto de investigación en genómica más grande del mundo, ha recurrido al envío de discos de computadora secuenciados a través de FedEx.

La computación en la nube puede ayudar a aliviar estos problemas. De hecho, algunos creen que Google por sí solo tiene suficiente capacidad de procesamiento y almacenamiento para manejar la carga de trabajo de genómica global. Otros creen que hay demasiados datos sin procesar y los investigadores tendrán que preprocesarlos para reducir el volumen o simplemente retener los bits únicos.

Pero hay problemas aún más difíciles de resolver. La metagenómica, que agrega secuencias de ADN de una población completa de organismos, requiere aún más datos. Por ejemplo, las especies microbianas del tracto digestivo humano representan aproximadamente un millón de veces más datos secuenciados que el genoma humano. Y debido a que esa población microbiana puede tener un efecto profundo en su huésped humano, esos datos genómicos se convierten en una pseudo-extensión del perfil genético de la persona.

Además de todo esto, están los datos asociados con el ARN, las proteínas y otras sustancias bioquímicas del cuerpo. Para obtener una imagen completa de la salud humana, todos estos datos también deben integrarse. Los datos son realmente un diluvio.

Deberías compartir en en tu Twitter y Facebook para que tus colegas lo flipen

??? ? ? ???

Comparte