El nuevo motor de búsqueda se puede utilizar para el descubrimiento creativo. - Calendae | Informática, Electrónica, CMS, Ciberseguridad

El nuevo motor de búsqueda se puede utilizar para el descubrimiento creativo.

Hola, un placer verte por aquí. Te escribe Simón Sánchez y esta vez hablaremos sobre El nuevo motor de búsqueda se puede utilizar para el descubrimiento creativo.

Cuando le pides a una supercomputadora que cuente una historia, es posible que no esperes un resultado creativo ni nada. Pero un grupo de investigadores de Virginia Tech está utilizando System X, la supercomputadora de la universidad, para probar un nuevo programa de investigación que puede contar historias de vida: las conexiones entre conjuntos de genes, por ejemplo, o las conexiones entre genes. hallazgos informados en artículos biomédicos en la base de datos PubMed de la Biblioteca Nacional de Medicina de EE. UU.

Todos estamos familiarizados con los motores de búsqueda que proporcionan una lista de resultados en los términos que ingresamos. Los investigadores en ciencias de la computación y bioquímica en Virginia Tech han creado una capacidad de investigación que llaman Storytelling que descubrirá conexiones entre información que parecen diferentes. Descubra una secuencia de eventos o relaciones para crear una cadena de conceptos entre los puntos de inicio y finalización especificados. Imagine, por ejemplo, pedir un vínculo entre el concepto de «viajar a Londres» y el concepto de «lugares donde están enterrados los papas». El Narrador podría postular «la historia de los códigos» como intermediario y encontrar el Código Da Vinci, si es que existió.

«Las historias se compilan analizando grandes volúmenes de texto u otros datos», dijo Naren Ramakrishnan, profesor asociado de informática en Virginia Tech que trabaja con científicos de la vida para crear software para la minería de datos y el análisis de información derivada de la biología. El objetivo es ayudar a los científicos a establecer conexiones en el complejo y próspero mundo de los descubrimientos científicos. «Todos los días hay nuevos hallazgos de investigación reportados en la literatura y hay descubrimientos que esperan ser hechos al explorar las conexiones».

«Nuestras mentes no pueden correlacionar todos los conjuntos de datos disponibles de manera eficiente y con un alto grado de confianza sin la ayuda de la biología computacional», dijo Richard Helm, profesor asociado de bioquímica. «El intento de encontrar correlaciones significativas en el océano de conjuntos de datos Online es abrumador. Sin embargo, puede haber experimentos publicados en la literatura que examinen subconjuntos particulares de un proceso biológico. El algoritmo Storytelling conecta objetos» distantes «al encontrar estas conexiones más cercanas. y reunirlos en una trama. La evaluación de estas historias puede proporcionar hipótesis que pueden ser probadas en el banco, lo que puede resultar en nuevos conocimientos sobre el papel de un evento molecular particular en el proceso que le interesa «.

El diseño del algoritmo Storytelling se basa en motores de búsqueda a gran escala como Google. Cada «nodo» en System X, una supercomputadora de clúster Apple Xserve G5 1100, es responsable de indexar una parte de la literatura biológica, y los nodos intercambian información entre sí para ayudar a definir enlaces y crear conexiones. «Algunas de nuestras sesiones de Storytelling más grandes procesan cientos de miles de documentos y ejecutan hasta 200 nodos simultáneamente», dijo Ramakrishnan.

Helm y su colega Malcolm Potts, profesor de bioquímica, están estudiando los procesos y estrategias que utilizan los organismos para entrar y salir de un estado de actividad metabólica reducida, como la inactividad o la animación suspendida. La aplicación de estos procesos a células de mamíferos podría conducir al desarrollo de biosensores celulares robustos, el almacenamiento a largo plazo de componentes celulares y vacunas que no requieren refrigeración.

Así que decidieron utilizar la narración para estudiar dichos procesos en la levadura en ciernes (Saccharomyces cerevisiae) explorando las conexiones entre los papeles de levadura. Utilizaron la narración de historias para explorar resúmenes de artículos, no acordaron un código o nomenclatura, sino oraciones y párrafos que presentan los pensamientos de diferentes personas usando diferentes frases y jerga y sin pensar en los mismos problemas.

Los investigadores utilizaron la narración para descubrir la relación entre dos artículos de PubMed (PM): «Expresión temprana de genes de levadura afectados por el estrés químico» (PMID: 15713640) y «Los factores de transcripción del estrés térmico del tomate pueden sustituir funcionalmente HSF1 en levadura Saccharomyces cerevisiae «(PMID: 9268023). Pidieron enlaces utilizando resúmenes de 140.000 publicaciones sobre levaduras. Las palabras clave se desarrollaron a partir de 3.756 resúmenes que contienen las palabras clave «levadura» y «estrés».

«Los [discovered] La historia comienza con un experimento de alto rendimiento que relaciona el estrés químico con la expresión génica en Saccharomyces cerevisiae y termina con los factores de transcripción del estrés por calor en el tomate «, informaron en una reunión internacional». La «trama» ha comenzado comparando el estrés oxidativo con los metales pesados. Esto condujo a un artículo que identificaba un gen de Candida sp. que se expresaba cuando las células se exponían al cadmio pero no al cobre, mercurio, plomo o manganeso «.

Resultó ser una proteína nueva. «El vínculo entre los factores de transcripción del estrés por calor del tomate y un gen específico de cadmio sin coincidencias conocidas en las bases de datos actuales fue a través del trabajo con una especie diferente de levadura (la levadura de fisión Schizosaccharomyces pombe), donde un estudio examinó específicamente las respuestas al estrés por calor y cadmio. Esta historia identifica a los actores clave en la biología de los sistemas de los estreses químicos relacionados «, dijo Helm.

«El santo grial de aplicar la informática a la biología es comprender un organismo o proceso en particular a un nivel superior al que estamos acostumbrados a considerar», dijo Helm.

El estudio del envejecimiento en humanos es un ejemplo de tal «biología de sistemas», el estudio de sistemas integrados. Y es un ejemplo de un área donde el enfoque de Storytelling puede marcar la diferencia. «Hay muchos componentes moleculares en el proceso de envejecimiento que producen ‘fenotipos’ físicos y emocionales. Todas estas interacciones generan un ser humano anciano, cuyos resultados son ligeramente diferentes para todos», dijo Helm. “¿Podemos establecer vínculos entre eventos moleculares aparentemente diferentes para unir el complejo proceso de envejecimiento? Ésta es una pregunta difícil, pero puede haber experimentos realizados y publicados en la literatura que examinen subconjuntos más pequeños del problema «.

El artículo, «Algoritmos para contar historias», del estudiante graduado Deept Kumar, Ramakrishnan, Helm y Potts, fue publicado en las Actas de la 12a Conferencia Internacional ACM SIGKDD sobre Descubrimiento de Conocimiento y Minería de Datos (KDD’2006) en agosto de 2006, accesible a http://people.cs.vt.edu/%7Eramakris/papers/kdd06-storytelling.pdf.

«En el trabajo futuro, nuestro objetivo es estudiar otras formas de construir historias que imiten o complementen la forma en que los biólogos establecen conexiones entre conceptos», dijo Ramakrishnan. «Nuestro objetivo final es un producto que sea una herramienta importante para razonar con datos y teorías de dominio».

System X es una supercomputadora de clúster Apple Xserve G5 1100. Obtenga más información sobre System X en http://www.tcf.vt.edu/systemX.html.

Obtenga más información sobre el trabajo del Dr. Ramakrishnan en http://people.cs.vt.edu/~ramakris/.

—–

Fuente: Virginia Tech

No te olvides compartir en tu Facebook para que tus amigos lo consulten

??? ? ? ???

Comparte