Watson da un giro a Wall Street - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Watson da un giro a Wall Street

Hola de nuevo. Yo soy Simón Sánchez y en esta ocasión vamos a hablar sobre Watson da un giro a Wall Street

A raíz del desempeño dominante de Watson en Jeopardy el mes pasado, IBM ha llevado la tecnología a la carretera para mostrársela a cualquiera que escuche. El lunes, Watson, o mejor dicho, sus custodios, fue la estrella de la sesión inaugural de la conferencia de mercados financieros de Linux de computación de alto rendimiento en la ciudad de Nueva York. También hubo una demostración de Watson en la conferencia, atrayendo multitudes al stand de expositores de IBM.

Si presentar un proyecto de investigación a una audiencia de Wall Street parece inusual, tenga en cuenta que IBM no tiene la intención de mantener a Watson en el laboratorio para siempre. La comercialización de la tecnología está claramente en el plan de la empresa.

Después de la victoria de Jeopardy, la próxima tarea de la supercomputadora será aplicar su inteligencia analítica a las aplicaciones sanitarias. IBM y Nuance Communications, en asociación con el Centro Médico de la Universidad de Columbia y la Facultad de Medicina de la Universidad de Maryland, están buscando formas de utilizar Watson para ayudar a los médicos a diagnosticar pacientes en un entorno médico del mundo real.

Como estaba en la ciudad para la conferencia de Wall Street HPC, tuve la oportunidad de charlar con dos de los miembros de IBM que hablaron sobre el tema: Jean Staten Healy, director del grupo Cross-IBM Linux, y Edward Epstein, gerente de Información. no estructurados en IBM Research, y pregúnteles cómo se podría aplicar la tecnología a los servicios financieros.

Pero primero quería aprender más sobre el diseño de Watson y cómo evolucionó a lo largo del proyecto de tres años. Dado que Epstein fue uno de los principales desarrolladores de software Watson, pudo darme un resumen del camino de la supercomputadora al estrellato Jeopardy.

Según él, Watson tuvo un comienzo bastante insignificante. En su primera encarnación, tomó dos horas escupir la respuesta a una pregunta (o más bien la pregunta a la respuesta), lo que obviamente no habría sido bueno para un juego en horario estelar. Los ingenieros de IBM pronto se dieron cuenta de que necesitaban hacer un rediseño serio de las 750.000 líneas de código si querían ser competitivos en Jeopardy.

En primer lugar, todos los datos (diccionarios, enciclopedias, textos históricos, etc.) debían insertarse en la RAM. Esperar valiosos milisegundos para que se lea el disco es un asesino del rendimiento, por lo que todo se ha introducido en la memoria para un acceso ultrarrápido.

Pero la mayor parte del esfuerzo inicial para aumentar la velocidad de ejecución implicó escalar el software para que los cientos de algoritmos de análisis y código de procesamiento de lenguaje natural (NLP) pudieran ejecutarse en paralelo. Los algoritmos se paralelizaron en todo el marco de análisis en este caso Apache UIMA (Arquitectura de gestión de información no estructurada), un entorno de gestión de información de código abierto que era el corazón del software de Watson. Además, los algoritmos de búsqueda que buscaban referencias de datos se distribuyeron entre los núcleos disponibles del clúster Watson. Cuando se realizó el esfuerzo de escalamiento horizontal inicial, había alrededor de 200 procesos Java y otros 200 procesos C ++ ejecutándose en paralelo en el hardware de Watson.

Según Epstein, este esfuerzo redujo el tiempo de respuesta promedio a poco más de 14 segundos. Porque, en Jeopardy, necesita tener la respuesta en segundos, en la mayoría de los casos solo una fracción de segundo después de leer la pista, todavía necesitaban un aumento adicional de cuatro veces en el rendimiento. La mayor parte de esto se logró mediante el llenado previo en profundidad de análisis NLP del texto preestablecido y martillando cada cálculo atípico. Con eso, el tiempo de respuesta promedio se redujo a 3.6 segundos, a la par con una muestra humana de Jeopardy.

El trabajo inicial de desarrollo de software y las coincidencias de combate para Watson se realizaron en un clúster blade IBM x86, equipado con CPU Xeon Nehalem. Ese sistema tenía la capacidad de almacenar resultados intermedios, de modo que durante las ejecuciones de prueba, el equipo de software podía ejecutar un escenario parcial y volver a él más tarde para realizar un nuevo cálculo basado en esos intermedios. Además, durante el desarrollo, era importante ejecutar miles de preguntas a la vez, en lugar de una sola pregunta para una ejecución rápida en tiempo real. Por lo tanto, el sistema se escaló de manera diferente al clúster Power 750 final utilizado en el partido Jeopardy.

El clúster de desarrollo x86 tenía procesadores mucho menos potentes, menos memoria y, lo que es más importante, menos ancho de banda de memoria que la máquina Power 750. Básicamente, Watson es una aplicación de big data que alimenta grandes cantidades de información a través de un marco complejo de software de análisis. El hecho de que esto tenga que hacerse de forma interactiva impone limitaciones particulares al rendimiento.

Según Epstein, necesitaban el rendimiento del Power 750 para ser competitivos en Jeopardy. Afortunadamente, trasladar el software del sistema blade x86 al clúster de Power fue bastante sencillo, ya que la pila de software está basada en tecnología portátil (Java, C ++, Linux y UIMA).

Un solo nodo 750 tiene cuatro CPU Power7 de 8 núcleos a 3,5 GHz, y todo el sistema constaba de noventa nodos de este tipo, que encapsulaban 2.880 CPU y 16 TB de RAM. Se estima que el rendimiento máximo del sistema Jeopardy es de alrededor de 80 teraflops.

El equipo de software de Watson ha agregado una serie de optimizaciones de Power7 para impulsar un poco más el rendimiento. La mayor parte de esto implicó el uso del control NUMA para asociar procesos de software con recursos específicos en la máquina. «Si realmente está buscando la máxima ventaja de rendimiento, haga cosas así», dijo Epstein.

El grupo Ninety Power7 probablemente fue un poco exagerado para el juego Jeopardy. Epstein estima que la utilización de la CPU estuvo cerca del 30 por ciento al procesar la pista (por lo que, en teoría, Watson podría haber jugado dos juegos Jeopardy adicionales al mismo tiempo). De cualquier manera, el trabajo de Epstein era ganar el juego a cualquier costo, maldito el uso de la CPU. «Tuve el lujo de tener suficiente hardware para hacer este trabajo para Jeopardy», explicó.

Entonces, ¿qué está haciendo Watson en Wall Street? IBM puede buscar atraer a algunos socios disponibles para un proyecto de análisis financiero al estilo Watson similar a la iniciativa de investigación de salud mencionada anteriormente. Obviamente, Big Blue se enorgullece de la tecnología y cree que el sistema se puede aplicar a todo tipo de trabajo de análisis profundo.

El propio Epstein está trabajando actualmente en el grupo involucrado en el proyecto de salud, pero hay varias personas que están explorando «otras oportunidades». Un grupo se centra específicamente en el espacio de aplicaciones financieras.

Healy de IBM cree que un enfoque principal de la tecnología en el ámbito financiero implicará la gestión de riesgos. La idea es ofrecer resultados que permitan a los inversores y administradores de dinero tomar decisiones muy rápidas en función de las condiciones del mercado. Healy dijo que no solo escupiría una sola respuesta como en Jeopardy, sino que también proporcionaría métricas de confianza sobre esa respuesta, así como algún tipo de prueba de su análisis.

Healy también sugirió la posibilidad de que Watson pudiera servir como un recurso para las personas que toman decisiones de inversión personales. Uno podría imaginar algún tipo de aplicación «Ask Watson» que pudiera servir a miles o incluso millones de inversores simultáneamente (asumiendo que la máquina se escalara adecuadamente). Para este tipo de trabajo, es posible que Watson necesite solicitarle información en función de su demanda de inversión específica. En ese sentido, Watson no podía ser simplemente un contestador automático; también necesitaría algunas habilidades de conversación rudimentarias. Si bien Healy admite que la tecnología aún se está investigando, tiene muchas aplicaciones futuras desde su punto de vista.

Sospecho que Watson estará presente en muchas conferencias este año mientras IBM prueba las aguas de la tecnología. El análisis en profundidad es ampliamente aplicable a muchos dominios y esto tiene todas las características para un negocio de alto margen para IBM. Solo necesitan recopilar algunos puntos de prueba.

Deberías compartir en tu Facebook para que tus amigos lo disfruten

??? ? ? ???

Comparte