Vista previa de tecnología disruptiva SC10: el primer portal en la nube para "R" y más allá - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Vista previa de tecnología disruptiva SC10: el primer portal en la nube para «R» y más allá

Hola otra vez. Te escribe Simón Sánchez y hoy te voy a hablar sobre Vista previa de tecnología disruptiva SC10: el primer portal en la nube para «R» y más allá

En cada conferencia anual de supercomputación, se seleccionan un puñado de innovaciones como «tecnologías disruptivas» del año que tienen más probabilidades de revolucionar la informática de alto rendimiento. Estos se describen como «innovaciones drásticas en las prácticas actuales … que tienen el potencial de transformar completamente» el paisaje.

En el evento de este año en Nueva Orleans, la atención se centrará en «nuevas arquitecturas e interfaces informáticas que tendrán un impacto significativo en el campo de la informática de alto rendimiento durante los próximos 5 a 15 años», un enfoque que se refleja en el ‘lista de expositores disruptivos que han sido seleccionados por un comité de SC.

Otra «calificación» de esas innovaciones seleccionadas es que es posible que aún no hayan surgido en el panorama de manera significativa, que se sientan en la vanguardia esperando que el impulso explote y provoque un cambio de paradigma.

Al margen de este potencial cambio radical en HPC, e incluido en la lista de innovación SC10 de este año, se encuentra un espectáculo individual dirigido por Karim Chine de su empresa recién creada, Cloud Era, Ltd.

La oportunidad de Chine de exhibir su «Portal de procesamiento de ciencia en la nube similar a Google Docs» podría significar su compromiso de tres años, que inició después de no asegurar la financiación necesaria para su proceso. investigación y desarrollo, podrían generar un interés significativo y lograr lo que este autodefinido «emprendedor social» llama un impacto real y universal en el vasto campo del análisis de datos a gran escala.

El objetivo de Chine cuando comenzó el proyecto después de dejar la academia era llevar el lenguaje R a la nube y distribuirlo sin problemas a los usuarios que pueden compartir infraestructura y colaborar en tiempo real con una amplia gama de documentos y herramientas. cálculo. O al menos esta es la versión Reader’s Digest: la tecnología y los procesos reales que crean la experiencia para los usuarios técnicos van mucho más allá de estos elementos en términos de complejidad y lo que es posible.

Desde el principio, Chine vio el valor intrínseco de R como una herramienta ubicua, pero también reconoció que hay una serie de desafíos incorporados en el uso del lenguaje en términos de memoria y capacidad de procesamiento que se extienden hasta el límite. En el otro extremo del espectro, también vio cómo podía transferir lecciones de las redes sociales. Chine señala que parte de lo que hace que su proyecto Elastic-R sea innovador, incluso disruptivo, es que los usuarios pueden ir más allá de compartir información estática como lo harían en una plataforma de redes sociales y, en cambio, tener una red científica donde compartir la información en tiempo real sería el núcleo de las comunidades.

El idioma R llegará a un navegador cercano

Es demasiado simple sugerir que lo que hace que la plataforma sea única o disruptiva es la capacidad de compartir recursos e información en tiempo real. En el corazón de esta innovación se encuentra la mayor capacidad de los investigadores para utilizar R, Scilab y otras herramientas de una manera nueva, en los recursos «infinitos» proporcionados por la nube.

Muchos estarán de acuerdo en que el lenguaje R es la lengua franca del análisis de datos: es el estándar para casi todos los estudiantes de estadística en las principales universidades y tiene una base de usuarios que, según algunas estimaciones, supera el millón. Desde el punto de vista de Chine, la belleza del lenguaje R, que es una implementación de código abierto de S, radica «no solo en las estadísticas, no solo en el código abierto, se ha convertido en el entorno en el que la gente comparte artefactos científicos». donde las personas contribuyen y acceden a herramientas poderosas para trabajar con datos «.

Aunque Chine ha discutido durante mucho tiempo algunas de las ventajas del lenguaje R para científicos e investigadores, señaló que existen algunas limitaciones significativas en el lenguaje, particularmente en el campo de la arquitectura de software, y la clara falta de la capacidad de R para optimizar el uso. de memoria. Sin embargo, los problemas de memoria y arquitectura se pueden resolver proporcionando R a través de recursos basados ​​en la nube, como EC2, en un entorno donde un usuario ya no está limitado por el cálculo o la memoria y donde las instancias de máquinas económicas con 70 pueden ponerse en acción. GB de RAM en momentos.

La idea de «unos momentos» para poner en funcionamiento una instancia puede parecer un poco descabellada para algunos usuarios nuevos de EC2, lo que lleva a otro problema que Elastic-R puede resolver. Uno de los objetivos que Chine tenía en mente no era solo proporcionar un recurso que haría que R estuviera disponible a través de un navegador web en una máquina como un iPad, por ejemplo, que tiene una capacidad de procesamiento limitada, sino proporcionar el recurso de una manera que es intuitivo y elimina la complejidad potencial de acceder a la infraestructura remota.

Elastic-R permite a los científicos, profesores y estudiantes utilizar los recursos de la nube sin problemas, trabajar con motores R y utilizar toda su funcionalidad desde cualquier navegador web estándar. Por ejemplo, pueden colaborar en tiempo real, crear, compartir y reutilizar máquinas, sesiones, funciones de datos, hojas de cálculo, cuadros de mando, etc. «

Elastic-R también es una plataforma de aplicación que permite a cualquier persona reunir métodos y datos estadísticos con interfaces de usuario interactivas para el usuario final. Estas interfaces y paneles se crean visualmente y se publican y entregan automáticamente como aplicaciones web simples «.

Para Chine, la naturaleza revolucionaria o disruptiva de Elastic-R radica en su facilidad de uso, algo que pocas personas podrían decir sobre el lenguaje R estático. Afirma que ofrecer una plataforma en R con la que sea fácil trabajar en cualquier navegador permite a las personas acceder a la infraestructura sin tener conocimientos de informática o con una formación específica real. Básicamente, en tres minutos puede tener acceso simple a máquinas en EC2 que le permitirán hacer lo que quiera con datos a gran escala.

Aún más disruptivo, sin embargo, es el hecho de que los usuarios pueden conectarse a otras herramientas de procesamiento científico como Scilab o MATLAB, lo que la convierte en una plataforma universal abierta al cambio y que agrega la capacidad de insertar herramientas adicionales para mejorar la investigación. Por lo tanto, pueden eliminar los problemas relacionados con la disponibilidad de datos en formatos dispares que pueden complicar el intercambio transfiriendo los resultados directamente a las herramientas estándar de Microsoft Office que se pueden compartir y modificar en tiempo real a través de la interfaz web.

Llevando R más allá de la nube pública

Por el momento, el recurso solo se puede implementar mediante Amazon EC2, pero es simplemente una cuestión de cuánto ha viajado Chine con sus experiencias; en teoría, esto se puede hacer en cualquier recurso. Por ejemplo, cuando comenzó a implementar la versión prototipo de Elastic-R, lo hizo en National Grid Services en el Reino Unido utilizando un clúster estándar, lo que habría sido posible en cualquier otro recurso que pudiera haber seleccionado.

El punto es que lo que ha creado Chine es independiente del hardware y del sistema operativo, por lo que los usuarios pueden conectarse a los motores de cómputo a través de sus navegadores, lo que les permite trabajar con datos a gran escala que no se mueven, pero que puede compartir con otros para la colaboración en tiempo real.

Como dijo Chine, «Lo maravilloso de Amazon es que ya proporcionan la nube pública más importante del momento, pero también que han difuminado la línea entre la informática normal y HPC … Para el usuario final o la perspectiva empresarial. «Diseño de interacción no hay frontera entre la informática general y la informática de alto rendimiento».

Hay una serie de características que Elastic-R son casi demasiado numerosas para mencionarlas en un artículo relativamente corto. De hecho, esta parece ser una de las razones por las que se trata de una tecnología tan disruptiva; tiene múltiples capas en su utilidad potencial. Los científicos e investigadores pueden abrir entornos informáticos convencionales más allá de R (Scilab, SciPy, Sage, etc.); pueden enviar comandos al motor remoto R, instalar y desplegar nuevos paquetes y ejecutar fácilmente algoritmos de cálculo intensivo que se administran virtualmente a través de la simple interfaz, luego comparta todo, incluidos los recursos computacionales mismos.

Lo siguiente es de una diapositiva de lo siguiente manojo (la presentación, que es la archivo pptx proporciona una descripción general más profunda de las capas del portal Elastic-R y lo que proporciona) que muestra cómo los usuarios pueden ver su acceso a los recursos y herramientas.

Durante una entrevista con Karim Chine, se me concedió acceso a la interfaz para observar cómo se lleva a cabo la colaboración y cómo se protegen los recursos. Sin mucha experiencia, fue posible entender intuitivamente qué se necesitaba exactamente para hacer que mi trabajo funcionara, identificar dónde estaban los resultados, con quién podía compartirlos y cómo en el mismo momento exacto actualicé una hoja de cálculo, mi compañero del otro lado. del océano pudo ver mis cambios en tiempo real. Tiempo real. No hubo demora. En el momento en que reemplazó un «5» con un «6» al final, lo vi en la pantalla de mi navegador.

Esta es una gran noticia para el futuro de la colaboración científica y la informática que utiliza recursos remotos.

Un modelo de negocio aún en marcha

Los objetivos de Chine son de varios niveles y van más allá de hacer que R sea más accesible para más investigadores a través de la nube: espera crear un «Facebook» para científicos y estadísticos donde puedan compartir y colaborar con big data a tiempo. utilizando una interfaz simple en la que pueden crear aplicaciones y agregar o eliminar capas de herramientas y recursos informáticos sin interrupción.

Como emprendedor social, Chine señala que esta interfaz, a medida que se desarrolla, significa que los investigadores de países en desarrollo sin acceso a recursos informáticos de alto rendimiento ahora pueden crear fácilmente instancias de máquinas para pequeñas cantidades e incluso si. esos precios son demasiado altos, incluso pueden compartir la infraestructura con los participantes colaboradores.

En esencia, esto significa que no hay solo una economía de intercambio de información involucrada en esta innovación disruptiva; hay un rincón económico que permite a los investigadores extender su infraestructura a personas de todo el mundo de manera fácil y en momentos. .

Sin embargo, como modelo de negocio, hay algunos problemas que Chine admite que todavía está trabajando para resolver. Por un lado, ve la posibilidad de involucrar a aquellos que ponen a disposición las herramientas científicas, incluido The MathWorks, colaborando en un sentido de participación en los ingresos una vez que estas herramientas estén integradas. También ve valor para los centros de supercomputación que deseen proporcionar una forma más sencilla y ágil de acceder y utilizar la infraestructura informática de alto rendimiento.

Por ahora, sin embargo, admite que solo está esperando ver cuán útil será a medida que amplíe su base de usuarios, que actualmente es de solo 140 miembros, que conoce personalmente. Anunciará la tecnología justo antes de SC10 como disponible para el público.

Si bien la nube puede abrir la puerta a una mejor colaboración y compartir recursos, además de proporcionar las herramientas que los investigadores necesitan, sigue existiendo la necesidad de software que cree un puente sólido entre las herramientas informáticas científicas y la nube, que es donde Elastic-R encaja en la foto.

Junto con la naturaleza abierta y colaborativa del proyecto, que está dirigido por su fundador y creador emprendedor social, será realmente emocionante ver cómo la comunidad recibe, usa y luego construye sobre esta innovación disruptiva.

Recuerda compartir en una historia de tu Instagram para que tus amigos opinen

??? ? ? ???

Comparte