Habilite la búsqueda con MATLAB en TeraGrid - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Habilite la búsqueda con MATLAB en TeraGrid

Hola y mil gracias por leerme. Yo soy Simón Sánchez y hoy hablaremos sobre Habilite la búsqueda con MATLAB en TeraGrid

Rajesh Bhaskaran, del estudio de diseño de sistemas espaciales CUSat Satellite Project de Cornell, lidera un esfuerzo de varios años para crear e implementar un sistema satelital de inspección en órbita autónomo utilizando simulación basada en MATLAB.

Mientras tanto, Ricky Harjanto del Laboratorio de Ingeniería de Tejidos de Cartílago de UC San Diego también está utilizando MATLAB para examinar los cambios en la forma del fémur de los ratones durante el desarrollo postnatal utilizando técnicas de modelado de formas estadísticas para determinar los cambios en el desarrollo del ratón en diferentes etapas de crecimiento.

Al mismo tiempo, Harshal Mahajan, del Centro de Tecnología de Calidad de Vida NSF de la Universidad de Pittsburgh, está modelando la conducción en silla de ruedas eléctrica para determinar diferentes técnicas para mejorar y mejorar la movilidad de las miles de personas que dependen de las sillas de ruedas. seguro y eficaz. El código de Mahajan utiliza la caja de herramientas de identificación del sistema MATLAB para construir modelos a partir de la gran cantidad de datos de conducción recopilados.

Además de utilizar MATLAB como herramienta principal, estos y otros investigadores tienen algo más en común; todos utilizan MATLAB de la Universidad de Cornell en el recurso informático experimental TeraGrid, que les ayuda a obtener resultados rápidos en su escritorio, y lo están haciendo en un entorno operativo con el que ya se sienten cómodos.

Programación de alto nivel para no programadores

MATLAB es omnipresente en la informática científica y a gran escala con estimaciones que se acercan a más de un millón de investigadores que utilizan la herramienta para una amplia variedad de aplicaciones informáticas técnicas. Aparte de su uso en aplicaciones técnicas, también se utiliza para manipular datos recopilados por una variedad de instrumentos científicos, incluidos satélites, telescopios y sensores.

Existen claros incentivos para proporcionar software y recursos computacionales de fácil acceso a un gran número de usuarios científicos en general. Este ha sido el objetivo de numerosas universidades y laboratorios nacionales desde la era de las redes hasta la actualidad. Este fue uno de los objetivos de la National Science Foundation, que es una de las pocas fuentes de financiamiento para este tipo de proyectos y, como resultado, no es difícil ver cómo se involucró su interés cuando Cornell dijo que podría brindar MATLAB y computación de alto rendimiento para múltiples investigadores.

Como dijo Robert Buhrman, vicepresidente senior de investigación de Cornell, «MATLAB en TeraGrid permitirá a una clase más amplia de investigadores expertos de MATLAB aumentar el tiempo de solución sin tener que convertirse en un experto en programación paralela». Es este momento. reducido por los resultados y la mitigación de los desafíos de programación, lo que la convierte en una opción atractiva y que tiene algunos resultados directos, a juzgar por la larga lista de Cornell de proyectos de investigación pendientes y en curso sobre los recursos de MATLAB y TeraGrid.

Parte del atractivo para los investigadores es que se reduce la curva de aprendizaje computacional. El acceso al recurso de 512 núcleos no requiere la comprensión de un sistema operativo, biblioteca MPI o programador de lotes en particular. Al utilizar Parallel Computing Toolbox y MATLAB Distributed Computing Server para acceder al recurso a través de los escritorios y puertas de enlace científicos de TeraGrid, los usuarios de TeraGrid obtienen equipos de alto rendimiento sin algunos de los problemas de programación comunes que solían encontrar de forma regular. En otras palabras, permite a los investigadores centrarse claramente en sus problemas de investigación, en lugar de obligarlos a convertirse, por poder, en expertos en programación paralela.

La asociación para llevar MATLAB a TeraGrid

La Universidad de Cornell, en asociación con la Universidad de Purdue, recibió una subvención de la NSF para implementar MATLAB en TeraGrid para lo que actualmente se considera un recurso experimental. Dado que MATLAB es una herramienta de datos tan importante para analizar datos complejos para muchos usuarios de TeraGrid, como recurso paralelo podría brindar una oportunidad aún mayor para ampliar el acceso a la informática de alto rendimiento para los investigadores.

El objetivo de la asociación entre las universidades y NSF es proporcionar «servicios informáticos de MATLAB paralelos y sin fisuras que se ejecutan en Windows HPC Server 2008 a usuarios de escritorio remoto y Science Gateway con requisitos analíticos complejos y simulación rápida».

En una entrevista reciente, David Lifka, director del Centro de Computación Avanzada de Cornell, señaló que la financiación de NSF era en parte para el personal de Cornell que desarrollaría software para habilitar a los clientes de MATLAB de cualquier plataforma (Windows, Linux, Mac) para conectarse sin problemas al recurso experimental en Cornell y realizar un trabajo paralelo. Esto significaría que los usuarios volverían a ver los resultados en el escritorio a través de la interfaz web sin tener que aprender un nuevo sistema por lotes o modelo de programación. Como explicó Lifka, «Básicamente, una vez que los usuarios están familiarizados con MATLAB, pueden usar MATLAB en paralelo directamente desde su cliente host».

La NSF también ha destinado fondos para el personal de la Universidad de Purdue encargado de permitir el mismo tipo de conectividad a través del portal científico. Purdue tiene un marco de software para crear pasarelas científicas llamado HubZero, un marco que se ha vuelto cada vez más popular a medida que más disciplinas crean pasarelas específicas de dominio para compartir y aumentar proyectos de investigación.

A nivel de hardware y software, debe tenerse en cuenta que el clúster de Cornell no es de ninguna manera un recurso «engañado». El clúster Dell PowerEdge HPC no es un sistema gigante; no hay interconexiones especiales y no ejecuta ningún software especializado y personalizado. Un vistazo a las especificaciones revela que está ejecutando todo lo que está disponible, incluido el programador HPC de Microsoft Windows y la versión estándar del software MathWorks, por ejemplo.

Lifka dijo que la única parte personalizada es la interfaz de software que el cliente instala en su cliente MATLAB que maneja la comunicación segura con el clúster para enviar trabajos.

El recurso en sí es modesto, aunque el equipo espera que eventualmente crezca después del éxito probado con el proyecto MATLAB en TeraGrid. Los tiempos de espera actuales siguen siendo un problema; este no es el acceso instantáneo que pueden proporcionar algunos proveedores de HPC como servicio del «mundo exterior». El equipo publica los tiempos de espera actuales, que suelen oscilar entre tres y cuatro días, más o menos.

Abriendo las puertas al descubrimiento

MATLAB se usa ampliamente en todas las disciplinas porque permite a los investigadores concentrarse en las preguntas inmediatas específicas de su disciplina sin la necesidad de convertirse en programadores avanzados. En general, se percibe que es mucho más compacto para usos científicos y matemáticos que Fortran o C, y por esta razón se ha convertido en el entorno más cómodo para muchos en la academia, la ingeniería y más. Al entregarlo a más usuarios, Cornell, Purdue y TeraGrid están ayudando a promover el descubrimiento científico y facilitar el acceso a muchos investigadores.

«Una de las maravillas de MATLAB es que es una herramienta tan amplia que se puede utilizar en todas las disciplinas y eso fue lo que nos pareció importante y por qué queríamos hacer este proyecto con NSF», dijo Lifka. “MathWorks MATLAB se utiliza en laboratorios empresariales, académicos y nacionales porque funciona y porque no requiere una curva de aprendizaje pronunciada. Si conoce su ciencia y conoce su MATLAB, puede hacerlo muy, muy rápidamente. «

Fomentar un impacto más amplio

Proporcionar MATLAB paralelo como recurso para una clase más amplia de investigadores fue parte de lo que hizo que el acuerdo fuera atractivo para la National Science Foundation (NSF), ya que examinó los beneficios de financiar dicha asociación. David Lifka, director del Cornell Center for Advanced Computing, dijo: “Lo que queríamos hacer y lo que NSF quiere fomentar es un impacto más amplio, atrayendo a nuevos usuarios que necesitan informática a gran escala sin la curva de aprendizaje. . Queremos que aumenten su ciencia y, con suerte, a lo largo del camino, harán algunas preguntas para que podamos seguir mejorando «.

El financiamiento proviene de una subvención para tecnologías estratégicas e infraestructura cibernética, que está respaldada por los objetivos declarados de la NSF de traer nuevos recursos que se utilizarán para fomentar un mayor acceso a la informática de alto rendimiento. La idea detrás del proyecto es presentarlo como un recurso para que luego se pueda determinar si este proyecto pertenecerá o no a la colección de proveedores de recursos de TeraGrid en el futuro. Como señaló Lifka, «estamos seguros de que algún día seremos parte de esta colección, pero hoy no lo somos».

El soporte adicional para el proyecto provino de Dell, Microsoft y The Mathworks, proveedores de MATLAB. Según Lifka, este apoyo se debió al interés de estas partes interesadas en observar cómo hacer que la informática de utilidad esté disponible y cómo el recurso experimental podría permitir un acceso sin problemas desde la Web al escritorio.

No te olvides compartir en una historia de tu Instagram para que tus colegas lo sepan

??? ? ? ???

Comparte