El DOE financia la investigación de resiliencia a exaescala - Calendae | Informática, Electrónica, CMS, Ciberseguridad

El DOE financia la investigación de resiliencia a exaescala

Hola, ¿qué tal colega?. Te habla Simón Sánchez y hoy te voy a contar sobre El DOE financia la investigación de resiliencia a exaescala

Con la cuenta regresiva del calendario para la primera supercomputadora de exaescala, los esfuerzos para resolver desafíos tecnológicos empinados están aumentando en número y urgencia. De los muchos obstáculos que inhiben las plataformas informáticas de escala extrema, la resiliencia es uno de los más importantes. A medida que los sistemas se acercan al paralelismo multimillonario, la proliferación de errores al ritmo actual no funciona. En reconocimiento de la gravedad de este desafío, el gobierno federal está buscando propuestas de investigación básica que aborden los desafíos de resiliencia de las plataformas informáticas en una escala extrema.

El 28 de julio de 2014, la Oficina de Investigación en Computación Científica Avanzada (ASCR) de la Oficina de Ciencias anunció un oportunidades de financiamiento bajo el lema «Resiliencia para sistemas de supercomputación de escala extrema». El programa tiene como objetivo estimular la investigación sobre la mitigación de fallas y errores para que las aplicaciones de exaescala puedan ejecutarse de manera eficiente hasta su finalización, generando resultados correctos de manera oportuna.

«La próxima generación de avances científicos será posible gracias a desarrollos de investigación que puedan explotar de manera efectiva los avances significativos o disruptivos en la tecnología de la información», dice el resumen oficial. “Las aplicaciones que se ejecutan en sistemas de computación de escala extrema generarán resultados con una resolución y fidelidad de órdenes de magnitud más alta, logrando un tiempo de solución significativamente más corto que el que es posible con las plataformas de computación de alto rendimiento actuales. Sin embargo, los indicios apuntan a que estos nuevos sistemas experimentarán fallas duras y blandas con una frecuencia cada vez mayor, lo que requiere investigación para desarrollar nuevos enfoques de resiliencia que permitan que las aplicaciones se ejecuten de manera eficiente hasta completarse de manera oportuna y obtengan resultados correctos «.

los

El DOE está buscando propuestas específicamente en tres áreas de interés:

1. Detección y clasificación de fallas: según los expertos en procesamiento del DOE, los sistemas de supercomputación actuales deben entenderse mejor para evitar comportamientos similares en máquinas futuras.
2. Mitigación de fallas: esta categoría se divide en dos partes: la necesidad de un punto de control / reinicio más eficiente y eficaz (C / R) y la necesidad de alternativas efectivas a C / R.
3. Detección de anomalías y prevención de fallas: uso de estrategias de aprendizaje automático para anticipar fallas lo suficientemente temprano como para tomar medidas preventivas, como migrar la aplicación en ejecución a otro nodo.

Se otorgarán de cuatro a seis premios de investigación durante un período de tres años que van desde $ 100,000 por año a $ 1,250,000 por año.
Se espera que el financiamiento total de hasta $ 4,000,000 por año esté disponible una vez que el Congreso lo apruebe. El plazo de solicitud previa está fijado para el 27 de agosto de 2014.

Puedes compartir en en tu Twitter y Facebook para que tus colegas lo vean

??? ? ? ???

Comparte