Los modelos de financiación de HPC deben incluir más que solo el precio de compra - Calendae | Informática, Electrónica, CMS, Ciberseguridad

Los modelos de financiación de HPC deben incluir más que solo el precio de compra

Hola otra vez. Te habla Simón Sánchez y en el día de hoy te voy a contar sobre Los modelos de financiación de HPC deben incluir más que solo el precio de compra

Más allá de la cuestión de cuántos fondos deberían invertirse en recursos informáticos de alto rendimiento, también es importante luchar por el modelo de financiación óptimo: cómo la financiación está vinculada al servicio y cómo permite e impulsa el comportamiento del usuario. Aparentemente, estos modelos están integrados en una cultura de TI que a menudo está en desacuerdo con la forma en que se usa HPC.

Este artículo se inspiró en debates de actualidad sobre los modelos de financiación y cobro de las HPC en instituciones académicas tanto del Reino Unido como de los EE. UU., Incluidos, en particular, varios publicaciones de blog por Brock Palen. Los problemas no se limitan de ninguna manera a las instituciones académicas y, de hecho, son igualmente urgentes para los usuarios de la industria y los proveedores de recursos de HPC.

Para muchas de las supercomputadoras más grandes del mundo, siempre existe una separación entre la gran suma de dinero para la máquina y el financiamiento para la operación actual, que a menudo se debe a diferentes vías de financiamiento para cada uno. Sin embargo, la realidad para la mayoría de los sistemas HPC fuera de los servicios nacionales de supercomputación, especialmente los sistemas HPC académicos institucionales e industriales, es que la financiación y la prestación de servicios están estrechamente vinculadas.

Para comenzar, limitemos esta discusión a los recursos internos de HPC. (Volveré para analizar la computación en la nube y otros modelos externos en un artículo futuro). La discusión incluye financiación, medición, expertos profesionales y, en última instancia, cambios culturales.

¿De dónde proviene la financiación?

Además de la donación a tanto alzado, existen esencialmente tres modelos para financiar los recursos de HPC: a través de gastos generales, tarifas de uso o una combinación de estos dos. A menudo me refiero al último modelo como «línea de base más». Con el modelo de gastos generales, la estructura de HPC corporativa o departamental se proporciona a los usuarios como parte de la infraestructura corporativa o universitaria y se incluye en los gastos generales corporativos. Puede haber una contabilidad, que es el registro del uso de los recursos por parte de cada usuario, pero no el cargo. Con el modelo de tasas de uso, la contabilidad conduce directamente a la facturación a los usuarios por su consumo real de recursos.

Con el modelo baseline plus, algunos elementos del servicio, como el almacenamiento, pueden incluirse en los gastos generales, mientras que otros, como el ciclo de la CPU, se pueden cobrar en forma de pago por uso. O la combinación se puede aplicar a todo, esencialmente subsidiando las tarifas de uso al incluir parcialmente los costos en los gastos generales. O se puede utilizar una combinación para proporcionar un servicio gratuito para niveles de consumo «normales» pero cobrar por uso extremo, como grandes requisitos de almacenamiento, grandes trabajos de memoria, trabajos de alto número de núcleos, etc. .

Encuentra el modelo que agrada a todos

Para ver los beneficios y desafíos de cada modelo, comencemos desde la perspectiva del usuario, siempre un buen lugar para comenzar. El modelo preferido de los usuarios casi siempre será «gratuito», que es el modelo de gastos generales. A primera vista, esto ofrece la menor carga para el usuario. Simplemente realizan las simulaciones científicas o de ingeniería que necesitan y prestan tanta atención al costo de los recursos de HPC como a la conexión a Internet corporativa o la iluminación de la oficina. Sin embargo, esto también puede generar tensiones cuando algunos usuarios sospechan que otros están consumiendo una parte «injusta» del recurso común.

En el otro extremo, es probable que el modelo de «cargo para todos» sea el menos favorecido por la mayoría de los usuarios, simplemente porque crea una cultura de tener que justificar cada uso del recurso. Esto puede ser visto como algo positivo por la alta dirección, ya que es probable que el activo HPC represente una inversión significativa. Sin embargo, podría limitar la libertad del investigador o del ingeniero para «simplemente demostrar esto», es decir, para realizar un trabajo especulativo que no está vinculado a un objetivo claro, pero que puede desencadenar una innovación significativa.

En teoría, el modelo baseline-plus permite lo mejor de ambos mundos, lo que permite el trabajo especulativo y menos atención al monitoreo del consumo, al tiempo que garantiza que los usuarios que dominan el consumo sean considerados como contribuyentes. Sin embargo, la complejidad potencial del modelo (lo que se incluye en el servicio principal y lo que se cobra en el momento de uso) puede crear confusión y debate entre los usuarios sobre la forma «correcta» de configurar la complejidad.

Volviendo al punto de vista del gerente de HPC, el instinto suele preferir el modelo de gastos generales, ya que esto suele funcionar en la práctica como una forma predecible de presupuestar el recurso. El modelo de tarifa de uso a menudo se considera menos deseable porque convierte a cada gerente de HPC en un empleado de ventas que intenta que los clientes regresen por más e implica un presupuesto incierto.

Permitir el crecimiento y la innovación

A lo largo de esta discusión hasta ahora, hemos asumido un presupuesto y recursos de tamaño estático. De hecho, el aspecto crítico de estos modelos es donde evoluciona la oferta de HPC.

Con el modelo de gastos generales, aumentar los recursos, por ejemplo, comprar una supercomputadora más grande o proporcionar más personal de apoyo, generalmente significa volver a la administración con un caso para aumentar el presupuesto. Sin un vínculo directo entre los usuarios finales y el recurso suministrado y consumido, ese caso es más difícil de resolver.

Con la contabilidad de uso (no necesariamente en la oficina) esto se vuelve más fácil. Cambiar el equilibrio de la provisión de HPC, como proporcionar nodos de memoria más grandes o más núcleos en lugar de almacenamiento, es casi imposible porque cada usuario verá una necesidad diferente.

El modelo de tarifa de uso resuelve este problema. A medida que aumenta el uso, el recurso se puede incrementar con ingresos por comisiones. El tipo de recurso proporcionado también se puede cambiar para satisfacer las necesidades de los usuarios que dirigen su uso pago a diferentes elementos del servicio.

Sin embargo, el modelo de tarifa de uso puro crea otros problemas. Y los recursos que el administrador de HPC sabe que los usuarios necesitarán, pero ¿por qué usuarios se oponen a pagar directamente? La experiencia en rendimiento de código es un ejemplo común, al igual que el ancho de banda de interconexión.

Lo que se mide es lo que se enfoca

Esto conduce a otro aspecto clave de los modelos, a saber, qué medir (y, por lo tanto, cobrar en las tarifas o en los modelos de línea de base plus).

La unidad de consumo más común para medir es la utilización de la CPU. Se contabiliza a los usuarios cuántas horas de CPU consumen y se les cobra de forma adecuada. El precio de la hora de CPU incluye el costo de funcionamiento del sistema, pero para muchos usuarios no es justo. Por ejemplo, ¿por qué debería pagar un precio alto por hora de CPU cuando no necesito esa interconexión rápida que está aumentando el precio? O nunca he usado el equipo de soporte, entonces, ¿por qué no puedo obtener un precio con descuento? El otro usuario consume mucha más memoria o disco que yo, ¿seguro que deberían pagar más? Y así.

Es tentador responder fácilmente con cargos separados para diferentes elementos del servicio: horas de CPU, personal de soporte, uso de disco, nodos de memoria alta, etc. Sin embargo, esto rara vez funciona bien en la práctica tanto para los usuarios como para los administradores de HPC.

Sin embargo, medir las horas de CPU es una práctica muy mala. Los procesadores son a menudo la parte más barata de comprar de la supercomputadora, detrás de la memoria, la interconexión y quizás el disco, y ciertamente son pequeños en comparación con los costos operativos, como la energía y los salarios del personal.

Los núcleos de procesador inactivos se consideran «algo malo», pero la memoria probablemente cuesta tanto comprar y casi tanto gastar allí y consumir electricidad. Sin embargo, pocos servicios de HPC controlan el uso de la memoria. O el uso de la interconexión.

Producción científica y corporativa, sin CPU ocupadas

Y hablando de uso, existen intereses en competencia entre los usuarios y administradores de HPC. Para los usuarios, un alto uso significa más contención por los recursos, por ejemplo, colas de trabajo más largas, lo cual es malo. Para los gerentes de HPC, la alta utilización significa que la oferta y la demanda están, en teoría, estrechamente emparejadas, lo que es un uso eficiente del presupuesto.

Pero un uso eficiente del presupuesto debe estar relacionado con los resultados científicos o de ingeniería logrados, no con el consumo detallado del recurso que permite tal innovación. Cuál es una mejor utilización del presupuesto, un sistema de baja utilización disponible en la escala de tiempo de las necesidades de los investigadores o ingenieros (y les da la libertad de probar nuevas ideas o respaldar las solicitudes de los clientes con poca antelación) o un sistema de alta utilización ¿Qué significa simplemente que puede hacer tratos planificados?

La complejidad de adaptar el modelo a las necesidades del negocio, tanto de los financiadores como de los usuarios, significa que la estrategia para entregar HPC rara vez es tan simple como se supone. Por eso, los profesionales con experiencia tienen un papel en la búsqueda del mejor modelo para una situación determinada. El «gerente de HPC» o equivalente es un rol valioso y distinto dentro de la organización, al igual que el apoyo potencial de expertos independientes disponibles para asesorar.

¿La cultura equivocada?

Quizás una parte clave de la respuesta es que HPC no es realmente TI. Está construido con tecnología informática, pero en realidad es un instrumento científico o una instalación de ingeniería. yo tengo escrito sobre esto antes. Entonces, tal vez necesitemos alejarnos de la financiación, la medición y las culturas de usuario heredadas de la TI tradicional.

El éxito de un telescopio óptico en astronomía podría medirse por los nuevos objetos que se observan, no por la cantidad de tiempo que un globo ocular está pegado al extremo. El éxito de un túnel de viento podría medirse por la calidad y cantidad de información de diseño obtenida, no necesariamente por la cantidad de tiempo que gira el ventilador. Se espera que la herramienta o la instalación cuenten con el apoyo de expertos cuya profesión sea la tecnología de herramientas y que ésta sea una parte clave del recurso financiado, no un extra opcional.

¿Qué puede ver como culturas del mundo de la TI tradicional que están frenando el potencial de HPC?

Recuerda compartir en una historia de tu Instagram para que tus amigos lo disfruten

??? ? ? ???

Comparte