EL DILEMA DE LA DENSIDAD DE DATOS - Calendae | Informática, Electrónica, CMS, Ciberseguridad

EL DILEMA DE LA DENSIDAD DE DATOS

Hola, un placer verte por aquí. Te habla Simón Sánchez y hoy vamos a hablar sobre EL DILEMA DE LA DENSIDAD DE DATOS

Por Geoff Barrall, director de tecnología de BlueArc Corporation

El aumento de la densidad del disco en la industria informática se está produciendo a un ritmo mucho más rápido que el aumento de la velocidad del disco. Esto presenta un problema que se acelera rápidamente y que aún puede estar bajo el radar de la mayor parte de la industria del almacenamiento.

Los clientes quieren más almacenamiento de datos a un costo menor, lo que impulsa una tendencia de producción para aumentar el tamaño del disco lo más rápido posible, duplicando la densidad por disco mientras los costos permanecen constantes. A medida que se disponga de discos más grandes, se retiran los discos más antiguos y más pequeños.

A primera vista, esto parecería ser una gran cosa para los CIO en todas partes; sin embargo, hay un inconveniente oculto en esta tendencia, ya que este aumento de densidad se produce a un ritmo mucho más rápido que el aumento de la velocidad del disco. Si esto continúa, inevitablemente conducirá a una disminución en el rendimiento del sistema de almacenamiento o una subutilización del espacio de datos disponible.

La investigación muestra una disminución drástica en el tiempo de búsqueda (una buena medida del rendimiento del disco en un entorno de datos razonablemente aleatorio) y un consiguiente aumento en la capacidad del disco a lo largo del tiempo durante la última década. Como puede verse, la reducción del tiempo de búsqueda es un fenómeno mayoritariamente lineal mientras que el aumento de capacidad es más una curva exponencial. Esta combinación da como resultado una situación en la que el rendimiento real realizado del disco duro disminuye con el tiempo (a medida que el tamaño aumenta a un ritmo más rápido que el rendimiento).

Hoy en día, los proveedores están de acuerdo en que se requiere que una cierta cantidad de unidades de disco estén conectadas a un sistema de servidor para lograr un nivel aceptable de rendimiento (por lo general, un mínimo de aproximadamente siete discos en la actualidad) por volumen RAID (básicamente un único sistema de archivos). o área de datos).

Con los discos duros de 73 GB actuales, este requisito obliga al cliente a comprar un mínimo de aproximadamente 500 GB de datos. A medida que aumenta la densidad del disco, lo que obliga a los proveedores a vender unidades de 150 GB, un sistema de siete discos se enviará con más de un terabyte completo de almacenamiento, ¡asumiendo que no necesita más discos para mantener el mismo nivel de rendimiento!

Los administradores del sistema de almacenamiento pueden optar por particionar estos discos en múltiples particiones para diferentes aplicaciones, pero el rendimiento se vería afectado ya que dos servidores o procesos de servidor separados indicarán a los cabezales del disco que se muevan rápidamente entre las particiones, lo que aumenta enormemente el tiempo de búsqueda. y recuperación de datos. En un sistema optimizado para un alto rendimiento, esta no es realmente una opción práctica.

SCSI difuso

Otro límite de almacenamiento que se acerca rápidamente lo impone la especificación SCSI. Hoy en día, dado un tamaño de transferencia de datos razonable (un bloque estándar de 512 bytes), es imposible crear una partición de datos de más de dos terabytes sin procesar y, posteriormente, acceder a los datos utilizando el protocolo SCSI, incluido SCSI sobre Fibre Channel FCP. Si la velocidad del disco continúa disminuyendo y el tamaño continúa aumentando, el espacio de datos disponible pronto tendrá que abandonarse en sistemas donde se debe mantener un alto rendimiento.

Aunque este efecto se ha comentado anteriormente, solo ahora, cuando se acerca el límite de SCSI duro de dos terabytes, el problema requerirá resolución y, por primera vez, los discos adicionales no pueden ser la respuesta sin desperdiciar capacidad de almacenamiento. Si seguimos las líneas de tendencia que acompañan a este artículo, es razonable suponer que para 2004 tendremos unidades de 360 ​​GB que en realidad serán más lentas (acceso por Gigabyte) que las unidades actuales.

Suponiendo que esta ralentización requiere que solo se utilicen siete discos para crear una partición de rendimiento razonable, será una partición de 2,5 terabytes. Suponiendo que esta partición no se divida más en varios sistemas de archivos, ya que se requiere el máximo rendimiento, el límite SCSI de 2 TB requeriría 500 gigabytes en el volumen que permanece sin usar. Este efecto, si no se aborda, compensará la disminución en los costos de almacenamiento que un CIO beneficia hoy.

Afortunadamente, hay una solución en camino. El comité t10 (www.t10.org), cuyo trabajo es proponer y monitorear la estandarización SCSI, tiene un borrador de trabajo llamado SCSI Block Commands 2 (o SBC-2) que moverá el límite de 2TB en tamaños de partición a 9.5 millones de Petabytes por partición, lo que debería contener las cosas por un tiempo. Actualmente, este estándar se encuentra en una etapa inicial (la revisión 6 se publicó el 6 de mayo de 2002), por lo que la pregunta clave sigue siendo si estos nuevos comandos se pueden colocar en matrices de almacenamiento, controladores RAID y servidores antes de que se alcance este límite en el empresa.

La carrera ha comenzado.

El Dr. Barrall es el CTO, vicepresidente ejecutivo y cofundador de BlueArc Corporation y el arquitecto principal de su tecnología central, la arquitectura SiliconServer. Antes de unirse a BlueArc, el Dr. Barrall fundó otras cuatro empresas, incluida una de las primeras empresas Fast Ethernet y una exitosa empresa de consultoría en el Reino Unido. En este cargo, estuvo involucrado en la introducción de productos de redes innovadores en los mercados del Reino Unido, incluidos Packeteer y NetScout. El Dr. Barrall recibió su doctorado en Cibernética de la Universidad de Reading en 1993.

Sitio web: http://bluearc.com

=============================================== ==========

Puedes compartir en una historia de tu Instagram para que tus amigos lo sepan

??? ? ? ???

Comparte