112 votos

¿Por qué es la Empresa de Almacenamiento tan caro?

Este es un Canónica Pregunta sobre el Costo de Almacenamiento de la Empresa.
Véase también la siguiente pregunta:

Con respecto a preguntas generales como:

  • ¿Por qué tengo que pagar 50 dólares al mes por extra gigabyte de espacio de almacenamiento?
  • Nuestro servidor de archivos siempre se queda sin espacio, ¿por qué no nuestro sysadmin acaba de lanzar un extra de unidad de 1 tb no?
  • ¿Por qué es SAN equipo tan caro?

Las Respuestas que aquí se intentará ofrecer una mejor comprensión de cómo el almacenamiento a nivel de empresa que funciona y lo que influye en el precio. Si se puede expandir en la Pregunta o proporcionar la penetración en cuanto a la Respuesta, por favor post.

120voto

Shlomi Fish Puntos 1951
  1. Servidor de la unidad de disco duro capacidad es minúscula comparada con la de escritorio la unidad de disco duro capacidad. 450 y 600 gb no son infrecuentes los tamaños de ver en la marca de los nuevos servidores, y usted puede comprar muchos de 4TB SATA unidades de sobremesa, por el precio de uno 600GB SAS (servidor) unidad de disco duro.

  2. Su unidad de disco duro SATA de tu PC de escritorio en casa es como un muscle car de Ford o GM o Mercedes o cualquier otro fabricante de automóviles para el día a día de la gente (de gran capacidad V8 o V12, 5 o 6 litros). Ya que deben ser manejados por personas que no tienen una licencia para correr, o entender cómo interno combusion funciona el motor, tienen muy grandes tolerancias. Tienen rev limitadores, están diseñados para funcionar en cualquier aceite de una determinada calificación, tienen intervalos de servicio a decir de 10.000 km de distancia, pero si se olvida de un intervalo de servicio por un par de semanas no va a explotar en la cara. No incendiarse si se conduce a largas distancias.

    La unidad SAS en un servidor es similar a la de un Fórmula 1 del motor. Son realmente pequeñas (2.4 litros), pero tienen un poder inmenso, salidas debido a sus pequeñas tolerancias. Ellos rev superior, y a menudo no tienen limitador de revoluciones (lo que significa que sufrir serios daños si se conduce de forma incorrecta), y si se olvida de un intervalo de servicio (que es cada pocas horas) de que exploten.

    Básicamente lo que hace es comparar la tiza y el queso. Los números y un desglose completo se discuten en el Intel Whitepaper de clase de la Empresa versus el Escritorio Discos Duros de clase

  3. Vamos a hablar un poco duro números aquí. Digamos que la solicitud de 1MB de datos adicionales (un bonito número redondo). La cantidad de datos que realmente? Así, su 1MB de datos se va a ir en una matriz RAID. Vamos a decir que están a salvo y hacer que en RAID1. Su 1MB de datos se duplican, por lo que, en realidad, de 2 mb de datos.

    Vamos a decir que sus datos están dentro de una SAN. En el caso de SAN nodo falla, los datos se sincronizan en un nivel de byte a un 2º SAN nodo. Así que es un duplicado, y sus 2 mb de datos es ahora de 4 mb.

    Usted espera que su proveedor para mantener en el lugar de copias de seguridad, por lo que sus datos se pueden restaurar en el caso de un no-emergencia y casos de desastre? Cualquier decente proveedor va a proporcionar usted con al menos 1 en el sitio de copia de seguridad, tal vez más. Digamos que tomar instantáneas de una vez a la semana durante tres semanas en el sitio. Eso es un extra de 3 mb de datos, así que ahora estás hasta 7MB.

    Si hay una catástrofe, su proveedor es mejor tener una copia que se conserva fuera del sitio en algún lugar. Incluso si se trata de un mes de edad, se debe de existir. Así que ahora estás de hasta 8MB.

    Si se trata de un muy alto nivel de proveedor, se puede incluso tener un sitio de recuperación del desastre que se sincroniza en vivo. Estos discos se Allanó así, para que un extra de 2 MB, y por lo tanto estás de hasta 10 mb de datos.

    Vas a tener que transferir los datos con el tiempo. Qué? La transferencia? Sí, los datos de los costes de transferencia de dinero. Cuesta dinero a la hora de descargar, acceder a ella a través de internet, incluso los costos de dinero para la copia de seguridad (alguien tiene que tomar las cintas fuera de la oficina, y podría ser que su 1MB de datos significa que ellos tienen que comprar un juego extra de las cintas de transferencia y en algún lugar).

  4. Cuando el SATA de la unidad principal no se consigue a través del soporte técnico y convencerlos de que su unidad está muerto. A continuación, envíe la unidad al fabricante (en su propia moneda de diez centavos la mayoría de las veces). Esperar una semana. Obtener un reemplazo de la unidad de nuevo y tener que volver a instalarlo (es casi seguro que no es intercambiable en caliente o en una ranura de la unidad de ya).

    Cuando SAS unidad falla de llamar al soporte técnico. Casi nunca pregunta su opinión de que la unidad inmediata de las necesidades de reemplazo y la nave de la gota una nueva unidad; por lo general la nueva unidad se entrega más tarde ese mismo día, de lo contrario al día siguiente, es muy común también. Comúnmente el fabricante enviará a un representante para instalar la unidad, si usted no sabe cómo (muy práctico si usted planea tomar unas vacaciones que nunca y la necesidad de las cosas a seguir trabajando mientras usted está ausente).

  5. Unidades para empresas que tienen tolerancias, véase #2 arriba, y tienden a durar alrededor de 10 veces más que los Consumidores de grado unidades (MTBF). Las unidades para empresas casi siempre de apoyo avanzado de error y detección de fallos en un informe de Google encontrado que trabaja alrededor del 40% del tiempo, pero eso es algo que cualquiera preferiría un equipo de repente morir.

    Cuando se tiene una sola unidad en la computadora de su casa, su estadística probabilidades de fracaso son, simplemente, el de la unidad. Unidades que se usan para ser evaluado en el MTBF (donde las unidades SAS todavía disfrutar de ~50% calificaciones más altas o más), ahora es más común ver a las tasas de error. Una típica unidad SAS es de 10 a 1.000 veces menos probabilidades de tener un error irrecuperable (con 100 veces más común que he encontrado recientemente). (tasas de error de acuerdo a la documentación del fabricante suministradas por Seagate, Western Digital, Hitachi y; sin sesgo de la intención; renuncian expresamente a indemnización).

    Las tasas de Error son particularmente importantes cuando no se ejecuta a través de un error irrecuperable en una unidad, pero cuando otra unidad de la misma matriz se produce un error y no se basa en todas las unidades en una matriz de lectura con el fin de recuperar el disco que ha fallado.

  6. SAS es un derivado de SCSI, que es un protocolo de almacenamiento. SATA se basa en ATA, que se basa en el bus ISA (que 8/16-bit de bus en los ordenadores de los dinosaurios de edad). El almacenamiento SCSI protocolo tiene más extensa de comandos para optimizar la manera en que se transfieren los datos desde las unidades de controladores y la espalda. Este aumento en la eficiencia haría de otro modo la igualdad de la unidad SAS inherentemente más rápido, especialmente en condiciones extremas de cargas de trabajo, de una unidad SATA; también aumenta el costo.

  7. Hay menos unidades SAS producido, las economías de escala dictan que van a ser más caros, todo lo demás siendo igual.

  8. Unidades SAS suelen venir en 10k o 15k velocidades de rotación; mientras SATA suelen venir en 5.4 k o 7.2 k. Unidades SAS, en particular los de 2.5" de tamaño, que se están volviendo cada vez más populares, más rápido el tiempo de búsqueda. Los dos combinados para aumentar dramáticamente el número de IOps una unidad puede realizar, normalmente, una unidad SAS es ~3 veces más rápido. Cuando varios usuarios están demandando de datos dispares, los IOps de la capacidad de la unidad/de la matriz se convierte en un crítico indicador de rendimiento.

  9. Las unidades en un centro de datos son normalmente energizado todo el tiempo. Los estudios han encontrado que el fallo de la unidad está influenciado por el número de calefacción/refrigeración de los ciclos que pasa a través de (de ejecución vs apagado). Mantener en funcionamiento todo el tiempo de un aumento general de la unidad de la vida. La consecuencia de esto es que las unidades que consumen electricidad. Esta electricidad tiene que ser suministrada por algo (en el caso de una gran DC las unidades solo pueden tomar más energía de la que un pequeño barrio de casas). También la necesidad de disipar el calor en algún lugar, que requieren sistemas de refrigeración (que tienen más energía para funcionar).

  10. De la infraestructura y gastos de personal. Esas unidades están en la gama alta de NAS o SAN unidades. Esas unidades son caros, incluso sin las costosas unidades en ellos. Ellos requieren de costosas personal para implementar y mantener. Los edificios que los NAS y SAN unidades son caros de operar (véase el punto acerca de la refrigeración, la de arriba, pero hay mucho más que hacer allí.) El software de copia de seguridad no suele ser gratis (ni son las licencias para cosas como la creación de reflejo), y el personal para implementar y mantener las copias de seguridad son generalmente caros también. El costo de alquiler del apagado-sitio de la cinta de entrega y el almacenamiento es sólo una más de las muchas cosas que empiezan a acumularse cuando usted necesita más espacio de almacenamiento.

Teniendo en cuenta que la capacidad de sus unidades puede ser 1/10 el tamaño de una unidad de sobremesa, y cinco veces el precio, su 1MB de datos es en realidad 10, y todas las otras diferencias, no hay manera de que usted puede sacar conclusiones significativas entre el precio de tu escritorio de almacenamiento y el precio de la empresa a nivel de almacenamiento.

33voto

Colin Pickard Puntos 801

Yo no soy de agregar esto a la parte superior de la CW respuesta, principalmente, porque es una diferencia de opinión. Siéntase libre de mezcla/edición de este si lo desea.

Con frecuencia, la razón "a nivel de empresa" de almacenamiento es tan caro podría ser que el autor de la pregunta no se entiende el requisito, pero a veces también de los sysadmin no entiende el requisito, no se puede comunicar con el requisito a que alguien con autoridad de compras, o es simplemente ignorado por dicha autoridad.

Alto rendimiento, alta disponibilidad, bajos costes de mantenimiento off-the-shelf matrices de almacenamiento son caros. Parte del trabajo de un diseñador de sistema es para saber donde estas sean apropiados, y en donde un diseño diferente es la adecuada.

No creo que los costos relativos de los diferentes tipos de unidades de disco es en realidad relevante a cualquiera de las preguntas de ejemplo.

¿Por qué tengo que pagar 50 dólares al mes por extra gigabyte de espacio de almacenamiento?

Esto está claramente dirigido a un proveedor de servicio de algún tipo. Las dos respuestas posibles a mi mente son:

  1. Tienes 5 nueves tiempo de actividad, soporte 24/7, en Manhattan/Londres/Hong Kong. Los platos giratorios son sólo una pequeña parte de la pila que está pagando.

  2. Usted está pagando demasiado. Negociar, cambiar de proveedor, o llevarlo en casa.

Nuestro servidor de archivos siempre se queda sin espacio, ¿por qué no nuestro sysadmin acaba de lanzar un extra de unidad de 1 tb no?

Esto es casi seguro que un mal diseño (y probablemente por razones políticas). Los datos de la fileserver cae en algún lugar en este espectro:

  • Datos de la pena de almacenar en un alto rendimiento, alta disponibilidad, alto costo de instalación. Tiempo de inactividad causado por quedarse sin espacio afecta a su alta disponibilidad y es un diseño o planificación de la falla.

  • De datos es poco importante o rendimiento lento o más el tiempo de inactividad son aceptables. Hoteles de discos y hoteles de soluciones de copia de seguridad son aceptables. Regular el tiempo de inactividad debido a la falta de espacio en el disco, todavía parece una extraña trade-off, ya que la mayoría de su costo en este caso es, probablemente, va a ser tu sysadmin tiempo, y en el largo plazo, se dedicará más tiempo a la solución de problemas de poco espacio en disco.

Nota que dije que es un espectro, y la mayoría de los requisitos venir en algún lugar entre los dos.

6voto

MagicAndi Puntos 10128

El costo de la producción de cualquier elemento está conectado directamente con el volumen de la unidad que se va a vender en un bucle de retroalimentación.

En el caso de un disco duro convencionales, con el hilado de rusty vidrio y la electrónica, hay potencialmente una enorme variación en el costo de los componentes mecánicos y electrónicos - sin embargo, 2 claras de precio/calidad de las bandas que han surgido de Empresa y de los productos básicos.

Sin embargo, el reducido volumen de ventas de una empresa, la unidad lleva una carga pesada sobre lo que usted consigue para su dinero - algo que cuesta siete veces más de no ser siete veces mejor.

Las unidades de la empresa (para una capacidad dada) son ligeramente más rápido que el de los productos básicos de las unidades, por ejemplo, la comparación de Seagate Barracuda SATA (commodity) y el Guepardo (SAS enterprise) unidades:

model            Barracuda            Cheetah
capacity(Gb)     500                  450
sustained data   125                  168
   rate (Mb/s)
cache(Mb)        16                   64
annual failure   <1%                  0.44%
   rate
Price GBP        42                   275
Price USD        67                   440

Pero en una empresa de contexto, no sane administrador del sistema tendría nunca guarde los datos importantes en una sola unidad - el uso de múltiples unidades de disco proporciona una mayor fiabilidad y ancho de banda, y efectivamente reduce la latencia; cuatro de las unidades Barracuda configurado como RAID 10, va a ser mucho más rápido que el único Cheetah de la unidad, con mucho menos riesgo de pérdida de datos en torno al 60% del precio.

Sin duda, usted obtendrá un mejor garantía con la Empresa de la unidad, y el vendedor suele ser capaz de conseguir uno para usted el mismo día, pero probablemente va a ser capaz de origen de una mercancía de la unidad de un proveedor local más rápido que su proveedor puede courier el disco de reemplazo. Por otro lado, la empresa de disco es más probable que sea un reemplazo exacto para la unidad que ha fallado.

Así que tal vez usted consigue mucho más la fiabilidad de la empresa de las unidades? Mientras la gente de la elaboración y venta de las unidades a menudo decimos que este es el caso (Seagate son bastante reacio a informar sobre esto en su página web -, pero incluso el ofuscado números que publican muestran que es menos que un factor de 2). Estudios independientes sugieren que no hay ninguna diferencia significativa.

El juego de comandos SCSI tiene algunas ventajas técnicas respecto a la ATA comando set - particularmente en términos de permitir que el sistema operativo para saber exactamente lo que está comprometido con el disco, sin embargo, de nuevo, esto sólo hace una diferencia mirar el rendimiento y la fiabilidad de un sistema de ficheros implementado en un único disco.

Si su proveedor de servicio opera una SAN de Canal de Fibra, entonces el costo por Gigabyte de almacenamiento será de al menos 8 veces mayor que la compra de un disco fuera de la plataforma más cercana a su tienda de hardware. Pero hay otros enfoques que puede traer el costo reducido de manera significativa.

Tenga en cuenta que esto nunca será más barato que comprar un off-the-shelf disco, como también está pagando por la redundancia, energía, aire acondicionado y apoyo, pero estos costos deben ser pequeños en relación con el costo de la prestación de almacenamiento.

6voto

Ilari Kajaste Puntos 989

También es importante tener en cuenta que 'local' de almacenamiento podría costar más de lo que usted piensa de todos modos.

Como parte de un ejercicio en el que desea mover algunos de nuestros "archivado" los datos a la nube recientemente he terminado un precio de ejercicio de la comparación de los costos de disposición (por ejemplo, formato en lugar de raw) de espacio en disco disponible en nuestra más reciente de SAN contra el costo de almacenamiento en la nube de Amazon servicio de datos.

Sólo teniendo en cuenta el precio pagado por el SAN propia incluidos los discos, suponiendo un 5 años de vida útil para el hardware de SAN, y no la 'sobrecarga' de los costos de funcionamiento de nuestro servidor de la habitación, a nuestro precio de 150 gb de almacenamiento local es de $31.88 por mes vs Amazon de $28.41 (suponiendo que el tipo de tráfico por mes de 20% hacia arriba y hacia abajo).

Ahora, yo no estoy a punto de salir corriendo y mover todo nuestro almacenamiento en la nube, ya que hay otros beneficios de tener un almacenamiento local, pero creo que este tipo de fijación de precios de ejercicio es útil: Si usted piensa que el almacenamiento en la nube es caro, entonces ¿cuánto está realmente pagando para su almacenamiento local?

4voto

user104917 Puntos 1

Mi opinión sobre esta cuestión es muy simple IO... un archivo que se encuentra en un solo producto la unidad de disco duro sin raid y, probablemente, de no intercambio en caliente, y normalmente se accede por una persona, y probablemente nunca la copia de seguridad. Esta es una forma barata y fácil método de IO...

En nuestro negocio, yo he utilizado uno de los métodos más caros de raid (raid 10), que requiere un mínimo de 4 unidades;utilizamos el 6... esto nos da de alta IO tasas y tolerancia a fallos.

Esta configuración se ha guardado mi$$ en una gran forma, y este resultado ha supuesto un mayor rendimiento y un menor tiempo de inactividad para los usuarios finales.. por el simple IO solo hay una persona a decepcionar y probablemente hay poco valor financiero ligado a la inactividad.

Nosotros también tenemos un dedicado iSCSI servidor que se utiliza para la virtualización Xen y que también está configurado para raid 10...

Los más de IO que se necesita para ser utilizada y copia de seguridad, el más caro es implementar... si su empresa exigencia de aceptar la pérdida de datos, a velocidades muy lentas, y no redundancia - luego de la clase business de almacenamiento se puede hacer en los hoteles!!! Solo debe estar preparado para ponerse en...

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: