11 votos

¿Qué se considera una matriz raid 5 "grande"?

Un problema reciente con un NAS TeraStation de Buffalo aquí en mi oficina me ha hecho investigar sobre Raid 5.

He encontrado algunos artículos diferentes que hablan de la inadecuación de usar raid 5 en matrices grandes, o con discos grandes

Aquí hay uno artículo de ejemplo que habla de los problemas con la reconstrucción de una matriz con unidades de consumo grandes.

Estoy intentando averiguar qué se considera "grande".

El NAS que tenemos aquí es una configuración de 4 unidades Raid 5, cada unidad es de 1 TB. Una unidad ha fallado y ha sido reemplazada, la matriz se está reconstruyendo actualmente.

¿Constituye esta configuración como grande, en términos de tendrá probablemente un problema durante la reconstrucción?

¿Qué fiabilidad tiene esta configuración para el uso diario?

18voto

Chris S Puntos 65813

Diseñar la fiabilidad de una matriz de discos:

  1. Encuentre la tasa de URE de su unidad (a los fabricantes no les gusta hablar de los fallos de sus unidades, así que es posible que tenga que indagar para encontrarla. Debería ser 1/10^X donde X es alrededor de 12-18 comúnmente).
  2. Decida cuál es la tasa de riesgo aceptable para sus necesidades de almacenamiento†. Normalmente es <0,5% de probabilidad de fallo, pero podría ser de varios porcentajes en un almacenamiento "scratch", y podría ser <0,1 para los datos críticos.
  3. 1 - ( 1 - [Drive Size] x [URE Rate]) ^ [Data Drives‡] = [Risk]
    Para matrices con más de un disco de paridad o espejos con más de un par de discos en el espejo, cambie el 1 después de los Drives in Array al número de discos con paridad/mirror.

Así que tengo un conjunto de cuatro discos WD Green de 1TB en una matriz. Tienen una tasa de URE de 1/10^14. Y los utilizo como almacenamiento de memoria virtual. 1 - (1 - 1TB x 1/10^14byte) ^ 3 => 3.3% riesgo de fracaso al reconstruir la matriz después de que una unidad muera. Estos son grandes para almacenar mi basura, pero no voy a poner los datos críticos en allí.

†Determinar un fallo aceptable es un proceso largo y complicado. Se puede resumir como <code>Budget = Risk * Cost</code> . Así que si un fallo va a costar 100 dólares, y tiene un 10% de posibilidades de ocurrir, entonces usted <em>debe </em>tienen un presupuesto de 10 dólares para evitarlo. Esto simplifica enormemente la tarea de determinar el riesgo, los costes de los distintos fallos y la naturaleza de las posibles técnicas de prevención, pero se entiende la idea. ‡ <code>[Data Drives] = [Total Drives] - [Parity Drives]</code> . Un espejo de dos discos (RAID1) y RAID5 tiene 1 unidad de paridad. Un espejo de tres discos (RAID1) y RAID6 tiene 2 unidades de paridad. Es posible tener más unidades de paridad con RAID1 y/o esquemas personalizados, pero es atípico.


Sin embargo, esta ecuación estadística tiene sus advertencias:

  • Esa tasa de URE es la anunciada y suele ser mejor en la mayoría de las unidades que salen de la línea de montaje. Usted podría tener suerte y comprar una unidad que es órdenes de magnitud mejor que la anunciada. De la misma manera, podrías conseguir una unidad que muera de mortalidad infantil.
  • Algunas líneas de fabricación tienen malas tiradas (en las que muchos discos de la tirada fallan al mismo tiempo), por lo que obtener discos de diferentes lotes de fabricación ayuda a distribuir la probabilidad de fallos simultáneos.
  • Los discos más antiguos son más propensos a morir bajo el estrés de una reconstrucción.
  • Los factores ambientales pasan factura:
    • Los discos que se someten a ciclos de calor con frecuencia son más propensos a morir (por ejemplo, encendiéndolos y apagándolos regularmente).
    • La vibración puede causar todo tipo de problemas - ver video en YouTube de IT gritando en una matriz de discos .
  • "Hay tres tipos de mentiras: las mentiras, las malditas mentiras y las estadísticas" - Benjamin Disraeli

9voto

Sobrique Puntos 2194

La razón de ser de este artículo es llamar la atención sobre las tasas de error de bits irrecuperables en los discos duros. Específicamente, los discos baratos de los "ordenadores domésticos". Suelen tener una especificación de fábrica de 1 / 10^14. Esto es alrededor de 12,5TB de datos, que si usted está haciendo un RAID-5 con discos de 2TB ... usted golpea muy rápidamente.

Esto significa que deberías:

  • utilizar grupos RAID más pequeños y aceptar un mayor espacio desperdiciado.
  • Utilice RAID-6 y acepte la penalización de escritura adicional. (50% más alto que el RAID 5)
  • Comprar discos más caros: los "de calidad de servidor" tienen una especificación UBER de 1 / 10^16, lo que significa que esto es un punto discutible. (1,2PB es mejor que 12,5TB)

Por lo general, sugeriría que RAID-6 es el camino a seguir, pero le costará rendimiento.

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: