21 votos

¿RAID-5: Dos discos fallaron simultáneamente?

Tenemos un Dell PowerEdge T410 servidor corriendo CentOS, con una matriz RAID-5 con el 5 Seagate Barracuda de 3 TB SATA de los discos. Ayer el sistema dejó de funcionar (no sé exactamente cómo y no tengo ningún registro).

Tras el arranque en la BIOS de la controladora RAID, vi que de los 5 discos, el disco 1 fue etiquetado como "falta", y el disco 3 fue etiquetado como "degradadas." He forzado el disco 3 de la espalda, y se sustituye el disco 1 con una nueva unidad de disco duro (del mismo tamaño). La BIOS detecta esto y comenzó a reconstruir el disco 1 - sin embargo se quedó atascado en %1. El spinning indicador de progreso no se movió en toda la noche; totalmente congelado.

¿Cuáles son mis opciones? Hay alguna forma de intento de reconstrucción, además de usar algunos profesionales de los servicios de recuperación de datos? Cómo podrían dos discos duros fallan simultáneamente como que? Parece demasiado casual. Es posible que el disco 1 error, y como resultado de disco de 3 "salió de la sincronización?" Si es así, ¿hay alguna utilidad que puede utilizar para obtener de vuelta "en la sincronización?"

38voto

Basil Puntos 6650

Tienes una falla en el disco doble. Esto significa que sus datos se ha ido, y usted tendrá que restaurar desde una copia de seguridad. Por esta razón no debemos para utilizar raid 5 en discos grandes. Quieres configurar tu raid así siempre tienes la capacidad de soportar dos fallos de disco, especialmente con grandes discos lentos.

18voto

peterh Puntos 3060

Después de aceptar a una mala respuesta, estoy realmente lo siento por mi hereje opinión (que guardan estas matrices varias veces ya).

Su segundo disco que ha fallado, probablemente haya un problema menor, tal vez un bloque de falla. Esta es la causa, ¿por qué el malo de la herramienta de sincronización de su mala raid5 firmware se estrelló en él.

Usted puede hacer fácilmente un sector de la copia de nivel con un bajonivel de clonación de disco herramienta (por ejemplo, gddrescue es, probablemente, muy útil), y utilizar este disco como su nuevo disk3. En este caso, su matriz sobrevivido con menor corrupción de datos.

Lo siento, probablemente es demasiado tarde, porque la esencia de la ortodoxa respuesta en este caso: "múltiples fallos en un raid5, aquí es el apocalipsis!"

Si desea muy buena, raid redundantes, el uso de raid por software en linux. Por ejemplo, su raid superbloque diseño de datos es pública y documentada... estoy muy triste, para mi este otro hereje opinión.

5voto

Halfgaar Puntos 2866

Para responder a "¿Cómo podrían dos discos duros fallan simultáneamente como que?" precisamente, me gustaría citar este artículo:

El quid del argumento es este. Como las unidades de disco se han convertido en grandes y de mayor tamaño (aproximadamente se duplica en dos años), la URE (error de lectura irrecuperable) no ha mejorado en la misma proporción. URE mide la frecuencia de aparición de un Error de Lectura Irrecuperable y se suele medir en errores por bits de lectura. Por ejemplo, una tasa de URE de 1E-14 (10 ^ -14) implica que estadísticamente, un error de lectura irrecuperable iba a aparecer una vez en cada 1E14 bits de lectura (1E14 bits = 1.25E13 bytes o aproximadamente 12 TB).

...

El argumento es que como capacidades de disco crecer, y URE tasa de no mejorar al mismo ritmo, la posibilidad de un RAID5 reconstruir el fracaso aumenta con el tiempo. Estadísticamente se demuestra que en 2009, disco la capacidad ha crecido lo suficiente como para hacer que carece de sentido utilizar RAID5 para cualquier significativos de la matriz.

Así, RAID5 era inseguro / a en 2009. RAID6 será demasiado pronto. Como para RAID1, empecé a hacer fuera de 3 discos. RAID10 con 4 discos también es precaria.

4voto

richardb Puntos 508

Fallo simultáneo es posible, incluso probable, por las razones que otros han dado. La otra posibilidad es que uno de los discos había cumplido algún tiempo antes, y no estaba revisando activamente.

Asegúrese de que su seguimiento recogería un volumen RAID ejecutando en modo degradado rápidamente. Tal vez no te dieron una opción, pero nunca es bueno tener que aprender estas cosas desde el BIOS.

1voto

HopelessN00b Puntos 38607

Sus opciones son:

  1. Restauración de copias de seguridad.
    • Te hacen tener copias de seguridad, ¿no? RAID no es una copia de seguridad.

  2. Profesional de recuperación de datos
    • Es posible, aunque muy caro y no se garantiza que un servicio profesional de recuperación será capaz de recuperar sus datos.

  3. La aceptación de la pérdida de datos y el aprendizaje de la experiencia.
    • Como se señaló en los comentarios, grandes discos SATA no son recomendados para una configuración de RAID 5, debido a la posibilidad de un doble fracaso durante la reconstrucción causando la matriz a fallar.
      • Si debe ser la paridad RAID, RAID 6 es mejor, y la próxima vez que utilice un repuesto de emergencia así.
      • Discos SAS son mejores para una variedad de razones, incluyendo más de la confiabilidad, de la resistencia, y las tasas más bajas de irrecuperable errores de bits que pueden causar UREs (irrecuperable errores de lectura)
    • Como se señaló anteriormente, RAID no es una copia de seguridad. Si los datos de la materia, asegúrese de que la copia de seguridad, y que sus copias de seguridad restaurar probado.

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: