10 votos

Recuperarse de un pinchazo en un array RAID

aquí está mi situación.

Tengo un Servidor Dell con un Dell Perc 7i controlador (Controlador LSI).

Yo tenía un coche me da un Error Predicho advertencia así que llamé a su apoyo y ellos salieron y se sustituye la unidad y la matriz se reconstruyó, bastante estándar.

Dos semanas más tarde, tengo otro coche me da el Error Predicho advertencia. Pensé que tal vez era un mal lote de unidades o coincidencia, etc. Así que en contacto con el soporte y la mirada más en profundidad. Me doy cuenta de que no eran malas bloques en una de las otras unidades que no fallan y los bloques defectuosos fueron copiados durante la reconstrucción. Así que ahora tengo la mala bloques de todo el lugar y poco a poco están matando a mi matriz. He llegado a encontrar que esto se llama un pinchazo en un Array.

Por lo que su consejo fue la de sustituir todas las unidades, la reconstrucción de la matriz, y de restaurar a partir de copia de seguridad. Excepto que yo he tenido este problema durante un par de semanas lo que significa que mis copias de seguridad son malos...y si puedo restaurar desde una copia de seguridad de antes (hace un mes), a continuación, voy a estar ausente unos 4 semanas de datos de mi base de datos, lo cual es totalmente inaceptable para nuestra oficina.

Mi pregunta es...¿alguien ha recuperado de algo como esto sin tener que perder los datos o sin la totalidad (tirar todo por la ventana y empezar de nuevo) enfoque ?

Me encontré un enlace que cubría mi escenario, no se si se arroja ninguna luz sobre la situación : http://www.theprojectbot.com/raid/what-is-a-punctured-raid-array/

Cualquier ayuda o dirección se agradece ! ¿Ustedes qué piensan?

15voto

Nathan C Puntos 10960

El sistema supongo que es todavía, así que la mejor cosa a hacer es inmediata copia de seguridad, el volcado de los discos/matriz, reconstruir y restaurar desde la copia de seguridad.

Los bloques defectuosos no siempre significa que las copias de seguridad también son malos. Si usted no ha experimentado los problemas de rendimiento o dañado archivos, las copias de seguridad todavía debe ser lo suficientemente completos como para terminar de restaurar.

Para probar, tomar su copia de seguridad más reciente y examinar sus datos más importantes. Si todavía intacto, es probable que tenga una buena copia de seguridad.

En este punto, hay un riesgo involucrado, ya que no puede estar 100% seguro de que sus copias de seguridad son buenas o que las copias de seguridad ahora no causa la pérdida de archivos. Sin embargo, la matriz va a fallar y la fuerza de la restauración de todas formas, así que esta es tu única opción real.

8voto

Grant Puntos 10929

En este mismo instante, hacer lo siguiente:

  • Detener la rotación de copias de seguridad o la eliminación de viejos por este sistema. Usted quiere guardar todas las copias de seguridad que actualmente tiene.
  • Tome una copia de seguridad completa del servidor.

Esperemos que los discos son todavía lo suficientemente bueno que sus datos están intactos, y usted no encontrará ningún problema en ejecución la nueva copia de seguridad completa.

Luego de chatarra de esos discos, y construir una nueva matriz RAID. Una vez que está listo, intenta restaurar desde la copia de seguridad que sólo llevo ahora. Con suerte, eso es todo lo que necesita hacer.

Si eso no funciona, intente con la siguiente más antiguo, y el siguiente más antiguos, etc. Asegúrese de probar la funcionalidad del sistema - sólo porque las botas, no significa que sea plenamente operativa. En particular, la prueba de las bases de datos para la corrupción.

Si había que restaurar todo el sistema desde una copia de seguridad anterior, eso está bien. Tomar la más reciente de las copias de seguridad y restaurar sólo los archivos de base de datos y otros archivos importantes. Prueba para asegurarse de que funcionen correctamente. De nuevo, si eso no funciona, intente con la siguiente más antigua.

Mediante este proceso minimiza la pérdida de datos.

4voto

JimNim Puntos 1206

Las respuestas proporcionadas por la Concesión y Nathan C son grandes en lo que respecta a cómo se debe proceder en el manejo de copias de seguridad/restauración, y el direccionamiento de la integridad de los datos.

He aquí algunos más detallada sobre cómo manejar el conjunto de RAID cuando se trata de tiempo para volver a crear el disco virtual y de restaurar a partir de copia de seguridad:

  • Compruebe que dispone de una buena copia de seguridad de los datos
  • Borrar el disco virtual existente; Todos los discos deben mostrar en un estado "listo" después
  • Volver a crear un nuevo Disco Virtual; configuración Recomendada: adaptación de lectura, escritura y almacenamiento en caché de disco movilidad
  • Usted debe tener una línea de Disco Virtual con un fondo de inicialización en el progreso.
  • Proceder con la restauración de la copia de seguridad; Fondo de inicialización se ejecuta normalmente alrededor de 600 GB/hr de 7.2 K husillos, por lo que dar el init de head start si la copia de seguridad, restaurar puede correr más rápido que eso, de lo contrario su software de copia de seguridad podría tener algunos problemas con la latencia de escritura, ya que el espacio es inmediatamente disponible durante la restauración.

Nota: Si usted ha estado utilizando RAID5, debería SERIAMENTE considerar el uso de RAID6 este tiempo. RAID5 no es confiable para los negocios crítica de datos según el estándar actual de la industria las mejores prácticas en una matriz de este tamaño. Gran capacidad SATA/NL-SAS de discos también tienen un mayor riesgo de encontrarse con un URE durante las reconstrucciones, que se traduce en un envase como el que usted está tratando. RAID6 reduce enormemente este riesgo, y es generalmente aceptable para la crítica de datos con los disponibles en la actualidad las capacidades de la unidad.

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: