4 votos

RAID-1 fallo de la unidad - la falta de datos de ser "reconstruido"?

Somos una pequeña empresa con un viejo Dell PowerEdge 830 con un CERC 6ch de la controladora raid. Servidor es nuestro servidor de archivos, el controlador de dominio (Windows Server 2003), servidor MySQL, etc. Tenemos un administrador de sistemas con los que hemos trabajado durante un par de años que normalmente mantiene las cosas funcionando bien para nosotros, pero él está fuera del país y inalcanzable ahora mismo.

Ayer recibí una llamada de mi jefe que el servidor había un sonido de alarma de entrar, bastante fuerte y no iba a dejar. Nadie en la oficina se quejó de errores de guardar archivos en el servidor o en la lectura de los archivos. Entré en la oficina y lo hizo buscar un poco en google y se determinó que la alarma estaba relacionado con el RAID y que hubo una configuración de BIOS para el silencio (hasta se puede sustituir la unidad de mala calidad). Oh, sí, me olvidé de mencionar que yo podía oír una falla mecánica en una de las unidades. Así que ir a la configuración de raid y encontrar la alarma y el silencio. Por supuesto, esto requiere un reinicio y durante el reinicio, podía escuchar a los pobres, muertos de la unidad y también hubo un par de mensajes del BIOS para el efecto de "Raid SATA 0 sin conexión o reconstrucción" - (no se exactamente lo que dijo, me disculpo yo no escribirlo)

Larga historia corta, el servidor de arrancar de nuevo y pronto encontramos que todos los datos que había sido escrito para discos entre el tiempo que la alarma fue de (es decir, error del disco) y el tiempo me reinicia se había ido. He guardado algunos archivos de POST-reiniciar el sistema y que persistió a través de un reinicio adicional. Pero los archivos que se han guardado el domingo, Ayer y Hoy hasta el primer reinicio se han ido.

De esto me sorprende, RAID-1 se refleja entonces, ¿por qué los datos que faltan? La gente en la oficina comenzó a quejarse de todos los archivos que necesita para recrear (ah, sí, la copia de seguridad es también faltan los archivos) y he parado hasta que pude averiguar un poco más acerca de todo esto. Mi pregunta para usted pros es: ¿hay algo que se puede hacer para restaurar los datos? Hay una utilidad RAID o proceso que debe seguirse con el fin de solucionar el problema? En otras palabras, hace lo que he descrito hasta ahora el sonido normal en un evento de error y es simplemente algunos pasos adicionales que deben ser adoptadas para decirle a la raid el otro disco está muerto y a confiar en los datos que se reflejan en el resto de la unidad?

Me siento bastante cómodo de administrar nuestro servidor y los diferentes servicios que se está ejecutando, pero cuando se trata de RAID de hardware y en general estoy un total newb y teniendo en cuenta que tenemos los datos del mundo real en juego soy reacio a iniciar juicio-n-erroring mi camino a través del proceso.

5voto

Zoredache Puntos 84524

Casi suena como su RAID decidió arrancar o reconstruir el uso de la unidad que ha fallado. Como un disco falla, el RAID mantiene escrito a la otra unidad, reinicie el sistema de apagado del error de uno de alguna manera. Tal vez es sólo algo ha fallado.

Esperemos que falló a cabo la unidad y no intentar la reconstrucción.

En cualquier caso, mi primera sugerencia es esta. Apague el sistema y desconecte una de las unidades (inicio con el hacer ruidos). A continuación, arrancar y ver si los datos se presentan. Si no, trate de cambiar a la otra unidad, por lo que sólo está conectado. Usted puede ser que necesite para arrancar el sistema con un livecd o algún tipo con el fin de inspeccionar el contenido de las unidades sin cambiar nada.

Si usted no ve los datos en la unidad, entonces lo más probable es que fuera de suerte.

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: