2 votos

5 discos duros muertos en un lapso de 2 meses: ¿qué debería comprobar?

Hace un año compramos un bonito servidor HP DL380 con una tarjeta RAID de lujo.

Hace 2 meses falló un disco duro. Gracias a Dios por el RAID 5... excepto que la tarjeta RAID sólo funcionó más o menos y la máquina se reseteó. Después de fvck volvió a funcionar.

Hace 6 semanas falla otro disco. La máquina se reseteó de nuevo y volvió a funcionar.

Hace 4 semanas falla otra unidad de disco. La máquina se reinicia. El centro de datos pone una nueva unidad, y la nueva unidad falla. Reemplaza ese disco. Después de un fvck vuelve a funcionar.

Esta mañana, otra unidad (ya es la quinta unidad, para los que llevan la cuenta) informa de "fallo inminente de SMART".

No hace falta decir que hemos movido todo fuera de este servidor para que ya no esté en uso.

¿Se le ocurre a alguien algo que pueda estar ocurriendo para causar este tipo de escenario? Me cuesta creer que pueda haber esta cantidad discos duros malos. ¿La tarjeta RAID está tostando los discos duros? ¿Problema con la fuente de alimentación?

2voto

dyasny Puntos 11858
  1. Fallo del controlador
  2. mal firmware del controlador
  3. discos defectuosos suministrados por el hoster (algunos de los menos reputados tienden a hacerlo)
  4. mala combinación de disco y firmware del controlador

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: