1 votos

Fallos aleatorios en mi máquina de servidor Windows

Esta semana estoy recibiendo curiosas caídas aleatorias en una de mis máquinas Windows. El fallo siempre termina con BSOD pero con códigos de error aleatorios en controladores de sistema aleatorios. No hay registro en el registro de eventos.

Así que la primera suposición es la memoria, pero me di cuenta de que sólo hay un disco SSD en el interior. No confío en ningún dato SMART de los discos, pero esta vez quizás sea el caso en el que debería hacerlo. ¿Qué opinas? La autoprueba del disco con Parted magic estaba bien. No puedo permitirme hacer la prueba de escritura.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   120   120   050    Pre-fail  Always       -       0/0
  5 Retired_Block_Count     0x0033   100   100   003    Pre-fail  Always       -       0
  9 Power_On_Hours_and_Msec 0x0032   095   095   000    Old_age   Always       -       4581h+05m+42.650s
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       290
171 Program_Fail_Count      0x0032   000   000   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   000   000   000    Old_age   Always       -       0
174 Unexpect_Power_Loss_Ct  0x0030   000   000   000    Old_age   Offline      -       11
177 Wear_Range_Delta        0x0000   000   000   000    Old_age   Offline      -       1
181 Program_Fail_Count      0x0032   000   000   000    Old_age   Always       -       0
182 Erase_Fail_Count        0x0032   000   000   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0022   128   129   000    Old_age   Always       -       128 (0 127 0 129 0)
195 ECC_Uncorr_Error_Count  0x001c   100   100   000    Old_age   Offline      -       0/0
196 Reallocated_Event_Count 0x0033   100   100   003    Pre-fail  Always       -       0
201 Unc_Soft_Read_Err_Rate  0x001c   100   100   000    Old_age   Offline      -       0/0
204 Soft_ECC_Correct_Rate   0x001c   100   100   000    Old_age   Offline      -       0/0
230 Life_Curve_Status       0x0013   100   100   000    Pre-fail  Always       -       100
231 SSD_Life_Left           0x0013   100   100   010    Pre-fail  Always       -       0
233 SandForce_Internal      0x0000   000   000   000    Old_age   Offline      -       1319
234 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       944
241 Lifetime_Writes_GiB     0x0032   000   000   000    Old_age   Always       -       944
242 Lifetime_Reads_GiB      0x0032   000   000   000    Old_age   Always       -       1317

Model Family:     SandForce Driven SSDs
Device Model:     Corsair Force 3 SSD

1voto

mfinni Puntos 29745

¿Ha creado al menos un volcado de memoria? Si no es así, comprueba si tu sistema está configurado para crear volcados de memoria, espera a que vuelva a ocurrir y utiliza Windbg para revisar el archivo memory.dmp.

1voto

John Puntos 741

Lo tengo amigos. Hay un gran error en estos SSDs con respecto al modo de suspensión. Si el disco entra en el modo de suspensión, a veces puede haber problemas para despertarlo, ya que ignora la declaración COM_WAK. No sé por qué empezó a hacerlo ahora, tal vez fue causado por la actualización de Windows.

Sin embargo, actualicé todos los firmware del sistema y después de actualizar el firmware de los discos a la versión 5.3, los fallos han desaparecido.

0voto

HopelessN00b Puntos 38607
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
194 Temperature_Celsius     0x0022   128   129   000    Old_age   Always       -       128 (0 127 0 129 0)

Um, suponiendo que esto sea realmente correcto, el problema es que tu ordenador se calienta lo suficiente como para hervir agua. Así que lo que tienes que hacer es invertir en una tetera adecuada para tus necesidades de hervir agua, y mantener tu ordenador mucho más frío, en lugar de usarlo para generar vapor.

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: