42 votos

¿Es mi Hard Drive fallando?

Traté de hacer una prueba en mi disco duro y no quiere realizar una autocomprobación. Aquí está el resultado:

smartctl --attributes --log=selftest /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic] (local build)

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       697
  3 Spin_Up_Time            0x0027   206   160   021    Pre-fail  Always       -       691
  4 Start_Stop_Count        0x0032   074   074   000    Old_age   Always       -       26734
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       28
  9 Power_On_Hours          0x0032   090   090   000    Old_age   Always       -       7432
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3186
191 G-Sense_Error_Rate      0x0032   001   001   000    Old_age   Always       -       20473
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       84
193 Load_Cycle_Count        0x0032   051   051   000    Old_age   Always       -       447630
194 Temperature_Celsius     0x0022   113   099   000    Old_age   Always       -       34
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       16
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%      7432         92290592
# 2  Conveyance offline  Completed: read failure       90%      7432         92290596
# 3  Conveyance offline  Completed: read failure       90%      7432         92290592
# 4  Short offline       Completed: read failure       90%      7431         92290596
# 5  Extended offline    Completed: read failure       90%      7431         92290592

¿Así que está fallando este disco?

44voto

MadHatter Puntos 44059

La unidad es muy feliz para hacer un auto-test, a partir de la síntesis, se ha hecho más que cinco de ellos en la última hora. Y todos han fracasado, al comienzo de la prueba, con errores de lectura.

Sí, este disco duro está fallando. Como el famoso Google Labs informe dijo (aunque yo no puedo poner mi mano en un enlace a ella en el momento), si smartctl dice que su unidad está fallando, probablemente lo es (parafraseo).

Edit: no intente ahorrar. Obtener todos los datos que contiene, y reemplazarlo.

10voto

DragonLord Puntos 369

Para responder a su pregunta, un error de la prueba SMART es una segura indicación de inminente fallo de la unidad. Debe hacer una copia de seguridad de sus datos y vuelva a colocar la unidad tan pronto como sea posible para evitar posibles pérdidas de datos.

@sj0h menciona el Ciclo de Carga de Recuento, que es muy alto en 447,630. (La mayoría de los modernos discos duros están diseñados para soportar los 600.000 ciclos de carga/descarga.) Esto es generalmente causado por la Administración Avanzada de Energía (APM), que trata de conservar el poder por el estacionamiento de los jefes (descarga desde los platos) después de varios segundos de inactividad. Las cabezas son de carga en los platos cuando sea necesario. En la mayoría de los sistemas, donde los discos duros intermitente, en-y-fuera de la actividad, esto puede causar un montón de ciclos de carga/descarga a ocurrir. A su vez APM apagado, ejecute el comando siguiente en un símbolo de root:

smartctl -s apm,off /dev/sda

Este comando se necesita para ejecutarse cada vez que el sistema se apaga y enciende o se pone a dormir o en la unidad de lo contrario está apagado, ya que esta configuración no se guarda cuando la unidad está apagada.

En mi experiencia, esto va a reducir drásticamente el número de ciclos de carga/descarga y, en consecuencia, las probabilidades de que usted va a experimentar este tipo de error de nuevo en el futuro. Tenga en cuenta, sin embargo, que esto aumenta el consumo de energía y la temperatura del disco. Si la unidad se ejecuta constantemente a temperaturas superiores a 50 °C, el riesgo de fallo prematuro es mayor, así que usted puede querer dejar de APM (o gire sobre si está apagado) durante los meses más cálidos.

2voto

sj0h Puntos 121

Aparte de los fallos de lectura, considerar también la cuenta del ciclo de carga. En casi 500.000 que esto puede indicar una razón para el fracaso, o por lo menos alta carga ciclo de desgaste. Hay un ciclo de carga por cada minuto de energía por hora. Después de reemplazar la unidad asegúrese de que el nuevo disco no está haciendo esto como bueno.

2voto

Jorge Nerín Puntos 765

Sí, tiene 16 sectores ilegibles, usted ha tratado de hacer varias pruebas de que todos han fallado en aproximadamente la misma área de la unidad, por lo que, de copia de seguridad rápida, pero tenga en cuenta que usted tiene datos ya inaccesible por ahora persistentes en la vecindad de los sectores 92290592, 92290596.

Usted puede tener otras áreas problemáticas, todavía no sé si los 16 sectores son consecutivos o difundidos, si quieres jugar después de la copia de seguridad que usted puede hacer selectivos de la auto-prueba-t seleccione,startlba-endlba.

Current_Pending_Sector significa que el disco duro de firmware tiene trató de leer, pero no puede, intente un par de veces más (siempre y cuando el sistema operativo se lo pide) hasta fallando y marcado como Offline_Uncorrectable o sustituya el sector dañado por otro de repuesto sector, si el sistema operativo se escribe en él (aumentando Reallocated_Sector_Ct a la hora de hacerlo).

1voto

Yo personalmente reemplazar la unidad. Si, por alguna razón no quieren hacer aún, pero permanecen en la unidad de un tiempo, sin embargo, usted necesita para asegurarse de que no accidentalmente el uso de las áreas malas para los nuevos archivos.

He tenido un coche en un viejo Mac acaba de grabación de vídeo, y decidí que yo no quería cambiar todavía, como los videos fueron sólo bueno tener. Así que se necesita para aislar los errores. Primero he creado una carpeta vacía sólo para archivos malos, y luego he intentado leer todos los archivos existentes en el disco y cualquiera de ellos con un error en la trasladaron a la mala-archivos-directorios (esperemos que sólo poco importante).

A continuación, he creado un montón de nombre único de un megabyte archivos a llenar el disco duro (para todo el espacio vacío que se encuentra ahora en uno de estos 1 MB de archivos) y, a continuación, se repite el procedimiento. Todos los archivos con errores en los mismos, se trasladó a la mala-archivos-directorios, y los que quedaban estaban bien y que pudieran ser eliminados para recuperar la mala espacio.

Ahora puede utilizar la unidad con un poco más de tiempo, pero no lo uso para cosas importantes. Se va a fallar más y es muy probable que sea un inconveniente cuando sucede.

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X