41 votos

¿Cómo debo grabar en los discos duros?

Google ha hecho un estudio muy profundo sobre los errores de disco duro, que encontró que una porción significativa de las unidades de disco duro fracasan dentro de los primeros 3 meses de uso intensivo.

Mis compañeros y yo pensando que podría implementar una quemadura en el proceso para todas nuestras nuevas unidades de disco duro que podría salvar algo de la angustia de perder el tiempo en nuevo, no probado unidades. Pero antes de la implementación de una quemadura en el proceso, nos gustaría obtener alguna información de otros que tienen más experiencia:

  • ¿Qué tan importante es para grabar en una unidad de disco duro antes de empezar a usarlo?
  • ¿Cómo se implementa una quemadura en el proceso?
    • ¿Cuánto tiempo puede quemar en un disco duro?
    • ¿Qué software se utiliza para grabar en los discos?
  • Cuánto estrés es demasiado para una quemadura en el proceso?

EDITAR: Debido a la naturaleza del negocio, los Allanamientos son imposibles de utilizar la mayor parte del tiempo. Tenemos que confiar en que las unidades individuales que son enviadas a través de la nación con bastante frecuencia. Tenemos una copia de seguridad de unidades tan pronto como podamos, pero todavía encontramos fracaso de aquí y de allá antes de que tengamos una oportunidad de realizar una copia de seguridad de los datos.

ACTUALIZACIÓN

Mi empresa ha implementado una quemadura en el proceso por un tiempo ahora, y ha demostrado ser extremadamente útil. De inmediato nos queman en todas las nuevas unidades que tenemos en stock, lo que nos permite encontrar muchos errores antes de la expiración de la garantía y antes de instalarlos en los nuevos sistemas informáticos. También ha demostrado su utilidad para comprobar que una unidad ha ido mal. Cuando uno de nuestros equipos se inicia encontrar errores y una unidad de disco duro es el principal sospechoso, vamos a volver a ejecutar la quemadura-en proceso en esa unidad y mirar los errores para asegurarse de que la unidad era en realidad el problema antes de iniciar el proceso de RMA o tirarlo a la basura.

Nuestro burn-in es un proceso sencillo. Hemos designado un sistema Ubuntu con un montón de puertos SATA, y le damos a ejecutar badblocks en modo de lectura/escritura con 4 pases en cada unidad. Para simplificar las cosas, nos escribió un guión que imprime una "DATOS SERÁN ELIMINADOS DE TODAS las UNIDADES" de advertencia y, a continuación, ejecuta badblocks en cada unidad, excepto la unidad del sistema.

49voto

MikeyB Puntos 26178

IMNSHO, usted no debe confiar en una grabación en proceso de eliminar las malas y unidades de "proteger" a sus datos. El desarrollo de este procedimiento y la aplicación va a tomar un tiempo que podría ser mejor utilizado en otros lugares, e incluso si un coche pasa de burn-in, que todavía puede fallar meses más tarde.

Usted debe ser el uso de RAID y copias de seguridad para proteger sus datos. Una vez que está en su lugar, deje que se preocupe de las unidades. Bueno controladores RAID y subsistemas de almacenamiento tendrá 'fregado' los procesos que van sobre los datos de cada tan a menudo y asegurarse de que todo está bien.

Una vez que todo está cuidado, no hay necesidad de hacer el disco de limpieza, aunque como otros han mencionado que no se pierde nada con hacer un sistema de prueba de carga para asegurarse de que todo está funcionando como se esperaba. Yo no se preocupe acerca de los discos.


Como se ha mencionado en los comentarios, no tiene mucho sentido el uso de unidades de disco duro para su caso de uso en particular. El envío de todo es mucho más probable que causen errores de datos que no van a estar allí cuando usted hizo el burn-in.

Cinta de medios de comunicación está diseñado para ser enviado a su alrededor. Usted puede obtener 250MBps (o hasta 650MBps comprimido) con una sola IBM TS1140 unidad que debe ser más rápido que su unidad de disco duro. Y más grande también - un solo cartucho puede dar hasta 4 tb (sin comprimir).

Si usted no desea utilizar la cinta, el uso de unidades de estado sólido. Pueden ser tratados con mucho más áspera que la de los discos Duros y satisfacer todos los requisitos que hemos dado hasta ahora.


Después de todo eso, aquí están mis respuestas a sus preguntas:

  • ¿Qué tan importante es para grabar en una unidad de disco duro antes de empezar a usarlo?
    No en todos.
  • ¿Cómo se implementa una quemadura en el proceso?
    • ¿Cuánto tiempo puede quemar en un disco duro?
      Una o dos carreras.
    • ¿Qué software se utiliza para grabar en los discos?
      Una simple ejecución de, digamos, shred y badblocks va a hacer. Verificación de los datos INTELIGENTE después.
  • Cuánto estrés es demasiado para una quemadura en el proceso?
    Sin estrés es demasiado. Usted debe ser capaz de tirar nada a un disco sin que volar.

36voto

Zoredache Puntos 84524

¿Qué tan importante es para grabar en una unidad de disco duro antes de empezar a usarlo?

Si usted tiene una buena copia de seguridad, y buenos sistemas de alta disponibilidad, entonces, no mucho. Desde la restauración a partir de un fallo debe ser bastante fácil.

¿Cómo se implementa una quemadura en el proceso? ¿Qué software se utiliza para grabar en los discos? Cuánto estrés es demasiado para una quemadura en el proceso?

Yo se ejecutará normalmente badblocks en contra de una unidad o sistema nuevo cuando lo reciba. Voy a correr siempre que puedo resucitar a un equipo de los repuestos de la pila. Un comando como este (badblocks -c 2048 -sw /dev/sde) se escribe realmente a cada bloque 4 veces, cada vez con un patrón diferente (0xaa, 0x55, 0xff, 0x00). Esta prueba no hacer nada para probar un montón de azar de lecturas/escrituras, pero debe demostrar que cada bloque puede ser escrito y leído.

También puede ejecutar bonnie++, o iometer que son herramientas de evaluación comparativa. Estos deben tratar a la tensión de la unidades un poco. Las unidades no debería fallar, incluso si intenta max. Así que podrías probar a ver qué pueden hacer. Yo no hago esto, sin embargo. Conseguir una e/S de referencia de su sistema de almacenamiento a la derecha en instalación/configuración de tiempo puede ser muy útil en el futuro cuando usted está buscando a problemas de rendimiento.

¿Cuánto tiempo puede quemar en un disco duro?

Una sola ejecución de badblocks es suficiente, en mi opinión, pero creo que tengo una muy fuerte sistema de copia de seguridad, y a mi, JA, necesidades no son tan altos. Me pueden permitirse el lujo de algún tiempo de inactividad para restaurar el servicio en la mayoría de los sistemas que apoyan. Si usted está tan preocupado, que piensa que un multi-aprobar el programa de instalación puede ser necesario, entonces usted probablemente debería haber RAID, buena copias de seguridad, y una buena HA de configuración de todos modos.

Si estoy en un apuro, me pueden pasar un burn-in. Mis copias de seguridad, y la RAID debe estar bien.

8voto

tylerl Puntos 8195

Dada su aclaración, no suena como cualquier quemadura-en proceso sería de ninguna utilidad para usted. Las unidades de fallar principalmente debido a factores mecánicos, generalmente el calor y la vibración; no a causa de cualquier tipo de oculto bomba de tiempo. "Burn-in" proceso de pruebas el entorno de la instalación tanto como cualquier otra cosa. Una vez que se mueva la cosa, estás de vuelta a donde comenzó.

Pero aquí están algunas sugerencias que pueden ayudarle a:

Portátil unidades son generalmente diseñados para soportar una más empujones y la vibración de las unidades de sobremesa. Mis amigos que trabajan en la recuperación de datos de las tiendas siempre envíe datos a los clientes en la computadora portátil unidades por esa razón. Nunca he probado este hecho, pero parece ser el "conocimiento común" en industrias seleccionadas.

Las unidades Flash (por ejemplo, unidades flash USB) son los más resistentes a los golpes de cualquier medio que usted encontrará. Debe ser incluso menos probable que usted va a perder datos en tránsito si utiliza el flash de los medios de comunicación.

Si envía un Winchester drive, hacer una exploración de superficie antes de ponerlo en uso. O mejor aún, simplemente no ponerlo en uso. En su lugar, usted puede designar a ciertas unidades como "envío" de unidades, lo que se ve todos los abusos, pero que no dependen de la integridad de los datos. (I. e.: copie los datos en la unidad para su envío, copia después del envío, muy sumas de comprobación en ambos lados, ese tipo de cosas).

5voto

David Schlosnagle Puntos 2113

Su proceso está mal. Usted debe utilizar matrices raid. Donde yo trabajo que hemos hecho robustos matrices raid que están diseñadas para hacer que transportan alrededor. No es ciencia de cohetes. Choque de montaje de las unidades en agrandar los recintos con grandes vibraciones de goma aislantes mejorará la confiabilidad enormemente. (Seagate constellation-es las unidades, son como un ejemplo clasificado para 300G de shock pero sólo 2G vibración no operativa: de modo que la caja de envío necesidades para aislar la vibración de la unidad. http://www.novibes.com/Products&productID=62 o http://www.novibes.com/Products&productId=49 [parte #50178])

Sin embargo, usted realmente desea grabar en la prueba de unidades de disco duro así que aquí va.

He trabajado en sistemas como unidades de disco duro y grabar en encontrado algunos problemas, pero...

Para acelerar el ciclo de vida de pruebas de Pcb para llevar a cabo las fallas, nada mejor que algunos caliente/fría ciclos. ( operación en caliente de los ciclos de frío funciona aún mejor... pero es más difícil de hacer, especialmente con los bancos de HDD)

Hazte con una cámara ambiental big enoug para el número de unidades a adquirir en un momento. ( Estos son bastante caros, sería más barato para enviar matrices raid alrededor) no Se puede escatimar en las cámaras de prueba de que usted tendrá el control de la humedad y rampas programables.

Programa en la repetición de dos rampas de temperatura, reducir al mínimo la temperatura de almacenamiento, hasta el máximo de la temperatura de almacenamiento, hacer las rampas empinadas suficiente para alterar el ingeniero de aplicación a partir de que los fabricantes de disco duro. 3 frío-caliente ciclos de 12 horas de ver los discos fallando bastante rapidez. Ejecutar las unidades en menos de 12 horas como esta. Si cualquier trabajo después me sorprenderá.

Yo no creo que esto: Un lugar en el que trabajó tuvimos un ingeniero de producción hizo esto, más productos se entregan con el mismo equipo de prueba, hubo un enorme aumento en los fallos en la prueba, pero los muertos a la llegada tasa se redujo prácticamente a cero.

3voto

voretaq7 Puntos 63415

¿Qué tan importante es para grabar en una unidad de disco duro antes de empezar a usarlo?

Depende.
Si la vas a usar en un RAID que proporciona redundancia(1, 5, 6, 10)? No muy.
Si la vas a usar standaolone? Un poco, pero es mejor que la simple ejecución de smartd, o algo por el monitor de lugar, al menos en mi opinión.

Naturalmente, esto conduce a que mi respuesta a "¿Cómo se puede implementar una quemadura en el proceso?" -- Yo no.
En lugar de tratar de "quemar" discos corro en pares redundantes y el uso de monitoreo predictivo (como SMART) para que me diga cuando la unidad está recibiendo wonky. He encontrado que el tiempo extra necesario para hacer un total de burn-in (en realidad, el ejercicio de todo el disco) es sustancialmente más caro que tratar con un error de disco y de intercambio.
La combinación de RAID y buenas copias de seguridad de sus datos debe ser muy seguro, incluso cuando se trata de mortalidad infantil (o el otro extremo de la bañera cura cuando empiece a tener unidades de morir de vejez)

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: