6 votos

Relativa de las tasas de fallo de los componentes de hardware

Digamos que yo soy la configuración de un único servidor de la máquina. Sin conocer los componentes específicos de la misma (y ser capaz de ver sus MTBFs), ¿qué son la típica relativa de las tasas de fallo de los componentes de hardware en el servidor?

Equivalentemente, ¿cuáles son las clasificaciones de la mayoría de las veces-sustituido componentes a través de todos los servidores de la empresa?

4voto

Ramiro Berrelleza Puntos 1017

Cualquier cosa que se mueve, que en un servidor es, básicamente, discos duros y ventiladores, se producirá mucho más a menudo que los componentes de estado sólido. Fuentes de alimentación son un lejano, pero notable, la segunda. Todo lo demás (cpu, memoria, etc) es bastante fiable... lo cual no es decir inmune al fracaso, pero definitivamente debe estar preocupado después de que tienes el disco//ventilador de la fuente de alimentación bases cubiertas.

2voto

Brad Puntos 106

Sólo investigando este para mi empresa de hoy, he encontrado un resumen de uno de microsoft, whitepapers en extremetech.com con este gráfico para un periodo de 8 meses:

failure rates w/ underclocking

La tensión nominal de la columna fue un digno referencia para mis cálculos del valor de Dell hardware de garantía (sólo vamos a invertir en hardware adicional en su lugar).

El documento completo está aquí: http://research.microsoft.com/apps/pubs/default.aspx?id=144888

2voto

Ryan Sampson Puntos 2898
  1. Unidades De Disco Duro
  2. Todo lo demás

Mejor mantener repuestos de todo en el lugar, a pesar de que, a menos que usted esté de acuerdo con lo que el tiempo de inactividad con su proveedor de hardware decide a dar.

1voto

Eddie Puntos 6779

Acerca de los discos duros, muchas personas confunden el MTBF y pensar en una unidad con un MTBF 100.000 horas va a durar, en promedio, de 11.5 años. Lo que el fabricante quiere decir es que en una colección de un gran número de unidades, N, todos dentro de su vida, de que una unidad de archivo por cada 100,000/N horas. Si usted tiene 100,000 unidades que cada uno tiene un MTBF de 100.000 horas, entonces usted debe esperar de una unidad a fallar ... en promedio, cada hora.

Los discos duros fallan más a menudo de lo que la gente espera. Copia de seguridad, copia de seguridad, copia de seguridad.

Nada con las piezas en movimiento pueden fallar, incluyendo las unidades de cinta, unidades de disco, los fans, y así sucesivamente. He tenido el ventilador en las tarjetas gráficas de morir, causando la muerte de la tarjeta gráfica. He tenido la alimentación del ventilador de morir, causando que la mayoría de las partes de la computadora a morir. (Desde entonces nunca he construido un sistema sin ventiladores adicionales.) Las unidades de cinta requieren de un cuidado extra, o su vida será mucho más corta. Esto es debido a que no solo se mueven, pero la cabeza de la cinta hace que el contacto físico con los medios de cinta -- al menos en muchos tipos de unidades de cinta. Limpieza de la unidad demasiado a menudo con los ordinarios de la cinta de limpieza de medios de comunicación desgaste de los cabezales de la cinta.

He tenido la incorporada en el chipset fans a morir, pero hasta el momento sin ningún efecto. Hasta ahora nunca he tenido un ventilador de CPU morir, pero yo tiendo a actualizar con la frecuencia suficiente que probablemente evitar esto a través de actualizaciones. (sonrisa)

Puedo reemplazar mis unidades de disco cada varios años (principalmente debido a la capacidad disponible aumenta tan rápidamente), por lo que han experimentado relativamente pocos errores de disco duro. He tenido muchas fuentes de alimentación falla, muchos más de lo que me hubiera ingenuamente que se espera para un componente sin movimiento de otras partes de la fan. Supongo que el poder irregularidades son la causa de muchas de las fallas en el suministro de energía.

Hasta ahora, en un par de décadas de la informática, nunca he tenido una CPU o la RAM o la placa base fallar a menos que haya una causa razonable, tales como el sobrecalentamiento (fans a morir). Sin embargo, algunas de las marcas de placas madres lo largo de los años han tenido mucha tiempos de vida más cortos de lo esperado debido a la sub-par de piezas, a menudo incorrectamente fabricados condensadores donde la energía entra en la placa base.

En cualquier lugar que usted tiene un enchufado de conexión es un punto de fallo. He tenido las computadoras no (la mayoría hace mucho tiempo) debido a hoteles de estaño-conectores enchapados. El estaño oxidado y con el tiempo la conexión, ya que con menos y menos confiable. Finalmente he desconectado de todo, tomó una goma de borrar para que el estaño conectores para eliminar la oxidación, conectado todo de nuevo, y fue y va por un tiempo más. Conectores de oro son el conector de la opción por una razón.

Por lo que he visto en un entorno corporativo, con mi hogar con experiencia mezclado, componentes parecen fallar en este orden, de más a menos frecuencia.

  1. Unidades de disco duro y las unidades de cinta
  2. Fuentes de alimentación
  3. los fans
  4. lejanamente, todo lo demás

No se menciona anteriormente, pero usted debe esperar todo de memoria flash de palos/tarjetas de morir con el tiempo, dependiendo de la frecuencia de uso. Pero va a tardar mucho tiempo, dado el promedio de uso de la mayoría de dichas tarjetas. Memoria Flash "se desgasta con el uso y células de memoria eventualmente fallará.

0voto

Chris Roberts Puntos 7543

Anecdóticamente, las baterías.

No tengo datos duros, pero me lo han sustituido más errores o bajo rendimiento de las baterías en mi vida que cualquier otro componente. Esto incluye sistemas de alimentación ininterrumpida, ordenadores portátiles/notebooks, controlador de baterías, las baterías para teléfono móviles, y probablemente un montón de otros.

Esto me ha llevado para siempre stock un extra de batería para un servidor de la sala de UPS.

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: