33 votos

¿Es necesario quemar de RAM para hardware de tipo servidor?

Teniendo en cuenta el hecho de que muchos sistemas de servidor están equipadas con ECC RAM, es necesario o útil para la grabación de los módulos Dimm de memoria antes de su implementación?

Me he encontrado un ambiente donde todos los server de RAM se coloca a través de una larga burn-in/estrés-tesing proceso. Esto ha retrasado la implementación del sistema en la ocasión y los impactos de hardware tiempo de entrega.

El hardware del servidor es principalmente de Supermicro, por lo que la RAM se obtiene de una variedad de proveedores; no es directamente desde el fabricante como un Poweredge de Dell o HP ProLiant.

Es este un ejercicio útil? En mi experiencia en el pasado, simplemente utiliza el proveedor de RAM fuera de la caja. No debería el POST las pruebas de memoria de captura DOA memoria? He respondido a la ECC errores mucho antes de que el módulo DIMM falló, como la ECC umbrales generalmente fueron el detonante para la garantía de la colocación.

  • ¿Grabar en su memoria RAM?
  • Si es así, ¿qué método(s) que utiliza para realizar las pruebas?
  • Se ha identificado ningún tipo de problemas por delante de la implementación?
  • Tiene la quemadura-en proceso resultó en cualquier plataforma adicional de la estabilidad frente a la no realización de ese paso?
  • ¿Qué hacer cuando la adición de memoria RAM existentes en un servidor en ejecución?

31voto

Shane Madden Puntos 81409

No.

El objetivo de la quema en el hardware está a la tensión hasta el punto de catalizador de una falla en un componente.

Hacer esto con la mecánica de las unidades de disco duro va a obtener algunos resultados, pero eso simplemente no va a hacer mucho para la memoria RAM. La naturaleza de la componente es tal que los factores ambientales y la edad son mucho más probable que sea la causa de los fallos de la lectura y escritura en la RAM (incluso en su máximo ancho de banda para un par de horas o días) nunca sería.

Asumiendo que su memoria RAM es lo suficientemente alta calidad, en la que la soldadura no se derrite la primera vez que realmente empezar a utilizarlo, una quemadura-en proceso no le ayudará a encontrar defectos.

26voto

Lucas Kauffman Puntos 14284

He encontrado un documento por parte de Kingston detallando cómo trabajar con la Memoria del Servidor, creo que este proceso que, normalmente, será el mismo para la mayoría de los fabricantes más conocidos. Los chips de memoria, así como todos los dispositivos semiconductores, siguen una determinada fiabilidad/patrón de fallo que se conoce como la Bañera de la Curva:

enter image description here

El tiempo se representa en el eje horizontal, comenzando con la fábrica de envío y continua a través de tres períodos de tiempo diferentes:

  • Principios de los Fracasos de la Vida: la Mayoría de los fracasos se producen durante el uso inicial que se período. Sin embargo, a medida que pasa el tiempo, el número de fallos disminuye rápidamente. La Vida Temprana de la Insuficiencia período, que se muestra en amarillo, es aproximadamente 3 meses.

  • Vida útil: Durante este período, los fracasos son extremadamente raros. El vida útil período se muestra en azul y se estima en 20 años.

  • Al final de la Vida Fallos: Finalmente, semiconductores, productos de desgaste y error. El Final de su período de Vida se muestra en verde

Ahora porque Kingston señaló que alto fail-las tasas de producirse los primeros tres meses (después de estos tres meses, la unidad se considera buena hasta que se EOL unos 15 - 20 años más tarde). Se ha diseñado una prueba con una unidad llamada KT2400 que brutalmente pruebas de que el servidor de módulos de memoria para 24 horas a 100 grados celsius en alta tensión, por la cual todas las células de cada chip DRAM es continuamente ejercido; este alto nivel de las pruebas de estrés tiene el efecto de envejecimiento de los módulos por al menos tres meses (como se señaló antes, el periodo crítico donde la mayoría de los módulos de mostrar fallos).

Los resultados fueron:

En Marzo de 2004, Kingston comenzó una prueba de seis meses en el que el 100 por ciento de su servidor de memoria fue probado en el KT2400. Los resultados fueron muy monitoreado para medir el cambio en los fracasos. En septiembre de 2004, después de todos los datos de la prueba fue compilada y analizada, los resultados mostraron que los fracasos se redujo en un 90 por ciento. Estos resultados superaron expectativas y representan una mejora significativa de un producto la línea que ya estaba en la parte superior de su clase.

Entonces, ¿por qué se quema en la memoria no es útil para la memoria del servidor? Simplemente, porque ya está hecho por el fabricante!

15voto

Some French Guy Puntos 96

Compramos hojas y por lo general comprar razonablemente bloque grande de ellos en un momento, como tal tengamos en e instalar ellos a lo largo de DÍAS antes de nuestra red de puertos están listos/secure. Así que usar el tiempo para usar memtest por alrededor de 24 horas, a veces más si se va en un fin de semana - una vez hecho esto nos rocíe el básico ESXi y la propiedad intelectual está listo para su huésped perfil para ser aplicado una vez que la red de seguridad. Así que sí, nos prueba que, más por oportunidad que por necesidad, pero es atrapado un par de DOA Dimm antes de ahora, y no me físicamente haciendo así que él me lleva sin esfuerzo. Estoy por ello.

11voto

Atari911 Puntos 286

Bueno creo que depende de qué es exactamente sus procesos. Corro siempre MemTest86 en memoria antes de que lo puse en un sistema (servidor o lo contrario). Después de tienen un sistema para arriba y corriendo, problemas causados por la pérdida de memoria pueden ser difíciles de solucionar.

En cuanto a la realidad "pruebas de resistencia" la memoria; Todavía tengo que ver por qué esto sería útil a menos que están probando para propósitos de overclocking.

6voto

Sirex Puntos 4053

No sé, pero he visto personas que hacen. Nunca los vi ganar nada de él, aunque creo que tal vez sería una resaca o superstición.

Personalmente, soy como tú en que los índices de error ECC son más útiles para mí - suponiendo que la memoria RAM no DOA pero entonces debería saber de todos modos.

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: