4 votos

Inicialización lenta de la paridad del conjunto RAID-5 en el controlador HP Smart Array P411

El 29 de octubre de 2011, construí una matriz RAID-5 utilizando 4 unidades Seagate SAS ST3146855SS de 146,8 GB que funcionaban a 15k conectadas a un PowerEdge R515 con una controladora HP Smart Array P411 que ejecutaba Windows 2008 (así que nada particularmente inusual).

Sé que la inicialización de la paridad de una matriz RAID-5 puede llevar algún tiempo, pero sigue funcionando después de 2,5 semanas, lo que parece un poco inusual.

Anteriormente había construido otra matriz en la misma controladora usando 4 unidades SATA-2 de 2TB y eso sí me llevó un tiempo, pero a) estoy seguro de que fueron menos de 2,5 semanas, b) esa matriz era ~12 veces más grande y c) durante la inicialización, el porcentaje aumentó lentamente cada día.

Por el momento, la pantalla de estado de esta nueva 2ª matriz dice simplemente "Estado de inicialización de paridad: En progreso" y lo ha dicho desde el principio. Es esta falta de cambio en el estado lo que más me preocupa - parece que no está haciendo nada.

¿Creéis que algo ha ido mal o estoy siendo poco paciente y por alguna razón, el que el estado no aumente es normal? Esperaba que un array mucho más pequeño con discos más rápidos (15k SAS frente a 7,5k SATA-2) se construyera en pocos días.

Esta es nuestra SAN principal que ejecuta StarWind, por lo que mis opciones de "jugar" son muy limitadas. Esta segunda matriz está actualmente en uso para un pequeño disco virtual, por lo que podría apagar la máquina de destino, mover el disco virtual a otra unidad e intentar reconstruirlo.

0 votos

Así que, permítanme resumir las cosas aquí. Pones un controlador HP en un servidor Dell y no lo hizo ¿espera que haya problemas? Vaya.

0 votos

@MarkM - no, compré un controlador que se ajustaba a los requisitos que necesitábamos en eBuyer que casualmente estaba fabricado por HP de la misma manera que podría haber sido fabricado por LSI Logic. Sin embargo, después de haber leído muchos posts de HP sobre problemas idénticos con HP servidores y algunos discos SATA (incluidos los de la marca HP) y sospecho que no es específicamente una incompatibilidad sólo con Dell. Han roto sus propios servidores también con la actualización del firmware

0 votos

@ewwhite - gracias por tus sugerencias, pero en el momento de escribir esto, el problema no se ha resuelto y mientras tu sugerencia de actualizar el firmware es probablemente la respuesta correcta (y lo marcaré como tal a continuación), no nos ayuda ya que no quiero arriesgarme a actualizar la SAN (aunque los discos SATA no sean de misión crítica) y terminar con un sistema inutilizable. Así que voy a comprar una tarjeta LSI Logic (que nos da 1GB de caché y 6Gbit/s) y migrar los discos virtuales. Luego podría intentar actualizarla cuando no dependa de ella.

4voto

Tina Puntos 21

Bueno, es un poco extraño. No veo muchos casos de mezcla de controladores HP Smart Array y servidores Dell. De cualquier manera, la inicialización de la paridad no comienza hasta que se inicia la E/S en la nueva unidad lógica. ¿Puedo preguntar cómo estás monitoreando esto? A través de la Página web de la utilidad de configuración de arrays de HP ? Tal vez el Herramienta de línea de comandos HP ACU ? Si tiene este último instalado, puede proporcionar la salida de:

ctrl all show config detail

Nos gustaría ver esa salida para ver si hay una posible problema con uno de sus discos .

Desde el Manual de HP Smart Array :

Background RAID creation 
When you create a RAID 1, RAID 5, or RAID 6 logical drive, the Smart Array controller must build the 
logical drive within the array and initialize the parity before enabling certain advanced performance 
techniques. Parity initialization takes several hours to complete. The time it takes depends on the size of the 
logical drive and the load on the controller. The Smart Array controller creates the logical drive, initializing 
the parity whenever the controller is not busy. While the controller creates the logical drive, you can access 
the storage volume which has full fault tolerance. 

También, comprobar el firmware del controlador Smart Array P411 . ¿Tienes instalado un módulo de caché con batería o flash de respaldo? Si no es así, tendrás otros problemas de rendimiento a lo largo del tiempo .

0 votos

Estoy usando la página de la utilidad de configuración de arrays de HP, así que gracias por el aviso de la utilidad de línea de comandos. Voy a comprobar que y volver a usted

0 votos

Re: paridad siempre que el controlador no esté ocupado: hmm, podría ver ahora mismo el controlador ha estado ocupado casi todo el tiempo ya que el otro array se ha utilizado mucho

1 votos

Creo que no se pueden subir archivos aquí y hay un pequeño límite de comentarios así que he puesto la salida del comando ctrl aquí: mailbigfile.com/5e1532240f3984dcc0b2579c8165ba7e/… . Ese enlace será válido durante unas semanas

2voto

Anwar Chandra Puntos 4341

La probabilidad de que se produzca un error no recuperable en los tiempos que corren es extremadamente alta. Podría sugerir un raid 1 o 10. Especialmente si se trata de guardar algo importante.

0 votos

Es cierto. Yo recomendaría no usar RAID 5 para implementaciones en estos días por razones de rendimiento y fiabilidad.

0 votos

Estoy de acuerdo por razones de rendimiento, pero la fiabilidad depende de lo fiable que sea. Pero por el coste, RAID-5 es un buen compromiso. Esta matriz no es de misión crítica - los discos internos del R515 son RAID-10 y contienen las cosas de misión crítica

0 votos

En realidad, RAID-5 está bien para discos pequeños como estos. No es razonable para unidades SATA, pero para unidades SAS o SSD está bien.

0voto

Aurelien P Puntos 1

Hay un firmware de disco disponible para las unidades DG072BABCE, y DG146BABCF : "Este firmware evita una condición poco frecuente que puede producirse durante una secuencia de comandos WRITE SAME que puede dar lugar a que se escriban datos incorrectos en el disco duro. El comando WRITE SAME puede utilizarse durante la inicialización de la paridad RAID ARRAY".

0 votos

¿Tienes la URL de donde viene esta información? Si es así, incluirla en su respuesta será de gran ayuda.

0 votos

¿Puede indicar dónde está disponible/se puede descargar este firmware? Por favor, también haga referencia a las notas de la versión si es posible. Hará que esta respuesta sea mucho más sólida.

0 votos

Esto es discutible. El OP no está usando discos HP, por lo que la advertencia del firmware no se aplica.

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: