3 votos

Servidor de correo/caja multimedia Linux sufren errores de sistema de archivos RAID, pánico de kernel

En la última semana, el mini-ITX de la máquina que he construido yo mismo para servir de correo y los recursos compartidos de Samba ha núcleo de pánico, dos veces con el sistema de archivos relacionados con la materia. Anoche me di cuenta de los errores en la integridad de la transmisión por secuencias de una película a mi set-top-cliente (artefactos), así que empecé a hurgar.

Tanto la unidad de disco duro interna y la unidad de disco duro externa uso linux software RAID y en espejo, si tengo que hacer una suma de control md5 de un archivo bastante grande, como un video, y hacerlo repetidamente, me sale una diferente de la suma de comprobación cada vez que debo de tener en cuenta que uno es ext4, el otro es JFS). Puedo arrancar desde una memoria USB en modo de recuperación, lo mismo que sucede. No he probado la lectura de la externa espejo en otro equipo, pero me hizo montar uno de los componentes de los discos y parecía estar bien, al menos se estaba dando coherente de las sumas md5 allí.

Así, el sistema de ficheros ha sido descartado (en la que está sucediendo en ambos ext4 y JFS), unidades de disco duro son probablemente (sería una increíble coincidencia), los controladores SATA son, probablemente, a ver como lo que está sucediendo en los dos completamente independiente de los controladores, una dañado el módulo de kernel o algo que está fuera viendo como se está haciendo, incluso cuando arrancando desde el disco de rescate.

El hecho de que esto está sucediendo a dos conjuntos separados de las unidades, controlado por dos controladores SATA, con dos diferentes sistemas de ficheros, y el comportamiento se mantiene cuando el arranque de dos núcleos diferentes me hace pensar que la única opción plausible es que hay algo terriblemente mal con la placa base. Esta placa base ya era un número de autorización de reemplazo de una compañía no estoy de particular confianza (Zotac), por lo que sería menos sorprendente de lo habitual.

Este es Ubuntu Server 10.04, por cierto, de 64 bits, en una Zotac IONITX-C (creo) de la placa base con un Atom N230.

¿Alguien tiene otras ideas, diagnósticos que debo realizar, etc.?

EDIT: Dos cosas que me olvidé de mencionar: cuando he arrancado desde la llave USB lo hice correr fsck en ambos dispositivos md bastante.

Esto es lo que el pánico se vería así:

enter image description here

He tratado de buscar en Google un par de estos, sin mucho éxito, pero creo que es más probable que el hardware de la culpa de todas maneras, yo no sé que se concreta la pieza de hardware.

EDIT 2: Acaba de ejecutar memtest86, y no una sola prueba está pasando. El menos significativo 2 bytes de la prueba patrón parece ser siempre de leer de nuevo mal. Todavía no es seguro si es la RAM o chipset, y no tengo un extra de stick de memoria RAM para realizar la prueba.

1voto

Thiago Puntos 362

Mi voto es RAM va mal, o tal vez algo en el chipset. ¿Puede cambiar la memoria RAM con RAM bien conocido y ver como va? -(linuxes más modernos tienen una opción "memtest" en el disco de instalación también, usted puede probar si no tienes ram buena conocido de mentira, aunque sugeriría salir buena RAM como una prueba mejor.

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: