4 votos

Corrupción de archivos Archivos grandes (32 GB) en 18.04 LTS [RESUELTO]

Me estoy poniendo de irregularidades con el gran tamaño de los archivos. Tengo 64 GB de RAM, y mis unidades de almacenamiento son todos los Samsung 860 EVO. Estoy corriendo mdcrypt en la parte superior de mi cruda unidades, luks RAID en la parte superior de que, y ext4 como sistema de archivos. Tengo un montón de espacio libre en la unidad, y no estoy corriendo de intercambio.

Mi distribución es Ubuntu 18.04 LTS (4.18.0-25-generic #26~18.04.1-Ubuntu SMP Thu Jun 27 07:28:31 UTC 2019 x86_64 x86_64 x86_64 GNU/Linux).

Esta irregularidad fue descubierta por primera vez cuando la clonación de grandes unidades flash USB. Entonces me di cuenta de que gran bucle de sistemas de archivos montados también dañado.

Fragmentos de seguir:

Yo inicio mi prueba mediante la creación de una de 32 GB archivo de ceros:

$ dd if=/dev/zero of=zero-file_32GB bs=1024k count=32768
32768+0 records in
32768+0 records out
34359738368 bytes (34 GB, 32 GiB) copied, 55.3081 s, 621 MB/s

Entonces me SHA256 suma que para conseguir el código hash. Nota cómo el hash cambios con múltiples iteraciones:

$ sha256sum zero-file_32GB 
5f7f8ea75d87ac7d64c07ecc2c5fdbe407540913ac0feb050ede768990140b38  zero-file_32GB

$ sha256sum zero-file_32GB 
64bcf7372df895319ce9e54758aec2814600fa3335fb82c5996a7636e7d637be  zero-file_32GB

$ sha256sum zero-file_32GB 
3475353b2a00e5abebb1878a9ddb5956eb829c94af26d9cd079f991fbd84435c  zero-file_32GB

$ sha256sum zero-file_32GB 
cf65fa70ba04d7bb4055b72fdf2ac90bf65ac8457cc80b8e673af5acb57d22d1  zero-file_32GB

El mismo inconsistencias suceder con la suma MD5:

$ md5sum zero-file_32GB 
8633b9ba83a8ac04c9b56fad0a065ec2  zero-file_32GB

$ md5sum zero-file_32GB 
cc289d380b25235b7610a7b86bc4fd47  zero-file_32GB

$ md5sum zero-file_32GB 
249f66bd3843b6fcad8316fd0a3e660c  zero-file_32GB

$ md5sum zero-file_32GB 
888ac00592204be7a026c27e98159ff2  zero-file_32GB

Por ahora estoy bastante seguro de que mi archivo está dañado, y no el hash suma de los algoritmos. Para probar esta hipótesis, me separé de mi 32 GB cero-archivo en treinta y dos de 1 GB fragmentos:

$ split --verbose -b 1G zero-file_32GB split-1G_
creating file 'split-1G_aa'
creating file 'split-1G_ab'
creating file 'split-1G_ac'
creating file 'split-1G_ad'
creating file 'split-1G_ae'
creating file 'split-1G_af'
creating file 'split-1G_ag'
creating file 'split-1G_ah'
creating file 'split-1G_ai'
creating file 'split-1G_aj'
creating file 'split-1G_ak'
creating file 'split-1G_al'
creating file 'split-1G_am'
creating file 'split-1G_an'
creating file 'split-1G_ao'
creating file 'split-1G_ap'
creating file 'split-1G_aq'
creating file 'split-1G_ar'
creating file 'split-1G_as'
creating file 'split-1G_at'
creating file 'split-1G_au'
creating file 'split-1G_av'
creating file 'split-1G_aw'
creating file 'split-1G_ax'
creating file 'split-1G_ay'
creating file 'split-1G_az'
creating file 'split-1G_ba'
creating file 'split-1G_bb'
creating file 'split-1G_bc'
creating file 'split-1G_bd'
creating file 'split-1G_be'
creating file 'split-1G_bf'

Entonces me SHA256 suma el nuevo archivo se divide. Todos ellos deben ser idénticos, porque cada uno de ellos debe constar de sólo ceros. Pero aviso de la inconsistencia en la divide az y ba:

$ sha256sum split-1G_??                                                                                                                                                  
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_aa                                                                                                                        
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_ab                                                                                                                        
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_ac                                                                                                                        
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_ad                                                                                                                        
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_ae                                                                                                                        
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_af                                                                                                                        
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_ag                                                                                                                        
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_ah                                                                                                                        
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_ai                                                                                                                        
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_aj
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_ak
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_al
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_am
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_an
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_ao
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_ap
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_aq
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_ar
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_as
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_at
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_au
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_av
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_aw
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_ax
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_ay
702301f26e8df8cf784ca6b45954f1ca3524d1e22c322ee271ab1ac20b4face2  split-1G_az
bd9442046cecfcdec29169f5e8485ee0e226f56fab24cfded23b4ad15275b5d9  split-1G_ba
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_bb
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_bc
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_bd
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_be
49bc20df15e412a64472421e13fe86ff1c5165e18b2afccf160d4dc19fe68a14  split-1G_bf

Similar inconsistencias con la suma MD5:

$ md5sum split-1G_??   
cd573cfaace07e7949bc0c46028904ff  split-1G_aa
cd573cfaace07e7949bc0c46028904ff  split-1G_ab
cd573cfaace07e7949bc0c46028904ff  split-1G_ac
cd573cfaace07e7949bc0c46028904ff  split-1G_ad
cd573cfaace07e7949bc0c46028904ff  split-1G_ae
cd573cfaace07e7949bc0c46028904ff  split-1G_af
cd573cfaace07e7949bc0c46028904ff  split-1G_ag
cd573cfaace07e7949bc0c46028904ff  split-1G_ah
cd573cfaace07e7949bc0c46028904ff  split-1G_ai
cd573cfaace07e7949bc0c46028904ff  split-1G_aj
cd573cfaace07e7949bc0c46028904ff  split-1G_ak
cd573cfaace07e7949bc0c46028904ff  split-1G_al
cd573cfaace07e7949bc0c46028904ff  split-1G_am
cd573cfaace07e7949bc0c46028904ff  split-1G_an
cd573cfaace07e7949bc0c46028904ff  split-1G_ao
cd573cfaace07e7949bc0c46028904ff  split-1G_ap
cd573cfaace07e7949bc0c46028904ff  split-1G_aq
cd573cfaace07e7949bc0c46028904ff  split-1G_ar
cd573cfaace07e7949bc0c46028904ff  split-1G_as
cd573cfaace07e7949bc0c46028904ff  split-1G_at
cd573cfaace07e7949bc0c46028904ff  split-1G_au
cd573cfaace07e7949bc0c46028904ff  split-1G_av
cd573cfaace07e7949bc0c46028904ff  split-1G_aw
cd573cfaace07e7949bc0c46028904ff  split-1G_ax
cd573cfaace07e7949bc0c46028904ff  split-1G_ay
7036950003e53e471654b020330b386e  split-1G_az
0a82f6068a91bef3b46294e1e30687be  split-1G_ba
cd573cfaace07e7949bc0c46028904ff  split-1G_bb
cd573cfaace07e7949bc0c46028904ff  split-1G_bc
cd573cfaace07e7949bc0c46028904ff  split-1G_bd
cd573cfaace07e7949bc0c46028904ff  split-1G_be
cd573cfaace07e7949bc0c46028904ff  split-1G_bf

Pensé que continuamente se dividió en fragmentos más pequeños para determinar el tamaño real de la discrepancia y, a continuación, a analizar con un editor hexadecimal, pero dudo que ofrecen información de lo que está causando estos datos degradación. Mis imágenes ISO, para archivos de vídeo, y EXT4 en bucle de los sistemas de ficheros son resultar dañado. Alguna idea de lo que el culpable es?

Siendo que esto sólo empieza a ocurrir en 32 GB (que pasa a ser la mitad del tamaño de mi 64 GB de RAM. Yo no soy de usar swap.), Me inclino a creer que es un problema de memoria. ¿Qué dices tú?

Actualización #1:

Por desgracia, la prueba de la memoria no se necesita casi siempre como se espera. :-(enter image description here

Actualización #2 (Resolución!)

  • He quitado todos los 4 de 16 GB palos desde el ordenador.
  • Yo, a continuación, insertar el más bajo de la serie numerada de palo, en la primera ranura DIMM, Ranura #1 (mi ranuras son numeradas de 1 a 4). Corrí MemTest86 para 3:44 (tres horas, cuarenta y cuatro minutos), y se concluyó con cero errores.
  • He sustituido que seguir con el siguiente de forma secuencial en serie numerada de palo (después de la obvia de apagado y electrostática precauciones). He utilizado una vez más la Ranura #1 (porque yo quería poner a prueba toda la memoria en primer lugar, antes de comenzar a revisar mi ranuras). Corrí MemTest86 de nuevo. Esta vez la prueba abortado de forma casi instantánea, debido a demasiados errores.
  • En consecuencia, he insertado el tercer módulo DIMM en la Ranura #1. MemTest86 corrió por 3:43, sin errores.
  • El cuarto módulo DIMM en la Ranura #1 de la prueba también se postuló para las 3:43 y sin errores.
  • Yo, a continuación, inserta los tres conocidos buen módulos Dimm en la primera de tres ranuras. MemTest86 corrió a las 8:54 y sin errores.

Me pareció interesante que el ensayo de tres módulos Dimm (8:54) tomó mucho menos tiempo que el de tres de un solo módulo de la prueba combinada hizo (3:44 + 3:43 + 3:43 = 11:10). Supongo que algunas pruebas se realizaron en tándem.

Yo sha256sum'ed un nuevo 32 GB ceros archivo. La suma se mantuvo sin cambios, incluso después de varias iteraciones. Mi suma fue 97af759fc4597bc41706df77cbab318a57d935bacb262bd409e3ab767e07066f, el mismo número de @bernard.wei presentado.

Me gustaría agradecer a @heynnema por su asesoramiento en MemTest86. Que fue instrumental en la solución de este problema.

Considero que esta cuestión sea resuelta. Gracias a todos!

4voto

Jordi Bunster Puntos 3840
  • comprobar las actualizaciones del firmware para tu Samsung 860 EVO. Samsung Magician es una aplicación de Windows se utiliza para comprobar el firmware.

  • compruebe la versión del BIOS con sudo dmidecode -s bios-version y, a continuación, vaya al sitio web del fabricante para comprobar si hay una nueva BIOS.

  • ejecutar memtest para comprobar su RAM 64G. Ir a https://www.memtest86.com/ y descargar/ejecutar la libre memtest a prueba tu memoria. Obtener al menos un pase de todas las pruebas para confirmar la buena memoria. Esto le llevará muchas horas para completar.

Actualización #1:

memtest fracasó en la prueba de 2/4, [Dirección de la prueba, de la propia dirección]

memtest puede fallar por varias razones...

  • mal de especificaciones de la memoria RAM instalada

  • la BIOS está configurada para el overclocking de la tarjeta de memoria o ejecutar a máxima velocidad

  • DIMM está correctamente asentada en su ranura

  • DIMM está defectuoso

Del módulo DIMM se instalan normalmente en pares de igual tamaños para tomar ventaja de la velocidad de intercalado de memoria en el uso de dos canales, a y B (o más en algunos casos). El primer par de Dimm va en las ranuras A1/B1, y el segundo par a A2/B2. (Suponiendo que este es un equipo de escritorio con cuatro o más ranuras DIMM).

Paso #1:

  • comprobación de la memoria RAM especificaciones para asegurar que son compatibles con tu placa base

Paso #2:

  • compruebe la configuración de BIOS

Paso #3:

  • toque el chasis a tierra, desconecte el equipo, mantenga presionado el botón de encendido durante 10 segundos

  • vuelva a conectar todos los módulos Dimm

  • prueba con memtest

  • si memtest se ejecuta correctamente, es probable que hayas solucionado el problema

Paso #4:

  • toque el chasis a tierra, desconecte el equipo, mantenga presionado el botón de encendido durante 10 segundos

  • identificar la A2/B2 Dimm y retire cuidadosamente ellos

  • prueba con memtest

  • si memtest ejecuta correctamente, el A1/B1 módulos Dimm son buenas

  • si memtest falla, entonces A1 o B1 DIMM es malo

    • quitar A1 o B1 DIMM
    • reemplácelo con un A2 o B2 DIMM
    • prueba con memtest
    • si memtest ejecuta correctamente, el A1/B1 DIMM que sacó es el defectuoso
    • si memtest falla, el otro A1/B1 DIMM está defectuoso

Asumiendo que usted tiene cuatro 16G de los módulos Dimm, continuar en bicicleta por el resto de DIMM palos a través de la ranura A1/B1 hasta que sólo uno defectuoso DIMM queda desinstalado. Tenga en cuenta que usted realmente puede tener más de un módulo DIMM defectuoso.

Actualización #2:

El uso de memtest, una mala DIMM fue identificado. Suma de comprobación de ahora son bellas, y de forma coherente.

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: