5 votos

La latencia en un pequeño Linux NFS4 sistema cliente/servidor

Somos un departamento de informática en una universidad pequeña, la ejecución de un RHEL 7 servidor mediante NFS4 y Fedora 24 clientes (~40 máquinas cliente, ~150 usuarios--rara vez concurrente). Estamos teniendo problemas de latencia, y estamos teniendo problemas para la solución de problemas/tratando de averiguar cuál es el problema. Ejemplos de los síntomas:

  • Emacs toma alrededor de 2 minutos para iniciar/ser utilizable. La interfaz gráfica de usuario aparece rápidamente, pero, a continuación, la aplicación se bloquea si se trató de abrir un archivo en el inicio. Si usted acaba de tratar de abrir emacs y , a continuación, intenta abrir un archivo, la aplicación se bloquea durante dos minutos. Después de unos dos minutos, usted puede crear archivos, la lectura de los archivos, etc., sin problema. EDIT: en ejecución emacs sobre un archivo local (por ejemplo, /tmp/prueba.fuera) no tiene el problema de latencia. También, la apertura de los archivos de red usando idle3 o gedit no tiene problemas.
  • La comprobación de un proyecto usando svn+ssh en la línea de comandos es muy lenta a partir de uno de los Linux cliente/escritorio de las máquinas, en el orden de los 3 minutos. Si usted se retire el proyecto, el uso de svn+ssh desde otra máquina, checkout tarda 3 segundos.
  • Usted puede configurar Inactivo. Cuando usted haga clic en el menú configurar, se bloquea la aplicación. ACTUALIZADO: Esto parece ser un error en idle3 que no repararon en Fedora 24, pero hemos sido capaces de aplicar la revisión.
  • Cuando usted haga clic en "abrir/browse" en una aplicación (por ejemplo, emacs, Eclipse) o abrir el administrador de archivos, la aplicación se bloquea por un tiempo, mientras recupera archivos. El uso de ls y el cd desde la línea de comandos es rápido.

Después de las largas demoras, usted puede leer/editar/crear archivos sin problema.

La única característica en común que he encontrado con estas aplicaciones es que son de uso oculto de los archivos de configuración (.emacs.d, .idle, .eclipse, ...). Me parece que no puede encontrar toda la documentación que los archivos ocultos sería manejado de manera diferente.

Cualquier consejo se agradece!

4voto

Grayda Puntos 21

Cómo iba a solucionar esto:

  1. si ~/.emacs.d/ es proporcionada por un montaje NFS, y
  2. el archivo de destino es un montaje NFS proporcionada por un segundo servidor NFS, y
  3. copia de todos los locales para el cliente elimina el retraso,

Me gustaría entonces mover uno de ellos en un momento posterior a NFS y trata de volver a crear el problema.

En la re-lectura de tu post original, me doy cuenta de que se supone que tienen dos o más servidores NFS, porque eso es lo que he visto en las anteriores empleadores. Un servidor NFS proporciona los directorios de inicio y un segundo siempre binarios. Hemos encontrado que ejecuta los archivos binarios localmente en el cliente mejora de rendimiento. :-)

Si usted tiene un servidor NFS, que son capaces de establecer una segunda para la solución de problemas? Quizás el único servidor NFS está abrumado en ciertos momentos; trabajar con un segundo servidor NFS puede ayudar a aislar este caso.

Si el problema aparece en sólo uno o dos clientes, me gustaría tratar de encontrar lo que los hace únicas de los clientes. Si el problema se muestra en cada cliente, me miraba en el servidor NFS.

Buscar en los registros en el RHEL7 servidor NFS ayudará en cualquier caso.

Una búsqueda en Google de "NFS Solución de problemas" siempre muchas páginas útiles, incluyendo tldp. También hay que Red Hat servidor nfs config. Usted probablemente ha mirado tanto de los que ya están.

Usted dijo que el servidor NFS es el de Red Hat EL 7. Si yo tuviera un contrato de soporte con mi copia de RHEL, me gustaría abrir un ticket con Red Hat y pídale que le ayude a solucionar problemas, también.

Espero que esto ayude. La buena suerte.


0voto

Jens Timmerman Puntos 498

¿Qué opciones de montaje usas para el nfs? Extracción de opciones como lookupcache=none (y deje el valor predeterminado en su lugar) permitirá a los clientes de caché mucho más agresiva, nos dimos cuenta de que esto puede confundir a los usuarios cuando un archivo en su directorio de inicio, se añade y se toma una hora antes de que sea visible en la máquina remota, pero para los binarios resultó ser fino.

También nos hemos fijado actimeo=60 y noactime sobre nuestras aplicaciones de montaje.

Las carpetas de inicio: rw,noatime,nfsvers=4,minorversion=1,soft,tcp,sec=sys,lookupcache=none,sloppy

aplicaciones/archivos binarios: rw,noatime,nfsvers=4,minorversion=1,soft,tcp,sec=sys,actimeo=60,sloppy

ver también los DATOS Y METADATOS de la COHERENCIA de la sección en la página man https://linux.die.net/man/5/nfs

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: