10 votos

Geográficamente sistema de archivos distribuido con preferred localidad

Estoy construyendo una aplicación que necesita para distribuir un estándar de archivo de servidor en un par de sitios a través de una WAN. Básicamente, cada sitio tiene que escribir un montón de varios archivos de tamaño variable (algunos en el 100 MB, pero la mayoría de las pequeñas), y la aplicación está escrita tal que las colisiones no son un problema. Me gustaría tener un sistema que cumpla con los siguientes requisitos:

  1. Cada sitio puede almacenar los archivos en un "espacio de nombres". Es decir, todos los archivos que se muestran en el mismo sistema de archivos.
  2. Cada sitio de no enviar datos a través de la WAN a menos que sea necesario. I. e., no sería el almacenamiento local en cada lado de la WAN que sería "fusionan" en la misma lógica del sistema de ficheros.
  3. Linux & Free ($$$) es un Plus

Básicamente, algo así como una central de recurso compartido de NFS cumpliría la mayoría de los requisitos, sin embargo no permitiría que los escritos localmente los datos locales. Todos los datos de forma remota lados de la WAN sería copiar localmente todo el tiempo.

He mirado en el Lustre, y se han ejecutado algunas de las más exitosas pruebas con ella, sin embargo, parece que para distribuir archivos de forma bastante uniforme a través del almacenamiento distribuido. Yo he cavado a través de la documentación y no he encontrado nada que automáticamente se "prefiere" almacenamiento local de más de almacenamiento remoto. Incluso algo que se fue con la menor latencia de almacenamiento estaría bien. Iba a trabajar la mayoría del tiempo, el cual se reunirá este de la aplicación de los requisitos.


Algunas respuestas a preguntas frecuentes a continuación:

  • Los nodos de servidor: 2 o 3 para comenzar. Cada servidor podría tener decenas de lecturas simultáneas/escritura de los clientes que se conecten.
  • WAN Topología de malla completa y fiable. (gran empresa, el costo no es tan limitante como la burocracia)
  • Conmutación por error de cliente: yo en realidad no había pensado en tener los clientes de conmutación por error (sobre todo porque nuestro actual appliction no hacer esto en un solo sitio). Supuse que practicle respuesta es que los servidores en cada distribuidos geográficamente sitio se espera que los puntos únicos de fallos para los clientes que están sirviendo. Aunque, si usted está pensando acerca de algo específico aquí, creo que sería muy pertinente para la discusión.
  • Roll-mi-propia: he pensado en rsync/unison, sin embargo se necesita un poco de fantasía en la lógica de la "dinámica" parte de este trabajo a la perfección. I. e., el archivo parece ser local, pero solo se recuperan en la demanda.
  • MS-DFS: ciertamente parece ser algo que debo mirar en. Mi principal problema sería potencialmente no estaba seguro acerca de la configuración del servidor NFS/fiabilidad/rendimiento en Windows, ya que muchos de los clientes que se conectan son los clientes NFS.

5voto

Chris Thorpe Puntos 9128

Es una pena que el Linux requisito. Esto es exactamente lo que Windows DFS. Desde 2003 R2, lo hace en un bloque de nivel de base, también.

4voto

Evan Anderson Puntos 118832

Algunas preguntas:

  • Cuántos "servidor" nodos estás pensando en participar en esta cosa?

  • ¿Cuál es la conectividad WAN topología como-- hub and spoke, malla completa? ¿Qué tan confiable es?

  • Qué esperan los clientes de la conmutación por error a un geográficamente servidor local no en el caso de que el servidor local falla?

Windows DFS-R sin duda lo que usted está buscando, aunque para algunos potencialmente considerable de los costos de las licencias.

Usted dice que las colisiones no son un problema y usted no necesita un distribuida administrador de bloqueo, por lo que se puede hacer esto con userland herramientas como rsync o al Unísono y sólo exportar el resultado corpus de archivos con NFS para los clientes locales. Es feo, y que tendría que manejar tocando juntos algún tipo de sistema para manejar la generación de una topología de replicación y ejecutar las utilidades de las herramientas, pero ciertamente sería turístico como la concesión de licencias costo va.

3voto

Tom Puntos 26

Han considerado que la AFS?

El Andrew File System (AFS) es un distribuida en red del sistema de archivos que utiliza un conjunto de servidores de confianza para presentar un conjunto homogéneo, ubicación transparentes nombre de archivo de espacio para todas las estaciones de trabajo cliente.

Como yo lo entiendo, la mayoría de la reciente desarrollo ha estado detrás de la OpenAFS proyecto.

Yo no puedo pretender ser lo suficientemente familiarizado con el proyecto para saber si el "preferido localidad" característica está disponible, pero de lo contrario suena como un buen ajuste.

1voto

James Puntos 5362

Has mirado en la OST de piscinas en Lustre?

No será automática, sino que con la OST de las piscinas puede asignar directorios/archivos específicos OST/OSSes - básicamente basada en directivas de asignación de almacenamiento, en lugar de la predeterminada round-robin/de la fragmentación a través de los Ost.

Así que usted puede configurar un directorio por cada sitio y asignar a ese directorio para el local Ost de ese sitio, que va a dirigir todas las e/S locales Ost. Seguirá siendo un espacio de nombres global.

Hay un montón de trabajo en la mejora de Brillo a través de conexiones WAN (local, servidores de almacenamiento en caché y cosas por el estilo), pero esto aún está bajo un fuerte desarrollo AFAIK.

1voto

Kyle Brandt Puntos 50907

Tal vez NFS pero con Cachefs en los servidores de la aplicación va a cumplir su parte de su objetivo. Como yo lo entiendo todo lo escrito todavía el servidor central, pero al menos lee podría terminar siendo la memoria caché local. Esto podría tomar un montón de retardo de apagado de lecturas dependiendo de sus patrones de uso.

También, mabye UnionFS es que vale la pena considerar. Con esto creo que cada lugar sería una exportación de NFS, y entonces usted puede utilizar UnionFS en cada ubicación para tener ese y todos los demás montajes de NFS de la ubicación de aparecer como un sistema de archivos. No tengo experiencia con esto, sin embargo.

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X