8 votos

¿Qué hace que el almacenamiento en la nube (Amazon AWS, Microsoft Azure, google Apps) sea diferente de las redes de almacenamiento de los centros de datos tradicionales (SAN y NAS)?

Alguna confusión debido a mi pregunta, así que para hacerlo simple..:

"¿Qué tipo de almacenamiento utilizan los grandes proveedores de nubes y por qué?"

Por lo que yo entiendo, sin embargo no soy capaz de encontrar ningún tipo de diferencias oficiales de redes de almacenamiento entre los centros de datos típicos y las nubes, todos los proveedores de nubes están utilizando DAS diferente de los centros de datos típicos.

Incluso el DAS tiene muchas desventajas que el SAN o el NAS, quiero aprender los detalles de por qué las nubes usan el DAS ya sea para almacenamiento o para aplicaciones.

Cualquier recurso o descripción se apreciará para aclararme.

EDITAR: Al leer el documento "Networking Challenges and Resultant Approaches for Large Scale Cloud Construction,David Bernstein y Erik Ludvigson (Cisco)" mencionan que,

Curiosamente no vemos nubes de los principales proveedores que usan NAS o SAN. La típica arquitectura de la Nube utiliza DAS, lo cual no es típico de los enfoques de almacenamiento de los centros de datos.

Pero aquí hay un conflicto: en mi opinión y también declarado más adelante en el documento, las nubes deben usar SAN o NAS porque el DAS no es apropiado cuando una VM se mueve a otro servidor y aún así necesita acceder al almacenamiento del servidor original.

¿Qué otras razones tienen las nubes de efectos para preferir el DAS, NAS o SAN? ¿qué tipo de almacenamiento utilizan los proveedores de grandes nubes y por qué?

4voto

Zameer Manji Puntos 1213

Esta respuesta ha sido editada después de que se aclarara la pregunta.

¿Cuáles son las otras razones por las que los efectos de las nubes prefieren el DAS

Donde "DAS" significa Direct Attached Storage, es decir, unidades de disco duro SATA o SAS.

Todos los vendedores de nubes usan el DAS porque ofrece mejoras de orden de magnitud en precio/rendimiento. Es un caso de escalando horizontalmente .

En resumen, los discos duros SATA y los controladores SATA son productos baratos. Son productos de mercado masivo, y tienen un precio muy bajo. Construyendo un gran clúster de PCs baratos con discos SATA baratos, Google, Amazon y otros obtienen una gran capacidad a un precio muy bajo. Luego agregan su propia capa de software en la parte superior. Su software hace una replicación multi-servidor para el rendimiento y la fiabilidad, la supervisión, el reequilibrio de la replicación después de un fallo de hardware, y otras cosas.

Podrías echar un vistazo a MogileFS como un representante más simple del tipo de software que Google, Amazon y otros utilizan para el almacenamiento. Es una implementación diferente, por supuesto, pero comparte muchos de los mismos objetivos y soluciones de diseño que los sistemas a gran escala. Si quieres, aquí tienes un punto de partida para aprender más sobre GoogleFS .

declarado más tarde en el documento, las nubes deben utilizar SAN o NAS debido a DAS no es apropiado cuando una VM se mueve a otro servidor

Hay dos razones por las que no se usan las RAS.

1) Precio. Las RAS son enormemente caras a gran escala. Aunque pueden ser la "mejor" solución técnica, no suelen utilizarse en instalaciones de gran escala debido a su coste.

2) El teorema CAP El teorema CAP de Eric Brewer muestra que a muy gran escala no se puede mantener una fuerte consistencia mientras se mantiene una fiabilidad aceptable, tolerancia a los fallos y rendimiento. Las redes SAN son un intento de hacer una fuerte consistencia en el hardware. Eso puede funcionar bien para una instalación de 5.000 servidores, pero nunca se ha demostrado que funcione para los más de 250.000 servidores de Google.

Resultado: Hasta ahora, los proveedores de computación en nube han elegido empujar la complejidad de mantener el estado del servidor al desarrollador de aplicaciones. Las ofertas actuales de nubes no proporcionan un estado consistente para cada máquina virtual. Los servidores de aplicaciones (máquinas virtuales) pueden fallar y sus datos locales se pierden en cualquier momento.

Cada proveedor tiene su propia implementación de almacenamiento persistente, que se supone que debe utilizar para los datos importantes. Las ofertas de Amazon son buenos ejemplos; MySQL , SimpleDB y Servicio de almacenamiento simple . Estas ofertas en sí mismas reflejan el teorema CAP la instancia de MySQL tiene una fuerte consistencia, pero una limitada escalabilidad. SimpleDB y S3 escalan fantásticamente, pero sólo eventualmente son consistentes.

1voto

Ilari Kajaste Puntos 989

Si usted usar el DAS entonces la disponibilidad es su problema

Si ellos usan el DAS, entonces la disponibilidad es su problema. Y si son buenos, usarán varias capas de abstracción para asegurarse de que su problema no se convierta en el tuyo. En lugar de estar colgados en cómo eligen montar sus discos dentro de su centro de datos, el problema es si la disponibilidad que garantizan en su SLA es adecuada para sus necesidades. Oh, y el verdadero elefante en la habitación, qué hacer si se van a la quiebra (no es probable para algunos proveedores tal vez, pero usted todavía debe considerarlo) y qué hacer si utiliza estos datos localmente y su conexión interweb no está disponible - esta última es sustancialmente más probable que su elección de DAS que conduce directamente a una interrupción.

0voto

Embreau Puntos 613

Aunque no tengo la respuesta en DAS vs SAN/NAS... ...hay muchas cosas a considerar cuando se buscan soluciones de almacenamiento.

¿La cantidad de datos? Si estamos hablando de Gb, bien, un NAS con una copia de seguridad podría hacer el trabajo. Si hay terribles datos, el precio sube muy rápido.

Creo que el precio es el factor principal... si tienes una SAN, necesitas..:

  • Administradores para configurarlo/administrarlo.
  • Sala de servidores (Electricidad, ancho de banda, medidas de seguridad alrededor de esa sala, ...)

Y aún así, no tienes ninguna redundancia. Si tienes acceso a un centro de datos, las cosas pueden ser diferentes.

Otra cosa a considerar es la accesibilidad. ¿Estás archivando? Si es así, la accesibilidad no es un problema, un par de veces al día/semana/mes archiva en su solución de almacenamiento.

Si por otro lado tienes datos que necesitan ser accedidos constantemente, rápidamente encuentras un cuello de botella de ancho de banda, limitación de hardware (como E/S). Pero por otro lado si tienes una gran cantidad de transferencia con tus datos, hay buenas posibilidades de que una solución de almacenamiento en línea te cueste mucho.

El ROI (Retorno de la inversión) es lo que todos los proveedores de soluciones de almacenamiento en línea anuncian y a menudo tienen razón, dependiendo del uso, por supuesto.

Buena suerte.

0voto

tst Puntos 2290

(Opinión solamente, y generalizando enormemente.)

La diferencia es la capa de abstracción que estás mirando (en general).

SAN/NAS suelen proporcionarte un volumen, en el que puedes instalar un sistema de archivos. El valor de este acercamiento al sistema final es que has externalizado los detalles del hardware físico (por ejemplo, el nivel de RAID, la ubicación física, etc.).

Por el contrario, el almacenamiento en la nube suele proporcionarle una interfaz con un sistema de archivos. La ventaja en este caso es que a menudo se pueden obtener características de alto nivel de forma gratuita (por ejemplo, Dropbox hace el versionado automático de cada archivo, de forma transparente).

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: