11 votos

Matemáticamente, cómo calcular un porcentaje de tiempo de actividad basado en un número de nodos y su respectivo porcentaje de tiempo de actividad?

Esta pregunta es más una pregunta de matemática de un servidor de pregunta, pero es fuertemente relacionados con el servidor.

Si tengo un servidor que yo sería capaz de garantizar que el 95% de tiempo de actividad y yo pondría server en un clúster de 2, ¿cuánto sería el tiempo de ser entonces? Ahora, digamos que yo hago lo mismo, pero voy a hacer un grupo de 3?

No vamos a considerar las cosas como único punto de fallo, pero se centran meramente en la matemática. Una de las cosas que hace que este un poco complicado es que si por ejemplo tengo 2 servidores, la probabilidad de que ambas sean de fuera es de 2^2, por lo que es 1/4th; o 3 que 2^3, por lo 1/8. Teniendo en cuenta que tengo un 5% de tiempo de inactividad para cada uno de estos servidores, el promedio total de la ser entonces que 1/8o de que el 5%?

¿Cómo calcular algo como esto?

11voto

katit Puntos 130

El tiempo de actividad es una cosa resbaladiza... Si se desea calcular la disponibilidad de un servicio , entonces es simplemente

amount of time service is available
-----------------------------------   x 100
  amount of time that has passed 

Si usted tiene un clúster de la prestación del servicio, entonces la probabilidad de que el servicio no está disponible hace hacia abajo, pero la disponibilidad (uptime) de cálculo para el servicio de estancias de la misma.

8voto

Phil Puntos 2153

La probabilidad de que un servidor está fuera de línea es (1 - 0.95) La probabilidad de que ambos servidores fuera de línea es (1 - 0.95) * (1 - 0.95) = 0.0025 etc...

Así que utilizar su modelo y desde una perspectiva puramente punto de vista matemático, uno o ambos de los servidores debe ser de hasta el 99,75% de las veces

Sin embargo, no estoy seguro de que la utilización de un modelo matemático es la forma correcta de trabajar fuera de su potencial de tiempo de actividad, ya que hay otros factores que pueden afectar la que son comunes a ambos servidores es decir, el 95% podría ser debido a que el 5% del tiempo hay un corte de energía whihc afectaría TANTO a los servidores por lo que tener un clúster haría ninguna diferencia

5voto

chris_2k Puntos 11

Esto depende del motivo por el que sus servidores están abajo del 5% del tiempo. Si usted tiene el poder el 95% del tiempo, pero los servidores son de otra manera impecable, a continuación, un segundo servidor en el mismo lugar no aumenta el tiempo de actividad en todo: si uno va hacia abajo, tanto para ir hacia abajo. Este es un ejemplo de los errores están correlacionados. Es probable que al menos parte de su tiempo de inactividad debido a los errores que afectan a todos los servidores, junto (...). Pero algunos de los tiempos de inactividad serán independientes entre servidores. Si quieres hacerlo correctamente, usted debe lidiar con estas cosas por separado. Así que quieres trabajar fuera de la probabilidad de que el servidor 1 no tiene un sistema independiente de error (p) y que el servidor 2 no tiene un sistema independiente de error (p) y que no hay ningún error sistémico que mata (r). Sería relativamente seguro asumir que estos errores son independientes, y por lo tanto sólo podría multiplicar juntos: pqr es la probabilidad de algún servidor.

El problema es que no se puede utilizar reales de tiempo de actividad datos para darte los valores de p,q y r, excepto que si usted acaba de servidor 1 y es hasta el 95% del tiempo, entonces p*r = 0.95.

5voto

ilkkachu Puntos 141

Primero de todo, la disponibilidad total o el tiempo de funcionamiento de un clúster depende de cómo gran parte del clúster que se necesita para ser activo para todo el clúster para ser considerado "arriba".

  • Es una máquina que funciona lo suficiente? Eso significaría que ninguna máquina puede tomar toda la carga si es necesario.
  • Hacer todo de ellos necesitan estar activos al mismo tiempo? Es decir, no hay redundancia.
  • O tal vez los dos, de tres en línea son suficientes? Esto permitiría una mayor carga de trabajo que en el primer caso.

Como se encontró, en los dos primeros casos son bastante simples de calcular. Deje que la probabilidad de un único servidor de estar en línea en cualquier momento dado p = 0.95. Ahora, para los tres servidores, la probabilidad de que todos ellos están en línea al mismo tiempo es p3 = 0.857375.

Para el caso opuesto, donde al menos una de las máquinas debe estar activo en un momento dado, es más fácil calcular invirtiendo el problema y buscando en las probabilidades de las máquinas sin conexión. La probabilidad de que una sola máquina está fuera de línea es q = 1-p = 0.05, y por lo tanto la probabilidad de que todos ellos están abajo, al mismo tiempo, es q3 = 0.000125, dando una probabilidad 1-q3 = 1-(1-p)3 = 0.999875 que al menos uno.

El 2 de 3 de caso es un poco más difícil de calcular. Hay cuatro posibles situaciones en las que al menos dos de los tres servidores. 1) ABC, 2) AB, 3) AC, 4) BC. Las probabilidades de todas éstas son, respectivamente, ppp, ppq, pqp y qpp. Ya que los casos son distintos, las probabilidades pueden ser añadidos juntos, dando un total A = p3 + 3 p2p = 0.992750.

(Esto puede ser ampliado a más máquinas. Los factores son bien conocidos los coeficientes binomiales, de modo de contar los casos diferentes a mano funciona principalmente como un ejercicio.)


Por supuesto, los cálculos de este tipo son mucho más fáciles de tratar mediante el uso de un programa de ordenador... Al menos una línea calculater se puede encontrar aquí:
http://stattrek.com/online-calculator/binomial.aspx

Introducir los valores de entrada: probabilidad de éxito = 0.95, el número de ensayos = 3, el número de éxitos = 2, se obtiene el resultado "Acumulativa de Probabilidad: P(X ≥ 2) = 0.99275". Algunos otros relacionados con los valores también son dadas, y la herramienta en línea hace que sea fácil de jugar con los otros números también.


Y sí, todo lo anterior supone que los servidores no de forma independiente, que es una) he ignorado los problemas que afectan al grupo como un todo, b) no hay nada como componente de envejecimiento que la probabilidad de que los servidores fallan en o casi en el mismo tiempo.

3voto

JEzell Puntos 351

He hecho un poco más de investigación y encontró esta pieza del rompecabezas.

Utilizando el ejemplo de un servidor con una disponibilidad del 95%, entonces la adición de un segundo servidor de aumentar la disponibilidad de: 95% + (1-95%)*95% = 99.75%. La lógica detrás de esto es que cuando el 1 servidor está abajo (5% del tiempo), el segundo servidor sigue hasta el 95% del tiempo.

La adición de un 3er servidor iterar a través de esta de la misma manera. Los primeros 2 juntos ya 99.75% availlable, así que la adición de la 3ª sería: 99.75% + (1-99.75%)*95% = 99.9875%. Y así sucesivamente y así sucesivamente. Esto es cerca de Phil respuesta, pero todavía un poco diferente, ya que se necesita para tomar el resultado de la iteración anterior y el uso que en la siguiente.

Para los componentes que dependen de la simpatia que simplemente multiplicar los porcentajes de disponibilidad, así que si usted tiene 2 componentes que son el 50% de disponibilidad de usted tiene 25% de la disponibilidad total (es decir, el sistema funciona sólo cuando los dos componentes de trabajo.)

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: