Sei sulla pagina 1di 19

Calculadora de disponibilidad implementada en una hoja de calculo

Esta hoja de calculo intenta ayudar en los calculos de disponibilidad para topologias de servidores distribuidos. Debe usarse e The spreadsheet should be used as a "worksheet" based around the "Overall Chain" calculation on sheet 2. The other sheets perform individual calculations, the results of which can be entered in the "Overall Chain" calculation.

Sheet 3, "Clusters", allows the overall availability of a cluster of servers to be calculated. This allows the cluster to be treated a overall chain.

Sheet 4, "Stacks", allows the availability of a single node to be calculated from the individual availabilities of each element of th hardware, software etc.). The results from these calculations can be used in either cluster or overall chain calculations.

Sheet 5, "Capacity & Availability", provides several utility calculations - e.g. how to calculate availability from mean time betwee capacity relates to availability. The results from these calculations can be used in calculations for Stacks, Clusters and / or the

istribuidos. Debe usarse en conjunto con el paper

sheet 2. The other sheets should be used repeatedly to .

the cluster to be treated as a single element in the

lities of each element of the stack on that node (e.g. chain calculations.

ity from mean time between failures, and how redundant cks, Clusters and / or the Overall Chain.

Calculos para la cadena global de la topologia

Esta hoja debe se usada para calcular las dispobilidad global de la topologia, debe ser usada cuando la disponibilidad para cu cluster en la topologia ha sido calculado, asi los cluster pueden ser tratados como componentes individuales

La hoja contiene 5 renglones de 10 elementos, Capturar la descripcion y disponibilidad de componetes en tantas celdas como requiera y deje el resto en blanco Esta hoja debe ser usada de acuerdo a la guia en ____ del paper Disponibilidad global Cadena de elementos Descripcion Contribuciones de disponibilidad Continuacion cadena de elementos Descripcion Contribuciones de disponibilidad Continuacion cadena de elementos Descripcion Contribuciones de disponibilidad Continuacion cadena de elementos Descripcion Contribuciones de disponibilidad Continuacion cadena de elementos Descripcion Contribuciones de disponibilidad 99.6502416038% 1 2 3

ISP Centro de datos Red 99.9990000000% 99.9998120000% 99.8610000000% 11 12 13

21

22

23

31

32

33

41

42

43

ser usada cuando la disponibilidad para cualquier omponentes individuales

ad de componetes en tantas celdas como se

5 6 Cluster del servidor de Bases de datos Cluster HTTP Aplicaciones (Backend) 99.9090000000% 99.9090000000% 99.9720000000% 14 15 16

17

18

19

24

25

26

27

28

29

34

35

36

37

38

39

44

45

46

47

48

49

10

20

30

40

50

Calculadora de Disponibilidad de Clusters


Esta hoja de calculo calcula la disponibilidad global de un cluster de nodos La disponibilidad es definida como el porcentaje de tiempo que la capacidad requerida es disponible asi se contabiliza tomando la redundacia disponible en el cluster cuando el cluster completo es disponible. Vase la hoja 5, Capacidad y Disponibilidad para calculos adicionales en esta area. Esta hoja debe ser usada de acuerdo a la guia del paper Capturar los datos base aqui: Tamao del cluster Numero de servidores que pueden fallar y que se considere que el cluster es disponible Tiempo medio para fallas en un solo nodo (dias) Tiempo medio para recuperacion de un solo nodo (horas) Disponibilidad Calculada de un solo nodo Disponibilidad calculada de reemplazo de un solo nodo % (Dejar en blanco para aceptar la cifra anterior en rojo) Disponibilidad Normalizada de un solo nodo en uso Resultados Disponibilidad del Cluster Capacidad redundante en operaciiones normales Notes de los calculos: 1. Availability = 1-((mean time to recover)/(mean time to failure + mean time to recover)). 2. Note that if the cluster depends on, e.g., physical data recovery, then the overall availability is (data centre availability) * (cluster availability). 3. This formula also applies to individual components on a node, e.g. overall node availability = (application availability) * (OS availability) * (HW availability). 4. The formula also applies to linear chains, e.g. overall availability = (ISP availability)*(data centre availability)*(HTTP cluster availability)*(application availability)*backend/database availabililty). 5. So, the overall availability should always be calculable from a nested combination of simple chains and clusters. 6. This spreadsheet is protected, apart from the entry data cells, to prevent losing the calucations. To remove protection, select "Tools" - "Protection" - "Unlock Sheet" and enter the password "availability". 7. If you really want to know how this works a. Take a cluster of 10 servers, of which servers 1-9 are available and 10 is unavailable. The probability of this specific configuration is (probability of an individual server being available)^9*(probability of an individual server being unavailable).

5 1 1095 (e.g. 1095 dias o 3 aos para UNIX) 24.0000 (e.g. 24 horas o 1 dia para UNIX) 99.908759%

0.99908759

#VALUE! 20%

b. ^ above means "raise to the power of". c. probability is the same as availability, except availabilities are usually expressed in percentages rather than values from 0 to 1. d. (probability of an individual server being unavailable) = 1 - (probability of an individual server being available). e. However: servers 1-9 being available and server 10 being unavailable is not the only way 1 server out of 10 can be unavailable - there are 9 other ways (i.e. servers 1 to 9). f. Now ask: how many ways are there of 2 servers out of 10 being unavailable? Or x servers out of y being unavailable? g. The probability of a specific x servers out of y being unavailable is (probability of an individual server being available)^(y-x)*(probability of an individual server being unavailable)^x. h. Maths gives us the answer: the number of ways is y!/((y-x)!*y!). i. Where y! = "y factorial" = 1*2*3* *y. j. The total probability of x servers then being unavailable is (answer to g)*(answer to h) I.e. the probability of any one of the combinations happening, multiplied by the number of combinations. k. Now, we have the probabilities of 1,2,3, or x servers out of y being unavailable. So, in terms of the cluster, all we need to do is find out what "available" means. l. Assuming we can afford 3 out of 10 servers to be unavailable. Then, the probability the cluster is unavailable is the sum of the probabilities of 4,5,6,7,8,9 or 10 servers being available. Anything else is available. m. So, there's your answer. n. Alternatively, go buy a maths book and enjoy. Honest ;-)

Calculos de la disponibilidad por Stack


Esta hoja provee calculos para determinar la disponibilidad de un nodo basado en su STACK de software y/o hardware Esta hoja debe ser usada de acuerdo a la guia del paper Las Tablas proveen para calcular la disponibilidad de hasta 10 stacks. La disponibilidad de cada stack puede se usada como entrada a los calculos de la disponiblidad del cluster o el calculo de la disponibilidad global de la cadena o ambas Se considera que los datos del tiempo medio para falla y el tiempo medio para recuperacion podrian ser usados para describir la disponibilidad. Para contrarrestarla, capturar una cifra de disponibilidad en el renglon reemplazo abajo del renglon disponibilidad calculada Para componentespara los cuales la disponibilidad no es conocida, refirase al paper Stack 1 <Introduce etiqueta aqui, e.g. Servidor de Aplicaciones> Elemento 1 2 3 4 5 servidor Descripcion Tomcat 7 Linux Tiempo medio para falla (dias) 1095 30 Tiempo medio para recuperacion (horas) 24 0.1 Contribuciones Disponibilidad Calculada 99.9088% 99.9861% 100.0000% 100.0000% 100.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default). Contribuciones de disponibilidad Normalizada en uso 0.999088 0.999861 1.000000 1.000000 1.000000 Disponibilidad Stack 1 99.8949%

Stack 2 <Introduce etiqueta aqui, e.g. Servidor de Aplicaciones> Elemento 1 2 3 4 5 Descripcion Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas) Contribuciones Disponibilidad Calculada 100.0000% 100.0000% 100.0000% 100.0000% 100.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default). Contribuciones de disponibilidad Normalizada en uso 1.000000 1.000000 1.000000 1.000000 1.000000 Disponibilidad Stack 2 100.0000%

Stack 3 <Introduce etiqueta aqui, e.g. Servidor de Aplicaciones>

Elemento 1 Descripcion Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas) Contribuciones Disponibilidad Calculada 100.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default). Contribuciones de disponibilidad 1.000000 Normalizada en uso Disponibilidad Stack 3 100.0000%

100.0000% 100.0000% 100.0000% 100.0000%

1.000000

1.000000

1.000000

1.000000

Stack 4 <Introduce etiqueta aqui, e.g. Servidor de Aplicaciones> Elemento 1 2 3 4 5 Descripcion Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas) Contribuciones Disponibilidad Calculada 100.0000% 100.0000% 100.0000% 100.0000% 100.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default). Contribuciones de disponibilidad Normalizada en uso 1.000000 1.000000 1.000000 1.000000 1.000000 Disponibilidad Stack 4 100.0000%

Stack 5 <Introduce etiqueta aqui, e.g. Servidor de Aplicaciones> Elemento 1 2 3 4 5 Descripcion Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas) Contribuciones Disponibilidad Calculada 100.0000% 100.0000% 100.0000% 100.0000% 100.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default). Contribuciones de disponibilidad 1.000000 1.000000 1.000000 1.000000 1.000000 Normalizada en uso Disponibilidad Stack 5 100.0000%

Stack 6 <Introduce etiqueta aqui, e.g. Servidor de Aplicaciones> Elemento 1 Descripcion

Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas) Contribuciones Disponibilidad Calculada 100.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default). Contribuciones de disponibilidad Normalizada en uso 1.000000 Disponibilidad Stack 6 100.0000%

100.0000% 100.0000% 100.0000% 100.0000%

1.000000

1.000000

1.000000

1.000000

Stack 7 <Introduce etiqueta aqui, e.g. Servidor de Aplicaciones> Elemento 1 2 3 4 5 Descripcion Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas) Contribuciones Disponibilidad Calculada 100.0000% 100.0000% 100.0000% 100.0000% 100.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default). Contribuciones de disponibilidad Normalizada en uso 1.000000 1.000000 1.000000 1.000000 1.000000 Disponibilidad Stack 7 100.0000%

Stack 8 <Introduce etiqueta aqui, e.g. Servidor de Aplicaciones> Elemento 1 2 3 4 5 Descripcion Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas) Contribuciones Disponibilidad Calculada 100.0000% 100.0000% 100.0000% 100.0000% 100.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default). Contribuciones de disponibilidad Normalizada en uso 1.000000 1.000000 1.000000 1.000000 1.000000 Disponibilidad Stack 8 100.0000%

Stack 9 <Introduce etiqueta aqui, e.g. Servidor de Aplicaciones> Elemento 1 Descripcion Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas)

Contribuciones Disponibilidad Calculada 100.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default). Contribuciones de disponibilidad Normalizada en uso 1.000000 Disponibilidad Stack 9 100.0000%

100.0000% 100.0000% 100.0000% 100.0000%

1.000000

1.000000

1.000000

1.000000

Stack 10 <Introduce etiqueta aqui, e.g. Servidor de Aplicaciones> Elemento 1 2 3 4 5 Descripcion Tiempo medio para falla (dias) Tiempo medio para recuperacion (horas) Contribuciones Disponibilidad Calculada 100.0000% 100.0000% 100.0000% 100.0000% 100.0000% Contribuciones de contrarestar la Disponibilidad (dejar en blanco para aceptar default). Contribuciones de disponibilidad 1.000000 1.000000 1.000000 1.000000 1.000000 Normalizada en uso Disponibilidad Stack 10 100.0000%

e software y/o hardware

a stack puede se usada al de la cadena o ambas

drian ser usados para n reemplazo abajo del

10

100.0000% 100.0000% 100.0000%

100.0000%

100.0000%

1.000000

1.000000

1.000000

1.000000

1.000000

10

100.0000% 100.0000% 100.0000%

100.0000%

100.0000%

1.000000

1.000000

1.000000

1.000000

1.000000

10

100.0000% 100.0000% 100.0000%

100.0000%

100.0000%

1.000000

1.000000

1.000000

1.000000

1.000000

10

100.0000% 100.0000% 100.0000%

100.0000%

100.0000%

1.000000

1.000000

1.000000

1.000000

1.000000

10

100.0000% 100.0000% 100.0000%

100.0000%

100.0000%

1.000000

1.000000

1.000000

1.000000

1.000000

10

100.0000% 100.0000% 100.0000%

100.0000%

100.0000%

1.000000

1.000000

1.000000

1.000000

1.000000

10

100.0000% 100.0000% 100.0000%

100.0000%

100.0000%

1.000000

1.000000

1.000000

1.000000

1.000000

10

100.0000% 100.0000% 100.0000%

100.0000%

100.0000%

1.000000

1.000000

1.000000

1.000000

1.000000

10

100.0000% 100.0000% 100.0000%

100.0000%

100.0000%

1.000000

1.000000

1.000000

1.000000

1.000000

10

100.0000% 100.0000% 100.0000%

100.0000%

100.0000%

1.000000

1.000000

1.000000

1.000000

1.000000

Clculos de Capacidad y Disponibilidad


Esta hoja contiene clculos para capacidad bsica y disponibilidad. Los clculos son usados para proveer datos a cualquiera Esta hoja debe ser usada de acuerdo a la guia en <SECTION> del documento <LINK>. Clculos del tiempo promedio de falla

Se calcula la disponibilidad basada en el tiempo promedio de falla (i.e.EL tiempo promedio entre el fin de una falla y el empie recuperarse de ella.

Tiempo Promedio para Falla (dias) Tiempo Promedio de recuperacion (horas) Disponibilidad Calculos de Capacidad y Disponibilidad para clusters Variante 1

3650 10 aos 24.0000 1 dia 99.972610%

Considerando que se quiere una capacidad normal de x. Que porcentaje de x esta preparado para invertir en redundancia de

Se introduce el tamao del cluster y nmero de servidores que se permiten fallar en "la hoja del Cluster" para determinar la d Redundancia de capacidad deseada como un porcentaje del nmero de servidores requeridos para capacidad normal (%) Number of servers required for normal capacity Numero total de servidores requeridos para soportar la disponibilidad Numero de servidores que pueden fallan mientras se mantiene la disponibilidad Actual redundant capacity as percentage of number of servers required for normal capacity Capacidad redundante como porcentaje del numero total de servidores requeridos para soportar la dispoibilidad

25 10 13 3 30.00%

23.08%

La siguiente tabla ilustra como las cifras anteriores evolucionan a medida que el tamao de del cluster se incrementa (limitado

Numero de servidores requeridos para capacidad normal 1 2 3 4 5 6 7 8 9 10 Variante 2

Numero total de servidores requeridos para soportar disponibilidad 2 3 4 5 7 8 9 10 12 13

Numero de servidores que pueden fallar mientras se mantiene la disponibilidad 1 1 1 1 2 2 2 2 3 3

Asumiendo que tiene definido el tamao del cluster y permite x servidores fallen, Cul es el porcentaje de capacidad disponi

Servidores permitodos para que fallen Tamao del cluster Capacidad disponible como fraccin del total desplegado cuando se permite que un numero de servidores falle Normal operating capacity that is effectively redundant

3 7

57.14% 42.86%

La siguiente tabla ilustra como las cifras anteriores evolucionan de acuerdo al incremento del tamao del cluster (limitado a ci Capacidad disponible cuando Capacidad de operacin se permite que un numero de normal que es efectivamente servidores falle redundante 1 n/a n/a 2 n/a n/a 3 n/a n/a 4 25.00% 75.00% 5 40.00% 60.00% 6 50.00% 50.00% 7 57.14% 42.86% 8 62.50% 37.50% 9 66.67% 33.33% 10 70.00% 30.00%

Tamao del cluster

dos para proveer datos a cualquiera de las otras hojas.

edio entre el fin de una falla y el empiezo de otra falla), y el tiempo promedio para

arado para invertir en redundancia de la capacidad para soportar la disponibilidad?

hoja del Cluster" para determinar la disponibilidad global

de del cluster se incrementa (limitado para cifras apropiadas a tamao de cluster de 10 o menos):

Capacidad redundante Capacidad redundante actual como porcentaje como porcentaje del del numero de servidores numero total de servidores requeridos para capacidad requeridos para soportar la normal disponibilidad 100.00% 50.00% 50.00% 33.33% 33.33% 25.00% 25.00% 20.00% 40.00% 28.57% 33.33% 25.00% 28.57% 22.22% 25.00% 20.00% 33.33% 25.00% 30.00% 23.08%

es el porcentaje de capacidad disponible cuando x servidores fallan?

o del tamao del cluster (limitado a cifras apropiadas para tamao de cluster de 10 o menos):

Potrebbero piacerti anche