Sei sulla pagina 1di 17

Anlisis de Varianza ( ANOVA)

Trabajo realizado por:


Ing. Qumico Rafael H. Villarruel Mayoral
e-mail r_villarruel@hotmail.com
Jalisco Mxico
Otoo 2009

Anlisis de Varianza ( ANOVA)


Introduccin:
Esta poderosa tcnica determina cuanto de una variacin observada puede ser atribuida a
ciertos "Factores" cualitativos.
Anlisis de varianza es un mtodo de separar el efecto de Factores cualitativos, o clasificaciones
sobre alguna variable observada de inters.
Esta tcnica nos permite analizar si, dos o ms muestras pertenecen no a la misma poblacin.
Es una extensin de la prueba "t" y Utiliza la distribucin "F" (Fisher), para relacin de varianzas.
Normalmente tenemos la variable dependiente, la cual es numrica y una o varias variables
categricas independientes, llamadas Factores.
La varianza es aditiva, entonces si tenemos varios factores que pueden afectar nuestras
observaciones, podemos aislar el efecto de cada Factor. La varianza relativa a cada Factor es
una medida de su importancia.
En su aplicacin debemos usar tablas de la distribucin "F". (Ver anexos).
Grados de Libertad: es el nmero de datos que se deben de conocer para determinar el sistema.
Normalmente es n-1, dnde n es el nmero de datos considerados.

Anova Simple:
Sea:

c= nmero de columnas (Tratamientos)


f= nmero de filas
nc = nmero de datos por columna
N = nmero total de datos
xij = dato en la fila i y columna j.
Ti = suma de xij por columna.
C1
x11
x21
x31
x41
T1

xij

x
T

C2
x12
x22
x32
x42
T2

C3
x13
x23
x33
x43
T3

C4
x14
x24
x34
x44
T4

1.

F TN
c

2. Suma de Cuadrados:
2
T
i
CSS
F c Suma de cuadrados de Columnas.( Tambin llamado

suma de cuadrados entre tratamientos)


2
TSS
x F c Suma Total de cuadrados
ij

ESS = TSS-CSS
Suma de cuadrados del Error. (Suma de cuadrados
Dentro de tratamientos).

3. Grados de libertad:
Grados de Libertad Columnas Glcolumnas= ( c-|)
Grados de Libertad del Error Glerror= c(n-1)
Grados de Libertad Totales Gltotal= N-1
CSS
4. Cuadrados Medios: CMC
Cuadrado
(c 1)
Medio de Columnas
ESS
CME
Cuadrado Medio de Filas
c(n 1)
Tabla ANOVA
Fuente de Variacin Suma de Cuadrados Grados de Libertad Cuadrados Medios
Entre Columnas
CSS
c-1
CSS
CMC
(c 1)
Error
ESS
c(n-1)
ESS
CME
c(n 1)
Total
TSS
N-1
5. Clculo de F
CMS
F
CME
Se obtiene de Tablas (anexos) la F* para = 0.05 0.01 con Glnumerador=k-1 y
Gldenominador=k(n-1). Gl = Grados de Libertad.
si F<F* se concluye que hay diferencia significativa entre Tratamientos.
Ejemplo 1:
En una planta se tienen dos Reactores a los cuales se les mide el rendimiento en la
reaccin. Uno de ellos opera con las condiciones normales de operacin y al segundo se
le modific un parmetro de operacin con el objeto de mejorar su rendimiento.
El objetivo es analizar si este cambio en las condiciones de operacin surti el efecto
esperado.
La siguiente tabla muestra los resultados de varias corridas.
Corrida
1
2
3
4
5
6
7
8
9
10

nc=10

Reactor 1
90.87
90.83
91.71
91.71
90.92
90.83
92.79
92.67
91.79
91.51

xi1 T = 915.63

Reactor 2
92.16
92.17
93.40
92.80
92.27
92.62
92.42
92.60
92.75
92.66

xi2

T2= 925.85

Promedios: C1=91.5 C2= 92.5


Establecemos la hiptesis nula H0 = no hay diferencia entre columnas.
T= Ti =915.63+925.85= 1,841.48
2
2
1
,
841
.
48
T
1. F c
= 169,552.43
N
20

T2
F
n

2. CSS

915.63 925.85

10

169,552.43 =

838,378.30 857,198.22
169,552.43 =5.22
10
2
2
2
2
3. TSS
x ij F c = 90.87 90.83 91.71 ........ 169,552.43
TSS= 169,563.67-169,552.43=11.24
4. ESS= TSS-CSS=11.24-5.22= 6.02
Tabla ANOVA
Grados de Libertad Cuadrados Medios

Fuente de
Variacin
Entre
Columnas

Suma de
Cuadrados
CSS = 5.22

Error

ESS = 6.02

c(n-1)=2(10-1) =18

Total

TSS = 11.24

N-1= 20-1 = 19

c-1=2-1 = 1

CMC

CSS =5.22/2=2
(c 1)

F
F

CMS = 2.6/0.33 = 7.8


CME

.6
CME

ESS =
c(n 1)

6.02/18 = 0.33

Cuando la F0.95 calculada es mayor que la F* de tablas se concluye que hay diferencia
significativa entre las columnas.
"F* 0.05 " de tablas para, 95 % de nivel de significancia y Gl numerador = 1, y Gldenominador =
18
F*0.05= 4.14 con una Fcalculada=7.8 podemos concluir que si hay diferencia entre los
Reactores. Analizando los promedios podemos inferir que el reactor 2 tiene un
rendimiento mayor en aproximadamente 1%.

ANOVA dos Factores:


Sean:

f= nmero de Filas
c= nmero de Columnas
k= nmero de datos por Celda ( en este caso k=1)
N= nmero Total de observaciones
Ri = suma de x en la fila i = xi
Cj = suma de x en la columna j = xj
T= Gran Total = xij = Ri= Cj
r1
r2
r3
ri
Sumas xj

c1
x11
x21
X31
xi1
C1

c2
x12
x22
x32
xi2
C2

T= Ri= Cj= xij


N=c*f*k
1. Suma de Cuadrados:
2

F TN
c

c3
X13
X23
X33
xi3
C3

cj
XIJ
X2J
X3J
XIJ
Cj

Sumas xi
R1
R2
R3
Ri
T

CSS

2
j

Suma de cuadrados de Columnas

FSS
TSS

ESS

Suma de cuadrados de Filas

F
x F

ij

TSS CSS

Suma Total de cuadrados


FSS Suma de cuadrados del Error

2. Grados de Libertad.
Glcolumnas =c-1
Glfilas= f-1
Glerror = GlTotal - GlColumnas - GlFilas
GlTotal = N-1=(c*f)-1
3. Cuadrados Medios:
CMS

FMS
EMS

CSS
(c 1)

FSS
( f 1)
ESS

Gl Error
4. Clculo de F:
CMS
Columnas=
EMS
FMS
Filas=
EMS

Fuente de
Variacin
Columnas

Tabla ANOVA
Suma de Cuadrados Grados de
Cuadrados
Libertad
Medios
CSS
c-1
C
CMS
CSS
2
j

(c 1)

Filas
Error
Total

FSS

f-1

ESS TSS CSS FSS GlTotal -

GlColumnas GlFilas

TSS

x F
ij

FMS
EMS

FSS
( f 1)

CMS
EMS
FMS
EMS

ESS

Gl

Error

N-1

5. Prueba de Hiptesis:
H10= No hay diferencia entre columnas
H20= No hay diferencia entre filas.
Si F1F* y c-1, (c-1)(f-1) Grados de libertad se rechaza la Hiptesis nula, si hay
diferencia significativa entre Columnas al nivel de significancia determinado.
Si F2F* y c-1, GlError, Grados de libertad se rechaza la Hiptesis nula, si hay
diferencia significativa entre Filas al nivel de significancia determinado.

Ejemplo: 2
Se tienen 4 Plantas de Fabricacin de Alimentos para Mascotas, cada una de ellas tiene tres
Lneas de fabricacin para el mismo producto. En estas se determina el grado de rendimiento
que tienen. Se quiere saber si existe diferencia entre Plantas y Lneas de produccin.
La tabla adjunta contiene los resultados de estas.
Planta
1
2
3
4

Rendimiento
Lnea 1 Lnea 2
95
91
96
95
97
93
94
90

Lnea 3
90
90
91
91

N=
12
n=
4
f=
4
c=
3
Ri = x.j = 95+91+90 as para todas las filas
Ci= xi. = 95+96+97+94 igual para todas las columnas.
La tabla anterior queda de la siguiente forma:
Rendimiento
Lnea 1
Lnea 2
95
91
96
95
97
93
94
90

Planta
1
2
3
4
Cj=

382

369

Lnea 3

Ri
90
90
91
91

276
281
281
275

362

1,113

1. Suma de Cuadrados:
T= Ri= Cj= xij = 1,113
N=c*f*k = 4*3*1 = 12 ( k=1 porque no hay repeticin en las celdas)
Fc = (1,113)2/12 = 103,231
TSS = x2ij Fc
Tabla de cuadrados xij
Cuadrados xij
9,025
8,281
9,216
9,025
9,409
8,649
8,836
8,100
Suma=

8,100
8,100
8,281
8,281
103,303

TSS = 103,303 103,231 = 72


FSS
FSS

CSS=
CSS

C
f

Fc

2
j

Fc

= ((2762+2812+2812+2752)/3) - 103,231 = 10

= ((3822+3692+3622)/4) 103,231 = 51.5

ESS = TSS FSS CSS = 10.5

2. Grados de Libertad:
Plantas = f-1 = 3
Lneas = c-1 = 2
Error = T-f-c = (c-1)(f-1) = 6
Total = N-1= c*f-1= 11
3. Cuadrados Medios:
FMS = FSS / GlFilas = 10/3 = 3.42
CMS = CSS / GlColumnas= 51.5 / 2 = 25.75
CME = EMS / GlError = 10.5 / 6 = 1.75
4. Clculo de F:
FFilas = FMS / EMS = 3.42 / 1.75 = 1.95
FColumnas = CMS / EMS = 25.75 / 1.75 = 14.7
Tabla ANOVA

Fuente de
Variacin
Plantas
Lneas
Error
Total

Cuadro ANOVA
Suma de
Grados de Cuadrados
Cuadrados
Libertad
Medios
F
10.3
3
3.42
51.5
2
25.75
10.5
6
1.75
72.3
11

1.95
14.71

5. Prueba de Hiptesis:
De Tablas del anexo:
F*05,3 y 6 Gl= 4.76
F*05,2 y 6 Gl= 5.14
Como Fplantas es menor que F*0.5,3y6 Gl se acepta la hiptesis nula,
no hay diferencia entre plantas
Como FLneas es menor que F*0.5,3y6 Gl se rechaza la hiptesis nula,
si hay diferencia entre Lneas

Ejemplo 3:
El grado de conversin de un producto final es analizado por dos mtodos y en dos
partes diferentes por dos analistas, se quiere determinar si hay diferencia entre los
mtodos y entre los analistas.
La tabla adjunta resume el resultado del anlisis de varias muestras.
As como las sumas de Ri y Cj.

Muestra Analista Metodo


1
1
23.26
2
22.91
3
23.19
4
22.99
A
5
22.56
6
22.90
7
22.68
8
22.52
9
22.04
10
21.73
11
20.49
12
20.64
13
21.02
14
21.38
B
15
21.00
16
21.21
17
21.35
18
21.45
19
21.28
20
21.09
Cj
437.69

Mtodo
Ri
2
22.31 447.96
22.28
22.33
22.63
21.88
22.29
22.41
22.08
21.45
21.51
20.80 416.41
20.94
21.16
20.20
20.43
19.94
20.87
20.17
20.72
20.27
426.67 864.37

T= Ri= Cj= xij = 437.69+426.68=864.37


f= nmero de filas = 2
c= nmero de Columnas = 2
k= nmero de datos por Celda =10
N=c*f*k = 2*2*10= 40
1. Suma de Cuadrados:
2

F TN = 86440.37 =747,118.21/40 =18,677.96


2

CSS

fk

= 437.69

2
426.39 191,572.54 182,047.29 18,677.96 18,680.99 18,677.96
20
20

= 3.03
2

FSS

ck

= 447.96

18,702.82-18.677.96=24.86
TSS

x F
ij

18,678.39=33.33
ESS TSS CSS

2
416.41 18,678.39 200,659.20 173,397.29 18,677.96
20
20

=(23.26)2+(22.91)2.......(20.27)2-18,678.39=18,711.72FSS =33.33-24.86-3.03= 5.43

2. Grados de Libertad:
Glcolumnas=c-1= 2-1 = 1
Glfilas=f-1 = 2-1 = 1
GlTotal=N-1=(c*f*k)-1=2*2*10-1= 39
Glerror= GlTotal-GlColumnas-GlFilas = 39-1-1-= 37

3. Cuadrados Medios:
CSS = 3.03/(2-1) =3.03
CMS
(c 1)

FSS
= 24.86/(2-1) = 24.86
( f 1)
ESS
= 5.43/37 = 0.15

FMS

EMS

Gl

Error

4. Clculo de F:

CMS
=3.03/0.15 = 20.2
EMS
FMS
Filas=
= 24.86/0.15 = 166
EMS
Columnas=

Fuente de
Variacin
Columnas
Filas
Error
Total

Tabla ANOVA
Grados de
Libertad
2-1=1
2-1=1

Suma de
Cuadrados
3.03
24.86
5.43

39-1-1 =
37

33.33

Cuadrados
Medios
3.03
24.86
0.15

F
20.2
166

40-1=39

5. Prueba de Hiptesis:
H10= No hay diferencia entre columnas
H20= No hay diferencia entre filas.
F*Gl numerador= 1, Gl denominador =37 de Tablas a 95% de significancia, =0.05, F*= 4.1
Dado que Fc>F* se rechaza H10, si hay diferencia entre Mtodos.
Dado que Ff>F* se rechaza H20, si hay diferencia entre analistas.
Ejemplo 4:
Se tienen tres Reactores para la conversin de un material y se utiliza para la reaccin
tres tipos de catalizadores, alimentados a cada uno de los reactores.
Para efecto de la prueba se mantienen todas las condiciones de operacin constantes y
se toma la muestra a un determinado tiempo incluso si la reaccin no ha terminado, para
mantener el efecto del tiempo constante.
Se requiere determinar si hay diferencia entre Reactores y tipo de Catalizador.
La tabla adjunta muestra los resultados de una serie de corridas, As como las sumas de
Ri y Cj.
Tipo de
Catalizador
Cat US
Cat G
Cat UK
Cj

Reactor C

Reactor B

Reactor A

Ri

93.4
92.8
92.6
92.7
91.1
91.2
553.84

92.9
93.1
92.6
92.8
91.4
91.5
554.16

92.8
92.7
91.9
91.7
90.9
90.9
550.85

557.63

T= Ri= Cj= xij = 553.84+554.16+550.85=1,658.85


9

554.31
546.91
1,658.85

f= nmero de Filas = 3
c= nmero de Columnas = 3
k= nmero de Datos por Celda = 2
N=c*f*k=3*3*2=18
1. Suma de Cuadrados:
2

F TN

= (1,658.85)2/18 = 152,876.85

CSS

2
2

fk

152,876.85 =

553.84 554.16 550.85

1.11

FSS

TSS

ck

x F
ij

557.63 554.31 546.91


6

152 ,876 .85

=10.04

2
2
2
2
93.4
92.8 .........90.0
90.9 152,876.85 =

152,888.59-152,876.85= 11.74
ESS TSS CSS FSS =11.74-1.11-10.04=0.59
2. Grados de Libertad:
Glcolumnas = c-1= 3-1 = 2
Glfilas = f-1 = 3-1 = 2
GlTotal = N-1 = (c*f*k)-1 = (3*3*2)-1 = 17
Glerror = GlTotal - GlColumnas - GlFilas = 17-2-2 = 13
3. Cuadrados Medios:
CSS = 1.11/2 =0.56
CMS
(c 1)

FMS

EMS

FSS
= 10.04/2 = 5.02
( f 1)
ESS
= 0.59/13 = 0.045

Gl

Error

4. Clculo de F:
CMS
Columnas=
=0.56/0.045 = 12.44
EMS
FMS
Filas=
= 5.02/0.045 = 111.55
EMS
Tabla ANOVA
Fuente de
Suma de
Grados de
Cuadrados
F
Variacin
Cuadrados
Libertad
Medios
Reactor
1.11
3-1=2
0.56
12.44
Catalizador
10.04
3-1=2
5.02
111.55
17-2-2 = 13
Error
0.59
0.045
Total
11.74
18-1=17
6. Prueba de Hiptesis:
H10= No hay diferencia entre columnas
H20= No hay diferencia entre filas.
F*Gl numerador= 2, Gl denominador =13 de Tablas a 95% de significancia, =0.05, F*= 3.8
Dado que FReactores>F* se rechaza H10, si hay diferencia entre Reactores.
Dado que FCatalizadores>F* se rechaza H20, si hay diferencia entre Catalizadores.

10

Anova dos Factores con Repeticin


Cuando se requiere conocer con ms precisin la varianza del error, se obtienen mas
muestras por celda, de esta manera eliminamos de la varianza no explicada aquella
proveniente de las mediciones, quedando solo la varianza no explicada.
Es decir si :
S2T=s2c+s2f+s2E sin considerar interacciones y
s2T= s2c+s2f+s2in+s2E considerando estas, es evidente que el ruido de las
interacciones es extrado de la varianza del Error, quedando esta solo con lo no
explicado.
Sean.
f= nmero de Filas
c= nmero de columnas
k= nmero de determinaciones por Celda
N= nmero Total de observaciones
Ri= suma de valores por fila
Cj= suma de valores por Columna
T= gran Total= Ri = Ci = Sxij
1. Suma de cuadrados:
Fc= T

FSS

CSS

kc

C
kf

suma de cuadrados de Filas

2
j

suma de cuadrados de columnas

FSS CSS F c suma de cuadrados de la interaccin


k
dnde xijk= es la suma de los valores por celda
2
TSS
xij F c suma Total de cuadrados
ISS

ijk

ESS= TSS-FSS-CSS-ISS suma de cuadrados del error


2. Grados de Libertad:
Glcolumnas=c-1
Glfilas=f-1
Glinteraccin= (f-1)(c-1)
Glerror= fc(k-1)
GlTotal=N-1= kfc-1
3. Cuadrados medios:
FMS

CMS

IMS

FSS
Cuadrados medios de filas
( f 1)

CSS
Cuadrados medios de columnas
(c 1)
ISS
Cuadrados medios de la interaccin
( f 1)( c 1)

11

EMS

ESS
Cuadrados medios del Error
f * c(k 1)

4. Clculo de F:
FMS
Ffilas=
EMS
CMS
Fcolumnas=
EMS
IMS
Finteraccin=
EMS
Tabla ANOVA
Suma de Cuadrados
Grados
de
Libertad

Fuente de
Variacin
Columnas

Filas

CSS

FSS

Interaccin

Total

2
j

kf

R
kc

f-1

FMS

ijk

FSS CSS

(f-1)(c-1)

IMS

fc(k-1)
fck-1

EMS

ESS= TSS-FSS-CSS-ISS
2

x F

TSS

c-1

CMS

ISS
Error

Cuadrados Medios

ij

CSS
(c 1)

2
3
4
5
6
7
Cj

A
96.9
96.8
95.1
94.6
97.3
96.9
97.4
97.8
97.4
97.0
97.8
98.1
98.0
98.1
1,359.2

FMS
EMS

ISS
( f 1)( c 1)

IMS
EMS

ESS
fc (k 1)

B
95.8
95.8
95.5
96.0
96.5
96.5
96.4
96.2
95.6
93.4
95.5
94.9
96.3
95.9
1,340.3

12

C
95.6
95.0
96.8
97.0
95.6
96.1
93.9
94.0
95.0
95.2
94.5
94.1
96.0
96.9
1,335.7

Ri
575.9
575.0
578.9
575.7
573.6
574.9
581.2
4,035.2

CMS
EMS

FSS
( f 1)

Ejemplo 5:
Se efectan anlisis de Color por tres diferentes laboratorios (A,B,C), tomando 7
muestras duplicadas. Efectuar ANOVA dos factores con repeticin.
La tabla anexa muestra los resultados. Se incluyen las sumas de filas y columnas.
Muestra
1

c=3
f=7
k=2
N= 42
T= gran Total= Ri = Ci = Sxij = 4,035.2
1. Suma de cuadrados:
Fc= T

FSS

=(4,035)2/42= 387,686.64

kc

331,660.8

(575.9)

(575)

2
(578.9)

( 575.7 )

(573.6)

2
(574.9)

2
(581.2)

387, 686.64

3*2

330,625.0

335,125.2

331,430.5

329,017.0

330,510.0

337,793.4

387,686.64

FSS=( 2,326,161.92 /6)-387,686.64 = 387,693.65-387,686.64= 7.01

CSS
CSS

2
j

kf

F c = (1,359.2)

1,847,424.6

(1,340.3)

(1,335.7 )

2
387,686.64

2*7

1,796,404.1
2*7

1,784,094.5

387,686.64 =

(5,427,923.2/14 )-387,686.64= 387,708.80-387,686.64= 22.16


ISS

ijk

FSS CSS

2
(96 .9 96 .8)

2
(95 .1 94 .6)
2

....... (96 .0 96 .9)

2
7.01 22 .16 387 ,686 .64

= 387,742.46-7.01-22.16-387,686.64 = 26.65
TSS

x F
ij

2
2
2
2
96.9 96.8 .......96.0 96.9 387,686.64

TSS= 387,746.54-387,686.64= 59.90


ESS= TSS-FSS-CSS-ISS =59.9-26.65-22.16-7.01= 4.08
2. Grados de Libertad:
Glcolumnas=c-1= 3-1 = 2
Glfilas=f-1= 7-1 = 6
Glinteraccin= (f-1)(c-1) = (7-1)(3-1)=12
Glerror= fc(k-1) = 7*3(2-1) = 21
GlTotal=N-1= kfc-1 = 2*7*3-1=42-1= 41
3. Cuadrados medios:
FMS

FSS
( f 1)

7.01
= 1.17
6

CMS

CSS
(c 1)

22 .16
= 11.08
2

13

ISS
26 .65
= 2.22
( f 1)( c 1)
12
ESS
4.08
EMS
= 0.19
f * c(k 1)
21
IMS

4. Clculo de F:
FMS 1.17
Ffilas=
= 6.16
EMS 0.19
CMS 11.08
Fcolumnas=
= 58.3
EMS 0.19
IMS 2.22
Finteraccin=
= 11.7
EMS 0.19
Fuente de
Variacin
Laboratorio
Muestras
Interaccin
Error
Total

Tabla ANOVA
Suma de Cuadrados
Grados de
Libertad
22.16
2
7.01
6
26.65
12
4.08
21
59.90
41

Cuadrados Medios

11.08
1.17
2.22
0.19

58.3
6.16
11.7

5. Prueba de Hiptesis:
H01 = No hay diferencia entre Laboratorios
H02 = No hay diferencia entre Muestras
H03 = No hay Interaccin
6. De tablas
F1 =0.05 y Gl= 2, 21 F* = 3.467
F2 =0.05 y Gl =6, 21 F* = 2.599
F3 =0.05 y Gl = 12, 21 F* = 2.25
Dado que las Fs calculadas son mayores que las F*s crticas, se rechazan las
Hiptesis nulas. Es decir que si hay diferencia significativa entre Laboratorios y
entre muestras y tambin que la interaccin es estadsticamente significativa.
Manejo de Tablas para la Distribucin "F":
Estas tablas vienen para diferente grado de significancia = 0.05 y/o 0.01
Est dividida en filas y columnas, en la parte superior de las columnas estn los grados de
libertad del numerador (siempre en el numerador va la MS mayor) y en las filas los grados de
libertad del denominador.
Colquese en los grados de libertad del numerador y baje verticalmente hasta encontrar los
grados de libertad el denominador y el valor encontrado es el valor de "F".
En el anexo se encuentran algunas tablas para tal efecto.

14

15

16

Bibliografa:
Estadstica Murray R. Spiegel Shaum series, Mc Graw Hill
Probabilidad y Estadstica Murray R. Spiegel Shaum series
CE Tutorial Chemical Engineering 1985
Manual del Ing Qumico Perry
SPSS Tutorial ver 12

17

Potrebbero piacerti anche