Sei sulla pagina 1di 17

02/06/2009

BIOESTADISTICA I
Anlisis de Varianza (ANOVA)
Facultad de Veterinaria
2 de junio de 2009

9.

Comparando ms de dos medias. Anlisis de Varianza.

Objetivos:

9.1
9.2
9.3
9.4
9.5
9.6

Al finalizar esta unidad el estudiante ser capaz de:


Describir los elementos estadsticos de un diseo experimental.
Definir el objetivo de un anlisis de varianza.
Formular hiptesis adecuadas para las diferentes situaciones.
Describir la distribucin de F.
Construir la tabla de anlisis de varianza.
Calcular F e interpretar los resultados de la prueba de hiptesis.

Contenidos:
9.1
9.2
9.3
9.4

Elementos del diseo de experimentos.


Supuestos para la aplicacin del anlisis.
Anlisis de varianza simple.
Anlisis de varianza de dos vas.

02/06/2009

COMPONENTES DE UN
EXPERIMENTO

RESPUESTA
Es la variable de inters en un experimento. Es la Variable Dependiente

FACTOR
Son las variables de quienes se quiere ver su efecto en la respuesta.
Pueden ser Cualitativas o Cuantitativas. Son las Variables Independientes

NIVELES DE UN FACTOR
Son los valores del factor utilizados en el experimento

TRATAMIENTOS
Son las combinaciones de niveles de factores utilizados, cuyo efecto se mide
y compara con otros tratamientos

UNIDAD EXPERIMENTAL
Es el objeto sobre el cual se aplica el Tratamiento y se observa o mide la
Respuesta y los Factores.

Tipo de Estudios
EXPERIMENTO DISEADO
Es en el cual el investigador controla los
tratamientos y mtodos de asignar el
tratamiento a cada unidad experimental.

ESTUDIO OBSERVACIONAL
Es en el cual el investigador simplemente
observa los tratamientos y respuestas en las
unidades de observacin

02/06/2009

SITUACION BASICA

 Un factor ( tratamientos) Categrica


 Una variable de respuesta: Cuantitativa
 Pregunta principal: Las medias de cada grupo
difieren o estn afectadas por el tratamiento?
 Nmero de grupos: El caso particular de dos
grupos , utilizamos test de t
 Nmero de grupos: Cuando son ms de 2 grupos:
No realizar test de t de a dos, por el problema de
las comparaciones multiples.

COMPARACION DE MAS DE DOS MEDIAS


Cuando se comparan dos medias a nivel de significacin , la
probabilidad de cometer un error de tipo I es .
Cuando se comparan de a dos a medias tenemos
comparaciones posibles.

C2a

La probabilidad de obtener al menos un resultado significativo


si las pruebas son independientes ser 1- P(x=0) :
P(x=0)=(1-p)^n

P(x>0)=1-[(1-p)^n]

Entonces la probabilidad
de rechazar alguna H0 (cometer un
a
erro tipo I) = 1-[(1-) C2 ]
Para 5 grupos tenemos 10 comparaciones posibles
Para un = 0,05 :
P(x>0)=1-[(1-0,05)^10]= 0,40

02/06/2009

CORRECCION DE BONFERRONI :
Suele ser excesivamente severa
En el ejemplo:

'=

'= a
C
2

0.05
= 0,005
10

UNA SOLUCIN PARA ESTE PROBLEMA ES EL


ANALISIS DE LA VARIANZA

2
sentre
Fc = 2
sdentro

02/06/2009

ANOVA (ANalysis Of Variance)


Finalidad

Modelo I efectos fijos

Comparar simultneamente
varias medias

xBj

Bj

= + i + ij

xij

Variacin total

grupos

bioestadistica

xij

= (i ) +
i

(xij i )

) (

xij x = xi x + xij xi

En la poblacin

ij
En la muestra

Elevando al cuadrado:

(xij x )2 = (xi x )2 + (xij xi )2 + 2(xi x )(xij xi )


Sumando:

x ij x
ij
SC TOTAL

= (x i x ) + x ij x i
ij
ij
2

SC ENTRE
grupos

SC DENTRO de
grupos (residual)

02/06/2009

x ij x
ij
SC TOTAL

= (x i x ) + x ij x i
ij
ij

SC ENTRE

2
sentre

2
sdentro

o residual

grupos (residual)

2
( xij x )

Recordar

ij

a 1

SCdentro
=
gldentro

HIPOTESIS
Modelo I

2
( xij xi )

ij

na

En general

H 0 : i : i = 0

H 0 : i : i =

MEDIAS DE CUADRADOS

MC entre = SC entre/(a-1)

ESTIMA

a = no de grupos

ni =

SC DENTRO de

grupos

SCentre
=
=
glentre

Mod I

+ ni

2
i

(a 1)

tamao medio
del grupo

MC dentro = SC dentro/(n-a )
n = tamao de la muestra total

Si Ho es verdadera : MC entre = MC dentro en la poblacin

02/06/2009

TEST DE HIPOTESIS

Fcalc = MC entre/ MC dentro


se compara con Ftab (a-1) y (n-a) grados de libertad
Supuestos para la validez del test
Normalidad de
los residuos (ij)

Homocedasticidad
de los residuos

Independencia de las observaciones

02/06/2009

2
SC total = x ij2 T
n
ij

SC entre =

Ti2 T 2

n
n
i
i

SC dentro = SC total SC entre


Donde:

Ti = x ij
j

En el i-simo grupo

ni = Tamao del i-simo grupo

T = x ij

Gran total

ij

n=

Tamao total de la muestra

02/06/2009

02/06/2009

FUENTE DE
VARIACION

SUMA DE
CUADRADOS

GL

MEDIA DE
CUADRADOS

ENTRE
GRUPOS

SC entre

a-1

SC entre (a 1)

DENTRO DE
GRUPOS

SC dentro

n-a

SC dentro (n a)

TOTAL

SC total

n-1

Fcalc

MC entre
MC dentro

0.4

f (x )

El

Fcalculado se compara con

el Ftabulado con (a-1) y (n-a) GL

0.2

19

0.0
0.0

1.5

3.0

4.5

10

02/06/2009

CALCULO DE LAS SUMAS DE CUADRADOS


A

4.4

8.6

3.4

8.9

5.9

4.5

7.3

0.0

6.2

8.4

8.8

1.7

6.3

8.7

0.2

H 0 : i : i =
2
xij = 597.2
ij

n = ni = 16

0.1
Ti

22.8

30.2

19.8

10.6

T =83.4

ni

n = 16

16 = 162.4775

SC total = 597.2 83.4


SC entre =

a=4

22.8 2 30.2 2 19.8 2 10.6 2 83.4 2


+
+
+

= 39.1088
4
4
5
3
16

SC dentro = SC total SC entre = 162.4775 39.1088 = 123.3687

gl
denominador
(n-trat)

gl numerador (trat-1)

11

02/06/2009

FUENTE DE
VARIACION

SUMA DE
CUADRADOS

GL

MEDIA DE
CUADRADOS

Fcalc

ENTRE
GRUPOS

39.1088

13.036

1.27

DENTRO DE
GRUPOS

123.3687

12

10.281

TOTAL

162.4775

15
F0.95(3, 12)= 3.49

Fcalc < Ftab No Se rechaza H0

las medias no difieren significativamente

A
2.6
2.4
2.9
2.6
2.7
2.9
2.5
2.8
2.5
3

B
3.2
3
2.8
2.9
3.3
3.1
3
3.4
3.2
3.2

C
2.4
2.8
2.5
2.7
2.5
2.9
2.4
2.6
2.2
2.6

-> trat = A
|
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------|
10
2.69
.2024846
2.4
3
-> trat = B
|
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------|
10
3.11
.1852926
2.8
3.4
-> trat = C
|
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------|
10
2.56
.2065591
2.2
2.9

12

02/06/2009

gl numerador (trat-1)
gl
denominador
(n-trat)

Fcalculado

. oneway x y,b

Analysis of Variance
Source
SS
df
MS
F
Prob > F
-----------------------------------------------------------------------Between groups
1.65266668
2
.826333338
21.01
0.0000
Within groups
1.06200005
27
.039333335
-----------------------------------------------------------------------Total
2.71466672
29
.093609197
Bartlett's test for equal variances:

chi2(2) =

0.1124

Prob>chi2 = 0.945

Ganancia de Peso por Tratamiento


3.5

(30 Preoperative Patients)

ganancia de peso (kg)


2.5
3

Comparison of x by y (Bonferroni)
Row Mean-|
Col Mean |
A
B
---------+---------------------B |
.42
|
0.000
C |
-.13
-.55
|
0.463
0.000

F0.99(2, 27)= 5.49


A

p=0.000 p < Rechazo H0

13

02/06/2009

p=0.0287

p < Rechazo H0

Supuestos del ANOVA


Observaciones Independientes.
Distribucin Normal.
Varianzas Homogneas.

14

02/06/2009

Independencia de las Observaciones


Con el fin de obtener inferencias vlidas, resulta
importante determinar si los errores se encuentran
correlacionados.
El supuesto ms importante es la independencia de las
observaciones, pues si no hubo asignacin aleatoria de
tratamientos a unidades experimentales, entonces los
resultados pueden incluir un efecto persistente de factores
no considerados en el anlisis. Esto invalida el
experimento

Normalidad
Este supuesto no es el ms crtico, pues el
ANOVA es robusto. Esto quiere decir que,
aunque las observaciones no provengan de una
variable con DN, los resultados de la prueba de
hiptesis se afectan muy poco por este motivo.
Ante la falta de normalidad se puede optar por el
uso de transformaciones, o el uso de mtodos no
paramtricos.

15

02/06/2009

Homogeneidad de varianzas
Esta prueba resulta fundamental, pues cualquier situacin
de heterogeneidad de las varianzas invalida las inferencias
realizadas.
Pueden existir grupos muy homogneos y, en el caso de
existir un grupo muy heterogneo, sera posible no detectar
diferencias entre los grupos con varianzas homogneas por
el efecto de la contribucin a la varianza de ese grupo
heterogneo.
Cuando existe el problema de heterogeneidad de
varianzas, lo apropiado es emplear transformaciones o
mtodos no paramtricos.

Homogeneidad de varianzas (alternativa a Bartlett)

Si no existen diferencias significativas puedo considerar


que se cumple el supuesto de homocedasticidad.

16

02/06/2009

Anlisis de residuos
Homogeneidad de Varianzas
Bartlett

Normalidad
Kolmogorov-Smirnov

Autocorrelacin
Durbin-Watson

Es importante mencionar que el empleo de estadstica no


paramtrica o el uso de transformaciones no elimina el
problema de la falta de aleatoriedad (falta de
independencia), es decir, la ejecucin incorrecta de un
experimento no tiene un remedio en la etapa del anlisis.

17

Potrebbero piacerti anche