Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
(ANOVA simple)
PROBLEMA 1: Dada una variable cuantitativa continua Y, y una
variable cualitativa F, determínese si entre ambas hay relación, o no.
Y Medias en
cada nivel
de factor
µ2
µ1
µ3
F
1 2 3
Niveles de factor
Y: variable respuesta (numérica)
F: factor (cualitativa)
Si el valor de F no guarda relación con el de Y… ¿Cómo deberían ser
µ1, µ2, µ3?
Media global
µ2
µ
µ1
µ3
F
1 2 3
H0: µ1= µ2= µ3
H1: alguna µi es distinta
µ2
µ
µ1
µ3
F
1 2 3
Yik: el primer subíndice (i) indica el valor del nivel del factor; el
segundo (k), el orden que ocupa el dato dentro de los perte-
necientes a ese nivel del factor.
TABLA DE ANOVA:
Entre-
i
y y 2
I-1 se2 VE / I 1 sˆe2 / sˆR2
grupos(VE) i, j
Intra-gruposó
y ij yi
2
N-I sR2 VNE / N I
residual ó no i, j
explicada
(VNE)
y ij y
2
Total (VT)
N-1
i, j
Análisis de la Varianza
------------------------------------------------------------------------
Fuente Sumas de cuad. Gl Cuadrado Medio Cociente-F P
------------------------------------------------------------------------
Entre grupos 1,05061E9 3 3,50202E8 1,21 0
Intra grupos 2,69068E10 93 2,8932E8
------------------------------------------------------------------------
Total (Corr.) 2,79574E10 96
SCE
100 VARIABILID AD EXPLICADA
SCT
H0: µ1= µ2= … = µn
H1: alguna µi es distinta ?
Statgraphics
Resumen:
y y
Variabilidad total I ni
2
ij
(VT ó SCT) i 1 j 1
y ij yi
ni
Variab. Residual I
2
I ni
Variab. Explicada
i
2
y y
(VE ó SCE) i 1 j 1
Error experimental
¿Qué hacer si alguna hipótesis falla?
Statgraphics
3. Contraste de Kruskal-Wallis
- Método no-paramétrico
xa xb xc ...
• Calcular valor de F (de Fisher).
• Distribución de F tiene sesgo
cuando se acepta hipótesis nula.
Que hace el ANOVA?
En su forma más simple ANOVA:
H0: Los promedios de todos los grupos son
iguales.
.
Ejemplos de utilización de ANOVA en odontología
f = 6, k = 5, N = 30
5 trat para infección herpética (valores indican días de
duración de las lesiones)
X 45 30 26 31 37
5 trat para infección herpética (valores indican días de
duración de las lesiones)
2
X
(P) (2) (3) (4) (5)
25 16 36 49 81
64 36 16 16 9
49 36 16 36 25
49 9 25 36 49
100 25 16 9 49
X 64 36 9 25 36
X
2
351 158 118 171 249
Suma total de cuadrados
TSS X
2X
2 Factor
de corrección (CF):
n (x)2/n
TSS = 94,97
Suma total de los cuadrados
X
2
SSW X
2 k
n
f
SSW = 1047 – ( 452/6 +302/6 +262/6 +312/6 + 372/6 )
= 1047 – 988,51
SSW = 58,49
SUMA DE CUADRADOS ENTRE LOS GRUPOS
Between sum of squares
Xk 2
SS B CF
n
f
SSB = ( 452/6 +302/6 +262/6 +312/6 + 372/6 ) – 952,03
SSB = 988,51 – 952,03
SSB = 36,48
Cuadrados medios
• Cada suma de cuadrados se convierte en una
varianza estimada (Cuadrados Medios)
dividiendo por sus grados de libertad.
• GL entre los grupos: k – 1
• Dentro de los grupos: (n1 – 1 + n2 – 1 + n3 – 1)
De la hipótesis nula:
Fuente de SC gl MS F
Variación
Total 94,97 29
0,05>P>0,01
Valores de F críticos según tabla
Valor de F obtenido = 3,897
4; 25
F
0 , 05 = 2,75
4; 25
F 0, 025
= 3,35
4; 25
F 0 , 01
= 4,18
Total = n – 1; 30 - 1 = 29
VALOR DE F
Si F es un número grande,
2
S between la variabilidad entre las
F 2 medias de las muestras
S within es mayor que la
esperada a la
variabilidad dentro de
las muestras, y rechaza
la hipótesis nula de que
todas las muestras son
de la misma población.
Least Squares Means
Factor Level LS Mean Standard N
Error
Medicamento Placebo 7.500 0.624 6.000
Analysis of Variance
Source Type III df Mean F-ratio p-value
SS Squares
Medicame 36.467 4 9.117 3.896 0.014
nto
Error 58.500 25 2.340
Gráficos para ANOVA
• Promedios y DS de cada grupo.
• Cajas.
• Puntos.
Tests para comparar medias
• Scheffé
– Si tamaño de los grupos es diferente
– Interesa además contrastes (Ej: grupo 1 y 2 vs 3)
• Tukey
– Si tamaño de los grupos es igual
– Interés prinicipal es comparar solo promedios de
grupos
• Bonferroni
– No se había previsto comparar grupos
6 6
(3,316)(0,8829) 2,928
Analysis of Variance
Source Type III SS df Mean F-ratio p-value
Squares
Medicamento 36.467 4 9.117 3.896 0.014
Error 58.500 25 2.340
Scheffe Test
Medicamento(i) Medicamento(j) Difference p-value 95.0% Confidence Interval
Lower Upper
Analysis of Variance
-------------------------------------------------------------------------------
Ventajas de utilizar computador en estadística
(Altman, 1999)
• Precisión y rapidez
• Versatilidad (gran cantidad de tests disponibles)
• Gráficos
• Flexibilidad
• Nuevas variables
• Volumen de datos
• Transferencia de datos
Estrategia para análisis de datos
• Recolección de datos (form codificados)
• Entrada de datos (Excel)
• Chequear datos (min, max, x, ds)
• Graficar antes de analizar
• Análisis de datos
• Chequear resultados
• Interpretar
Análisis de Varianza (ANOVA)
• Realizar el estudio de uno o más factores sobre
la media (o la varainza) de una variable medida.
• Idea básica
descomponer la variabilidad total en las partes
asociadas a cada factor, más una residual (no
justificables por los factores estudiados).
Variabilidad
Variabilidad debida residual
Variabilidad
= a diferencias entre + (diferencias dentro
total
tratamientos de cada
tratamiento)
• La variabilidad se calcula a través de la suma de
cuadrados (SC = (xij – m)2, donde m es (según
el caso)
– o bien la media general (con xij sobre todos los
• Los cuadrados medios (CM)
CM = SC / grados de libertad
– Los cuadrados medios son parecidos a las
correspondientes varianzas.
• Para comparar el efecto de la presencia
de un factor se comparan los cuadrados
medios:
F=CMtratamiento / CMresidual
– Para hacer esto se usa el test de Fisher.
ANOVA – Ejemplo:
• Media general Factor estudiado
m = 40.53
• Media por tratamiento: A B C
mA = 37, mB = 41.3, mC = 43.3 23 35 50
• SCtotal=(xiT – 40.53)2 i,T. 28 36 43
29 Grados de libertad
• SCtratamientos =N(mT – m)2 21 29 36
N = nº datos por tratamiento. 27 40 34
2 grados de libertad. Resultados
95 43 45
• SCresidual=Ti (xiT – mT)2 obtenidos
27 grados de libertad 41 49 52
SCtotal = SCtratamiento + SCresudual 37 51 52
• CMtratamiento=SCtratamiento/gtratamien
to 30 28 43
• CMresidual=SCresidual/gresidual
32 50 44
• F=CMtratamiento / CMresidual=
0.532 36 52 34
• Calcular F2,27 (5%) = 3.35 > Media 37 41.3 43.3
0.532