Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Lectura Fundamental
ANOVA
Contenido
1 ANOVA
Referencias
1.1. Introducción
El análisis de varianza ANOVA, por sus siglas en inglés, se puede ver como una generalización de las pruebas de
hipótesis para la media cuando se tienen más de dos tratamientos (uno por cada muestra), para determinar si
existen diferencias siginificativas entre las poblaciones. Por lo tanto, a través de esta herramienta estadı́stica se
determina si las poblaciones tenı́an el mismo valor para la media; por ejemplo cuando se quiere observar si existen
diferencias en los tiempos de mantenimiento en vı́as principales o secundarias a través de muestras que se toman
en puntos crı́ticos de las ciudades donde se construyó con materiales de diferente tipo. A continuacnón se muestran
otras situaciones se aplica el análisis de varianza.
• En la universidad U se quiere medir si existen diferencias entre los diferentes modelos pedagógicos que se
están implementando actualmente en las tres modalidades que tiene la institución.
• Presencial.
• Semipresencial.
• A distancia.
• En una empresa que provee material de construcción para grandes superficies de mercado, existe la necesidad
de cuantificar si hay diferencias entre los tipos de bloques.
• Sencillo.
• Con acabados.
• Supér resistente.
• Una ensambladora de vehiculos quiere determinar si el rendimiento por galón presenta un mejor desempeño
con las nuevas propuestas de motores que se diseñaron.
• 1.000 cc.
• 1.050 cc.
• 1.200 cc.
Cuantificar si los niveles de material particulado en el centro de la ciudad son diferentes de acuerdo a la zona
donde se mide.
• Zona sur.
• Zona norte.
• Zona oriente.
• Zona occidente.
El análisis de varianza nos permite determinar cuál de los factores es la fuente de la variabilidad en un
conjunto de datos, cuando se tiene un esquema como el siguiente.
POLITÉCNICO GRANCOLOMBIANO 1
Tabla 1: Esquema de datos y tratamientos.
Datos del Tratamiento
Tratamiento 1 2 ... k
1 x11 x12 ... x1k
2 x21 x22 ... x2k
3 x31 x32 ... x3k
... ... ... ... ...
... ... ... ... ...
I xi1 xi2 ... xik
Dentro de este esquema cabe aclarar que cada uno de los tratamientos es una población y que tenemos los siguientes
supuestos sobre esas poblaciones.
H0 : µ1 = µ2 = µ3 = µ4 = ... = µI
vs
H0 : µ1 6= µ2 6= µ3 6= µ4 6= ... 6= µI
Lo cual implica que el ANOVA determinará si las medias de todas poblaciones son iguales o presentan diferencias
significativas, gráficamente se ve ası́:
POLITÉCNICO GRANCOLOMBIANO 2
Figura 2: Distribución de x̄ bajo H1
Fuente: Elaboración propia
En la siguiente tabla se muestra un ejemplo donde no existe diferencias ni entre los tratamientos, ni dentro de
cada una de las muestras.
La tabla 3 presenta un ejemplo donde existen diferencias entre los tratamientos, pero no dentro de cada una de
las muestras.
La tabla 4 trae un ejemplo donde no existen diferencias entre los tratamientos, sino dentro de cada una de las
muestras.
POLITÉCNICO GRANCOLOMBIANO 3
Por último, se presenta una tabla donde existen diferencias tanto en los tratamientos como en las muestras.
Si el resultado obtenido al comparar dichas estimaciones es casi igual, entonces no se tiene evidencia estadı́stica
suficiente para rechazar H0 , sino que las diferencias que existen entre los tratamientos son significativas. A conti-
nuación se presenta una serie de ejemplos para mostrar cómo se calcula la variabilidad y cómo se toma la decisión
de rechazar o no H0 .
1.3. Ejemplos
El gerente de una planta de concreto desea comparar la productividad que se presenta en tres regiones con base
en la cantidad de pedidos por región, para ello selecciona aleatoriamente cuatro meses del año obteniendo los
siguientes resultados.
Solución
La pregunta a la que se dará respuesta es: ¿Existen diferencias entre el número promedio de pedidos en las tres
regiones?
POLITÉCNICO GRANCOLOMBIANO 4
Se comienza entonces por calcular la varianza entre las medias muestrales ası́:
2. Como se calculará la varianza entre las medias muestrales, se debe reemplazar cada xi por la media co-
¯;
rrespondiente a la ı́-esima muestra x̄i , y la media muestral X̄ por el promedio global de todos los datos X̄
además, n ahora es k que es el número de muestras, por lo tanto, se obtiene:
Pk ¯ )2
(X̄i − X̄
2
Sx̄ = i=1
k−1
σ2
3. Partiendo de la base de que σx̄2 = n , despejando σ 2 se obtiene σ 2 = nσx̄2 , entonces finalmente se tiene que:
Pk ¯ )2
− X̄
2 i=1 (X̄i
σEM M =n
k−1
Pk ¯ )2
n (X̄ − X̄
2 i=1 i i
σEM M =
k−1
Donde:
Pk
2 i=1 ni Si2
σDM = P k
i=1 ni
POLITÉCNICO GRANCOLOMBIANO 5
Donde:
• ni es el tamaño de la muestra i.
• k es la cantidad de muestras.
2
• σDM es la estimación de la varianza con base en la varianza dentro de las muestras.
2
Por lo tanto, el cálculo de la σDM es el siguiente:
2 1315, 7
σDM = = 109, 64
12
A través del estadı́stico de prueba F se compara la varianza entre las muestras con la varianza dentro de las
muestras.
473, 08
Fc = = 4, 3149
109, 64
Para determinar si se rechaza o no la hipótesis nula ese valor se compara con el valor de Fα .
Donde:
POLITÉCNICO GRANCOLOMBIANO 6
En este caso a un nivel de significancia del 5 % se tiene un valor crı́tico Fα , gn = 3 − 1 = 2 y gd = 12 − 3 = 9, por
lo tanto, Fα = 4, 2565.
Al comparar Fc con Fα se puede observar que Fc > Fα y por lo tanto se rechaza la hipotésis nula H0 . De don-
de se puede concuir que sı́ existen diferencias significativas entre el número promedio de pedidos en las tres regiones.
POLITÉCNICO GRANCOLOMBIANO 7
Figura 6: Ruta en excel. Fuente: Elaboración propia
POLITÉCNICO GRANCOLOMBIANO 8
Referencias
[1] Montgomery, Douglas C and Runger Probabilidad y estadı́stica aplicadas a la ingenierı́a 1996.
[2] Walpole, Ronald E and Myers, Raymond H and Myers, Sharon L Probabilidad y estadı́stica para ingenieros
1999.
[3] Anderson, D.R. and Sweeney, D.J. Estadı́stica Para Administración y Economı́a 2008.
POLITÉCNICO GRANCOLOMBIANO 9
INFORMACIÓN TÉCNICA
Módulo: Estadı́stica II
Unidad 3: Pruebas de hipótesis con dos o más poblaciones
Escenario 6: ANOVA
POLITÉCNICO GRANCOLOMBIANO 10