Sei sulla pagina 1di 35

Análisis de varianza

Dr. José Luis Morales Rocha


Análisis de Varianza de un factor
El análisis de varianza (ANOVA) de un factor sirve para comparar varios grupos en una
variable cuantitativa, es decir es útil para comparar dos o más medias poblacionales.

A la variable categórica (nominal u ordinal) que define los grupos que deseamos comparar
la llamamos independiente o factor y a la variable cuantitativa (de intervalo o razón) en la
que deseamos comparar los grupos la llamamos independiente.

Las hipótesis que se pone a prueba en el ANOVA de un factor es que las medias
poblacionales (las medias de la variable dependiente en cada nivel de la variable
independiente) son iguales, es decir:

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = ⋯ 𝜇𝑘
𝐻𝑎 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑑𝑜𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙𝑒𝑠 𝑛𝑜 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠
Análisis de Varianza - ejemplo
Se selecciona al azar una muestra representativa de una población, la
muestra esta conformada por 24 alumnos que se constituyen en cuatro Grupo Grupo Grupo Grupo
grupos de seis alumnos cada uno, escogidos al azar. Se les asigna una 1 2 3 4
tarea que consiste en resolver el mismo tipo de problemas en
matemáticas. 75 78 55 64
93 91 66 72
Al grupo1 se le advirtió que se aplicaba un examen más tarde (se le 78 97 49 68
examino una hora después). 71 82 64 77
Al grupo 2 también se le informo que se aplicaba un examen más tarde
(se le examino un día después). 63 85 70 56
Al grupo 3 no se le notifico sobre el examen (se le examino una hora 76 77 68 95
después).
Al grupo 4 tampoco se le aviso acerca del examen (se le examino un día
después).

En este estudio se tienen cuatro grupos (cuatro tratamientos); la variable


de interés es el resultado del mismo examen aplicado a cada grupo, que
mide el aprendizaje según las condiciones establecidas previamente. La
variable e interés (puntuaciones obtenidas en el examen) es la
dependiente, cuya naturaleza es continua y numérica, la variable
independiente es nominal o sea categórica y pertenece al grupo 1, 2, 3 y
4.
Análisis de Varianza - ejemplo
1. Hipótesis

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4
𝐻𝑎 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝑚𝑒𝑑𝑖𝑎 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑛𝑡𝑒 𝑜 𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎

2. Estadístico de prueba (Con SPSS: Analizar, Comparar medias, ANOVA de un factor)


Análisis de Varianza - ejemplo

3. Decisión estadística

Como p-valor = 0.007 (Sig. Bilateral) es menor a 0,05, entonces rechazamos la hipótesis nula y
aceptamos la hipótesis alterna, lo que implica que existe diferencia estadísticamente significativa
entre los grupos 1,2,3 y 4.
Análisis de Varianza - ejemplo
Pruebas posteriores (Tukey) Subconjuntos homogéneos

Se concluye que solo el grupo 2 con respecto al grupo 3 tienen diferencia estadísticamente significativa
Caso 01
Una empresa desea evaluar 5 dietas alimenticias enriquecidas por dosis de proteínas que
beneficia la calidad de carne de cerdo. Para ello selecciona aleatoriamente 30 cerdos de
similares características a los cuales asigna aleatoriamente las dietas y tres meses después
se evaluó el incremento que han tenido en el peso. La información es la siguiente:

D1 D2 D3 D4 D5
4 7 7 2 5
5 8 8 3 4
6 9 4 2 3
8 6 5 3 2
4 7 3 4 2

¿Existen evidencias para afirmar que las cinco dietas son similares en cuanto al efecto que
tienen sobre el incremento del peso de los cerdos?
Caso 02
Un analista de sistemas esta interesado en determinar que sistema le conviene implementar
en la empresa de tal manera que el tiempo de procesamiento de una venta sea el menor
posible. Con tal fin diseña 5 sistemas diferentes y luego selecciona aleatoriamente 30 ventas
de similar complejidad a las que aigna aleaoriamente los cinco sistemas y se registra los
tiempos de demora de cada proceso de venta.

S1 S2 S3 S4 S5
2 4 4 2 7
3 6 4 3 3
5 4 5 1 4
1 3 6 3 5
3 5 3 4 3

¿Cuáles son sus conclusiones a un nivel de significancia del 5%?


Análisis de varianza de dos factores
Diseño por bloques
Modelo:
𝑦𝑖𝑗 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + 𝜀 𝑖 = 1,2, … , 𝑎 𝑗 = 1,2, … , 𝑏

𝑦𝑖𝑗 : representa la respuesta de la variable en el i-ésimo nivel del


factor 1 (α) y en el j-ésimo nivel del factor 2 (β).
𝛼𝑖 : representa el efecto que sobre la media global μ tiene del
nivel i del factor 1.
𝛽𝑗 : representa el efecto que sobre la media global μ tiene del
nivel j del factor 2.
𝜀 : es la variación aleatoria de las Yij (igual para todas ellas)
Muestra aleatoria
(una observación por casilla)
Pruebas de hipótesis
› Prueba de hipótesis acerca del factor A:
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = … 𝜇𝑎
𝐻𝑎 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑒𝑚𝑎𝑠

El estadístico de prueba es:

𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑛𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑓𝑎𝑐𝑡𝑜𝑟 𝐴


𝐹𝑐 = ~𝐹(𝑎−1 𝑔.𝑙. 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑔𝑟𝑢𝑝𝑜𝑠)
𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑒𝑟𝑟𝑜𝑟

› Prueba de hipótesis acerca del factor B:

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = … 𝜇𝑏
𝐻𝑎 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑒𝑚𝑎𝑠

El estadístico de prueba es:

𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑛𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑓𝑎𝑐𝑡𝑜𝑟 𝐵


𝐹𝑐 = ~𝐹(𝑏−1 𝑔.𝑙. 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑔𝑟𝑢𝑝𝑜𝑠)
𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑒𝑟𝑟𝑜𝑟
Análisis estadístico - ANOVA
Análisis estadístico - ANOVA
Ejemplo
Un ingeniería zootecnista esta interesado en averiguar que tipo de alimento incrementa
mas el peso de pollo de engorde. Especialmente esta interesado en cuatro tipos de
alimentos: A, B, C y D. el ingeniero dispone de 5 razas de pollos 4 pollos por cada raza.
Asigna de manera aleatoria los tipos de alimento a todos los pollos de cada raza y tres
meses después obtiene la siguiente información:

Tipo de alimento
Raza A B C D
R1 1,9 1,2 0,4 1,2
R2 1,5 0,7 0,8 0,7
R3 2,2 1,3 0,9 1,2
R4 1,6 0,8 0,4 0,8
R5 1,9 1,3 0,8 1,2
R6 1,5 1,1 0,4 0,9

¿A que conclusión puede llegar a un nivel de significancia del 5%?


Resultados

Conclusión:
Como p-valor= 0.000 menor a 0,05, podemos afirmar que existen
evidencias estadistas a un nivel de 5% para rechazar la hipótesis nula y
aceptar la hipótesis alterna. Se concluye que existen diferencias
significativas entre el incremento de peso promedio debido a los cuatro
tipos de alimento.
Resultados
Resultados
Resultados
Ejercicio
El jefe de informática de una empresa de seguros esta interesado en determinar que
tipo de documento es el que mayor tiempo demora en su procesamiento.
Principalmente esta interesado en cuatro tipos de documentos: D1, D2, D3, y D4. Su
área dispone de 5 empleados y también sospecha que no todos los empleados
tienen la misma rapidez en procesar los documentos. Recopila información del
tiempo total que han empleado en procesar 100 documentos de cada tipo. La
información se muestra a continuación:
Documento
Empleado D1 D2 D3 D4
E1 500 450 550 480
E2 520 440 580 470
E3 550 490 620 490
E4 530 410 590 440
E5 540 400 600 400
E6 610 430 580 430

¿Qué puede concluir acerca del rendimiento de las variaciones con un nivel de
significancia del 5%?
Análisis de varianza factorial
› Los modelos factoriales de análisis de varianza (factorial=mas de un factor) sirven
para evaluar el efecto individual y conjunto de dos o más factores (variables
independientes categóricas) sobre una variable dependiente cuantitativa.
› El ANOVA factorial permite estudiar, por ejemplo, si el peso del recién nacido
(variable dependiente) de los varones y de las mujeres es diferente (efecto del
primer factor), y al mismo tiempo, si recién nacidos procedentes de madres de
distinta edad tienen distinto salario (efecto del segundo factor). Pero además
también permite estudiar si las diferencias entre varones y mujeres se repiten en
cada grupo de edad, es decir permite determinar si la interacción entre factores
sexo y grupos de edad afecta a la variable dependiente peso del recién nacido.
› Usar más de un factor en un mismo diseño posee la ventaja de poder estudiar el
efecto interacción entre los factores.
› En un modelo de dos factores los efectos son tres: los efectos principales (uno por
cada factor) y el efecto de la interacción entre ambos factores.
Pruebas de hipótesis
› Prueba de hipótesis acerca del factor A:
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = … 𝜇𝑎
𝐻𝑎 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑒𝑚𝑎𝑠

El estadístico de prueba es:

𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑛𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑓𝑎𝑐𝑡𝑜𝑟 𝐴


𝐹𝑐 = ~𝐹(𝑎−1 𝑔.𝑙. 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑔𝑟𝑢𝑝𝑜𝑠)
𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑒𝑟𝑟𝑜𝑟

› Prueba de hipótesis acerca del factor B:

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = … 𝜇𝑏
𝐻𝑎 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑒𝑚𝑎𝑠

El estadístico de prueba es:

𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑛𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑓𝑎𝑐𝑡𝑜𝑟 𝐵


𝐹𝑐 = ~𝐹(𝑏−1 𝑔.𝑙. 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑔𝑟𝑢𝑝𝑜𝑠)
𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑒𝑟𝑟𝑜𝑟
Pruebas de hipótesis
› Prueba de hipótesis acerca del la interacción entre el
factor A y B:

𝐻0 : 𝑛𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑖𝑛𝑡𝑒𝑟𝑎𝑐𝑐𝑖𝑜𝑛 𝑒𝑛𝑡𝑟𝑒 𝑙𝑜𝑠 𝑓𝑎𝑐𝑡𝑜𝑟𝑒𝑠 𝐴 𝑦 𝐵


𝐻𝑎 : 𝑠𝑖𝑒𝑥𝑖𝑠𝑡𝑒 𝑖𝑛𝑡𝑒𝑟𝑎𝑐𝑐𝑖𝑜𝑛 𝑒𝑛𝑡𝑟𝑒 𝑙𝑜𝑠 𝑓𝑎𝑐𝑡𝑜𝑟𝑒𝑠 𝐴 𝑦 𝐵

El estadístico de prueba es:

𝐹𝑐
𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑛𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑎 𝑖𝑛𝑡𝑒𝑟𝑎𝑐𝑐𝑖ó𝑛
= ~𝐹(𝑎−1)(𝑏−1) 𝑔.𝑙. 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑔𝑟𝑢𝑝𝑜𝑠
𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑒𝑟𝑟𝑜𝑟
Ejemplo
Grado de instrucción
Nivel
Un investigador esta interesado en socioeconómico Secundaria Técnica Universitaria

determinar si el nivel 15 23 13
socioeconómico y el grado de 20 15 12
Bajo
instrucción tienen efecto sobre la 12 19 18
cantidad de cigarrillos que una 20 21 17
persona consume mensualmente. 21 32 25
18 29 24
Medio
Los niveles socioeconómicos de su 19 30 23
interés son bajo, medio y alto y los 22 29 21
niveles de grado de instrucción: 30 31 36
28 33 38
secundaria, técnica y universitaria Alto
24 29 40
16 34 39
Pruebas de hipótesis
› Prueba de hipótesis acerca del grado de instrucción:

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 ∶ las cantidades promedio de cigarrillos fumados mensualmente son similares en los tres niveles
de instrucción.

𝐻𝑎 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑒𝑚𝑎𝑠

› Prueba de hipótesis acerca del nivel socioeconómico:

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 ∶ las cantidades promedio de cigarrillos fumados mensualmente son similares en los tres niveles
socioeconómicos.

𝐻𝑎 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑒𝑚𝑎𝑠

› Prueba de hipótesis acerca de la interacción grado de instrucción*nivel socioeconómico:

𝐻0 : (𝛼𝛽)𝑖𝑗 = 0 ∶ no existe interacción entre el grado de instrucción y el nivel socioeconómico.

𝐻0 : (𝛼𝛽)𝑖𝑗 ≠ 0 ∶ si existe interacción entre el grado de instrucción y el nivel socioeconómico.


SPSS
SPSS
Resultados

Conclusiones respecto a la prueba de hipótesis acerca del grado de instrucción:


Como p-valor =0,000 < 0,05, se rechaza la H0 y se acepta la Ha, existen suficientes evidencias estadísticas a
un nivel de α=0.05 de que al menos un grado de instrucción difiere de los demás con respecto a la cantidad
promedio de cigarrillos que se fuma mensualmente.
Conclusiones respecto a la prueba de hipótesis acerca del nivel socioeconómico:
Como p-valor =0,000 < 0,05, se rechaza la H0 y se acepta la Ha, existen suficientes evidencias estadísticas a
un nivel de α=0.05 de que al menos un nivel socioeconómico difiere de los demás con respecto a la cantidad
promedio de cigarrillos que se fuma mensualmente.
Conclusiones respecto a la prueba de hipótesis acerca de la interacción grado de instrucción*l nivel
socioeconómico:
Como p-valor =0,000 < 0,05, se rechaza la H0 y se acepta la Ha, existen suficientes evidencias estadísticas a
un nivel de α=0.05 para afirmar que existe interacción entre el grado de instrucción y ell nivel socioeconómico.
< 15 15 a 18 19 a 30 > 30
Ejercicio años
1800
años
2000
años
3000
años
3100
1900 2400 2800 3300
Un medico esta interesado en determinar si tanto Normal
1700 2900 2900 2600
el estado nutricional como la edad de la madre 2000 3000 3200 2800
2100 2500 2700 2900
tienen efecto sobre el peso del recién nacido. Los Con
1800 2900 2900 2600
estados nutricionales de su interés son: Normal, sobrepes
1900 3200 3100 3200
o
sobrepeso y obesa los grupos de edad: <15 años, 2200 2900 3500 2700
15-18 años, 19-30 años y >30 años. Selecciona 3000 3100 2800 2800
2800 3300 2500 3100
aleatoriamente 5 madres para cada combinación Obesa
2400 2900 3200 3400
de los niveles de estado nutricional y edad de la 2500 3400 3100 3500
madre.

¿Cuáles son sus conclusiones a un nivel de significancia del 5%?


Pruebas de hipótesis
› Prueba de hipótesis acerca de la edad de las madres:

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 : los pesos promedio de los recién nacido de los cuatro grupos de edad son similares.

𝐻𝑎 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑒𝑚𝑎𝑠

› Prueba de hipótesis acerca del estado nutricional:

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 ∶ los pesos promedio de los recién nacidos de los tres estados nutricionales son similares.

𝐻𝑎 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑒𝑚𝑎𝑠

› Prueba de hipótesis acerca de la interacción edad*estado nutricional:

𝐻0 : (𝛼𝛽)𝑖𝑗 = 0 ∶ no existe interacción entre la edad y el estado nutricional.

𝐻0 : (𝛼𝛽)𝑖𝑗 ≠ 0 ∶ si existe interacción entrela edad y el estado nutricional.


Gracias …

Dr. José Luis Morales Rocha

Potrebbero piacerti anche