Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
A la variable categórica (nominal u ordinal) que define los grupos que deseamos comparar
la llamamos independiente o factor y a la variable cuantitativa (de intervalo o razón) en la
que deseamos comparar los grupos la llamamos independiente.
Las hipótesis que se pone a prueba en el ANOVA de un factor es que las medias
poblacionales (las medias de la variable dependiente en cada nivel de la variable
independiente) son iguales, es decir:
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = ⋯ 𝜇𝑘
𝐻𝑎 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑑𝑜𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙𝑒𝑠 𝑛𝑜 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠
Análisis de Varianza - ejemplo
Se selecciona al azar una muestra representativa de una población, la
muestra esta conformada por 24 alumnos que se constituyen en cuatro Grupo Grupo Grupo Grupo
grupos de seis alumnos cada uno, escogidos al azar. Se les asigna una 1 2 3 4
tarea que consiste en resolver el mismo tipo de problemas en
matemáticas. 75 78 55 64
93 91 66 72
Al grupo1 se le advirtió que se aplicaba un examen más tarde (se le 78 97 49 68
examino una hora después). 71 82 64 77
Al grupo 2 también se le informo que se aplicaba un examen más tarde
(se le examino un día después). 63 85 70 56
Al grupo 3 no se le notifico sobre el examen (se le examino una hora 76 77 68 95
después).
Al grupo 4 tampoco se le aviso acerca del examen (se le examino un día
después).
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4
𝐻𝑎 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝑚𝑒𝑑𝑖𝑎 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑛𝑡𝑒 𝑜 𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎
3. Decisión estadística
Como p-valor = 0.007 (Sig. Bilateral) es menor a 0,05, entonces rechazamos la hipótesis nula y
aceptamos la hipótesis alterna, lo que implica que existe diferencia estadísticamente significativa
entre los grupos 1,2,3 y 4.
Análisis de Varianza - ejemplo
Pruebas posteriores (Tukey) Subconjuntos homogéneos
Se concluye que solo el grupo 2 con respecto al grupo 3 tienen diferencia estadísticamente significativa
Caso 01
Una empresa desea evaluar 5 dietas alimenticias enriquecidas por dosis de proteínas que
beneficia la calidad de carne de cerdo. Para ello selecciona aleatoriamente 30 cerdos de
similares características a los cuales asigna aleatoriamente las dietas y tres meses después
se evaluó el incremento que han tenido en el peso. La información es la siguiente:
D1 D2 D3 D4 D5
4 7 7 2 5
5 8 8 3 4
6 9 4 2 3
8 6 5 3 2
4 7 3 4 2
¿Existen evidencias para afirmar que las cinco dietas son similares en cuanto al efecto que
tienen sobre el incremento del peso de los cerdos?
Caso 02
Un analista de sistemas esta interesado en determinar que sistema le conviene implementar
en la empresa de tal manera que el tiempo de procesamiento de una venta sea el menor
posible. Con tal fin diseña 5 sistemas diferentes y luego selecciona aleatoriamente 30 ventas
de similar complejidad a las que aigna aleaoriamente los cinco sistemas y se registra los
tiempos de demora de cada proceso de venta.
S1 S2 S3 S4 S5
2 4 4 2 7
3 6 4 3 3
5 4 5 1 4
1 3 6 3 5
3 5 3 4 3
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = … 𝜇𝑏
𝐻𝑎 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑒𝑚𝑎𝑠
Tipo de alimento
Raza A B C D
R1 1,9 1,2 0,4 1,2
R2 1,5 0,7 0,8 0,7
R3 2,2 1,3 0,9 1,2
R4 1,6 0,8 0,4 0,8
R5 1,9 1,3 0,8 1,2
R6 1,5 1,1 0,4 0,9
Conclusión:
Como p-valor= 0.000 menor a 0,05, podemos afirmar que existen
evidencias estadistas a un nivel de 5% para rechazar la hipótesis nula y
aceptar la hipótesis alterna. Se concluye que existen diferencias
significativas entre el incremento de peso promedio debido a los cuatro
tipos de alimento.
Resultados
Resultados
Resultados
Ejercicio
El jefe de informática de una empresa de seguros esta interesado en determinar que
tipo de documento es el que mayor tiempo demora en su procesamiento.
Principalmente esta interesado en cuatro tipos de documentos: D1, D2, D3, y D4. Su
área dispone de 5 empleados y también sospecha que no todos los empleados
tienen la misma rapidez en procesar los documentos. Recopila información del
tiempo total que han empleado en procesar 100 documentos de cada tipo. La
información se muestra a continuación:
Documento
Empleado D1 D2 D3 D4
E1 500 450 550 480
E2 520 440 580 470
E3 550 490 620 490
E4 530 410 590 440
E5 540 400 600 400
E6 610 430 580 430
¿Qué puede concluir acerca del rendimiento de las variaciones con un nivel de
significancia del 5%?
Análisis de varianza factorial
› Los modelos factoriales de análisis de varianza (factorial=mas de un factor) sirven
para evaluar el efecto individual y conjunto de dos o más factores (variables
independientes categóricas) sobre una variable dependiente cuantitativa.
› El ANOVA factorial permite estudiar, por ejemplo, si el peso del recién nacido
(variable dependiente) de los varones y de las mujeres es diferente (efecto del
primer factor), y al mismo tiempo, si recién nacidos procedentes de madres de
distinta edad tienen distinto salario (efecto del segundo factor). Pero además
también permite estudiar si las diferencias entre varones y mujeres se repiten en
cada grupo de edad, es decir permite determinar si la interacción entre factores
sexo y grupos de edad afecta a la variable dependiente peso del recién nacido.
› Usar más de un factor en un mismo diseño posee la ventaja de poder estudiar el
efecto interacción entre los factores.
› En un modelo de dos factores los efectos son tres: los efectos principales (uno por
cada factor) y el efecto de la interacción entre ambos factores.
Pruebas de hipótesis
› Prueba de hipótesis acerca del factor A:
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = … 𝜇𝑎
𝐻𝑎 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑒𝑚𝑎𝑠
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = … 𝜇𝑏
𝐻𝑎 : 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝜇𝑖 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑒𝑚𝑎𝑠
𝐹𝑐
𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑛𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑎 𝑖𝑛𝑡𝑒𝑟𝑎𝑐𝑐𝑖ó𝑛
= ~𝐹(𝑎−1)(𝑏−1) 𝑔.𝑙. 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑔𝑟𝑢𝑝𝑜𝑠
𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑒𝑟𝑟𝑜𝑟
Ejemplo
Grado de instrucción
Nivel
Un investigador esta interesado en socioeconómico Secundaria Técnica Universitaria
determinar si el nivel 15 23 13
socioeconómico y el grado de 20 15 12
Bajo
instrucción tienen efecto sobre la 12 19 18
cantidad de cigarrillos que una 20 21 17
persona consume mensualmente. 21 32 25
18 29 24
Medio
Los niveles socioeconómicos de su 19 30 23
interés son bajo, medio y alto y los 22 29 21
niveles de grado de instrucción: 30 31 36
28 33 38
secundaria, técnica y universitaria Alto
24 29 40
16 34 39
Pruebas de hipótesis
› Prueba de hipótesis acerca del grado de instrucción:
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 ∶ las cantidades promedio de cigarrillos fumados mensualmente son similares en los tres niveles
de instrucción.
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 ∶ las cantidades promedio de cigarrillos fumados mensualmente son similares en los tres niveles
socioeconómicos.
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 : los pesos promedio de los recién nacido de los cuatro grupos de edad son similares.
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 ∶ los pesos promedio de los recién nacidos de los tres estados nutricionales son similares.