Sei sulla pagina 1di 115

ESTADISTICA

INDUSTRIAL
TEMA 04

Ing. William León Velásquez


ANALISIS DE
LAS
VARIANZAS
Ing William León Velásquez 2
ANOVA de un factor

ANOVA de dos factores


Suposiciones en el
análisis de la varianza
(ANOVA)
Para emplear ANOVA se supone lo
siguiente:
Las poblaciones siguen la distribución
normal.
Las poblaciones tienen desviaciones
estándar iguales (σ).
Las poblaciones son independientes.

5
Ing. William león Velásquez
El análisis de la varianza
(ANOVA)
• ANOVA permite comparar las medias de
tratamientos de forma simultánea y evitar la
acumulación del error tipo I.

• ANOVA se desarrolló para aplicaciones en


agricultura, y aún se emplean muchos de los
términos relacionados con ese contexto.

• El término tratamiento
se identifican las
poblaciones diferentes
que se examinan.

6
Ing. William león Velásquez
EJEMPLO DIDACTICO
El gerente de un centro financiero, desea comparar
la productividad, medida por el número de clientes
atendidos en tres de sus empleados.
Selecciona cuatro días en forma aleatoria y se
registra el número de clientes atendidos por cada
empleado.
Los resultados son:
Walter Willy Kike
55 66 47
54 76 51
59 67 46
56 71 48

¿Habrá alguna diferencia en el número de clientes


atendidos? Ing. William león Velásquez 7
EJEMPLO DIDACTICO
En las siguiente gráficas se ilustra cómo pueden aparecer las
poblaciones si hubiera una diferencia en las medias del
tratamiento.

Walter
• Las poblaciones en la gráfica de la
izquierda siguen la distribución
Kike normal y la variación en cada
Willy
población es la misma. Sin
embargo, las medias no son
iguales.
Servicio al
cliente

Suponer que las poblaciones son Walter


iguales es decir que no hay diferencia
en las medias (tratamiento). Esto se Kike

muestra en la gráfica de la derecha. Willy


Las poblaciones siguen la distribución
normal y la variación en cada población
es la misma. Ing. William león Velásquez Servicio al 8
cliente
La prueba ANOVA
• Si se desea determinar si varias medias
muestrales provienen de una sola
población o de poblaciones con medias
diferentes, lo que se hace en realidad, es
que estas medias muestrales se comparan
mediante sus varianzas.

• Una de las suposiciones para aplicar la


prueba ANOVA es que la desviación
estándar de las diversas poblaciones
normales tienen que ser las mismas. Se
aprovecha este requisito en la prueba
ANOVA.

9
Ing. William león Velásquez
La prueba ANOVA
• La estrategia es estimar la varianza de la
población de dos formas y después
determinar la razón de dichos estimados.
• Si esta razón es aproximadamente 1,
entonces por lógica los dos estimados
son iguales, y se concluye que las
medias poblaciones son iguales.

• La distribución F sirve como un


árbitro al indicar en que instancia la
razón de las varianzas muestrales
es mucho mayor que 1 para haber
ocurrido por casualidad.

Ing. William león Velásquez 10


La prueba ANOVA
• Se definirá algunos conceptos que nos ayudaran a
entender mejor en problemas posteriores, a través del
ejemplo planteado.
VARIACIÓN TOTAL (SS) Suma de las
diferencias elevadas al cuadrado entre cada
observación y la media global

Ing. William león Velásquez 11


EJEMPLO DIDACTICO

La variación total del ejemplo:

• Se calcula la media global de las 12 observaciones:


𝑋𝐺 =(55+54+59+56+66+76+67+71+47+51+46
+48)/12 = 58 X G  58
Ing. William león Velásquez 12
EJEMPLO DIDACTICO
• Después, para cada una de las 12
observaciones se encuentra la diferencia
entre el valor particular y la media global.
Cada una de estas diferencias se eleva al
cuadrado y estos cuadrados se suman, este
resultado es la variación total,
SS= (55-58)2+(54-58)2+(59-58)2+(56-58)2+

(66-58)2+(76-58)2+(67-58)2+(71-58)2+
(47-58)2+(51-58)2+(46-58)2+(48-58)2=

SS= 1082.

Ing. William león Velásquez 13


EJEMPLO DIDACTICO
Luego se divide esta variación total en dos
componentes:
• la que se debe a los tratamientos y
• la que es aleatoria.

SS: Suma de cuadrados


SST: Suma de cuadrados de los
SS = SST + SSE tratamientos
SSE: Suma de cuadrados del
error

 Para encontrar estas dos componentes, se


determina la media de cada tratamiento.
 La primera fuente de variación se debe a los
tratamientos.
Ing. William león Velásquez 14
La prueba ANOVA

• La primera fuente de variación:

VARIACIÓN DEL TRATAMIENTO (SST) Suma de las


diferencias elevadas al cuadrado entre la media de
cada tratamiento y la media global

Ing. William león Velásquez 15


EJEMPLO DIDACTICO
En el ejemplo:
• La variación debida a los tratamientos es la
suma de las diferencias al cuadrado entre la
media de cada empleado y la media global.
• Para calcularlo, primero se encuentra la media
de cada uno de los tres tratamientos.

La media de Walter es 56, determinada por:


(55 + 54 + 59 + 56)/4.
La media de Willy es son 70 determinada
por:
(66 + 76 + 67 + 71)/4.
La media de Kike es 48 determinada por:
16
(47 + 51 + 46 + 48)/4.
Ing. William león Velásquez
EJEMPLO DIDACTICO
La suma de los cuadrados debida a los tratamientos es:

SST=(56 – 58)2 +(56 – 58)2 + … ..+ (48 – 58)2 + (48 – 58)2 =


=4(56 – 58)2 + 4(70 – 58)2 + 4(48 – 58)2 = 992

SST = 992
 Si existe una variación considerable entre las
medias de los tratamientos, es lógico que este
término sea grande.
 El valor más bajo posible es cero. Esto ocurrirá
cuando todas las medias de los tratamientos
Ing. William león Velásquez
17

sean iguales.
La prueba ANOVA
• La otra fuente de variación se le conoce como
componente aleatorio o componente de error.

VARIACIÓN ALEATORIA (SSE) Suma de las


diferencias elevadas al cuadrado entre cada
observación y su media de tratamiento.

18
Ing. William león Velásquez
EJEMPLO DIDACTICO
Las medias de cada empleado:

Walter es 56
Willy es 70
Kike es 48
En el ejemplo:
• Este término es la suma de las diferencias al
cuadrado entre cada valor y la media para ese
empleado en particular.
SSE=(55 – 56)2 +(54 – 56)2 + ……… + (46 – 48)2+
(48 – 48)2 = 90
• La variación de error es de 90.
Ing. William león Velásquez 19
SSE = 90
EJEMPLO DIDACTICO
En resumen:
 La suma de la diferencia entre el valor
particular y la media global elevado al
cuadrado es la variación total, y es igual 1082.
 La suma de los cuadrados debida a los
tratamientos es 992
 La variación de error es de 90.
Por lo tanto:
SS = SST + SSE
1082 = 992 + 90

+
=
Ing. William león Velásquez 20
La prueba ANOVA
El estadístico de prueba, es la razón de los dos
estimados de la varianza poblacional, se determina
a partir de la siguiente ecuación:

Estimado de la varianza poblacional basado en


F = las diferencias entre las medias muestrales
Estimado de la varianza poblacional basado en
la variación dentro de la muestra

𝑀𝑆𝑇
𝐹=
𝑀𝑆𝐸𝑟𝑟𝑜𝑟
Ing. William león Velásquez 21
La prueba ANOVA
𝑀𝑆𝑇
𝐹=
𝑀𝑆𝐸𝑟𝑟𝑜𝑟
𝑆2 𝑇 Diferencia entre grupos

𝑚
𝐹= 2− 1 m-1

𝑆 𝐸 Diferencias dentro
de cada grupos
𝑛−𝑚 n -m

Ing. William león Velásquez 22


EJEMPLO DIDACTICO

El primer estimado de la varianza


poblacional entre los tratamientos, es decir,
de la diferencia entre las medias.
Éste es 992/2.
¿Por qué se divide entre 2?
Recuerde que para encontrar una varianza
muestral , se divide entre el número de
observaciones menos uno (n-1).
En este caso hay 3 tratamientos por lo que Entre grupos
se divide entre 2.
El primer estimado poblacional es 992/2.

Ing. William león Velásquez 23


EJEMPLO DIDACTICO

El estimado de la varianza dentro de


los tratamientos es la variación
aleatoria dividida entre el número total de
observaciones menos el número de
tratamientos.
Es decir 90 / (12-3).
De aquí, el segundo estimado de la
varianza poblacional es 90/9. Dentro de cada
grupos

Ing. William león Velásquez 24


EJEMPLO DIDACTICO

Por tanto

2
𝑆 𝑇
𝑀𝑆𝑇 𝑚 − 1 Entre grupos
𝐹= 𝐹= 2
𝑀𝑆𝐸𝑟𝑟𝑜𝑟 𝑆 𝐸 Dentro de cada
𝑛−𝑚 grupos

Ing. William león Velásquez 25


EJEMPLO DIDACTICO
Como esta razón es muy distinta a 1, se
concluye que las medias de los tratamientos
no son iguales.

Por lo tanto hay una diferencia en el número


medio de clientes atendidos por los tres
empleados.

Al igual que en la prueba de hipótesis de dos


muestras y una muestra se sigue la regla de
los cinco pasos.

Ing. William león Velásquez 26


Comparación de varias medias
Análisis de Varianza (ANOVA)

Es la relación entre una variable


cualitativa (con más de 2 categorías)
y una variable cuantitativa

Ing. William león Velásquez 27


El problema
• Se tiene varias medias muestrales y se
desea saber si realmente son evidencia de
una diferencia entre los diferentes grupos.
• Existe una variable cuanlitativa X que
podría explicar los cambios en una variable
cuantitativa Y

Ing. William león Velásquez 28


Esquema ANOVA

Variable Variable
Independiente o dependiente o
Explicativa Respuesta
CUALITATIVA CUANTITATIVA
X  Y

FACTOR que Medición que


incluye varios puede
posibles RESPONDER a los
tratamientos que varios posibles
pueden influir en tratamientos del
Ing. William león Velásquez 29
la respuesta factor estudiado
La Hipótesis

Ho: No hay relación entre X e Y


Ho: Las medias de Y en los
diferentes grupos son iguales
Ho: μ1 = μ2 = μ3

Ha: Si hay relación entre X e Y


Ha: Por lo menos una media de Y es
diferente en los grupos definidos
por la variable X
Ha: No todas las medias
poblacionales son iguales

Ing. William león Velásquez 30


Ilustración mediante un ejemplo
Se ha calculado la producción promedio de tres
líneas de producción de una empresa de productos
electrónicos
Línea 1 Línea 2 Línea 3
Producción 11.1 15.9 22.7
promedio
(unidades)
Desviación 5.6 6.2 5.9
estándar
(unidades)
Base n 244 206 139

La muestra seleccionada permite ver que hay diferencias,


pero esta diferencia representa sólo en la muestra
Ing. William león Velásquez 31
Si se asume que Ho es cierta
(No hay relación)
Línea 1 Línea 2 Línea 3 Media
general
Producción 15.5 15.5 15.5 15.5
promedio

Base (n) 244 206 139 589

En la población las medias deberían ser iguales (Este es


el supuesto de Ho)

Ing. William león Velásquez 32


Modelo de ANOVA de un factor

Media general
Efecto del tratamiento en
Y= el factor analizado

Error aleatorio

Ing. William león Velásquez 33


En el ejemplo
X: Es el factor analizado
Variable cualitativa
Línea 1 Línea 2 `Línea 2
Variable Y:
cuantitativa Producción 11.1 15.9 22.7
promedio
 El efecto sobre la cantidad producida de cada
tratamiento (línea de producción) en la muestra
no tiene que ser el mismo.
 La hipótesis nula dice que no
hay diferencia en la producción
en los tratamientos.
 La hipótesis alternativa dice
que por lo menos uno de los
tratamientos (línea de
producción) tiene efecto sobre
la cantidad comprada
Ing. William león Velásquez 34
Resultados de ANOVA
Efecto del factor Línea de Producción

Efecto del Error aleatorio


Como el valor de p es casi 0 se rechaza la Ho
Con lo cual se rechaza la hipótesis de igualdad de medias
Por lo tanto al menos una línea tiene una producción diferente
En otras palabras hay una relación en el factor línea y la
producción. Ing. William león Velásquez 35
SUPUESTOS DE ANOVA
• La dispersión debe ser la misma en
cada grupo o categoría (igualdad de
varianza)
• La distribución de las observaciones
en cada grupo debe ser normal

ANOVA es más sensible al primer supuesto que la


segundo

En casos extremos hay que considerar alternativas no


paramétricas
Ing. William león Velásquez 36
Ejemplo 1
• Una gran ciudad está dividida en cuatro distritos. El jefe de policía
quiere determinar si hay alguna diferencia en el número promedio de
infracciones cometidos en cada distrito.
• Se registró el número de infracciones reportados en cada distrito en
una muestra de seis días.
• Al nivel de significancia 0,05; puede el funcionario concluir que hay
diferencia en el número promedio de infracciones?

Distrito 1 Distrito 2 Distrito 3 Distrito 4


13 21 12 16
15 13 14 17
14 18 15 18
15 19 13 15
14 18 12 20
15león Velásquez19
Ing. William 15 18
37
Ejemplo 1
a) Formulación de las hipótesis
Ho: μ1 = μ2 = μ3 = μ4
H1: Al menos una de las μi es diferente
Al menos en unos de los distritos
la cantidad promedio de
infracciones cometidos es
diferente

b) Obtención del valor crítico:


Nivel de significancia=0.05
GL numerador: k-1 = 4-1=3
GL del denominador: n-k = 24-4 =20
Fcrítico= 3.098
Regla de decisión:
Se rechazará la Ho si F> 3.10 38
Ing. William león Velásquez
Ejemplo 1
c) Cálculo del valor del estadístico de la prueba:
Distrito Distrito Distrito Distrito
01
x2
02
x2
03
x2
04
x2 total
13 169 21 441 12 144 16 256
15 225 13 169 14 196 17 289
14 196 18 324 15 225 18 324
15 225 19 361 13 169 15 225
14 196 18 324 12 144 20 400
15 225 19 361 15 225 18 324 ∑∑x
∑x
(T) 86 108 81 104 379
n 6 6 6 6 ∑∑x2
∑ x2 1236 1980 1103 1818 6137

Ing. William león Velásquez 39


𝑋 2
Ejemplo 1 𝑆𝑆𝑇𝑜𝑡𝑎𝑙 = 𝑋2 −
𝑛
𝟑𝟕𝟗 2
𝐒𝐒𝐓𝐨𝐭𝐚𝐥 = 𝟔𝟏𝟑𝟕 − = 𝟏𝟓𝟏. 𝟗𝟓𝟖
24

𝑇 2𝑗 𝑋 2
𝑆𝑆𝑇 = −
𝑛𝑗 𝑁
(86)2 (108)2 (81)2 (104)2 (379)2
SST=------ + ------ + ------ + -------- - --------
6 6 6 6 24

SST= 1232.67 + 1944.00 + 1093.50 + 1802.67 - 5985.04 = 87.79

SSTotal= SST+ SSE

SSE=SSTotal – SST SSE=151.958 – 87.79 =64.188


Ing. William león Velásquez 40
Ejemplo 1
Suma de Media
F. Variación G.L. F
Cuadrados Cuadrado
Tratamientos 87.770 3 29.256 9.118
Error 64.188 20 3.2094
Total 151.958 23

d) Criterio de decisión
Se rechaza la Ho debido a que el valor del Fcalculado es 9.118 y es mayor al
valor del Fcrítico de 3.10.
e) Conclusión:
Se puede afirmar con un nivel de significancia del 5%
Que al menos en unos de los distritos la cantidad promedio de infracciones
cometidos es diferente
Por lo tanto existe diferencia en el número promedio de infracciones
cometidos en cada distrito
41
Ing. William león Velásquez
Ejemplo 2
• Una egresada de ingeniería industrial tiene ofertas de trabajo de
cuatro empresas. Para examinar un poco más las propuestas,
solicitó a un grupo de personas recién ingresadas a dichas
empresas, que le indiquen cuántos meses trabajaron cada una
para su compañía, antes de recibir un aumento de sueldo.
• La información muestral fueron lo siguiente:

Empresa1 Empresa2 Empresa3 Empresa4


12 14 18 12
10 12 12 14
14 10 16 16
12 10
• Al nivel de significancia de 0,05; existe alguna diferencia entre
las cuatro empresas, en el promedio de meses antes de recibir
42
un aumento de sueldo? Ing. William león Velásquez
Ejemplo 2
a) Formulación de las hipótesis
Ho:μ1 = μ2 = μ3 = μ4
H1: Al menos una de las μi es diferente
Al menos en una de las empresas el
promedio de meses antes de recibir un
aumento de sueldo es diferente
b) Obtención del valor crítico:
Nivel de significancia=0.05
GL numerador: k-1 = 4-1=3
GL del denominador: n-k = 14-4 =10
Fcritico= 3.708
Regla de decisión:
Se rechazará la Ing.
HoWilliam
si F> león3.71
Velásquez 43
Ejemplo 2

• C) Obtención del F de los datos de la muestra


Empresa Empresa Empresa Empresa
01
X2 02
X2
03
X2 04
X2 Total

Ing. William león Velásquez 44


Ejemplo 2

SStotal   X
2  X
 
2

2  X
SST    T c   
2

 nc  n

Ing. William león Velásquez 45


Ejemplo 2
ANOVA
Factor de SC GL CM F
Variación
Tratamiento 32.33 3 10.777 2.360
Error 45.67 10 4.567
Total 78.00 13
Conclusión
• Como el valor Fcalculado (2.360) es menor al valor Fcrítico (3.71) no se
rechaza la Ho,
• No se puede afirmar con un nivel de significancia del 5%, que al menos
en una de las empresas el promedio de meses antes de recibir un
aumento de sueldo es diferente
• Es decir no existe diferencia entre las cuatro empresas, en el promedio
de meses antes de recibir un aumento de sueldo
• Por lo tanto debe elegir otro criterio para seleccionar a una de las
Ing. William león Velásquez 46
empresas
Ejemplo 3
 Los miembros de un equipo ciclista se dividen al
azar en tres grupos que entrenan con métodos
diferentes.
 El primer grupo realiza largos recorridos a ritmo
pausado, el segundo grupo realiza series cortas
de alta intensidad y el tercero trabaja en el
gimnasio con pesas y se ejercita en el pedaleo de
alta frecuencia.

 Después de un mes de
entrenamiento se realiza un
test de rendimiento
consistente en un recorrido
cronometrado de 9 Km.

Ing. William león Velásquez 47


Ejemplo 3
Los tiempos empleados fueron los siguientes
Método I Método II Método III
15 14 13
16 13 12
14 15 11
15 16 14
17 14 11

A un nivel de confianza del 95% ¿Puede considerarse


que los tres métodos producen resultados
equivalentes? O por el contrario ¿Hay algún método
superior a los demás?
Ing. William león Velásquez 48
Ejemplo 3
a) Formulación de las hipótesis
Ho:μ1 = μ2 = μ3 = μ4
H1: Al menos una de las μi es diferente
Al menos uno de los tres métodos producen en el test de
rendimientos resultados diferentes
b) Obtención del valor crítico:
Nivel de significancia=0.05
GL numerador: k-1 = 3-1=2
GL del denominador: n-k = 15-3 =12
Fcritico= 3.89
Regla de decisión:
Se rechazará la Ho si F> 3.89

Ing. William león Velásquez 49


Ejemplo 3
c.- Se encuentra el Fcalculado
Primero se calcula los totales y los cuadrados de
los totales divididos por el numero de
observaciones

Ing. William león Velásquez 50


Ejemplo 3
X
2
 2984
 X 2

 2940
n

A partir de estas cantidades básicas calculamos


las Sumas de Cuadrados:

SStotal   X
2

 X
2
SC(total) = 2984 - 2940 = 44
n
SST    c   
 T 2  X 2
SC(entre) = 2966,8 – 2940 = 26,8
 nc  n
SC(intra) = 2984 – 2966,8 = 17,2
SS = SST + SSE
SST = SS - SSE
Ing. William león Velásquez 51
Ejemplo 3
𝑀𝑆𝑇 Los cuadrados medios serán:
𝐹=
𝑀𝑆𝐸𝑟𝑟𝑜𝑟 MSA= CM(entre) = 26,8/2 = 13,4
MSerror= CM(intra) = 17,2/12 = 1,43

Por consiguiente el estadístico de contraste


es:

S m 1 2T F = 13,4/ 1,43 = 9,37


F 2
S E nm
Ing. William león Velásquez 52
Ejemplo 3
d.- Conclusión:
• Como el F calculado (9.37) es mayor que es valor de la F teórica
(3,89) se rechaza la Ho.
• Se puede afirmar con un nivel de significancia del 5%
que al menos uno de los tres métodos producen en el test de
rendimientos resultados diferentes
• Se concluye que los tres métodos de entrenamiento
producen diferencias significativas.

Ing. William león Velásquez 53


Ejemplo 4
Un estudio muestra en la pantalla de cuatro computadores
una lista de palabras sin sentido con procedimientos
diferentes, asignados aleatoriamente a un grupo de personas.
Luego se les realiza una prueba de memoria de dichas
palabras, obteniéndose los siguientes resultados:
COMP 1 COMP 2 COMP 3 COMP 4
5 9 8 1
7 11 6 3
6 8 9 4
3 7 5 5
9 7 7 1
7 4 4
4 4
2
¿Qué conclusiones pueden obtenerse acerca de las cuatro
formas de presentaciónIng.de lasleónpalabras,
William Velásquez con un nivel de 54
significación del 5%?
Ejemplo 4
a) Formulación de las hipótesis
Ho:μ1 = μ2 = μ3 = μ4
H1: Al menos una de las μi es diferente
Al menos en una de las cuatros formas de
presentar las palabras se obtiene resultados
diferentes
b) Obtención del valor crítico:
Nivel de significancia=0.05
GL numerador: k-1 = 4-1=3
GL del denominador: n-k = 26-4 =22
Fcritico= 3.05
Regla de decisión:
Se rechazará la Ho si F> 3.05

Ing. William león Velásquez 55


Ejemplo 4
c) Encontrar el Fcalculado
Calcular los totales y los cuadrados de los
totales divididos por el número de observaciones:

Ing. William león Velásquez 56


Ejemplo 4
Luego calcular los cuadrados de las observaciones y su total

Ing. William león Velásquez 57


Ejemplo 4
A partir de estas cantidades básicas calcular las
Sumas de Cuadrados:

𝑋 2
𝑆𝑆𝑇𝑜𝑡𝑎𝑙 = 𝑋2 − SC(total) = 988 – 820 = 168
𝑛
𝑇 2𝑗 𝑋 2
𝑆𝑆𝑇 = − SC(entre) = 902 – 820 = 82
𝑛𝑗 𝑁

SC(intra) = 988 – 902 = 86


Los cuadrados medios serán:

CM(entre) = 82/3 = 27,3


CM(intra) = 86/22 = 3,9
Ing. William león Velásquez 58
Ejemplo 4
Por lo tanto el estadístico de prueba será:
27.3
𝐹= =7.0
3.9
d.- Conclusión
Como el Fcalculado (7.0) es mayor que el Fcritico (3.05) se
rechaza la hipótesis nula
Se puede afirmar con un nivel de significancia del 5%
Que al menos en una de las cuatros formas de presentar las palabras se
obtiene resultados diferentes
Y se concluye que los cuatro procedimientos de
presentación producen diferencias significativas.

Ing. William león Velásquez


59
ANOVA de dos factores
◦ Se consideran los efectos de dos
factores simultáneamente

• Diseño de bloques aleatorios


◦ Cuando una característica puede
afectar la medición de la variable
dependiente, se trata de controlar o
bloquear esta variable, de tal manera
que se pueda comparar mejor la
influencia de un determinado
tratamiento
Ing. William león Velásquez 61
Diseño de Bloques aleatorios

Media general

Efecto del tratamiento específico


del primer factor
Y=
Efecto del bloque

Error aleatorio

Ing. William león Velásquez 62


ANOVA de dos factores
Con Interacción

Media general

Efecto del tratamiento


específico del primer factor

Y= Efecto del tratamiento


específico del segundo factor

Efecto de la interacción entre


tratamientos

Error aleatorio
Ing. William león Velásquez 63
ANOVA – P.H. para probar la igualdad de
medias de varias poblaciones con dos
factores
Se trata de probar si el efecto de un factor o
Tratamiento en la respuesta de un proceso o sistema
es significativo, al realizar experimentos variando los
niveles de ese factor (Temp.1, Temp.2, etc.) por
FILAS
Y Considerando los niveles de otro factor que se
piensa que tiene influencia en la prueba – FACTOR
DE BLOQUEO por COLUMNA

Ing. William león Velásquez 64


ANOVA – P.H. para probar la igualdad
de medias de varias poblaciones con
dos factores
Para el tratamiento – en filas
Ho: µ1=µ2=µ3=………….µi
Ha: Al menos unas de las µs es diferente
No todas las medias de tratamientos son
iguales
Para el factor de bloqueo – en columnas

Ho: µ’1=µ’2=µ’3=………….µ’i
Ha: Al menos unas de las µs es diferente

Ing. William león Velásquez 65


ANOVA 2 Factores -
Ejemplo
Experiencia de los operadores
Máquinas 1 2 3 4 5
1 27 31 42 38 45
2 21 33 39 41 46
3 25 35 39 37 45

Ing. William león Velásquez 66


ANOVA – Dos factores o
direcciones
• La SCTot y SCTr (filas) se determina de la
misma forma que para la ANOVA de una
dirección o factor
• En forma adicional se determina la suma
de cuadrados del factor de bloqueo
(columnas) de forma similar a la de las filas
• La SCE = SCT – SCTr - SCBl

Ing. William león Velásquez 67


ANOVA de 2 factores –
Suma de cuadrados, gl. y Cuadrado medio para el factor
de bloqueo (en cols)

b
SCBl   a ( X j  X ) 2

j 1

gl.SCBl  b  1
CMBl  SCBl /(b  1)
Ing. William león Velásquez 68
ANOVA de 2 factores –
Suma de cuadrados, gl. y Cuadrado
medio para el error

SCE  SCT  SCTr  SCBl

gl.SCE  (n  a )(n  b)
CME  SCBl /( n  a )(n  b)

Ing. William león Velásquez 69


ANOVA 2 Factores
Cálculo del estadístico Fc y Ftabla
𝑀𝐶𝑇𝑟
𝐹𝑐 =
𝑀𝐶𝐸

𝐹𝑡𝑎𝑏𝑙𝑎 = 𝐹𝑎𝑙𝑓𝑎 , 𝑔𝑙. , 𝑆𝐶𝑇𝑟 , 𝑆𝐶𝐸

𝑀𝐶𝐵𝑙
𝐹𝑐 =
𝑀𝐶𝐸

𝐹𝑡𝑎𝑏𝑙𝑎 = 𝐹𝑎𝑙𝑓𝑎 , 𝑔𝑙. , 𝑆𝐶𝐵𝑙 , 𝑆𝐶𝐸


Ing. William león Velásquez 70
ANOVA 2 Factores
Tabla final
SUMA DE GRADOS DE CUADRAD
FUENTE DE VARIACIÓN CUADRADOS LIBERTAD O MEDIO VALOR F
Entre muestras
(tratamiento) SCTR a-1 CMTR CMTR/CME

Entre Bloques (Factor


Bloque) SCBl b-1 CMBL CMBL/CME

Dentro de muestras
(error) SCE (a-1)(b-1) CME

Variación total
SCT n-1 CMT

Regla: No rechazar si la F de la muestra es menor que la F de tabla para


una cierta alfa

Ing. William león Velásquez 71


ANOVA – 2 F.
Toma de decisión
Distribución F
Ftabla

Alfa
Zona de no
rechazo

Zona de no rechazo de Ho Zona de rechazo de Ho


O de no aceptar Ha o aceptar Ha
Fc: Tr o Bl
72
Ing. William león Velásquez
ANOVA – 2 F. Toma de
decisión
Si Fc (Tr o Bl) es mayor que Ftabla se rechaza Ho.
Aceptando Ha donde las medias son diferentes

O
Si el valor de p correspondiente a Fc (Tr o Bl) es menor de
Alfa se rechaza Ho

Ing. William león Velásquez 73


Ejemplo 5
• Una empresa realiza una investigación para determinar
el rendimiento en km por galón, característico de tres
marcas de gasolina: Como cada gasolina da
rendimientos distintos en automóviles de marcas
diferentes,

• Se eligen cinco marcas


de automóviles que se
tratan como bloques en
el experimento, es decir
el automóviles de cada
marca se prueba con los
tres tipos de gasolina.

Ing. William león Velásquez 74


Ejemplo 5
• Los resultados del experimento (en
Km. por galón) se presenta a
continuación:
MARCA DE GASOLINA
I II III
A 18 21 20
AUTOMOVI
B 24 26 27
LES
C 30 29 34
D 22 25 24
E 20 23 24
Con un α= 0.05 ¿Existirá alguna diferencia entre los
rendimientos medios en miles por galón de los tres
tipos de gasolina?
Ing. William león Velásquez 75
Ejemplo 5
1.- Establecer las hipótesis

• Ho: Los consumos de gasolina según la marca de


gasolina no son diferentes

• Ha: Los consumos de gasolina según la marca de


gasolina son diferentes

• Como la relación entre la marca de gasolina y la


marca de automóvil es de uno a uno no existirá
prueba de interacción entre las dos variables.

Ing. William león Velásquez 76


Ejemplo 5
2.- Establecer el Criterio de Contraste
a b n nivel de significancia de .05
3 5 15
Gl T1 =2
Gl SCE= 8
gl T1 a-1 2 F=4.459
gl T2 b-1 4
Gl T2 =4
gl Tot n-1 14 Gl SCE= 8
gl F= 3.838
SCE glTot-gl T1 -gl T2 8
T1 T2

77
4.459 3.838 Ing. William león Velásquez
Ejemplo 5
3. Elaborar la tabla ANOVA

3.1- Cálculo de la Suma de cuadrados

I II III ∑X ∑X2 n
A 18 21 20 59 1165 3
B 24 26 27 77 1981 3
C 30 29 34 93 2897 3
D 22 25 24 71 1685 3
E 20 23 24 67 1505 3
∑X 114 124 129 367 ∑∑X
∑X2 2684 3112 3437 9,233 ∑∑X2
n 5 5 5 15 ∑∑n
Ing. William león Velásquez 78
Ejemplo 5
3.2- Cálculo del Factor de corrección

( X ) 2

FC  Factor de corrección

 n FC =
(367)2
----------- = 8979.267
15

3.3- Cálculo de la Suma cuadrado de totales

SCTotales   X  FC 2

Suma total de
cuadrados

SSTot = 9,233 - 8,979.267 = 253.733


Ing. William león Velásquez 79
Ejemplo 5
3.4- Cálculos de los tratamientos

( X ) 2
SCTi    FC
n
Suma de cuadrados del
tratamiento 1
SST1 = (114)2 (124)2 (129)2
-------- + --------- + --------- - 8979.2667 = 23.3333
5 5 5

Suma de cuadrados del


tratamiento 2
SST2 = (59)2 (77)2 (93)2 (71)2 (67)2
-------- + ------- + --------- + --------- + --------- - 8979.2667 = 217.067
3 3 3 3 3
-
Suma de cuadrados del error
SSE = 253.7333 - 23.3333 - 217.067 = 13.3333333

Ing. William león Velásquez


Ejemplo 5
3. Construir la Tabla ANOVA
FUENTE SS GL SM F
T1 23.33333 2 11.66667 7
T2 217.0667 4 54.26667 32.56
ERROR 13.33333 8 1.666667
TOTAL 253.7333 14

4. Conclusión

FCRITICO FDATOS Conclusión


FT1= 4.459 7 Se rechaza la Ho

FT2= 3.838 32.56 Se rechaza la Ho


FCrítico
Ing. William león Velásquez 81
ANOVA de dos factores con
interacción
• Cuando se emplea ANOVA de dos vías para
estudiar la interacción, en lugar de emplear los
términos tratamientos y bloques, ahora a las dos
variables se les denominan factores.
• La interacción tiene lugar si la combinación de
dos factores ejerce algún efecto sobre la variable
en estudio, además de hacerlo en cada factor por
sí mismo.
• A la variable en estudio se le llama variable de
respuesta.

abr-18 Ing. William León Velasquez 82


ANOVA de dos factores con
interacción
Un ejemplo cotidiano de interacción:
• Es el efecto de dieta y ejercicio sobre el peso. En general,
se acepta que el peso de una persona (la variable de
respuesta) se controla con dos factores, dieta y ejercicio.
• Las investigaciones demuestran
que sólo una dieta afecta al peso
de una persona, y también que el
solo ejercicio tiene un efecto sobre
el peso.
• Sin embargo, el método
recomendado para controlar el
peso se fundamenta en el efecto
combinado o en la interacción
entre dieta y ejercicio.
abr-18 Ing. William León Velasquez 83
Ejemplo 6
• Se ha diseñado una prueba de vocabulario para detectar
la afinidad hacia la mecánica.
• La prueba consiste en un cierto número de palabras
tomadas de una lista de términos alusivos a la mecánica y
a la maquinaria; y que la calificación que una persona
puede obtener en esa prueba es, simplemente, el número
de palabras que puede definir correctamente.
• Suponer que se quiere probar si
hay diferencias relativas a dos
características: sexo y lugar
donde viven, y también si se
presentan diferencias atribuibles
a la combinación de ambas.

Ing. William león Velásquez 84


Ejemplo 6
• Las calificaciones (cantidad de palabras bien definidas)
de las personas clasificadas de acuerdo a las dos
variables fueron las siguientes:
Urbano Rural

Hombre Mujer Hombre Mujer

C p 4 1 3 4
a a
n l 9 4 7 4
t d a
i e b
d r
9 5 7 4
a a
d s 10 6 7 8
Ing. William león Velásquez 85
Ejemplo 6

• Es posible, llevar a efecto un análisis de varianza de


una sola clasificación con estos cuatro grupos de
sujetos, sin embargo, si se encuentra una diferencia
significativa entre estos cuatro grupos.
• ¿Como saber si esas diferencias deben atribuirse
al sexo o al lugar donde viven o a una
combinación de ambos?
• Es por ello que en estos casos se utiliza el método
de análisis de varianza de doble clasificación.

Ing. William león Velásquez 86


Ejemplo 6
Pasos
1.- Establecer Hipótesis
Se tiene que establecer hipótesis para cada uno de
los tratamientos y para la interacción de ambos:
a) Primer tratamiento:
Ho: “Con respecto al sexo no existe diferencia en
las calificaciones obtenidas, que mide la
afinidad hacia la mecánica”
Ha: “Con respecto al sexo existe diferencia en las
calificaciones obtenidas, que mide la afinidad
hacia la mecánica”

Ing. William león Velásquez 87


Ejemplo 6
1.- Establecer Hipótesis
b) Respecto al segundo tratamiento:
Ho: “Con respecto al lugar donde viven no existe
diferencia en las calificaciones obtenidas, que mide la
afinidad hacia la mecánica”
Ha: “Con respecto al lugar donde viven existe diferencia en
las calificaciones obtenidas, que mide la afinidad hacia
la mecánica”

c) Respecto a la interacción de los dos tratamientos


Ho: ”La combinación de las circunstancias sexo y lugar de
residencia no afecta de manera significativa el tener
más afinidad hacia la mecánica”
Ha: ”La combinación de las circunstancias sexo y lugar de
residencia afecta de manera significativa el tener más
afinidad hacia Ing.
la mecánica”
William león Velásquez 88
Ejemplo 6
2.- Establecer el Criterio de Contraste
a=2 b=2 n=16
nivel de
gl T1 a-1 1 Gl T1 =1 significancia de
gl T2 b-1 1 Gl SCE= 12 .05
gl Iter (a-1)(b-1) 1 F= 4 .75
gl Tot n-1 15
gl SCE glTot-gl T1 -gl T2 - gl Iter 12
Gl T2 =1
Gl SCE= 12
F= 4 .75

Gl Iter =1
Gl SCE= 12
F= 4 .75
Ing. William león Velásquez
89
Ejemplo 6
3.- Calcular el Estadístico de Prueba
Sumatoria de los totales

Urbano Rural
Hombre x2 Mujer x2 Hombre x2 Mujer x2
4 16 1 1 3 9 4 16
9 81 4 16 7 49 4 16
9 81 5 25 7 49 4 16
10 100 6 36 7 49 8 64 ΣΣ
ΣX = 32 16 24 20 92
ΣX² = 278 78 156 112 624
n 4 4 4 4 16

Ing. William león Velásquez 90


Ejemplo 6
•Cálculo del Factor de corrección:

( X ) 2
FC 
 n

FC 
92
2
 529
16 Ing. William león Velásquez 91
Ejemplo 6
•Cálculo de la Suma Total de Cuadrados

SCTotal = X 2 - FC
= ( 278 + 78 + 156 + 112) - 529 = 95
= 624 - 529 = 95

Ing. William león Velásquez 92


Ejemplo 6
• Calcular la suma de cuadrados por cada tipo de
tratamiento
• SCT1 (por el lugar donde viven)

(  Ti ) 2
SCT1    FC
n

Ing. William león Velásquez 93


Ejemplo 6
• Calcular la suma de cuadrados por cada tipo
de tratamiento
• SCT2 (por sexo)

( Bli ) 2
SCT2    FC
n
Hombre Mujer

Ing. William león Velásquez 94


Ejemplo 6
•Calcular la suma de cuadrados por grupos

( X ) 2
SCG    FC
n

*Este valor nos servirá para calcular el SCI y SCE

Ing. William león Velásquez 95


Ejemplo 6
• Calcular la suma de cuadrados de la interacción
de los dos tratamientos
SCI = SCG – SCT1 – SCT2 =
= 35 – 1 – 25 = 9

• Calcular la suma de cuadrados del error


SCE = SCTOT – SCG =
= 95 – 35 = 60

Ing. William león Velásquez 96


Ejemplo 6
• Construir la Tabla ANOVA

FUENTE SC GL MC F
TRATAMIENTO 1 1.0 1 1 0.2
TRATAMIENTO 2 25.0 1 25 5
POR GRUPOS 35
INTERACCION 9.0 1 9 1.8
ERROR 60 12 5
TOTAL 95 15

Ing. William león Velásquez 97


Ejemplo 6
4.- Tomar Decisión y Conclusión
Decisión

FCRITICO FDATOS Conclusión


FT1= 4 .75 0.2 No se rechaza la Ho

FT2= 4 .75 5 Se rechaza la Ho


FCrítico
FINT= 4 .75 1.8 No se rechaza la Ho

Como los Estadísticos de Prueba, en los casos de las variables de


localidad (F*1 = 0.2) y la combinación de sexo y localidad (F*i =1.8)
son mas pequeños que sus respectivos criterios de contraste (F =
4.75), en estos casos no se rechaza la hipótesis nula,
Mientras que en el caso del sexo el Estadístico de Prueba (F*2 = 5.0)
es mas grande que el Criterio de Contraste (F = 4.75), entonces por
lógica inferimos que F* queda dentro de la zona crítica y por lo tanto
se rechaza la hipótesis nula por lo tanto aceptamos la hipótesis
alterna
98
Ing. William león Velásquez
Ejemplo 6
y la conclusión :

 “Hay evidencia suficiente, con un nivel de significancia


de .05, para afirmar que con respecto al sexo existe
diferencia en las calificaciones obtenidas que mide la
afinidad hacia la mecánica”
 “Hay evidencia suficiente, con un nivel de significancia
de .05, para afirmar que con respecto al lugar de
procedencia no existe diferencia en las calificaciones
que mide la afinidad hacia la mecánica”

 ni tampoco podemos afirmar que la combinación de


ambas circunstancias influya en la afinidad hacia la
mecánica de las personas”.

Ing. William león Velásquez 99


Ejemplo 7
• El departamento de nutrición de cierta universidad
lleva a cabo un estudio para determinar si hay
diferencia o no en el contenido de ácido ascórbico
entre tres diferentes marcas de concentrado de jugo
de naranja.

• Se hacen cuatro pruebas


de los tres tipos de
concentrado de jugo de
naranja que fue congelado
durante tres periodos de
tiempo diferentes (en días)

Ing. William león Velásquez 100


Ejemplo 7
• Los resultados, en miligramos de ácido ascórbico
por litro, son los siguientes:
TIEMPO ( DÍAS )
MARCA 0 3 7
RICA 52.6 54.2 49.4 49.2 42.7 48.8
49.8 46.5 42.8 53.2 40.4 47.6
BUENA 56.0 48.0 48.8 44.0 49.2 44.0
49.6 48.4 44.0 42.4 42.0 43.2
BARATA 52.5 52.0 48.0 47.0 48.5 43.3
51.8 53.6 48.2 49.6 45.2 47.6
• Utilice un nivel de significancia de .05 para probar la hipótesis que:
• Los contenidos de ácido ascórbico por marca de jugo son diferentes
• Los contenidos de ácido ascórbico por tiempo de congelamiento son
diferentes
• Los contenidos de ácido ascórbico son diferentes debido a la interacción
de las dos variables.
Ing. William león Velásquez 101
Ejemplo 7
a) Planteamiento de las hipótesis:
Ho: Los contenidos de ácido ascórbico por marca de jugo son
iguales
Ha: Los contenidos de ácido ascórbico por marca de jugo son
diferentes
Ho: Los contenidos de ácido ascórbico por tiempo de
congelamiento son iguales
Ha: Los contenidos de ácido ascórbico por tiempo de
congelamiento son diferentes
Ho: Los contenidos de ácido ascórbico son iguales debido a la
interacción de las dos variables.
Ha: Los contenidos de ácido ascórbico son diferentes debido
a la interacción de las dos variables.

Ing. William león Velásquez 102


Ejemplo 7
2.- Establecer el Criterio de Contraste

a b n nivel de
Gl T1 =2 significanc
3 3 36 Gl SCE= 27 ia de .05
F=3.35
3.35
gl T1 a-1 2
gl T2 b-1 2 Gl T2 =2
gl Iter (a-1)(b-1) 4 Gl SCE= 27
gl Tot n-1 35 F= 3.35
gl glTot-gl T1 -gl T2 - gl 3.35
SCE Iter 27
Gl Iter =4
Gl SCE= 27
F=2.73
Ing. William león Velásquez 10
2.73
Ejemplo 7
• Elaborar la tabla ANOVA
n
0 3 7

52.6 54.2 49.4 49.2 42.7 48.8 12


𝑥 577.2
RICA
49.8 46.5 42.8 53.2 40.4 47.6
56 48 48.8 44 49.2 44 12 559.6
BUENA
49.6 48.4 44 42.4 42 43.2
52.5 52 48 47 48.5 43.3 12 587.3
BARATA
51.8 53.6 48.2 49.6 45.2 47.6

1724.1

Tratamientos 615 566.6 542.5 𝑥 1724.1

𝑥 n 12 12 12 36

Ing. William león Velásquez 104


Ejemplo 7
• 1- Cálculo del Factor de corrección

 X  2
 (1724.1) 2  2972520.81
2,972,520.81
( X ) 2 FC = ---------------- = 82,570.0225
FC  36
 n
Ing. William león Velásquez 105
FC = 82570
Ejemplo 7
• 2- Cálculo de la Suma cuadrado de totales

SCTotales   X 2  FC
SCTotales= 531.987
83,102.01 - 82,570 = 5
Ing. William león Velásquez 106
Ejemplo 7
3- Cálculos de los tratamientos

SCT1   
2
X
 FC
n
ΣX²/ n0 ΣX²/ n3 ΣX²/ n7

6152 566.62 542.52


SCT1     FC
12 12 12
TIEMPO SCT1 = 31518.75 + 26752.96 + 24525.52 - 82570.02

SCT1 = 82,797.23 - 82,570.02 = 227.212

107
Ejemplo 7
3- Cálculos de los tratamientos
SCT2   
2
X
 FC
n

ΣX²/ nRICA ΣX²/ nBUENA ΣX²/ nBARATA - FC


2 2 2
577.2 559.66 587.3
SCT2     FC
12 12 12
MARCA SCT2 = 27763.32 + 26096.01 + 28743.44 - 82570.02

SCT2= 82602.77 - 82570.02 = 32.752


Ing. William león Velásquez
Ejemplo 7
4- Calcular la suma de cuadrados por bloques

SGG  
 X
2

 FC
n
X n=4

0 3 7
RICA 203.1 194.6 179.5
BUENA 202 179.2 178.4
BARATA 209.9 192.8 184.6

  X 2
203.1
2
41249.61
   10312.4
n 4 4

SCG = 10312.40 + 9467.29 + 8055.06 +


+ 10201 + 8028.16 + 7956.64 +
+ 11014.50 + 9292.96 + 8519.29 - 82570.02 = 277.29
109
Ing. William león Velásquez
Ejemplo 7
5- Calcular la suma de cuadrados de la interacción de
los dos tratamientos

SCI = SCG – SCT1 – SCT2


=

SCI = 277.29 - 227.212 - 32.752 17.322


=

110
Ing. William león Velásquez
Ejemplo 7
6- Calcular la suma de cuadrados del error

SCE = SCTOT – SCG

SCE = 531.9875 - 277.29 = 254.703

111
Ing. William león Velásquez
Ejemplo 7
•Construir la Tabla ANOVA

FUENTE SC GL MC F
TRATAMIENTO 1 227.21 2 113.606 12.0429

TRATAMIENTO 2 32.75 2 16.376 1.7359


POR GRUPOS 277.29
INTERACCION 17.32 4 4.330 0.4591
ERROR 254.70 27 9.433
TOTAL 531.99 35

Ing. William león Velásquez 112


Ejemplo 7
•Conclusión

FDATOS Conclusión
FCRITICO
12.0429 Se rechaza la Ho
FT1= 3.35
1.7359 No se rechaza la Ho
FT2= 3.35

0.4591 No se rechaza la Ho
FINT= 2.73 FCrítico

Ing. William león Velásquez 113


FIN
wjleonv@yahoo.com

Potrebbero piacerti anche