Sei sulla pagina 1di 20

Anlisis de Varianza

Zultner Quintanilla Montoya

11-3

Caractersticas de la distribucin F
z
z

z
z
z

Existe una familia de distribuciones F.


Cada miembro de la familia est determinado por dos
parmetros: los grados de libertad (gl) en el
numerador y los grados de libertad en el denominador.
El valor de F no puede ser negativo y es una
distribucin continua.
La distribucin F tiene sesgo postivo.
Sus valores varan de 0 a . Con forme
F la curva se aproxima al eje X.

11-4

Prueba para variancias iguales


z

Para prueba de dos colas, el estadstico de prueba est


dado por:

2
1
2
2

S
F=
S
z

S12 y S22 son las variancias muestrales para las dos

muestras. La hiptesis nula se rechaza si el clculo del


estadstico de prueba es ms grande que el valor crtico
(de tablas) con nivel de confianza / 2 y grados de
libertad para el numerador y el denominador.

11-6

EJEMPLO 1
z

Colin, agente de bolsa del Critical Securities, report


que la tasa media de retorno en una muestra de 10
acciones de software fue 12.6% con una desviacin
estndar de 3.9%.

La tasa media de retorno en una muestra de 8 acciones


de compaas de servicios fue 10.9% con desviacin
estndar de 3.5%.

Para 0.05 de nivel de significancia,

Puede Colin concluir que hay mayor variacin en las


acciones de software?

11-7

EJEMPLO 1
z

Paso 1:

H0 : s u
z

continuacin

H1 : s > u

Paso 2:
H0 se rechaza si F > 3.68,
gl = (9, 7),
= .05

Paso 3:

Paso 4: H0 no se rechaza. No hay evidencia suficiente


para asegurar que hay mayor variacin en las acciones
de software.

(3.9) 2
F=
= 1.2416
2
(3.5)

11-8

Suposiciones de ANOVA
z

La distribucin F tambin se usa para probar la


igualdad de ms de dos medias con una tcnica
llamada anlisis de variancia (ANOVA). ANOVA
requiere las siguientes condiciones:
z

la poblacin que se muestrea tiene una distribucin


normal

las poblaciones tienen desviaciones estndar


iguales

las muestras se seleccionan al azar y son


independientes

11-9

Procedimiento de anlisis de variancia


z
z
z
z

Hiptesis nula: las medias de las poblaciones son


iguales.
Hiptesis alterna: al menos una de las medias es
diferente.
Estadstico de prueba: F = (varianza entre
muestras)/(varianza dentro de muestras).
Regla de decisin: para un nivel de significancia , la
hiptesis nula se rechaza si F (calculada) es mayor
que F (en tablas) con grados de libertad en el
numerador y en el denominador.

11-10

NOTA
z
z
z

Si se muestrean k poblaciones, entonces los


gl (numerador) = k - 1
Si hay un total de N puntos en la muestra, entonces los
gl (denominador) = N - k
El estadstico de prueba se calcula con:

SST
k

1
F=
SSE
N k
z
z

SST es la suma de cuadrados de los tratamientos.


SSE es la suma de cuadrados del error.

11-11

Frmulas
Sea TC el total de la columna, nc el nmero de
observaciones en cada columna, y X la suma de todas
las observaciones.

SS (total ) = ( X )
2

T
SST =
nc

2
c

( X )
n

( X )

SSE = SS (total ) SST

11-12

EJEMPLO 2
z
z
z

z
z

Los restaurantes Rosenbaum se especializan en


comidas para retirados y familias.
Su presidenta Katy Polsby acaba de desarrollar un
nuevo platillo de pastel de carne.
Antes de hacerlo parte del men normal decidi probarlo
en varios de sus restaurantes. Quiere saber si hay
diferencia en el nmero medio de comidas vendidas por
da en los restaurantes Sylvania, Perrysburg y Point
Place para una muestra de cinco das.
Con .05 de nivel de significancia,
puede Katy concluir que hay una diferencia en el
nmero medio de comidas de carne vendidas por da en
los tres restaurantes?

11-13

EJEMPLO 2
Sylvania
13
12
14
12

continuacin

Perrysburg Point Place


10
18
12
16
13
17
11
17
17
Total

Tc

51

46

85

182

nc

13

(X2)

653

534

1447

2634

11-14

EJEMPLO 2

z
z
z
z

continuacin

De la tabla, Katy determina SST = 76.25, SSE =


9.75, y el estadstico de prueba:
F = [76.25 /2] /[9.75 /10] = 39.1026
Paso 1: H0: 1= 2= 3 H1: no todas las medias son
iguales
Paso 2: H0 se rechaza si F > 4.10
Paso 3: F = 39.10
Paso 4: H0 se rechaza. Existe una diferencia en el
nmero medio de comidas vendidas.

11-15

Inferencias acerca de las medias de


tratamiento

Cuando se rechaza la hiptesis nula de que las medias


son iguales, quiz sea bueno saber qu medias de
tratamiento difieren.

Uno de los procedimientos ms sencillo es el uso de los


intervalos de confianza.

Intervalos de confianza para la


diferencia entre dos medias

11-16

z
z

donde t se obtiene de la tabla con (N - k) grados de


libertad.
MSE = [SSE /(N - k)]

1 1
( X 1 X 2 ) t MSE +
n1 n2

11-17

EJEMPLO 3
z

Del EJEMPLO 2 desarrolle un intervalo de confianza de


95% para la diferencia en el nmero medio de comidas
de pastel de carne vendidas en Point Place (pob # 1) y
Sylvania (pob # 2). Puede Katy concluir que existe
diferencia entre los dos restaurantes?

1 1
( X 1 X 2 ) t MSE +
n1 n2
1 1
(17 12.75) 2.228 0.975 +
4 5

4.25 1.48 (2.77,5.73)

11-18

Dos factores ANOVA


z

z
z

Para ANOVA de dos factores se prueba si existe una


diferencia significativa entre el efecto de tratamiento y si
existe una diferencia en la variable de bloqueo.
Sea Br el total de bloque (r segn las filas)
SSB representa la suma de los cuadrados de los
bloques, donde:

B ( X )
SSB =
n
k
2
r

11-19

EJEMPLO 4
z

La Bieber Manufacturing Co. opera 24 horas al da, cinco


das a la semana. Los trabajadores rotan su turno cada
semana. Todd Bieber, el propietario, se interesa en saber
si hay una diferencia en el nmero de unidades
producidas cuando los empleados trabajan diferentes
turnos. Se seleccion una muestra de cinco trabajadores
y se registr su produccin en cada turno. Con .05 de
nivel de significancia, se puede concluir que existe una
diferencia en la produccin media por turno y por
empleado?

11-20

EJEMPLO 4

continuacin

Empleado

Produccin
en el da

Produccin
en la tarde

Produccin
en la noche

McCartney

31

25

35

Neary

33

26

33

Schoen

28

24

30

Thompson

30

29

28

Wagner

28

26

27

11-21

EJEMPLO 4

continuacin

Variable de tratamiento
z Paso 1:
H0: 1= 2= 3 H1: no todas las medias son
iguales.
z Paso 2:
H0 se rechaza si F > 4.46, gl = (2, 8).
z Calcule la variable de suma de cuadrados:
SS(total) = 139.73, SST = 62.53, SSB = 33.73,
SSE = 43.47. gl(bloque) = 4, gl(tratamiento) = 2,
gl(error) = 8.
z Paso 3:
F = [62.53 /2] /[43.47 /8] = 5.75

11-22

EJEMPLO 4

Paso 4: H0 se rechaza. Existe una diferencia en el


nmero promedio de unidades producidas para los
distintos periodos o turnos.
Variable de bloqueo:
z Paso 1: H0: 1= 2= 3= 4= 5 H1: no todas las
medias son iguales.
z Paso 2: H0 se rechaza si F > 3.84, gl = (4,8)
z Paso 3: F = [33.73 / 4] / [43.47 / 8] = 1.55
z Paso 4: H0 no se rechaza ya que no existe una
diferencia significativa en el nmero promedio de
unidades producidas para los distintos trabajadores.
z

continuacin

Potrebbero piacerti anche