Sei sulla pagina 1di 6

DEPARTAMENTO DE ESTADISTICA INFERENCIA M.V.

COMPARACION DE VARIAS MEDIAS POBLACIONALES ANALISIS DE VARIANZA DE UN FACTOR Hasta el momento hemos tratado el problema de comparar las medias de dos poblaciones. La idea ahora es generalizar la comparacin de medias de k poblaciones. Supongamos entonces que disponemos de k muestras aleatorias independientes, cada una de tamao ni , para i=1,...,k y k. hemos calculado las distintas medias muestrales para cada una de ellas: x 1, x 2 ,...,x Cuando varias medias muestrales exhiben valores diferentes, los investigadores tienen inters en explorar si todas estas muestras provienen de poblaciones con la misma media, o si cada una de las k muestras se obtiene de una poblacin dada y que las medias de las k poblaciones no son todas iguales.As se quiere probar: H0 : .1 = .2 = ....=.k vs. H1 : algn .i distinto. Si el anlisis estadstico permite aceptar el primer caso, entonces las diferencias observadas entre las medias muestrales, se deben slo a fluctuaciones del muestreo y, por lo tanto, no son significativas. En cambio, si el anlisis no permite aceptar igualdad de medias, las diferencias entre las diversas medias muestrales son significativas, esto es se rechaza la hiptesis que .1 =.....=.k . El procedimiento usado para probar igualdad de medias de varias poblaciones normales se denomina Anlisis de Varianza (nombre que parece errado ya que queremos probar igualdad de medias). Este procedimiento involucra una separacin de una varianza total en piezas o partes: varianza intra (dentro) y varianza inter (entre) y luego decide aceptar o rechazar la igualdad de medias basndose en la magnitud relativa de estas partes. Supongamos que disponemos de k muestras aleatorias independientes, cada una de tamao ni i=1,2,..,k .Para poder llevar a cabo la prueba de igualdad de medias necesitamos que se satisfagan los dos supuestos siguientes: 1) Cada una de las muestras se obtienen de una poblacin con distribucin normal y ,
2 2 2 2) Las k poblaciones tienen la misma varianza, esto es 51 = 52 = ......= 5k .

Sea :

H0 : .1 = .2 = ....=.k vs. H1 : algn .i distinto.

La decisin de rechazar o no H! se har con el estadstico F= Varianza inter-muestras Varianza intra-muestras

DEPARTAMENTO DE ESTADISTICA INFERENCIA M.V.H

donde la varianza inter y la varianza intra son dos estimaciones de la varianza comn 5# Si la disparidad entre estas dos estimaciones es considerable, la hiptesis nula es rechazada y las diferencias entre las diversas medias muestrales son consideradas significativas. Si la hiptesis nula es verdadera, esperamos que las dos estimaciones para la varianza poblacional estn razonablemente cercanas y por lo tanto se espera que la razn F sea cercana a 1, en cambio, si las k medias son diferentes, la varianza inter-muestras ser mayor que la varianza intra-muestras. Esto debido a que la varianza intra-muestras es una estimacin insesgada de la varianza poblacional sin importar si H0 es verdadero o no, en cambio el valor esperado de la varianza inter-muestras consiste de la varianza poblacional ms una varianza adicional que refleja la diferencia entre las k poblaciones. Esto es, los valores esperados de las dos estimaciones de la varianza 52 son: E[Varianza intra-muestras] = 52
k

E[Varianza inter-muestras] = 5 + " ni


2 i=1

(.i -.)2 k"

As, cuando las k poblaciones difieren en lo que respecta a su media, se espera que la razn F sea mayor que 1; adems, mientras mayor sea la diferencia entre las diversas muestras, mayor ser la razn F. Por lo tanto, con un nivel de significacin !, se rechazar H0 : .1 = .2 = ....=.k si F >F1-! (r1 , r2 ).

Frmulas
k= N de poblaciones en estudio (N de muestras)
k

ni = Tamao de la muestra i, i=1,2,...,k

"ni = n.
i=1

! !Xij Estimador de la media : . s=


k ni i=1 j =1

ni

! ni
i=1

...................................(1)

!!(Xij . s )2 Estimador de la varianza total :


k

5 s2 =

i=1 j=1

! ni 1
i=1

...........................................(2)

Si ni = n , a i=1, ..,k, entonces "ni = nk y las frmulas (1) y (2) pasan a ser respectivamente
i=1

DEPARTAMENTO DE ESTADISTICA INFERENCIA M.V.H

n !Xi . s=
i=1

!X i =
i=1

!!(Xij . s )2 , 5 s2 =
i=1 j=1

k n

nk

nk 1

Notemos que, el numerador de 5 s2 corresponde a una suma de cuadrados totales que puede descomponerse en: ""(Xij . s )2 ="" [(Xij X i )+(X i . s )]2
i=1 j=1 i=1 j=1 k ni k ni k ni k ni

y como los dobles productos son 0

= "" (Xij X i )2 + "" (X i . s )2


i=1 j=1 i=1 j=1

.............................(3)

Suma cuadrado total=Suma cuadrado dentro de muestras+ Suma cuadrado entre muestras Notemos que (3) se puede escribir como:
k ni 2 k

""(Xij . s)
i=1 j=1

= "ni
i=1

"S2 i+ +

"ni (X s )2 i.
i=1

SCT

SCW

SCB

(W=Whithin=dentro, B=Between=entre) Como . s es combinacin lineal de variables normales, ella es normal. Adems, X i . s se distribuye normal por ser combinacin lineal de normales. Cov ( . s ,Xi . s )=0 para cada i, y Cov( X i . s , Xij X i )=0 para cada i, j. As: . s es independiente de X i . s, !ni "S2 i . s es independiente de S2 c = y
i=1 k

n. k

Xi . s es independiente de S2 c .

Dividiendo la expresin (3) por 52 tenemos: SCT ;2 (n. 1), 52 SCW ;2 (n. k), 52 SCB ;2 (k 1), 52

Dada la independencia de las variables involucradas obtenemos que

DEPARTAMENTO DE ESTADISTICA INFERENCIA M.V.H

SCB 1) F= = SCW 52 (n. k) 52 (k

k !ni (X s )2 i. i=1

k1 ! ni
i=1 k

F( k 1, n. k) .......................(5)

"S2 i
k n! (X i . s )2 i=1

n. k

Si ni = n para todo i = 1, ...,k (5) toma la forma : F =

k1 !S2 i
i=1 k

2 nS X

!S2 i
i=1

k F F( k 1, k(n 1)).

Lo anterior se puede resumir en una tabla conocida como la TABLA ANOVA ANOVA SC CP SCB SCW SCT SCB/(k 1) SCW/(n. k)

Fuente de Variacin Entre pobl. Dentro de las k pobl. Total

g.l. k1 n. k n. 1

Razn F Fc =
SCB (k1) SCW (n.k)

v-p P(F Fc )

Observacin. Podemos obtener frmulas alternativas para la SCT y SCB, estas son: !! Xij 2
i=1 j=1 k ni

SCT = !! X2 ij
i=1 j=1 n"

k ni

n ! X#j 2 +
j=1 n#

! X"j 2 SCB= y
j=1

! Xkj 2 .....+
j=1

nk

!! Xij 2
i=1 j=1

k ni

n"

n2

nk

SCW = SCT SCB

Ejercicio. Como parte de la investigacin del derrumbe del techo de un edificio, un laboratorio prueba todos los pernos disponibles que conectaban la estructura de acero en tres posiciones distintas del techo. Las fuerzas requeridas para "cortar" cada uno de los pernos (valores codificados) son los siguientes:

DEPARTAMENTO DE ESTADISTICA INFERENCIA M.V.H

Posicin 1: 90 82 79 98 83 91 Posicin 2: 105 89 93 104 89 95 86 Posicin 3: 83 89 80 94 Realice un anlisis de varianza para probar, con un nivel de significacin de 0.05, si las diferencias entre las medias muestrales en las 3 posiciones son significativas. Solucin Realizamos la prueba de hiptesis: H0 : .1 =.2 =.3 (las fuerzas promedios es la misma para las tres posiciones) H1 : Algn .i es distinto. Bajo los supuestos de normalidad en las fuerzas requeridas, independencia e igualdad de varianza para las 3 posiciones , y de acuerdo a la observacin anterior, recogemos las distintas sumas para cada una de las posiciones obtenemos:

ni ! Xij
j=1 ni

Posicin 1 6 523

Posicin 1 7 661

Posicin 1 4 346

Total n. =17 !! Xij =1530


i=1 j=1 k ni

As
k ni

SCT="" X2 ij
i=1 j=1

(1530)# (1530)# = 138638 =938 17 17

523# 661# 346# (1530)# SCB = #$% 6 7 4 17 y SCW=938 234=704. #$% ""( De donde el estadstico es Fc = # = =2.33 (!% 50.3 "% Para !=0.05 tenemos F0.95 (2,14)=3.74 Dado que Fc =2.33 F0.95 (2,14) no podemos rechazar H0 . Las diferencias entre las medias muestrales no son significativas al nivel 0.05. Z +69< : P(F(2,14) 2.33) = 0.13381807 no significativo. Los clculos los podemos resumir en la siguiente tabla ANOVA

DEPARTAMENTO DE ESTADISTICA INFERENCIA M.V.H

Fuente de variacin SCB (Tratamientos) SCW (Error) SCT

g.l. 2 14 16

SC 234 704 938

SCP 117 50.3

Fc 2.33

F1! (k-1, n -k) 3.74

v-p 0.1338

Esta misma tabla la podemos obtener de la planilla Excell en la opcin "Anlisis de Varianza de un Factor" en "Anlisis", todo dentro del cono "Datos" .

Ejercicio 1. Como parte de la investigacin del derrumbre del techo de un edificio, un laboratorio prueba todos los pernos disponibles que conectaban la estructura de acero en tres posiciones distintas del techo. Las fuerzas requeridas para "cortar" cada uno de los pernos (valores codificados ) son los siguientes:

Posicin 2 105 89 93 104 89 95 86 Anlisis de varianza de un factor RESUMEN Grupos Posicin 1 Posicin 2 Posicin 3

Posicin 1 90 82 79 98 83 91

Posicin 3 83 89 80 94

N Observaciones 6 7 4

Suma 523 661 346

Promedio Varianza 87,1666667 50,1666667 94,4285714 55,952381 86,5 39

ANLISIS DE VARIANZA O. de las variaciones Entre grupos Dentro de los grupos Total

S.C. 234,452381 703,547619 938

G. de l. 2 14 16

C.M F Prob (v-p) V. crtico para F 117,22619 2,33270161 0,133547147 3,738891832 50,2534014

Potrebbero piacerti anche