Sei sulla pagina 1di 30

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA

Departamento de Estadstica e Informtica


Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

1

Captulo I

PRUEBAS NO PARAMTRICAS: APLICACIONES DE LA DISTRIBUCIN
CHI-CUADRADO

Introduccin
Para el anlisis de datos mediante estadstica inferencial existen dos tipos de
pruebas estadsticas: las paramtricas y las no paramtricas.
Las pruebas paramtricas son aquellas que requieren el cumplimiento de
ciertos supuestos con respecto a las observaciones que se utilizarn en el
anlisis como: la aleatoriedad en su seleccin, el ajuste a una distribucin
terica conocida (por ejemplo a la distribucin normal). El supuesto de
normalidad, es quizs el requisito ms importante que debe ser verificado antes
de proceder a desarrollar algunas pruebas paramtricas correspondientes a la
estadstica clsica, pues su no cumplimiento implicara la invalidez de los
resultados.
Las pruebas no paramtricas o de libre distribucin, no exigen que el conjunto
de datos provenga de una distribucin terica conocida. Es decir, pueden ser
usadas, en muchos casos, como mtodos alternativos a las pruebas
paramtricas. A pesar de esto, las pruebas paramtricas son las que
mayormente son utilizadas por los investigadores, debido a su mayor difusin.
Verificar si las observaciones provienen de una distribucin terica puede
hacerse mediante algn procedimiento estadstico descriptivo (como el
histograma de frecuencias) o a travs de un procedimiento inferencial (como la
prueba de Anderson-Darling, la que se desarrollar ms adelante). Utilizar un
mtodo descriptivo en muchas situaciones podra crear cierta ambigedad en
la toma de decisin sobre la forma de la distribucin del conjunto de datos. Por
este motivo, en esta situacin, un procedimiento inferencial sera lo ms
recomendable.
Otro mtodo inferencial para la verificar si un conjunto de datos se ajusta a una
distribucin terica es la Prueba de Bondad de Ajuste (introducida por Karl
Pearson) cuyo estadstico de prueba se puede ajustar a una distribucin Chi
Cuadrado. Esta prueba consiste en comparar el patrn de las frecuencias de
observaciones de los datos muestrales organizados en categoras con el patrn
esperado de frecuencias basado en una hiptesis nula en particular.
Esa no es la nica utilidad de la distribucin Chi Cuadrado, debido a que
tambin se utiliza para analizar las frecuencias en tablas de doble entrada (o
tablas de contingencia) o para verificar el cumplimiento del supuesto de
homogeneidad de varianzas, requisito exigido en los Diseos Experimentales.
En resumen la distribucin Chi Cuadrado pueden ser utilizada para diferentes
propsitos. Entre las principales pruebas y su respectivo uso tenemos:
1. Pruebas de Bondad de Ajuste, para verificar si un conjunto de datos se ajusta o
no una distribucin terica establecida.
2. Pruebas con Tablas de Contingencia, para analizar la independencia de dos
variables cualitativas u homogeneidad de subpoblaciones
3. Prueba de Homogeneidad de Variancias (Prueba de Barttlet), para verificar la
homogeneidad de varianzas de dos o ms conjuntos de datos.



UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

2

El presente captulo tiene como objetivo presentar el desarrollo de las
Aplicaciones cuyo estadstico de prueba se ajusta a una distribucin Chi
Cuadrado as como indicar la utilidad de cada una de ellas.

1. Pruebas de Bondad de Ajuste
Un investigador luego de recolectar una muestra (a la cual se le observ o
midi ciertas caractersticas o variables) podra tener inters en saber a que
distribucin terica se puede ajustar cada una de las variables que analiz, con
el fin, en muchos casos, de aplicar posteriormente otros procedimientos
estadsticos ms sofisticados.
Por ejemplo:
Cuando se analiza la variable nmero de insectos muertos por m
2
luego
de aplicar un insecticida en un campo experimental, se quiere saber si
esta variable se ajuste a una distribucin de Poisson.
Cuando se quiere determinar si la gestin de un personaje poltico est
distribuido de la siguiente manera: muy buena en un 10%, regular en un
20% y psima en un 70%.

Para poder aplicar adecuadamente esta prueba se debe contar con una tabla
de frecuencias de una variable cualitativa o cuantitativa, de la siguiente
manera:

N
Valor de la variable o
nombre de la categora
Frecuencia
observadas ( )
i
o
1
A
1

1
o
2
A
2

2
o

k
A
k

k
o
Total n

La isima frecuencia observada ( )
i
o indica el nmero de veces que se repite
la categora (o el valor de la variable) en la muestra de tamao n. En otras
palabras,
i
o representa la frecuencia absoluta ( )
i
f , de tal manera que se debe
cumplir que:
1
k
i
i
O n

Esta prueba se aplica cuando se desea verificar si al menos una de las
frecuencias observadas ( )
i
o perteneciente a la i-sima categora o valor de la
variable (mutuamente excluyentes) difiere significativamente de su respectiva
frecuencia terica o frecuencia esperada ( )
i
e .
Cada frecuencia esperada ( )
i
e se obtiene multiplicando el tamao de la
muestra n por la probabilidad terica correspondiente ( )
i
t :
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

3
i i
e np

En algunas pruebas de bondad de ajuste, las probabilidades tericas o
hipotticas ( )
i
t son establecidas por el investigador, mientras que en otras
pruebas deben ser estimadas a partir de la distribucin terica formulada en la
hiptesis nula. De tal manera que se debe cumplir que:
1
1
k
i
i
p

Este valor esperado representa el nmero de observaciones pertenecientes a
la i-sima categora (o valor de la variable), que cabe esperar se obtenga en la
muestra, si la distribucin de probabilidad de la poblacin es la que se formula
en la hiptesis nula.
A partir de la expresin anterior es fcil deducir que:
1
k
i
i
e n
Prueba Estadstica
Debido a las fluctuaciones aleatorias en el proceso de muestreo es razonable
que las frecuencias observadas ( )
i
o y las frecuencias esperadas ( )
i
e no
coincidan. La hiptesis nula afirma que la discrepancia entre dichas frecuencias
no es muy grande.
Como medida de discrepancia, entre las frecuencias esperadas y observadas,
Pearson propuso el siguiente estadstico:
2
2 2
(1 , 1)
1
~
k
i i
c k m
i i
o e
e
a
c c

En la expresin cada diferencia
i i
o e aparece elevada al cuadrado para
evitar que signos contrarios compensen la medida global, pues el inters se
centra en la cuanta de la desviacin y no en su direccin o signo. La diferencia
se pondera por el inverso de la frecuencia esperada, puesto que una
discrepancia grande podra llevar a rechazar el modelo de probabilidad
recogido en la hiptesis nula aunque la i-sima categora o valor de la variable
sea de probabilidad no muy grande.

Regin Crtica
Valores elevados del estadstico _
2
evidencian discrepancias relevantes entre
las frecuencias observadas ( )
i
o y las esperadas ( )
i
e , por lo que deber
rechazarse la hiptesis nula de que dicha muestra procede de una poblacin
con probabilidades tericas
i
t . Por lo tanto si
2 2
(1 , 1) c k a
c c se rechaza H
0
.
El percentil
2
(1 , 1) k m a
c o valor crtico es determinado por el complemento del
nivel de significacin asignado (es decir, 1-) y el nmero de grados de libertad
es el nmero de categoras o valores de la variable en que se dividen los datos
en la tabla de frecuencia (k) (gl = k m 1) menos el nmero de parmetro
estimados a partir de la muestra (m) menos una unidad.
El nmero de parmetros estimados a partir de la muestra (m) son utilizados
para calcular los
i
t y dependen de la distribucin terica propuesta en las
hiptesis y si estos son conocidos o desconocidos.
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

4

En resumen las pruebas de bondad de ajuste tienen como objetivo verificar si
un conjunto de datos se ajusta a una distribucin terica preestablecida por el
investigador. Si bien es cierto que mediante este tipo de prueba se puede
verificar si un conjunto de datos presenta cualquier distribucin terica, en el
presente curso solo se realizarn los siguientes ajustes:
Ajuste a la Distribucin Multinomial conocida tambin como prueba de
frecuencia o de proporciones
Ajuste a la Distribucin Binomial y
Ajuste a la Distribucin de Poisson.

Observaciones:
a. Dado que la distribucin del estadstico
2
c es asinttica se utiliza,
comnmente, como regla de aproximacin aceptable que los valores
esperados deban ser superiores a 5. Si esto no sucede se deben agrupar
las clases que tienen esperado menor a 5 con aquella clase ms cercana y
ms pequea hasta lograr el cumplimiento de esta regla. Este
reagrupamiento produce a su vez una reduccin de los grados de libertad
de la distribucin del estadstico
2
c , al unirse algunas categoras o valores
de la variable X.
b. Si se tiene un solo grado de libertad para el valor crtico o el tamao de la
muestra es pequea (n<50), se puede hacer uso de la Correccin de
Yates, el cual hace un ajuste al estadstico
2
c

( )
2
) 1 , 1 (
1
2
2
~
5 . 0

=


=
m k
k
i
i
i i
c
e
e o
o
_ _



1.1 Ajuste a la Distribucin Multinomial o Prueba de Frecuencia
En esta prueba las probabilidades tericas o hipotticas ( )
i
t son establecidas
por el investigador.
Por ejemplo, en una investigacin la hiptesis nula podra ser que en una
ciudad el 60% de personas prefieren la marca Toyota, el 30% la marca Nissan
y el 10% la marca Volkswagen, mientras que la hiptesis alterna seria al menos
una de las proporciones es diferente a las especificadas.
Como los valores
i
t son conocidos, el nmero de parmetros a estimar a partir
de la muestra m es igual a cero, con lo cual los grados de libertad en el valor
crtico es igual a k -1.

Procedimiento:
1) Planteamiento de la hiptesis.
H
0
: Las categoras estn distribuidas segn las proporciones especificadas
H
1
: Al menos una de las proporciones es diferente a las especificadas

2) Nivel de Significacin (o).

3) Prueba Estadstica
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

5
( )
2
) 1 , 1 (
1
2
2
~

=


=
k
k
i i
i i
c
e
e o
o
_ _


4) Desarrollo de la prueba


5) Criterios de decisin.

0.10
0.08
0.06
0.04
0.02
0.00
Chi Critico 0








No se rechaza H
0
si: _
2
cal
s _
2
crit

Se rechaza H
0
si: _
2
cal
> _
2
crit




6) Conclusin

Ejemplo de Aplicacin
En una fbrica se cuenta con tres mquinas que producen el mismo producto.
El jefe de produccin desea determinar si las mquinas estn produciendo en
diferentes proporciones. Para despejar sus dudas selecciona al azar 135
artculos de la ltima semana de produccin y los clasifica segn la mquina
que lo ha producido. A continuacin se presenta la tabla de frecuencia de las
cantidades producidas por cada mquina:

Mquina A Mquina B Mquina C
43 53 39

Use nivel de significacin 5% para probar si la cantidad producida no es la
misma en las 3 mquinas.

Solucin:
1) Planteamiento de la hiptesis.
H
0
: Las 3 mquinas producen en igual proporcin.
H
1
: Las 3 mquinas no producen en igual proporcin.

2) o=0,05

3) Prueba Estadstica.
2
2 2
(0.95, 1)
1
~
k
i i
c k
i i
o e
e
c c


UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

6

4) Desarrollo de la Prueba
A continuacin se muestra la tabla que contiene las frecuencias observadas,
las frecuencias esperadas entre otros valores que se requieren para esta
prueba.
Mquina
i
o
i
t
i i
e np (o
i
-e
i
)
2
/e
i

A 43 1/3 45
0,08888889
B 53 1/3 45
1,42222222
C 39 1/3 45
0,8
Total 135 1 135
2.31111111

Observe que las probabilidades para cada mquina deben ser las mismas,
pues debe tenerse igual frecuencia terica en el supuesto de que la
produccin es la misma para cada mquina.

2
3
2
1
2.3111
i i
c
i i
o e
e
c


5) Criterios de decisin
0.5
0.4
0.3
0.2
0.1
0.0
X
5.99
0.05
0
Chi-Square, df=2

No se rechaza H
0
si: _
2
c
s 5,9915
Se rechaza H
0
si: _
2
c
> 5,9915


6) Conclusin.
A un nivel de significacin del 5% no se puede afirmar que las 3 mquinas
no producen en igual proporcin.

1.2 Ajuste a la Distribucin Binomial
En esta prueba, las probabilidades tericas ( )
i
t que sern utilizadas para
calcular las frecuencias esperadas deben ser estimadas a partir de la
distribucin Binomial
(1 ) 0,1, 2 ,
( )
0 . .
x r x
r
p p x r
P X x x
c c

| |
=

|
= =

\ .

.



UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

7
Recordemos que la distribucin Binomial tiene dos parmetros r y p y
detonamos que una variable se ajusta a una distribucin Binomial como
X~B(r,p).
El valor de r siempre es conocido debido a que es el nmero de veces que se
realiza el experimento o ensayo de Bernoulli, mientras el valor de p
(probabilidad de xito) puede ser conocido o desconocido.
Si es desconocido debe ser estimado utilizando la muestra a partir del valor
esperado de la distribucin Binomial ( ) E X rp , de tal manera que:
E X
p
r

El valor esperado en una tabla de frecuencia para una variable discreta puede
ser estimado mediante:
1
( )
k
i i
i
x o
E X
n

Por lo tanto, cuando se tiene que estimar el parmetro p a partir de la muestra,
m es igual a uno, con lo cual los grados de libertad en el valor crtico es igual a
k 1 1 = k 2; caso contrario cuando el parmetro p es conocido m seria
igual a cero, con lo cual los grados de libertad en el valor crtico es igual a k 0
1 = k 1.

Procedimiento:
1) Planteamiento de la hiptesis.
H
0
: Los datos provenientes de la variable en estudio "X" se ajusta a una
distribucin terica Binomial.
H
1
: Los datos provenientes de la variable en estudio "X" no se ajusta a una
distribucin terica Binomial.

2) Nivel de Significacin (o)

3) Prueba Estadstica.
( )
2
) 1 , 1 (
1
2
2
~

=


=
m k
k
i
i
i i
c
e
e o
o
_ _

Donde:
o
i
: frecuencia observada para el valor i de la variable X.
e
i
: frecuencia esperada para el valor i de la variable X.
4) Desarrollo de la prueba
5) Criterios de decisin
0.10
0.08
0.06
0.04
0.02
0.00
Chi Critico 0








No se rechaza H
0
si: _
2
cal
s _
2
crit

Se rechaza H
0
si: _
2
cal
> _
2
crit


UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

8

6) Conclusin.

Ejemplo de Aplicacin
Con el fin de realizar afiliaciones a un seguro mdico, un vendedor de plizas
de seguros hace cuatro llamadas diarias. Una muestra de 210 das da como
resultado las frecuencias del nmero de ventas realizadas que son resumidas
en la siguiente tabla de frecuencia:

Nmero de ventas
realizadas
Nmero de das
0 50
1 75
2 65
3 15
4 5

Se desea verificar si el nmero de ventas realizadas diariamente sigue una
distribucin Binomial a un nivel de significacin del 5%.

Solucin:
Procedimiento:
1) Planteamiento de la hiptesis.
H
0
: Los datos provenientes del nmero de ventas realizadas por el vendedor
de seguros se ajustan a una distribucin Binomial.
H
1
: Los datos provenientes del nmero de ventas realizadas por el vendedor
de seguros no se ajustan a una distribucin Binomial.

2) o=0,05

3) Prueba Estadstica.
( )
2
) 1 , 1 (
1
2
2
~

=


=
m k
k
i
i
i i
c
e
e o
o
_ _


4) Desarrollo de la Prueba
Estimamos la media de la poblacin suponiendo que la hiptesis nula es
verdadera.

Nmero de ventas (X)
Nmero de das (
i
o )
i i
x o
0 50 0
1 75 75
2 65 130
3 15 45
4 5 20
Total 210 270

270 1, 2857143
( ) 1.2857143 0.3214286
210 4
E X rp p = = = = =
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

9

Esta probabilidad de xito ser utiliza para calcular las probabilidades tericas
que a la vez servirn para calcular las frecuencias esperadas:
( )
0 4 0
1
4
0 0.321 (1 0.321) 0.212
0
P X t

| |
= = = =
|
\ .


( )
4 4 4
5
4
4 0.321 (1 0.321) 0.011
4
P X t

| |
= = = =
|
\ .

Nmero de ventas (X) Nmero de das (
i
o )
i
t
i i
e np
0 50 0.212023 44.5247586
1 75 0.401727 84.3627004
2 65 0.285438 59.9419187
3 15 0.090138 18.929027
4 5 0.010674 2.2415953
Total 210 1,000000 210

La frecuencia observada de la ltima clase es menor que cinco.
Nmero de
ventas (X)
Nmero de das
(
i
o )
i
t
i i
e np (o
i
-e
i
)
2
/e
i

0 50 0.212023 44.5247586 0.673294359
1 75 0.401727 84.3627004 1.039086694
2 65 0.285438 59.9419187 0.426816269
3 y 4 20 0.1008125 21.1706223 0.064729155
Total 210 210 2.203926477
2
4
2
1
2.2039
i i
c
i i
o e
e
c


5) Criterios de decisin.
Tenemos 4-1-1 = 2 grados de libertad para la estadstica de prueba Chi-
cuadrado

0.5
0.4
0.3
0.2
0.1
0.0
X
5.99
0.05
0
Chi-Square, df=2

No se rechaza H
0
si: _
2
c
< 5,9915
Se rechaza H
0
si: _
2
c
> 5,9915

6) Conclusin.
A un nivel de significacin del 5% no podemos afirmar que la variable
nmero de ventas realizadas no sigue una distribucin Binomial.
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

10

1.3 Ajuste a la Distribucin de Poisson
En esta prueba las probabilidades tericas ( )
i
t , que sern utilizadas para
calcular las frecuencias esperadas deben ser estimadas a partir de la
distribucin de Poisson
( )
0,1, 2...
( )
!
0 . .
x
e
x
P X x
x
c c

=
= =

.

Recordemos que la distribucin de Poisson tiene un parmetro l y detonamos
que una variable se ajusta a una distribucin de Poisson como X~P().
El valor de l puede ser conocido o desconocido.
Si es desconocido debe ser estimado utilizando la muestra a partir del valor
esperado de la distribucin de Poisson ( ) E X l .

Por lo tanto, cuando se tiene que estimar el parmetro l a partir de la muestra
m es igual a uno, con lo cual los grados de libertad en el valor crtico es igual a
k 1 1 = k 2; caso contrario cuando el parmetro l es conocido m seria
igual a cero, con lo cual los grados de libertad en el valor crtico es igual a k 0
1 = k 1.

Procedimiento:
1) Planteamiento de la hiptesis.
H
0
: Los datos provenientes de la variable en estudio "X" se ajusta a una
Distribucin Poisson.
H
1
: Los datos provenientes de la variable en estudio "X" no se ajusta a una
Distribucin Poisson.

2) Nivel de Significacin (o)

3) Prueba Estadstica.
( )
2
) 1 , 1 (
1
2
2
~

=


=
m k
k
i
i
i i
c
e
e o
o
_ _


Donde:
o
i
: frecuencia observada para el valor i de la variable X.
e
i
: frecuencia esperada para el valor i de la variable X.

4) Desarrollo de la prueba

5) Criterios de decisin
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

11
0.10
0.08
0.06
0.04
0.02
0.00
Chi Critico 0








No se rechaza H
0
si: _
2
cal
s _
2
crit

Se rechaza H
0
si: _
2
cal
> _
2
crit


6) Conclusin.

Ejemplo de Aplicacin:
Se cree que el nmero de accidentes automovilsticos diarios en un cruce de
dos avenidas de determinada ciudad tiene una distribucin de Poisson. En una
muestra de 80 das del ao pasado se obtuvieron los datos de la tabla adjunta.
Apoyan estos datos la hiptesis de que el nmero diario de accidentes tiene
una distribucin de Poisson? Use nivel de significacin 0.05.

N accidentes
i
o
0 34
1 25
2 11
3 7
4 3
Solucin:
Procedimiento:
1) Planteamiento de la hiptesis.
H
0
: Los datos provenientes del nmero de accidentes automovilsticos en el
cruce de las avenidas de inters sigue una distribucin de Poisson.
H
1
: Los datos provenientes del nmero de accidentes automovilsticos en el
cruce de las avenidas de inters no sigue una distribucin de Poisson.
2) o=0.05

3) Prueba Estadstica.
( )
2
) 1 , 1 (
1
2
2
~

=


=
m k
k
i
i
i i
c
e
e o
o
_ _

4) Desarrollo de la Prueba
Calculando la media (un parmetro a estimar)

N accidentes (x
i
)
i
o
i i
x o
0 34 0
1 25 25
2 11 22
3 7 21
4 3 12
80 80
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

12
1
80
1
80
k
i i
i
x o
n

=
= = =


A continuacin tenemos otros clculos que nos permiten realizar la prueba y
obtener los grados de libertad de la estadstica de prueba.
( )
( )
0
1
1
1
0 0.3679
0!
e
P X t

= = = =

( ) ( ) ( )
5
4 1 4 1 3 1 0.081 0.019 P X P X P X t = > = < = s = =
N accidentes
i
t
i i
e np
0 0.3679 29.43
1 0.3679 29.43
2 0.1839 14.72
3 0.0613 4.91
4 o mas 0.0190 1.52
1.0000 80.00
Observe que las dos ltimas clases tienen frecuencias menores a cinco
Tenemos la siguiente tabla que resulta de unir las tres ltimas clases.
2
3
2
1
4.3129
i i
c
i i
o e
e
c

5) Criterios de decisin.
Los g.l. para la distribucin Chi- cuadrado de la prueba son: k m - 1 = 4
1 - 1 = 2 grados de libertad.

0.5
0.4
0.3
0.2
0.1
0.0
X
5.99
0.05
0
Chi-Square, df=2

No se rechaza H
0
si: _
2
c
s5,9915
Se rechaza H
0
si: _
2
c
> 5,9915

6) Conclusin.
A un nivel de significacin del 5% no podemos afirmar que la variable
nmero de accidentes automovilsticos en el cruce de las avenidas de
inters no sigue una distribucin Poisson.
N accidentes
(x)
i
o
i i
e np (o
i
-e
i
)
2
/e
i

0 34
29.43 0.7096
1 25 29.43 0.6668
2 11 14.72 0.9401
3 o ms 10 6.42 1.9963
80 80 4.3129
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

13

Ejercicios Propuestos
1. En un estudio para determinar la opinin de los televidentes sobre un nuevo
programa humorstico se tom una muestra aleatoria de 400 personas,
obtenindose los siguientes resultados:

Opinin muy
bueno
bueno regular malo muy
malo
total
Frecuencia 25 60 175 120 20 400

Probar si la opinin de los televidentes respecto al nuevo programa humorstico
no se distribuye en la proporcin: 2:4:6:5:3. Use o = 0.01

2. A continuacin se presenta la informacin del nmero de automviles que
llegaron a una estacin de servicios durante 80 intervalos no superpuestos de 5
minutos cada uno, los cuales fueron seleccionados aleatoriamente

# de automviles
0 1 2 3 4 o mas
# de intervalos
10 18 12 17 23

El nmero de automviles que llegan a la estacin de servicio en un intervalo
dado no se ajusta a una distribucin de Poisson con = 2? . Use o = 0.05.

3. Durante las primeras 13 semanas de la temporada de televisin, se registraron
las audiencias de sbado por la noche, de 8:00 p.m. a 9:00 pm. Como sigue:
ABC 29%, CBS 28%, NBC 25% y otros 18%. Dos semanas despus, una
muestra de 300 hogares seleccionados aleatoriamente arroj los siguientes
resultados de audiencia: ABC 95 hogares, CBS 70 hogares, NBC 89 hogares y
otros 46 hogares. Pruebe, con nivel de significacin 0.05, si han cambiado las
proporciones de telespectadores.

4. Suponga que el nmero de llamadas telefnicas que entran al conmutador de
una empresa durante intervalos de un minuto tiene una distribucin de Poisson.
Los resultados obtenidos de analizar una muestra aleatoria de 100 intervalos
de un minuto de duracin son los siguientes:

N llamadas que entran c/min., X 0 1 2 3 4 5 6
Frecuencia observada 15 31 20 15 13 4 2

Use nivel de significacin 0,10 y los siguientes datos para probar la hiptesis
de que las llamadas que entran no tiene distribucin de Poisson.

5. Suponga que los investigadores desean determinar si el patrn de distribucin
del ingreso familiar en el Per, ha cambiado significativamente durante los
ltimos cinco aos. Se sabe que hace cinco aos la distribucin del ingreso
familiar para las distintas clases de ingreso era la siguiente:




UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

14
Clase de Ingreso ($)
% de todas las familias en la
clase
(1) menos de 3000 9
(2) de 3000 a menos de 5000 11
(3) de 5000 a menos de 7000 12
(4) de 7000 a menos de 10000 22
(5) de 10000 a menos de 15000 27
(6) de 15000 a menos de 25000 15
(7) de 25000 a mas 4
TOTAL 100

Se elige una muestra aleatoria de 1000 familias y se obtiene la siguiente
distribucin:
Clase de Ingreso ($) 1 2 3 4 5 6 7
Nmero de familias 70 100 110 200 300 170 50

Con o = 0,05, el patrn actual de distribucin del ingreso familiar es
significativamente distinto al de hace cinco aos?

6. Durante un periodo fijo se observ la cantidad de accidentes que sufrieron los
operarios de mquinas en cierta industria; los resultados que se obtuvieron se
muestran en la siguiente tabla:
Accidente por operario 0 1 2 3 4 5 6 7 8
# de operarios 296 74 26 8 4 4 1 0 1
Realice una prueba, con un nivel de significacin de 5%, de la hiptesis que
afirma que los datos no provienen de una distribucin de Poisson con promedio
2 accidentes.

7. Un vendedor hace cuatro llamadas diarias. Una muestra aleatoria de 100 das
da como resultado las frecuencias de ventas que vemos a continuacin:



En los registros histricos se observa que las ventas se hicieron en 30% de
todas las llamadas. Suponga que las llamadas son independientes, el nmero
de ventas por da sigue una distribucin binomial? Use un nivel de significaron
del 1%.

2. Pruebas con Tablas de Contingencia
Tablas de Contingencia fxc
Es un cuadro de doble entrada en el cual se recoge la frecuencia conjunta de
los datos de una o varias muestras aleatorias. Estas frecuencias son
clasificadas de acuerdo a las clases categoras de una variable A y a las
clases categoras de una variable B.

Sea "A" una caracterstica con sus categoras a
1
, a
2
, ,a
c
y "B" una caracterstica
con sus categoras b
1
, b
2
,..., b
f




Nmero de ventas 0 1 2 3 4
Nmero de das 30 32 25 10 3
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

15

Caracterstica A
Total
a
1
a
2
a
c

Carac. B
b
1
o
11
o
12
o
1c
n
1.

b
2
o
21
o
22
o
2c
n
2.



b
f
o
f1
o
f2
o
fc
n
r.

Total n
.1
n
.2
n
.c
n..

Donde:
i = 1, 2, ...., f "filas"
j = 1, 2, ...., c "columnas"

1
.
c
i ij
j
n o
1
.
f
i ij
i
n o
1 1
..
f c
ij
i j
n o

A los totales de filas y columnas se les conoce como totales marginales.

La ijsima frecuencia observada
( )
ij
o indica el nmero de veces que se repite
un elemento en las categoras i y j a la vez.
Esta prueba se aplica cuando se desea verificar si al menos una de las
frecuencias observadas
( )
ij
o perteneciente a la ij-sima categora (mutuamente
excluyentes) difiere significativamente de su respectiva frecuencia terica o
frecuencia esperada
( )
ij
e .
Las frecuencias esperadas
( )
ij
e se calculadas de la siguiente manera:
.. ij ij e n p

. . .. i j ij e n p p

|
|
.
|

\
|
|
|
.
|

\
|
=
n
n
n
n
n e
j
i
ij
..
.
..
.
..

n
n n
e
j i
ij
..
. .
=


Prueba Estadstica
Como medida de discrepancia, entre las frecuencias esperadas y observadas,
Pearson propuso el siguiente estadstico:
2
2 2
1 ,( 1) 1
1 1
~
f c
ij ij
c
f c
i j ij
o e
e
a
c c




Regin Crtica
Valores elevados del estadstico _
2
evidencian discrepancias relevantes entre
las frecuencias observadas
( )
ij
o y las esperadas
( )
ij
e , por lo que deber
rechazarse la hiptesis nula de que dicha muestra procede de una poblacin
con probabilidades tericas
i
t . Por lo tanto si
2 2
1 ,( 1) 1
c
f c a
c c se rechaza H
0
.

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

16
A pesar que se puede realizar diferente tipos de inferencia usando tablas de
contingencia en el curso solo se desarrollar las siguientes pruebas:
Prueba de Independencia
Prueba de Homogeneidad de Subpoblaciones

Observaciones:
Si se tiene un solo grado de libertad para el valor critico, el tamao de la
muestra es pequeo (n<50) o existe un valor esperado menor a 5, se puede
hacer uso de la Correccin de Yates, el cual hace un ajuste al estadstico
2
c
2
2 2
1 , 1 1
1 1
0.5
~
f c
ij ij
c
f c
i j ij
o e
e
a
c c



Diferencias entre la prueba de independencia y de homogeneidad

1) La prueba de Independencia se usan para probar si una caracterstica es
independiente de otra, mientras que la prueba de Homogeneidad de
subpoblaciones se usan para probar si una caracterstica se distribuye
homogneamente en 2 ms subpoblaciones, tambin si diferentes
muestras proceden de la misma poblacin.

2) La prueba de independencia supone una sola muestra tomada de una sola
poblacin, mientras que la prueba de Homogeneidad de subpoblaciones
supone 2 ms muestras independientes.

3) En la prueba de Independencia las frecuencias marginales de filas y
columnas son valores aleatorios, en la prueba de Homogeneidad de
subpoblaciones una de las frecuencias marginales (filas columnas) son
valores fijados porque son los tamaos de muestra.


2.1 Prueba de Independencia
Estas pruebas se aplican cuando los datos de una muestra aleatoria son
clasificados de acuerdo a dos caractersticas (variables) y lo que se desea es
probar si las caractersticas utilizadas como criterios de clasificacin son
independientes entre s si existe alguna relacin entre ellas.
En una prueba de independencia los totales marginales de filas y columnas son
aleatorios.



Procedimiento
1) Planteamiento de la Hiptesis
H
0
: Las caractersticas "A" y "B" son independientes (no estn relacionadas)
entre si.
H
1
: Las caractersticas "A" y "B" no son independientes (si estn relacionadas).

2) Nivel de Significacin (o)

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

17
3) Prueba Estadstica
( )
( )( )
2
2 2
1 , 1 1
1 1
~
f c
ij ij
c
f c
i j
ij
o e
e
o
_ _
(

= =



4) Desarrollo de la prueba

5) Criterios de Decisin:
0.10
0.08
0.06
0.04
0.02
0.00
Chi Critico 0







No se rechaza H
0
si: _
2
cal
< _
2
crit

Se rechaza H
0
si: _
2
cal
> _
2
crit



6) Conclusiones.

Ejemplo de aplicacin
El jefe de una planta industrial desea determinar si existe relacin entre el
rendimiento en el trabajo y turno laboral del empleado. Se tom una muestra
aleatoria de 400 empleados y se obtuvo las frecuencias observadas que se
presentan en la siguiente tabla de contingencia:

Rendimiento
en el trabajo
Turno Laboral
Maana Tarde Noche Total
Deficiente 23 60 29 112
Promedio 28 79 60 167
Muy bueno 9 49 63 121
Total 60 188 152 400

Con el nivel de significacin 0.01, La calificacin del rendimiento del
trabajador est asociada con el turno en el que labora el empleado?

Solucin:
1)
H
0
: El rendimiento de un empleado en el trabajo es independiente del turno
en el que labora.
H
1
: El rendimiento de un empleado en el trabajo no es independiente del
turno en el que labora.
2)
o
= 0,01
3) Prueba Estadstica
( )
( )( ) | |
2
1 1 , 1
1 1
2
2
~

= =


=
c f
f
i
c
j ij
ij ij
c
e
e o
o
_ _

4) Desarrollo de la prueba
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

18
La siguiente tabla muestra tanto las frecuencias observadas como las
esperadas (entre parntesis)


Rendimiento
en el trabajo
Turno Laboral
Maana Tarde Noche Total
Deficiente 23
(16.80)
60
(52.64)
29
(42.56)
112
Promedio 28
(25.05)
79
(78.49)
60
(63.46)
167
Muy bueno 9
(18.15)
49
(56.87)
63
(45.98)
121
Total: 60 188 152 400


2 2 2
2
(23 16.80) (28 25.05) (63 45.98)
... 20.18
16.80 25.05 45.98
c
c

5) Criterios de decisin.
0.20
0.15
0.10
0.05
0.00
13.3
0.01
0



Si _
2
> 13.277 se rechaza H
0

Si _
2
13.277 no se rechaza H
0




6) Conclusin
Con nivel de significacin 0,01 se puede afirmar que la calificacin del
rendimiento real de un empleado en el trabajo esta relacionado con el turno
en el que labora

2.2 Prueba de Homogeneidad de Subpoblaciones
Estas pruebas se aplican cuando se desea verificar si una caracterstica tiene
un comportamiento semejante homogneo en dos ms poblaciones. Es
decir, las muestras correspondientes a "C" poblaciones son clasificadas de
acuerdo a las clases categoras de una caracterstica "A".
En una prueba de homogeneidad de subpoblaciones uno de los totales
marginales de filas y columnas es aleatorio y el otro es fijo.

Procedimiento
1) Planteamiento de la Hiptesis
H
0
: Las muestras son extradas de la misma poblacin.
H
1
: Las muestras son extradas de poblaciones diferentes.

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

19
2) Nivel de Significacin (o)

3) Prueba Estadstica
( )
( )( )
2
2 2
1 , 1 1
1 1
~
f c
ij ij
c
f c
i j
ij
o e
e
o
_ _
(

= =



4) Desarrollo de la prueba
5) Criterios de Decisin:
0.10
0.08
0.06
0.04
0.02
0.00
Chi Critico 0






No se rechaza H
0
si: _
2
cal
< _
2
crit

Se rechaza H
0
si: _
2
cal
> _
2
crit



6) Conclusiones.


Ejemplo de aplicacin
Muestras de tres tipos de materiales, sujetos a cambios extremos de
temperatura, produjeron los resultados que se muestran en la siguiente tabla:

Condicin Material A Material B Material C Total
Desintegrados 41 27 22 90
Permanecieron intactos 79 53 78 210
Total 120 80 100 300

Use un nivel de significancia de 0.05 para probar si, en las condiciones
establecidas, la probabilidad de desintegracin es diferente en al menos uno de
los tres tipos de materiales.



1) Formulacin de las hiptesis
H
0
: La probabilidad de desintegracin no difiere los tres tipos de materiales.
H
1
: La probabilidad de desintegracin es diferente en al menos uno de los tres
tipos de materiales.

2) Fijacin del nivel de significacin: 0.05
3) Prueba Estadstica
( )
( )( ) | |
2
1 1 , 1
1 1
2
2
~

= =


=
c f
f
i
c
j ij
ij ij
c
e
e o
o
_ _


4) Desarrollo de la Prueba
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

20
Clculos previos:
Condicin
Tipo de Material
Total
Material A Material B Material C
Desintegrados
41
(36)
27
(24)
22
(30) 90
Permanecieron
intactos
79
(84)
53
(56)
78
(70) 210
Total 120 80 100 300

2 2 2
2
(41 36) (79 84) (78 70)
... 4.575
36 84 70
c
c

5) Criterios de decisin.
0.5
0.4
0.3
0.2
0.1
0.0
X
5.99
0.05
0
Chi-Square, df=2

No se rechaza H
0
si: _
2
c
< 5.9915
Se rechaza H
0
si: _
2
c
> 5.9915


6) Conclusin
Con nivel de significacin 0,05 no se rechaza la hiptesis nula.
Por lo tanto no se puede afirmar que la probabilidad de desintegracin es
diferente en al menos uno de los tres tipos de materiales


Ejercicios Propuestos

1) Se realiz una encuesta para saber si existe una relacin entre el gnero y la
confianza que la gente tiene en la polica. Los resultados de una muestra
aleatoria se presenta en la siguiente tabla:
Gnero
Confianza en la polica
Mucha Regular Muy poca o
ninguna
Hombres 115 56 29
Mujeres 175 94 31

Use un nivel de significacin del 0.05 para probar la afirmacin de que s
existe una relacin del gnero y la confianza a la polica

2) Se realiza un estudio para determinar la relacin entre el tipo de crimen y si
el criminal es un extrao o no. La tabla adjunta lista los resultados de una
encuesta practicada a una muestra aleatoria de vctimas de diversos
crmenes
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

21

Condicin Homicidio Asalto Agresin
El criminal era un extrao 12 379 727
El criminal era un conocido o pariente 39 106 642

A un nivel de significacin de 0.05, pruebe la hiptesis respectiva

3) Un estudio de accidentes automovilsticos seleccionados al azar y
conductores que usan telfonos celulares proporcion los datos de una
muestra aleatoria, que fue resumida en la siguiente tabla de contingencia:

Condicin
Tuvo accidente el
ao pasado
No tuvo accidente el
ao pasado
Usa telfono celular 23 282
No usa telfono celular 46 407

Se desea saber si existe alguna relacin entre la ocurrencia de accidentes y
uso de telfonos celulares. Con base en estos resultados, realice la prueba
correspondiente con un nivel de significacin del 5%.

4) Se recolectaron datos sobre los equipos que ganaron en diferentes deportes,
con los resultados que se dan en la tabla adjunta:

Resultado
Baloncesto Bisbol Jockey Ftbol
americano
Gano equipo local 127 53 50 57
Gano equipo
visitante
71 47 43 42

Use un nivel de significancia de 0.10 para probar la aseveracin de que las
victorias de local/visitante no es independiente del deporte.


5) Una de las preguntas del estudio de suscriptores de 1996 de Bussiness
Week fue: Durante los ltimos 12 meses, en viajes de negocios, qu tipo
de boleto de avin compr con ms frecuencia? Las respuestas obtenidas
se muestran en la siguiente tabla:

Tipo de vuelo
Nacional Internacional
T
i
p
o

d
e

b
o
l
e
t
o

Primera clase 29 22
Clase de negocios o
ejecutiva
95 121
Clase econmica 518 135

Usando nivel de significacin 0.05, pruebe si no existe independencia entre
el tipo de vuelo y tipo de boleto.


6) En el estudio de un taller, se obtuvo un conjunto de datos para determinar si
la proporcin de artculos defectuosos producidos por los trabajadores era la
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

22
misma durante el da, la tarde o la noche. Se encontraron los siguientes
resultados luego de obtener muestras de trabajadores de diferentes turnos:

Condicin
TURNO
Da Tarde Noche
Defectuosos 45 55 70
No
defectuosos
905 890 870

Utilice un nivel de significacin del 5% para determinar si la proporcin de
artculos defectuosos no es la misma para los tres turnos.

7) La enfermera de un colegio llev a cabo un experimento para determinar el
grado de alivio proporcionado por tres remedios para la tos. Cada remedio
se suministr a 50 estudiantes distintos y se registraron los siguientes datos:

Efecto
Remedio para la tos
NyQuil Robitussin Triaminic
Sin alivio 11 13 9
Cierto alivio 32 28 27
Alivio total 7 9 14

Pruebe la hiptesis, con un nivel de significacin del 5%, que los tres
remedios para la tos no son igualmente efectivos.


3. Prueba de Homogeneidad de Variancias
Prueba de Bartlett de Homogeneidad de Variancias (Snedecor y Cochran,
1983)
Esta prueba es utilizada para evaluar si existe homogeneidad de variancias
entre t poblaciones ( ) 2 t > . Los supuestos para la aplicacin de esta prueba
son:
Las muestras provienen de distribuciones normales
Las muestras son independientes.
Las muestras son tomadas al azar.
Nota Importante
Esta prueba estadstica no pertenece al grupo de pruebas no paramtricas.
Es presentada en este captulo como parte de las aplicaciones de la
distribucin Chi Cuadrado dado que ser utilizada como supuesto en los
diseos experimentales

Procedimiento
a) Hiptesis
H
0
:
2 2 2 2
1 2 t
o o o o = = = =
H
1
: Al menos un
2
i
o es diferente 1, 2, , i t =

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

23
b) Nivel de significacin o .
c) Estadstico de prueba
El estadstico de prueba tiene una distribucin Chi-cuadrado con 1 t grados
de libertad
( ) ( ) ( )
( )
( )
( )
2 2
1 1 2
1
1
1
1 1
~
1 1 1
1
3 1 1
1
t t
i p i i
i i
t
t
t
i i
i
i
n LnS n LnS
Q
t n
n
_
= =

=
=
| |

|
\ .
=
(
(
| |
( +
|

(
\ .

(


Donde
i
n es el tamao de la i-sima muestra.
2
i
S es la variancia muestral de cada muestra
2
2
1 2
1
i
n
i
ij i
j
i
i
Y n Y
S
n
=

=


2
p
S es la variancia ponderada de las muestras
( )
( )
2
2 1
1
1
1
t
i i
i
p t
i
i
n S
S
n
=
=


d) Desarrollo de la prueba
e) Criterio de Decisin:
Se rechaza la hiptesis nula con un nivel de significacin o si:
| |
2
1 , 1 t
Q
o
_

> .

f) Conclusiones

Ejemplo de Aplicacin
Una empresa usa 4 mquinas para el llenado de bolsas de detergente. Todas
las mquinas son de la misma marca y modelo. Dichas mquinas estn
programadas para llenar 250 gr. en cada bolsa de detergente. El jefe de
produccin se ha quejado de que las 4 mquinas presentan cierto nivel de
variabilidad en la cantidad de detergente de cada bolsa. Un especialista
encargado por la compaa selecciona al azar 6 bolsas de c/u de las mquinas
y posteriormente pesa las bolsas. Los resultados obtenidos se muestran a
continuacin:

Repeticin
Mquinas
A B C D
1 250.3 249.3 250.0 251.1
2 250.2 246.8 251.1 250.1
3 249.9 248.3 250.9 248.9
4 249.3 247.9 248.3 249.3
5 250.6 249.7 248.9 251.0
6 250.3 249.9 249.9 249.9
Total 1500.6 1491.9 1499.1 1500.3
Promedio 250.10 248.65 249.85 250.05
2
i
S 0.20 1.44 1.20 0.78
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

24

Pruebe el supuesto de homogeneidad de variancias. Use 0.05 o =
4 3 2 1
251
250
249
248
247
Maquina
P
e
s
o
Grfica de caja de Peso

a) Hiptesis

H
0
:
2 2 2 2 2
1 2 3 4
o o o o o = = = =
H
1
: Al menos un
2
i
o es diferente 1, 2, 3, 4 i =

b) 0.05 o =
c) Estadstico de prueba
El estadstico de prueba tiene una distribucin Chi-cuadrado con 1 t grados
de libertad
( ) ( ) ( )
( )
( )
( )
2 2
1 1 2
1
1
1
1 1
~
1 1 1
1
3 1 1
1
k t
i p i i
i i
t
t
t
i i
i
i
n LnS n LnS
Q
t n
n
_
= =

=
=
| |

|
\ .
=
(
(
| |
( +
|

(
\ .

(



d) Desarrollo de la prueba
2
i
S 0.20 1.44 1.20 0.78

2
i
LnS
-1.5896 0.3639 0.1815 -0.2446

( ) 1
i
n 5 5 5 5 20


( ) ( )
2
5 0.20 5 0.78
33.4917
0.905
20 20
p
S
+ +
= = =

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

25
( )
20 0.905 4.7972 5.5139
4.13
1.0833 1 1 1 1
1
3 3 5 5 20
Ln
Q

= = =
( | |
+ + +
|
(
\ .

e) Criterio de Decisin:
0.25
0.20
0.15
0.10
0.05
0.00
X
7.81
0.05
0

Se rechaza la hiptesis nula con
un nivel de significacin 0.05 o =
si:
| |
2
0.95,3
7.8147 Q _ > =


f) Conclusiones
No existe evidencia para rechazar la H
0
. Por lo tanto no se puede afirmar que
las variancias sean heterogneas.

A
251.0 250.5 250.0 249.5 249.0
99
95
90
80
70
60
50
40
30
20
10
5
1
A
P
e
r
c
e
n
t
Mean 250.1
StDev 0.4517
N 6
AD 0.391
P-Value 0.254
Probability Plot of A
Normal

pvalor=0.254
B
252 251 250 249 248 247 246
99
95
90
80
70
60
50
40
30
20
10
5
1
B
P
e
r
c
e
n
t
Mean 248.7
StDev 1.200
N 6
AD 0.255
P-Value 0.576
Probability Plot of B
Normal

p-valor=0.576
C
253 252 251 250 249 248 247
99
95
90
80
70
60
50
40
30
20
10
5
1
C
P
e
r
c
e
n
t
Mean 249.9
StDev 1.095
N 6
AD 0.239
P-Value 0.630
Probability Plot of C
Normal

pvalor=0.63
D
252 251 250 249 248
99
95
90
80
70
60
50
40
30
20
10
5
1
D
P
e
r
c
e
n
t
Mean 250.1
StDev 0.8849
N 6
AD 0.242
P-Value 0.621
Probability Plot of D
Normal

pvalor=0.621

Ejercicios Propuestos
1. Un promotor inmobiliario est considerando invertir en un centro comercial a
construirse en el sector medio de una capital del interior del pas. Para el
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

26
promotor, es muy importante el nivel de los ingresos mensuales de las familias.
Para el estudio, se evalan 4 ciudades: Arequipa, Iquitos, Piura y Trujillo y en
cada una de ellas se seleccionaron muestras aleatorias de ingresos familiares.
Los ingresos mensuales observados en dlares son los siguientes:

Arequipa Iquitos Piura Trujillo
610 710 560 500
560 730 610 400
490 660 470 500
550 610 510 500
460 580 500
620 400
650

Asuma que los ingresos mensuales se distribuyen normalmente.
A un nivel de significacin de 0.05 pruebe el supuesto de homogeneidad de
varianzas.

2. Se realiz un estudio para analizar el tipo de pago efectuado en la compra de
artculos de primera necesidad en supermercados. Se seleccionaron al azar a
15 personas y se contabiliz el nivel de consumo diario (en decenas de nuevos
soles). Los datos se presentan en la siguiente tabla:

Dbito Efectivo Crdito
5.6 5.8 6.2
5.5 5.7 6.1
5.3 5.7 6.3
5.2 5.6 6.2
5.1 5.7 6.2
A un nivel de significacin de 0.05 pruebe el supuesto de homogeneidad de
varianzas.



















UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

27
Resultados con Minitab

Ejemplo de Aplicacin 1: Prueba de Frecuencia
Stat / Tables / Chi Square Goodness of Fit Test (One Variable)

Chi-Square Goodness-of-Fit Test for Observed Counts in Variable: oi
Using category names in oi

Test Contribution
Category Observed Proportion Expected to Chi-Sq
43 43 0.333333 45 0.08889
53 53 0.333333 45 1.42222
39 39 0.333333 45 0.80000

N DF Chi-Sq P-Value
135 2 2.31111 0.315

Ejemplo de Aplicacin 3: Ajuste a una Poisson
Stat / Basic Statistics / Goodness of Fit Test for Poisson

Goodness-of-Fit Test for Poisson Distribution
Data column: Accidentes
Frequency column: oi

Poisson mean for Accidentes = 1

Poisson Contribution
Accidentes Observed Probability Expected to Chi-Sq
0 34 0.367879 29.4304 0.70953
1 25 0.367879 29.4304 0.66693
2 11 0.183940 14.7152 0.93798
>=3 10 0.080301 6.4241 1.99047

N N* DF Chi-Sq P-Value
80 0 2 4.30491 0.116

Ejemplos de Aplicacin 4 y 5: Pruebas con Tablas de Contingencia
Stat / Tables / Chi Square Test (Table in Worksheet)

Ejemplo 4
Chi-Square Test: C1, C2, C3
Expected counts are printed below observed counts
Chi-Square contributions are printed below expected counts

C1 C2 C3 Total
1 23 60 29 112
16.80 52.64 42.56
2.288 1.029 4.320

2 28 79 60 167
25.05 78.49 63.46
0.347 0.003 0.189

3 9 49 63 121
18.15 56.87 45.98
4.613 1.089 6.300

Total 60 188 152 400

Chi-Sq = 20.179, DF = 4, P-Value = 0.000

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

28
Ejemplo 5
Chi-Square Test: C1, C2, C3

Expected counts are printed below observed counts
Chi-Square contributions are printed below expected counts

C1 C2 C3 Total
1 41 27 22 90
36.00 24.00 30.00
0.694 0.375 2.133

2 79 53 78 210
84.00 56.00 70.00
0.298 0.161 0.914

Total 120 80 100 300

Chi-Sq = 4.575, DF = 2, P-Value = 0.101

Ejemplos de Aplicacin 6: Pruebas de Homogeneidad de Varianzas
Stat / ANOVA / Test for Equal Variances


Test for Equal Variances: Peso versus Maquina

95% Bonferroni confidence intervals for standard deviations

Maquina N Lower StDev Upper
1 6 0.250789 0.45166 1.50089
2 6 0.666077 1.19958 3.98626
3 6 0.608000 1.09499 3.63868
4 6 0.491332 0.88487 2.94046


Bartlett's Test (Normal Distribution)
Test statistic = 4.13, p-value = 0.248


Levene's Test (Any Continuous Distribution)
Test statistic = 1.91, p-value = 0.161

4
3
2
1
4 3 2 1 0
M
a
q
u
i
n
a
95% Bonferroni Confidence Intervals for StDevs
Test Statistic 4.13
P-Value 0.248
Test Statistic 1.91
P-Value 0.161
Bartlett's Test
Levene's Test
Test for Equal Variances for Peso



UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

29
Aplicaciones de la Distribucin Chi Cuadrado con Minitab
Prueba de Frecuencia
Stat / Basic Statistics / Chi Square Goodness of Fit Test (One Variable)



Ajuste a la Poisson
Stat / Basic Statistics / Goodness of Fit Test for Poisson



Pruebas con Tablas de Contingencia
Stat / Tables / Chi Square Test (Table in Worksheet)



UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Departamento de Estadstica e Informtica
Mtodos Estadsticos para la Investigacin I
MS Jaime Carlos Porras Cerrn
jaimepc@lamolina.edu.pe

30


Pruebas de Homogeneidad de Varianzas
Stat / ANOVA / Test for Equal Variances

Potrebbero piacerti anche