Sei sulla pagina 1di 41

CUARTA UNIDAD

Cul es la importancia de las


distribuciones muestrales y la estimacin
con intervalos de confianza?

Poblacin
Muestra
aleatoria
150seg.
15seg. P150 X 155 ?

n=50 llamadas

Orientaciones y propsitos
Tiene como propsito estudiar las distribuciones muestrales de la media y de la proporcin muestral
que puedan utilizarse para generar estimaciones puntuales y de intervalos de confianza de la media
poblacin y la proporcin poblacional.

Sumario
1. Cul es la importancia del estudio de las distribuciones muestrales?
2. En que consiste la estadstica inferencial?
3. Qu es la distribucin muestral?
4. Cul es la importancia del teorema del lmite central?
5. Cul el uso de la distribucin muestral de media muestrales?
6. Cul el uso de la distribucin muestral de proporciones muestrales?
7. En qu consiste la estimacin por intervalos para la media poblacional?
8. En qu consiste la estimacin por intervalos para la proporcin poblacional?
Leccin 1

DISTRIBUCIONES MUESTRALES

1. Introduccin
Generalmente las poblaciones son demasiado grandes como para ser estudiadas en su totalidad. Es
necesario seleccionar una muestra representativa de un tamao ms manejable. Esta muestra se
utiliza luego para sacar conclusiones sobre la poblacin. Por ejemplo, se puede calcular la media
muestral, el estadstico X y utilizarlo como un estimado de la media poblacional . El estadstico se
utiliza como estimador puntual del parmetro. Al confiar en una muestra para sacar alguna
conclusin o inferencia sobre la poblacin, se est en la estadstica inferencial.

2. Estadstica inferencial
La estadstica inferencial involucra el uso de un estadstico para sacar una conclusin o inferencia
sobre el parmetro correspondiente. (Webster: 2000,144)
La inferencia estadstica consta de los mtodos mediante los cuales se hacen inferencias o
generalizaciones acerca de una poblacin. La tendencia actual es distinguir el mtodo clsico de
estimacin de un parmetro de la poblacin, donde las inferencias se basan estrictamente en la
informacin obtenida de una muestra aleatoria seleccionada de la poblacin. (Walpole: 2012, 265).
La inferencia estadstica se divide en dos reas principales: la estimacin (puntual y por intervalos) y
la prueba de hiptesis, que veremos ms adelante. (Walpole: 2012,266)

Fig. 4.1 Proceso de estimacin de

Poblacin
X
1, Muestra aleatoria
X
Media Poblaciona
2,
l
X Media Muestral Estadsticos
2 Varianza
Poblaciona l
s Varianza Muestral
2


X n=Tamao de la muestra
N=Tamao de
N la poblacin

Estimador
=? puntual X

Sin embargo, el valor del estadstico depende de la muestra tomada. De cualquier poblacin dada de
tamao N, es posible obtener muchas muestras diferentes de tamao n.
Cada muestra tambin puede tener una media diferente. De hecho, es posible obtener una
distribucin completa de las medias muestrales X s diferentes de varias muestras posibles.
Como un estadstico es una variable aleatoria que depende solo de la muestra observada, debe tener
una distribucin de probabilidad. ((Walpole: 2012,232)

105
3. Distribucin muestral o distribucin de muestreo

La distribucin muestral es una lista de todos los posibles valores de un estadstico y la probabilidad
asociada con cada valor (Webster: 2000,146). Es la distribucin de probabilidad de un estadstico.
(Walpole: 2012,232)

4. Distribucin muestral de las medias muestrales

La distribucin muestral de las medias muestrales es simplemente una lista de todas las medias
muestrales posibles y sus respectivas probabilidades. (Webster:2000,146)

Ejemplo
En un estudio de 500 firmas que aparecen en la revista Fortune sobre los negocios ms grandes de la
nacin, se puede tomar una muestra de n=50. De esta muestra se puede calcular la tasa de
rendimiento promedio X para estas 50 firmas. Esta media muestral servira entonces como un
estimado de que es la tasa promedio de rendimiento de la poblacin para todas las 500 firmas.

De esta lista de 500 firmas, sera posible obtener muchas muestras diferentes de tamao 50.
Especficamente se podra obtener k= 500C50 muestras diferentes de tamao n = 50. Debido a que
500C50 es un nmero ms bien grande.

Ejemplo de los ingresos de estudiantes.


Se asume en aras de la simplicidad de la discusin, se tiene una poblacin de N = 4 ingresos para
cuatro estudiantes universitarios. Estos ingresos son de US$100, US$200, US$300 y US$400. El
ingreso promedio puede calcularse como =US$250. Sin embargo, para hacer las cosas an ms
simples, se puede pensar que calcular la media de cuatro observaciones requiere mucho esfuerzo.
Como alternativa, se decide seleccionar una muestra de n=2 observaciones para estimar el
"desconocido". Se podra entonces seleccionar aleatoriamente una muestra de k=6=4C2 muestras
posibles. Estas seis muestras distintas y sus medias se muestran en la tabla 4.1

Figura 4.2 Esquema de la distribucin de la media muestrales


N=4 ingresos y 6 muestras de tamao n=2

Poblacin de ingresos $

200
X 250 300 100 100
200 X 150
200
300
400
200
X 300 400
? 100
X 200
300

N=4
300 100
X 350 400 ingresos 400 X 250
n=2

106
Tabla 4.1 Todas las muestras posibles de tamao n=2 y poblacin N=4

Elementos muestrales Xi Ingresos promedio de 2


Muestra
(Ingresos de 2 estudiantes) estudiantes ( X )
1 100,200 150
2 100,300 200
3 100,400 250
4 200,300 250
5 200,400 300
6 300,400 350

Con una poblacin de slo N = 4, se puede enumerar cada media muestral posible que aparece en la
tabla 4.1, junto con su respectiva probabilidad. Tal listado se le denomina distribucin muestral y
aparece en la tabla 4.2.

Tabla 4.2 Distribucin muestral para muestras de tamao n=2 y poblacin N=4
Media muestral X Nmero de muestras que dan X Probabilidad de P( X )
150 1 P( X =150)= 1/6
200 1 P( X =200)=1/6
250 2 P( X =250)=2/6
300 1 P( X =300)=1/6
350 1 P( X =350)=1/6
k=6 1

Interpretacin
La probabilidad que el ingreso promedio de dos estudiantes sea $150, es 1/6.

4.1. Error de muestreo


Es la diferencia entre el parmetro poblacional y el estadstico de la muestra utilizado para
estimar el parmetro. (Webster:2000,145)

Debido simplemente al azar se puede seleccionar una muestra de n=2 que conste de US$100
y de US$300. La media resultante de X =US$200 produce un error de muestreo de US$250 -
US$200 =US$50. Por supuesto que nunca se puede calcular realmente el tamao del error de
muestreo debido a que la media poblacional sigue siendo desconocida. Sin embargo, se debe
ser consciente de que es probable que ocurra algn error de muestreo.

4.2. La media de medias


La distribucin muestral de las medias muestrales es simplemente una lista de todas las
medias muestrales posibles. Estas medias muestrales, al igual que cualquier lista de nmeros,
tienen una media denominada la media de las medias muestrales o la gran media. Esta
media de las medias se calcula de la forma usual: las observaciones individuales (medias
muestrales) se suman y el resultado se divide por el nmero de observaciones ( k=muestras).
(Webster:2000,146)

107
La media de las medias
muestrales X X
k

En donde k=6, es el nmero de muestras en la distribucin muestral en la presente distribucin


muestral, se tiene que:

150 200 250 250 300 350


X 250
6

Notar que la media de la distribucin muestralX es igual a la media de la poblacin original


=250. Esto no es coincidencia. La media de la distribucin muestral siempre ser igual a la
media poblacional ( X =)

4.3. La varianza y el error estndar de las medias mustrales


La distribucin de las medias mustrales tambin tiene una varianza. La varianza en las
medias mustrales es como cualquier otra varianza. Mide la dispersin de las observaciones
individuales (medias mustrales) alrededor de su media (la gran media). Adems, esta
varianza se calcula al igual que cualquier otra varianza. (Webster:2000,147)
Es la media del cuadrado de las desviaciones con respecto a su media. Se halla:
1. Determinando la cantidad por la cual cada una de las observaciones (medias mustrales)
difiere de su media (la gran media).
2. Elevando al cuadrado tales desviaciones.
3. Promediando las desviaciones al cuadrado y dividiendo por el nmero de medias
mustrales, k. As se tiene x2 :


Varianza de la distribucin (X X ) 2
( X ) 2

de las medias muestrales 2


x
K K

Dadas las seis medidas muestrales anteriores:


(150 250) 2 (200 250) 2 (250 250) 2 (250 250) 2 (300 250) 2 (350 250) 2
x2 4,167 $ 2
6
Al sacar la raz cuadrada de la varianza en la distribucin de estas medias mustrales, se
tendr el error estndar de la distribucin muestral: x , Asi:

Error estndar de la distribucin


de las medias muestrales x x2

En el caso actual x 4,167 = 64.55 dlares

108
Interpretacin
El error estndar de la distribucin muestral (o error estndar) es una medida de la dispersin
de las medias mustrales alrededor de . Debido a que la diferencia entre X y es el error de
muestreo, mide la tendencia de la media muestral a desviarse de , se le denomina
acertadamente error estndar. Por tanto, el error estndar x mide la tendencia a sufrir del
error de muestreo en el esfuerzo por estimar .

En la tabla 4.3 se presentan algunos estimadores puntuales utilizados con frecuencia.


(Kazmier:1993,145)

Tabla 4.3 Estimadores puntuales.


Parmetro (de la poblacin) Estimadores (de la muestra)
Media poblacional = Media muestral = X
Proporcin poblacional = Proporcin muestral = p
Varianza poblacional = 2 Varianza muestral = s2
Desviacin estndar poblacional = Desviacin estndar muestral = s

Una aproximacin cercana puede obtenerse mediante.

2 y
x2 x
n n

Claro que esto requiere la suposicin que la varianza poblacional 2 sea conocida.
La ltima frmula es apropiada slo si el muestreo se realiza con reemplazo, o si la muestra se
toma de una poblacin muy grande (virtualmente infinita).
Pero, si el muestreo se realiza sin reemplazo y si el tamao de la muestra es ms del 5% de la
poblacin, n> 0.05N, debe aplicarse el factor de correccin para poblaciones finitas (fpc). La
frmula apropiada para el error estndar entonces es:

Error estndar N n
x
utilizando el fpc n N 1

N n
En donde es el fpc. (Kazmier:1993,146)
N 1

Si n es pequea respecto a N (menos del 5%), el fpc se aproxima a 1 y por tanto es


innecesario, pues multiplicar por 1 no cambia el valor del error estndar.

109
Leccin 2
TEOREMA DEL LMITE CENTRAL

1. Introduccin

De la discusin que se ha realizado hasta el momento, es evidente que es posible tomar muchas
muestras de un tamao dado de cualquier poblacin. Estas muestras dan pie a toda una distribucin
de medias muestrales.

2. Muestreo de poblaciones normales


(Levin:1996,333)

2.1. Poblacin de original es normal


Si el muestreo se realiza de una poblacin de origen normalmente distribuida, entonces, la
distribucin de las medias muestrales tambin estar distribuida normalmente. Es decir, que
todas las medias muestrales se graficarn como una distribucin normal. (Webster:2000,150)
Esto se observa en la figura 4.3. La grfica superior muestra que la distribucin de las
observaciones individuales Xi en la poblacin est normalmente distribuida y centrada en una
media de =500 y una desviacin estndar =50.
Las observaciones individuales Xi estn medidas en el eje horizontal.
Figura 4.3 Distribucin de las medias muestrales de una poblacin normal.

=50 La distribucin
de la poblacin

=500 Xi (Observaciones individuales)

La distribucin de las
50 medias muestrales
x / n 10
25

Medias muestrales
X ==500

En la grfica inferior de la figura 4.3 se ve la distribucin de las medias muestrales para todas
las muestras de tamao n=25. Las medias muestrales X s, se miden en el eje horizontal. Estas
medias muestrales tambin estn distribuidas normalmente y estn centradas en la media
poblacional ya que: = = 500
X
Es decir, la media de las medias muestrales es igual a la media de la poblacin. Adems la
dispersin de la poblacin original =50 es mayor que la dispersin de las medidas muestrales
x / n 50 / 25 10. Las Xi estn ms dispersas que lasXS debido a que
x / n .

110
2.2. Poblacin de original no es normal
Cmo sera la distribucin de las medias muestrales si la poblacin original no est distribuida
normalmente. La respuesta la proporcionar el Teorema del Lmite Central.

3. Teorema del lmite central


(Webster:2000,150) (Walpole:2012,234)

El teorema del lmite central dice que para una poblacin cualquiera, a medida que n aumenta, la
distribucin de las medidas muestrales se aproxima a una distribucin normal con media
X = y
un error estndar x .
n
Figura 4.4 Distribucin de las medias muestrales de una poblacin no normal.
Moda
Mediana
Media La distribucin
=100 de la poblacin

=1000 Xi

La distribucin de las
medias muestrales
n=50

X = =1000

La distribucin de las
medias muestrales
n=100

X = =1000

El teorema del lmite central es tal vez uno de los ms importantes de la inferencia estadstica. Nos
asegura que la distribucin de muestreo de la media se aproxima a la normal al incrementarse el
tamao de la muestra.
La importancia del teorema del lmite central es que nos permite usar estadsticas de la muestra para
hacer inferencias, con respecto a los parmetros de la poblacin sin saber nada sobre la forma de la
distribucin de frecuencia de la poblacin ms que lo que podamos obtener de la muestra.
(Levin:1996,338)

La regla general es que si n es por lo menos 30 (n30), entonces el teorema de lmite central
asegurar una distribucin normal en las medias muestrales, incluso si la poblacin de origen no es
normal, ver figura 4.4.

111
Observando la figura 4.4 de la grfica superior, se asume que la poblacin de origen no est
distribuida normalmente, tiene una media de =1000 con una desviacin estndar de =100.

En la grfica del centro se observa la distribucin de las medias muestrales que resultaran si se
tomarn muestra de tamao n=50. La distribucin de las medias muestrales est normalmente
distribuida y centrada en X = =1000.

/ n
Adems, la dispersin de las medias muestrales como lo mide el error estndar es x
100 50 14.14 . Notar que lasXs estn menos dispersas que las observaciones individuales Xi
en la poblacin original.

En la grfica inferior de la figura 4.3 ilustra lo que le sucede a la distribucin deXs a medida que el
tamao de la muestra aumenta. Si el tamao de la muestra aument a n=100, el error estndar se
vuelve
x / n 100 100 10 . Las medias muestrales estn compactadas ms
estrechamente alrededor de la media poblacional =1000.

Como la mayora de las medias muestrales estn ms cerca de la media poblacional, el error
estndar que se obtiene en el esfuerzo por estimar es menor. Por esto, es probable que las
muestras ms grandes produzcan estimados ms precisos de la media poblacional.

4. Ejercicios propuestos

1. Qu entiende por desviacin estndar de la poblacin y por error estndar de la distribucin


muestral de las medias muestrales?. Cmo se relacionan y cmo se diferencian en cuanto a
tamao? Dibuje las grficas en su respuesta.

2. Qu pasa con el error estndar a medida que el tamao de la muestra aumenta? Dibuje las
grficas para ilustrar.

112
Leccin 3
USO DE LA DISTRIBUCIN MUESTRAL
1. Introduccin
La importancia de la discusin anterior puede reconocerse slo si se recuerda que muchas decisiones
se toman con base en los resultados mustrales.
- Un gerente administrativo puede tomar una muestra de un producto para determinar si cumple con
ciertas especificaciones de produccin.
- Un oficial del gobierno tomar una muestra de los residentes para decidir si cierto plan tributario o
programa de bienestar social producir los resultados deseados.
Generalmente, las muestras tienen un impacto muy directo y consecuencial en las decisiones que se
tomen. Por tanto, toda conclusin que se saque o todo conocimiento que se tenga respecto a una
muestra, es muy importante.

2. Uso de la distribucin muestral


Una aplicacin muy comn y de gran utilidad en una distribucin muestral es la de determinar la
probabilidad de que una media muestral ( X ) clasifique dentro de un rango dado. (Webster:2000,152)

En la tercera unidad del presente curso, se determin la probabilidad de seleccionar una observacin
que estuviera dentro de un rango dado. Para tal efecto, se us la frmula z:
X
Z

En la cual X es una observacin nica de inters y es la desviacin estndar poblacional.
Sin embargo, muchas decisiones en los negocios dependen de una muestra completa, no slo de una
observacin. En este caso, la frmula de conversin debe alterarse para explicar el hecho de que
estamos interesados en la media de varias observaciones X. Por tanto, cuando se hace el muestreo,
la frmula de conversin (o frmula-Z) es la siguiente:

X
Z
x

El valor de inters en el numerador no es una observacin nica Xi, sino la media de n observaciones.
Adems, el denominador es el error estndar de la distribucin muestral x . En lugar de determinar
la probabilidad de la duracin de una sola llamada, se puede calcular la probabilidad de que la media
de n observaciones dure un cierto periodo de tiempo.

Ejemplo Telcom
TelCom Satlite presta servicios de comunicacin a los negocios del rea metropolitana de Chicago.
Los funcionarios de la compaa han aprendido que el tiempo promedio de transmisin satelital en el
rea () es de 150 segundos, con una desviacin estndar () de 15 segundos. Los tiempos parecen
estar distribuidos normalmente.

113
Para estimar la demanda del cliente por sus servicios y establecer una estructura de tarifas que
maximice las utilidades corporativas, TelCom debe determinar qu tan probable es que algunas
llamadas se presenten. El director de servicios desea que usted proporcione estimados de:

a. La probabilidad de que una (1) sola llamada dure entre 150 y 155 segundos
Xs = tiempos de trasmisin en la poblacin

Poblacin de tiempos
150seg.
15seg.
P150 X 155 ?

Se resuelve usando la distribucin normal visto en la unidad anterior:


X 155 150
Z 0.33 en la tabla normal da una rea de 0.1293
15
Por tanto, P(150 X 155) = P(0 Z 0.33)=0.1293. Esto se muestra en la grfica superior de la
figura 4.4.
Interpretacin
Existe un 12.93% que una (1) sola llamada dure entre 150 seg y 155 seg.

b. La probabilidad de que el tiempo promedio de n=50 llamadas ( X ) est entre 150 y 155 segundos.
X =tiempo promedio de trasmisin en la muestra de 50 llamadas.

Se resuelve usando la distribucin de medias muestrales:

X 155 150
Z 2.36 en la tabla normal da una rea de 0.4909
15
n 50

Poblacin de tiempos
Muestra aleatoria
150seg.
15seg. P150 X 155 ?

n=50 llamadas

Por tanto, P(150 X 155) = P(0 Z 2.36) = 0.4909 (ver tabla normal)
Interpretacin
Existe un 49.09% que el tiempo promedio de 50 llamadas dure entre 150 seg y 155 seg.

Como se observa en la grfica inferior de la figura 4.5. La gran diferencia en las probabilidades se
debe al hecho de que las medias muestrales estn menos dispersas que las observaciones
individuales ya que lasXs estn ms compactas alrededor de =150, como lo muestran las
grficas

114
Figura 4.5 Probabilidades para TelCom

a) P(150X155)
0.1293

=150 155 Xi (segundos)

=0 0.33 Z

b) P(150 X 155
0.4909

X (segundos)
X ==150 155

=0 2.36 Z

Ejemplo TelCom nuevos equipos


TelCom planea instalar nuevos equipos que mejoraran la eficiencia de sus operaciones. Sin
embargo, antes que los ejecutivos puedan decidir si dicha inversin ser eficaz en funcin de los
costos deben determinar la probabilidad de que el promedio de una muestra de n=35 llamadas.
a) Est entre 145 y 150. d) Est entre 145 y 155.
b) Sea mayor que 145. e) Sea mayor que 155
c) Sea menor que 155.

Solucin:
Figura 4.6 Esquema para TelCom nuevos equipos

Poblacin de tiempos
Muestra
aleatoria
a.P145 X 150
150seg. b.P X 145

15seg. c.P X 145


d .P145 X 155
e.P X 155

n=35 llamadas

X =tiempo promedio de trasmisin con nuevos equipos en la muestra de 35 llamadas.

115
a. P(145 X 150)

0.4756

145 =150 X (segundos


)

-1.97 Z
=0

X 145 150
Z 1.97 de la tabla normal da una rea de 0.47756
x 15
35
P (145 X 150) = P(-1.97 Z 0) = 0.4756

b. P( X 145)

0.4756 0.5000

145 =150
X (segundos)
-1.97
Z
=0

X 145 150
Z 1.97 de la tabla normal da una rea de 0.4756
x 15
35
P( X 145) = P(Z -1.97) = P(0 Z 1.97)+0.5000 = 0.4756 + 0.5000 = 0.9756

c. P( X 155)

0.5000 0.4756

=150 155
X (segundos)

Z
=0 1.97
X 155 150
Z 1.97 de la tabla normal da una rea de 0.4756
x 15
35
P( X 155) = P(Z 1.97) = 0.5000+P(0 Z 1.97) = 0.5000+0.4756 = 0.9756

El resto de la solucin est en el Webster:2000, pag. 153.

116
Ejemplo
Es posible determinar la probabilidad de error considerando una poblacin con una media de =25 y
una desviacin estndar de =8.5. Como se muestra en la figura 4.6, si se toma una muestra de
n=50, se presentar un error de muestreo de 2 o ms si la media muestral es 27 o ms, o 23 o
menos.
Por tanto, P(error) = P( X 27) + P( X 23)

X 27 25
Z 1.66 da una rea de 0.4515
8.5
n 50

X 23 25
Z 1.66 da una rea de 0.4515
8.5
n 50

P( X 27) = P(Z 1.66) = 0.5000 0.4515 = 0.0485.


P( X 23) = P(Z -1.66) = 0.5000 0.4515 = 0.0485.
Entonces el P(error 2) = 0.0485 x 2 = 9.7%
Figura 4.6 La probabilidad de error

0.4515 0.4515
0.0485 0.0485
23 =25 27
X
Z
-1.66 =0 1.66

Interpretacin
Existe casi un 10% de probabilidad de que el error de muestreo resultante en su intento por estimar
sea por lo menos dos.

3. Ejercicios propuestos
1. Las latas de gaseosas vendidas en el supermercado tienen un promedio de 16.1 onzas, con una
desviacin estndar de 1.2 onzas. Si se toma una muestra de n=200, cul es la probabilidad de
que la media sea:
a. Por lo menos 15.93?
b. Entre 15.9 y 16.3?
2. El consumo diario de agua en una ciudad promedia 18.9 galones por hogar, con una
desviacin estndar de 3.6 galones. El alcalde de la ciudad desea estimar esta media no
conocida con una muestra de 100 hogares. Qu tan probable es que el error de muestreo
exceda los 0.5 galones? Rpta.0.1646 (Webster:2000,157)

117
Leccin 4
LA DISTRIBUCIN DE LAS PROPORCIONES MUESTRALES

1. Introduccin
Aunque la discusin hasta ahora se ha concentrado exclusivamente en las medias, muchos asuntos
de negocios tratan de la proporcin poblacional .
- Una firma de marketing puede querer averiguar si un cliente (1) compra o (2) no compra el
producto.
- Muchas firmas deben determinar la probabilidad de que un proyecto para presupuestar capital (1)
generar o (2) no generar un rendimiento positivo.

2. Distribucin de las proporciones muestrales

La distribucin muestral de las proporciones es simplemente una lista de todas las proporciones
muestrales posibles y sus respectivas probabilidades. (Webster:2000,157)

Utilizar la proporcin muestral p para estimar el parmetro desconocido ., ver figura 4.7
Fig. 4.7 Proceso de estimacin de

Poblacin
X1
, Muestra aleatoria

X2 Estadstico
Proporcin
, poblaciona l
p proporcin muestral

XN
parmetro
n=Tamao de la muestra
N=Tamao de la poblacin

Estimador puntual
=? p

El proceso de las proporciones mustrales es muy similar al de las medias. De cualquier poblacin es
posible obtener muchas muestras diferentes de un tamao dado. Cada muestra tendr su propia
proporcin p de "xitos". Sin embargo, al igual que con las medias, el valor esperado de la
distribucin muestral de las proporciones mustrales ser igual a la proporcin de xitos en la
poblacin: E(p) = .

Ejemplo Sobre el anuncio publicitario


Una compaa pregunta a toda la poblacin N=4 clientes si vieron el anuncio publicitario de la
compaa en el peridico de esta maana. Se registr una respuesta de si como xito, y de "no"
como fracaso. Los cuatro clientes respondieron S1, N2, N3 y S4. La proporcin poblacional de xitos es

118
=0.50. Se tomaron muestras de tamao n=2, y la proporcin de xitos se registra en la figura 4.8 y
tabla 4.4.

Fig. 4.8 Esquema de la distribucin de las proporciones


ejemplo anuncio publicitario

Poblacin de respuestas
S1,N2 p=1/2
N2 ,N3
??
p=0/2

S1,N3 p=1/2
p=1/2 N2 ,S4 S1 , N2 , N3 , S4

p=1/2
S1,S4 p=2/2
N3 ,S4

n=2
n=2
N=Tamao de la poblacin

Tabla 4.4 Distribucin de las proporciones muestrales para todas las muestras posibles de tamao
n=2 de una poblacin de N=4 clientes.
Xi Nmeros de xitos p(proporcin de xitos)
S1, N2 1 0.50
S1, N3 1 0.50
S1 , S4 2 1.00
N2, N3 0 0.00
N2, S4 1 0.50
N3, S4 1 0.50
3.00

2.1 La media o valor esperado de la distribucin muestral de las proporciones muestrales

El valor esperado (media) de la distribucin muestral de la proporcin muestral es:

Media de la distribucin muestral p


E ( p)
de las proporciones muestrales K

2.2 Error estndar de la distribucin muestral de las proporciones muestrales

Error estndar de la distribucin muestral ( )(1 )


p
de las proporciones muestrales n

De la misma manera que con las medias, si n > 0.05N, se requiere el fpc y el error estndar se
vuelve. (Webster:2000,158)

119
( )(1 ) N n
p
n N 1

En ese caso del ejemplo del anuncio publicitario


p 3
E ( p) 0.50
K 6

(0.50)(1 0.50) 4 2
Y utilizando el fpc: p 0.289
2 4 1

3. Utilidad
Las herramientas desarrolladas para las proporciones muestrales permiten determinar las
probabilidades que pueden ser muy tiles en la toma de decisiones importantes. Esto se logra
aplicando la desviacin normal a la distribucin de proporciones muestrales. (Webster:2000,158)
p
Z
p

Ejemplo. Defectos en telfonos celulares.


Una compaa adquiere componentes para sus telfonos celulares en lotes de 200 de una firma. El
componente tiene una tasa de defectos () del 10%. Una poltica establecida recientemente por la
compaa establece que si el siguiente envo tiene:
a. Ms del 12% de defectos en la muestra, definitivamente buscar un nuevo proveedor.
b. Entre el 10 y el 12% de defectos en la muestra, considerar un nuevo proveedor.
c. Entre el 5 y el 10% de defectos en la muestra, definitivamente no conseguir un nuevo proveedor.
d. Menos del 5% de defectos en la muestra, incremntala sus pedidos.
Cul decisin es ms probable que tome la compaa?

Solucin
Debido a que el tamao de la poblacin N no se suministra, se asume que la compaa compra
muchos componentes y el tamao de la muestra de n=200 es menor que 0.05N y el fpc por tanto no
se necesita. p= tasa de defectos en la muestra de 200.

Figura 4.9 Esquema defectos en telfonos celulares

Poblacin de componentes
Muestra aleatoria

a. P p 0.12
0.10 b. P0.10 p 0.12
c. P0.05 p 0.10
d . P p 0.05

N= grande n=200
ccompo
nentes

120
(0.10)(0.90)
p 0.021
200

a. P(p > 0.12)

0.4913 0.3289
0.0087 0.1711
0.05 =10 0.12 p

Z
-2.38 =0 0.95

0.12 0.10
Z 0.95 de la tabla normal da una rea de 0.3289
0.021

P(p > 0.12) = P(Z > 0.95) = 0.5000 P(0 Z 0.95) = 0.5000 0.3289 = 0.1711

b. De la parte a, P(0.10 p 0.12) = P(0 Z 0.95) = 0.3289

c. P(0.05 p 0.10):
0.05 0.10
Z 2.38 de la tabla normal da una rea de 0.4913
0.021

Entonces: P(0.05 p 0.10) = P(-2.38 Z 0) = P(0 Z 2.38)= 0.4913

d. P(p < 0.05) = P(Z -2.38) = 0.5000 P(-2.38 Z 0)= = 0.5000 0.4913 = 0.0087

Interpretacin
Como la parte c. tiene la probabilidad ms alta, la compaa se quedar con su proveedor actual.

4. Ejercicios propuestos
1. La proporcin de todos los clientes de Pizza Hut que comen en el sitio es del 75%. En una
muestra de 100 clientes, cul es la probabilidad de que menos del 20% lleven su comida a
casa?

2. El 60% de las reses de una manada grande tiene ntrax. De las 100 reses seleccionadas
aleatoriamente cul es la probabilidad de que por lo menos 50 tengan que ser apartadas de la
manada?

121
Leccin 5
FUNDAMENTO DEL INTERVALO DE CONFIANZA
1. Estimadores
Un estimador es la regla o procedimiento, generalmente expresado como una frmula, que se utiliza
para derivar la estimacin. (Wester:2000,186)
1.1. Estimador puntual
Un estimador puntual utiliza un estadstico para estimar el parmetro en un solo valor o punto.
(Webster:2000,170)
Ejemplo
El gerente de la tienda puede seleccionar una muestra de n=500 clientes y hallar el gasto
promedio de X = US$ 37.10. Este valor sirve como una estimacin puntual para la media
poblacional.

1.2. Estimador por intervalos


Especifica el rango dentro del cual est el parmetro desconocido, asociado con un nivel de
confianza. (Webster:2000,170)
Una estimacin por intervalo describe un intervalo de valores dentro del cual es posible que este
un parmetro de poblacin. (Levin:1996,372)
Las estimaciones por intervalo gozan de ciertas ventajas sobre las estimaciones puntuales.
Debido al error de muestreo, probablemente X no ser igual a . Sin embargo, no hay manera
de saber qu tan grande es el error de muestreo. Por tanto, los intervalos se utilizan para
explicar esta discrepancia desconocida.
Ejemplo
El gerente puede decidir que la media poblacional est en algn sitio entre US$35 y US$38. Tal
intervalo con frecuencia va acompaado de una afirmacin sobre el nivel de confianza que se da
en su exactitud. Por tanto se llama intervalo de confianza (I. C.).
El gerente mencionado anteriormente puede tener un 95% de confianza en que la media
poblacional est entre US$35 y US$38.

2. Fundamento de un intervalo de confianza


Un intervalo de confianza tiene un lmite inferior de confianza (LIC) y un lmite superior de confianza
(LSC). Estos lmites se hallan calculando primero la media muestral, X . Luego se suma una cierta
cantidad a X para obtener el LSC, y la misma cantidad se resta de X para obtener el LIC.
(Webster:2000,171)
Cmo se puede construir un intervalo y luego argumentar que se puede tener un 95% de confianza
en que contiene , si incluso no se sabe cul es la media poblacional? Vale la pena recordar sobre la
Regla Emprica que el 95.5% de todas las medias muestrales caen dentro de dos errores estndar de
la media poblacional.
122
Entonces la media poblacional est mximo a dos errores estndar del 95.5% de todas las medias
muestrales. Por tanto, al comenzar con cualquier media muestral, si se pasa de dos errores estndar
por encima de dicha media y dos errores estndar por debajo de ella, se puede tener un 95.5% de
confianza en que el intervalo resultante contenga la media poblacional desconocida.
Entonces, la clave es recordar: como la media poblacional est a lo ms a dos errores estndar para
el 95.5% de todas las medias muestrales, entonces dada una media muestral cualquiera, se puede
estar 95.5% seguro de que el intervalo de dos errores estndar alrededor de dicha media muestral
contiene la media poblacional desconocida.
Si se desea construir un intervalo ms convencional del 95% (en lugar del 95.5% discutido
anteriormente), cuntos errores estndar se debe mover por encima y por debajo de la media
muestral?
Cmo se halla?
Como lo demuestra la figura 4.10, debido a que la tabla Normal contiene valores slo para el rea que
est por encima o por debajo de la media, se procede asi:
- Se divide el 95% por 2, produciendo 0.4750.
- Luego, se halla el valor de Z, correspondiente a una rea de 0.4750, el cual es Z=1.96.
- Este valor del 95% es llamado coeficiente de confianza.
Figura 4.10 Intervalo de confianza del 95% para estimar la media poblacional

(1-) = 0.95

0.4750 0.4750

LIC =? LSC XS
1.96 X 1.96 X

3. Coeficiente de confianza
Es el nivel o grado de confianza que se tiene en el que el intervalo contenga el valor desconocido del
parmetro. (Webster:2000,171)
Existe tres niveles de confianza que se utilizan con mayor frecuencia con los intervalos de confianza y
son: 99, 95, y 90%. Estos tres niveles de confianza, denominados coeficientes de confianza, son
simplemente convencionales.

4. Intervalo de confianza para la media poblacional .


Muestras grandes (n30) utilizar la distribucin normal. (Webster:2000,172)
4.1 Intervalo de confianza para la media poblacional.
Un intervalo de confianza para la media es un estimador de intervalo que se construye con
respecto a la media muestral y que permite especificar la probabilidad de que se incluya el valor
de la media poblacional. (Kasmier,p.149)

123
Uno de los usos ms comunes de los intervalos de confianza es estimar la media poblacional.
Ejemplo: un fabricante puede querer estimar la produccin mensual promedio de su planta,etc.
Recordar que el intervalo se forma utilizando la media muestral como una estimacin puntual
para el cual se adiciona y se resta un cierto valor para obtener los lmites superior e inferior del
intervalo de confianza, respectivamente. Por tanto el intervalo es:
4.2 Intervalo de confianza para estimar cuando es conocido.
(Webster:2000,173) (Walpole:2012,270)(Kazmier:1993,149)

Se requiere la suposicin que la desviacin estndar poblacional es conocida.

Intervalo de confianza para estimar


cuando es conocido X Z X

X Z X es lo mismo que X Z X X Z X

Cunto debe sumarse y restarse, depende en parte del nivel de confianza deseado, estipulado
por el valor de Z. Un nivel de confianza del 95% requiere un valor de Z de 1.96 (0.95/2 = 0.4750).
El rea de 0.4750 corresponde a un valor de Z de 1.96.
Ejemplo
Un promotor inmobiliario quien intenta construir un gran centro comercial. Puede estimar en el
rea el ingreso promedio por familia () como indicador de las ventas esperadas. Una muestra
de n=100 familias da una media de X =US$35,500. Se asume que la desviacin estndar

poblacional es = US$7,200. Dado que: X , se estima un intervalo del 95% como:
n
Solucin:
Esquema
Poblacin de ingresos
Muestra aleatoria

X Z X
X $35,500
?
$7,200
n=100 familias

7,200
I.C. para estimar = 35,500 (1.96)
100
34,088.80 36,911.20

4.2.1 Interpretaciones de un intervalo de confianza


a. El promotor tiene un 95% de confianza en que el ingreso promedio por familia en la
poblacin est entre US$ 34,088.80 y US$ 36,911.20. Aunque el valor real para la
media poblacional sigue siendo desconocido, el promotor tiene un 95% de confianza
en que est entre estos dos valores. (Webster:2000,173)
b. Si se construyen todos los NCn intervalos de confianza, el 95% de ellos contendr la
media poblacional desconocida.

124
4.2.2 Valor alfa
Esto por supuesto significa que el 5% de todos los intervalos estara errado (no
contendran la media poblacional). Este 5%, hallado como (1-coeficiente de confianza),
es denominado el valor alfa y representa la probabilidad de error. (Webster:2000,173)
El valor alfa es la probabilidad de que cualquier intervalo dado no contenga la media
poblacional desconocida.

4.3 Intervalo de confianza para estimar cuando es desconocido.


(Webster:2000,173) (Walpole:2012,276) (Kazmier:1993,149)

En el evento probable que sea desconocida, la desviacin estndar de la muestra (s) debe
substituirse:
Intervalo de confianza para estimar
cuando es desconocido X Zs X
s
en donde: s X
n
Ejemplo
El contador Gerber, registra las declaraciones de impuestos de sus clientes. Desea estimar la
cantidad promedio que deben () al Servicio de Renta Interna. De los 50 clientes que seleccion
en su muestra, la cantidad promedio que se adeudaba ( X )es de US$ 652.68. Ya que la
desviacin estndar de todos sus clientes es desconocida. Gerber debe estimar con la
desviacin estndar de la muestra de s=US$217.43. Si se desea un nivel del 99% de confianza,
el valor de Z apropiado es 2.58 (0.99/2 = 0.4950). De la tabla normal, un rea de 0.4950 revela
que Z= 2.58.
Solucin:

Poblacin de declaraciones
Muestra aleatoria
X Zs X
X $652.68
? s $217.43
?
n=50 clientes

I.C. para estimar X Zs X


217.43
= US$ 652.68 2.58
50
US$573.35 US$732.01
Interpretacin
El seor Gerber puede tener un 99% de confianza en que la cantidad promedio que deben todos
sus clientes al Servicio de Renta Interna (SRI) est entre US$ 573.35 y US$ 732.01
A continuacin, en la tabla 4.5 se presentan los valores de Z que se requieren para construir
intervalos.

125
Tabla 4.5 Proporciones seleccionadas de rea bajo la curva normal.
(Kazmier:1993,149)

Z (nmero de unidades de la desviacin Proporcin de rea en el intervalo


estndar de la media) X Z X
1.65 90%
1.96 95%
2.00 95.5%
2.06 96%
2.33 98%
2.58 99%

5. Ejercicios propuestos
1. Para estimar el gasto promedio de los clientes en el McDonalds local, los estudiantes de una
clase de estadstica toman una muestra de 200 clientes y encuentran un gasto promedio de US$
5.67, con una desviacin estndar de US$ 1.10 Cul es el intervalo de confianza del 95% para
los gastos promedio de todos los clientes? Interprete sus resultados. (Webster,175-176).

2. Un estudio realizado por los profesores en una universidad de Kansas est diseado para
ofrecer inferencias sobre las tasas de desempleo por condado en Estados Unidos. Una muestra
de 200 condados reporta una tasa promedio del 6.2%, con una desviacin estndar del 1.7%. A
un nivel de confianza del 90%. cul es el estimado de la tasa de desempleo promedio por
condado en la nacin? Interprete sus resultados.

3. Un teatro de cine local desea desarrollar un intervalo para estimar las cajas promedio de
palomitas de maz que se venden por sala de cine. Si los registros llevados para 70 salas revelan
un promedio de 54.98 cajas y una desviacin estndar de 12.7, calcule e interprete un intervalo
de confianza del 92% para la media poblacional.

126
Leccin 6
INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL.
MUESTRAS PEQUEAS DISTRIBUCIN t

1. Introduccin
En muchos casos una muestra grande no es posible. No siempre puede ser posible obtener ms de
30 observaciones.
Ejemplos
- Para una compaa de seguros que prueba la resistencia al impacto de los autos, destruir a
propsito 30 vehculos de lujo puede volverse un poco costoso.
- Un investigador mdico que prueba una nueva medicina puede no encontrar 30 personas
dispuestas a actuar como conejillo de indias.
Cuando debe tomarse una muestra pequea, la distribucin normal puede no aplicarse.
El teorema del lmite central asegura normalidad en el proceso de muestreo slo si la muestra es
grande.

2. Distribucin t
Cuando se utiliza una muestra pequea, puede ser necesaria una distribucin alternativa, la
distribucin t Student (o simplemente la distribucin t). Se utiliza cuando se cumplen las tres
condiciones: (1) la muestra es pequea, (2) es desconocida, y (3) la poblacin es normal o casi
normal. (Webster:2000,176)

La distribucin t tiene una media de cero, es simtrica con respecto a la media y oscila entre - y +
. La varianza de la distribucin t es mayor que 1. Por tanto, es ms plana y ms dispersa que la
distribucin normal. La varianza para la distribucin t es:
Varianza de la n 1
2
distribucin t n3

La varianza depende de los grados de libertad (g.l.), definidos como el nmero de observaciones que
se pueden escoger libremente. Es el nmero de observaciones menos el nmero de restricciones
impuestas sobre tales observaciones.

3. Intervalo de confianza para estimar la media poblacional (muestras pequeas)


(Walpole:2012,275) (Kazmier:1993,150) (Webster:2000,176)

La distribucin t producir un intervalo ms amplio que la distribucin Z, si sta se utilizara. Este


ancho adicional es necesario debido a que se pierde algo de precisin porque es desconocida y
debe estimarse. El estadstico t se calcula en gran parte como el estadstico Z.
El estadstico t X
t
sX

Reescribiendo algebraicamente la frmula t, para expresarlo como un intervalo de confianza para


estimar se tiene que:

127
Intervalo de confianza para estimar la
X t s X X t
s
media poblacional (muestras pequeas) n
(Webster:2000,177)
Uso de la tabla de la distribucin t
Para ilustrar, se asume que se desea un intervalo de confianza del 95% y se tiene una muestra de 20
observaciones. Debido a que n=20, los grados de libertad son g.l.=n-1= 19.
- Bajando por la primera columna en la tabla t bajo g.l. hasta 19.
- Se mueve a travs de dicha fila hacia la columna encabezada por un nivel de confianza de 0.95
para las pruebas de dos colas. (Se ignoran las dos filas referentes a las pruebas de una cola.
Estas se tratarn en la cuarta unidad).
- La entrada resultante de 2.093 es el valor t apropiado para un intervalo de confianza del 95%
con un tamao muestral de 20 (g.l. = 19).

Ejemplo
Una empresa de construccin fue culpada de inflar los comprobantes que registra para los contratos
de construccin con el gobierno federal. El contrato estableci que un cierto tipo de trabajo debera
promediar US$ 1,150. Por motivos de tiempo, los directivos de slo 12 agencias del gobierno fueron
llamados a dar testimonio ante la corte respecto a los comprobantes de la empresa. Si se descubri a
partir del testimonio una media de US$1,275 y una desviacin estndar de US$235, un intervalo de
confianza del 95% apoyara el caso legal de la empresa? Se asume que los montos de los
comprobantes son normales.
Solucin

Poblacin de contratos
Muestra aleatoria

X t
s
X $1,275
n
s $235
?
n=12 agencias

Un nivel de confianza del 95% con g.l =12-1=11 resulta de la tabla de la distribucin t un valor t de
2.201. Entonces:
I.C. para estimar X t
s 235
1,275 2.201
n 12

US$ 1,125.69 US$ 1,424.31


Interpretacin
La corte puede tener un 95% de confianza en que el promedio de todos los comprobantes est entre
US$1,125 y US$1,424. Este intervalo contiene los US$1,150 acordados, fortaleciendo la defensa de
la empresa.

128
Leccin 7
INTERVALO DE CONFIANZA PARA
LA PROPORCIN POBLACIONAL

1. Introduccin

Las decisiones dependen con frecuencia de parmetros que son binarios, parmetros con slo dos
posibles categoras dentro de las cuales pueden clasificase las respuestas. En este evento, el
parmetro de inters es la proporcin poblacional.
Ejemplos
- Una empresa puede desear saber qu proporcin de sus clientes paga a crdito en oposicin a
quienes utilizan efectivo.
- Las corporaciones con frecuencia estn interesadas en qu porcentaje de sus productos son
defectuosos en oposicin al porcentaje que no es defectuoso.

En la unidad anterior se encontr que si n y n (1 -) son ambos mayores que 5, la distribucin de


las proporciones muestrales ser normal y la distribucin muestral de la proporcin muestral tendr
una media igual a la proporcin poblacional y un error estndar de:

Error estndar de la distribucin muestral ( )(1 )


p
de las proporciones muestrales n

Sin embargo, la frmula del error estndar contiene , el parmetro que se desea estimar. Por tanto,
la proporcin muestral p se utiliza como estimador de ; y puede replantease como:

Estimacin del error estndar de la distribucin ( p )(1 p )


muestral de las proporciones muestrales sp
n

2. Intervalo de confianza para la proporcin poblacional


(Webster:2000,180) (Kazmier:1993,165) (Walpole:2012,297)

El intervalo de confianza es entonces

Intervalo de confianza para estimar


p Zs p
la proporcin poblacional

Ejemplo
El gerente de una estacin de televisin debe determinar en la ciudad qu porcentaje o proporcin
de casas () tiene ms de un televisor. Una muestra aleatoria de 500 casas revela que 275 tienen
dos o ms televisores. Cul es el intervalo de confianza del 90% para estimar la proporcin de
todas las casas () que tienen dos o ms televisores?

Solucin

129
Poblacin
Muestra aleatoria

? p Zs p p
275
500
0.55

n=500 casas

p=proporcin en la muestra de 500 casas con ms de televisor.


Dados estos datos, p= 275/500= 0.55, (pty:

(0.55)(1 0.55)
sp 0.022
500

La tabla normal da un valor de Z de 1.65 para un intervalo de confianza del 90%.

I.C. para estimar = 0.55 (1.65) (0.022)


= 0.55 0.036
0.514 0.586
Interpretacin
El gerente puede tener un 90% de confianza que entre el 51.4% y el 58.6% de las casas de la ciudad
tienen ms de un televisor.

3. Ejercicios propuestos
1. Como respuesta al nuevo furor de fumar cigarrillo que arrasa la nacin, el Instituto Nacional del
Corazn (National Heart Institute) practic encuestas a mujeres para estimar la proporcin de
quienes fumaban un cigarrillo ocasionalmente. De las 750 mujeres que respondieron, 287
respondieron que s lo hacan. Con base en estos datos, cul es su estimacin al 90% para la
proporcin de todas las mujeres que participan de este hbito?

2. La Asociacin Nacional de Viajes (National Travel Association) tom muestras de las personas
que tomaban vacaciones en Irlanda para estimar la frecuencia con la cual los norteamericanos
visitaban Emerald Isle. Cul es el intervalo de confianza del 96% para la proporcin de turistas
que son norteamericanos, si 1,098 de los 3,769 encuestados portaban pasaportes de EE.UU.?
3. De los 1,098 turistas norteamericanos 684 haban registrado su viaje a travs de un agente de
viajes. Calcule e interprete el intervalo del 95% para la proporcin de todos los norteamericanos
que utilizan los servicios de agencias de viajes profesionales en Irlanda.
4. Si 896 de los turistas norteamericanos recomendaran al viaje a sus amigos, qu porcentaje de
todos los turistas norteamericanos haran lo mismo con un nivel del 99% de confianza?
5. Si 796 de los 1,098 turistas norteamericanos planean viajes para regresa a Irlanda, con un nivel
de confianza del 92%, qu proporcin de todos los turistas norteamericanos repetiran sus
vacaciones?

130
Leccin 8
TAMAO DE LA MUESTRA
1. Determinacin del tamao de la muestra
El tamao de la muestra juega un papel importante al determinar la probabilidad de error as como en
la precisin de la estimacin. Una vez que se ha seleccionado el nivel de confianza, dos factores
importantes influyen en el tamao muestral: (1) la varianza de la poblacin 2 y (2) el tamao del error
tolerable que el investigador est dispuesto a aceptar. Mientras que el primer factor est ms all del
control del investigador (no hay nada que se pueda hacer sobre la varianza de la poblacin), s es
posible limitar el tamao del error.
El tamao del error que un investigador puede tolerar depende de qu tan crtico es el trabajo.
Algunas tareas extremadamente delicadas requieren de resultados exactos: los procedimientos
mdicos vitales de los cuales dependen vidas humanas, o la produccin de piezas de una mquina
que deba cumplir medidas precisas, pueden tolerar slo un pequeo error. En otros casos, los errores
ms grandes pueden tener consecuencias menos graves. (Webster:2000,183)

Ejemplo
Se supone que en la fabricacin de una pieza para los reproductores de discos compactos (CD), un
error de 2 milmetros (mm) en el dimetro no causara problema alguno; sin embargo, todo error
superior a 2 mm resultar en un reproductor defectuoso. Si una pieza puede variar por encima y por
debajo de algn dimetro deseado en 2 mm, se permite un intervalo de 4 mm. Todo intervalo dado es
dos veces el error tolerable. Ver la figura 3.1 para observar una ilustracin.

Figura 4.11 El error tolerable es la mitad del intervalo

2mm 2mm

LIC LSC
4 mm
Ancho del intervalo

A continuacin se considera la determinacin del tamao muestral apropiado bajo varias condiciones.

1.1 Tamao de la muestra para estimar .


(Webster:2000,183) (Walpole:2012, 272)

X X
De la leccin 3, la desviacin normal Z puede expresase como: Z
X
n

131
Esto puede reescribirse algebraicamente como

Tamao muestral para intervalos de Z 2 2


n
la media poblacional X 2

donde e= ( X -) = es el error estadstico = error permisible o tolerable = nivel de precisin.

En el ejemplo anterior de los reproductores de CDs, con un error tolerable de 2 mm, la frmula
del tamao muestral se escribe como:

Z 2 2
n
22
El valor de Z depende del nivel de confianza requerido. Esto deja por determinar slo 2 para
calcular el tamao muestral apropiado. En el evento probable que 2 sea desconocido, puede
estimase mediante la desviacin estndar muestral s, utilizando una muestra piloto de cualquier
tamao razonable (n 30). La varianza calculada de esta muestra preliminar puede entonces
utilizase en la frmula para calcular el tamao muestral.

Ejemplo
Se asume que el fabricante de los reproductores de discos compactos desea construir un
intervalo del 95% para el tamao promedio de la pieza. Una muestra piloto ha revelado una
desviacin estndar de 6 mm. Qu tan grande debera ser la muestra? Un intervalo del 95% da
un valor de Z de 1.96. Por tanto:

n
1.962 62 34.5 35
22
Interpretacin
El fabricante debera seleccionar una muestra de 35 piezas. De esta muestra, un intervalo de
95% podra construirse para el tamao promedio. El intervalo tendra un error no superior a 2
mm.

1.2 Tamao de la muestra para estimar


(Webster:2000,185) (Walpole:2012, 298)

p
En la leccin 4, sobre la distribucin muestral de las proporciones, se tiene: Z
p

En donde
( )(1 )
p
n

Se puede reescribir esto para producir una expresin para el tamao muestral:

132
Tamao muestral para intervalos para Z 2 1
n
la proporcin poblacional p 2

en donde (p-) es la diferencia entre la proporcin muestral y la proporcin poblacional, y por


tanto es el error estadstico. Esta frmula requiere el valor de . Sin embargo, es el parmetro
que se desea estimar y es desconocido.
Este problema puede tratase en una de las dos maneras. Se podra tomar una muestra piloto
para obtener un valor preliminar para . O se puede determinar que =0.5, para efectos de
determinar el tamao muestral.

Ejemplo
Un poltico est postulando para congresista en nuestro pas. l desea estimar dentro de 1 punto
porcentual (error estadstico) la proporcin de personas que votarn por l. Tambin desea tener
el 95% de confianza en sus hallazgos. Qu tan grande debera ser el tamao muestral?

n
1.962 0.51 0.5
0.012
= 9,604 votantes

Interpretacin
Una muestra de 9,604 votantes permitir al poltico estimar con un error de un 1% y un nivel de
confianza del 95%.

2. Ejercicios propuestos

1. Qu tan grande se requiere que sea una muestra para que proporcione una estimacin del 90%
del nmero promedio de graduados de las universidades de la nacin con un error de 2,000
estudiantes si una muestra piloto reporta que s = 8,659?

2. La divisin de crditos de un banco comercial grande desea estimar con un nivel de confianza
del 99% la proporcin de sus crditos que estn en mora. Si el ancho del intervalo es del 7%,
cuntos crditos deben revisarse? Cul es el error tolerable?

133
RESUMEN
En esta unidad se present los conceptos sobre inferencia estadstica y de la distribucin muestral. La
importancia que tiene el teorema del lmite central para hacer inferencias. El uso de la distribucin
muestral de las media muestrales y de las proporciones muestrales.
Asimismo, se present las diferencias entre estimadores puntuales y por intervalo; el fundamento de
un intervalo de confianza; la construccin de los intervalos de confianza para estimar para la media
poblacional para muestras grandes; pequeas; la construccin de intervalos para estimar la
proporcin poblacional y la determinacin del tamao de una muestra.

TEXTO PARA LEER


Walpole Ronald, Raymond Myers y Sharon Myers (2012). Probabilidad y estadstica para ingeniera y
ciencias. 9na.Ed, en espaol. Mxico, D.F. Pearson.

ACTIVIDADES
De distribuciones muestrales

1. Las ventas en miles de dlares de una compaa ECM durante los ltimos 5 meses fueron de 68,
73, 65, 80 y 72. Asumiendo que estos cinco meses constituyen la poblacin, la media claramente
es =71.6. Como director de marketing de ECM, se desea estimular este desconocido
tomando una muestra de tamao n=3. Se espera que el error de muestreo que es probable que
ocurra sea relativamente pequeo. Realice la distribucin muestral y haga comentarios sobre el
posible error de muestreo. (Webster,2000,148)

2. El consumo diario de agua en una ciudad promedia 18.9 galones por hogar, con una desviacin
estndar de 3.6 galones. El alcalde de la ciudad desea estimar esta media no conocida con una
muestra de 100 hogares. Qu tan probable es que el error de muestreo exceda los 0.5
galones? (Webster:2000,157)

3. El 30% de todos los empleados tienen capacitacin avanzada. Si en una muestra de 500
empleados menos del 27% estn preparados de forma adecuada, todos los nuevos contratados
necesitarn registrarse en un programa de capacitacin. Cul es la probabilidad de que se
inicie el programa? (Webster:2000,160)

De Intervalos de confianza

4. Cien latas de 16 onzas de la salsa de tomate tienen un promedio de 15.2 onzas. La desviacin
estndar poblacional en peso es de 0.96 onzas a un nivel de confianza del 95% las latas
parecen estar llenas con un promedio de 16 onzas? (Webster:2000,175)

5. Las bonificaciones para 10 nuevos jugadores de la Liga Nacional de Ftbol se utilizan para
estimar la bonificacin promedio para todos los nuevos jugadores. La media muestral es de
US$65,890 con s US$ 12,300. Cul es su estimacin con un intervalo del 90% para la media
poblacional? (Webster:2000,180)

134
6. CNN inform que el 68% de todos los estudiantes de secundaria tena computadores en sus
casas. Si una muestra de 1,020 estudiantes revela que 673 tienen computadores caseros, un
intervalo del 99% apoya a CNN? (Webster:2000,182)
7. Comprobar que los resultados obtenidos manualmente o con las tablas estadsticas, en los
ejemplos, pueden obtenerse mediante Excel, Minitab, SPSS y StatGraphics.

AUTOEVALUACIN
1. Segn la revista Business Week, el promedio de los aos de experiencia de los pilotos de
aerolnea es de 25.2. Se asume una desviacin estndar de 12 aos. Este ao usted debe tomar
36 vuelos comerciales. Usted espera que la experiencia promedio de los pilotos de los vuelos
que usted tome sea superior a 30. Qu tan probable es que X 30?

a. 0.2882 b. 0.2808 c. 0.8200 d. 0.0082

2. En promedio, el nivel de produccin en una planta de manufactura local es de 47.3 unidades por
da, con una desviacin estndar de 12.7. El gerente de planta tomar una muestra de 100 das.
Si la media muestral excede de 49 promete dar a todos los empleados una bonificacin de
Navidad. Qu tan probable es que los empleados disfruten de una feliz Navidad?
a. 0.0901 b. 0.9010 c. 0.8080 d. 0.0190

3. El promedio del fondo de pensiones en TIAA, para una poblacin de profesores, es de $40,715,
con una desviacin estndar de $19,015. Halle la probabilidad de que una muestra de 75
profesores produzca un error de muestreo menor que $1,000 (mil dlares).
a. 0.5544 b. 0.3544 c. 0.4455 d. 0.2544

4. Un proceso industrial genera el 8% de unidades defectuosas. Usted compra 100 unidades.


Cul es la probabilidad de que menos del 10% sean defectuosas? (Webster:2000,p.166)
a. 0.7704 b. 0.4074 c. 0.0757 d. 0.3578

5. Un productor de cmaras de video pblica que el 28% de las cmaras de video vendidas en el
mercado son de su marca. De las 150 ventas recientes, exactamente 40 fueron producidas por
esta compaa. qu piensa de lo que dice la compaa?
a. 0.5704 b. 0.6404 c. 0.3936 d. 0.9339

6. El fabricante de un nuevo computador le comprueba que usted experimentar con su nuevo


modelo slo un 9% de reduccin de tiempo en reparaciones y mantenimiento. Una revisin de
su equipo actual revela que en las ltimas 90 horas, 12 fueron de inactividad. El nuevo
computador es ms confiable que el modelo actual?
a. 0.6704 b. 0.0764 c. 0.7064 d. 0.4670

135
7. Durante el ltimo domingo de ftbol Sammy y sus compaeros ordenaron 27 pizzas de una
marca A. El tiempo promedio de entrega era de 23.7 minutos, con una desviacin estndar de
10.7 minutos. Al considerar que esta era una demora muy grande en su propsito culinario,
Sammy y sus amigos decidieron comprar la pizza nmero 28 en otra parte, si el tiempo de
entrega de pizzas A era superior a 30 minutos. Sea =1%.Ordenaran en otra parte?
a. 10.2511.52 b. 7.989.41 c. 27.9849.41 d.17.9829.42

8. De 209 clientes, 183 expresaron su satisfaccin con los servicios bancarios ofrecidos por First of
Amrica. Cmo se compara esto con los resultados de un estudio anterior por parte de River
Valley Savings, el cual estim al 99% del nivel de confianza que entre 74.1 y 83.7% de sus
clientes estn satisfechos? (Webster:2000,192)
a. 0.8230.937 b. 0.3610.392 c. 0.0560.074 d. 38.17 41.29

9. A los golfistas profesionales se les pidi califica un nuevo palo de grafito en una escala de 0 a
10. Veinticinco pros generaron un rango promedio de 7,3, con s = 1.01. Construya e interprete el
intervalo de confianza del 90%. c
a. 5.227.91 b. 5.526.12 c. 6.967.63 d. 7.51 8.49

10. La Pizzera Up est considerando incrementar el precio de su pizza grande de encurtidos si el


precio promedio de su competencia excede el precio de Up de US$12.95. Otras 37 pizzeras
reportan un precio promedio de US$12.50, con una desviacin estndar de US$1.01. Pizza Up
desea estar un 90% segura de sus hallazgos.

a. 4.235.68 b. 15.5215.12 c. 9.6710.63 d. 12.2312.77

11. Un restaurante de comida china para llevar, deseaba determinar qu porcentaje de sus clientes
seleccionan la sopa de nido de aves como parte de su cena placentera. En una muestra de 320
clientes, 220 se llevaron a casa esta delicia. Calcule e interprete un intervalo del 99%.
a. 62.0675.43 b. 26.5237.12 c. 19.6727.10 d. 22.2231.27

12. Qu tan grande se requiere que sea una muestra para que proporcione un estimacin del 90%
del nmero promedio de graduados de las universidades de la nacin con un error de 2,000
estudiantes, si una muestra piloto reporta que s=8,659?
a. 31 b. 51 c. 230 d. 678

13. La divisin de crditos de un banco comercial grande desea estimar con un nivel de confianza
del 99% la proporcin de sus crditos que estn en mora. Si el ancho del intervalo es del 7%,
cuntos crditos deben revisarse? Cul es el error tolerable?

a. 312 b. 764 c. 1359 d. 1650

RESPUESTAS DE CONTROL

1.d, 2.a, 3.b, 4.a, 5.c, 6.b, 7.d, 8.a, 9.c, 10.d, 11.a, 12.b, 13.c
.c

136
EXPLORACIN ON LINE
1. http://www.uoc.edu/in3/emath/docs/Distrib_Muestrales.pdf
2. http://www.edu.xunta.es/centros/iesastelleiras/?q=system/files/doce.pdf
3. http://www.edu.xunta.es/centros/iesastelleiras/?q=system/files/trece.pdf
4. http://www.unac.edu.pe/documentos/organizacion/vri/cdcitra/Informes_Finales_Investigacion/Enero_2
011/BAZAN_BACA_FCE/Estad%EDstica%20computacional.pdf
5. http://www.iesxunqueira1.com/Download/pdf/teointervalos.pdf
6. http://www.uoc.edu/in3/emath/docs/Estimacion_IC.pdf
7. http://math.uprag.edu/cap7.pdf
8. http://jjsalaza.webs.ull.es/MEI/Practica6/practica6.pdf
9. http://www.ugr.es/~bioestad/guiaspss/practica5/index.html

REFERENCIAS BIBLIOGRFICAS
Kazmier, Leonard y Alfredo Daz Mata (1993) Estadstica aplicada a la administracin y a la economa. 2da.
Ed. Revisada. Mxico, D.F., McGraw-Hill, pp.145,146,149,150,165.
Levin, Richard y David Rubin (1996) Estadstica para administradores. 6ta. Ed. Mxico, D.F., Prentice-Hall
Hispanoamericana, S.A., pp. 333,338,372.
Walpole, Ronald, Raymond Myers y Sharon Myers (2012). Probabilidad y estadstica para ingeniera y ciencias.
9na.Ed, 1ra. en espaol. Mxico, D.F., Pearson, p. 265, 266, 232, 234, 270, 272, 275, 276, 297, 298.
Wayne W, Daniel (1993) Bioestadstica. Base para el anlisis de las ciencias de la salud. Mxico, D.F., Editorial
Limusa, p.171.
Webster, Allen L (2000) Estadstica aplicada a los negocios y la economa. 3ra. Ed. Santa Fe de Bogot, Irwin
McGraw-Hill, pp.143-150,152,153,157,158,160,165,166,170-173,175-177,179, 180, 182, 183, 186,192.

REFERENCIAS COMENTADA
Walpole, Ronald, Raymond Myers y Sharon Myers (2012). Probabilidad y estadstica para ingeniera y
ciencias. 9na.Ed, 1ra. en espaol. Mxico, D.F., Pearson.

Ha procurado equilibrar la teora y las aplicaciones, con ejemplos y ejercicios relevantes.

Webster, Allen L (2000) Estadstica aplicada a los negocios y la economa. 3ra. Ed. Santa Fe de
Bogot, Irwin McGraw-Hill.

Este libro es muy didctico. Caractersticas:


Los ejemplos presentan tres partes: planteamiento, solucin e interpretacin.
Se presentan ejercicios por resolver en cada seccin.
Cada captulo concluye con problemas resueltos, lista de frmulas y problemas por resolver.

137
GLOSARIO

Asimetra. Que no tiene simetra.

Censo. Es la encuesta dirigida a la totalidad de elementos de una poblacin.

Clase(s) o intervalos de clase. Se llama clases a cada uno de los grupos en que se divide o se distribuye el
conjunto de datos.

Coeficiente de variacin. Sirve como medida relativa de dispersin.

Coeficiente de confianza. Es el nivel o grado de confianza que se tiene en el que el intervalo contenga el
valor desconocido del parmetro.

Combinaciones. Una combinacin es un arreglo de objetos distintos, donde una combinacin difiere
de otra, slo si difiere el contenido del arreglo.

Dato. Es el valor o respuesta que adquiere la variable en cada unidad de anlisis.

Desviacin normal Z. Se define como "el nmero de desviaciones estndar a las que una observacin
est de la media", y X es algn valor especfico de la variable aleatoria.

Distribucin binomial. Permite determinar la probabilidad de cuntos xitos habr en un nmero dado de
ensayos, en un proceso Bernoulli.

Distribucin de frecuencias. Una distribucin de frecuencias es una tabla en la cual se agrupan en clases los
valores posibles para una sola variable y se registra el nmero de valores
observados que corresponde a cada clase.

Distribucin de probabilidad de una variable aleatoria discreta. Es una tabla, grfica, frmula o cualquier otro medio que se
utilice para especificar todos los valores posibles de una variable aleatoria discreta
junto con sus respectivas probabilidades.

Distribucin hipergeomtrica. Permite hallar probabilidades para el nmero de observaciones que caen en una
categora particular, de un experimento hipergeomtrico.

Distribucin exponencial. Mide el paso del tiempo entre ocurrencias. Estima el lapso entre ocurrencias.

Distribucin muestral. Es una lista de todos los posibles valores de un estadstico y la probabilidad
asociada con cada valor.

Distribucin muestral de medias muestrales. Es una lista de todas las medias muestrales posibles y sus respectivas
probabilidades.

Distribucin muestral de proporciones. Es una lista de todas las proporciones muestrales posibles y sus respectivas
probabilidades.

Distribucin normal. Es una distribucin continua, simtrica en forma de campana. Se utiliza para
reflejar la distribucin de variables tales como estaturas, pesos, distancias y otras
medidas que son divisibles infinitamente. Notacin abreviada: X N(,2) indica
que la variable aleatoria X se distribuye normalmente con media y varianza 2 .

Distribucin Poisson. Mide la probabilidad de un evento aleatorio sobre algn intervalo de tiempo o
espacio, en proceso Poisson.

Distribucin uniforme. Las probabilidades son las mismas para todos los posibles resultados.

Distribucin normal. Es una distribucin de datos continuos (no discretos) que produce una curva
simtrica en forma de campana,

Espacio muestral. Es el conjunto de todos los resultados posibles del experimento. Se denota por SS.

138
Estadstico(a) o estadgrafo. Es una medida descriptiva de una muestra y sirve como una estimacin del
parmetro desconocido de la poblacin correspondiente.

Error de muestreo. Es la diferencia entre el parmetro poblacional y el estadstico de la muestra


utilizado para estimar el parmetro.

Error estndar de distribucin de media muestrales. Mide la tendencia a sufrir del error de muestreo en el esfuerzo por
estimar . Es la raz cuadrada de la varianza.

Espacio muestral. Es el conjunto de todos los resultados posibles del experimento. Se denota por SS.

Estadstica inferencial. Involucra el uso de un estadstico para sacar una conclusin o inferencias sobre el
parmetro correspondiente.

Estimacin. Es el resultado numrico de la estadstica

Estimador. Es la regla o procedimiento, generalmente expresado como una frmula, que se


utiliza para derivar la estimacin.

Estimador por intervalos. Especifica el rango dentro del cual est el parmetro desconocido, asociado con un
nivel de confianza.

Estimador puntual. Utiliza un estadstico para estimar el parmetro en un solo valor o punto,

Evento o suceso. Es un subconjunto del espacio muestral SS.

Experimento aleatorio. Describe cualquier proceso que genere un conjunto de datos. Es el proceso que
produce un evento. Es toda es toda accin bien definida que conlleva a un
resultado nico bien definido.

Evento o suceso. Es un subconjunto del espacio muestral SS.

Experimento aleatorio. Describe cualquier proceso que genere un conjunto de datos. Es el proceso que
produce un evento. Es toda es toda accin bien definida que conlleva a un
resultado nico bien definido.

Funcin de densidad de probabilidad. Se usa para calcular un rea que representa la probabilidad de una variable
aleatoria continua.

Funcin de probabilidad. Probabilidad de que la variable aleatoria discreta tome algn valor especifico.

Histograma de frecuencias. Es la grfica de una distribucin de frecuencias, en forma de cajas rectangulares


verticales juntas.
Intervalo de confianza para la media. Es un estimador de intervalo que se construye con respecto a la media muestral y
que permite especificar la probabilidad de que se incluya el valor de la media
poblacional.
Media aritmtica o media o promedio. Se define y calcula dividiendo la suma de todos los valores de la variable entre el
nmero de observaciones o valores.

Media muestral. Es un estadstico (que se lee Xbarra). Se define y calcula dividiendo la suma
de todos los valores de la variable entre el nmero de observaciones o valores de
la muestra.

Media poblacional. Es el parmetro (que se pronuncia mu). Se define y calcula dividiendo la suma
de todos los valores de la variable entre el nmero de observaciones o valores de
la poblacin.

Mediana o valor mediano Es el valor numrico que queda exactamente en la mitad del conjunto de datos
despus de que las n observaciones se han colocado en serie ordenada. La
mitad de las observaciones (el 50%) estar por encima de la mediana, la otra mitad
(el otro 50%) estar por debajo de ella.

139
Medida de dispersin. Miden el grado de concentracin o dispersin de las observaciones alrededor de un
valor central.

Medida de tendencia central. Ubica e identifica el punto o valor numrico del cual se centran los datos.

Moda. La observacin modal es la observacin que ocurre con mayor frecuencia.

Muestra. Es un subconjunto de la poblacin o universo.

Nivel de significancia. Indica el porcentaje de las medias de muestra que est fuera de ciertos lmites.

Parmetro. Es una medida descriptiva de todas las observaciones de la poblacin.

Poblacin o universo. Es el conjunto completo de individuos, objetos, o medidas que poseen al menos
una caracterstica comn observable, de naturaleza cualitativa o cuantitativa.

Probabilidad. Es la posibilidad numrica de que ocurra un evento. La probabilidad de un evento


es medida por valores comprendidos entre 0 y 1.

Proceso de estimacin. Implica calcular, a partir de los datos de una muestra, algn estadstico que se
ofrece como una aproximacin del parmetro correspondiente de la poblacin de la
cual se extrajo la muestra.

Sesgo. Es la tendencia a favorecer la seleccin de ciertas muestras sobre otras en la


recoleccin de los datos de la muestra.

Tabla de contingencia. Es una tabla de doble entrada, permite examinar y comparar dos variables.

Tabla de probabilidad. Llamada tambin tablas de probabilidades conjuntas, donde se analizan dos
variables, son tiles al calcular la probabilidad de eventos.

Teorema del lmite central. Es la relacin entre la distribucin de la poblacin y la forma de la distribucin de
muestreo (Levin,p.338)

Valor alfa. Es la probabilidad de que cualquier intervalo dado no contenga la media


poblacional desconocida.

Variable. Es la caracterstica de inters de la muestra o poblacin.

Variable aleatoria. Es una funcin que asigna un nmero real a cada resultado del espacio muestral
de un experimento aleatorio.

Varianza. Es el promedio de las observaciones individuales respecto a su media, elevadas al


cuadrado.

140
BIBLIOGRAFIA GENERAL
Avila Acosta, Roberto (2003) Estadstica elemental. Lima, Estudios y Ediciones RA, pp.54, 102, 106,
108, 117, 307.

Barreno, Emma (2000). Estadstica aplicada a la empresa. Lima, Centro de impresiones de la


U.S.M.P. ,p.16, 124.

Crdova, Manuel (2000). Estadstica Descriptiva e inferencia. Aplicaciones. 4ta. Ed. Lima, Editorial
Moshera S.R.L., p.34,233

Gmez, Doris y otros (2006). Estadstica descriptiva. Con soporte de spss y matlab. Lima, Fondo
editorial UNMSM.

Hines, William y Douglas Montgomery (1980). Probability and statistics in engineering and
management science. Second Edition. New York, John Wiley & Sons, pp. 43, 46,51
Hines, William y Douglas Montgomery (1993). Probabilidad y estadstica para ingeniera y
administracin. 3ra. Ed. en ingls, 2da. Ed. en espaol. Mxico, D.F., Cecsa,
pp.174,176,190,195,225,226.

Hines, William y Douglas Montgomery (1994). Probabilidad y estadstica para ingeniera y


administracin. 3ra. Ed. en ingls, 2da. Ed. en espaol. Mxico, D.F., Cecsa, p.2,3,39,42,52-55,63-
65.

Kazmier, Leonard y Alfredo Daz Mata (1993) Estadstica aplicada a la administracin y a la


economa. 2da. Ed. Revisada. Mxico, D.F., McGraw-Hill, pp. 8,10, 37,73-78,81,82,119,132,145,
146, 149, 150,165.

Levin, Richard y David Rubin (1996) Estadstica para administradores. 6ta. Ed. Mxico, D.F.,
Prentice-Hall Hispanoamericana, S.A., pp. 16,333,338,372.

Meyer, Paul (1973) Probabilidad y aplicaciones estadsticas. Mxico,D.F., Fondo Educativo


Interamericano S.A., p.8,10,26-30,39,40

Mitacc, Mximo (1995) Tpicos de estadstica descriptiva y probabilidad. 1ra. Ed. Lima, Per,
Editorial San Marcos, p.104,212,458.

Montgomery, Douglas y George Runger (2002). Probabilidad y estadstica aplicadas a la ingeniera.


2da. Ed. Mxico, D.F., Editorial Limusa, p.92,113,145.

Moya, Rufino (1995). Estadstica descriptiva y probabilidad. Conceptos y aplicaciones. 1ra. Ed.
Lima, Per, Editorial San Marcos, pp. 55,61

Walpole, Ronald, Raymond Myers y Sharon Myers (2012). Probabilidad y estadstica para ingeniera
y ciencias. 9na.Ed, 1ra. en espaol. Mxico, D.F., Pearson, pp. 35, 39,40,50,56,65,72, 75, 77, 144,
146, 152-154,157,161,162,171,173,174,182,188,197,265, 266, 232, 234, 270, 272, 275, 276, 297,
298.

Webster, Allen L (2000). Estadstica aplicada a los negocios y la economa. 3ra. Ed. Santa Fe de
Bogot, Irwin McGraw-Hill, pp. 21-25, 40-64, 76-83, 85, 86, 88, 89, 91, 94, 105, 108-111, 113-118,
120-125, 132,1 33,135,137,140, 143-150,152,153,157,158,160, 165,166,170-173, 175-177,179,
180, 182, 183, 186,192.

141
APNDICE

TABLAS ESTADSTICAS

142
Fuente: Webster, Allen L (2000) Estadstica aplicada a los negocios y la
economa. 3ra. Ed. Santa Fe de Bogot, Irwin McGraw-Hill.

143
Fuente: Webster, Allen L (2000) Estadstica aplicada a los negocios y la economa. 3ra. Ed.
Santa Fe de Bogot, Irwin McGraw-Hill.

144

Potrebbero piacerti anche