Sei sulla pagina 1di 4

Problemas de estimacin de una y dos muestras

Cristian Arvalo
Universidad Nacional de Loja
Loja, Ecuador
arevalohenrry@hotmail.com
Resumen La inferencia estadstica consiste en mtodos que
se realizan para realizar generalizaciones acerca de una
poblacin, en el presente informe se tratar unas de sus reas
principales que es la estimacin de
los parmetros de la
poblacin, se lo desarrollara especficamente para problemas
que tengas una y dos muestras.
Palabras clave Estimador, media, intervalo, proporcin,
varianza.

I. INTRODUCCIN
En clases anteriores se han abordado las propiedades del
muestreo de la media y la varianza, as como las
representaciones de datos en varias formas, todo esto con el
fin de permitir a los estadsticos extraer conclusiones acerca
de los parmetros de la poblacin a partir de los
experimentos.
En el presente tema hablaremos sobre la inferencia
estadstica, abordando una de sus dos reas principales que
es la estimacin de los parmetros de la poblacin para
problemas que tengas una y dos muestras.

IV. UNA SOLA MUESTRA: ESTIMACIN DE LA MEDIA


Si la muestra se selecciona a partir de una poblacin
normal o, a falta de sta, si n es suficientemente grande,
podemos establecer un intervalo de confianza para al
considerar la distribucin muestral de .
De acuerdo con el teorema del lmite central, podemos
esperar que la distribucin muestral de , est distribuida de
forma aproximadamente normal con media = y
desviacin estndar = / . Al escribir /2 para el
valor z por arriba del cual encontramos un rea de /2, de la
figura 2 podemos ver que
( < < ) = 1
2

/

( <
< ) = 1
2
2
/

II. INFERENCIA ESTADSTICA


La teora de la inferencia estadstica consiste en aquellos
mtodos por los que se realizan inferencias o
generalizaciones acerca de una poblacin.
La inferencia estadstica se puede dividir en dos reas
principales: estimacin y prueba de hiptesis.

Fig. 2. ( < < ) = 1


2

III. ESTIMADOR
Un estimador es un estadstico usado para estimar un
parmetro desconocido de la poblacin.

A. Estimador insesgado
es un estimador insesgado
Se dice que un estadstico
del parmetro si
) =
(
Si consideramos todos los posibles estimadores
insesgados de algn parmetro , el de menor varianza se
llama estimador ms eficaz de .
En la figura 1 ilustramos las distribuciones muestrales de
1 ,
2
3 , todos para . Resulta
3 estimadores diferentes

claro que slo 1 y 2 son insesgados, pues sus distribuciones


1 tiene una varianza
estn centradas en . El estimador

menor que 2 y, por lo tanto, es ms eficaz.

Al multiplicar cada trmino en la desigualdad por


/ y despus restar de cada trmino y multiplicar por
1 (para invertir el sentido de las desigualdades), obtenemos

(
< < + ) = 1
2
2
Se selecciona una muestra aleatoria de tamao n de una
poblacin cuya varianza 2 se conoce y se calcula la media
de la muestra para obtener un intervalo de confianza de
(1 )100%.

A. Intervalo de confianza de ; con conocida:


Si es la media de una muestra aleatoria de tamao n de
una poblacin con varianza 2 conocida, un intervalo de
confianza de (1 )100% para est dado por


< < +
2
2
Donde /2 es el valor z que deja un rea de /2 a la
derecha.
Teorema 1: Si se utiliza como una estimacin de ,
podemos tener una confianza de (1 )100% de que el error

no exceder
2

Fig. 1. Distribuciones muestrales de estimadores diferentes de .

Teorema 2: Si se usa como estimacin de , podemos


tener (1 )100% de confianza de que el error no exceder
una cantidad especfica e cuando el tamao de la muestra sea
2 2
=(
)

donde

= 2

B. Lmites de confianza unilaterales en ; conocida


Si es la media de una muestra aleatoria de tamao n a
partir de una poblacin con varianza 2 , los lmites de
confianza unilaterales de (1 )100% para estn dados por
lmite unilateral superior +
lmite unilateral inferior

Para una distribucin normal de mediciones con media


desconocida y varianza conocida 2 , un intervalo de
prediccin de (1 )100% de una observacin futura es
2 1 + 1 < 0 < + 2 1 + 1
donde 2 es el valor z que deja un rea de /2 a la
derecha

G. Intervalos de prediccin para una observacin


futura: desconocida
Para una distribucin normal de mediciones con media
desconocida y varianza desconocida 2 , un intervalo de
prediccin de (1 )100% de una observacin futura es
2 1 + 1 < 0 < + 2 1 + 1

C. El caso de desconocida
Con frecuencia intentamos estimar la media de una
poblacin cuando se desconoce la varianza, para ello si
tenemos una muestra aleatoria a partir de una distribucin
normal, entonces la variable aleatoria

=
/
Aqu S es la desviacin estndar de la muestra. En esta
situacin en que se desconoce se puede utilizar T para
construir un intervalo de confianza de . El procedimiento es
el mismo que cuando se conoce excepto en que se
reemplaza con S y la distribucin normal estndar se
reemplaza con la distribucin t. Con referencia a la figura 3.

(
< < + ) = 1
2
2

donde 2 es el valor t con v=n-1 grados de libertad, que


deja un rea de /2 a la derecha

H. Lmites de tolerancia
Para una distribucin normal de mediciones con media
y desviacin estndar , ambas desconocidas, los lmites de
tolerancia estn dados por , donde k se determina de
manera que se pueda asegurar con una confianza de
(1 )100% que los lmites dados contienen al menos la
proporcin 1 de las mediciones.
La tabla A.7 da valores de k para 1 = 0.90, 0.95, 0.99;
= 0.05, 0.01; y para valores seleccionados de n de 2 a 1000.

Ejemplo:
Se encuentra que la concentracin promedio de zinc que
se obtiene a partir de una muestra de mediciones de zinc en
36 sitios diferentes es 2.6 gramos por mililitro. Encuentre el
intervalo de confianza de 95% para la concentracin media
de zinc en el ro. Suponga que la desviacin estndar de la
poblacin es 0.3.

Solucin:

Fig. 3. ( < < ) = 1


2

= 2.6.
z0.025 = 1.96
= 0.3

2

D. Intervalo de confianza de ; con desconocida:


Si y s son la media y la desviacin estndar de una
muestra aleatoria de una poblacin con varianza 2
desconocida, un intervalo de confianza de (1 )100% para
es


< < +
2
2
Donde /2 es el valor t con v=n-1 grados de libertad que
deja un rea de /2 a la derecha.

E. Lmites de confianza de para desconocida


= . . ( )
2

donde e.e. es el error estndar estimado


2

F. Intervalos de prediccin para una observacin


futura: conocida

2.6 (1.96)

0.3
36

< < +
2

< < 2.6 + (1.96)

0.3
36

. < < .
V. DOS MUESTRAS: ESTIMACIN DE LA DIFERENCIA ENTRE
DOS MEDIAS
Si tenemos dos poblaciones con medias 1 y 2 y
varianzas 21 y 2 2 , respectivamente, un estimador puntual
de la diferencia entre 1 y 2 est dado por el estadstico
1 2. Por lo tanto, para obtener una estimacin puntual de
1 2, seleccionaremos dos muestras aleatorias
independientes, una de cada poblacin, de tamaos n1 y n2, y
calculamos la diferencia 1 2, de las medias muestrales.

A. Intervalo de confianza para 1 2 ; con 12 y 22


conocidas:
Si 1 y 2 son las medias de muestras aleatorias
independientes de tamao 1 y 2 de poblaciones con
varianzas conocidas 12 y 22 , respectivamente, un intervalo
de confianza de (1 )100% para 1 2 est dado por
12

(1 2 )
2

22
2

12

< 1 2 < (1 2 ) +
2

22

Solucin
Estacin 1 1 = 3.84, 1 = 3.07 1 = 15
Estacin 2 2 = 1.49, 2 = 080 2 = 12

=
=

(12 1 + 22 2 )2
1)] + [(22 2 )2 (2 1)]

[(12 1 )2 (1

(3.07215 + 0.80212)2
[(3.07215)2 (15 1)] + [(0.80212)2 (12 1)]

Donde /2 es el valor z que deja un rea de /2 a la


derecha.

B. Intervalo de confianza para 1 2 ; con 12 = 22


pero desconocidas:
Si 1 y 2 son las medias de muestras aleatorias
independientes de tamao 1 y 2 , respectivamente, de
poblaciones aproximadamente normales con varianzas
iguales pero desconocidas, un intervalo de confianza de
(1 )100% para 1 2 est dado por

= 16.3 16
1 2 = 3.84 1.49 = 2.35
= 0.05

0.025 = 2.120 para = 16 grados de libertad

Por lo tanto, el intervalo de confianza es


12 22
12 22
(1 2 ) + < 1 2 < (1 2 ) + +
2
2
2 1
2 1
3.072 0.802
3.072 0.802
2.35 2.120
+
< 1 2 < 2.35 + 2.120
+
15
12
15
12

. < < .

1
1
1
1
(1 2 ) + < 1 2 < (1 2 ) + +
1 2
1 2
2
2

donde
(1 1)12 + (2 1)22
2 =
1 + 2 2

y es la estimacin de unin de la desviacin estndar


poblacional y /2 es el valor t con v=1 + 2 2 grados de
libertad que deja un rea de /2 a la derecha.

C. Intervalo de confianza para 1 2 ; con 12 22


y desconocidas:
Si 1 y 12 y 2 y 22 son las medias y varianzas de

muestras aleatorias independientes de tamao 1 y 2 ,


respectivamente, de poblaciones aproximadamente normales
con varianzas desconocidas y diferentes, un intervalo de
confianza de (1 )100% para 1 2 est dado por
12 22
12 22
(1 2 ) + < 1 2 < (1 2 ) + +
2
2
2 1
2 1

donde /2 es el valor t con


(12 1 + 22 2 )2
=
[(12 1 )2 (1 1)] + [(22 2 )2(2 1)]

grados de libertad, que deja un rea de /2 a la derecha.

VI. UNA SOLA MUESTRA: ESTIMACIN DE UNA PROPORCIN


Un estimador puntual de la proporcin p en un
experimento binomial est dado por el estadstico = ,
donde representa el nmero de xitos en n pruebas. Por lo
tanto, la proporcin de la muestra = se utilizar como
el estimador puntual del parmetro p.
Si no se espera que la proporcin p desconocida est
demasiado cerca de cero o de 1, podemos establecer un
intervalo de confianza para p al considerar la distribucin
muestral de .
Si es la proporcin de xitos en una muestra aleatoria
de tamao n, y = 1- , un intervalo de confianza aproximado
de (1 )100% para el parmetro binomial p est dado por


< < +

2
es el valor z que deja un rea de /2 a la

donde 2
derecha.

Teorema 3: Si se utiliza como una estimacin de p,


podemos tener una confianza de (1 )100% de que el error
no exceder 2

Ejemplo
El Departamento de Zoologa del Instituto Politcnico y
Universidad Estatal de Virginia llev a cabo un estudio para
estimar la diferencia en la cantidad de ortofsforo qumico
medido en dos estaciones diferentes del ro James. El
ortofsforo se mide en miligramos por litro. Se reunieron 15
muestras de la estacin 1 y 12 muestras de la estacin 2. Las
15 muestras de la estacin 1 tuvieron un contenido promedio
de ortofsforo de 3.84 miligramos por litro y una desviacin
estndar de 3.07 miligramos por litro; en tanto que las 12
muestras de la estacin 2 tuvieron un contenido promedio de
1.49 miligramos por litro y una desviacin estndar de 0.80
miligramos por litro. Encuentre un intervalo de confianza de
95% para la diferencia en el contenido promedio real de
ortofsforo en estas dos estaciones. Suponga que las
observaciones provienen de poblaciones normales con
varianzas diferentes.

Teorema 4: Si se utiliza como una estimacin de p,


podemos tener una confianza de (1 )100% de que el error
ser menor que una cantidad especfica e cuando el tamao
de la muestra sea aproximadamente
22
=

Teorema 5: Si se utiliza como una estimacin de p,


podemos tener una confianza de al menos (1 )100% de
que el error no exceder una cantidad especfica e cuando el
tamao de la muestra sea
22
=
4 2

VII. DOS MUESTRAS: ESTIMACIN DE LA DIFERENCIA


ENTRE DOS PROPORCIONES

A. Intervalo de confianza de 1 2 de una muestra


grande
Si 1 y 2 son las proporciones de xitos en muestras
aleatorias de tamao 1 y 2 , respectivamente 1 = 1 1 ,
y 2 = 1 2 , un intervalo de confianza aproximado de (1
)100% para la diferencia de dos parmetros binomiales
1 2 , est dado por
(1 2 )
2

1 1 2 2
+
< 1 2
1
2
< (1 2 ) +
2

1 1 2 2
+
1
2

donde 2 es el valor z que deja un rea de /2 a la


derecha.
VIII. UNA SOLA MUESTRA: ESTIMACIN DE LA VARIANZA
Si se extrae una muestra de tamao n de una poblacin
normal con varianza 2 y se calcula la varianza muestral 2 ,
obtenemos un valor del estadstico 2 . Esta varianza
muestral calculada se usar como estimacin puntual de 2 .
Por ello, el estadstico 2 se llama estimador de 2 .
Se puede establecer una estimacin por intervalos de 2
utilizando el estadstico
( 1) 2
2 =
2
El estadstico 2 tiene una distribucin chi cuadrada con
n 1 grados de libertad, cuando las muestras se eligen de
una poblacin normal. En base a la figura 4, podemos escribir
2
2
2
(1
2 < < 2 ) = 1

2
2
donde 22 y 1
2 son valores con v = n 1 grados de
libertad, que dejan reas de /2 y 1 /2, respectivamente, a
la derecha.

IX. DOS MUESTRAS: ESTIMACIN DE LA RAZN DE DOS


VARIANZAS

A. Intervalo de confianza de para 12 /22


Si 12 y 22 son las varianzas de muestras independientes
de tamao 1 y 2 , respectivamente, de poblaciones

normales, entonces un intervalo de confianza de (1 )100%


para 12 /22 es
21
1
12 21
<
< 2 (2 , 1 )
22 2 (1 , 2 ) 22 22
Donde 2 (1 , 2 ) es un valor f con 1 = 1 1 y 2 =
2 1 grados de libertad que deja un rea de /2 a la derecha,
y 2 (2 , 1 ) es un valor f similar con 2 = 2 1 y
1 = 1 1 grados de libertad.

Ejemplo
En una muestra aleatoria de n = 500 familias que tienen
televisores en la ciudad de Hamilton, Canad, se encuentra
que x = 340 estn suscritas a HBO. Encuentre un intervalo de
confianza de 95% para la proporcin real de familias en esta
ciudad que estn suscritas a HBO.

Solucin:
340
=
= 0.68
500
z0.025 = 1.96
= 1- =0.32
el intervalo de confianza de 95% para p es
=



< < +

(0.68)(0.32)
(0.68)(0.32)
0.68 1.96
< < 0.68 + 1.96
500
500
. < < .

Fig. 4. (12 < 2 < 2 ) = 1

donde son valores de la distribucin chi cuadrada con


n 1 grados de libertad, que dejan reas de 1 /2 y /2,
respectivamente, a la derecha. Al sustituir para X2, escribimos
( 1) 2
2
(1
< 22 ) = 1
2 <
2
Al dividir cada trmino de la desigualdad entre (n 1) 2
y, despus, invertir cada trmino (lo que cambia el sentido de
las desigualdades), obtenemos
( 1) 2
( 1) 2
2
(
<

<
)= 1
2
22
1
2
Para nuestra muestra aleatoria particular de tamao n, se
calcula la varianza muestral 2 y se obtiene el siguiente
intervalo de confianza de (1 )100% para 2 .
( 1) 2
( 1) 2
2
<

<
2
22
1
2

X. EJERCICIO PROPUESTO
Un antroplogo se interesa en la proporcin de individuos
de dos tribus indias con doble remolino de cabello en la zona
occipital de la cabeza. Suponga que se toman muestras
independientes de cada una de las dos tribus, y se encuentra
que 24 de 100 individuos de la tribu A y 36 de 120 individuos
de la tribu B poseen tal caracterstica.
Construya un intervalo de confianza de 95% para la
diferencia entre las proporciones de estas dos tribus
con remolinos de cabello en la zona occipital de la cabeza.
XI. CONCLUSIONES
La amplitud de un intervalo de confianza est
determinada por el nivel de confianza establecido, la
variabilidad de los datos y el tamao de la muestra.
Un intervalo de confianza aporta ms informacin que un
estimador puntual cuando se quiere hacer inferencias sobre
parmetros poblacionales.
REFERENCIA
[1] Walpole, Ronald; Myers, Raymond, Probabilidad y estadstica para
ingeniera y ciencias, 9na ed., Ed. Pearson, Mxico, 2012

Potrebbero piacerti anche