Sei sulla pagina 1di 44

Muestreo aleatorio simple

Estadstica Terica II

MUESTREO ALEATORIO SIMPLE

Santiago de la Fuente Fernndez 33


Muestreo aleatorio simple
MUESTREO ALEATORIO SIMPLE. DISTRIBUCIN EN EL MUESTREO

1.- Con el objetivo de analizar el rendimiento acadmico de una promocin de


licenciados universitarios se lleva a cabo un estudio en el que se emplea una m.a.s. de 3
licenciados. La variable que mide el rendimiento puede tomar tres valores segn la
calificacin final obtenida:
1 Aprobado
2 Notable
3 Sobresaliente
Por otra parte, en esa promocin hubo un total de 20 aprobados, 40 notables y 140
sobresalientes.
a) Hallar las distintas muestras que pueden extraerse y la probabilidad de
obtencin que tiene cada una de ellas.
b) Calcular le media de cada muestra, as como la distribucin de probabilidad en el
muestreo de la media.
c) Hacer lo mismo que en el apartado anterior con las varianzas.
d) Calcular la media y la varianza muestral y compararlas con la media y la varianza
poblacionales.
e) Calcular la esperanza de la varianza muestral y compararla con la varianza
poblacional.
a)
1 (1,1,1) , (1,1,2) , (1,1,3)
1 2
3

1
1 2 2 (1,2,1) , (1,2,2) , (1,2,3)
3

1
3 2
3 (1,3,1) , (1,3,2) , (1,3,3)

1 (2,1,1) , (2,1,2) , (2,1,3)


1 2
3

1
2 2 2 (2,2,1) , (2,2,2) , (2,2,3)
3

1
3 2
3 (2,3,1) , (2,3,2) , (2,3,3)
1 (3,1,1) , (3,1,2) , (3,1,3)
1 2
3

Santiago de la Fuente Fernndez 34


Muestreo aleatorio simple
1
2 2 (3,2,1) , (3,2,2) , (3,2,3)
3

1
3 2
3 (3,3,1) , (3,3,2) , (3,3,3)

Nmero muestras distintas


(1,1,1) 1
(1,1,2) , (1,2,1) , (2,1,1) 3
20
(1,1,3) , (1,3,1) , (3,1,1) 3 p(1) = = 0,1
(1,2,3) , (1,3,2) , (2,1,3) , (2,3,1) , (3,1,2) , (3,2,1) 6 200
(2,2,1) , (2,1,2) , (1,2,2) 3 40
p(2) = = 0,2
(2,2,2) 1 200
(2,2,3) , (2,3,2) , (3,2,2) 3 140
p(3) = = 0,7
(3,3,1) , (3,1,3) , (1,3,3) 3 200
(3,3,2) , (3,2,3) , (2,3,3) 3
(3,3,3) 1
27

Muestras posibles Nmero muestras Probabilidad xi


(1,1,1) 1 1 (0,1)3 = 0,001 1
(1,1,2) 3 3. (0,1)2 (0,2) = 0,006 4/3
(1,1,3) 3 3. (0,1)2 (0,7) = 0,021 5/3
(1,2,3) 6 6. (0,1) (0,2) (0,7) = 0,084 2
(2,2,1) 3 3. (0,2)2 (0,1) = 0,012 5/3
(2,2,2) 1 1 (0,2)3 = 0,008 2
(2,2,3) 3 3. (0,2)2 (0,7) = 0,084 7/3
(3,3,1) 3 3. (0,7)2 (0,1) = 0,147 7/3
(3,3,2) 3 3. (0,7)2 (0,2) = 0,294 8/3
(3,3,3) 1 1 (0,7)3 = 0,343 3

b) La distribucin de probabilidad en el muestreo para la media:

xi P ( x = xi )
1 P ( x = 1) = 0,001
4/3 P ( x = 4 / 3) = 0,006
5/3 P ( x = 5 / 3) = 0,021 + 0,012 = 0,033
2 P ( x = 2 ) = 0,084 + 0,008 = 0,092
7/3 P ( x = 7 / 3) = 0,084 + 0,147 = 0,231
8/3 P ( x = 8 / 3) = 0,294
1 P ( x = 3) = 0,343

c) La varianza de cada muestra y la distribucin en el muestreo de la varianza


muestral:

Santiago de la Fuente Fernndez 35


Muestreo aleatorio simple

Muestras
posibles
xi = xi n x2i n 2x i = x2i n x2 Probabilidad

(1,1,1) 1 1 11=0 1. (0,1)3 = 0,001


(1,1,2) 4/3 6/3 6/3 (4/3)2 = 2/9 3. (0,1)2 (0,2) = 0,006
(1,1,3) 5/3 11/3 11/3 (5/3)2 = 8/9 3. (0,1)2 (0,7) = 0,021
(1,2,3) 2 14/3 14/3 (2)2 = 2/3 6. (0,1) (0,2) (0,7) = 0,084
(2,2,1) 5/3 9/3 9/3 (5/3)2 = 2/9 3. (0,2)2 (0,1) = 0,012
(2,2,2) 2 12/3 12/3 (2)2 = 0 1. (0,2)3 = 0,008
(2,2,3) 7/3 17/3 17/3 (7/3)2 = 2/9 3. (0,2)2 (0,7) = 0,084
(3,3,1) 7/3 19/3 19/3 (7/3)2 = 8/9 3. (0,7)2 (0,1) = 0,147
(3,3,2) 8/3 22/3 22/3 (8/3)2 = 2/9 3. (0,7)2 (0,2) = 0,294
(3,3,3) 3 27/3 27/3 (3)2 = 0 1. (0,7)3 = 0,343

La distribucin de probabilidad de la varianza muestral:

2x P ( 2x = 2x )
i i
0 P( 2
x
)
= 0 = 0,001 + 0,008 + 0,343 = 0,352
P( )
2/9 2
x = 2 / 9 = 0,006 + 0,012 + 0,084 + 0,294 = 0,396
P( = 2 / 3) =
2/3 2
x 0,084

P( = 8 / 9) =
8/9 2
x 0,021 + 0,147 = 0,168

d) La media y la varianza de la media muestral y compararlas con la media y la varianza


poblacionales:

xi P (x = x i ) x i . P (x = x i ) x i2 x i2 . P (x = x i )
1 0,001 0,001 1 0,001
4/3 0,006 4/3 . 0,006 16/9 16/9 . 0,006
5/3 0,033 5/3 . 0,033 25/9 25/9 . 0,033
2 0,092 2 . 0,092 4 4 . 0,092
7/3 0,231 7/3 . 0,231 49/9 49/9 . 0,231
8/3 0,294 8/3 . 0,294 64/9 64/9 . 0,294
3 0,343 3 . 0,343 9 9 . 0,343

x i . P (x = x i ) = 2,6 xi2 . P (x = x i ) = 6,9067

E (x ) = x i . P (x = x i ) = 2,6

E (x ) = x 2i . P (x = x i ) = 6,9067
2 muestra


V (x) = E (x 2 ) (E (x)) 2 = 6,9067 (2,6 ) 2 = 0,1467

= x i . P (x = x i ) = 1.0,1 + 2 . 0,2 + 3 .0,7 = 2,6



E (x ) = x 2i . P (x = x i ) = 12 . 0,1 + 22 . 0,2 + 32 . 0,7
2
= 7,2 poblacin

2 = E (x 2 ) 2 = 7,2 (2,6 ) 2 = 0,44

Santiago de la Fuente Fernndez 36


Muestreo aleatorio simple

= E(x) 2 0,44
En consecuencia: Obsrvese que, 2x = a 0,1467 =
2 V ( x ) = 2
x
n 3

e) Calcular la esperanza de la varianza muestral y compararla con la varianza


poblacional.
2x P (2x = 2x ) 2x . P ( 2x = 2x )
i i i i
0 0,352 0 . 0,352
2/9 0,396 2/9 . 0,352
2/3 0,084 2/3 . 0,352
8/9 0,168 8/9 . 0,352
2x i .P (2x = 2x ) = 0,2933
i

E ( 2x ) = 2x i .P (2x = 2x ) = 0,2933 (esperanza varianza muestral)


i

2 2
= E (x ) =2
7,2 (2,6) 2 = 0,44 (varianza poblacional)

(3 1) (0,44) (n 1) 2
Se verifica la relacin: E (2x ) = 0,2933 = =
3 n

Santiago de la Fuente Fernndez 37


Muestreo aleatorio simple
MUESTREO ALEATORIO SIMPLE. DISRIBUCIN DE LA MEDIA MUESTRAL CON VARIANZA
CONOCIDA.

2.- Se sabe que el peso de los jvenes entre 14 y 18 aos sigue una distribucin normal
con media 50 kg y desviacin tpica 25 kg. Para llevar a cabo un estudio del control de
peso se seleccionan aleatoriamente 100 jvenes cuyas edades se encuentran
comprendidas en el intervalo sealado. Si el peso medio muestral est entre 45 y 70 kg
se considera que estn dentro de los lmites normales. Cul es la probabilidad de que el
peso est fuera de control?

Solucin:
v. a. X = peso entre 14 y 18 aos

P [(x < 45) (x > 70)] = P (x < 45) + P (x > 70) =


x 50 45 50 x 50 70 50
= P < + P > =
2 ,5 2 ,5 2,5 2,5
= P (z < 2) + P (z > 8) = P (z > 2) + P (z > 8) = 0,0228 + 0 =
= 0,0228

Santiago de la Fuente Fernndez 38


Muestreo aleatorio simple
MUESTREO ALEATORIO SIMPLE. DISRIBUCIN DE LA MEDIA MUESTRAL CON VARIANZA
CONOCIDA Y CON VARIANZA DESCONOCIDA.

3.- Los barcos que hacen visitas guiadas por el Sena disponen de 60 asientos por barco
y una capacidad mxima de 4.200 kg por viaje. Los dueos de la empresa de barcos
saben por experiencia que los pesos de los turistas tienen una media de 71 kg y una
dispersin, medida a travs de la desviacin tpica, de 10 kg.
a) Cul es la probabilidad de que un grupo de 60 turistas, escogidos aleatoriamente
en uno de los viajes, tenga un peso medio superior al total de la carga lmite
permitida?
b) Cul sera el resultado si la varianza poblacional fuera desconocida?. (Suponga
que la desviacin tpica muestral es de 5 kg).

Solucin:

a) Peso = 4200/60 = 70 kg v. a. X = peso medio turistas

x 71 70 71
P ( x > 70 ) = P > = P ( z > 0,77) = P ( z < 0,77) =
1,29 1,29
= 1 P ( z > 0,77) = 1 0,2206 = 0,7794

b) En el muestreo de una poblacin normal con varianza desconocida, y desviacin tpica


x
muestral x , la variable: = t n 1
x
n1

x 71 70 71
P ( x > 70 ) = P = P ( t59 > 1,53) P ( z > 1,53) =
n > 30
>
5 59 5 59

= P ( z < 1,53) = 1 P ( z > 1,53) = 1 0,063 = 0,937

Interpolando: P ( t59 > 1,53) = P ( t59 < 1,53) = 1 P ( t59 > 1,53) = 1 0,069 = 0,931

P ( t59 > 1,53) = P ( t59 < 1,53) = 1 P ( t59 > 1,53) = 1 0,069 = 0,931

Santiago de la Fuente Fernndez 39


Muestreo aleatorio simple
Abscisas reas Abscisas reas
P ( t60 > 1,53) = x 1,296 1,671 0,1 - 0,05 0,37 0,05
1,53 - 1,671 x 0,05 0,14 x 0,05

0,14 . 0,05
x = 0,05 + = 0,069
0,37

Santiago de la Fuente Fernndez 40


Muestreo aleatorio simple
4.- La empresa Grano Sol vende galletas ecolgicas en paquetes de 60 unidades. Los dueos
saben que el peso de cada galleta es una variable aleatoria que tienen una media de 71 gr. y una
dispersin, medida a travs de la desviacin tpica, de 10 gr.
a) Cul es la probabilidad de que en un paquete de 60 galletas escogidas aleatoriamente, el
peso medio de las galletas sea superior a 70 gramos?
b) Cul sera el resultado si la varianza poblacional fuera desconocida? (Suponga que la
desviacin tpica muestral es de 5 kg, y una cuasidesviacin tpica de 5,04).

Solucin:

a) v. a. X = peso de las galletas

x 71 70 71
P ( x > 70 ) = P > = P ( z > 0,77) = P ( z < 0,77) =
1,29 1,29
= 1 P ( z > 0,77) = 1 0,2206 = 0,7794

b) En el muestreo de una poblacin normal con varianza desconocida, y desviacin tpica


x
muestral x , la variable: = tn 1
x
n1

x 71 70 71
P ( x > 70 ) = P = P ( t59 > 1,53) P ( z > 1,53) =
n > 30
>
5 59 5 59

= P ( z < 1,53) = 1 P ( z > 1,53) = 1 0,063 = 0,937

Interpolando: P ( t59 > 1,53) = P ( t59 < 1,53) = 1 P ( t59 > 1,53) = 1 0,069 = 0,931

Abscisas reas Abscisas reas


P ( t60 > 1,53) = x 1,296 1,671 0,1 - 0,05 0,37 0,05
1,53 - 1,671 x 0,05 0,14 x 0,05

0,14 . 0,05
x = 0,05 + = 0,069
0,37

Santiago de la Fuente Fernndez 41


Muestreo aleatorio simple

Advirtase que, si la varianza poblacional es desconocida, la media muestral x sigue


2

una t-Student con (n-1) grados de libertad, entonces:

x x
= tn 1 y es una cantidad pivotal para
x sx
n1 n

recordemos que n . 2 = (n 1) . s2

x 71 70 71
P ( x > 70 ) = P > = P ( t59 > 1,5369) = P ( t59 < 1,5369) =
5,04 60 5,04 60

= 1 P ( t59 > 1,5369) = 1 x = 1 0,06789 = 0,09321

Abscisas reas Abscisas reas


P ( t60 > 1,5369 ) = x 1,2961 1,6711 0,1 - 0,05 0,375 0,05
1,5369 - 1,6711 x 0,05 0,1342 x 0,05

0,1342 . 0,05
x = 0,05 + = 0,06789
0,375

Santiago de la Fuente Fernndez 42


Muestreo aleatorio simple
MUESTREO ALEATORIO SIMPLE. DISRIBUCIN DE LA VARIANZA MUESTRAL.

5.- Se sabe por los datos censales que la variabilidad de la altura de alumnos de una
clase medida a travs de la varianza es de 15,3. No obstante, para estudiar la
variabilidad en el muestreo de la varianza muestral se decide tomar una m.a.s. de 15
alumnos. Cul es la probabilidad de que la varianza muestral sea mayor que 15?
Nota: Suponer que la estatura es una variable aleatoria normalmente distribuida.

Solucin:

Para el anlisis de la varianza muestral se


utiliza el estadstico n21 de Pearson con
(n - 1) grados de libertad.

2 varianza poblacional
2x varianza muestral
s2x cuasivarianza muestral

(
v.a. X =estatura: X N ; 15,3 N ( ; 3,91 ) )
n . 2x n = 15 15 . 2x
n21 2
14
2 15,3

(
P 2x > 15 )= 15 . 2 15 . 15
P
15,3
x >
15,3 14 ( )
= P 2 > 14,7 = 0,4835

Abscisas reas Abscisas reas

2
P 14(> 14,7 = x ) 7,790 21,064
14,7 - 21,064
0,90 - 0,10
x 0,10
13,274
6,364
0,80
x 0,10

6,364 . 0,80
x = 0,10 + = 0,4835
13,274

(n 1) . s2x n = 15 14 . s2x
De otra parte, n21 2
2
14
15,3

(
P s2x > 15 ) 14 . s2
= P
15,3
x
>
14 . 15
15 ,3
2
= P 14 ( )
> 13,725 = 0,5423

Santiago de la Fuente Fernndez 43


Muestreo aleatorio simple
MUESTREO ALEATORIO SIMPLE. DISRIBUCIN DE LA DIFERENCIA DE MEDIAS MUESTRALES
CON VARIANZAS CONOCIDAS.

6.- Se desea analizar las diferencias de las calificaciones entre dos grupos de alumnos.
Unos proceden del Grupo b1 y otros del Grupo b2. Para estudiar la distribucin en el
muestro de la diferencia de medias se toman m.a.s. independientes de ambas
poblaciones obtenindose la siguiente tabla:

Grupo b1 Grupo b2
Tamao de la poblacin 200 150
Tamao de la muestra 100 75
Media de la poblacin 4,10 5,18
Media de la muestra 4,2153 5,3247
Desviacin tpica de la poblacin 1,55 1,95
Desviacin tpica de la muestra 1,5635 1,8238

Cul es la probabilidad de que la diferencia de medias muestrales sea mayor que uno?

Solucin:
v.a. X =calificacin del Grupo b1 X N(4,10 , 1,55)
v.a. Y =calificacin del Grupo b2 Y N (5,18 , 1,95)

Siendo X e Y independientes, la nueva variable (X Y) sigue tambin una distribucin


normal N ( x y ; 2x + 2y )


Con lo cual, (x y) N ( 4,10 5,18 ); 0,155 2 + 0,225 2 N ( 1.08 ; 0,2732)

(
P x y >1 ) = P [ (x y ) > 1] + P [ (x y ) < 1] =
1 + 1,08 1 + 1,08
= P z > + P z < = P (z > 7,61) + P [ z < 0,2928] =
0,2732 0,2732
= 0 + [ 1 P ( z > 0,2928 ) ] = 1 0,3859 = 0,6141
o tambin,

P ( x y >1 =1P) ( )
x y < 1 = 1 P ( 1 < (x y) < 1 ) =

Santiago de la Fuente Fernndez 44


Muestreo aleatorio simple
1 + 1,08 (x y) + 1.08 1 + 1,08
= 1 P < < = 1 P ( 0,2928 < z < 7,61 ) = 0,6141
0,2732 0,2731 0,2732
MUESTREO ALEATORIO SIMPLE. DISRIBUCIN DE LA PROPORCIN MUESTRAL

7.- Un concesionario vende dos tipos de vehculos, unos de gama alta y otros de gama
media. Los coches de gama alta suponen el 30% del total de los coches vendidos. Cul
es la probabilidad de que entre los 100 ltimos vehculos vendidos ms del 35% sean de
gama alta?

Solucin:

La variable poblacional
X = 'venta de coches gama
alta' es una variable
binomial B(100; 0,3), que
sigue aproximadamente una
distribucin normal tal que
X N (np ; npq )

X Teorema Central Lmite pq


p = p N p ,
n n

0,3 . 0,7
para n = 100, p N 0,3 ; N (0,3 ; 0,0458 )
100

p 0,3 0,35 0,3


P (p > 0,35) = P > = P (z > 1,0917) = 0,1375
0,0458 0,0458

Interpolando:

Abscisas reas Abscisas reas


0,1379 0,1357 1,09 1,1 0,0022 0,01
P (z > 1,0917) = x
x - 0,1357 1,0917 1,1 x - 0,1357 0,0083

0,0022 . 0,0083
x = 0,1357 + = 0,1375
0,01

Santiago de la Fuente Fernndez 45


Muestreo aleatorio simple

MUESTREO ALEATORIO SIMPLE. DISRIBUCIN DE LA DIFERENCIA DE PROPORCIONES


MUESTRALES.

8.- Se sabe que los sbados por la noche un 70% de los conductores superan la tasa de
alcoholemia permitida por la ley. Sin embargo esta cifra se reduce a un 40% los
domingos por la noche. Durante un fin de semana, se quiere realizar un control de
alcoholemia y comparar los resultados de los dos das. Se decide elegir al azar 40
vehculos de los que circulan el sbado por la noche y 35 del domingo. Calcular la
probabilidad de que la proporcin muestral de conductores que superan la tasa de
alcoholemia permitida por la ley haya descendido ms de un 10% del sbado al domingo.

Solucin:

Sean las variables poblacionales:

X = tasa de alcoholemia sbado, con p x = 0,7


Y = tasa de alcoholemia domingo, con p y = 0,4

X Teorema Central Lmite p x q x


p x = p x N p x ,
nx nx

Y Teorema Central Lmite p y q y
p y = p y N p y ,
ny ny

p x qx p y qy
[ p x p y ] N [ p x p y ] ;
nx
+
ny





siendo las muestras: n x = 40 , n y = 35


[ p x p y ] N [ 0,7 0,4] ; 0,7 . 0,3 0,4 . 0,6
+ N (0, 3 ; 0,11)

40 35

0, 1 0,3
P ( p x p y > 0, 1) = P z > = P ( z > 1,82) = 1 P ( z > 1,82) = 1 0,0344 = 0,9656
0, 11

Santiago de la Fuente Fernndez 46


Muestreo aleatorio simple

9.- Segn los resultados de un estudio exhaustivo de la poblacin un 80% de las


mujeres entrevistadas afirman utilizar algn producto cosmtico todos los das,
mientras que en el caso de los hombres este porcentaje en la actualidad asciende 55%.
Una pequea firma de cosmtica se plantea sacar al mercado una crema hidratante de
uso especfico para hombres, pero antes de crear esa nueva lnea de negocio, decide
realizar su propia encuesta sobre una pequea muestra aleatoria: selecciona a 50
mujeres y a 60 hombres y les pregunta sobre sus hbitos cosmticos. Calcule la
probabilidad de que la diferencia entre la proporcin de mujeres que utiliza cosmticos
respecto a la proporcin de hombres que los utiliza sea inferior al 20%.

Solucin:

Sean las variables poblacionales:

X = mujeres utilizan algn producto cosmtico, con px = 0,8


Y = hombres utilizan algn producto cosmtico, con py = 0,55

X Teorema Central Lmite p x q x


p x = p x N p x ,
nx nx

Y Teorema Central Lmite p y q y
p y = p y N p y ,
ny ny

p x qx p y qy
[ p x p y ] N [ p x p y ] ;
nx
+
ny



siendo las muestras: nx = 50 , ny = 60


[ px py ] N [ 0,8 0,55] ; 0,8 . 0,2 0,55 . 0,45
+ N (0, 25 ; 0, 0856)

50 60

[ ]
P ( px p y ) < 0, 20 = P z <

0, 2 0,25
0, 0856
= P (z < 0,58) = P (z > 0,58) = 0,2810

[ ]
Como la P ( px p y ) > 0, 20 = 1 0,2810 = 0,719 es bastante probable, se aconsejara
sacar el producto del mercado.

Santiago de la Fuente Fernndez 47


Muestreo aleatorio simple

CLCULO DE PROPIEDADES BSICAS DE LOS ESTIMADORES (INSESGADEZ y EFICIENCIA)

10.- La variable aleatoria poblacional "renta de las familias" del municipio de Madrid se
distribuye siguiendo un modelo N (, 2 ) . Se extraen muestras aleatorias simples de
tamao 4. Como estimadores del parmetro , se proponen los siguientes:

x1 + 2x 2 + 3x 3
1 =

6
x3 4x 2
2 =

3
3 = x

Se pide:
a) Comprobar si los estimadores son insesgados
b) Cul es el ms eficiente?
c) Si tuviera que escoger entre ellos, cul escogera?. Razone su respuesta a partir
del Error Cuadrtico Medio.

Solucin:

a) Un estimador es insesgado (o centrado) cuando se verifica E() =

E (
x1 + 2x 2 + 3x 3
1) = E
6
=
1
6
[
E x1 + 2x 2 + 3x 3 = ]

=
1
6
[
E ( x 1) + 2 E ( x 2 ) + 3 E ( x 3 ) = ]
1
6
[6 ] =

E (
x1 4x 2
2) = E
3
=
1
3
[
E x1 4x2 ] =
1
3
[
E ( x 1) 4 E ( x 2 ) = ]

1
= [ 3 ] =
3

E (
x1 + x2 + x3 + x 4
3) = E
4
=
1
4
[
E x1 + x2 + x3 + x 4 = ]

=
1
4
[
E ( x 1) + E ( x 2 ) + E ( x 3 ) + E ( x 4 ) =
1
4
]
[4 ] =

Los tres estimadores son insesgados o centrados.

b) El estimador ms EFICIENTE es el que tenga menor varianza.

[ ]
1
V = V
x1 + 2x 2 + 3x 3
6
=
1
36
[
V x1 + 2x 2 + 3x 3 = ]

=
1
36
[
V ( x 1) + 4 V ( x 2 ) + 9 V ( x 3 ) =
1
36
]14 2 =
14 2
36
[
= 0,39 2 ]

Santiago de la Fuente Fernndez 48


Muestreo aleatorio simple

[ ]
2
V = V
x1 4x2
3
=
1
9
V x1 4x2[ ] =
1
9
[ V ( x 1) + 16 V ( x 2 ) ] =

=
1
9
[
17 2 =
9
]
17 2
= 1,89 2

[ ]
V
3
x1 + x2 + x3 + x 4
= V
4
=
1
16
[
V x1 + x2 + x3 + x 4 = ]

=
1
16
[
V ( x 1) + V ( x 2 ) + V ( x 3 ) + V ( x 4 ) =
1
16
]
4 2 =
4 2
16
[
= 0,25 2 ]
El estimador 3 es el ms eficiente.

c) Escogera el estimador que presentase menor Error Cuadrtico Medio (ECM)

2

ECM (
) = E (
) 2
= V (
) + E (
)
1424 3
sesgo b (
) = E ( [
) ]
sesgo
Si E14
(
2
)=
4

3 ECM () = V ()
insesgado

Como los tres estimadores son insesgados (centrados), me decido por el que
menor varianza presenta, puesto que coincidir con el que menor ECM tiene, es
decir, escojo el estimador 3

Advirtase que si el estimador es insesgado: ECM( ) = V ( )

Santiago de la Fuente Fernndez 49


Muestreo aleatorio simple

ESTIMADORES SESGADOS: CLCULO SESGO Y ESTIMACIN PUNTUAL

11.- La variable aleatoria X representa los gastos mensuales de una empresa, cuya
funcin de densidad es f (, x) = x 1 con > 0 y 0 < x < 1 . Se realiza una m.a.s. de
tamao 3, y se proponen tres estimadores:


1 = x

x 12 + 2 x 2 2
2 + 3x 3

2 =
6
x 3 2x1 + 4x 2

3 =
6
a) Calcule los sesgos
b) Si la muestra que se obtiene es (0,7 ; 0,1 ; 0,3), calcule las estimaciones
puntuales.
c) Cules son las funciones estimadas para las estimaciones anteriores?

Solucin:

Un estimador es insesgado (centrado) cuando E () = .


Un estimador es sesgado cuando E () = + b{) b (
( ) = E (
)
sesgo

X = gastos mensuales de la empresa


f (, x) = x 1 con > 0 y 0 < x < 1 m.a.s. con n = 3

Sesgo del estimador 1 = x


1 = x E (
x 1 + x 2 + x 3
1) = E
3
=
1
3
[
E x1 + x2 + x3 =
1
3
]
(3 ) = (media poblacional)

1
1 1 1 x +1
donde = x f (x, ) dx = 0 x f (x, ) dx = 0 x x 1 dx = 0 x dx = =
+ 1 0 +1

2
El sesgo: b (1 ) = E (1 ) = =
+1 +1

x 12 + 2 x 2 2
2 + 3x 3
Sesgo del estimador 2 =
6

x 2 + 2x 2 + 3x 2
1 2 3 1 2 2 2 1
E (
2) = E = E (x 1 ) + 2 E (x 2 ) + 3 E (x 3 ) = (6 2 ) = 2 ()
6 6 123 123 123 6

2 2 2

donde 2 es el momento de orden 2 respecto al origen.

Santiago de la Fuente Fernndez 50


Muestreo aleatorio simple
1 2 1 2 1
2 = E(x 2 ) = x2 f (x, ) dx = x f (x, ) dx = x x 1
dx = x +1 dx =
0 0 0
1
x+2
= =
+ 2 0 +2

entonces,

x 2 + 2 x 2 + 3 x 2
1 2 3 1 2 2 2
E (
2) = E = E (x 1 ) + 2 E (x 2 ) + 3 E (x 3 ) = 2 =
6 6 123 1 2 3 1 2 3 +2

2 2 2

El sesgo: b (2 ) = E 2 =( )
=
2 +
+2
+2

x 3 2x1 + 4x2
Sesgo del estimador 3 =
6

E (
x 3 2 x 1 + 4 x 2
3) = E
6
=
1
6
E x3 2x1 + 4x 2 =
1
6
[
(3 ) =
1
2
]

1
1 1 1 1
x +1
=
x f (x, ) dx = 0
x f (x, ) dx = 0
x x dx = 0
x dx =
+ 1
=
0 +1

1 22 +
El sesgo: b (3 ) = E (3 ) = =
2 + 1 2 ( + 1)

b) Si la muestra que se obtiene es (0,7 ; 0,1 ; 0,3), calcule las estimaciones puntuales.

0, 7 + 0, 1 + 0, 3
1 = = 0, 367
3

0, 7 2 + 2 . 0, 1 2 + 3 . 0, 3 2
2 = = 0, 13
6
0, 3 2 . 0, 7 + 4 . 0, 1
3 = = 0, 117 a no puede ser, puesto que
> 0
6

c) Cules son las funciones estimadas para las estimaciones anteriores?

1 f (0, 367, x) = 0, 367 x0, 367 1 = 0, 367 x 0, 633

2 f (0, 13, x) = 0, 13 x0, 13 1 = 0, 367 x 0, 87

Santiago de la Fuente Fernndez 51


Muestreo aleatorio simple
CLCULO EFICIENCIA RELATIVA Y ERROR CUDRATICO MEDIO

12.- Sea una poblacin con media de la que se extraen m.a.s. de tamao n. Considere
los siguientes estimadores de la media:
n
1
1 = x
2 =

n+1
xi
i =1
a) Estudie la insesgadez, la eficiencia relativa y la consistencia de ambos
estimadores.
b) Elija uno de los dos en trmino del error cuadrtico medio.

Solucin:

a) Insesgadez

Un estimador es insesgado (o centrado) cuando se verifica E () =


Un estimador es sesgado cuando E () = + b{
(
) b
{ (
) = E (
)
sesgo sesgo

Un estimador es asintticamente insesgado si su posible sesgo tiende a cero al


~
aumentar el tamao muestral que se calcula: lim b ( ) = 0
n

1 n 1 n
1 n
1
E (
1 ) = E (x) = E (
n i=1
x i) =
n
E ( x i) =
n
E (x i ) =
n
(n ) =
i=1 i=1
b (
1 ) = E (
1) = = 0

1 n 1 n
1 n
1 n
E (
2) = E(
n + 1 i=1
x i ) =
n+1
E ( x i) =
n+1
E (x i ) =
n+1
(n ) =
n+1
i=1 i=1

0 cuando 'n' aumenta


6447448
n n n
b (
2 ) = E (
2) = = =
n+1 n+1 14n2+41
3
sesgado
asinto ticamente

Eficiencia

Sean 1 y 2 dos estimadores insesgados de un parmetro desconocido .


Decimos que 1 es ms eficiente que 2 si se verifica que Var ( 1) < Var ( 2 )
Var (
1)
La eficiencia relativa se mide por el ratio:

Var ( 2 )

1 n 1 n 1 2 2
V (
1 ) = V (x ) = V ( x i) = V (x i ) = ( n ) =
n i=1 n 2 i=1 n2 n
1 n 1 n
1 n
V (
2) = V ( x i ) = 2 V (x i ) = 2
(n 2) = 2
n + 1 i=1 (n + 1) i=1 (n + 1) (n + 1) 2

Santiago de la Fuente Fernndez 52


Muestreo aleatorio simple
Var (
1) 2 2
n (n + 1)
eficiencia relativa = = > 1 a Var (
1 ) > Var (
2)
2 2
Var (
2) n (n + 1) n2
El estimador 2 tiene menor varianza, por lo que es ms eficiente que 1

Consistencia

Un estimador consistente es un estimador asintticamente insesgado cuya varianza


tiende a cero al aumentar el tamao muestral.
lim E (
) =
n
El estimador es consistente cuando
lim V (
) = 0
n

lim E ( 1 ) = lim E (x) =


n n
1
2 es consistente
lim V (
1 ) = lim =0
n n n

1
lim E (
2 ) = lim =
n n n+1
2
es consistente
n
lim V (
2 ) = lim 2 = 0
n n (n + 1) 2

c) Elegir uno de los dos en trmino del error cuadrtico medio.

El Error Cuadrtico Medio (ECM) de un estimador viene definido:


2

ECM (
) = E (
) 2
= V (
) + E (
) sesgo b (
) = E (
)
1424 3
sesgo
Si E14
(
2
)=
4

3 ECM () = V ()
insesgado

2 2
1 ) = V (
ECM ( 1) + [ b ( 1)] 2 = n
+0=
n
2
n 2 + 2
ECM (
2 ) = V (
2) + [ b ( 2 )] 2 = n 1
2 +

=
(n + 1) 2 n+1 (n + 1) 2

El estimador 1 ser el que presenta menor ECM cuando ECM (


1 ) ECM (
2)

En esta lnea,

2 n 2 + 2 n 2 2 2 n 2 2
= +
n (n + 1) 2 (n + 1) 2 (n + 1) 2 n (n + 1) 2 (n + 1) 2

Santiago de la Fuente Fernndez 53


Muestreo aleatorio simple
2 2 2 2 2 2 2
(n + 1) n (n + 1) n
2 2
2 2 n
n (n + 1) (n + 1)

2n + 1 2n + 1 2
2 2
n n 2

2n + 1 2
Si 1 se elige antes que
a 2
n 2

2n + 1 2
Si 2 se elige antes que
a 1
n 2

Santiago de la Fuente Fernndez 54


Muestreo aleatorio simple
CLCULO INSESGADEZ E EFICIENCIA

13.- El peso en kilos de los jamones vendidos por una empresa sigue una distribucin
normal con varianza 4 y peso medio desconocido. Se conoce que el peso medio de los
jamones vendidos es superior a 5 kg, y se toman m.a.s. de tamao 4 para estimar .
Cul de los dos estimadores sera el mejor respondiendo a la insesgadez y eficiencia?

X1 + X2 + X3 X1 + X2

1 =
2 =
4 2
Solucin:

- Un estimador es insesgado (centrado) si E() =


Un estimador es sesgado si E() = + b () a b
{ (
) = E (
)
sesgo

La v.a X i =' peso en kg de los jamones' sigue una distribucin normal de varianza 4
Para estudiar la insesgadez de los estimadores hallamos sus esperanzas:

E (
X 1 + X 2 + X 3
1) = E
4
=
1
4
[
E (X 1 ) + E (X 2 ) + E (X 2 ) =
3
4
]

3 1
El sesgo del estimador 1 ser: b ( 1) = E ( 1) = =
4 4

E (
X 1 + X 2
2) = E
2
=
1
2
[
E (X 1 ) + E (X 2 ) ] =
2
2
=

El estimador 2 es insesgado, b ( 2 ) = 0

Atendiendo al sesgo se elige 2


- Para analizar la eficiencia relativa de los dos estimadores se calculan las
respectivas varianzas


V (
X 1
1) = V
+ X2 + X3
4
=
1
V (X 1 + X 2 + X 3 )
16 144424443

=
1
16
[ V (X 1) + V (X 2 ) + V (X 2 ) ] =

las observaciones
son independientes
V (X i ) = 4
} 1 12 3
= 12 = =
16 16 4


V (X i ) = 4
}
V (
X 1
2) = V
+ X2
2
=
1
V (X 1 + X 2 ) =
4 1442443
1
4
[ V (X 1) + V (X 2 ) ] =
1
4
8 = 2

las observaciones
son independientes

Respecto a la varianza se elige el estimador 1 por ser el de menor varianza.

Santiago de la Fuente Fernndez 55


Muestreo aleatorio simple
Tenemos propiedades contrapuestas, de modo que el estimador insesgado 2 es el de
mayor varianza. Elegiremos el estimador en base al error cuadrtico medio (ECM):

3
2
2 + 12
ECM ( 1) = + =
4 4 16

ECM = Varianza + (sesgo) 2
ECM (
2) = 2 + 0 = 2


Se analiza cuando es mayor el ECM del primer estimador 1 : ECM( 1) > ECM ( 2 )

2 + 12
> 2 2 > 20 > 20 4,47
16

Si es en valor absoluto mayor que 4,47, el error cuadrtico medio de 1 es mayor, con
lo que se elige el estimador 2 .
Como sabemos que el peso medio de los jamones es superior a 5 kg, no queda duda que
el estimador a elegir (con menor error cuadrtico medio) es 2 .

Santiago de la Fuente Fernndez 56


Muestreo aleatorio simple
14.- La distribucin del peso de las manzanas de una determinada cosecha sigue una
distribucin normal, cuyo peso medio es desconocido y cuya desviacin tpica es 7
gramos. Se pide:

a) Analizar cul de los estimadores 1 , 2 del peso medio es mejor respecto del
sesgo y de la eficiencia, para una muestra aleatoria simple de tamao cinco.
5
Xi
b) Si
1 = i=1
y 2 = X1 + 2X 2 + 3X 3 4X 4 X 5 ,
obtener los pesos medios
5
estimados a partir de la siguiente muestra (125, 135, 130, 137, 142).

Solucin.-

a) El peso de las manzanas sigue una distribucin N (, 7)

Calculamos las esperanzas de los estimadores para analizar el sesgo de los estimadores

E (X i) =
5 1 5 5 }
E [ X i]
1 1
E ( 1) = E X i 5 = E X i = = (5 ) =
i=1 5 i=1 5 i =1 5

E ( 2) = E (X 1 + 2 X 2 + 3 X 3 4 X 4 X 5) = E (X 1) + 2 E ( X 2) + 3 E ( X 3) 4 E ( X 4) E ( X 5) =
= + 2 + 3 4 =

Los estimadores 1 , 2 son insesgados (centrados).

b) Para analizar la eficiencia de los estimadores calculamos sus varianzas:

V (X i ) = 7 2
5 5 5
V [X i ]
1 1 } 1 49
1) = V X i 5 =
V ( V X i = = (5 . 49) =
i=1 25 i=1 25 i=1 25 5

V ( 2) = V (X 1 + 2 X 2 + 3 X 3 4 X 4 X 5) = V (X 1) + 4 V ( X 2) + 9 V ( X 3) + 16 V ( X 4) + V ( X 5) =
= (49) + 4 (49) + 9 (49) + 16 (49) + (49) = 31 (49) = 1519

Como los dos estimadores son insesgados y V ( 2 ) se elige como mejor el


1 ) < V (

estimador 1 , que es el peso medio de la muestra de las cinco manzanas.

Santiago de la Fuente Fernndez 57


Muestreo aleatorio simple
15.- Supongamos que la distribucin de ingresos de una cierta poblacin es una variable
aleatoria con media desconocida y varianza 2 tambin desconocida. Si queremos
estimar el ingreso medio de la poblacin mediante una m.a.s. de tamao n, respecto de la
insesgadez y de la eficiencia. Cul de los dos estimadores elegiramos?
n n
Xi Xi
1 = i=1 2 = i=1

n1 n
Solucin:

Un estimador es insesgado (centrado) si E() =


Un estimador es sesgado si E() = + b () a b
{ (
) = E (
)
sesgo

La v.a Xi ='ingresos de cierta poblacin'' sigue una distribucin normal N(, )

Para analizar el sesgo de los estimadores, hallamos la esperanza:

n 1 n 1 n 1 n
1) = E ( X i n 1) =
E ( E ( X i ) = E (X i) = (n ) =
i=1 n 1 i=1 n1 i=1 n1 n1

n 1
El sesgo del estimador 1 ser: b (
1 ) = E (
1) = =
n1 n1

n 1 n 1 n 1
2 ) = E ( X i n) =
E ( E ( X i ) = E (X i) = n (n ) =
i=1 n i=1 n i=1

El estimador 2 , que es la media muestral, es insesgado (centrado).

La eficiencia de los estimadores se analiza a travs de su varianza:

n
1 n
1 n
1 n 2
1) = V ( X i
V ( n 1) = V ( X i ) = V (X i ) = (n 2 ) =
i =1 (n 1) 2 i =1 (n 1) 2 i =1 (n 1) 2 (n 1) 2

n 1 n 1 n 1 2
2 ) = V ( X i n) =
V ( V ( X i ) = V (X i) = (n 2 ) =
i=1 n2 i=1 n i=1 n2 n

El estimador ms eficiente ser el de menor varianza. Comparando las varianzas de los


estimadores:
2 n 2
V (
2) = < = V (
1) puesto que (n 1) 2 < n 2
n (n 1) 2

El estimador 2 , que es la media muestral, es el mejor tanto al sesgo como a la


eficiencia.
COMPRENSIN DE LA VEROSIMILITUD

Santiago de la Fuente Fernndez 58


Muestreo aleatorio simple
CLCULO DE LOS ESTIMADORES MXIMO VERSOSMILES. PROPIEDADES

16.- Una urna contiene bolas blancas y negras. Sea p la probabilidad de extraer una
bola blanca cuando se realiza una extraccin al azar. Asociado a este experimento
aleatorio tenemos la variable aleatoria X que puede tomar los valores:

X = 1 si la bola extrada es blanca


X = 0 si la bola extrada es negra

La distribucin de probabilidad ser una B(1; p): P(X = x) = p x (1 p) 1 x

Se selecciona una muestra aleatoria con reemplazamiento de tamao 3 (x 1, x 2, x 3 ) ,


siendo x i la variable aleatoria a la extraccin i-sima, y suponemos que ha resultado la
siguiente relacin (B, N, B). Como el parmetro p es desconocido pretendemos saber,
entre los valores, p = 0,65 y p = 0,73 qu valor hace ms probable la aparicin de dicha
extraccin.

Solucin.-
P(B) = p
Si la muestra (B, N, B) es independiente, siendo
P(N) = 1 p

P(B, N, B) = P(B N B) = P(B) .P(N) .P(B) = p .(1 p).p = p 2. (1 p)

p = 0,65 : P(B, N, B) = 0,65 2 . 0,35 = 0, 1479



entonces
p = 0,73 : P(B, N, B) = 0,73 2 . 0,27 = 0, 1439

Resulta ms probable (p = 0,65), siendo ms verosmil.

FUNCIN DE VEROSIMILITUD DE LA MUESTRA.- Sea (X 1, L , X n ) una muestra


aleatoria de una poblacin X con funcin de masa (o funcin de densidad f ) donde
= ( 1, L , n ). El estimador de mxima verosimilitud de es el formado por los
valores ( 1, L , n ) que maximizan lo que llamaremos funcin de verosimilitud de la
muestra (x 1, L , x n ) obtenida:
P (x 1 , ) L P (x n , ) caso discreto
L () = L ( x 1, L , x n ; ) =
f (x 1 ) L f (x n ) caso continuo

Si consideramos la m.a.s. (x 1, x 2 , x 3 ) , siendo las variables aleatorias x i independientes,


tomando los valores 0, 1, con distribucin B(1, p), la distribucin de probabilidad
asociada ser:

Santiago de la Fuente Fernndez 59


Muestreo aleatorio simple
P ( x 1 , p) = P ( X = x 1) = p
x1
(1 p) 1 x1

x2 1x2
P ( x 2 , p) = P ( X = x 2) = p (1 p) x i = 1 , 0 sea bola blanca o negra
x 1 x3

P ( x 3 , p) = P ( X = x 3 ) = p 3 (1 p)

La funcin de verosimilitud ser:

3
x 1 x1 x 1x2 x 1 x3
L (p) = P (x i , p) = p 1 (1 p) . p 2 (1 p) . p 3 (1 p) =
i =1
x +x2 +x3 3 ( x 1 + x 2 + x 3)
= p 1 (1 p)

En la muestra (B, N, B) el valor que toma la funcin de verosimilitud ser:

L (p) = p 1 + 0 + 1 (1 p) 3 ( 1 + 0 + 1) = p 2. (1 p)

Santiago de la Fuente Fernndez 60


Muestreo aleatorio simple
17.- Un atleta olmpico de salto de altura se enfrenta a un listn de 2,3 metros. Su
entrenador desea estudiar el comportamiento del saltador. Sabe que el nmero de
saltos fallidos por hora es una variable aleatoria distribuida como una Poisson de
parmetro .
a) Calcular el estimador mximo verosmil del parmetro .
b) Analizar sus propiedades.

Solucin.-

a)

FUNCIN DE VEROSIMILITUD DE LA MUESTRA (EMV).- Sea (x 1, L , x n ) una


muestra aleatoria de una poblacin X con funcin de masa P (o funcin de densidad f )
donde = ( 1, L , n ). El estimador de mxima verosimilitud de es el formado por los
valores ( 1, L , n ) que maximizan lo que llamaremos funcin de verosimilitud de la
muestra (x 1, L , x n ) obtenida:
P (x 1 , ) L P (x n , ) caso discreto
L () = L(X; ) = L ( x 1, L , x n ; ) =
f (x 1 ) L f (x n ) caso continuo
En muchas ocasiones, la forma ms cmoda de encontrar el estimador de mxima
verosimilitud es considerar [ ln L ()] en vez de L () , ya que es ms fcil de manejar y
presenta los mismos mximos y mnimos, y despejamos = ( 1, L , n ) de la ecuacin:
ln L ()
= 0

Sea la v.a. X = 'nmero de saltos fallidos por hora'

x E (X) =
En la distribucin de Poisson: P (X = x) = e
x! V (X) =

En una muestra aleatoria simple de tamao n, la funcin de verosimilitud L (X, ) :


n

x x
xi
n
1 n i=1
L ( ) = L (X , ) = P (x i, ) = e L e = n e n
i=1 x 1! x n!
x i!
i=1
n n n
xi xi
i =1 i =1 xi n
n n
L (X , ) = n e ln L (X , ) = ln n e = ln ( i =1 ) ln ( x i !) + ln (e n ) =
i=1
x i! x i!
i=1 i =1
n n
= x i Ln Ln (x i !) n
i=1 i=1

Santiago de la Fuente Fernndez 61


Muestreo aleatorio simple
n n
ln L (X , ) = x i Ln Ln (x i ! ) n
i =1 i =1
n
n
xi
ln L (X , ) 1 i =1
= xi n = 0 = = x
i =1 n

Lo que nos dice que el Estimador de Mxima Verosimilitud (EMV) del parmetro
vendra dado por la media muestral: EMV () = x

b) Analizar las propiedades

Insesgadez

El estimador sera insesgado (centrado) si E (


) =
n
xi 1 n 1 n
1
E (
) = E i=1 =
n n
E ( x i) =
n
E (x i ) = n
(n ) =
i=1 i=1

Eficiencia

Para que un estimador sea eficiente tiene que ser centrado y de varianza mnima.
La varianza mnima se analiza en virtud de la acotacin de Cramer-Rao:
1
V (
) 2
acotacin de Cramer - Rao
ln f(x , )
n E

x
Ahora bien, f (x , ) = e
x!
x
ln f (x , ) = ln e = x ln ln (x !)
x !
ln f (x , ) x x
= 1 =

2 2
ln f (x , ) x 1 1 1 1
E = E = 2
E (x ) 2 = 2
E (x x) 2 = 2
V (x) = 2
=

1
En consecuencia, V (
) =
1 n
n

El resultado nos dice que el menor valor de la varianza del estimador sera n .

= x (calculado por el EMV). Sabemos V (x) = , lo que muestra que el estimador


n
empleado es eficiente.

Santiago de la Fuente Fernndez 62


Muestreo aleatorio simple
n
xi n
1 1
2
V (x) = V ( i=1 )= V (x i ) = 2
(n ) =
n n i=1 n n

Consistencia

Un estimador consistente es un estimador asintticamente insesgado cuya varianza


tiende a cero al aumentar el tamao muestral.
lim E (
) =
n
El estimador es consistente cuando
lim V (
) = 0
n

lim E (
) = lim =
n n

lim V (
) = lim =0
n n n

El estimador es consistente

Santiago de la Fuente Fernndez 63


Muestreo aleatorio simple
18.- En una gran piscifactora hay una proporcin desconocida de peces de una especie
A. Para obtener informacin sobre esta proporcin, vamos a ir sacando peces al azar.

a) Si la proporcin de peces de la especie A es p., cul es la probabilidad de que el


primer pez de la especie A sea el dcimo que extraemos?.
b) Tres personas realizan, independientemente unas de otras, el proceso de sacar
peces al azar hasta encontrarse con el primero de tipo A:
- La primera persona obtiene el primer pez tipo A en la dcima extraccin.
- La segunda persona obtiene el primer pez tipo A en la decimoquinta extraccin.
- La tercera persona obtiene el primer pez tipo A en la decimoctava extraccin.

Escribir la funcin de verosimilitud y obtener la estimacin de mxima verosimilitud de


la proporcin p.

Solucin.-

El objetivo fundamental del ejercicio es estimar, por mxima verosimilitud, el


parmetro p = "proporcin de peces de la especie A".

a) P(primer pez tipo A en la dcima extraccin) = (1 p) 9 p

b) La funcin de verosimilitud L(p) = P(Resultados muestrales obtenidos)

L(p) = P(primer pez tipo A en la dcima extraccin y primer pez tipo A en la


decimoquinta extraccin y primer pez tipo A en la decimoctava extraccin)

(
L(p) = (1 p) 9 p ) ( (1 p) 14 p ) ( (1 p) 17 p ) = (1 p) 40 p 3
(
log [ L(p)] = log (1 p) 40 p 3 ) = log (1 p) 40
+ log p 3 = 40 log (1 p) + 3 log p

log [ L(p)] 40 3 3
= + =0 a p =
dp 1p p 43

Santiago de la Fuente Fernndez 64


Muestreo aleatorio simple
19.- Las personas de un pas se clasifican segn dos caractersticas: color de los ojos
(claros u oscuros) y sexo (hombre o mujer). Las dos caractersticas son independientes.

a) Obtenemos una muestra al azar de la poblacin con los siguientes resultados:


- 200 mujeres con ojos claros
- 150 hombres con ojos claros
- 350 mujeres con ojos oscuros
- 300 hombres con ojos oscuros

Obtener la estimacin de mxima verosimilitud de p = P(hombres) y q = P(ojos


oscuros)

b) Si tomamos 8 personas al azar de ese pas, cul es la probabilidad de encontrar


alguna mujer de ojos oscuros?. Y si la muestra que tomamos es de 200 personas,
cul es la probabilidad de que haya ms de 60 mujeres de ojos oscuros?

Solucin.-

a) Las probabilidades de los cuatro posibles resultados muestrales son:

- P(mujer con ojos claros) = (1 p) q


- P(hombre con ojos claros) = p q
- P(mujer con ojos oscuros) = (1 p) (1 q)
- P(hombre con ojos oscuros) = p (1 q)

La funcin de verosimilitud L(p, q) = P(resultados muestrales obtenidos)

L(p, q) = ( (1 p) q ) 200 ( p q ) 150 ( (1 p) (1 q) ) 350 ( (p (1 q) ) 300 = p 450 (1 p) 550 q 350 (1 q) 650

( )
log L(p, q) = log p 450 (1 p) 550 q 350 (1 q) 650 = 450 log p + 550 log (1 p) + 350 log q + 650 log (1 q)

log L(p, q) 450 550


= =0 a p = 0,45
p p 1p
log L(p, q) 350 650
= =0 a q = 0,35
q q 1 q

b) Conocemos que P(mujer con ojos oscuros) = (1 p) (1 q) = 0,24

La variable aleatoria X = "nmero de mujeres con ojos oscuros, entre 8" sigue una
distribucin binomial B (n = 8 ; p = 0,24)

8
P(X 1) = 1 P(X = 0) = 1 (0,24) 0 (0,76) 8 = 0,89
0

Santiago de la Fuente Fernndez 65


Muestreo aleatorio simple
La variable Y = "nmero de mujeres con ojos oscuros, entre 200" sigue una
distribucin binomial B (n = 20 ; p = 0,24) , que por ser el tamao de la muestra grande
(n = 200) y p no prximo a cero (p = 0,24) aproximamos por la distribucin normal

B (n = 20 ; p = 0,24) N ( = n p = 48 ; = np q = 200 (0,24) (0,76) = 6,04)

Y 48 60 48
P(Y > 60) = P > = P(z > 1,99) = 0,0233
6,04 6,04

Santiago de la Fuente Fernndez 66


Muestreo aleatorio simple
20.- Calcular el estimador mximo verosmil del parmetro 'a' de las siguientes
funciones:
a) f(x; a) = a 2 e ax siendo x 0 en muestras aleatorias simples de tamao n.
b) f(x; a) = a e ax para x 0 , a > 0 en muestras aleatorias simples de tamao 2.

Solucin.-

a) f(x; a) = a 2 e ax donde x 0 en m.a.s. de tamao n

La funcin de verosimilitud
n
a xi
L = L (x 1, x 2 , L , x n ; a) = (a 2 e a x1 ) . (a 2 e a x2 ) L (a 2 e a xn ) = a 2 n e i=1

n
a xi n
aplicando logaritmos neperianos: log L = log (a 2 n e i=1
) = 2 n log a a x i
i=1
derivando respecto de 'a' e igualando a cero:

d (log L) 2 n n 2n 2 2
= x i = 0 a = = a =
da a i=1 n x x
xi
i=1

b) Sea f(x; a) = a e ax para x 0 , a > 0 en m.a.s. de tamao 2

La funcin de verosimilitud L = L (x 1, x 2 ; a) = (a e a x1 ) . (a e a x2 ) = a 2 e a (x1 + x2 )

aplicando logaritmos neperianos: log L = log (a 2 e a (x1 + x2 )) = 2 log a a (x1 + x2 )

derivando respecto de 'a' e igualando a cero:

d (log L) 2 2 1
= (x1 + x2 ) = 0 a = =
da a x1 + x2 x

Santiago de la Fuente Fernndez 67


Muestreo aleatorio simple
21.- Sea la distribucin N ( ; ) , con media conocida y varianza desconocida.
Calcular la estimacin mximo-verosiml de la varianza en muestras aleatorias simples
de tamao n.

Solucin.-

La funcin de verosimilitud es:

(x1 ) 2 (x 2 ) 2 (x n ) 2

1 2 2 1 2 2 1 2 2
L (X; , 2 ) = e e L e =
2 2 2 2 2 2

n
2
(xi )
i=1
1 2 2
= e
n n
2 2 2
(2 ) ( )

tomando logaritmos neperianos, se tiene:

n
(xi )
2
n
(xi )2
i=1
[ ]

1 2 n n
log L (X; , 2 ) = log n n
e 2 2
= log (2 ) log ( ) i =1
2 2 2 2
2 2 2
(2 ) ( )

y derivando respecto a 2 e igualando a cero:

n
[ ]=
2
2 (xi )
d log L (X; , ) n
+ i=1 =0
2 2
d 2 24
n
2
(xi )
como 2 > 0 , el estimador mximo verosmil de 2 ser: 2 = i =1

n

Conviene observar que el estimador no es la varianza muestral, dado que las


desviaciones de los valores muestrales lo son con respecto a la media poblacional y no
respecto a la media muestral x .

Santiago de la Fuente Fernndez 68


Muestreo aleatorio simple
22.- Sea la distribucin N ( ; ) , con la media y varianza desconocidas. Calcular los
estimadores mximo-verosmiles de y 2 .

Solucin.-

La funcin de verosimilitud es:

(x1 ) 2 (x 2 ) 2 (x n ) 2

1 2 2 1 2 2 1 2 2
L (X; , 2 ) = e e L e =
2 2 2 2 2 2

n
2
(xi )
i =1
1 2 2
= e
n n
2 2 2
(2 ) ( )

tomando logaritmos neperianos, se tiene:

n
(xi )
2
n
(xi )2
i=1
[ ]

1 2 n n
log L (X; , 2 ) = log n n
e 2 2
= log (2 ) log ( ) i =1
2 2 2 2
2 2 2
(2 ) ( )

y derivando respecto a y 2 , e igualando a cero:

n
[
log L (X; , )
= i=1
2
] (xi )
=0
2

n
[ ]=
2
(xi )
log L (X; , 2 ) n
+ i=1 =0
2 2
2 24

n
2
(xi x)
resolviendo el sistema resulta: =x y
2 = i =1
= 2x
n

Los estimadores mximo-verosmiles de y 2 son la media y la varianza muestrales.

Santiago de la Fuente Fernndez 69


Muestreo aleatorio simple
CLCULO DE ESTIMADOR POR EL MTODO DE LOS MOMENTOS

23.- Sea una poblacin definida por:

1
P ( = 1) =
2
+ 0< <1
P ( = 0) =
2 0< <1
1
P ( = 1) =
2

Estimar los parmetros y por el mtodo de los momentos, estudiando si son


insesgados.

Solucin.-

MTODO DE LOS MOMENTOS.- El procedimiento consiste en igualar momentos


poblacionales respecto al origen ( r ) a los correspondientes momentos muestrales
respecto al origen (a r ) , formando as tantas ecuaciones como parmetros
poblacionales se pretenden estimar:
n
xi
= E (X) = = a = i=1 = x
1 1 1
n
n

x i2
2 = E (X 2 )
2 = a 2 = i=1
n
L LL L L L L L LL L L L L L

n
x ri
= E (X r ) r = a r = i=1
r n

Puesto que hay que estimar dos parmetros hay que calcular los dos primeros
momentos.
644444444444444444momentos 444447 poblaciona les
4444444444444444444444 8
1 + 1
1 = = E() = x i P( = x i ) = (1) + (0) + (1) =
i 2 2 2 2
1 + 1 2
2 = E( 2 ) = x i2 P( = x i ) = (1) 2 + (0) 2 + (1) 2 =
i 2 2 2 2

6444momentos
44447muestrales
44444448
xi x i2
a1 = x = i a2 = i
n n

Santiago de la Fuente Fernndez 70


Muestreo aleatorio simple

1 = a1 = x = 2x
2 = 2x = 1 a2 x

2 = 2a2 2 = 1 a 2 + x
2 = a2 = a2 = 2a2 2
2

Insesgadez

Un estimador es insesgado (o centrado) cuando se verifica E () =

2
E (
) = E ( 1 a 2 + x) = 1 E (a 2 ) + E (x) = 1 2 + = 1 + =
2 2
2
E (
) = E ( 1 a 2 x) = 1 E (a 2 ) E (x) = 1 2 = 1 =
2 2

Los estimadores y son insesgados.

Santiago de la Fuente Fernndez 71


Muestreo aleatorio simple
CLCULO DE ESTADSTICOS. FUNCIN DE DENSIDAD

24.- Una muestra aleatoria (X1 , L , Xn ) de la poblacin tiene como funcin de


1
densidad f (x) = x si x ( 0, 1 )
>0
0 en el resto
a) Hallar un estadstico suficiente
b) Estimador de mxima verosimilitud de
c) Estimador de por el mtodo de los momentos

Solucin.-

a)

Un estimador es suficiente cuando no da lugar a una prdida de informacin. Es


decir, cuando la informacin basada en es tan buena como la que hiciera uso de toda
la muestra.
Para identificar estadsticos suficientes se utiliza el teorema de factorizacin, que
dice que dada una muestra aleatoria (x 1 , L , x n ) de una poblacin X con funcin de
masa P (o funcin de densidad f ) un estadstico es suficiente para si y slo s:


1 n [1 n ]
P (x , L , x ) = g (x , L , x ) , . h (x , L , x )
1 n caso discreto

1 n [ 1 n ]
f (x , L , x ) = g (x , L , x ) , . h (x , L , x )
1 n caso continuo

Para encontrar un estadstico suficiente hay que factorizar la funcin de


verosimilitud de la forma: L () = g ( , ) . h (x 1 , L , x n)

1 1 1 ) = n (x L x ) 1
L () = f (x 1) f (x 2) L f (x n) = ( x ) ( x ) L ( x n 1 n
1 2

Por tanto, = x 1 , L , x n es un estadstico suficiente.

b) L () = n (x 1 L x n ) 1
n n
1 1
ln L () = ln n (x 1 L x n ) 1 = ln n + ln x = ln n + ln ( x i )
i
i=1 i =1

n ln L () n n n
ln L () = n ln + ( 1) ln (x i) = + x i = 0 a =
i=1 i=1 n
ln (x i)
i=1

c) Se plantea la ecuacin E (X) = x

Santiago de la Fuente Fernndez 72


Muestreo aleatorio simple
1
1 1 1 x + 1
x = E (X) = 0 x f (x) dx = 0 x x 1 dx = 0 x dx = =
+ 1 0 +1

x
x ( + 1) = =
1 x

Santiago de la Fuente Fernndez 73


Muestreo aleatorio simple
25.- Una muestra aleatoria (X 1 , L , X n ) de la poblacin tiene como funcin de
x+
densidad f (x) = e si x > 0
0 en el resto

a) Hallar un estimador por el mtodo de los momentos de


b) Estudiar si el estimador encontrado en el apartado anterior es insesgado para
estimar el parmetro

Solucin.-

a) Se plantea la ecuacin: E [X] = x

int egracin por partes


64447444
8
x = E [X] =

x f (x) dx = x e x + dx =+1
= x 1

b) Un estimador es insesgado o centrado cuando su valor probable coincide con el


valor
del parmetro a estimar. Es decir, E () =

E (
) = E ( x 1 ) = E ( x ) 1 = ( + 1 ) 1 =


x+ x+ x+ x+
x { e
14243 dx = x 1e4243)
{ ( 1e4243 dx
{ = xe e x+ =
u dv u du
v v
int egracin 1 + x
= (1 + x) e x + = e
por partes ex

x e x + dx = e 1 + x = 1 +
x
e

Santiago de la Fuente Fernndez 74


Muestreo aleatorio simple

26.- Una muestra aleatoria (X 1 , L , X n ) de la poblacin tiene como funcin de


2 x
densidad f (x) = x e si x > 0
0 en el resto
Hallar el estimador de mxima verosimilitud de

Solucin.-

La funcin de verosimilitud L () :
x1 x 2 x n
L () = f (x 1) f (x 2) L f (x n) = ( 2 x 1 e ) ( 2 x 2 e ) L ( 2 x n e )
n
xi
(x 1 + x 2 + L + x n )
= 2 n (x 1 L x n) e = 2 n (x 1 L x n) e i =1

n n
xi xi
L () = 2 n (x 1 L x n) e i = 1 ln L () = ln 2 n (x 1 L x n) e i = 1



n n n n
ln L () = (2 n) ln + ln x i x i ln L () = (2 n) ln + ln x i x i
i=1 i=1 i=1 i=1

ln L () 2n n 2n
= xi = 0 =
i=1 n
xi
i=1

Santiago de la Fuente Fernndez 75


Muestreo aleatorio simple

27.- El coseno X del ngulo con el que se emiten los electrones en un proceso
radioactivo es una variable aleatoria con funcin de densidad

( 1 + x ) 2 1 x 1
f (x) = 1 1
0 en el resto

Consideremos una muestra aleatoria (X 1 , L , X n ) de esta variable aleatoria


a) Obtener el estimador por el mtodo de los momentos
b) Calcular la varianza de este estimador y demostrar que es consistente

Solucin.-

a) Se plantea la ecuacin E [ X] = x

1
1+ x x 2 x3
x = E [X] =
1

1
x
2
dx =
2
+
6

1
=
3
= 3x

V (X) 9
b) V () = V (3 x) = 9 V (x) = 9 = V (X)
n n

2 1 2
1+ x x 3 x 4 3 2
V (X) = E (X ) [E (X)]
2 2 1 2
= 1
x
2
dx
3
= + =
6 8
1
3 9

9 9 3 2 3 2
de donde, V () = V (X) = =
n n 9 n
lim E (
) =
n
Para probar que es consistente para estimar es suficiente probar
lim V (
) = 0
n

lim E (
) = lim E (3 x) = lim 3 E (x) = 3 E (X) = 3 =
n n n 3

3 2
lim V (
) = lim V (3 x) = lim =0
n n n n

Por tanto, queda probado que es consistente para estimar

Santiago de la Fuente Fernndez 76

Potrebbero piacerti anche