Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Gibergans Báguena / DMA3 – EUETIB / UPC Tema 6: Muestreo aleatorio y estimación puntual
TEMA 6
MUESTREO ALEATORIO Y
ESTIMACIÓN PUNTUAL
6.1. Introducción
6.2. Conceptos de muestra aleatoria, estadístico y estimador
6.3. Método de los momentos
6.4. Método de máxima verosimilitud
6.5. Propiedades de los estimadores
6.6. Distribución de la media muestral. Teorema del Límite Central.
6.1. INTRODUCCIÓN
Inferencia clásica: trata los parámetros poblacionales desconocidos como valores fijos o
constantes.
Inferencia bayesiana: considera que los parámetros desconocidos del modelo son variables
aleatorias, para las cuales debe fijarse una distribución inicial, denominada distribución a
priori. Utilizando información muestral junto con esta distribución a priori, los métodos
bayesianos hacen uso de la regla de Bayes para ofrecer una distribución a posteriori sobre los
parámetros.
VI - 1
MEE – Electricidad – 2009-10-P J. Gibergans Báguena / DMA3 – EUETIB / UPC
6.2.1. Muestreo
Una muestra aleatoria simple, de tamaño n , de una variable aleatoria X , con distribución teórica
f ( x) , son n variables aleatorias X 1 , X 2 ,..., X n , independientes e idénticamente distribuidas, con
distribución común f ( x) .
Una realización de la muestra son los valores particulares x1 , x2 ,..., xn , observados para las variables
X 1 , X 2 ,..., X n . Como consecuencia de todo ello, la función de probabilidad conjunta de X 1 , X 2 ,..., X n
es:
f ( x1 , x2 ,..., xn ) f ( x1 ) f ( x2 )... f ( xn )
1 n
Por ejemplo, el estadístico T ( X 1 , X 2 ,..., X n ) X i , se llama media muestral y que suele
n i 1
designarse por X . Más adelante, estudiaremos con detalle la distribución en el muestreo de X .
VI - 2
J. Gibergans Báguena / DMA3 – EUETIB / UPC Tema 6: Muestreo aleatorio y estimación puntual
Supongamos ahora que pretendemos obtener información acerca del valor desconocido del parámetro
que caracteriza la distribución teórica de cierta población. Y disponemos de una muestra.
Proporcionar un intervalo numérico en cual pueda afirmarse con cierta confianza que se
encuentra el valor de que caracteriza la distribución de la población. Este método de
estimación será estudiado en el próximo tema.
Proporcionar una estimación puntual del parámetro, es decir, seleccionar un valor que
constituya un pronóstico individual sobre el parámetro. La forma de proceder para obtener
una estimación puntual del valor desconocido del parámetro consiste en seleccionar un
estadístico ˆ T ( X 1 , X 2 ,..., X n ) , función únicamente de las observaciones muestrales y,
tomar como estimación el valor de T calculado a partir de la muestra obtenida.
Los estadísticos utilizados para estimar los parámetros de una distribución de probabilidad se
denominan estimadores.
A continuación estudiamos los dos métodos de estimación puntual más importantes: método de los
momentos y el método de máxima verosimilitud.
2) Se igualan tantos momentos como parámetros desconocidos hay que estimar, y se resuelve el
sistema de ecuaciones resultante.
1 1 n
E X x e x dx ... y x xi
0
n i 1
1 1
De manera que: x
x
VI - 3
MEE – Electricidad – 2009-10-P J. Gibergans Báguena / DMA3 – EUETIB / UPC
n
L f ( xi )
i 1
Debido a que muchas funciones de densidad de probabilidad son exponenciales, algunas veces es
conveniente trabajar con la función logaritmo de la verosimilitud:
n
ln L ln f ( xi )
i 1
n n n n
ln L ln f ( xi ) ln e xi ln xi n ln xi
i 1 i 1 i 1 i 1
d (ln L)
El máximo valor de ln L ocurre cuando 0 , es decir, cuando:
d
d (ln L) n n 1 1 n 1
xi 0 x
d i 1 n i 1 i x
Observación: En el caso de la distribución exponencial, las estimaciones por los dos métodos
coinciden, pero, en general, no tiene porqué ocurrir.
VI - 4
J. Gibergans Báguena / DMA3 – EUETIB / UPC Tema 6: Muestreo aleatorio y estimación puntual
2
Var (ˆ) E ˆ
2 E X 1 2 E X 2 E X 3 2 2
E ˆ1
3 3
4Var X 1 4Var X 2 Var X 3
ECM ˆ1 Var ( ˆ11 ) 2
9
Análogamente obtenemos:
4 6
2 2
2
ECM ˆ 2 Var ( ˆ 2 ) y ECM ˆ 3 Var ( ˆ 3 )
3 9 3
El error cuadrático medio de ̂3 es el menor de los errores cuadráticos de los tres estimadores
cualquiera que sea el valor de y de 2 . Por lo tanto, el mejor estimador es ̂3 , pero no podemos
comparar los estimadores ̂1 y ̂2 porque no conocemos los valores de y de 2 .
VI - 5
MEE – Electricidad – 2009-10-P J. Gibergans Báguena / DMA3 – EUETIB / UPC
lim E ˆn ,
n
Ejemplo: Sea X 1 , X 2 ,..., X n una muestra aleatoria simple de una variable aleatoria X con E X .
3 X 1 X 2 .. X n
El estimador: ˆ n es asintóticamente insesgado para :
n
n2
lim E ˆ n lim
n n n
Un estimador ˆn se dice consistente en media cuadrática para estimar un parámetro si:
De acuerdo con la definición de error cuadrático medio, una condición necesaria y suficiente para que
ˆn sea consistente es que sea asintóticamente insesgado y que lim Var ˆn 0 .
n
Ejemplo: Hemos visto que ˆ X es un estimador insesgado para el parámetro . Además hemos
visto que Var ( ˆ ) Var ( X ) n , por tanto, es fácil ver que se trata de un estimador consistente en
2
media cuadrática.
Se dice que el estimador ˆ1 es más eficiente que el estimador ˆ2 si:
Var (ˆ ) Var (ˆ )
1 2
VI - 6
J. Gibergans Báguena / DMA3 – EUETIB / UPC Tema 6: Muestreo aleatorio y estimación puntual
Sea X 1 , X 2 ,..., X n una muestra aleatoria simple de una variable aleatoria X con E X y
Var ( X ) 2 . Tal y como se ha visto en los anteriores ejemplos, un estimador razonable del
parámetro es la media muestral:
X X 2 ... X n
X 1
n
Propiedades:
1 n 1 n 1 n 1
E X E X i E X i n
n i 1 n i 1 n i 1 n
1 n 1 n n 2
Var ( X ) Var X i 2 Var ( X i ) 2 Var ( X i )
n i 1 n i 1 n n
Sea X 1 , X 2 ,..., X n una muestra aleatoria simple de una variable aleatoria X normal con media con
y varianza 2 conocida. Entonces a partir de las propiedades de la normal y de lo dicho
anteriormente, la media muestral X sigue una distribución normal con media y varianza n . Por
tanto, la variable tipificada:
X
Z sigue una distribución normal estándar N(0,1).
/ n
Ejemplo: Consideremos las alturas de un grupo de estudiantes. Sabemos que se trata de una variable
aleatoria normal con media de 172 cm y desviación típica 11 cm. Hemos tomado una muestra de 15
estudiantes tomados al azar.
X 170 172
P ( X 170) P P ( Z 0,70) P ( Z 0,70) 0, 2420
/ n 11/ 15
P (| X | 1) P (1 X 1) P
1 0
X 0 1 0
/ n / n / n
P
1 0
X 0
1 0
P( 0,35 Z 0,35)
11/ 15 11/ 15 11/ 15
2 P ( Z 0,35) 2 · 0,3632 0,7264
Observemos que no ha participado para nada la media poblacional de 172 cm, por lo que en caso de
ser desconocida ya tendríamos información sobre ella.
VI - 7
MEE – Electricidad – 2009-10-P J. Gibergans Báguena / DMA3 – EUETIB / UPC
Sea X 1 , X 2 ,..., X n una muestra aleatoria simple de una variable aleatoria X normal con media con
y varianza 2 desconocida. Entonces, habrá que estimar la varianza a partir de la muestra calculando
la varianza muestral corregida:
1 n
S n21
n 1 i 1
( X i X )2
no sigue una distribución normal sino que sigue una distribución t de Student con n-1 grados de
libertad.
La distribución t de Student con n grados de libertad que denotaremos por tn es muy parecida a la
distribución normal estándar: es simétrica alrededor del cero, pero su desviación típica es un poco
mayor que la de la normal estándar, es decir, los valores que toma esta variable están más dispersos.
No obstante, a medida que aumenta el número de grados de libertad más se parece a la normal
estándar tal y como se muestra en la figura 6.1.
Esta distribución de debe a W.S. Gosset al final del siglo XIX. Gosset trabajaba en la empresa
cervecera Guinness y utilizaba el seudónimo Student para firmar sus trabajos de investigación.
Ejemplo: Veamos de nuevo el ejemplo anterior, pero ahora en el caso en que no conocemos la
varianza poblacional.
Consideremos las alturas de un grupo de estudiantes. Sabemos que se trata de una variable aleatoria
normal con media de 172 cm y desviación típica poblacional desconocida. Hemos tomado una
VI - 8
J. Gibergans Báguena / DMA3 – EUETIB / UPC Tema 6: Muestreo aleatorio y estimación puntual
muestra de 15 estudiantes tomados al azar de la que hemos hallado su desviación típica corregida
obteniendo un resultado de 11,187 cm.
X 170 172
P ( X 170) P P (t14 0,6924) P(t14 0,6924) 0, 25
S / n 11,187 15
n 1
P (| X | 0,746) P(1 X 1) P
1 0
X 0
1 0
S n 1 / n S n 1 / n Sn 1 / n
P
1 0
X 0
1 0
P (0,3462 t14 0,3462)
11,187 / 15 11,187 / 15 11,187 / 15
2 P (t14 0,3462) 0,734
De nuevo, observemos que no ha participado para nada la media poblacional de 172 cm, por lo que en
caso de ser desconocida ya tendríamos información sobre ella.
Antes de pasar al siguiente apartado, queda por justificar porqué en la fórmula de la varianza
muestral corregida se ha dividido por n-1 en lugar de dividir por n tal y como hacíamos con la
varianza en el tema dedicado a la estadística descriptiva.
Observemos que:
1 n
Xi X 1 n
( X i E[ X ] ( E[ X ] X )
2 2
S n2
n i 1 n i 1
1 n
( X i E[ X ]2 ( E[ X ] X )2 2( X i E[ X ]( E[ X ] X )
n i 1
1 n
( X i E[ X ]) 2 n ( E[ X ] X ) 2
n i 1
1 n
E Sn2 E ( X i E[ X ]) 2 n ( E[ X ] X ) 2
n i 1
1 n
E ( X i E[ X ]) 2 n E ( E[ X ] X ) 2
n i 1
1 n 1 n 1 n 1 2
Var[ X ] n Var[ X ] n Var[ X ] Var[ X ] Var[ X ]
n i 1 n n n
Así pues, el valor esperado de S n2 es menor que 2 . Por esta razón se define la varianza muestral corregida
por:
VI - 9
MEE – Electricidad – 2009-10-P J. Gibergans Báguena / DMA3 – EUETIB / UPC
1 n n 2
S n21
n 1 i 1
( X i X )2
n 1
Sn
De manera que:
n
E S n21 E Sn2 Var ( X ) 2
n 1
Resumiendo, Sn2 tiende a subestimar la varianza de la población. Para corregir este defecto dividimos
por n-1 en lugar de por n, definiendo de esta forma la varianza muestral corregida que es un estimador
insesgado de la varianza.
Si X 1 , X 2 ,..., X n constituyen una muestra aleatoria de una población de media y varianza 2,
entonces sea cual sea la distribución de la variable aleatoria X, se tiene que la distribución de:
X
/ n
Ejemplo: Una empresa de mensajería que opera dentro de la ciudad tarda una media de 35 minutos en
llevar un paquete con una desviación típica de 8 minutos. Supongamos que durante el día de hoy de
han repartido 200 paquetes.
¿Cuál es la probabilidad que la media del tiempo de entrega esté entre 30 y 35 minutos?
Sea la variable X = ”tiempo de entrega del paquete”. No sabemos qué distribución sigue pero como
que el tamaño de la muestra es superior a 30, entonces, aplicando el teorema del límite central,
tenemos que:
X
N (0,1)
/ n
Por tanto,
30 35 X 35 35 35
P (30 X 35) P P (8,84 Z 0) 0,5
8 / 200 8 / 200 8 / 200
VI - 10