Sei sulla pagina 1di 4

lOMoARcPSD|365807

Examen Noviembre 2017, preguntas y respuestas

Estadistica (Universidad de Valladolid)

StuDocu no está patrocinado ni avalado por ningún colegio o universidad.


Descargado por Dani Fadrique (fadriquebasket6@hotmail.com)
lOMoARcPSD|365807

Estadística II: 1º parte Prueba de evaluación. 10 de noviembre de 2017

Nombre y apellidos :………………………………………………………………Grado :……………

1.- (2 puntos) Razona si son verdaderas o falsas las siguientes afirmaciones:

a) Sea (X1, X2) una m.a.s. de una variable Binomial B(3,p). Los posibles valores de la media muestral son:
{ 0, 0.5, 1, 1.5, 2 }
Falsa. Cada una de las variables (X1, X2) de la muestra es B(3,p) y puede tomar los valores {0,1,2,3}. Por
𝑋1+𝑋2
tanto, la media muestral de esas dos variables, , puede tomar, los valores dados pero también
2
los valores 2.5 y 3

b) La proporción de caras que obtengo al tirar 1000 veces una moneda perfecta es una variable aleatoria
cuya media es 500
Falsa. Asociemos a cada lanzamiento de la moneda perfecta una v.a. Bernoulli b(0.5) tal que
1 𝑠𝑖 𝑠𝑎𝑙𝑒 𝑐𝑎𝑟𝑎 𝑐𝑜𝑛 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑝 = 0.5
X=�
0 𝑠𝑖 𝑠𝑎𝑙𝑒 𝑐𝑟𝑢𝑧 𝑐𝑜𝑛 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑞 = 0.5
La proporción de caras en 1000 lanzamientos de esta moneda es la Media Muestral (no por la suma)
de 1000 v.a.i.i.d. (m.a.s.) con la misma distribución que X. Por tanto,
𝐸(𝑋�) = 𝐸(𝑋) = 𝐸�𝑏(0.5)� = 0.5

c) Sea (X1, …, X10) una muestra aleatoria simple de una variable aleatoria X con distribución N(0,1).
(
Entonces, p X > 0,2 < p X > 0,2 ) ( )
(
Verdadera. X → N 0,1/ 10 y por tanto: )
( )
p ( X > 0,2 ) = 1 - φ 0.2 10 = 1 - φ (0.63) = 1 - 0.7357 = 0.2643
<
p ( X > 0,2 ) =
1 − φ( 0.2 ) =
1 − 0.5793 =
0.4207

d) El intervalo de confianza al 95% para estimar la diferencia, en media, entre el gasto de una familia en
viajes (X1) y en alimentación (X2), utilizando una muestra de 5000 familias, es el siguiente:
 SC21 SC22 
( X

1 − X ) ± 1.96
2
5000
+ 5000 

 

Falsa. Se trata de muestra pareada y el intervalo que se presenta es para muestras independientes

2.- (2,5 puntos) Sea (X1, …, Xn) una muestra aleatoria simple de una variable aleatoria X que se distribuye
como una Binomial Negativa BN(3, p):
a) Obtén el estimador máximo verosímil de p.
n

 x + 2  x + 2  x + 2  x + 2 ∑ xi
L ( x1,, xn ; p =
) L( p=)  1x ( 1 − p )x1 p 3 ×  ×  nx ( 1 − p )xn p =3  1x    nx ( 1 − p )i =1 p 3n
 1   n   1   n 
 x + 2   xn + 2  n
=ln L( p ) ln(  1   ) + ∑ xi ln( 1 − p ) + 3n ln( p )
 x1   xn  i =1
n
− ∑ xi
∂ 3n 3
ln L( p ) = i =1 + = 0 ⇒  ⇒ pˆ =
∂p 1− p p 3+X

Descargado por Dani Fadrique (fadriquebasket6@hotmail.com)


lOMoARcPSD|365807

Estadística II: 1º parte Prueba de evaluación. 10 de noviembre de 2017

Nombre y apellidos :………………………………………………………………Grado :……………

b) Demuestra que el estimador obtenido en a) es consistente y explica el significado de esta propiedad.


Consistente significa que, a partir de cierto tamaño muestral, n, suficientemente grande, es muy
probable que el estimador difiera muy poco del parámetro.
3 3 3
=
p lim pˆ p=
lim =
n →∞ n →∞ 3 + X 3 + p lim X 3 + E( X )
n →∞

3( 1 − p ) 3
La esperanza de una BN(3,p) es E( X ) = =
, con lo que p lim pˆ = p
p n →∞ 3( 1 − p )
3+
p

3.- (2 puntos) Sea X una variable aleatoria que toma los valores 2,3 y 4 con probabilidades p(X=2)=θ,
p(X=3)=3θ, p(X=4)=1-4θ, respectivamente, donde θ es un parámetro desconocido, con 0<θ<1/4.

a) Se selecciona una muestra aleatoria simple de tamaño 3 de dicha variable obteniéndose los siguientes
valores: (2, 3, 3). Calcula la función de verosimilitud para dicha muestra.

2 θ
3 ) θ ⋅ ( 3θ ) =
2
La variable es X : 3 3θ , con lo que L( θ ) =
p( X =⋅
2 ) p( X =⋅
3 ) p( X == 9θ 3
4 1 − 4θ

b) Obtén el estimador de θ por el método de momentos y demuestra que dicho estimador es insesgado.
Justifica tu respuesta definiendo claramente qué es un estimador insesgado.
4−X
La esperanza de X es E( X ) = 2 ⋅ θ + 3 ⋅ 3θ + 4 (⋅ 1 − 4θ ) = 4 − 5θ , de donde 4 − 5θˆ = X ⇒ θˆ =
5
Un estimador es insesgado si su valor esperado coincide con el parámetro que se quiere estimar, es
decir, si su distribución de probabilidad (o su densidad, en caso continuo) está centrada en dicho
parámetro.
4 − E( X ) 4 − E( X ) 4 −( 4 − 5θ )
=
Insesgado: E( θˆ ) = = =) θ .
5 5 5

4.- (3,5 puntos) Se ha seleccionado una muestra aleatoria simple de 10 hogares y se ha medido, en cada
hogar, el consumo mensual de gas natural en calefacción (en €), obteniéndose los siguientes resultados:
103, 156, 118, 89, 125, 147, 122, 109, 138, 99
a) A partir de estos datos, estima la proporción de hogares cuyo consumo mensual de gas en calefacción
supera los 110€, utilizando un estimador insesgado. Especifica claramente el modelo probabilístico
subyacente a este problema y justifica la elección del estimador utilizado.
Definimos una variable que sea 1 si el consumo es mayor que 110 y cero sino. Es decir, una Bernoulli, b(p).

p̂ = X es el estimador adecuado. La nueva muestra resulta (0,1,1,0,1,1,1,0,1,0) con lo que la


estimación de la proporción de hogares con consumo mayor que el señalado es de 0.6.
b) Después de incluir en la muestra 5 hogares más seleccionados aleatoriamente, se ha obtenido la
siguiente información sobre la muestra ampliada:

Consumo mensual en gas por hogar (en €)


Media 121,067
Cuasi-desviación típica 17,754
Cuasi- varianza 315,210
Suma 1816
Tamaño de la muestra 15

Descargado por Dani Fadrique (fadriquebasket6@hotmail.com)


lOMoARcPSD|365807

Estadística II: 1º parte Prueba de evaluación. 10 de noviembre de 2017

Nombre y apellidos :………………………………………………………………Grado :……………

Asumiendo que el consumo mensual de gas en calefacción sigue una distribución Normal, responde a las
siguientes preguntas, explicando detalladamente los pasos seguidos para obtener los intervalos pedidos:

b.1) Obtén un intervalo de confianza al 90% para la varianza del consumo mensual de gas e interpreta el
resultado.
n −1 2  14 
El pivote a usar es el 1d: Sc → χn2−1 =
χ142 y el intervalo resulta de p a ≤ 2 Sc2 ≤ b  =
0.90
σ 2
 σ 
Obtenemos a y b: a=6.57 y b=23.7, resultando el intervalo aleatorio de confianza:
 14 2 14 2 
p Sc ≤ σ 2 ≤ = Sc  p 0.591Sc2 ≤ σ 2 ≤ 2.131
= Sc2  0.90 y sustituyendo los valores
 23.7 6.57 
 14 14 
proporcionados el intervalo de confianza resulta:  315.21 , 315, 21 = [186.3, 671.68]
 23.7 6.57 
Si se obtuvieran muchas muestras de tamaño 15 de esa población, el 90% de los intervalos
construidos de la forma 0.591Sc2 ≤ σ 2 ≤ 2.131Sc2  contendrían a la verdadera varianza poblacional,
por eso depositamos una confianza del 90% de que el intervalo que hemos obtenido contenga a σ2.

b.2) Obtén un intervalo de confianza al 95% para la media del consumo mensual de gas.
X −µ
El pivote a usar es el 1c: → t n −1 =
t 14 y el intervalo resulta de
Sc / n
 X −µ 
p  −t 0.025 ≤ ≤ t 0.025  =0.95 , obteniendo t 0.025 = 2.145 , con lo que el intervalo aleatorio de
 Sc / n 
 S S 
confianza resulta  X − 2.145 c , X + 2.145 c 
 15 15 
y sustituyendo los valores proporcionados el intervalo de confianza resulta:
 17.754 
121.067 ± 2.145 = [111.234, 130.899]
 15 

b.3) Si utilizáramos un nivel de confianza del 99%, ¿cambiaría tu respuesta al apartado b.2)? ¿Cómo
cambiaría? ¿Por qué? Responde a esta pregunta sin realizar ningún cálculo adicional.
Si, la respuesta cambiaría, ya que el margen de error, que es el que determina la amplitud del
intervalo, depende del nivel de confianza. Concretamente, en el problema del apartado b.2), el
intervalo de confianza es de la forma:
 Sc 
 X ± t α /2 
 15 
Por tanto, si el nivel de confianza (1-α) aumenta (pasa del 95% al 99%), el correspondiente valor tα/2
también aumenta, y por ello, como los otros datos son los mismos, aumenta la amplitud del
intervalo.

Descargado por Dani Fadrique (fadriquebasket6@hotmail.com)

Potrebbero piacerti anche