Sei sulla pagina 1di 17

Pontificia Universidad Catlica de Chile Facultad de Ciencias Econmicas y Administrativas

Ejemplo resueltos N2

EAS-201A Semestre II 2006

Mxima verosimilitud, Cota de Cramer Rao e Intervalos de Confianza Profesor: Vctor Correa S. Ejemplo 1 La empresa CDNEWS vende msica en formato CD por internet. Las ventas de esta empresa en una semana son presentadas en la tabla siguiente. En la primera fila se presenta el nmero de CDs comprados por un cliente y en la segunda fila se presenta la frecuencia de clientes que compr ese nmero de CDs.
Nmero de CDs por cliente 1 2 3 4 5 6 7 8 Frecuencia de clientes 852 387 214 120 72 40 12 15 9 9 10 7 1728

Se supone que la variable Y = nmero de CDs que compra un cliente, tiene una distribucin geomtrica de parmetro . Es decir, la probabilidad de que un cliente compre y CDs es: p( y, ) = (1 ) y 1 y = 1,2,3,....

a) Considera Y1 ,..., Y1728 una muestra aleatoria simple de clientes, encuentra el estimador de mxima verosimilitud de y su estimacin correspondiente. b) Encuentra la Cota de Cramer Rao de . c) Encuentra la distribucin asinttica del estimador de mxima verosimilitud, estima su error estndar y construye un intervalo al 90% de confianza para el parmetro. Solucin
a) Ln (L) = (Yi n)ln(1-) + nln() (Ln (L)) = ( Yi + n) /((1- )) = 0

Esimador mximo verosmil: ^MV = n/Yi = 1/Ybarra Yi = 3.703 Estimacin ^MV = 1728/ 3703 = 0,467 CCR() = - [E{(Ln (L))}] 1

b) Cota de Cramer Rao:

(Ln (L)) = ( 2Yi + 2n - n ) / (2( -1 )2) En la Geomtrica: E(Yi) = 1/ , reemplazando se tiene: E{(Ln (L))} = n( -1 ) / (2( -1 )2) = - n / (2(1- )) CCR() = - [E{(Ln (L))}] 1 = 2(1- )/n.

c) Por las propiedades asintoticas de los estimadores mximo verosmiles, la distribucin asinttica de ^MV es normal con media y varianza CCR() = 2(1- )/n En el caso anterior, es vlida la aproximacin anterior pues n = 1.728 >30 muy grande. Error estndar ee(^MV ) = Raiz( (0,467)2(1-0,467 )/1728 ) = 0,0082 As un intervalo de confianza al 90% para es: ^MV 1,64*ee(^MV) = 0,467 0,001= [ 0,466; 0,468].

Ejemplo 2 El Servicio de Impuestos Internos (SII) informa que recibi 2.036.775 declaraciones de la renta del ao tributario 2002. (El Mercurio 20/05/2003, pgina B1) Suponga que se seleccionan aleatoriamente 1.000 declaraciones, resultando que en 265 casos corresponde devolver impuestos al contribuyente. Con la informacin anterior se construy el siguiente intervalo de confianza simtrico para la proporcin de declaraciones en las 2.036.775 en que corresponde devolver impuestos, [0,2347; 0,2953] .

a) Se puede afirmar que el porcentaje de declaraciones en que corresponde devolver impuestos se encuentra entre 23,47% y 29,53%? Cmo se interpreta el intervalo anterior? b) Determine la estimacin obtenida de la muestra, su margen de error y la confianza del intervalo. c) El SII procesa las 2.036.775 declaraciones e informa que el 27,79% de los contribuyentes recibirn devolucin. Si se seleccionarn 200 muestras aleatorias de tamao 1.000 en cuntas de ellas podemos esperar que el intervalo calculado como en b) no contendr el % de devoluciones informado por el SII?.
Solucin
a) Lo que se puede afirmar es que el intervalo capturar al parmetro = proporcin de declaracin a las que se debe devolver parte de los impuestos tributados con una confianza dada 1 - . Es decir, el intervalo anterior fue construido con un mtodo que capturaba al parmetro con probabilidad 1 - . y por lo tanto confiamos que el intervalo calculado es uno de los (1 - )*100 en 100 que cubre le parmetro . b) ^ = p = 265/1000 = 0,265 (26,5%) Margen de error = (0,2953 0,2347)/2 = 0,0606/2 = 0,0303 Pero, por otro lado, el margen de error se deduce de la frmula, me1 0,265)/1000) = 0,0303 z1 - /2 = 2,16 1 - /2 = 0,9846, as, 1 - = 0,97 (97% de confianza) b) Dado que SII procesa el universo de la declaraciones, se tiene que = 0,279. As como el intervalo calculado como en b) tiene confianza 97%, si calculamos 200 intervalos, aproximadamente en (10,97)*200 = 6 casos (muestras ) el intervalo no capturara el parmetro .
- .=

z1

- /2*Raiz(

0,265(1-

Ejemplo 3 Se sabe que las exportaciones mensuales Y de un determinado producto sigue una distribucin normal con varianza = 100 se tom una muestra aleatoria de n =10 meses obtenindose las siguientes exportaciones en miles de dlares.
2

Mes 1 28,20

Mes 2 49,15

Mes 3 35,56

Mes 4 55,96

Mes 5 40,77

Mes 6 56,18

Mes 7 50,40

Mes 8 60,65

Mes 9 47,50

Mes 10 50,45

Se pide obtener un intervalo de confianza bilateral simtrico del 95% para: a. La media b. El tercer cuartil.
Solucin
a) Como la poblacin es normal con desviacin conocida o = 10, el pivote Raiz(19)*(Ybarra-)/10 N(0,1) conduce al Intervalo de confianza 1-: .ybarra z 1-/2o/raiz(n) Se tiene ybarra = 47,48, y 1- = 0,95 as 1-/2 = 0,975 y z 0,975 = 1,96. Entonces, IC(): 47,48 1,96*10/Raiz(10) = 47,48 6,20 = [ 41,28 ; 53,68 ] b) Sea y075 el tercer cuartil, entonces, Pr[ Y y075 ] = 0,75, as, (( y075 -)/10)=0,75 Entonces, ( y075 -)/10 = 0,67 (tabla normal estndar) As, y075 = + 6,7 Dado que 41,28 53,68 con 95% de confianza, entonces,

41,28 + 6,7 + 6,7 53,68 +6,7 con 95% Es decir, 47,98 y075 60,38 con 95% Otro mtodo es observar que Ybarra + 6,7 N( + 6,7; 2/10) As un pivote para el parmetro: y0,75 = + 6,7 es donde se obtiene el mismo intervalo que antes. (Ybarra - y075 )*Raiz(10)/10 N(0,1). De

Ejemplo 4 Sean T1 y T2 estimadores insesgados e independientes de un parmetro desconocido . Considere la combinacin lineal: T p = aT1 + bT2 , donde a y b son constantes tal que a + b = 1 . a) Si los estimadores T1 y T2 tienen distribuciones normales, con varianzas conocidas V1 y V2 , encuentre la distribucin del estimador T p . b) Dos economistas han estimado (proyectado), independientemente, el crecimiento porcentual del P.I.B. para el ao 2002 (con respecto al 2001). Los dos acadmicos,

usaron estimadores insesgados, con distribuciones normales. A continuacin, se presentan las estimaciones, varianzas y el porcentaje de aciertos de cada economista en el pasado.
Economista Estimacin Varianza Aciertos % 1 3,0 0,04 46 2 2,0 0,06 69 i) Combinar las estimaciones anteriores y obtener una tercera estimacin ponderada del crecimiento del P.I.B. en el ao 2002 ii) Usar el estimador combinado para construir un intervalo de confianza al 95% para el crecimiento del P.I.B. Se puede concluir que el crecimiento ser mayor que el 2,2%? S|olucin
a) T1 N( , V1) T2 N( , V2) ETp = a ET1+ bET2 = a + b = (a+b) = VarTp = a2VarT1+ b2VarT2 = a2 V1+ b2 V2 Adems la suma ponderadas de normales independientes es tambin una normal, as. Tp N( , a2 V1+ b2 V2) b) i) Tp = a T1+ bT2 Debemos encontrar los ponderadores a y b que sumen 1. Con la informacin dada, solamente podemos ponderar usando los % de acierto: a = 46/(46+69) = 0,4; b = 69(46+69) = 0,6; As, Tp = 0,4 T1+ 0,6T2 La estimacin ponderada es ii) Un intervalo de confianza 1 - para es: Tp z1 - /2 Raiz( 0,42V1+ 0,62 V2) = 2,4 1,96*0,1673 = 2,40 0,33 = [ 2,07; 2,73 ] Luego al 97,5% de confianza no se puede concluir que el crecimiento ser superior al 2,2%. Tp () = 0,4*3+ 0,6*2 = 2,4

Ejemplo 5 La gerente de crditos y cobro de cierta empresa, debe precisar sus polticas de crdito. Suponga que la gerente desea estimar la proporcin de cuentas consideradas incobrables en la empresa, en base a un Intervalo de Confianza Bilateral del 95% con una precisin de 0,01. a) Cuntas cuentas deben formar la muestra para cumplir con los objetivos planteados por la gerente?.(2ptos)

b) Si se toma una muestra con el nmero de cuentas establecidas en el punto anterior y se determina que el 10% de ellas son incobrables Qu Intervalo del 95% de Confianza resulta de ello? c) Compare y comente el I. de C. Propuesto por el gerente con el realmente obtenido en el punto anterior. d) Qu habra pasado con el tamao de la muestra si en las hiptesis planteadas por la gerente, si ella hubiese dicho lo siguiente. La proporcin real de incobrables no puede superar el 15%, ya que ello implicara que la compaa est al borde de la quiebra y tal hecho dista mucho de nuestra realidad financiera .
a)

Solucin
Sea la proporcin de cuentas incobrables en la empresa, y Sea p la proporcin de cuentas incobrables en la muestra, p es un estimador de

Se pide determinar n tal que: P ( p 0,01 p + 0,01) = 0,95 A partir de la frmula de I. De C. Para una proporcin , podemos establecer que:

0,01 = z 0,975

p(1 p ) n

1,96 n= p (1 p) n = 38.416 p(1 p ) 0,01

El tamao de la muestra depende del valor de p a travs de la funcin: f(p) = p(1-p), esta corresponde a la varianza estimada del modelo Bernoulli, una solucin conocida como el caso de varianza mxima es buscar aquel valor de p que maximiza dicha funcin, como esta grfica corresponde a una parbola invertida que se anual para p = 0 y para p = 1, entonces el mximo se produce para p = 0,5 y corresponde al valor f(0,5) = 0,25. As entonces el mximo valor de n esta dado por n = 38.416 * 0,25 = 9.604 cuentas b)

El I. de C. Para

esta dado por: p z1

p(1 p ) , p + z1 2 n

p(1 p) n

0,01 1,96

0,01 * 0,09 0,01 * 0,09 0,01 + 1,96 0,094 0,106 9,604 9,604

c) El intervalo propuesto exige una precisin del 1%, sin embargo el obtenido supera por largo dicho valor llegando a ser del 0,6%, dado que el tamao muestral es el de varianza mxima y asume que la proporcin estar en alrededor del 50%, pero en realidad en ste caso es del 10%. d) A deferencia del caso anterior en que la varianza Es mxima para una proporcin del 50% en ste caso el mximo se produce en p = 0,15, por lo tanto el tamao muestral es igual a:

1,96 n= p (1 p) , con p = 0,15 n = 38.416 * 0,15 * (1 0,15) n = 4.898. 0,01

Ejemplo 6

Sea Y1 , Y2 ,Y3 , ...,Yn una muestra aleatoria de una distribucin N , , se desea determinar el mayor tamao de muestra posible de tal modo que el valor esperado de la amplitud del intervalo bilateral del 95% de confianza para la varianza, no supere al triple del valor del parmetro que se estima.
2

(a) (b)

Suponga que la media es desconocida Suponga que la media es conocida

Solucin
a)

(n 1)S 2 (n 1)S 2 Un I de C para ; desconocido , est dado por: 2 , 2 n1,1 2 n 1, 2


2

Amplitud del Intervalo = A = Ya que S


2

(n 1)S 2 (n 1)S 2

2 n 1,

2 n 1,1
2

E ( A) =

(n 1) 2 (n 1) 2

2 n 1,

2 n 1,1

es un Estimador Insesgado de

Por lo tanto:

(n 1) 2 (n 1) 2

2 n 1,

2 n 1,1

3 2

(n 1)
2 n 1, 2

(n 1)
2 n 1,1 2

3
3

Usando un nivel de confianza del 95% tenemos que:

(n 1)
2 n 1, 0, 025

(n 1)
2 n 1, 0 ,975

Usando la tabla de la distribucin CHI-CUADRADO, por tanteo, vemos que para: n - 1 = 9 grados de libertad

2,700 19,073

= 2,86 3 y para n - 1 = 8, dicho valor

sobrepasa el valor 3. As entonces el tamao de muestra solicitado es n = 9 b)

(Y )2 (Yi )2 i , Un I de C para ; conocido , est dado por: 2 2 n ,1 n , 2 2


2

Ya que:

2 (Yi )

Ejemplo 7

2 (n )

E ( A) =

n 2
2 n , 2

n 2
2 n ,1 2

n=8

El peso neto en gramos de las cajitas de caramelos AMBROSIA tienen una distribucin N ( ,49 ) . Los pesos de una m.a.s. de estas cajitas estn dados en la siguiente tabla:
136,7 131,1 122,2 118,9 134,4 125,6 132,2 141,1 146,7 132,2 127,8 131,1 136,7 134,4 130,0

a) Construya un intervalo de confianza bilateral del 95% para la varianza de los pesos. Compruebe si efectivamente la varianza se puede considerar igual a 49. b) Con la informacin obtenida en el punto anterior. Construya un intervalo de confianza bilateral simtrico para la media de los pesos. c) Con que tamao de muestra la amplitud del I.de C al 95%. bilateral para la media se reducira en al menos un 20% con respecto al obtenido en el punto b)?
SOLUCION a) El intervalo de confianza del 95% para

esta dado por:

(n 1)S 2 2 ( n1),1 2
2

(n 1) S 2

(2n1),

n = 15 ; s = 49,0 ; por lo tanto el I.de C. es: ( 26,3 ; 121,9 ), por lo tanto efectivamente podemos considerar que la varianza poblacional es 49, dado que dicho valor pertenece al intervalo de confianza. b) Se trata entonces de un I de C para

conocida la varianza, luego el I. de C. esta dado por:


*

1 n 2 2 n = 15 ; y = 132,07 ; por lo tanto el I. de C. es: ( 128,5 ; 135,6 ) 1


c)

Y + z

Amplitud del Intervalo = 2z/Raiz(n) = 0,80*7,1 <= 5,68. Despejando n se obtiene n >= 23,3. As el tamao de muestra debe ser al menos n = 24.

Ejemplo 8
Un psiquiatra asociado a cierta clnica afirma en una reunin de mdicos que al menos un 36% de todos los dolores crnicos de cabeza son psicosomticos, es decir no tienen origen orgnico. Sus colegas escpticos, elaboran pldoras con harina y agua que son suministradas a 54 pacientes de la clnica con dolores de cabeza crnicos, a los que se informa que constituyen una nueva medicina para el dolor de cabeza, luego solicitan a cada paciente su opinin, las cuales se clasificaron de la siguiente forma: Mejor que la aspirina: 18 personas. Mas o menos como la aspirina: 5 personas. Ms lentas que la aspirina: 3 personas. No producen efecto alguno: 28 personas.

Aunque los mdicos quedan sorprendidos por los resultados, acusaron no obstante al psiquiatra de exagerado. a) Usando un intervalo de confianza del 95% analice si la afirmacin del psiquiatra es respaldada por los datos. b) Usando un intervalo de confianza del 98% analice si la afirmacin del psiquiatra es respaldada por los datos. SOLUCION a) = p = (18+5+3)/54 = 0,481 - - intervalo unilateral

- construccion del intervalo: - [0,369, ] - El intervalo resultante es no contiene a 0,36, por lo tanto respaldada por los datos. b) - [ p z1

> 0,36 y la afirmacin del siquiatra est

p (1 p) , ] y la construccin del intervalo unilateral. n

- [0,342, ] - Como contiene el valor 0,36 se concluye que los datos no sostienen la afirmacin del siquiatra dado que esta en el intervalo, puede ocurrir que 0,342 < <0,36. As al 98% los mdicos si suponemos que tienen razn en acusar al siquiatra de exagerado.

Ejemplo 9 Sea, Y1 , Y2 , ...., Yn una m.a.s.(n) de Y N 0, 2 .


2 MV a) Verifica que =

i =1 i

Y2

n Cul es el estimador mximo verosmil del tercer cuartil Q3 de la poblacin? b) Suponiendo que el estimador anterior es insesgado y que su varianza alcanza la Cota de Cramer Rao, encuentra su distribucin asinttica. 100 c) Supn que n = 100 y i =1 y i2 = 666. Encuentra un intervalo de confianza

es el estimador de mxima verosimilitud de 2 .

aproximada 95% para 2.

Alguien afirma que 2 < 7,0. Estas de acuerdo?

Solucin

a) Ln (L) = - 0,5nLn(2) 0,5nLn( 2) - 0,5(1/2) Yi 2 (Ln (L)) = n2 + 0,5n(1/2) + 0,5(1/4) Yi 2 = 0 / : 0,5 / *4

Yi 2 = 0, entonces, 2gorro = Yi 2/n

El tercer cuertil de una normal con media o y varianza tiene Q3^ = 0,67Raiz(Yi 2/n)

es Q3 = 0,67 As, por invarianza se

b) Dado que es insesgado y su varianza es Var( Yi 2/n) = (1/n2) 4*Var(Yi2/2) = ( Yi2/2 Chicuadrado n) = (1/n2) 4 2n = 24 /n Entonces, por las propiedades asintoticas de los estimadores de mxima verosimilitud se tiene, 2^ = Yi 2/n a N(2, 24/n). c) Por b), 2^ es insesgado y tiene una distribucin asintotica normal, entonces, un intervalo de confianza aproximado al 95% para 2 es: 2 = 2^ 1,96*Raiz(Var^ (2^)) 2^ = 666/100 = 6,66 Raiz(Var^ (2^) = Raiz(2*4^/n) = Raiz(2(2^)2/100) = Raiz(2*6,662/100) = 0,94. As 2 = 6,66 0,94 y 2 < 7,0. Es compatible con ese intervalo.

Ejemplo 10 Sea X1, X2, X3, ...., Xn una muestra aleatoria de tamao n de una poblacin X tal que X 2 N , . 1. Suponiendo que la varianza es desconocida y que el tamao de muestra es pequeo a) Explique en palabras cmo encontrara un intervalo de confianza para el parmetro 3 + 2 . b) Construya paso a paso, un intervalo de confianza del 95% bilateral simtrico para 3 + 2 . El mtodo utilizado aqu, NO tiene que coincidir con el descripto en a).

2. Suponiendo que la varianza es desconocida y que el tamao de muestra es grande c) Esta nueva condicin en que afecta al intervalo obtenido en el punto b) ( 0,5 ptos.) 3. Suponiendo que la varianza es conocida d) Esta nueva condicin en que afecta al intervalo obtenido en el punto b) ptos.) Solucin
1. a) Dado que la poblacin es normal, la varianza desconocida y la muestra pequea un intervalo para se puede obtener va la distribucin la t-student con n-1 grados de libertad) por lo tanto un intervalo para 3 + 2 se puede obtener aplicando la funcin g(x) = 3x + 2 al intervalo anterior. Otra solucin es encontrar un pivote para 3 + 2, es decir una variable que slo dependa de la muestra y el parmetro 3 + 2 pero su distribucin no dependa de cantidades desconocidas. Luego se despeja el parmetro de la doble desigualdad b) 3 Ybarra +2 N (3 + 2, 92/n)
2 2

( 0,5

As un pivote es [( 3Ybarra +2 -(3 + 2))/(3/raiz(n))] /

Raiz[ (n-1)S / /(n-1)] = ( 3Ybarra +2 -(3 + 2))/ [3S/ Raiz(n)] t n-1 As el pivote anterior da lugar al intervalo: t*S/Raiz(n)] donde g(x) = 3x + 2. 3*ybarra +2 t*3S/Raiz(n) que es idntico a g[ybarra

Con n = 6, resulta t (6-1, 0,975) = 2,5706 y as, 3 + 2 = 3*ybarra +2 3,148*s 2) c) Aqu no es necesario utilizar el percentil t y basta el coeficiente 1,96 de la normal, dado que podemos utilizar el TLC y la consistencia de s para estimar . Resulta: 3 + 2 = 3*ybarra +2 1,96*3*s/Raiz(6) = 3*ybarra +2 2,4*s. Claramente resulta un intervalo ms coro que en el caso b) y la confianza 0,95 es aproximada.

3) d) Resulta 3 + 2 = 3*ybarra +2 1,96*3*0/Raiz(6) = 3*ybarra +2 2,4*0 En este caso la confianza es exactamente 0,95.

Ejemplo 11 Sea Y1 , Y2 , Y3 ,...,Yn una m.a. de una poblacin Y con f.d.p.:

f ( y) = y exp{ y}
2 *

y0

Establezca un Intervalo de confianza bilateral simtrico con confianza ( 1- ) para el parmetro , en base al estimador mximo verosmil del parmetro , caso muestra grande.
Nota : E (Y ) = 2

V (Y ) =

Solucin
La funcin de verosimilitud es: L() = i=1, .. .n { 2 Yi exp(-Yi) }= 2n exp(-Yi) Yi ln( L() ) = 2n*ln() + ln(Yi) - Yi Derivando dln(L)/d = 2n/ - Yi = 0, entonces, ^MV = 2n/Yi = 2/Ybarra Por las propiedades asntoticas de los EMV ^MV a N( , CCR() ) Hay que determinara la Cota de Cramer Rao: CCR = - [ E (d2ln{L()}/d2 ) ] -1 d2ln{L()}/d2 = -2n /2 E (d2ln{L()}/d2 ) = -2n /2 Entonces, CCR = 2 /2n ^MV a N( , 2 /2n ) Pivote para , : ( ^MV - )*raiz(2n)/ a N(0 , 1 ) As: de - z1 - /2 ( ^MV - )*raiz(2n)/ z1 - /2 (*)

Aqu hay varios caminos: Mtodo 1 Una alternativa ms fcil, pero ms aproximada es reemplazar por ^MV en el denominador y luego despejar : - z1 - /2 ( ^MV - )*raiz(2n)/ ^MV z1 - /2 Se tiene el IC(): :^MV z1 - /2 ^MV /raiz(2n) (**)

Mtodo 2 Un mtodo ms exacto es, anotar de (*):

10

( ^MV - )2*2n z21 - /2 Se tiene la inecuacin cuadrtica en : 2(1 z2/2n) -2^MV + ^2MV 0 Se tiene que x1 x2, donde x1 y x2 sin las races de la ecuacin cuadrtica, as el intervalo es: IC(): ( ^MV z1 - /2Raiz(2n) )/ [ 1- z21 - /2/2n]

Ntese que dado que n es grande, el intervalo anterior es prcticamente el mismo que el de (**). Mtodo 3 De - z1 - /2 ( ^MV - )*raiz(2n)/ z1 - /2 Se tiene: - z1 - /2 ( 2/(Ybarra) - 1 )*raiz(2n) z1 - /2 despejando el parmetro se tiene el IC: 2/ [Ybarra*( 1 z1 - /2/raiz(2n) ) ]

Ejemplo 12 En una muestra aleatoria de 1500 personas adultas seleccionadas en Santiago, el 31% opinaban que las drogas es el problema ms grave en las escuelas hoy en da. a) Da un intervalo de confianza al 93% para el porcentaje de adultos que opina que las drogas es el problema ms grave en las escuelas hoy en da. b) Explica a alguien que no sabe estadstica el significado de la frase con 93% de confianza cuando nos referimos al intervalo calculado en a).
a) Dado que la muestra es grande n = 1500 > 30 segn el TLC el margen de error de P al 95% en la estimacin del parmetro = proporcin de personas adultas que opina, es: me = z*Raiz(p(1-p)/1500) = z*Raiz(0,31*0,69/ 1500) = z*0,011942 Donde z es el percentil 1 - /2 y la confianza que se pide es 1 - = 0,93, esto implica =0,07 y entonces, 1 - /2 = 0,965 as el percentil del 96,5% de la distribucin N(0,1), es segn la tabla z = 1,81, entonces, me = 0,022 IC(): p me = 0,31 0,022 = de 0,288 a 0,332 b) El intervalo de 0,288 a 0,322 fue construido con un mtodo que captura el valor de en 93 de 100 veces que seleccionamos una muestra aleatoria, as, la frase con 93% de confianza significa que confiamos que el intervalo anterior es uno de los 93 en 100 que cubre el valor de .

Solucin

salario mensual crees que se debera pagar a los consejales? Llmanos con tu cifra. Llama un total de 958 personas. La media del salario que sugieren las personas

Ejemplo 13 En un debate radiofnico se invita a los oyentes a que participen en una discusin sobre una propuesta de aumento del sueldo de los consejales de una municipalidad. Qu es 509.833 pesos al mes, con una desviacin estndar de las respuestas de 65.625 pesos. La emisora dice que el intervalo de confianza al 95% para el salario medio que propondran todos las personas de la comuna, va de 505.677 a 513.989 pesos a) Cmo obtuvo el intervalo la emisora?
11

b) Sus conclusiones se refieren al universo de todos los habitantes de la comuna? Justifica t respuesta. Solucin
a) Aplicaron la frmula IC(): ybarra 1,96*s/Raiz(n) = 509.833 1,96*65.625/Raiz(958). b) No, como se trata de una muestra de voluntarios y no aleatoria las conclusiones se refieren slo a las personas que llamaron, es decir, ellas slo se representan a si mismas. La muestra no es aleatoria, es de voluntarios y entonces no se aplican las formula del intervalo de confianza para la media basadas en el TLC.

Ejemplo 16 A continuacin, se presentan los resultados al lanzar 75 veces un dado necesariamente balanceado):
6 1 4 6 5 6 5 6 2 2 1 6 4 6 4 5 2 4 3 1 5 2 2 2 6 5 6 3 6 3 5 3 2 4 6 4 6 6 6 2 1 1 6 1 5 4 5 4 4 1 3 2 6 1 5 1 5 6 2 5 3 6 4 3 2 1 1 4 3 6 5 6

(no
2 3 1

Considera la poblacin Y = 1 si sale seis, 0 si no. a) Determina la distribucin de la poblacin y sus parmetros . b) Con los resultados de los 75 ensayos se puede construir una muestra aleatoria de tamao n = 75 de la poblacin Y. Anota los primeros cinco valores de la muestra anterior. c) Propone un estimador para el parmetro de la poblacin y obtn una estimacin. d) Encuentra el margen de error del estimador propuesto y construye un intervalo de confianza 95% para . Se sospecha que el dado est cargado al nmero seis, es decir, =Pr(sale seis) > 1/6. Concluiras que el dado est cargado al nmero seis? e) Supn que en realidad se realizaron 150 lanzamientos del dado, pero por alguna razn slo se mostraron los 75 lanzamientos anteriores. Dada la informacin anterior, podra cambiar t conclusin en b)? Explica porque si no. Solucin
a) La distribucin de Y es bernoulli de parmetro = Pr( Y=1 ) =Probabilidad de seis Es decir la tabla de probabilidades de Yes .y 0 1 p(y) 1- b) Los cinco primeros valores de la muestra aleatoria de la variable Y segn los resultados de los 75 ensayos son: 1 1 0 0 0 c) El estimador P = proporcin de seis en la muestra, es insesgado y consistente con respecto a . ^() = p = #( valores Y=1 ( o seis) en la muestra) / 75 = 19/75 = 0,25 d) Dado que la muestra es grande n = 75 > 100 segn el TLC el margen de error de P al 95% es: me = 1,96*Raiz(P(1-P)/75) = 1,96*Raiz(0,25*0,75/ 75) = 0,10 IC(): p me = 0,25 0,10 = de 0,15 a 0,35

12

El intervalo de confianza para al 95% contiene el valor 1/6 = 0,17, que es valor que debera tener si el dado no estuviera cargado, por lo tanto no podemos afirmar (con confianza del 95%) que > 1/6 y por tanto afirmar que el dado esta cargado a las caras ( porque puede ocurrir que < 1/6 o > 1/6). e) En este caso, no sabemos si los 75 lanzamientos son una muestra aleatoria simple de Y y por lo tanto los resultados en c) no son vlidos. La situacin anterior, equivale a planear una muestra de n = 150 y que slo respondan 75.

Ejemplo 14 Se observa durante 100 das hbiles la rentabilidad de una accin en la bolsa. Los 100 valores anteriores los consideraremos una muestra aleatoria de n = 100 de la poblacin Y = rentabilidad (%) de la accin en un da cualquiera. De la muestra se obtiene: Suma = 2004,75 % y Suma de cuadrados = 53.000, %2 a) Utiliza los estimadores naturales para obtener estimaciones de = E(Y) y 2 = Var(Y). 2 4 . b) Supn que la distribucin del estimador S2 es normal con varianza n 1 Encuentra el margen de error y construye un intervalo de para 2 al 90% de confianza. c) La varianza 2 mide la volatibilidad o riesgo de la accin. Un inversionista esta dispuesto a comprar acciones si su volatibilidad es menor que 170. Considerando el intervalo de la parte c), debe el inversionista comprar las acciones?
a) Estimadores naturales de la media y varianza: ^() = Ybarra = 2004,75/100 = 20,0475 2^() = s2 = ( 53.000 100 (20,0475) 2 )/99 = 129,4 b) Segn el modelo de intervalo = ^ z ee(^), donde ^ es insesgado con respecto a y normal , entonces, como ^ = S2 es insesgado con respecto a = 2 y el enunciado dice que es normal con

Solucin

2 4 2s 4 2 2 varianza , entonces, un intervalo con 90% IC( ): s me donde me = 1,64*Raiz( )= n 1 99


30. Entonces: IC(2 ): 129 30 = de 99 a 159 c) El intervalo en b) permite afirmar que 2 < 170. Por lo tanto, el inversionista si debera invertir en el valor usando su criterio.

Ejemplo 15 Se observa durante 22 das hbiles la rentabilidad de una accin en la bolsa. Los 22 valores anteriores los consideraremos una muestra aleatoria de n = 22 de la poblacin Y = rentabilidad (%) de la accin en un da cualquiera. A continuacin, se presentan 22 rentabilidades (en %) observadas de la poblacin Y:
4,2 -2,1 4,6 2,2 1,8 5,0 2,1 -1,5 4,3 8,7 6,1 5,5 4,7 12,6 6,6 8,4 2,9 10,3 5,4 5,9 -4,8 5,1

Suma = 98,00 % y Suma de cuadrados = 767,08 %2 a) Construye un grfico de hoja y tallo de los datos anteriores. Existe asimetra y valores atpicos?

13

b) Utiliza los estimadores naturales para obtener estimaciones de = E(Y) y la varianza 2 = Var(Y). c) Encuentre el margen de error del estimador de y construye un intervalo de confianza 95% para ese parmetro. d) Un inversionista esta dispuesto a comprar acciones si su rentabilidad media supera el 5%. Considerando el intervalo de la parte c), Debe el inversionista comprar las acciones?
a) Diagrama de tallo y hoja. -4 8 -3 -2 1 -1 5 0 18 2912 3 46327 514059 661 7 847 9 10 3 11 12 6 No se observa asimetra evidente, ni puntos atpicos. b) Estimadores naturales de la media y varianza: ^() = ybarra = 98/22 = 4,5 2^() = S2 = ( 767,08 22 (4,5) 2 )/21 = 15,3 ^() = S = Raiz( 15,3 ) =3,91 c) Dado que no hay asimetra ni puntos atpicos y la muestra es pequea n = 22 < 30 utilizaremos el coeficiente de la distribucin t-Student con n 1 grados de libertad, para calcular el margen de error: me = t* s/Raiz(n)

Solucin

Donde t* es el percentil 1 - /2 donde la confianza se pide que sea 1 - = 0,95, esto implica = 0,05 y entonces, 1 - /2 = 0,975 as el percentil del 97,5% de la distribucin t-Student con n -1 = 22-1 = 21 grados de libertad, es segn la tabla correspondiente, t* = 2,0796. me = 2,0796*3,91/Raiz(22) = 1,7 IC(, 95%): ybarra me = 4,5 1,7 = de 2,8 a 6,2 d) El intervalo de confianza para al 95% contiene el valor 5%, por lo tanto, no podemos afirmar (con confianza del 95%) que (la rentabilidad media) se mayor que 5% ( es decir, puede ocurrir que <5 o >5). As el inversionista no deberan segn su criterio, invertir basado en los datos de la muestra. Ntese que si el inversionista considerar que una rentabilidad mnima del 2,8% es suficiente, entonces, el intervalo de confianza le indica que >2,8 y puede invertir (con una confianza del 95%)

14

Ejemplo 16 A continuacin, se presentan los resultados de una prueba sobre comprensin de lectura de una muestra aleatoria de 44 nios, alumnos de tercero bsico de los colegios de una comuna del Gran Santiago. 40 47 52 47 26 19 25 35 39 26 35 48 14 35 35 22 42 34 33 33 18 15 29 41 25 44 34 51 43 40 41 27 46 38 49 14 27 19 31 46 28 52 54 45

a) Creemos que la distribucin de los resultados en la prueba es aproximadamente normal. Dibuja un diagrama de tallo y hoja de la distribucin de los 44 resultados, describe su forma, hay valores atpicos? b) Estima la media y desviacin estndar de los resultados que habran obtenido en la prueba todos los alumnos de tercero bsico de los colegios de la comuna. c) Supn que se sabe que la desviacin estndar de la poblacin de los resultados de la prueba es = 11. Construye un intervalo de confianza al 94 % para la media de los resultados que habran obtenido en la prueba todos los alumnos de tercero bsico de los colegios de la comuna. d) Una persona interpreta el intervalo (a,b) calculado en c) diciendo que el 94% de todos los alumnos de tercero bsico de la comuna tienen puntuaciones entre a y b Tiene razn? Justifica tu respuesta. e) Confiaras en tus conclusiones en b) si los resultados provinieran de un curso de tercero bsico de uno de los colegios de la comuna? Justifica tu respuesta. Solucin
1 2 3 4 5 a) Diagrama de tallo y hoja. 489954 657659827 95481553453 02367406197815 2214 6 9 11 14 4

Se observa cierta asimetra hacia la derecha y no hay valores atpicos. Notar adems, que no hay valores poco frecuentes en las colas lo que posiblemente se deba al tamao de la muestra, es decir, el grfico no muestra evidencia clara contra la normalidad. b) Para estimar la media y desviacin estndar de los puntajes que habra obtenido todos los alumnos de los colegios de tercero bsico de la comuna (poblacin) usaremos los estimadores naturales, Ybarra y S (S2), que tienen buenas propiedades estadsticas, insegamiento y consistencia. Ybarra = ( 40 + 26 + . . .+ 45)/44 = 35,1 S = raiz( ( (402 + 262 + . . .+ 452) - 44*(35,1)2 )/43 ) = 11,2 a) Usaremos el intervalo para la media, IC(): ybarra z* S/raiz(44).

El intervalo anterior, se justifica suponiendo que los puntajes son normales (parte a) o bien por el TLC dado que n = 44 > 30. Se pide confianza = 1 - alfa = 0,94, entonces, alfa = 0,06, asi, 1 - alfa/2 = 0,97, as, z 0,97 = 1,88. IC(): 35,1 1,88* 11,2/raiz(11,2) = 35,1 3,2 = 31,9 a 38,3 con un 94% de confianza.

15

b) No, el intervalo significa que hay una confianza del 94% de que el intervalo de 31,9 y 38,3 contenga la media de los puntajes de todos los alumnos de tercero bsico de la comuna. Es decir, si repetimos 100 veces la seleccin de 44 alumnos de la comuna en 94 de las veces, aprox., el intervalo construido contendra la media poblacional. c) No porque en ese caso la muestra de alumnos no sera aleatoria. De hecho la muestra podra estar muy sesgada, por ejemplo si los alumnos pertenecen a un colegio particular o a uno municipal.

Ejemplo 17 La empresa Time Ibope ha instalado monitores electrnicos en los aparatos de televisin de una muestra de 450 de los 1.230.393 de los hogares del Gran Santiago. Con los datos obtenidos de los monitores se obtiene la proporcin de hogares que sintonizan un programa XX de TV (rating-hogares de XX). a) Describe el universo del estudio, poblacin, parmetro de inters y la muestra. b) Propone un estimador para el rating del programa XX, explica sus propiedades. c) Supn que el programa XX fue visto por 329 hogares de la muestra. Estima el rating del programa, el margen de error y construye un intervalo de confianza al 95%. Qu supuesto sobre la muestra es necesario hacer para que los resultados anteriores sean estadsticamente vlidos? d) Un ejecutivo del canal afirma que el rating obtenido por XX es record, pues el anterior era un 70%. Un experto estadstico dice que no hay evidencia para confimar lo que dice el ejecutivo y que el rating pud ser inferior al record histrico. Justifica estadsticamente lo que dice el experto y explica en en lenguaje que el ejecutivo pueda entender por qu no podemos estar seguros que el rating de XX super el 70% y que incluso pud ser menor. e) Cul debi ser el tamao de la muestra (mnimo) para dar la razn (al 95%) al ejecutivo de la parte d)? Supn la misma estimacin del parmetro.
a) Universo : los 1.230.393 de los hogares del Gran Santiago. Poblacin: Y = 1 si el hogar esta mirando el programa XX, 0 si no. Parmetro: = Proporcin de los 1.230.393 de los hogares del Gran Santiago que sintonizaron el programa XX. Muestra de n = 450 hogares. b) El estimador natural del parmetro es, ^ = P = Proporcin de hogares en la muestra que sintonizaron el programa XX. El estimador anterior es insesgado, consistente y, del TLC, tiene una distribucin asintotica normal. c) Estimacin del rating: ^() = p = 329/450 = 0,731. As, 73,1% de los hogares del Gran Santiago sintonizaron el programa XX. Margen de error(95%) = me = 1,96*ee(P) = 1,96* raiz (0,731(1 0,731)/450) = 0,041. Intervalo de confianza para el rating IC(): p me = 0,731 0,041 = 69,0% a 77,2%. Los supuestos del intervalo anterior son una muestra aleatorio simple de hogares y grande. d) El intervalo de confianza al 95 para el rating del programa XX va de 69,0% a 77,2%, contiene el rating histrico 70%, de modo que el rating del programa XX podra ser menor que el 70%. Dado que el rating estimado proviene de una muestra tiene un margen de error estadstico de 4,1 ptos porcentuales lo que significa que el verdadero rating se ubicara entre 69% y 77,2%. As el rating poblacional podra ubicarse entre el 69% y 70% resultando inferior al histrico.

Solucin

16

e) La evidencia estadstica dara razn al ejecutivo, si el intervalo (0,731 me; 0,731 + me) resulta ubicado a la derecha de 0,70. As, se debe tener, me = 0,731 0,70 = 0,031, entonces, me = 1,96*raiz(0,731*0,269)/n) = 0,031, y as despejando, n = 786. Es decir, para dar la razn al ejecutivo, la muestra debi ser mayor que 786 hogares, por ejemplo, 790.

Ejemplo 18 El banco BRANDOCARO quiere saber que proporcin de sus 5.321 cuentacorrentistas-personas utiliza la pgina de Internet del banco para realizar sus operaciones bancarias. Se han intentado tres mtodos: 1. Se obtuvieron, con un programa, 500 nmeros aleatorios entre 0001 y 5.321, luego, se enviaron 1cuestionarios por correo a los correspondientes 500 clientes del listado, de los cules respondieron, tambin por correo, 150 personas. 2. Con una tabla de dgitos aleatorios se obtuvieron 150 nmeros aleatorios entre 0001 y 5.321, entonces, se llam y pregunto por telfono a los clientes correspondientes del listado, de los cules respondieron 142. 3. Se encuestaron a 500 personas en las filas de clientes, en todas las sucursales del banco entre 13:00 y 14:00, durante cinco das hbiles. a) Identifica el universo, la poblacin y el parmetro de inters.
b) Desde el punto de vista estadstico, cul es el mejor mtodo para estimar la

proporcin de clientes que utilizan la pgina de Internet del Banco? mtodo y porque descartas los otros. Solucin

Justifica el

a) Universo: 5.321 Cuenta-correntistas personas del banco. Poblacin: Y = 1 si un Cuenta correntista seleccionado al azar utiliza la pgina de Internet del banco. 0 si no. Parmetro de inters: = proporcin de los 5.321 cuenta correntistas que utilizan la pgina de Internet del banco. b) El mejor mtodo es el 2) pues el procedimiento implica la seleccin de una muestra aleatoria simple que es el mtodo probabilstico ms simple. Bajo el procedimiento anterior se minimizan los sesgos de seleccin y el estimador natural del parmetro , el estadstico ^ = P es insesgado consistente y con distribucin asintotica normal. Existe no respuesta pero es muy baja y por lo tanto el sesgo debe ser pequeo. El procedimiento 2) se descarta porque la no respuesta es tan grande que se destruyen las propiedades de la muestra aleatoria simple de la muestra inicial n = 500. El procedimiento 3) se descarta porque existen sesgos por falta de cobertura. Es muy posible que entre las persona que van a las sucursales la proporcin que utilizan Internet sea menor que en la poblacin de los 5.321.

17

Potrebbero piacerti anche