Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Los parmetros de la poblacin se desconocen generalmente, siendo uno de los primordiales principios de la estadstica el estimarlos.
El mtodo o estadstico empleado para ello se denomina estimador del parmetro poblacional.
Hablamos de estimacin puntual cuando asignamos al parmetro de la poblacin un valor concreto. Los mejores estimadores
puntuales de la media y varianza poblacional son :
De la media poblacional : la media muestral
Est ( 2 ) = s 2 =
Est ( ) = x
n
.s 2
n 1
Hablamos de estimacin por intervalos de confianza cuando asignamos al parmetro un intervalo de valores.
Si estimamos el parmetro h mediante el estimador
E( h) = h
Pr(2'58 <
hh
< 2'58) = 0'99
D( h )
o bien
D( h) , sabemos que
La probabilidad de que el parmetro de la poblacin se encuentre en un cierto intervalo (0'99 en el supuesto anterior), se denomina
nivel de confianza y se representa por 1-. El valor (0'01 o 1%) es el margen de error que se permite en la estimacin.
Los intervalos de confianza de los parmetros usuales se enumeran junto a las funciones de decisin correspondientes, en el tercer
epgrafe del presente tema.
CONTRASTES PARAMTRICOS
Contraste es el procedimiento por el cul decidimos si una propuesta sobre la poblacin puede aceptarse o no.
Las notaciones y terminologas empleadas se resumen a continuacin :
H0
H1
Hiptesis nula
Hiptesis alternativa
Error de Tipo II
Aceptar H0 siendo falsa
Error de Tipo I
Rechazar H0 siendo cierta
= Prob (Error de Tipo I)
= nivel de significacin
n=
n=
2 . z + z
( 0 1 ) 2
2 . z / 2 + z
( 0 1 ) 2
unilateral
bilateral
=1-
Intervalo en el que se acepta la hiptesis nula
Intervalo en el que no se acepta la hiptesis nula
Extremos del intervalo o regin de aceptacin
Estadstico que permite resolver el contraste
H0
H1
Tipo
Regin de aceptacin
h = h0
h = h1
Unilateral
h = h0
h = h0
h = h0
h h0
h h0
h h0
h < h0
h > h0
h < h0
h > h0
Bilateral
Unilateral
Unilateral
Unilateral
Unilateral
(- , p) si h0 < h1
(p , +) si h0 > h1
( p1 , p2)
(p , +)
(- , p)
(p , +)
(- , p)
MUESTRA
Tamao de la muestra
Media
Varianza
Cuasivarianza
Proporcin
Coeficiente de correlacin
s2
s'2
p
r
1. MEDIA
1.1. Varianza de la poblacin conocida :
Funcin de decisin :
x
z =
Intervalo de confianza :
z .
n
x z .
x
z =
s
n 1
Intervalo de confianza :
s
z .
n 1
x z .
s
n 1
t n1,
x
=
s
n 1
Intervalo de confianza :
s
t n 1, .
n 1
x t n 1, .
s
n 1
2. VARIANZA
Funcin de decisin :
2n 1, =
Intervalo de confianza :
n. s
2
. 12
n. s2 n. s2
2 , 2
1 2
. 22
3. DIFERENCIAS DE MEDIAS
3.1. Muestras independientes y varianzas de las poblaciones conocidas :
Funcin de decisin :
Regin de aceptacin (bilateral) :
z =
( x1 x2 ) ( 1 2 )
12 22
+
n1 n2
( 1 2 ) z .
12 22
+
n1 n 2
Intervalo de confianza :
( x1 x2 ) z .
12 22
+
n1 n 2
z =
( x1 x2 ) ( 1 2 )
+
1
1
+
.
n1 + n 2 2
n1 n 2
n1. s12
n 2 . s22
Intervalo de confianza :
( x1 x2 ) z .
B) Muestras pequeas (n1+n2-2 50) :
Funcin de decisin :
( x1 x2 ) ( 1 2 )
t n1 + n2 2 , =
1
1
+
.
+
n1 + n 2 2
n1 n 2
n1. s12
1
1
n1. s12 + n 2 . s22
.
+
n1 + n 2 2
n1 n 2
n 2 . s22
t 2 n 2 , =
n1 = n 2 = n
( x1 x2 ) ( 1 2 )
s12
:
Regin de aceptacin (bilateral) :
s12 + s22
( 1 2 ) t 2 n2, . n 1
+ s22
n 1
Intervalo de confianza :
( x1 x2 ) t 2 n2, .
s12 + s22
n 1
gl =
s12 s22
+
n1 n 2
s12 s22
n n
1
2
+
n1 + 1
n2 + 1
z =
( x1 x2 ) ( 1 2 )
s12
s22
+
n1 1 n 2 1
s12
s22
( 1 2 ) z . n 1 + n 1
1
2
Intervalo de confianza :
s12
s22
( x1 x2 ) z . n 1 + n 1
1
2
B.2) Muestras pequeas (gl 50):
Funcin de decisin :
t gl, =
( x1 x2 ) ( 1 2 )
s2
s12
+ 2
n1 1 n 2 1
( 1 2 ) t gl, .
s12
s2
+ 2
n1 1 n 2 1
Intervalo de confianza :
s12
s22
( x1 x2 ) t gl, . n 1 + n 1
1
2
NOTA :
Estimacin y Decisin - 143
Las expresiones
s i
ni
si
ni 1
muestrales).
3.4. Muestras relacionadas y varianza de la diferencia D conocida :
Regin de aceptacin (bilateral) :
Funcin de decisin :
2
z =
( x1 x2 ) ( 1 2 )
( 1 2 ) z .D
Intervalo de confianza :
( x1 x2 ) z .D
3.5. Muestras relacionadas y varianza de la diferencia desconocida (muestras grandes: n > 51):
s2D
Siendo :
( D i D)
=
n
Funcin de decisin :
z =
( x1 x2 ) ( 1 2 )
Intervalo de confianza :
( 1 2 ) z . sD
sD
( x1 x2 ) z . sD
n 1
n 1
n 1
3.6. Muestras relacionadas y varianza de la diferencia desconocida (muestras pequeas: n 51):
Regin de aceptacin (bilateral) :
Funcin de decisin :
t n1, =
( x1 x2 ) ( 1 2 )
sD
( 1 2 ) t n1, . sD
n 1
Intervalo de confianza :
n 1
( x1 x2 ) t n1, . sD
n 1
t n 2 , =
(s'12 s'22
). n 2
2. s'1 . s'2 . 1 r 2
(s12
s22 ).
n2
2. s1. s2 . 1 r 2
B) Observaciones independientes :
CASO GENERAL : Medias poblacionales desconocidas.
Funcin de decisin :
Fn1 1, n 2 1,
Intervalo de confianza :
n1
n1
2
. s12
n 1 . s1
s'2
s'12
n1 1
1
1
. F2 = 2 . F1 , 2 . F2
. F1 ,
n2
s'2
2
n 2 . s2
s'2
.
s
2
2
n2 1
n2 1
n1
. s2
2
2
s1 2
n1 1 1 22
= 2. 2 =
. 2
n2
s2 1
2 1
.s
n2 1 2
s12
s22
n2
n2
2
.12
n 1 .1
n 1
. F1 , 2
en 2
. F2
n1
n
1 . 22
.2
n1 1 2
n1 1
s'2
2
o bien: 12 en 12 . F1 , 12 . F2
s'2
2
2
NOTA :
En todos los casos, lo habitual es que el cociente de varianzas
poblacionales se suprima, al ser igual a la unidad :
12 22
=
=1
22 12
2
n 2 ( x1 1 ) 22 s1 + ( x1 1 ) 22
=
.
. =
.
n1 ( x ) 2 12 s2 + ( x ) 2 12
2
2
2
2
2
2
Funcin de decisin :
Fn1 1, n 2 1,
5. PROPORCIN (valor de 0 a 1)
Muestras grandes (n > 51):
Regin de aceptacin (bilateral) :
Funcin de decisin :
z =
p
.(1 )
n
z .
Intervalo de confianza :
.(1 )
n
p z .
p.(1 p)
n
Funcin de decisin :
p
.(1 )
n
t n1, =
t n1, .
Intervalo de confianza :
.(1 )
n
p t n1, .
p.(1 p)
n
6. DIFERENCIA DE PROPORCIONES
1 2 = 0:
n . + n . n . + n . 1 1
= 1 1 2 2 .1 1 1 2 2 . +
n1 + n 2
n1 n 2
n1 + n 2
D decisin
con
n .p + n .p n .p + n .p 1 1
D estimacin = 1 1 2 2 .1 1 1 2 2 . +
n1 + n 2 n1 n 2
n1 + n 2
Funcin de decisin :
p p
z = 1 2
D estimacin
Intervalo de confianza :
( 1 2 ) z . Ddecisin
( p1 p2 ) z . Destimacin
1 2 0:
con
Funcin de decisin :
z =
( p1 p2 ) ( 1 2 )
p1. ( 1 p1 ) p 2 . ( 1 p 2 )
+
n1
( 1 2 ) z .
n2
1 . ( 1 1 ) 2 . ( 1 2 )
+
n1
n2
Intervalo de confianza :
( p1 p2 ) z .
p1.( 1 p1 ) p 2 . ( 1 p 2 )
+
n1
n2
NOTA :
En los dos supuestos anteriores, si n1 + n2 -2 50, sustituiremos el valor normal tabulado z por el de t de
Student con n1 + n2 -2 grados de libertad.
6.3. Muestras relacionadas,
Situacin 1
con
1 2 = 0:
0
1
Situacin 2
1
0
A
B
C
D
A+C
B+D
A+B
C+D
n
z =
DA
A+D
Intervalo de confianza :
D z . ( D + A ) .0'5.0'5
x t n 1, .
con s 2 =
n
. s 2 = covarianza
n1
s
x t n 1, .
n1
3
15 1
8'5 2'144776.
2
n.s 2 n.s 2
2 , 2
1 2
15 .3
15 .3
=
,
31322266
'
4'074219
14367
'
, 110451
'
) =
'
, 110451
'
(14367
)
'
, 3'3234)
(11986
2
Observadas las calificaciones en las asignaturas de Filosofa y Lengua se aprecia una notable diferencia entre ellas.
Con el fin de analizarla se seleccionan 20 alumnos de Filosofa y otros tantos de Lengua, obteniendo :
Filosofa :
Media = 6
Varianza = 2
Lengua :
Media = 5
Varianza = 1'5
Estime la diferencia media de las calificaciones con un margen de error del 5%.
Estimacin de una diferencia de medias con varianzas poblacionales desconocidas y muestras pequeas de igual tamao.
146 - Estimacin y decisin
Intervalo de confianza :
(x 1 x 2 ) t 2 n 2 , .
s 12 + s 22
n 1
con n = n1 = n2
El intervalo pedido es :
(6 5) 2'024395.
2 + 15
'
20 1
1 0'869
'
, 1869
' )
( 0131
La diferencia entre los promedios de calificaciones estar comprendida entre 0'131 y 1'869 puntos.
3
Para analizar la eficacia de la aplicacin de un tratamiento , se someten al mismo a 64 pacientes. Finalizado el
perodo de aplicacin se observ que remiti la enfermedad en 50 casos.
Con un nivel de confianza del 92%, estime el porcentaje de efectividad del tratamiento objeto de estudio.
Estimacin de una proporcin.
Intervalo de confianza :
p z .
p .( 1 p )
n
0'78125 1'75.
0'78125.(1 0'78125)
0'78125 0'09043(0'69082,0'87168)
64
Con un margen de error del 8% podemos afirmar que el tratamiento ser efectivo entre el 69'082% y el 87'168% de los
casos.
4
Por experiencias anteriores se sabe que las estaturas de los soldados tienen una varianza de 64 cm.
a) Con un margen de error del 6%, estime la estatura media partiendo de un grupo de 100 soldados, tomados al
azar, sabiendo que proporcion un promedio de 164 cm.
b) Manteniendo el mismo intervalo de confianza calculado en el apartado anterior, qu tamao muestral debe
fijarse para que el margen de error pase a ser = 0'02 ?.
a) Estimacin de la media con varianza poblacional conocida.
Intervalo de confianza :
x z .
Intervalo de confianza :
64
164 1' 88 .
100
164 1'504
(162'496 , 165'504)
b)
Para = 0'02 ; z = 2'33
165' 504 = x + z .
De aqu resulta :
n=
64
n
2' 33. 64
= 12' 3936 n = 153' 60 154
165' 504 164
Para reducir a 0'02 el margen de error, debemos tomar una muestra de 154 soldados.
5
Un estudio sobre la proporcin de fumadores estableci que entre el personal de un Hospital slo fumaban entre el
20% y el 35%.
a) Cul fue el porcentaje muestral observado ?.
b) Si se realiz el estudio partiendo de una muestra de 40 individuos, con qu margen de error se trabaj ?.
c) Si el anlisis se efectu con un nivel de confianza del 95%, cuntos individuos integraron la muestra
seleccionada ?.
Estimacin de una proporcin.
Intervalo de confianza :
p z .
p .( 1 p )
n
a)
El valor central del intervalo es siempre la proporcin muestral. En consecuencia, al ser el intervalo de confianza (0'20 ,
0'35), resulta : p = proporcin muestral = 0'275.
b)
Tomando uno de los extremos del intervalo, por ejemplo el izquierdo :
p .( 1 p )
0' 275 .( 1 0' 275 )
= 0' 275 z .
= 0' 275 z . 0' 0706
n
40
0' 275 0' 20
z =
= 1' 06232 1' 06
0' 0706
0' 20 = p z .
De aqu :
0' 35 = p + z .
p .( 1 p )
0' 275 .( 1 0' 275 )
= 0' 275 + 1' 96 .
n
n
0' 4465
n=
6
En una muestra de 13 elementos, obtenidos aleatoriamente de una poblacin normal e infinita, sabemos que los
lmites del intervalo confidencial de estimacin de la media poblacional, con un nivel de riesgo del 5% son,
respectivamente, 128 y 1872. Calcule :
a) la media de la muestra
b) la desviacin tpica insesgada de la muestra.
a)
La media muestral siempre ocupa el valor central o medio del intervalo de confianza. As :
x=
18'72 128
'
= 8'72
2
b)
En la estimacin de la media poblacional con varianza desconocida y siendo la muestra de tamao pequeo, el intervalo de
confianza es :
s'
s'
= ( 128
x t n1, / 2 .
, x + t n1, / 2 .
' , 18'72)
n
n
x + t n 1, / 2 .
s'
s'
s'
10. 13
= 8'72 + 2'178792.
= 18'72 2'178792.
= 10 s' =
= 16'548
2'178792
n
13
13
7
Partiendo de una muestra de 113 elementos, se obtuvo 11856 como lmite superior del intervalo de estimacin de la
varianza poblacional, con un margen de error del 5%.
Calcule la varianza insesgada de la muestra.
En la estimacin de una varianza, el intervalo de confianza es :
n. s2 n. s2
( n 1). s'2 ( n 1). s'2
,
2 , 2 o bien
2
22
1 2
1
Determinemos los valores tabulados de 2. En este caso, al ser el nmero de grados de libertad superior a 50 (n-1 = 112),
los calculamos mediante la tabla de la distribucin normal.
Los valores z correspondientes a /2 = 0025 son :
z = 196
De aqu :
para z = 196 :
para z = -196 :
)
)
2
1
1
2
. ( z + 2. 1) = . 196
' + 2 . 112 1 = 142'69
2
2
2
1
1
2
2
' + 2 . 112 1 = 84'15
= . ( z + 2. 1) = . 196
2
2
2 =
=
2
2
'
'
112
'
142
69
84
15
84
15
2
1
2
De 100 alumnos seleccionados aleatoriamente de un Centro Universitario, 55 eran mujeres. Con mrgenes de error del 5%
y del 1%, determine la proporcin de mujeres del Centro.
3
Analizadas 16 muestras de sangre se determin 64 mg./dl. para la varianza de las determinaciones de colesterol. Con un
nivel de confianza del 95%, estime la desviacin tpica de las determinaciones de colesterol en sangre.
4
En la medicin de longitudes de tornillos producidos por una mquina se calcul una desviacin tpica de 0'05 mm. .
Seleccionada una muestra aleatoria de ellos dio un promedio de 21 mm.
Con un margen de error del 5%, qu tamao debe tener la muestra seleccionada para poder afirmar que la longitud media
de los tornillos est comprendida entre 20'99 y 21'01 mm. ?.
5
Partiendo del estudio de una muestra de 90 individuos a los que se aplic un test de agresividad, se obtuvo 25 puntos para
su desviacin tpica, estimando que la puntuacin media del test debera estar comprendida entre 64 y 80 puntos.
Calcule la media muestral del test y el margen de error con el que se realiz la estimacin.
2
Estimacin de una proporcin. p = 0'55
a) Para = 0'05 : (0'45 , 0'65)
b) Para = 0'01 : (0'42 , 0'68)
3
Estimacin de la varianza de la poblacin :
Estimacin de la desviacin tpica :
(37'236 , 163'578)
(6'102 , 12'790)
4
Estimacin de la media con varianza poblacional conocida. n = 96
5
Estimacin de la media para varianza poblacional desconocida y muestra grande.
Media muestral = 72 ; z = 3'02 ; = 0'00254
x=
Parmetros muestrales :
Media = x = 185'87
Desviacin tpica = s = 9'8986
Desviacin estimada (raz de la cuasivarianza) = s' = 10'246
xi
n
2
x
i x2
s=
n
n 2
2
.s
s' =
n 1
t=
x 185' 87 180
= 2' 2189
=
10' 246
s
15
n
t n 1, .
10'246
10'246
= 180 2'144776.
, 180 + 2'144776.
= ( 174'326 , 185'741)
n
15
15
Decisin :
Como la media muestral (18587) no pertenece a la regin de aceptacin, rechazamos la hiptesis nula,
aceptando as la sospecha establecida en el Centro hospitalario.
2
Un psiclogo educacional considera que el nmero de alumnos que abandonan los estudios es inferior al 15% que se
establece por las autoridades educativas. Para comprobar la certeza de su creencia, selecciona al azar un grupo de
500 alumnos resultando que slo 59 dejaron los estudios.
Podemos aceptar la hiptesis planteada por el psiclogo, con un nivel de significacin del 5% ?.
Contraste paramtrico de la proporcin poblacional.
Hiptesis nula y alternativa :
H0 : 0'15
H1 : < 0'15
Observe que se ha construido la hiptesis alternativa en base a la hiptesis experimental. El rechazo de la
hiptesis nula permitir aceptar lo planteado por el psiclogo.
No sera una incorreccin plantear la hiptesis nula en los trminos H0 : = 0'15 , manteniendo la alternativa
anterior. Es precisamente la hiptesis alternativa la que se debe fijar con sumo cuidado, ya que ella determina la
regin de rechazo del contraste y el tipo : bilateral, unilateral derecho o unilateral izquierdo.
Funcin de decisin :
Proporcin muestral : p = 59/500 = 0'118
El estadstico de contraste se distribuye normalmente, siendo :
z=
.( 1 )
n
= 2' 0039
0' 15 . 0' 85
500
Criterio de decisin :
Nivel crtico de decisin :
Para = 0'05 , z = -1'64
z .
.(1 )
n
.(1 )
015
' .0'85
z .
, + = 015
' 164
' .
, + = ( 01238
'
, + )
n
500
Como la proporcin muestral (0118) se encuentra dentro de la regin de aceptacin, admitimos lo establecido en la
hiptesis nula.
3
Durante los ltimos aos se ha establecido en 1'1 la desviacin tpica de las calificaciones en las pruebas de acceso a
la Universidad.
Ante la sospecha de que en la actualidad ha aumentado la dispersin de las calificaciones, se seleccionan las
correspondientes a 25 alumnos presentados en la ltima convocatoria, resultando como desviacin tpica 1'64.
Con un nivel de significacin del 1%, podemos concluir que aument la dispersin de las calificaciones de las
pruebas de acceso ?.
Contraste paramtrico de la varianza poblacional.
Hiptesis nula y alternativa :
H0 : 2 1'21
H1 : 2 > 1'21
( 1'12 )
2 =
n . s 2 25 . 1' 64 2
=
= 55' 57025
1' 21
2
Criterio de decisin :
Nivel crtico de decisin :
Para = 0'01 , 2, = 42'978516
2 . 12 2 . 22
2 . 2
121
' . 42'978516
= ,
= ( , 2'08)
,
n
n
n
25
Puesto que la varianza muestral (1642 = 26896) queda fuera de la regin de aceptacin, rechazamos la hiptesis nula.
Recordemos que el problema trataba de desviaciones tpicas. Este segundo mtodo nos permite, en este caso, definir la regin de
aceptacin para dicho estadstico (desviaciones tpicas) :
Regin de aceptacin de la desviacin tpica :
( ,
2'08 ) = ( , 144
' )
Puesto que la desviacin tpica muestral 164 no pertenece al intervalo ( - , 144 ) , rechazamos la hiptesis nula.
4
Las calificaciones de 18 alumnos en Psicologa Matemtica (PM) y en Psicologa General (PG) fueron las siguientes :
Alumno
PM
PG
1
6'3
7
2
5'1
6'2
3
3'5
6'5
4
2
4'8
5
8
9'5
6
6'4
6
7
7
5'8
8
5'1
4
9
5
4'5
Alumno
PM
PG
10
8'6
9
11
3
3'8
12
2'5
5
13
4
6'5
14
5'8
7
15
6
5'2
16
8'7
9
17
6
5'8
18
3
4'5
Con una significacin = 0'05 , podemos afirmar que las calificaciones en ambas asignaturas estn igualmente
dispersas ?.
Comparacin de varianzas para observaciones relacionadas.
Hiptesis :
H0 : 12 = 22
H1 : 12 22
Funcin de decisin :
El siguiente estadstico de contraste se distribuye segn una t de Student con = n-2 = 16 grados de libertad :
t=
(s12 s22 ). n 2
2. s1 . s 2 . 1 r 2
x1 = 5'333 ; s1 = 1'9785
x 2 = 6'117 ; s2 = 1'6507
s12 = 2'4708
r=
s12
2' 4708
=
= 0' 7565
s1 . s 2 1' 9785 . 1' 6507
t=
(s12 s22 ). n 2
2. s1 . s 2 . 1 r 2
2
2
(19785
'
16507
'
). 18 2
'
. 16507
'
. 1 0'75652
2 . 19785
= 11140
'
Criterio de decisin :
Nivel crtico de decisin :
Para = 0'05 , t/2, = 2'119900
Al ser -2'1199 < t < 2'1199 , aceptamos la hiptesis nula.
Las calificaciones en Psicologa Matemtica y en Psicologa
General tienen la misma variabilidad.
NOTA :
Ciertos autores establecen, en la funcin de decisin, cuasivarianzas (estimacin insesgada de la varianza) en lugar de
varianzas. Ambas expresiones son correctas, como comprobamos a continuacin :
n 2
n 2
n
. s1
.(s12 s22 ). n 2 (s2 s2 ). n 2
s2 ). n 2
n
n
n
1
1
1
=
= 1 2
=
t=
2
n
n
n
2
2. s'1 . s'2 . 1 r
2. s1. s2 . 1 r 2
.2. s1. s2 . 1 r
. s1.
. s2 . 1 r 2
2.
n 1
n 1
n 1
(s'12 s'22 ). n 2
5
Una academia de conductores desea experimentar sobre la eficacia de un nuevo mtodo de enseanza basado en el
empleo de simuladores. Toma para ello al azar a 28 alumnos utilizando con 16 de ellos el mtodo en
experimentacin y , con los dems, el tradicional.
Finalizado el curso de formacin de conductores, los exmenes dan como resultados :
Alumnos que siguieron el mtodo basado en simuladores :
Media = 6'8
Varianza = 1'4
Alumnos que siguieron el mtodo tradicional :
Media = 5'8
Varianza = 2
Qu podemos concluir sobre la eficacia del nuevo mtodo ?.
NOTA : Realice el correspondiente contraste con niveles de significacin del 10%, 5% y 1%.
Contraste de comparacin de medias (diferencia de medias).
Consideracin importante :
De forma premeditada se ha omitido en el enunciado todo tipo de indicacin sobre las varianzas poblacionales. Como
quiera que el estudio relativo a la comparacin de dos medias, es distinto segn sean iguales o distintas tales varianzas,
deberamos comenzar nuestro problema contrastando tal hiptesis (igualdad de varianzas poblacionales).
En funcin de su aceptacin o rechazo, emplearemos el mtodo que corresponda.
No lo hacemos en este caso, resolviendo el problema en las dos situaciones posibles.
Hiptesis :
H0 : 1 = 2
H1 : 1 > 2
(1 - 2 = 0)
(1 - 2 > 0)
1.- Varianzas de las poblaciones desconocidas y las muestras pequeas de distinto tamao, estableciendo el
supuesto previo de igualdad de varianzas poblacionales ( 12 = 22 ).
Funcin de decisin :
El siguiente estadstico de contraste se distribuye segn una t de
Student con = n1+n2-2 = 26 grados de libertad.
t=
(x 1 x 2 ) ( 1 2 )
n 1 .s 12 + n 2 .s 22 1
1
.
+
n1 + n 2 2
n1 n 2
t=
(x 1 x 2 ) ( 1 2 )
n 1 .s + n 2 .s
1
1
.
+
n1 + n 2 2
n1 n 2
2
1
2
2
6'8 5'8
16.1'4 + 12.2 1 1
.
+
26
16 12
= 1'9602
El planteamiento de las hiptesis nos llevar a rechazar la hiptesis nula si el valor anterior es superior al tabulado.
= 0'10
Se rechaza H0.
El mtodo con simuladores es ms eficaz que el tradicional
t26,0'05 = 1'705617 < 1'9602
Se rechaza H0.
= 0'05
El mtodo con simuladores es ms eficaz que el tradicional
t26,0'01 = 2'478629 > 1'9602
Se acepta H0.
= 0'01
El mtodo con simuladores no puede asegurarse que sea
significativamente ms eficaz que el tradicional.
La disminucin del nivel de significacin (probabilidad de cometer un error de tipo I) aumenta la regin de aceptacin
de la hiptesis nula. Es por ello ms fcil su aceptacin, pero con una inferior significacin del contraste.
2.- Varianzas de las poblaciones desconocidas y las muestras pequeas de distinto tamao, estableciendo el
supuesto previo de que las varianzas poblacionales son distintas ( 12 22 ).
Comenzamos calculando la expresin que determina los grados de libertad :
gl =
s12 s22
+
n1 n 2
s12 s22
n n
2
1
+
n2 + 1
n1 + 1
2
2=
'
2
14
+
16 12
17
2 = 22'97 23
13
Funcin de decisin :
Siendo los grados de libertad calculados inferiores o iguales a 30, el
siguiente estadstico de contraste se distribuye segn una t de
Student con = gl = 23 grados de libertad.
t gl, =
( x1 x2 ) ( 1 2 )
s12
s22
t gl, =
( 6'8 58
' ) ( 0)
+
n1 1 n 2 1
14
2
'
+
15 11
( x1 x2 ) ( 1 2 )
s12
s2
+ 2
n1 1 n 2 1
'
= 19064
El planteamiento de las hiptesis nos llevar a rechazar la hiptesis nula si el valor anterior es superior al tabulado.
= 0'10
Se rechaza H0.
= 0'05
Se rechaza H0.
= 0'01
Se acepta H0.
6
El Ayuntamiento de una ciudad realiza una campaa de informacin sobre la labor desarrollada en los ltimos
aos. Con el fin de analizar la eficacia de la campaa, seleccionamos al azar a 44 ciudadanos, preguntando su
opinin sobre la gestin de los muncipes , al inicio y una vez concluida la misma.
Los resultados de la consulta fueron los siguientes :
Despus
Favor
Contra
Antes
Favor
4
8
Contra
27
5
Con los niveles de significacin del 5% y del 1%, podemos afirmar que ha cambiado la opinin de los ciudadanos
?.
Comparacin de proporciones (diferencia de proporciones). Muestras relacionadas.
Hiptesis :
H0 : 1 = 2
H1 : 1 2
Funcin de decisin :
(1 - 2 = 0)
(1 - 2 0)
Estimacin y Decisin - 155
El estadstico z =
D A
A+D
(1) Antes
De aqu obtenemos :
Favor
Contra
z=
DA
A+D
(2) Despus
Contra
Favor
A=8
B=4
C=5
D = 27
27 8
8 + 27
= 2' 5355
Criterio de decisin :
Al tratarse de un contraste bilateral, rechazamos la hiptesis nula si el estadstico de contraste anterior queda fuera del
intervalo determinado por los niveles crticos z/2 y z1-/2 .
Para = 0'05 :
Siendo 2'58 > 1'96 , rechazamos la hiptesis nula.
Podemos afirmar que existe una influencia significativa de la
campaa en la opinin de los ciudadanos.
Para = 0'01 :
Siendo -2'58 < 2'5355 < 2'58 , aceptamos la hiptesis nula.
No existen diferencias significativas para afirmar que exista
influencia de la campaa en la opinin de los ciudadanos.
7
La aplicacin de un test en el colectivo de profesionales de la enseanza tiene, por experiencias anteriores, una
puntuacin media 55 con varianza 121. Un psiclogo educativo considera que en la actualidad el promedio se
increment, pasando a ser de 60 puntos.
Para contrastar la hiptesis planteada por el psiclogo, se somete al test a 50 individuos en los que se obtiene una
puntuacin muestral media 58.
a) Con un nivel de significacin = 0'01, puede aceptarse el planteamiento del psiclogo ?.
b) Para el nivel anterior, determine la probabilidad del error de tipo II.
c) Qu tamao muestral debe utilizarse para incrementar la potencia del contraste en un 10% ?.
Contraste de la media poblacional. Varianza de la poblacin conocida.
Hiptesis nula y alternativa :
H0 : = 55
H1 : = 60
Funcin de decisin :
a)
z=
x 58 55
=
= 1' 93 ; Valor tabulado : z = z0'01 = 2'33
11
50
n
Aceptamos la hiptesis nula al ser 1'93 < 2'33 ( z < z ), rechazando lo supuesto por el psiclogo.
b)
A partir del nivel de significacin , podemos obtener el nivel crtico y el criterio de decisin :
55
Pr z >
= 0'01
11
50
55
= 2' 33 = 58' 62
11
50
El criterio de decisin es "Aceptamos H0 si la media muestral es inferior a 58'62" , lo cul concuerda con la
conclusin del apartado a) ya que al ser la media muestral 58 < 58'62 nos permite aceptar la hiptesis nula.
Conocido el nivel crtico , estamos en condiciones de calcular :
= Pr (Aceptar H0 / H0 es falsa) = Pr( x > / = 60 ) =
58'62 60
Pr z <
11
50
Determinacin del tamao n, partiendo del valor de y al margen del valor que correspondera para :
= Pr (Aceptar H0 / H0 es falsa) = Pr( x > / = 60 ) =
58' 62 60
= 1' 25
11
n
n=
58'62 60
Pr z <
= 0'1054
11
1' 25 . 11
= 9' 9638 n = 99' 28 99
58' 62 60
n=
2 . z + z
( 0 1 ) 2
121.(2'33 + 1'25) 2
= 62
(55 60) 2
8
Las determinaciones de colesterol en sangre se distribuyen normalmente con media 180 mg./dl. y varianza 450. De
experimentaciones en la zona costera de la provincia de Cdiz se tiene la creencia de que esta cifra media es de 192
mg./dl., por lo que se decide analizar la validez de dicha hiptesis, estableciendo como regla de decisin :
"Se aceptar el promedio 180, establecido como estndar, si la media muestral observada en 80 individuos es
inferior a 187 mg./dl.".
a) Calcular las probabilidades de error de tipo I y de tipo II.
b) Trabajando con un nivel de significacin del 5%, qu tamao muestral se debe tomar ?.
Contraste de la media poblacional. Varianza de la poblacin conocida.
Hiptesis nula y alternativa :
H0 : = 180
H1 : = 192
Funcin de decisin :
n
Estimacin y Decisin - 157
a)
187 180
= Pr ( z > 2'95) = 0'00159
Pr z >
450
80
b)
187 192
= Pr ( z < 2'11) = 0'01743
Pr z <
450
50
n=
2 . z + z
(0 1 )2
Al margen del valor de que correspondera para = 0'05 , y manteniendo el criterio de decisin :
187 180
= 1' 64
450
n=
187 180
= 0'05
Pr z >
450
1' 64 . 450
= 4' 97 n = 24' 7 25
187 180
9
Las calificaciones de la pruebas de acceso a la Universidad para mayores de 25 aos se ajustan a una distribucin
normal N(4'5 , 0'9). El anlisis de los resultados obtenidos en las pasadas convocatorias hacen pensar que el
promedio adecuado es 4.
a) Qu tamao muestral debe utilizarse para que las probabilidades de los errores de tipo I y II sean iguales a
0'06 y 0'08 respectivamente ?.
b) Si, seleccionada una muestra de dicho tamao, se obtiene un promedio 4'2, qu decisin debemos adoptar ?.
Contraste de la media poblacional. Varianza de la poblacin conocida (2 = 0'92 = 0'81).
H0 : = 4'5
H1 : = 4
Funcin de decisin :
a)
z=
se distribuye normalmente.
z = z0'06 = -1'55
z = z0'08 = 1'40
b)
n=
2 . z + z
( 0 1 ) 2
z=
x 4 ' 2 4' 5
=
= 1' 80
0' 9
29
n
Con el nivel de significacin = 0'06 , la tabla de la distribucin N(0,1) proporcion el nivel crtico de decisin :
z = z0'06 = -1'55
Siendo z < z (-1'80 < -155) rechazamos la hiptesis nula, aceptando que la media ms adecuada es 4.
10
Los ingresos mensuales por dietas de desplazamiento de los trabajadores de una empresa, se calcul que tenan
como media 32000 pts. y desviacin tpica 8000.
Si se establece en 35000 el nivel crtico de decisin y seleccionamos muestras de 16 individuos, calcule las potencias
de los contrastes con alternativas sucesivas :
37000
38000
39000
40000
Contraste de la media poblacional. Varianza de la poblacin conocida.
Funcin de decisin :
H0 : = 32000
H1 : = 37000
z=
35000 37000
Pr z <
= Pr ( z < 1) = 0'15866
8000
16
= 1 - = 1 - 0'15866 = 0'84134
H0 : = 32000
H1 : = 38000
35000 38000
Pr z <
= Pr ( z < 1'5) = 0'06681
8000
16
= 1 - = 1 - 0'06681 = 0'93319
H0 : = 32000
H1 : = 39000
35000 39000
Pr z <
= Pr ( z < 2) = 0'02275
8000
16
= 1 - = 1 - 0'02275 = 0'97725
H0 : = 32000
H1 : = 40000
35000 40000
Pr z <
= Pr (z < 2'5) = 0'00621
8000
16
= 1 - = 1 - 0'00621 = 0'99379
Habiendo fijado el criterio de decisin del contraste, lo cul es equivalente a establecer el nivel de significacin o
probabilidad del error de tipo I, al alejar la hiptesis alternativa hacemos que la probabilidad del error de tipo II disminuya.
Al diminuir , la potencia del contraste ( = 1-) aumentar. La grfica de valores sucesivos de recibe el nombre de
"curva de potencia". La construimos a continuacin.
1,05
0,95
0,9
0,85
0,8
37000 38000 39000 40000
11
Los ingresos mensuales por dietas de desplazamiento de los trabajadores de una empresa, se calcul que tenan
como media 32000 pts. y desviacin tpica 8000.
Si se establece en 35000 el nivel crtico de decisin para contrastar la hiptesis con alternativa 38000, calcule las
potencias correspondientes a la seleccin de muestras de tamaos :
10
40
70
100
Contraste de la media poblacional. Varianza de la poblacin conocida.
Funcin de decisin :
H0 : = 32000
H1 : = 38000
z=
n = 10
35000 38000
Pr z <
= Pr (z < 1'19 ) = 0'11702
8000
10
= 1 - = 1 - 0'11702 = 0'88298
H0 : = 32000
H1 : = 38000
n = 40
35000 38000
Pr z <
= Pr (z < 2'37 ) = 0'00889
8000
40
= 1 - = 1 - 0'00889 = 0'99111
H0 : = 32000
H1 : = 38000
n = 70
35000 38000
Pr z <
= Pr ( z < 3'14) = 0'00085
8000
70
= 1 - = 1 - 0'00085 = 0'99915
H0 : = 32000
H1 : = 38000
35000 38000
Pr z <
= Pr ( z < 3'75) = 0'00009
8000
100
=
n = 100
= 1 - = 1 - 0'00009 = 0'99991
Fijando el criterio de decisin del contraste, al aumentar el tamao muestral conseguimos que la probabilidad del error de
tipo II disminuya y, en consecuencia, que el contraste sea ms potente.
12
En una muestra aleatoria de 16 alumnos de 2 de E.G.B. de un determinado Colegio, hemos obtenido una media
igual a 105 en un test de inteligencia. La suma de cuadrados de las puntuaciones diferenciales respecto a la media
result ser igual a 240.
A continuacin, se toma una muestra de 14 alumnas del mismo curso y Centro escolar y se obtiene una media igual
a 102 en el mismo test, y una desviacin tpica insesgada de 3.
Podemos afirmar con un nivel de riesgo del 5% que los alumnos y alumnas de 2 de E.G.B. de ese Centro poseen el
mismo nivel de inteligencia ?.
Contraste relativo a una igualdad de medias poblacionales, en muestras independientes.
Hiptesis :
H0 : 1 = 2
H1 : 1 2
(1 - 2 = 0)
(1 - 2 0)
Al no realizar el enunciado del problema indicacin alguna sobre las varianzas de la poblacin, consideramos el caso ms
amplio : varianzas poblacionales desconocidas y distintas.
Calculemos previamente el valor de los grados de libertad, para lo cul determinaremos antes las varianzas muestrales.
n1 = 16 ;
( x x) 2 = 240
s12 =
( x x) 2
n1
n
1
13
n 2 = 14 ; s'2 = 3 s22 = 1 . s'22 = .9 = 8'357
n1
14
gl =
s12 s22
+
n1 n 2
s12
n
1
n1 + 1
240
= 15
16
15 8'357
16 + 14
2 2
2
8'357
15
s22
14
16
n
+
2
15
17
+
n2 + 1
2
) (
2 = 29'204 29
t gl, =
( x1 x2 ) ( 1 2 )
s12
s22
+
n1 1 n 2 1
( 105 102)
15 8'357
+
15
13
= 2'3406
Para un nivel de significacin del 5%, la tabla t de Student proporciona los valores : t29,005/2 = 2045230.
Dado que el valor calculado 23406 queda fuera del intervalo ( -2045230 , 2045230) , rechazamos la hiptesis nula. En
consecuencia, no podemos admitir que los alumnos y las alumnas del Centro posean el mismo nivel de inteligencia.
13
Un centro que imparte clases de E.G.B. tiene distribuidos a los 55 alumnos de 5 en dos grupos, A y B, de 25 y 30
alumnos respectivamente. Al acabar el curso aprueban 17 alumnos del grupo A y 18 del B.
Con un nivel de confianza del 95%, podemos afirmar estadsticamente que superan el curso el mismo nmero de
alumnos en ambos grupos ?, o bien, es independiente el hecho de superar el curso con respecto al grupo en el que
est ?.
Contraste relativo a una igualdad de proporciones poblacionales, en muestras independientes.
Las proporciones muestrales observadas son :
A ) n 1 = 25 ; p 1 =
17
= 0'68
25
B) n 2 = 30 ; p 2 =
18
= 0'6
30
Hiptesis :
Estimacin y Decisin - 161
H0 : 1 = 2
H1 : 1 2
(1 - 2 = 0)
(1 - 2 0)
Siendo :
n .p + n .p n .p + n .p 1 1
D = 1 1 2 2 .1 1 1 2 2 . +
n1 + n 2 n1 n 2
n1 + n 2
25.0'68 + 30.0'6 25.0'68 + 30.0'6 1 1
.1
. + = 01303
=
'
25 30
25 + 30
25 + 30
la funcin de decisin es :
z =
p1 p 2 0'68 0'6
=
= 0'614
D
01303
'
z = 196.
La tabla normal proporciona, para un nivel de significacin del 5% (confianza del 95%) :
Dado que el valor calculado 0614 pertenece al intervalo ( -196 , 196) , aceptamos la hiptesis nula. En consecuencia,
el curso es superado por el mismo nmero de alumnos en ambos grupos.
14
Un centro escolar tiene matriculados en C.O.U. 250 alumnos, de los que 110 fuman habitual u ocasionalmente.
Tras realizar un cursillo sobre el tema, han decidido dejar de fumar el 60% de los que lo hacan, pero un 10% de los
que no fumaban les ha picado la curiosidad y han comenzado a fumar.
Podemos afirmar, con un nivel de confianza del 95%, que el cursillo ha conseguido el fin que persegua ?.
Hiptesis :
H0 : 1 = 2
(1 - 2 = 0)
Muestras relacionadas
H1 : 1 2
(1 - 2 0)
Disponemos las frecuencias observadas antes y despus del cursillo en la tabla siguiente :
No fuma
Fuma
Antes
Despus
Fuma
No fuma
A=14
B=126
C=44
D=66
58
192
140
110
250
Funcin de decisin :
z =
DA
A+D
66 14
14 + 66
= 5'814
z = 196.
La tabla normal proporciona, para un nivel de significacin del 5% (confianza del 95%) :
Dado que el valor calculado 5814 no pertenece al intervalo ( -196 , 196) , rechazamos la hiptesis nula. En
consecuencia, existe influencia significativa del cursillo en el cambio de hbito de fumar.
15
Diferentes estudios realizados en el campo del procesamiento de la informacin, muestran que las personas
retrasadas la procesan ms lentamente que las personas normales. En esta lnea, queremos averiguar si las personas
retrasadas presentan un tiempo de inspeccin (una medida de la rapidez del procesamiento sensorial) ms largo que
las personas normales, lo que indicara un procesamiento sensorial ms deficiente.
Para ello elegimos una muestra aleatoria de 8 sujetos retrasados y otra de 8 normales. Los tiempos de inspeccin
(TI) de las dos muestras de sujetos son los siguientes :
Retrasados
Normales
150
110
180
120
300
90
240
125
170
122
220
80
280
115
195
95
Suponiendo que las dos distribuciones se distribuyen normalmente y las dos varianzas poblacionales son distintas,
aplique una tcnica paramtrica para someter a prueba la hiptesis de que el TI de las personas retrasadas es ms
largo que el de las normales.
Contraste relativo a una comparacin de medias poblacionales, en muestras independientes.
Hiptesis :
H0 : 1 > 2
H1 : 1 2
Parmetros muestrales :
162 - Estimacin y decisin
(1 - 2 > 0)
(1 - 2 0)
(1) Retrasados
cuadrados
(2) Normales
cuadrados
150
180
300
240
170
220
280
195
= 1735
22500
32400
90000
57600
28900
48400
78400
38025
= 396225
110
120
90
125
122
80
115
95
= 857
12100
14400
8100
15625
14884
6400
13225
9025
= 93759
1735
= 216'875
8
857
= 107 '125
x2 =
8
x1 =
396225
216'8752 = 2493' 36
8
93759
107 '1252 = 244'11
s22 =
8
s12 =
Funcin de decisin :
Se trata de varianzas poblacionales desconocidas y distintas, con muestras pequeas del mismo tamao (n = 8).
t 2 n 2, =
( x1 x 2 ) ( 1 2 )
+
n1
s12
s22
216'875 107'125
2493' 36+ 244'11
81
= 5'55
Nos encontramos ante un contraste unilateral. La hiptesis alternativa (1 - 2 0) establece que el nivel de significacin
() quedar en su totalidad a la izquierda.
El intervalo o regin de aceptacin ser del tipo : ( -t2n-2, , +)
Fijando = 005 y, para 2n-2 = 14 grados de libertad, obtenemos de la tabla t de Student (unilateral) : t14,005 = 1761304
Como 555 pertenece al intervalo ( -1761304 , +) , aceptamos la hiptesis nula. Luego, el TI de las personas retrasadas
es ms largo que el de las normales.
16
Los siguientes datos han sido tomados de una investigacin de Campbell, representando las puntuaciones de 10
sujetos en una escala de impulsividad :
Sujeto
Impulsividad
1
2
2
3
3
4
4
16
5
9
6
2
7
6
8
12
9
2
10
8
Utilizando un nivel de significacin igual a 005, aplique una tcnica paramtrica para contrastar la hiptesis nula
de que la varianza poblacional de las puntuaciones en la escala de impulsividad es igual a 36.
Contraste de la varianza poblacional.
Hiptesis :
H0 : 2 = 36
H1 : 2 36
(Contraste bilateral)
Parmetros muestrales :
Impulsividad (x)
x2
2
4
3
9
4
16
x=
16
256
64
= 6' 4
10
9
81
2
4
s2 =
6
36
12
144
2
4
8
64
= 64
= 618
618
6' 42 = 20'84
10
2n1, =
n. s 2
10 . 20'84
= 5' 789
36
Consultando la tabla de 2 con n-1 = 9 grados de libertad, obtenemos los valores que dejan a derecha y a izquierda un
rea /2 = 0025 . Estos son : 2700439 y 19022827
El intervalo o regin de aceptacin es pues : ( 2700439 , 19022827 ) .
Como el valor obtenido en la funcin de decisin (5789) se encuentra dentro del intervalo ( 2700439 , 19022827 ),
aceptamos la hiptesis de que la varianza poblacional es igual a 36.
2 . 12 2 . 22 36 . 2'700439 36 .19'022827
= ( 9'72 , 68'4828)
,
,
n
10
10
n
Como la varianza muestral (2084) pertenece a la regin de aceptacin de la hiptesis nula (972 , 684828) , mantenemos
que la varianza poblacional es igual a 36.
17
En octubre de 1991 se celebraron unas vistas en el Senado de Estados Unidos sobre un caso de acoso sexual,
presentado por Anita Hill (AH) contra el juez Clarence Thomas (CT) que afectara, o no, su nominacin como juez
del Tribunal Supremo. El juez fue confirmado para el Supremo. El peridico Los ngeles Times ha realizado una
encuesta para analizar qu grupos poblacionales de mujeres creyeron el testimonio de AH. Los resultados obtenidos
fueron los siguientes :
El 32% de las mujeres con estudios superiores (ES) creyeron el testimonio de AH versus un 18% de las que no
tenan estudios superiores (SES).
El 54% de las mujeres que trabajan fuera de casa (T) creyeron el testimonio de AH versus un 44% de las que no
trabajan (NT).
El 60% de las mujeres con categoras profesionales altas (CA) creyeron el testimonio de AH versus un 45% de
las que tenan categoras profesionales bajas (CB).
Asumiendo que las mujeres se seleccionaron al azar, que las observaciones y las muestras son independientes, que el
tamao muestral fue n = 100 en todos los casos y, que el margen de error es del 5%, entre qu pares posibles
existen diferencias significativas ?.
Se trata de tres contrastes sobre igualdad de proporciones.
Hiptesis :
H0 : 1 = 2
H1 : 1 2
(1 - 2 = 0)
(1 - 2 0)
Muestras independientes
Funcin de decisin :
z =
p1 p 2
D
siendo
n1 . p1 + n 2 . p 2 n1 . p1 + n 2 . p 2 1
1
D=
. +
.1
n1 + n 2
n1 + n 2
n1 n 2
Regin de aceptacin :
Para un nivel de significacin = 005, la tabla normal proporciona los valores z = 196. Es decir, aceptaremos que no
existen diferencias significativas si el valor de la funcin de decisin est en el intervalo ( -196 , 196 ).
A) Grupo en funcin de haber cursado o no estudios superiores :
(ES) p1 = 032 ; (SES) p2 = 018 ; n1 = n2 = 100 ; n1.p1 = 32 ; n2.p2 = 18
32 + 18 1
1
32 + 18
.1
.
= 0' 06124
D=
+
100 + 100 100 + 100 100 100
0' 32 018
'
z =
= 2 '286 ( 1' 96, 1' 96) . Existen diferencias significativas.
0' 06124
B) Grupo en funcin de trabajar fuera de casa :
(T) p1 = 054 ; (NT) p2 = 044 ; n1 = n2 = 100 ; n1.p1 = 54 ; n2.p2 = 44
54 + 44 1
1
54 + 44
. 1
.
= 0' 07069
D=
+
100 + 100 100 + 100 100 100
0'54 0' 44
z =
= 1' 415 ( 1' 96, 1' 96) . No existen diferencias significativas.
0' 07069
C) Grupo en funcin de la categora profesional :
(CA) p1 = 060 ; (CB) p2 = 045 ; n1 = n2 = 100 ; n1.p1 = 60 ; n2.p2 = 45
60 + 45 1
1
60 + 45
= 0' 07062
.
. 1
+
D=
100 + 100 100 + 100 100 100
0' 60 0' 45
z =
= 2 '124 ( 1' 96, 1' 96) . Existen diferencias significativas.
0' 07062
18
164 - Estimacin y decisin
Una empresa de transporte de mercancas tiene dos oficinas (A y B) y desean analizar el tiempo de llamadas por
FAX que recibe cada una de ellas con el fin de distribuir los aparatos de acuerdo con el tiempo de utilizacin de los
mismos. Para ello, seleccionaron al azar 7 lneas de FAX en cada oficina y registraron los tiempos de utilizacin en
minutos a lo largo de un da en la tabla siguiente :
Oficina A
Oficina B
120
130
150
160
110
120
200
210
140
170
230
250
170
190
Utilizando un nivel de significacin 001 y suponiendo que las distribuciones son normales :
a) Aplique una tcnica paramtrica para someter a prueba la hiptesis de que las varianzas de los tiempos de
utilizacin del FAX en las dos oficinas son iguales.
b) Basndose en el resultado del apartado anterior, aplique otra tcnica paramtrica para someter a prueba la
hiptesis de que el tiempo medio de utilizacin del FAX es menor en la oficina A que en la B.
a)
(Contraste bilateral)
H 0 : 12 = 22
12
2 = 1
H1: 12 22
12
2 1
2
Parmetros muestrales :
Calculamos las cuasivarianzas a partir de las siete observaciones de la oficina A y la B. Estos clculos conducen a :
x A = x1 = 160
s A2 = s12 = 1600'86
x B = x 2 = 175' 71
s B2 = s 22 = 1767' 34
Funcin de decisin :
Fn1 1, n 2 1, =
s12 22 1867' 67
. =
.1 = 0' 9058
s22 12 2061' 90
Correspondiendo a una F de Snedecor con 6 y 6 (n1-1 y n2-1) grados de libertad, la tabla relativa a
/2 = 001/2 = 0005
(contraste bilateral)
F6,6,0'005 = 11070313
'
1
F6,6,0'005
1
= 0'090332
11070313
'
Al pertenecer 09058 al intervalo (0090332 , 11070313), aceptamos la hiptesis de igualdad de dispersiones (varianzas).
b)
(Contraste unilateral)
H0 : 1 < 2
H1 : 1 2
(1 - 2 < 0)
(1 - 2 0)
Funcin de decisin :
Al ser las varianzas poblacionales desconocidas pero iguales (segn el apartado anterior), las muestras independientes y de
tamao pequeo, la funcin de decisin es :
t n1 + n 2 2, =
( x1 x 2 ) ( 1 2 )
n 1 . s12
+ n 2 . s 22
1
1
+
.
n1 + n 2 2
n1 n 2
160 175' 71
7.1600'86 + 7.1767' 34 1 1
.
+
7+ 7 2
7 7
= 0' 663
Al tratarse de un contraste unilateral la significacin =001 quedar en su totalidad a la derecha (alternativa : 1 - 2 0).
La tabla t de Student, para 12 grados de libertad (7+7-2), proporciona :
t12,001 = 2680955.
Puesto que el valor -0663 de la funcin de decisin se encuentra en el intervalo (- , 2680955) , de aceptacin de la
hiptesis nula, concluimos que el tiempo medio de utilizacin del FAX es menor en la oficina A que en la B.
19
Estimacin y Decisin - 165
Garriga-Trillo, Gonzlez-Labra, Villarino, Lubn, Garca-Gallego & Arnau (1994) y Baird & Harder (1994)
realizaron un estudio comparativo entre una muestra espaola (E) y otra estdounidense (EU), considerando
variables de tipo psicofsico (entre ellas la sensibilidad visual). En ambos casos se utiliz una muestra aleatoria
simple de 50 sujetos. Al analizar los datos se encontr que la variabilidad, medida por la desviacin tpica insesgada,
de las puntuaciones en sensibilidad visual (S) en E fue de 02 y en EU de 03. Asumiendo la normalidad de las
puntuaciones en sensibilidad visual en ambas poblaciones, se quiere contrastar si la variabilidad en EU es realmente
superior a la de E. Para ello, conteste :
a) Cul es la hiptesis nula y cul la alternativa ?.
b) Elija el estadstico a utilizar, justificando su eleccin, para contrastar si existen diferencias significativas en la
variabilidad de las puntuaciones en sensibilidad visual.
c) Calclelo y determine la probabilidad aproximada (p) de obtener ese valor o uno menor.
d) Utilizando ese valor p como nivel de significacin, interprete el resultado obtenido en el contexto de la
investigacin.
a)
H 0 : 2E < 2EU
2E
2 < 1
EU
H1: 2E 2EU
2E
2 1
EU
b)
Nos encontramos ante un contraste relativo a la comparacin de dos varianzas en dos muestras independientes. El
estadstico de contraste es :
Fn 1 1, n 2 1, =
s12 22
.
s22 12
(E = 1 ; EU = 2 )
c)
Sustituyendo los valores muestrales en la funcin de decisin anterior, obtenemos :
F=
Calculemos la probabilidad :
0' 22
0' 32
= 0' 444
F = 1607300
F = 1762207
F = 1'962646
F = 2113037
rea = 1- = 095
rea = 1- = 0975
rea = 1- = 099
rea = 1- = 0995
F = 1/1607300 = 0622161
F = 1/1762207 = 0567470
F = 1/1'962646 = 0509516
F = 1/2113037 = 0473252
El valor ms prximo a 0444 lo encontramos en 0473252, el cul deja a su derecha un rea 0995, luego dejar a su
izquierda un rea 0005 que es la probabilidad pedida :
2EU
2E
>1
La hiptesis nula pudo haber sido planteada en la forma que indica la expresin de la izquierda.
En este caso, el estadstico F de contraste habra tomado el valor :
0'32
F=
= 2'25
0'2 2
Con ello, el clculo de la probabilidad p, habra considerado el valor tabulado 2113037 como ms prximo
(rea a la derecha = 0005), dando como resultado :
p = Prob( F49,49 225) 0995
(1 - = 1 - 0005)
Para el apartado d), resultara inapropiado tomar un nivel de significacin = p = 0995. La lgica nos
debe llevar a tomar su complemento a la unidad; es decir : = 1 - p = 0005
20
166 - Estimacin y decisin
Se desea estudiar la eficacia de determinada terapia para el control de la agresividad. Para ello, se seleccion una
muestra aleatoria de 7 sujetos violentos y se les aplic una escala de agresividad (pretest). Posteriormente se les
trat durante unos meses con dicha terapia y, a continuacin, se les volvi a pasar la escala de agresividad (postest).
Aqu aparecen las medidas pretest y postest obtenidas :
Pretest
Postest
30
10
34
25
50
36
40
22
25
20
28
19
46
30
a) Sabiendo que las puntuaciones en la escala de agresividad son una variable continua y que las n diferencias
(medida pretest menos medida postest) son independientes y se distribuyen normalmente, cul es el contraste
ms apropiado para comprobar la eficacia de la terapia ?. Razone su eleccin, formule las hiptesis estadsticas,
aplique dicho contraste utilizando un = 001, e interprete el resultado.
b) Sabiendo que las varianzas sesgadas de las medidas pretest y postest fueron, respectivamente, 7669 y 5955, y
que la correlacin entre las dos series de puntuaciones es rpre-pos = 082, contraste si existe homogeneidad entre
los resultados obtenidos en las dos medidas. Formule las hiptesis, aplique el estadstico ms adecuado
utilizando un = 005, e interprete el resultado.
a) Comparacin de medias (varianza de la diferencia desconocida)
Hiptesis :
H0 : 1 > 2
H1 : 1 2
(1 - 2 > 0)
(1 - 2 0)
30
10
34
25
50
36
40
22
25
20
28
19
46
30
Diferencia (d)
d2
20
400
9
81
14
196
18
324
5
21
9
81
16
256
D=
91
= 13
7
sD =
1359
132 = 5'014
7
s' D =
= 91
= 1359
7
.5'014 = 5'416
7 1
Funcin de decisin :
Puede calcularse a partir de la varianza o de la cuasivarianza muestral, siendo el estadstico de contraste :
t n 1, =
t n 1, =
( x1 x 2 ) ( 1 2 )
sD
n 1
13
= 6'351
5'014
7 1
( x 1 x 2 = D)
D ( 1 2 )
13
=
= 6'351
5'416
s' D
7
n
t7-1,005 = 1942911
El contraste unilateral, con alternativa 1 - 2 0 , dejar el nivel de significacin a la izquierda. El intervalo o regin de
aceptacin ser : ( -1942911 , +).
Aceptamos la hiptesis nula, de que las puntuaciones pretest son superiores a las postest (eficacia), al pertenecer 6351 a la
regin de aceptacin ( -1942911 , +).
b) Comparacin de varianzas (muestras relacionadas).
El trmino ser igualmente homogneas representa tener la misma dispersin.
Hiptesis :
H 0 : 12 = 22
12
2 = 1
H1: 12 22
12
2 1
2
Funcin de decisin :
Necesitamos calcular las varianzas muestrales de las dos series (pretest y postest). Los resultados son :
Con esto :
t n 2, =
(s12 s22 ). n 2
2. s1. s2 . 1 r
(76' 69 59'55). 7 2
2.76' 69.59 '55. 1 0'82 2
= 0' 495
t7-2,005 = 2570796
Aceptamos la hiptesis de igualdad de varianzas de las puntuaciones pretest y postest, al pertenecer 0495 a la regin de
aceptacin : ( -2570796 , 2570796 ).
21
En un estudio sobre los efectos de la contaminacin de una sustancia qumica en malformaciones congnitas, se
encontr que el 20% de una muestra aleatoria simple de 90 nios nacidos de madres expuestas accidentalmente a
esa sustancia nacieron sin la mano izquierda, mientras que en una muestra aleatoria simple de 90 nios nacidos de
madres no expuestas, el 5% nacieron sin esa mano. Asumiendo que las poblaciones son dicotmicas y que las
observaciones son aleatorias e independientes, conteste :
a) Podramos afirmar que a nivel poblacional existen diferencias en el nmero de malformaciones entre los hijos
de madres expuestas a esa sustancia qumica y los hijos de las no expuestas ?. Formule las hiptesis nula y
alternativa, contraste la hiptesis nula tomando un = 005, e interprete el resultado.
b) Calcule el intervalo de confianza para la diferencia entre los parmetros poblacionales e interprete el resultado.
a) Contraste sobre igualdad de proporciones.
Hiptesis :
H0 : 1 = 2
H1 : 1 2
(1 - 2 = 0)
(1 - 2 0)
Muestras independientes
Funcin de decisin :
z =
p1 p 2
D
siendo
n1 . p1 + n 2 . p 2 n1 . p1 + n 2 . p 2 1
1
D=
. +
.1
n1 + n 2
n1 + n 2
n1 n 2
Regin de aceptacin :
Para un nivel de significacin = 005, la tabla normal proporciona los valores z = 196. Es decir, aceptaremos que no
existen diferencias significativas si el valor de la funcin de decisin est en el intervalo ( -196 , 196 ).
p1 = 02 ; p2 = 005 ; n1 = n2 = 90 ; n1.p1 = 18 ; n2.p2 = 45
1
18 + 4'5 18 + 4'5 1
.1
. + = 0'0493
D=
90 + 90 90 + 90 90 90
0'2 0'05
z =
= 3'0426 ( 1'96 , 1'96) . Rechazamos la hiptesis nula.
0'0493
A nivel poblacional, existen diferencias en el nmero de malformaciones entre los hijos de madres expuestas a la sustancia
qumica y los hijos de las no expuestas.
b) Intervalo de confianza :
( 0'053 , 0'247)
Con un margen mximo de error del 5% podemos afirmar que, a nivel poblacional, la diferencia en el nmero de
malformaciones entre los hijos de madres expuestas a la sustancia qumica y los hijos de las no expuestas, est
comprendida entre el 53% y el 247%.
22
En la enseanza de idiomas se siguen dos mtodos; uno tradicional y otro basado en el empleo continuado de
sistemas audiovisuales. Para comparar la eficacia de ambos, se seleccionaron al azar 7 alumnos que recibieron
enseanza con el mtodo tradicional y otros 7 con el segundo mtodo. Aplicada una prueba comn, se obtuvieron las
puntuaciones siguientes :
Mtodo 1
Mtodo 2
7
6
5
8
3
5
5
9
2
7
6
8
4
6
Utilizando un nivel de significacin 001 y suponiendo que las distribuciones son normales :
a) Aplique una tcnica paramtrica para contrastar la hiptesis de que las varianzas de las puntuaciones de la
prueba en las dos poblaciones de alumnos, definidas en funcin del mtodo de enseanza seguido, son iguales.
b) Contraste la hiptesis anterior, suponiendo que sabemos que la puntuacin poblacional media que ofrece la
prueba en alumnos que siguen el mtodo tradicional es de 55 puntos, siendo de 68 puntos la obtenida en el
segundo colectivo.
168 - Estimacin y decisin
a)
(Contraste bilateral)
12
2 = 1
H 0 : 12 = 22
H1: 12 22
12
2 1
2
Parmetros muestrales :
Calculamos las medias, varianzas y cuasivarianzas a partir de las siete observaciones de cada muestra. Estos clculos
proporcionan los resultados siguientes :
x1 = 4 '57
s12 = 2 '53
s'12 = 2 '95
x2 = 7
s22 = 171
'
s'22 = 2
Funcin de decisin :
Fn1 1, n 2 1, =
s12 22 2 '95
. =
.1 = 1475
'
2
s22 12
Correspondiendo a una F de Snedecor con 6 y 6 (n1-1 y n2-1) grados de libertad, la tabla relativa a
/2 = 001/2 = 0005
(contraste bilateral)
proporciona los valores tabulados (lmites del intervalo de aceptacin de la hiptesis nula) :
F6,6,0'005 = 11' 07
1
F6,6,0'005
1
= 0' 09
11' 07
Fn1 1,n2 1,
2
2 '53 + ( 4 '57 55
' )
171
' + ( 7 6'8)
.1 = 19399
'
Dado que 19399 pertenece al intervalo (009 , 1107), aceptamos la hiptesis de igualdad de dispersiones (varianzas).
2
Se sabe, por experiencias de cursos anteriores, que el nmero medio de faltas de ortografa en ejercicios de comentarios
sobre textos filosficos es de 5 faltas.
Calificado un grupo aleatorio de 82 alumnos, se observ que el nmero medio de faltas era de 2'8 con desviacin tpica 1'3.
Puede admitirse que el promedio de faltas ortogrficas ha disminuido, con una significacin del 1% ?.
3
Un psiclogo social realiza un estudio sobre el racismo, manteniendo la creencia de que el comportamiento en zonas
urbanas y rurales es distinto. Sus experiencias en ambos grupos le llevan a concluir que entre los habitantes de ncleos
urbanos hay un 20% ms de personas con sentimientos racistas que en zonas rurales.
Con un nivel de significacin = 0'05 , justifique si es aceptable la afirmacin del psiclogo, partiendo de las
observaciones muestrales siguientes :
- de un grupo de 40 habitantes de zonas urbanas, 17 se consideran racistas
- de otro de 32 habitantes en zonas rurales, pueden considerarse racistas a tan slo 5.
4
En la Escuela Universitaria de Formacin del Profesorado se imparte la asignatura de Informtica, comn a las
especialidades de Ciencias y Filologa.
Sabiendo que las calificaciones de ambos grupos de alumnos estn igualmente dispersas y que en un grupo de 12 de la
especialidad de Ciencias se obtuvo una nota media de 6'8 puntos con varianza 4 y, en otro de 10 de Filologa la media fue
de 4'5 puntos con varianza 3'6, puede afirmarse que existe una diferencia significativa entre las calificaciones ?.
Realice el correspondiente contraste para los niveles de significacin del 5% y del 1%.
5
Para el contraste de la hiptesis de que la media poblacional es igual a 20 frente a la alternativa de que su valor es 28, se
selecciona una muestra aleatoria de tamao 15 en la que se calcula un promedio 25 con desviacin tpica 4'1.
a) Con una significacin mxima del 5%, contraste la hiptesis planteada.
b) Determine la probabilidad de aceptar la hiptesis nula en el supuesto de no ser cierta.
c) Qu tamao muestral debemos tomar para que las probabilidades de los errores de tipo I y II sean 0'002 y 0'005 ,
respectivamente ?.
6
Partiendo de muestras aleatorias de 50 individuos se establece como criterio de aceptacin del promedio poblacional = 5
frente al alternativo = 6 que , para ello, la media muestral observada sea inferior a 5'6.
Si se admite que la varianza poblacional es igual a 2 :
a) Determine las probabilidades de los errores de tipo I y II.
b) Para que el nivel de significacin sea del 1%, qu tamao muestral debe tomarse ?.
2
Media con varianza de la poblacin desconocida y muestra grande.
H0 : 5 ; H1 : < 5
z = -15'231 ; z = -2'33 ; El promedio ha disminuido.
3
Diferencia de proporciones con 1 - 2 0 .
H0 : 1 - 2 = 0'2 ; H1 : 1 - 2 0'2
p1 = 0'425 ; p2 = 0'15625
D = 0'461 ; z = 0'1491 ; z/2 = 1'96 ; Se admite la hiptesis del psiclogo.
4
Diferencia de medias con varianzas poblacionales desconocidas pero iguales (muestras pequeas).
H0 : 1 - 2 = 0 ; H1 : 1 - 2 0
t = 2'6211
= 0'05 ; t20,0'05 = 2'0860 ; Existe una diferencia significativa entre las calificaciones.
= 0'01 ; t20,0'01 = 2'8453 ; No hay diferencia significativa entre las calificaciones.
5
Media con varianza de la poblacin desconocida y muestra pequea.
H0 : = 20 ; H1 : = 28
a)
t = 4'56 ; t14,0'05 = 1'7613 ; Se rechaza la hiptesis nula = 20 .
b)
inferior a 0005
c)
Estimacin puntual de la varianza de la poblacin = Cuasivarianza muestral = 18'011
z = 2'88 ; z = 2'58 ; n = 8'39 8 .
6
Media con varianza poblacional conocida.
H0 : = 5 ; H1 : = 6
a)
= Pr(z > 2'97) = 0'00149 ; = Pr(z-1'98) = 0'02385
b)
Para el valor calculado en a) :
z = 2'33 ; z = 1'98 ; n = 37'15 37 .
Independientemente del valor :
n = 30'16 30 .