Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Introduccin:
Si se examina el 100% de una poblacin, la hiptesis podra ser probada sin error,
pero trabajar con el 100% de la poblacin no es posible por razones de tiempo y
de costo.
1
H0: Hiptesis nula: = 0 y otra de la forma
2
Estado de la DECISION
naturaleza No rechazar H0 Rechazar H0
H0 es verdadera Correcta Error tipo I
H0 es falsa Error tipo II Correcta
Ejemplo1:
Basndose en muestras un fabricante de productos farmacuticos tiene que
decidir si el 90% de todos sus pacientes a quienes les da un nuevo medicamento
se recuperaran de cierta enfermedad. Supngase que el fabricante del nuevo
medicamento desea probar la hiptesis nula de 0 = 0,90 contra la hiptesis
alternativa 1 = 0,60 . La estadstica de prueba es x, el nmero observado de
acierto es n = 20, y aceptar la hiptesis nula si x 15 ; de lo contrario, concluir
que aceptar 1 = 0,60 . Evalu y
Solucin:
La regin de no rechazo de H0 est dada por x = 15, 16, 17, 18, 19, 20, entonces
la regin de rechazo o critica est dada por x = 0, 1,...,14. Por lo tanto se tiene
que:
= P (error tipo I)
=0,0114
=P ( x<15;1 = 0,60 )
= 0,1255
3
Para explicar la terminologa, consideremos una situacin en la cual se desea
probar la hiptesis nula H0: H0 : = 0 contra la hiptesis alternativa bilateral
H1: 0
4
La situacin grafica para un ensayo unilateral izquierdo es:
5
Plan de Docimasia
Ejemplo2:
Supongamos que por experiencia se sabe que la desviacin estndar del peso de
ciertos paquetes de galletas, hechas por una pastelera, es de 16 gramos.
Para cerciorarse de que la produccin est bajo control en un da dado, es decir,
para verificar si el peso promedio real de los paquetes es de 80 gramos, se
selecciona una muestra al azar de 25 paquetes y se encuentra que su peso medio
es 81,12 gramos.
Probemos la H0 : = 80grs. . Contra la alternativa H1: 8 0gr., si = 0,01
4) Estadstica de trabajo:
6
Como:
x = 81,12
0 = 81,12
= 16
n = 15
x 0
Z=
n
Se tiene que:
81,12 80
Z obs = = 0,35
16
25
Z = Z.99 = 2,575
2
7
6) Evaluacin de la estadstica
7) Conclusin e interpretacin
8
prueba cuando la hiptesis nula es verdadera. Es as como el valor de P acarrea
mucha informacin sobre el peso de la evidencia con H0 de modo que el
investigador pueda llegar a una conclusin para cualquier nivel de significancia
especificado.
Definicin:
El valor de P es el nivel de significancia ms pequeo que conduce al
rechazo de la hiptesis nula.
Ejemplo:
Consideremos el ejemplo de las galletas. El valor de Z Obs. = 0,35 y como la
hiptesis alternativa es de dos colas, el valor de P es:
9
2.2 Varianza desconocida
Ejemplo 3:
Se sabe que el valor medio de protrombina en la poblacin normal es de
aproximadamente 20 mg./100 ml de plasma. Una muestra de 635 pacientes con
deficiencia de vitamina K presenta un nivel medio de protrombina de
19,50 mg /100 ml. La desviacin estndar de la muestra es 4 mg /100 ml. Tienen
los pacientes con deficiencia de vitamina K un nivel significativamente ms bajo de
protrombina que la poblacin general?
H0 : = 0 = 20mgs.
H1 : < 20
x 0
TObs =
S
n
19,5 20
Tobs. = = 3,125
4
625
10
Que tendr bajo H0, distribucin muestral t624
De todo lo anterior resulta que nuestra regin de rechazo (de H0) es:
R = {T / T < t crit }
Con
11
2.3 Pruebas concernientes a diferencias entre medias
Ejemplo 4:
Supngase que se miden los contenidos de nicotina de dos muestras de
cigarrillos. Si en un experimento de 50 cigarrillos de la marca A tuvieron un
contenido de nicotina en promedio x1 = 2,61 miligramos con una desviacin
estndar de 1 = 0,12 miligramos, mientras que 40 cigarrillos de la marca B
tuvieron un contenido de nicotina en promedio de x 2 = 2,38 con una desviacin
estndar de 2 = 0,14 miligramos, pruebe la hiptesis:
Z Obs =
( x x ) ( )
1 2 1 2
21 2 2
+
1 n2
n
Z Obs =
(2.61 2.38) 0.2 = 1.08
0.12 2 0.14 2
+
50 40
12
El valor critico de Z = 1,96 . Bajo H0 la distribucin es normal.
2
Ejemplo 5:
En un estudio de angina de pecho en ratas, se dividi aleatoriamente a 18
animales afectados en dos grupos de 9 animales cada uno. A un grupo se le
suministro un placebo y al otro un frmaco experimental FL113. Despus del
ejercicio controlado sobre una rueda de andar, se midi el tiempo de recuperacin
de cada rata. El FL113 reducir el tiempo medio de recuperacin? Se dispone de
la siguiente informacin.
Solucin:
=
(
2n1 1)S 21 + (n2 1)S 2 2
(n1 + n2 2)
2) Nos interesa docimar
H 0 : 1 = 2 o H 0 : 1 2 = 0
13
H 1 : 1 > 2 o H 1 : 1 2 > 0
3) Tenemos que = 0,05
TObs =
(x x ) ( )
1 2 1 2
1 1
+
n1 n2
TObs =
(x x )
1 2
1 1
+
n1 n2
8 452 + 8 432
= = 44
18 2
14
Luego, se tiene que:
329 238
TObs = = 4,39
1 1
44 +
9 9
Ejemplo 6:
El director de un consultorio cree que en la comunidad que debe atender hay un
grado de satisfaccin de a lo menos un 75%. El subdirector encuesta a 120
usuarios, aleatoriamente seleccionados, de los cuales 80 se declaran satisfechos.
Confirma o no este resultado la opinin del director?
Solucin:
3) Sea = 0,05
15
p P
Z=
P (1 P )
n
Sabemos que Z tiene, bajo la hiptesis nula, una distribucin normal estndar
5) Regin critica R = {T / T < Z crit } con Z crit. = -1,645. Por ser una prueba unilateral
80
6) Ya que p = = 0,67
120
0, 67 0, 75
Z Obs = = 2, 02
0, 75 0, 25
120
16
3.1 Ensayos de diferencias de proporciones
Ejemplo 7:
En una muestra de 50 hogares de cierta comunidad arroja que 10 de ellos se
encuentran bajo la lnea de pobreza. En una segunda comunidad, 15 hogares de
una muestra aleatoria de 50 se encuentran bajo la lnea de pobreza. Probemos la
hiptesis de que la proporcin de todos los hogares en las dos comunidades no
difiere con = 0,01
Solucin:
1) Sea X: La proporcin de hogares total de las dos comunidades que estn bajo
la lnea de pobreza.
p 1 p 2
Z Obs =
P (1 P ) P (1 P )
+
n1 n2
n1p1 + n2 p 2
P=
n1 + n2
Donde:
17
X1 X2
p 1 = y
p 2 =
n1 n2
y p
p son las proporciones muestrales
1 2
ZCrit = 2,58
6) Evaluacin de la estadstica
10
p 1 = = 0,20 . Proporcin de la muestra uno
50
15
p 2 = = 0,30 . Proporcin de la muestra dos
50
50 0, 20 + 50 0,30
P = = 0, 25 . Proporcin combinada poblacional
50 + 50
P (1 P ) P (1 P )
p p = + : Desviacin de la diferencia de proporciones
1 2
n1 n2
18
Entonces, tememos que:
0.20 0.30
Z Obs = = 1,15
0.087
i) x y S2 son independientes
(n 1) S 2
=2
Ejemplo 8:
Para juzgar ciertas caractersticas de seguridad de un automvil, un inspector
debe saber si el tiempo de reaccin del conductor ante una situacin de
emergencia determinada tiene una desviacin estndar de 0,010 segundos o si
sta es mayor que 0,010 segundos. Qu puede concluir en el nivel 0,05 de
significancia, si se obtiene que s = 0,014 segundos para una muestra aleatoria de
n = 15?
19
Solucin
H0 : = 0,010
H1 : > 0,010
= 0,05
(n 1) S 2 14(0,014) 2
2
= = = 27, 44
Obs .
2 0,0102
crit
2
= .95,14
2
= 23,7
Por lo tanto, como Obs > Crit se rechaza la hiptesis nula, es decir, el inspector
2 2
puede concluir que la desviacin estndar del tiempo de reaccin del conductor en
la situacin de emergencia es mayor que 0,010 segundos.
S 21 S 22
F= 2 o F= 2
S 2 S 1
20
Se puede elegir cualquiera que sea mayor
Ejemplo 9:
Al medir las capacidades lectoras de dos grupos de estudiantes, se tiene que
S 21 = 63,45 y S 2 2 = 42,65 para dos muestras aleatorias independientes de tamao
n = 5. Usemos el nivel de significancia 0,02 para probar si hay alguna evidencia de
que las desviaciones estndar de las poblaciones de las que se efecta el
muestreo no son iguales.
Solucin:
Ho: 1 = 2
H1 : 1 2
S 21
Dado que S 2
1 es mayor que S 2
2 se elige F = 2 y, sustituyendo se tiene
S 2
que:
S 21 63,45
FObs = 2 = = 1,49 .
S 2 42,65
Con v1 = 5-1 = 4 y v2 = 5 1 = 4
F.99,4,4 = 16
Por lo tanto, como FObs no es mayor que Fcrit. , no se rechaza la hiptesis nula
21
5.0 La prueba Chicuadrado: 2
a) Prueba de Asociacin
b) Prueba de Homogeneidad
Ejemplo 10:
En un estudio de Rothman y Sller (1972), se presenta la tabla anexa que muestra
la distribucin de casos de cncer bucal y controles adecuados, segn consumo
de cigarrillos por da. Evaluemos a partir de esa informacin, la posible asociacin
entre ese tipo de cncer y el hbito de fumar (cigarrillos/da).
22
Grupo Categora fumador Total
Cncer Nulo Liviano Mediano Excesivo
0 1 - 19 20 - 39 40 o ms
Caso 26 (57,65) 66 (84,65) 248 (231,11) 143 (109,58) 483
Controles 85 (55,35) 97 (78,34) 197 (213,89) 68 (101,42) 447
Total 111 163 445 211 930
Docimar:
E11 483
= E11 = 57,65
111 930
Si no hay asociacin entre ambas variables, la distribucin de frecuencias relativas
observadas en le primer grupo se repetira en el segundo. Por ello, las frecuencias
Oij coincidiran con las frecuencias esperadas Eij celda por celda y una
estadstica como
A = ( Oij Eij ) = 0
2
23
f c ( O E )2
2Obs =
ij ij
i =1 j =1 Eij
2 ( f 1)(c 1)
{ }
R = T / T > 2 ( 3;0.95) De donde
.95,3
2
= 7,815
La situacin grafica es:
24
Obs
2
= 68,469
Ejemplo 11:
Es la proporcin de enfermos de Sida la misma en las regiones V, VII y
Metropolitana del pas?
Si no se rechaza H0 que afirma que existe Homogeneidad, significa que del punto
de vista de la morbilidad del Sida, las tres regiones constituyen una sola poblacin.
En caso de rechazar H0, se dice que no existe homogeneidad entre las
poblaciones
Se tienen K poblaciones de las cuales se escoge una muestra aleatoria
independiente de tamaos n1 ,..., nk respectivamente, no necesariamente de igual
tamao, para ser clasificados en h categoras de una variable
25
Categoras Poblaciones
p1 p2 ...........pj ........pk
c1 x11 x12 ...........x1j ........p1k x1
. . . . . .
. . . . . .
. . . . . .
. . . . . .
Cn xn1 xn2 .................xnj ..............xnk
xn
n1 n2 nj nk n
Tamaos de la muestra
xi
pi = Probabilidad de que una observacin quede clasificada en la categora (i)
n
Planteamiento de hiptesis
f c (O E ) 2
2Obs =
ij ij
i =1 j =1 Eij
26
Ejemplo 12:
En un rea hospitalaria se tom una muestra aleatoria de 115 profesionales, 110
administrativos y 125 auxiliares, para determinar con un 5% de significacin, si la
opinin de los tres estamentos difiere en cuanto a una nueva poltica de sueldos.
Cada persona deba optar por responder: a favor, en contra, indiferente.
= 0,05
2
=
(80 72,61)
2
+
(72 69,46 )
2
+ ... +
(25 22,14 )
2
= 8,97
Obs
72,61 69,46 22,14
Por lo tanto, como el valor observado es menor que el valor critico no se rechaza
la hiptesis nula.
27
5.3 Prueba de bondad de ajuste
Ejemplo13:
Segn una de las leyes de Mendel, el cruzamiento entre pollos normales y rizados
extremo, debe producir en la segunda generacin (F2) pollos rizados extremo,
rizado suave y normal en la proporcin 1: 2: 1.
Si en un cruce, se obtuvo en la segunda generacin 23 rizado extremo, 50 rizado
suave y 20 normal, se podra decir que esta distribucin es la dada por Mendel?
Solucin:
Las hiptesis son:
28
La estadstica de prueba es:
f c (O E ) 2
2Obs =
ij ij
i =1 j =1 Eij
Fenotipo Frecuencias
O E
Rizado extremo 23 93/4 = 23,25
Rizado suave 50 93/2 =46,50
Normal 20 93/4 = 23,25
Total 93
Crit . =
2
+ + = 0, 6449
23, 25 46,50 23, 25
.99,2
2
= 9,21
Como obs < crit se concluye que no se rechaza la hiptesis nula, es decir,
2 2
no hay evidencia para suponer, que la distribucin de los fenotipos sea diferente
de 1: 2: 1
29
6.0 Inferencia y dcimas concerniente a una recta de regresin
Tabla 6.1
Estudiante Horas Notas
Estudio
X Y
1 5 3
2 6 3
3 6 4
4 7 5
5 8 4
6 9 6
7 10 6
8 10 5
= 61 = 36
y = 0 + 1 x
La estadstica de prueba se define como:
30
b1 ( 1 )0
tObs = .
Sb1
Donde
Sy/ x
Sb1 =
X 2
n ( x ) 2 .
b1
tObs =
Sb1
b1 t (1 / 2 ),v S b1
31
Ejemplo 14:
Usemos la recta de regresin correspondiente a la tabla 6.1. De esta informacin
se tiene lo siguiente:
y = 36
xy = 288
x 2
= 491
y 2
= 172
Solucin
H 0 : 1 = 0
H1 : 1 0
Sy/ x 0.7020
Sb1 = = = 0,1380
X 2
n( x ) 2
491 8(7.625) 2
32
Luego:
b1 0.522
tObs = = = 3.7826
Sb1 0.1380
Por lo tanto, como tobs > t crit se rechaza la hiptesis nula y se concluye que
existe una relacin significativa entre las horas de estudio y las notas
Ejemplo 15:
Respecto al ejemplo 14, probar que la pendiente de la poblacin es negativa.
Usando = 0,05
Solucin:
Las hiptesis son:
H 0 : 1 0
H1 : 1 > 0
b1 0.522
tObs = = = 3.7826
Sb1 0.1380
Por lo tanto, como t Obs > t Crit se rechaza la hiptesis nula, es decir, la
pendiente de la lnea de regresin poblacional es positiva y existe una relacin
directa entre las horas de estudio y las notas
Ejemplo 16:
Del ejemplo 14 determinar un intervalo de confianza del 95% para 1
Solucin:
Como b1 = 0.522 y v = 8 2 = 6
33
El intervalo de confianza pedido esta dado por:
= b0 + b1 x
Con base en los datos muestrales, el error estndar de la media condicional vara
de acuerdo con el valor designado x:
S yx = S y / x
1
+
(x x )2
n ( x )2
x 2 n
34
y t (n 2 ) S yx
Ejemplo 17:
Utilizar lo datos del ejemplo 14 para construir un intervalo de confianza del 95% si
X = 8.5 horas
Solucin:
Como = b0 + b1 x
Entonces, se tiene:
x 2
= 491
( x)
2
= (61) 2 = 3721
n=8
S y / x = 0.7020
35
1 (8.5 7.625) 2
S yx = 0.7020 + = 0.2760
8 3721
491
8
y t (n2 ) S yx
Luego sustituyendo se tiene que el intervalo de confianza pedido est dado por:
Por lo tanto, se estima que la nota promedio para 8.5 horas de estudio esta entre
5.6352 y 4.2828 con una confianza del 95%
S Y ( siguiente ) = S 2 Y . X + S 2 Y . X
36
SY ( siguiente ) = SY / X
1
1+ +
(x x ) 2
n ( x)
2
X 2
Y tObs SY ( siguiente )
Ejemplo 18:
Utilizar los datos del ejemplo 14 y determinar el intervalo de prediccin del 95%
para 8.5 horas de estudio
Solucin
SY ( siguiente ) = SY / X
1
1+ +
(x x ) 2
n ( x ) 2
X 2
n
Se tiene:
1 ( 8.5 7.625 )
2
37
Dado que Y = 0.522 + 0.522 X y X = 8.5, entonces se tiene que:
b1 0.522
tObs = = = 3.7826
Sb1 0,1380
38
Ejemplo 7:
En la tabla siguiente se consignan los datos aportados por una organizacin sobre
la calidad del aire (x) y la enfermedad pulmonar (y)
Probar que no hay correlacin en los datos ordenados por rangos de todas las
ciudades del mundo? Utiliza = 0,05
Solucin:
6 58
rs = 1 = 0, 73636
11(112 1)
Por lo tanto, se rechaza la hiptesis nula, es decir, existe asociacin entre los
niveles de calidad del aire y la incidencia de la enfermedad pulmonar
39
Si el tamao de la muestra es mayor que 30, la distribucin de muestreo de rs es
aproximadamente normal con:
rs = 0
1
rs =
n 1
Ejemplo 8:
Un psiclogo intenta averiguar si las personas inteligentes tienden a elegir
cnyuges que tambin lo sean. Se selecciono aleatoriamente a 32 matrimonios y
efecto la prueba para comprobar si existe relacin significativa por rangos en el
coeficiente intelectual (CI) de esas parejas. Los datos son los siguientes usa
= 0,05
40
Matrimonio CI esposo: CI esposa: Rango x Rango y ( x y )2
x y
1 95 95 8 4,5 12,25
2 103 98 20 8,5 132.25
3 111 110 26 23 9.00
4 92 88 4 2 4.0
5 150 106 32 18 196
6 107 109 24 21.5 6.25
7 90 96 3 6 9.0
8 108 131 25 32 49.0
9 100 112 17.5 25.5 64
10 93 95 5.5 4.5 1.0
11 119 112 29 25.5 12.25
12 115 117 28 30 4.0
13 87 94 1 3 4.0
14 105 109 21 21.5 .25
15 135 114 31 27 16.0
16 89 83 2 1 1.0
17 99 105 14.5 16.5 4.0
18 106 115 22.5 28 30.25
19 126 116 30 29 1.0
20 100 107 17.5 19 2.25
21 93 111 5.5 24 342.5
22 100 105 17.5 16.5 1.0
23 100 105 17.5 16.5 1.0
24 96 103 10 15 25.0
25 99 101 14.5 13 2.25
26 112 123 27 31 16.0
27 106 108 22.5 20 6.25
28 98 97 12.5 7 30.25
29 96 100 10 11.5 2.25
30 98 99 12.5 10 6.25
31 100 100 17.5 11.5 36
32 96 102 10 14 16.0
Total 1043.75
6 1043, 75
rs ( obs ) = 1 = 0,8087
32(32 2 1)
41
Como:
1
Z crit . = Zc
n 1
1
Z Crit . = 2,33 = 0, 41848
(32 1)
m3 6
1 = 3
N 0,
2 n
m2
Este estadstico
1 permite contrastar la hiptesis de que los datos
provienen de una distribucin con simetra normal (asimetra = 0) y se basa
en que si la hiptesis de normalidad es cierta, el coeficiente de asimetra
estima un parmetro de la poblacin que es cero (el coeficiente de asimetra
de una distribucin normal es cero).
42
Para realizar el contraste se halla el valor de k tal que P (1 k ) = , siendo
el nivel de significacin establecido en el contraste.
m4 24
2 = 3 N 0,
m2 2 n
43
8.3 Contraste de Jarque-Bera
Para muestras grandes, el contraste de Jarque - Bera usa los dos
estadsticos anteriores mediante la consideracin del estadstico de
Bowman Shelton siguiente:
12 2 2
B = n + 2
2
6 24
Ejemplo 6.1.
Se controlan los beneficios de una inversin durante 278 das escogidos al azar
observndose un coeficiente de asimetra de 0,04033 y una curtosis de 0,15553
en la muestra. Podramos deducir de estos datos la normalidad de la poblacin al
95% (beneficios de la inversin normales) = 0,05
Solucin:
m3 6 6 1
1 = 3
N 0, = N 0, = N ( 0; 0,15 ) Z Obs = N ( 0,1)
2 n 278 0,15
m2
44
Este estadstico 1 (o Z) permite contrastar la hiptesis de que los datos
provienen de una distribucin con simetra normal (asimetra = 0) y se basa en
que si la hiptesis de normalidad es cierta, el coeficiente de asimetra estima un
parmetro de la poblacin que es cero.
P ( Z k ) = 0, 05 k = 1,96
1 0, 04033
Z Obs = = = 0, 2689
0,15 0,15
Por lo tanto, se tiene que Z Obs < k , es decir, cae fuera de la regin crtica, o sea,
no se puede rechazar la hiptesis nula de simetra, y por su puesto de la
normalidad.
m4
2 =
m22 3
Tiene distribucin asintticamente normal de media cero y varianza
24 m
2 = 2 4
n m 2 3
45
m4 24 24 2
2 = 2
3 N
0,
= N
0, = N ( 0; 0.29 ) Z Obs = N ( 0,1)
m2 n 278 0, 29
P ( Z k ) = 0, 05 k = 1,96
2 0,15553
Z Obs = = = 0,5363
0, 29 0, 29
Este valor resulta menor que k, entonces se acepta la hiptesis nula de curtosis
poblacional cero, y por supuesto la de normalidad.
12 22 0, 040332 0,155532
B = n + = 278 + = 0,36 22
6 24 6 24
P ( 22 k ) = 0, 05 k ( .05,
2
2 ) = 5,99
Como el valor del estadstico B para los datos dados de la muestra es 0,36 el que
resulta menor que el valor de k, no se rechaza la hiptesis nula de la normalidad
46
Apndice: Tablas
Correlacin de Spearmann
47
48