Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Ejemplo
Un tratamiento para dejar de fumar a mostrado ser efectivo en el 60 %
de los casos. Un investigador propone un nuevo método que se supone
mejorará dicho porcentaje. Para verificar esta afirmación se aplicó di-
cho tratamiento a 20 voluntarios con hábito de fumar. ¿Como usar la
información recolectada para decidir si el nuevo tratamiento es mejor?
Queremos determinar si la proporción de personas que deja de fumar a
causa del nuevo tratamiento es más del 60 %. ¿Cuantas de las 20 perso-
nas mı́nimo deben dejar de fumar para aceptar que el nuevo tratamiento
es mejor?
Solución
Sea X: # personas que dejan de fumar a causa del nuevo tratamiento.
X ∼ bin(20 , p). Las hipótesis a probar son:
H0 : p ≤ 0.6 vs Ha : p > 0.6 .
Suponga que un valor k, es tal que si X > k, se tiene suficiente evidencia
para rechazar H0 . (es decir, para concluir que p > 0.6).
138
Observe que
X k k
X>k ⇔ > ⇔ p̂ > = p0 .
n n 20
Ası́ X > k ⇔ p̂ > p0 . La desición recae sobre p̂.
H0 : μ = μ0 vs Ha : μ > μ 0 .
Entonces:
X̄ − μ0 k − μ0
α = P (X̄ > k | μ = μ0 ) = P > .
√σ √σ
n n
140
X̄ − μ0
∼ n(0, 1) .
√σ
n
Luego
k − μ0
α≈P Z > .
√σ
n
k−μ0
De esta última ecuación, se obtiene que zα = √σ
. Al despejar k se
n
obtiene k = μ0 + zα √σn . Finalmente, la región crı́tica está dada por:
σ
R.C = X̄ | X̄ > μ0 + zα √ ⇔ R.C = {ZC | ZC > zα } ,
n
X̄−μ0
donde, ZC = √σ
.
n
X̄ − μ 0
X̄ | X̄ > k ⇔ X̄ | X̄ > μ 0 + Zα ⇔ X̄ | √ > Zα .
σ/ n
Estadı́stico de Prueba:
X̄ − μ 0
ZC = .
√σ
n
Región Crı́tica: ⎧
⎨ ZC | ZC < −Zα
ZC | ZC > Zα .
⎩
ZC | |ZC | > Zα/2
141
Si σ 2 es desconocida, se usa S 2 .
Ejemplo
Se estudia el rendimiento de un proceso quı́mico. Con base en la obser-
vación de 50 dias. Se obtuvo un rendimiento promedio del 90.48 % con
una desviación estándar de 1.1514 %. ¿Se puede afirmar que el rendi-
miento real del proceso es superior al 90 %? Use un α = 0.01.
Solución
Sea X 1 , . . . , X 50 una m.a. que representa los rendimientos de 50 dias.
Suponga que E[Xi ] = μ y V [Xi ] = σ 2 ambas desconocidas. Se
obtuvo X̄ = 90.48 y S = 1.1514
Las hipótesis a probar son:
H0 : μ = 90 vs Ha : μ > 90
E. Prueba:
X̄ − 90
ZC = ∼ n(0 , 1) α = 0.01 .
√S
50
R. Critica =
{ZC | ZC > Z0.01 } .
Como α = 0.01, se tiene que Z0.01 = 2.33. Ası́, R. Critica = {ZC | ZC > 2.33 } .
90.48 − 90
ZC = 1.1514 = 2.95 .
√
50
E.P:
X̄ − μ
TC = .
√S
n
Región Crı́tica:
⎧
⎨ TC | TC < −tα (n − 1)
TC | TC > tα (n − 1) ; α dado .
⎩
TC | |TC | > tα/2 (n − 1)
Ejemplo
En el ejemplo anterior suponga que el rendimiento del proceso es una
v.a. normal n(μ, σ 2 ) con μ y σ 2 desconocidas. Al observar el rendimiento
diario en los siguientes 20 dias, se obtuvo un rendimiento promedio de
90.52 % y una desviación estándar de 1.2212 %. ¿Se puede afirmar que
el rendimiento medio real del proceso es superior al 90 %?
Solución
Sea X 1 , . . . , X 20 una m.a. que representa los rendimientos del proceso
en 20 dias. Asuma que Xi ∼ n(μ, σ 2 ).
Se quiere probar:
H0 : μ = 90 vs H1 : μ > 90
X̄ − 90
E.Prueba: TC = ∼ t(19)
√S
20
90.52 − 90
TC = 1.2212 = 1.90 .
√
20
Ejemplo
El tiempo de secado de un cierto tipo de pintura es una variable aleatoria
Normal con media μ = 75 y desviación estándar σ = 9 (en minutos).
Un grupo de investigadores proponen incorporar un aditivo a la pintura
que permitirá reducir el tiempo de secado al que actualmente se tiene.
Se cree que los tiempos de secado para esta pintura con el aditivo se
seguirán comportando de manera normal con una desviación estándar
σ = 9. Para verificar la afirmación de los investigadores, se consideran
25 pruebas donde se aplica la pintura con el aditivo y se registran los
tiempos de secado. Se decide que si el tiempo promedio obtenido en
la muestra es inferior a 71.8 min, se concluye que el tiempo medio de
secado con el aditivo es inferior al estándar (75 min).
a) Bajo estas condiciones ¿Cuál es la probabilidad de error Tipo I?
b) Calcule la probabilidad de que se concluya que el aditivo no reduce
el tiempo medio de secado, cuando el tiempo medio de secado es
realmente de 72 min.
Solución
Sea X1 , X2 , . . . , X25 una muestra aleatoria que representa los tiempos
de secado de la pintura usando el aditivo. Se asume que Xi ∼ N (μ, 92 ),
i = 1, 2, . . . , n. Las hipótesis a contrastar son:
H0 : μ = 75 vs Ha : μ < 75 .
Se decide que el tiempo medio de secado (μ) será inferior al actual (75
min) si : X̄ <71.8. Luego la región crı́tica o de rechazo es de la forma:
R = { X̄ | X̄ < 71.8 } .
144
Ejemplo
Dos proveedores fabrican un engrane plástico utilizado en una impreso-
ra láser. El interés está en la resistencia al impacto del engrane, el cuál
se mide en pie − lb. Una muestra aleatoria de 50 engranes suministrados
por el proveedor A, arrojan una resistencia promedio de 295pie − lb con
una desviación de 15pie − lb. Del proveedor B se toma una m.a. de 45
engranes. Esta muestra arroja una resistencia promedio de 306pie − lb y
una desviación estándar de 16pie−lb. ¿Puede afirmarse que los engranes
del proveedor A tienen una resistencia media inferior a los engranes del
proveedor B?. Use α = 0.01
Solución
Sea X1 , . . . , X50 una m.a que representa las resistencias de los en-
granes del proveedor A. Asuma que E[Xi ] = μ1 y V ar[Xi ] = σ12 ;
i = 1, 2, . . . , 50.
Sea Y1 , . . . , Y45 otra m.a. que representa las resistencias de los en-
granes del proveedor B. Asuma que E[Yj ] = μ2 y V ar[Yj ] = σ22 ;
j = 1, 2, . . . , 45., ambas muestras independientes entre si.
De la información muestral se tiene que:
X̄ = 295 , S1 = 15 , Ȳ = 306 , S2 = 16 , n = 50 , m = 45 .
Las hipótesis a probar son:
H0 : μ1 − μ2 = 0 vs Ha : μ1 − μ2 < 0 .
El estadı́stico de prueba es:
X̄ − Ȳ − δ0 aprox
ZC =
2 ∼ n(0, 1) .
S1 S2
50
+ 452
Para α = 0.01 la región de rechazo es
R.C. : {ZC | ZC < −z0.01 } = {ZC | ZC < −2.33} .
146
1 S12
FC = ∼ f (n − 1, m − 1) .
δ0 S22
148
Ejemplo
El artı́culo ((Effects of fast-food consumption on energy intake and diet
quality among children in a National household study)) (Pediatrics,
2004), reporta el resumen de datos relacionados con la ingesta de calorı́as
tanto para una muestra de adolescentes que dijeron no suelen consumir
comida rápida y otra muestra de adolescentes que digeron consumirla.
Se cree que esta costumbre incrementa el consumo medio de calorı́as
en el segundo grupo en comparación con el primero. Se desea estable-
cer si la variabilidad en las mediciones de calorı́as en ambos grupos es
diferente. Use un α = 0.05. De la experiencia se sabe que el contenido
de calorı́as en ambas poblaciones es una variable aleatoria Normal. La
infomación obtenida en el estudio se muestra a continuación.
1
{ FC | FC < ∨ FC > f0.025 (12, 11) } .
f0.025 (11, 12)
En este caso f0.025 (11, 12) = 3.321 y f0.025 (12, 11) = 3.430. Con esto, la
región de rechazo es de la forma:
S12 15192
Ahora, FC = 2 = = 1.782 . Como FC < 3.43, no se puede re-
S2 11382
chazar H0 y se concluye que la evidencia muestral no es suficiente para
observar una diferencia en las varianzas de los consumos de calorias para
ambos grupos de adolescentes, se asume entonces que ambas varianzas
son similares.
X̄ − Ȳ − δ 0
ZC =
2 ∼ n(0, 1) .
σ1 σ2
n
+ m2
X̄ − Ȳ − δ0 (n − 1)S12 + (m − 1)S22
TC =
∼ t (n + m − 2) ; Sp2 = .
sp n1 + m1 n+m−2
R. Crı́tica: ⎧
⎨ TC | TC < −tα (n + m − 2)
TC | TC > tα (n + m − 2) ;
⎩
TC | |TC | > tα/2 (n + m − 2)
Caso II: σ12 = σ22 . En este caso el estadı́stico de prueba tiene una
distribución aproximada.
Estadı́stico de Prueba:
2 2
S1 S22
X̄ − Ȳ − δ0 aprox n
+ m
TC =
2 2
∼ t (v) ; v = 2 2 2 2 − 2 .
S1 S2 S 1 S2
n
+ m
n m
n+1
+ m+1
La región crı́tica tiene forma similar al caso anterior pero cambiando los
151
Ejemplo
Dos proveedores fabrican un engrane plástico utilizado en una impre-
sora láser. El interés está en la resistencia al impacto del engrane, el
cuál se mide en pie − lb. Una m.a. de 10 engranes suministrados por el
proveedor A, arrojan una resistencia promedio de 290pie − lb con una
desviación de 12pie − lb. Del proveedor B se toma una m.a. de 15 engra-
nes. Esta muestra arroja una resistencia promedio de 308.5pie−lb y una
desviación estándar de 15pie − lb. Se sabe que las resistencia al impac-
to se comportan de manera normal para este tipo de engrane. ¿Puede
afirmarse que los engranes del proveedor A tienen una resistencia media
inferior a los engranes del proveedor B?. Use α = 0.05
Solución
Sea X 1 , . . . , X 10 una m.a que representa las resistencias de los engra-
nes del proveedor A. Asuma que Xi ∼ n(μ 1 , σ12 ).
Sea Y 1 , . . . , Y 15 otra m.a. que representa las resistencias de los engra-
nes del proveedor B. Asuma que Yj ∼ n(μ 2 , σ22 ) ambas m.a. E.I.
De las muestras se tienen los siguientes resultados:
σ12
Un I.C. al 95 % para σ22
es:
S12 1 S12
, f (14, 9) ,
S22 f0.025 (9, 14) S22 0.025
H0 : μ 1 − μ 2 = 0 vs H1 : μ 1 − μ 2 < 0 .
E. Prueba
X̄ − Ȳ − 0
TC =
∼ t (23) .
S p 10 + 15
1 1
9 S12 + 14 S22
Sp2 = = 193.304 , Sp = 13.90 .
23
290 − 308.5
TC =
= −3.26 .
1 1
13.90 10 + 15
Ejemplo
Se investigan los puntos de fusión de dos aleaciones utilizadas en la fa-
bricación de cierto tipo de soldadura. Para ello se funden 10 muestras
de cada material, y se miden en ambas los respectivos de fusión. Para
la aleación 1 se obtiene un punto de fusión promedio de 421◦ F con una
desvición estándar de 2◦ F. Para la aleación 2 los resultados fueron
426◦ F y 4.2◦ F respectivamente. Por experiencia se sabe que los puntos
de fusión para ambas aleaciones es una variable aleatoria normal. ¿Se
puede afirmar que no hay diferencia significativa en los puntos de fusión
de ambas aleaciones?. Use α = 0.05.
Solución
Sea X 1 , . . . , X 10 una m.a. que representa los puntos de fusión de las
10 muestras de la aleación tipo 1.
Asuma Xi ∼ n(μ 1 , σ12 ) , i = 1, 2, . . . , 10. Sea Y 1 , . . . , Y 10 otra m.a.
que representa los puntos de fusión de las 10 muestras de la aleación
153
1
R.C. : FC | FC < ∨ FC > f0.025 (9, 9) .
f0.025 (9, 9)
H0 : μ 1 − μ 2 = 0 vs H1 : μ 1 − μ 2 = 0 .
154
X̄ − Ȳ − 0 aprox
E.P. TC =
2 ∼ t (v) , con v = 13.745 ∼
= 14 .
S1 S22
10
+ 10
R.Crı́tica:
{TC | TC > tα/2 (14)} = {TC | |TC | > t0.025 (14) } = { TC | |TC | > 2.145 }
421 − 426
TC =
= −3.3989 ≈ −3.40 .
4 4.2 2
10
+ 10
Como |TC | = 3.40 > 2.145, se rechaza H0 : y se concluye que según la
información suministrada por ambas muestras, hay evidencia suficiente
para afirmar que los puntos medios de fusión son diferentes.
aprox
Si H0 es cierta p̂−p0 ∼ n(0, 1) . Ası́, el estadı́stico de prueba
p0 (1−p0 )
n
a ser usado es
p̂ − p0
ZC =
.
p0 (1−p0 )
n
Ejemplo
En cierta región, tres candidatos aspiran a cierto cargo público. Para
elegir uno de los tres se realiza una votación entre todas las personas
mayores de edad. Para tener idea si existe preferencia por alguno de
los tres, se realiza una encuesta a 1000 personas y se observó 365 a favor
de A, 330 a favor de B y 305 a favor de C. ¿Existe mayor preferencia
por el candidato A?
Solución
X: # votantes en la encuesta a favor de A.
1 1
H0 : p = vs H1 : p > .
3 3
Estadı́stico de Prueba:
p̂ − 1/3 aprox
ZC =
1 2 ∼ n(0, 1) .
3
(3)
1000
En este caso
0.365 − 1/3
ZC =
1 2 = 2.12 .
( )
3 3
1000
Como ZC > 1.645 se rechaza H0 y se concluye que según los datos ob-
servados existe mayor preferencia por A.
Ejemplo
Un tratamiento para dejar de fumar a mostrado ser efectivo en el 60 %
de los casos. Se propone un nuevo tratamiento que se cree mejorará
dicho porcentaje. Para verificar esto se tiene una muestra de 20 volun-
tarios que se someten a este tratamiento y 17 de ellos deja de fumar. ¿Es
el nuevo tratamiento mejor?. Use α = 0.05. Luego α = 0.01. ¿Cambia
la conclusión?
Solución
Sea X: # de pacientes tratados que dejan de fumar.
X ∼ bin (20, p). Las hipótesis a probar son:
100.95 − 100
TC = 2.21 = 1.922 .
√
20
Resumen: ⎧
⎨ μ < μ0
H 0 : μ = μ0 vs Ha : μ > μ0
⎩
μ = μ0
Ejemplo
Se lleva a cabo un estudio para determinar la efectividad de una va-
cuna contra la gripe. La empresa que produce la vacuna asegura que
esta es no efectiva en menos del 0.8 % de los casos en los que se aplica.
Se administra la vacuna a una muestra aleatoria de 3000 sujetos y 13
contraen gripe. ¿Es cierta la afirmación del fabricante? Use el Valor p
para concluir.
Solución
Sea X: Número de vacunados que contraen gripe. Se sabe que X ∼
b(3000, p) , donde p es desconocido. La hipótesis del fabricante establece
que p < 0.008. Luego, las hipótesis a contrastar son:
H0 : p = 0.008 vs Ha : p < 0.008 .
Como n es grande, el estadı́stico de prueba es:
p̂ − 0.008
ZC =
.
0.008 (1−0.008)
3000
163
Como p̂ = 3000
13
= 0.0043, se tiene que ZC = −2.25. Luego, el Valor p de
esta prueba se obtiene como:
H0 : F (x) = F0 (x) vs
Ha : F0 (x) no es la c.d.f. asociada a la muestra.
Si F0 está claramente especificada, es posible conocer valores particula-
res para los pi ; i = 1, 2, . . . , k y asi obtener E [Ni ]. En otro caso, los pi
deberán ser estimados y en vez de tener E [Ni ], se estima con n p̂i .
En resumen tenemos:
clase 1 2 k total
Frec observada n1 n2 ... nk n
Probabilidad p1 p2 ... pk 1
Frec esperada n p1 n p2 n pk n
Si n pi ≥ 5 ; i = 1, 2 . . . , k , la v.a.
k
(Ni − n pi ) 2
X= ∼ χ 2 (k − 1) .
i=1
n pi
Observe que
k
(Ni − n pi ) 2 (f.obs − f.esp) 2
X= = ∼ χ2 (k − 1) .
i=1
n pi todas las celdas
f.esp
H0 : p i = pi 0 ; i = 1, 2 . . . , k vs Ha : ∃ j tal que pj = pj 0
166
E.P:
k
(ni − n pi ) 2
XC = ∼ χ 2 (k − 1) .
i=1
n pi
R.C.:
{XC |XC > χ2α (k − 1) } ; para α dado .
Finalmente
Vp = P χ2α (k − 1) > XC .
Ejemplo
Para determinar si un dado está cargado o no, éste es lanzado 600 veces
y se anota cuantas veces aparece cada cara. Los resultados observados
fueron:
167
Cara 1 2 3 4 5 6
Fre.obs 85 94 108 112 98 103
Frec.esp 100 100 100 100 100 100
Las hipótesis a plantear son:
1 1
H 0 : pi = , i = 1, 2, · · · , 6 vs Ha : ∃ j tal que pj = .
6 6
En este caso la distribución acumulada F 0 (x), está asociada a una dis-
tribución uniforme discreta.
Estadı́stico de Prueba:
6
(n i − 100) 2
XC = ∼ χ 2 (5) .
i=1
100
Dı́gito 0 1 2 3 4 5 6 7 8 9
Frec 11 11 9 8 8 11 9 11 13 9
F.espe. 10 10 10 10 10 10 10 10 10 10
Las hipótesis a plantear son:
1 1
H 0 : pi = , i = 1, 2, . . . , 10 vs Ha : ∃j tal que pj = .
10 10
1
F.esperada = 100 10 = 10:
E.Prueba:
10
(n i − 10) 2
Xc = ∼ χ 2 (9) .
i=0
10
168
30 40 42 52 55 60 60 62 64 65 66 66 67 67 68 68 68
70 70 70 71 72 72 73 74 74 75 76 76 78 78 78 79 80
80 82 83 84 84 85 86 88 90 90 92 93 93 94 95 97
67
N.rango = 70 , Amplitud = = 9.571 ≈ 10 .
7
Los intervalos resultantes son:
(−∞ , 40), [40 , 50) , [50 , 60) , [60 , 70) , [70 , 80) , [80 , 90) , [90 , ∞) .
E. Prueba:
5
(n i − n pi ) 2
XC = ∼ χ 2 (5 − 2 − 1) .
i=1
n pi
Usando código en R:
shapiro.test(puntajes)
data: puntajes
W = 0.9521, p-value = 0.04163
Ejemplo
De la producción diaria de una empresa se seleccionan de manera aleato-
ria 4 artı́culos y se examinan uno a uno para verificar si son defectuosos
o no. A pesar de desconocer la proporción diaria de defectuosos en la
empresa, se tiene la idea de que el número de artı́culos defectuosos de los
4 seleccionados es Binomial. Para verificarlo, se repite este experimento
durante 100 dı́as y cada vez se registra el número de defectuosos entre
los 4 seleccionados. Los resultados se muestran en la siguiente tabla.
No éxitos 0 1 2 3 4
Frec Obs 11 17 42 21 9
Solución
Sea X1 , X2 , · · · , X100 una muestra aleatoria que representa el número
de defectuosos para los 100 dı́as observados. Según el enunciado se desea
probar las hipótesis:
100
100
(p) = K + Xi ln(p) + 4 ∗ 100 − Xi .
i=1 i=1
1
100
p̂ = Xi .
4 ∗ 100 i=1
No éxitos 0 1 2 3 4
Frec Obs 11 17 42 21 9
Frec Esp 6.25 25 37.5 25 6.25
Estadı́stico de prueba. En este caso la estimación del parámetro p hace
que se pierda un grado de libertad más.
4
(Ni − n pi )2
XC = ∼ χ2 (3) .
i=0
n pi
174
Para α dado se rechaza H0 si Dn > √cn . Esta prueba puede ser usada
para verificar si un conjunto de datos (discretos o continuos) provienen
de una distribución especı́fica.
Los valores de c se encuentran tabulados y la respectiva tabla se muestra
en la figura 30.
175
Ejemplo
A partir de una muestra de 215 estudiantes, se recopiló información
acerca de 5 variables de interés: Estrato, Horas (dedicadas semanalmente
a estudiar), Edad (en años), Trab(Trabaja 1:Si; 2: No) y Prom (obtenido
en el semestre anterior). Se muestra una parte de los datos:
> ind[1:10,]
Estrato Horas edad trab prom
1 1 28 20 1 3.8
2 1 24 21 1 3.7
3 1 18 19 1 3.9
4 1 20 20 2 3.7
5 1 23 25 2 3.7
6 1 26 18 2 3.6
7 2 12 35 1 3.0
8 2 30 26 1 3.2
9 2 4 32 1 2.9
10 2 9 26 1 3.4
data: ind[, 5]
D = 0.0892, p-value = 0.0002713
Este valor P permite rechazar H0 y concluir que los promedios NO se
distribuyen normalmente.