Sei sulla pagina 1di 94

Introducción a la

inferencia estadística

Semanas 10 y 11

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Objetivo

À  Caracterizar el comportamiento de una población, utilizando medidas resumen obtenidas en una


muestra representativa y probabilística de la misma población.

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Conceptos

Probabilística
(Muestreo Aleatorio Simple)

Muestra
Población

Generalizo
comportamiento

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Conceptos

•  Media (x)

•  Proporción (p)
Muestra
•  Varianza (s2)
PARÁMETROS
•  Desviación
•  MEDIA (µ) estándar (s)
Población
•  PROPORCIÓN (π)
Estimadores
•  VARIANZA (σ2)

•  DESVIACIÓN
ESTÁNDAR (σ)
a los v alores
Aproxim

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Estimador: variable
Muestra
1

Si fuera posible tener


aleatoria un listado de TODAS
Muestra las muestras, y los
2
valores de la variable
en cada una de ellas,
se observaría que
Muestra con los datos de
3
cada muestra se
Población obtiene un valor
diferente para el
Muestra estimador.
4

El estimador es una
variable aleatoria. Se
: podría calcular el
: valor de la media y la
desviación estándar
para el estimador.
Muestra
s

Tatiana Jiménez (tjimenez@unisalle.edu.co)


IMPORTANTE…

À  En la práctica no tiene sentido tomar TODAS las muestras posibles, sería un proceso ineficiente.
À  En la práctica se toma UNA ÚNICA muestra y con ella de concluye sobre la POBLACIÓN

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Intervalos de
confianza

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Conceptos

Una estimación es un valor que toma el estimador en una muestra específica y se utiliza para
aproximar el verdadero valor del parámetro.

El error estándar describe la falta de fiabilidad (debida al error de muestreo)del estimador con
respecto al parámetro.

La distribución muestral es la distribución de probabilidad asociada a un estimador.

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Estimadores y error estándar

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Selección de la Distribución
muestral

distribución
muestral Cuantitativa
¿Qué tipo
de variable
se tiene? Cualitativa
Proporción

Dispersión ¿Cuál es
el interés?

Tendencia NORMAL
Varianza
Media

JI-
CUADRADO No ¿Se conoce la Si
varianza de la
población?

T-STUDENT NORMAL

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Intervalo de confianza

À  Un intervalo de confianza es un rango de posibles valores para el parámetro poblacional.


À  El intervalo está definido por la probabilidad de que el verdadero valor se encuentre en el intervalo
y sus límites se calculan a partir de la información del:

À  Estimador à valor aproximado para el parámetro


À  Error estándar à fiabilidad del estimador
À  Valor crítico de la distribución de muestreo à representa confianza en que el verdadero valor se encuentre
dentro del intervalo

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Intervalo de confianza

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Intervalo de confianza
para µ con σ
conocida

Tatiana Jiménez (tjimenez@unisalle.edu.co)


√n θ̂L = x̄ − z α/ 2√n y θ̂U = x̄ + z α/ 2 .
√n √ n
Tatiana Jiménez (tjimenez@unisalle.edu.co)

Muestras diferentes producirán valores


Muestrasdiferentes
diferentes de x̄ y, por
producirán lo tanto,
valores producirán
diferentes de x̄ y, por dife-
lo tanto, producirán dife-
rentes estimaciones por intervalos del parámetro
rentes estimaciones µ, por
como se muestra
intervalos en laµ,ficomo
del parámetro gurase9.3. Losen la figura 9.3. Los
muestra
puntos en el centro de cada intervalopuntos
indicanen el centro de cada intervalo indican la posición de la estimación puntual x̄ para
la posición de la estimación puntual x̄ para
cada muestra aleatoria. Observe que todos los intervalos tienen el mismo ancho, pues
cada muestra aleatoria. Observe que estotodos
dependelossólointervalos
de la eleccióntienen
de zα/2el
unamismo
vez que seancho, pues
determina x̄. Cuanto más grande
esto depende sólo de la elección de sea
zα/2el una
valorvez que
de zα/2 quese determina
elijamos, x̄. Cuanto
más anchos haremosmás todosgrande
los intervalos, y podremos
tener
sea el valor de zα/2 que elijamos, más más confi
anchos anza en que
haremos la muestra
todos particular queyseleccionemos
los intervalos, podremos producirá un inter-
valo que contenga el parámetro desconocido µ. En general, para una elección de zα/2,
tener más confianza en que la muestra100(1particular
– α)% de losque seleccionemos
intervalos contendrá µ. producirá un inter-
valo que contenga el parámetro desconocido µ. En general, para una elección de zα/2,
100(1 – α)% de los intervalos contendrá µ.
10
9
8
10
¿Qué sucede9 7

Muestra
6

cuando 8 5
4

construimos 6un
7
3
Muestra

intervalo de 5 1
x

confianza? 3 4 µ

Figura 9.3: Estimaciones por intervalos de µ para muestras diferentes.


Ejemplo

21. Pesos de mujeres Si utilizamos la muestra aleatoria simple de los pesos de mujeres incluidos
en el conjunto de datos 1 del apéndice B, obtenemos los siguientes estadísticos muestrales: n 5 40
y x = 146.22 libras. Investigaciones de otras fuentes sugieren que la población de pesos de mujeres
tiene una desviación estándar dada por s 5 30.86 libras.
a) Calcule la mejor estimación puntual de la media del peso de todas las mujeres.
b) Calcule una estimación de un intervalo de confianza del 95% del peso medio de todas las
mujeres.

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Ejemplo
21. Pesos de mujeres Si utilizamos la muestra aleatoria simple de los pesos de mujeres incluidos
en el conjunto de datos 1 del apéndice B, obtenemos los siguientes estadísticos muestrales: n 5 40
y x = 146.22 libras. Investigaciones de otras fuentes sugieren que la población de pesos de mujeres
tiene una desviación estándar dada por s 5 30.86 libras.

Mejor estimación
puntual para µ
n = 40
σ = 30.86
x = 146.22
Confianza 95% à Z0.025 = 1.96

Con un 95% de confianza el verdadero peso medio de las mujeres se


encuentra entre [136.66 y 155.78] libras.
Tatiana Jiménez (tjimenez@unisalle.edu.co)
Ejemplo

Tatiana Jiménez (tjimenez@unisalle.edu.co)


24. Conteo de glóbulos rojos en la sangre Se obtiene una muestra aleatoria simple de 50
adultos (que incluye hombres y mujeres), y se mide el conteo de glóbulos rojos (en glóbulos por
microlitro) de cada persona. La media muestral es 4.63. La desviación estándar poblacional para
los conteos de glóbulos rojos es de 0.54.
a) Calcule la mejor estimación puntual de la media del conteo de glóbulos rojos de adultos.
b) Construya un intervalo de confianza del 99% para el conteo medio de glóbulos rojos de adultos.
c) El rango normal del conteo de glóbulos rojos de adultos, determinado por los National Ins-
titutes of Health, es de 4.7 a 6.1 para los hombres, y de 4.3 a 5.4 para las mujeres. ¿Qué sugiere el
intervalo de confianza acerca de estos rangos normales?

>limite_inf<-4.63-qnorm(0.025, mean=0, sd=1, lower.tail=FALSE)*(0.54)/sqrt(50)


> limite_inf
[1] 4.480322
>limite_sup<-4.63+qnorm(0.025, mean=0, sd=1, lower.tail=FALSE)*(0.54)/sqrt(50)
> limite_sup Con un 95% de confianza el conteo de glóbulos rojos
[1] 4.779678 de los adultos se encuentra entre 4.48 y 4.78
Tatiana Jiménez (tjimenez@unisalle.edu.co)

Ejemplo

26. Pesos al nacer Una muestra aleatoria simple de pesos al nacer en Estados Unidos tiene una
media de 3433 g. La desviación estándar de todos los pesos al nacer es de 495 g.
a) Utilice un tamaño de la muestra de 75 para construir un intervalo de confianza del 95% para
el peso medio al nacer en Estados Unidos.
b) Utilice un tamaño de la muestra de 75,000 para construir un intervalo de confianza del 95%
para el peso medio al nacer en Estados Unidos.
c) ¿Cuál de los intervalos de confianza anteriores es más ancho? ¿Por qué?

>limite_inf<-3433-qnorm(0.025, mean=0, sd=1, >limite_inf<-3433-qnorm(0.025, mean=0, sd=1,


lower.tail=FALSE)*(495)/sqrt(75) lower.tail=FALSE)*(495)/sqrt(75000)
> limite_inf > limite_inf
[1] 3320.973 [[1] 3429.457
>limite_sup<-3433+qnorm(0.025, mean=0, sd=1, >limite_sup<-3433+qnorm(0.025, mean=0, sd=1,
lower.tail=FALSE)*(495)/sqrt(75) lower.tail=FALSE)*(495)/sqrt(75000)
> limite_sup > limite_sup
[1] 3545.027 [1] 3436.543
Intervalo de confianza
para µ con σ
desconocida

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Supuestos necesarios para
construir el intervalo de confianza

À  La muestra es aleatoria simple


À  Los datos provienen de una población con distribución de probabilidad normal

Tatiana Jiménez (tjimenez@unisalle.edu.co)


α
Tabla A.4 Valores críticos de la distribución t 0 tα

Distribución t-Student
α
v 0.40 0.30 0.20 0.15 0.10 0.05 0.025
1 0.325 0.727 1.376 1.963 3.078 6.314 12.706
2 0.289 0.617 1.061 1.386 1.886 2.920 4.303
3 0.277 0.584 0.978 1.250 1.638 2.353 3.182
4 0.271 0.569 0.941 1.190 1.533 2.132 2.776
5 0.267 0.559 0.920 1.156 1.476 2.015 2.571

La distribución t-Student tiene forma


6 0.265 0.553 0.906 1.134 1.440 1.943 2.447
7 0.263 0.549 0.896 1.119 1.415 1.895 2.365
8 0.262 0.546 0.889 1.108 1.397 1.860 2.306
simétrica alrededor del valor 0. 9 0.261 0.543 0.883 1.100 1.383 1.833 2.262
10 0.260 0.542 0.879 1.093 1.372 1.812 2.228
11 0.260 0.540 0.876 1.088 1.363 1.796 2.201

Su amplitud varia dependiendo del 12


13
0.259
0.259
0.539
0.538
0.873
0.870
1.083
1.079
1.356
1.350
1.782
1.771
2.179
2.160
14 0.258 0.537 0.868 1.076 1.345 1.761 2.145
tamaño de muestra empleado, a 15 0.258 0.536 0.866 1.074 1.341 1.753 2.131

mayor tamaño de muestra menor 16


17
0.258
0.257
0.535
0.534
0.865
0.863
1.071
1.069
1.337
1.333
1.746
1.740
2.120
2.110

amplitud. 18
19
0.257
0.257
0.534
0.533
0.862
0.861
1.067
1.066
1.330
1.328
1.734
1.729
2.101
2.093
20 0.257 0.533 0.860 1.064 1.325 1.725 2.086
21 0.257 0.532 0.859 1.063 1.323 1.721 2.080
22 0.256 0.532 0.858 1.061 1.321 1.717 2.074
23 0.256 0.532 0.858 1.060 1.319 1.714 2.069
24 0.256 0.531 0.857 1.059 1.318 1.711 2.064
25 0.256 0.531 0.856 1.058 1.316 1.708 2.060
26 0.256 0.531 0.856 1.058 1.315 1.706 2.056
27 0.256 0.531 0.855 1.057 1.314 1.703 2.052

Grados de libertad 28
29
0.256
0.256
0.530
0.530
0.855
0.854
1.056
1.055
1.313
1.311
1.701
1.699
2.048
2.045
30 0.256 0.530 0.854 1.055 1.310 1.697 2.042
40 0.255 0.529 0.851 1.050 1.303 1.684 2.021
60 0.254 0.527 0.848 1.045 1.296 1.671 2.000
120 0.254 0.526 0.845 1.041 1.289 1.658 1.980
∞ 0.253 0.524 0.842 1.036 1.282 1.645 1.960

Área de cola derecha


Tatiana Jiménez (tjimenez@unisalle.edu.co)
9.8 Un experto en eficiencia desea determinar el
tiempo promedio que toma perforar tres hoyos en cierta de secado, en horas, de c
placa metálica. ¿De qué tamaño debe ser una muestra 3.4 2.5
para tener un 95% de confianza en que esta media 2.8 3.3
muestral estará dentro de 15 segundos de la media ver- Ejemplo 4.4 4.0
dadera? Suponga que por estudios previos se sabe que Suponga que las medici
σ = 40 segundos. aleatoria de una poblaci
9.9 Según estudios realizados por el doctor W. H. calcule el intervalo de pr
Bowen, del Instituto Nacional de Salud, y por el doctor po de secado de la siguie
J. Yudben, profesor de nutrición y dietética de la Uni- 9.15 Remítase al ejerci
versidad de Londres, el consumo regular de cereales lo de predicción del 99%
preendulzados contribuye al deterioro de los dientes, a anualmente el propietari
las enfermedades cardiacas y a otras enfermedades de- 9.16 Considere el ejerc
generativas. En una muestra aleatoria de 20 porciones de predicción del 95% p
sencillas similares del cereal Alpha-Bits, el contenido vado de palabras por min
promedio de azúcar era de 11.3 gramos con una desvia- da de la escuela de secre
ción estándar de 2.45 gramos. Suponga que el conteni-
do de azúcar está distribuido normalmente y con base 9.17 Considere el ejerc
en esto construya un intervalo de confianza de 95% de predicción del 95% pa
para el contenido medio de azúcar de porciones senci- siguiente porción de cere
llas de Alpha-Bits. 9.18 Remítase al ejerc
Tatiana Jiménez (tjimenez@unisalle.edu.co)
9.8 Un experto en eficiencia desea determinar el 9.14 Se registran las siguientes mediciones del tiempo
tiempo promedio que toma perforar tres hoyos en cierta de secado, en horas, de cierta marca de pintura vinílica:
placa metálica. ¿De qué tamaño debe ser una muestra 3.4 2.5 4.8 2.9 3.6
2.8 3.3 5.6 3.7 2.8
para tener un 95% de confianza en que esta media
muestral estará dentro de 15 segundos de la media ver- Ejemplo
4.4 4.0 5.2 3.0 4.8
dadera? Suponga que por estudios previos se sabe que Suponga que las mediciones representan una muestra
σ = 40 segundos. aleatoria de una población normal y con base en esto
9.9 Según estudios realizados por el doctor W. H. calcule el intervalo de predicción del 95% para el tiem-
Bowen, del Instituto Nacional de Salud, y por el doctor po de secado de la siguiente prueba de pintura.
J. Yudben, profesor de nutrición y dietética de la Uni- 9.15 Remítase al ejercicio 9.5 y construya un interva-
versidad de Londres, el consumo regular de cereales lo de predicción
Tamañodel de99% para los
muestra àkilómetros
20 que viaja
preendulzados contribuye al deterioro de los dientes, a anualmente el propietario
Promedio de un
muestral àautomóvil
11.3 en Virginia.
las enfermedades cardiacas y a otras enfermedades de- Desviación
9.16 Considere estándar
el ejercicio 9.10muestral el 2.45
y calculeà intervalo
generativas. En una muestra aleatoria de 20 porciones de predicción del 95% para el siguiente número obser-
sencillas similares del cereal Alpha-Bits, el contenido vado de palabras por minuto tecleadas por una gradua-
promedio de azúcar era de 11.3 gramos con una desvia- ¿IC(µ ; 95%)?
da de la escuela de secretarias.
ción estándar de 2.45 gramos. Suponga que el conteni-
do de azúcar está distribuido normalmente y con base 9.17 Considere el ejercicio 9.9 y calcule un intervalo
en esto construya un intervalo de confianza de 95% de predicción del 95% para el contenido de azúcar de la
para el contenido medio de azúcar de porciones senci- siguiente porción de cereal Alpha-Bits.
llas de Alpha-Bits. 9.18 Remítase al ejercicio 9.13 y construya un inter-
9.10 Las integrantes de una muestra aleatoria de 12 valo de tolerancia del 95% que contenga el 90% de las
graduadas de cierta escuela para secretarias teclearon mediciones.
Tatiana Jiménez (tjimenez@unisalle.edu.co)
www.elsolucionario.net
Tabla A.4 Valores críticos de la distribución t 737
Tatiana Jiménez (tjimenez@unisalle.edu.co)

Tabla A.4 Valores críticos de la distribución t

v 0.40 0.30 0.20


α
0.15 0.10
0 tα
α

0.05 0.025
Ejemplo
1 0.325 0.727 1.376 1.963 3.078 6.314 12.706
2 0.289 0.617 1.061 1.386 1.886 2.920 4.303
3 0.277 0.584 0.978 1.250 1.638 2.353 3.182
4 0.271 0.569 0.941 1.190 1.533 2.132 2.776
5 0.267 0.559 0.920 1.156 1.476 2.015 2.571
6 0.265 0.553 0.906 1.134 1.440 1.943 2.447
7 0.263 0.549 0.896 1.119 1.415 1.895 2.365
8 0.262 0.546 0.889 1.108 1.397 1.860 2.306
9 0.261 0.543 0.883 1.100 1.383 1.833 2.262
10 0.260 0.542 0.879 1.093 1.372 1.812 2.228
Confianza à 95%
11
α = 0.05
0.260 0.540 0.876 1.088 1.363 1.796 2.201
12 0.259 0.539 0.873 1.083 1.356 1.782 2.179
13 0.259 0.538 0.870 1.079 1.350 1.771 2.160
14 0.258 0.537 0.868 1.076 1.345 1.761 2.145 α/2 = 0.025
15 0.258 0.536 0.866 1.074 1.341 1.753 2.131
16 0.258 0.535 0.865 1.071 1.337 1.746 2.120
17 0.257 0.534 0.863 1.069 1.333 1.740 2.110
18 0.257 0.534 0.862 1.067 1.330 1.734 2.101
19 0.257 0.533 0.861 1.066 1.328 1.729 2.093
20 0.257 0.533 0.860 1.064 1.325 1.725 2.086
21 0.257 0.532 0.859 1.063 1.323 1.721 2.080
22 0.256 0.532 0.858 1.061 1.321 1.717 2.074
23
n = 20
0.256 0.532 0.858 1.060 1.319 1.714 2.069
24 0.256 0.531 0.857 1.059 1.318 1.711 2.064

v = n-1 = 20-1 = 19 t(α/2,v) = 2.093


25 0.256 0.531 0.856 1.058 1.316 1.708 2.060
26 0.256 0.531 0.856 1.058 1.315 1.706 2.056
27 0.256 0.531 0.855 1.057 1.314 1.703 2.052
28 0.256 0.530 0.855 1.056 1.313 1.701 2.048
29 0.256 0.530 0.854 1.055 1.311 1.699 2.045
30 0.256 0.530 0.854 1.055 1.310 1.697 2.042
40 0.255 0.529 0.851 1.050 1.303 1.684 2.021
60 0.254 0.527 0.848 1.045 1.296 1.671 2.000
120 0.254 0.526 0.845 1.041 1.289 1.658 1.980
∞ 0.253 0.524 0.842 1.036 1.282 1.645 1.960
nes se distribuyen de forma normal y con base en esto
cio 9.3 si deseamos tener un 95% de confianza en que
construya un intervalo de confianza de 90% para la du-
nuestra media muestral estará dentro de un 0.0005 de
reza media de Rockwell.
pulgada de la media verdadera?
9.8 Un experto en eficiencia desea determinar el 9.14 Se registran las siguientes mediciones del tiempo
de secado, en horas, de cierta marca de pintura vinílica:
tiempo promedio que toma perforar tres hoyos en cierta
placa metálica. ¿De qué tamaño debe ser una muestra
para tener un 95% de confianza en que esta media
3.4 2.5 4.8 2.9 3.6
2.8 3.3 5.6 3.7 2.8
Ejemplo
muestral estará dentro de 15 segundos de la media ver- 4.4 4.0 5.2 3.0 4.8
dadera? Suponga que por estudios previos se sabe que Suponga que las mediciones representan una muestra
σ = 40 segundos. aleatoria de una población normal y con base en esto

Tatiana Jiménez (tjimenez@unisalle.edu.co)


9.9 Según estudios realizados por el doctor W. H. calcule el intervalo de predicción del 95% para el tiem-
Bowen, del Instituto Nacional de Salud, y por el doctor po deTamaño
secado dede muestra
la siguiente à 20de pintura.
prueba
J. Yudben, profesor de nutrición y dietética de la Uni- 9.15Promedio
Remítase almuestral à y11.3
ejercicio 9.5 construya un interva-
versidad de Londres, el consumo regular de cereales lo deDesviación
predicción delestándar
99% para losmuestral àque
kilómetros 2.45
viaja
preendulzados contribuye al deterioro de los dientes, a t(α/2,v) =el2.093
anualmente propietario de un automóvil en Virginia.
las enfermedades cardiacas y a otras enfermedades de- 9.16 Considere el ejercicio 9.10 y calcule el intervalo
generativas. En una muestra aleatoria de 20 porciones
IC(µ ; 95%)
de predicción = [11.3
del 95% para–el(2.093)*2.45/raíz(20)
siguiente número obser- ; 11.3 – (2.093)*2.45/raíz(20)]
sencillas similares del cereal Alpha-Bits, el contenido vadoIC(µ
de palabras
promedio de azúcar era de 11.3 gramos con una desvia- ; 95%)por minuto tecleadas
= [10.15338 por una gradua-
; 12.44662]
da de la escuela de secretarias.
ción estándar de 2.45 gramos. Suponga que el conteni-
do de azúcar está distribuido normalmente y con base 9.17 Considere el ejercicio 9.9 y calcule un intervalo
en esto construya un intervalo de confianza de 95% Con un
de predicción del95% deelconfianza
95% para el contenido
contenido de azúcar de la medio de azúcar
para el contenido medio de azúcar de porciones senci- siguiente
está porción
entre de 10.153
cereal Alpha-Bits.
y 12.447 gramos
llas de Alpha-Bits. 9.18 Remítase al ejercicio 9.13 y construya un inter-
9.10 Las integrantes de una muestra aleatoria de 12 valo de tolerancia del 95% que contenga el 90% de las
graduadas de cierta escuela para secretarias teclearon mediciones.

> 11.3-qt(0.025,19,lower.tail = FALSE)*2.45/sqrt(20)


[1] 10.15336
> 11.3+qt(0.025,19,lower.tail = FALSE)*2.45/sqrt(20)
[1] 12.44664
fianza en que una muestra aleatoria de 12. Se toman mediciones de la
0 horas a par- dureza de Rockwell para cada una de las 12 cabezas y
se obtiene un valor promedio de 48.50, con una desvia-
en el ejerci-
ción estándar muestral de 1.5. Suponga que las medicio-
nes se distribuyen de forma normal y con base en esto
Ejemplo
fianza en que
construya un intervalo de confianza de 90% para la du-
un 0.0005 de
reza media de Rockwell.
eterminar el 9.14 Se registran las siguientes mediciones del tiempo
oyos en cierta de secado, en horas, de cierta marca de pintura vinílica:
una muestra 3.4 2.5 4.8 2.9 3.6
e esta media 2.8 3.3 5.6 3.7 2.8
la media ver- 4.4 4.0 5.2 3.0 4.8
s se sabe que Suponga que las mediciones representan una muestra
aleatoria de una población normal y con base en esto
octor W. H. calcule el intervalo de predicción del 95% para el tiem-
por el doctor po de secado de la siguiente prueba de pintura.
ca de la Uni- 9.15 Remítase al ejercicio 9.5 y construya un interva-
r de cereales lo de predicción del 99% para los kilómetros que viaja
los dientes, a anualmente el propietario de un automóvil en Virginia.
Tatiana Jiménez (tjimenez@unisalle.edu.co)

medades de-
una muestra aleatoria de 12. Se toman mediciones de la
dureza de Rockwell para cada una de las 12 cabezas y
se obtiene un valor promedio de 48.50, con una desvia-
ción estándar muestral de 1.5. Suponga que las medicio-
nes se distribuyen de forma normal y con base en esto
construya un intervalo de confianza de 90% para la du-
Ejemplo
reza media de Rockwell.
9.14 Se registran las siguientes mediciones del tiempo

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Para verificar que los datos provienen de una población normal
de secado, en horas, de cierta marca de pintura vinílica: > qqnorm(tiempo)
> qqline(tiempo)
3.4 2.5 4.8 2.9 3.6
2.8 3.3 5.6 3.7 2.8
4.4 4.0 5.2 3.0 4.8
Suponga que las mediciones representan una muestra
aleatoria de una población normal y con base en esto
calcule el intervalo de predicción del 95% para el tiem-
po de secado de la siguiente prueba de pintura.
9.15 Remítase al ejercicio 9.5 y construya un interva-
lo de predicción
> tiempo<-c(3.4, del
2.5, 4.8,99% para
2.9, 3.6, 2.8,los
3.3,kilómetros que4.0,
5.6, 3.7, 2.8, 4.4, viaja
5.2, 3.0, 4.8)
> mediatiempo<-mean(tiempo)
anualmente el propietario de un automóvil en Virginia.
> desviacionmuestral<-sd(tiempo)
9.16
> mediatiempo
Considere el ejercicio 9.10 y calcule el intervalo
[1] 3.786667
de predicción del 95% para el siguiente número obser-
> desviacionmuestral
vado de palabras por minuto tecleadas por una gradua-
[1] 0.9709102
da de la escuela de secretarias.
9.13 En un estudio para determinar la dureza de
i- Rockwell en la cabeza de alfileres para costura se toma
e una muestra aleatoria de 12. Se toman mediciones de la
r- dureza de Rockwell para cada una de las 12 cabezas y
se obtiene un valor promedio de 48.50, con una desvia-
ción estándar muestral de 1.5. Suponga que las medicio-
Ejemplo
i-
nes se distribuyen de forma normal y con base en esto
e
construya un intervalo de confianza de 90% para la du-
e
reza media de Rockwell.
el 9.14 Se registran las siguientes mediciones del tiempo
a de secado, en horas, de cierta marca de pintura vinílica:
a 3.4 2.5 4.8 2.9 3.6
a 2.8 3.3 5.6 3.7 2.8
r- 4.4 4.0 5.2 3.0 4.8 > mean(tiempo)-qt(0.025,14, lower.tail = FALSE)*sd(tiempo)/
sqrt(15)
e Suponga que las mediciones representan una muestra [1] 3.248995
aleatoria de una población normal y con base en esto
H. calcule el intervalo de predicción del 95% para el tiem- > mean(tiempo)+qt(0.025,14, lower.tail = FALSE)*sd(tiempo)/
po de secado de la siguiente prueba de pintura. sqrt(15)
or [1] 4.324339
i- 9.15 Remítase al ejercicio 9.5 y construya un interva-
s lo de predicción del 99% para los kilómetros que viaja IC(µ;95%)=[3.25;4.32]
a anualmente el propietario de un automóvil en Virginia.
e- 9.16 Considere el ejercicio 9.10 y calcule el intervalo
s Con un 95% de confianza el tiempo medio de secado se encuentra entre 3.25 y 4.32 horas
de predicción del 95% para el siguiente número obser-
o vado de palabras por minuto tecleadas por una gradua-
a- da de la escuela de secretarias.
Tatiana Jiménez (tjimenez@unisalle.edu.co)
para σ 2
Intervalo de confianza

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Supuestos necesarios para
construir el intervalo de confianza

À  La muestra es aleatoria simple


À  Los datos provienen de una población con distribución de probabilidad normal

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Tatiana Jiménez (tjimenez@unisalle.edu.co)
740
www.elsolucionario.net
Apéndice A Tablas y demostraciones estadísticas

Tabla A.5 (continuación) Valores críticos de la distribución chi cuadrada


α
α
Tabla A.5 Valores críticos de la distribución chi cuadrada 0 χ α2 v 0.30 0.25 0.20 0.10 0.05 0.025 0.02 0.01 0.005 0.001
α 1 1.074 1.323 1.642 2.706 3.841 5.024 5.412 6.635 7.879 10.827
v 0.995 0.99 0.98 0.975 0.95 0.90 0.80 0.75 0.70 0.50 2 2.408 2.773 3.219 4.605 5.991 7.378 7.824 9.210 10.597 13.815
3 3.665 4.108 4.642 6.251 7.815 9.348 9.837 11.345 12.838 16.266
1 0.04393 0.03157 0.03628 0.03982 0.00393 0.0158 0.0642 0.102 0.148 0.455
4 4.878 5.385 5.989 7.779 9.488 11.143 11.668 13.277 14.860 18.466
2 0.0100 0.0201 0.0404 0.0506 0.103 0.211 0.446 0.575 0.713 1.386
3 0.0717 0.115 0.185 0.216 0.352 0.584 1.005 1.213 1.424 2.366 5 6.064 6.626 7.289 9.236 11.070 12.832 13.388 15.086 16.750 20.515
4 0.207 0.297 0.429 0.484 0.711 1.064 1.649 1.923 2.195 3.357 6 7.231 7.841 8.558 10.645 12.592 14.449 15.033 16.812 18.548 22.457
5 0.412 0.554 0.752 0.831 1.145 1.610 2.343 2.675 3.000 4.351 7 8.383 9.037 9.803 12.017 14.067 16.013 16.622 18.475 20.278 24.321
6 0.676 0.872 1.134 1.237 1.635 2.204 3.070 3.455 3.828 5.348 8 9.524 10.219 11.030 13.362 15.507 17.535 18.168 20.090 21.955 26.124
7 0.989 1.239 1.564 1.690 2.167 2.833 3.822 4.255 4.671 6.346 9 10.656 11.389 12.242 14.684 16.919 19.023 19.679 21.666 23.589 27.877
8 1.344 1.647 2.032 2.180 2.733 3.490 4.594 5.071 5.527 7.344 10 11.781 12.549 13.442 15.987 18.307 20.483 21.161 23.209 25.188 29.588
9 1.735 2.088 2.532 2.700 3.325 4.168 5.380 5.899 6.393 8.343
11 12.899 13.701 14.631 17.275 19.675 21.920 22.618 24.725 26.757 31.264
10 2.156 2.558 3.059 3.247 3.940 4.865 6.179 6.737 7.267 9.342
12 14.011 14.845 15.812 18.549 21.026 23.337 24.054 26.217 28.300 32.909
11 2.603 3.053 3.609 3.816 4.575 5.578 6.989 7.584 8.148 10.341 13 15.119 15.984 16.985 19.812 22.362 24.736 25.471 27.688 29.819 34.527
12 3.074 3.571 4.178 4.404 5.226 6.304 7.807 8.438 9.034 11.340 14 16.222 17.117 18.151 21.064 23.685 26.119 26.873 29.141 31.319 36.124
13 3.565 4.107 4.765 5.009 5.892 7.041 8.634 9.299 9.926 12.340 15 17.322 18.245 19.311 22.307 24.996 27.488 28.259 30.578 32.801 37.698
14 4.075 4.660 5.368 5.629 6.571 7.790 9.467 10.165 10.821 13.339
15 4.601 5.229 5.985 6.262 7.261 8.547 10.307 11.037 11.721 14.339 16 18.418 19.369 20.465 23.542 26.296 28.845 29.633 32.000 34.267 39.252
17 19.511 20.489 21.615 24.769 27.587 30.191 30.995 33.409 35.718 40.791
16 5.142 5.812 6.614 6.908 7.962 9.312 11.152 11.912 12.624 15.338
18 20.601 21.605 22.760 25.989 28.869 31.526 32.346 34.805 37.156 42.312
17 5.697 6.408 7.255 7.564 8.672 10.085 12.002 12.792 13.531 16.338
18 6.265 7.015 7.906 8.231 9.390 10.865 12.857 13.675 14.440 17.338
19 21.689 22.718 23.900 27.204 30.144 32.852 33.687 36.191 38.582 43.819
19 6.844 7.633 8.567 8.907 10.117 11.651 13.716 14.562 15.352 18.338 20 22.775 23.828 25.038 28.412 31.410 34.170 35.020 37.566 39.997 45.314
20 7.434 8.260 9.237 9.591 10.851 12.443 14.578 15.452 16.266 19.337 21 23.858 24.935 26.171 29.615 32.671 35.479 36.343 38.932 41.401 46.796
21 8.034 8.897 9.915 10.283 11.591 13.240 15.445 16.344 17.182 20.337 22 24.939 26.039 27.301 30.813 33.924 36.781 37.659 40.289 42.796 48.268
22 8.643 9.542 10.600 10.982 12.338 14.041 16.314 17.240 18.101 21.337 23 26.018 27.141 28.429 32.007 35.172 38.076 38.968 41.638 44.181 49.728
23 9.260 10.196 11.293 11.689 13.091 14.848 17.187 18.137 19.021 22.337 24 27.096 28.241 29.553 33.196 36.415 39.364 40.270 42.980 45.558 51.179
24 9.886 10.856 11.992 12.401 13.848 15.659 18.062 19.037 19.943 23.337 25 28.172 29.339 30.675 34.382 37.652 40.646 41.566 44.314 46.928 52.619
25 10.520 11.524 12.697 13.120 14.611 16.473 18.940 19.939 20.867 24.337
26 29.246 30.435 31.795 35.563 38.885 41.923 42.856 45.642 48.290 54.051
26 11.160 12.198 13.409 13.844 15.379 17.292 19.820 20.843 21.792 25.336 27 30.319 31.528 32.912 36.741 40.113 43.195 44.140 46.963 49.645 55.475
27 11.808 12.878 14.125 14.573 16.151 18.114 20.703 21.749 22.719 26.336 28 31.391 32.620 34.027 37.916 41.337 44.461 45.419 48.278 50.994 56.892
28 12.461 13.565 14.847 15.308 16.928 18.939 21.588 22.657 23.647 27.336 29 32.461 33.711 35.139 39.087 42.557 45.722 46.693 49.588 52.335 58.301
29 13.121 14.256 15.574 16.047 17.708 19.768 22.475 23.567 24.577 28.336 30 33.530 34.800 36.250 40.256 43.773 46.979 47.962 50.892 53.672 59.702
30 13.787 14.953 16.306 16.791 18.493 20.599 23.364 24.478 25.508 29.336
40 20.707 22.164 23.838 24.433 26.509 29.051 32.345 33.66 34.872 39.335 40 44.165 45.616 47.269 51.805 55.758 59.342 60.436 63.691 66.766 73.403
50 27.991 29.707 31.664 32.357 34.764 37.689 41.449 42.942 44.313 49.335 50 54.723 56.334 58.164 63.167 67.505 71.420 72.613 76.154 79.490 86.660
60 35.534 37.485 39.699 40.482 43.188 46.459 50.641 52.294 53.809 59.335 60 65.226 66.981 68.972 74.397 79.082 83.298 84.58 88.379 91.952 99.608
Ejemplo

Tatiana Jiménez (tjimenez@unisalle.edu.co)


23. Control de plomo en el aire En la siguiente lista se incluyen cantidades de plomo medidas
en el aire (en microgramos por metro cúbico o mg/m3). La EPA estableció un estándar de calidad
del aire para el plomo de 1.5 mg/m3. Las mediciones que se presentan a continuación se registraron
en el edificio 5 del World Trade Center en diferentes días posteriores a la destrucción causada por
los ataques terroristas del 11 de septiembre de 2001. Utilice los valores dados para construir un
intervalo de confianza del 95% para la desviación estándar de las cantidades de plomo en el aire.
¿Hay algo en este conjunto de datos que sugiera que el intervalo de confianza no es muy bueno?
Explique.

5.40 1.10 0.42 0.73 0.48 1.10


Ejemplo
23. Control de plomo en el aire En la siguiente lista se incluyen cantidades de plomo medidas

Tatiana Jiménez (tjimenez@unisalle.edu.co)


en el aire (en microgramos por metro cúbico o mg/m3). La EPA estableció un estándar de calidad
del aire para el plomo de 1.5 mg/m3. Las mediciones que se presentan a continuación se registraron
en el edificio 5 del World Trade Center en diferentes días posteriores a la destrucción causada por
los ataques terroristas del 11 de septiembre de 2001. Utilice los valores dados para construir un
intervalo de confianza del 95% para la desviación estándar de las cantidades de plomo en el aire.
¿Hay algo en este conjunto de datos que sugiera que el intervalo de confianza no es muy bueno?
Explique.

5.40 1.10 0.42 0.73 0.48 1.10


> limite_inf<-5*var(plomo)/qchisq(0.025,5,lower.tail = FALSE)
> limite_sup<-5*var(plomo)/qchisq(0.025,5,lower.tail = TRUE)
> limite_inf
[1] 1.427694
> limite_sup
[1] 22.04118
Con un 95% de confianza la desviación > sqrt(limite_inf)
estándar de plomo en el aire se encuentra [1] 1.194861
entre 1.195 y 4.695 µg/m3 > sqrt(limite_sup) IC(σ, 95%) = [1.19;4.69]
[1] 4.694803
Ejemplo
23. Control de plomo en el aire En la siguiente lista se incluyen cantidades de plomo medidas

Tatiana Jiménez (tjimenez@unisalle.edu.co)


en el aire (en microgramos por metro cúbico o mg/m3). La EPA estableció un estándar de calidad
del aire para el plomo de 1.5 mg/m3. Las mediciones que se presentan a continuación se registraron
en el edificio 5 del World Trade Center en diferentes días posteriores a la destrucción causada por
los ataques terroristas del 11 de septiembre de 2001. Utilice los valores dados para construir un
intervalo de confianza del 95% para la desviación estándar de las cantidades de plomo en el aire.
¿Hay algo en este conjunto de datos que sugiera que el intervalo de confianza no es muy bueno?
Explique.

5.40 1.10 0.42 0.73 0.48 1.10

> qqnorm(plomo)
> qqline(plomo)
que sus baterías durarán, en promedio, 3 años con una para σ en el e
varianza de 1 año. Suponga que 5 de estas baterías tie-
nen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años y con 9.77 Constr
base en esto construya un intervalo de confianza del para σ1/σ2 en
Ejemplo
95% para σ 2, después decida si la afirmación del fabri- σ1 y σ2 son, r
cante de que σ 2 = 1 es válida. Suponga que la pobla- para las dista
ción de duraciones de las baterías se distribuye de de los camion
forma aproximadamente normal.
9.78 Constr
9.72 Una muestra aleatoria de 20 estudiantes obtuvo para σ 2/σ 2
1 2
una media de x̄ = 72 y una varianza de s = 16 en un justifica que
2

examen universitario de colocación en matemáticas. truimos nuest


Suponga que las calificaciones se distribuyen normal-
mente y con base en esto construya un intervalo de con- 9.79 Constr
fianza del 98% para σ 2. para σ 21/σ 22
9.73 Construya un intervalo de confianza del 95% beríamos sup
para σ 2 en el ejercicio 9.9 de la página 283. nuestro interv
Tatiana Jiménez (tjimenez@unisalle.edu.co)

9.74 Construya un intervalo de confianza del 99% 9.80 Const


nen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años y con 9.77 Construya un in
base en esto construya un intervalo de confianza del para σ1/σ2 en el ejercic
95% para σ 2, después decida si la afirmación del fabri- σ1 y σ2 son, respectivam
para las distancias reco
cante de que σ 2 = 1 es válida. Suponga que la pobla-
ción de duraciones de las baterías se distribuye de
Ejemplo
de los camiones compa
forma aproximadamente normal.
9.78 Construya un in
9.72 Una muestra aleatoria de 20 estudiantes obtuvo para σ 21/σ 22 en el ejerc

Tatiana Jiménez (tjimenez@unisalle.edu.co)


una media de x̄ = 72 y una varianza de s2 = 16 en un justifica que supongam
examen universitario de colocación en matemáticas. truimos nuestro interva
Suponga que las calificaciones se distribuyen normal-
mente y con base en esto construya un intervalo de con- 9.79 Construya un in
fianza del 98% para σ 2. para σ 21/σ 22 en el ejerc
9.73 Construya un intervalo de confianza del 95% beríamos suponer que
para σ 2
en el ejercicio
= FALSE) 9.9 de la página 283. nuestro intervalo de con
> limite_inf<-19*16/qchisq(0.01,19,lower.tail IC(σ2, 98%) = [8.4 ; 39.8]
> limite_sup<-19*16/qchisq(0.01,19,lower.tail = TRUE)
> limite_inf 9.74 Construya un intervalo de confianza del 99% 9.80 Construya un in
[1] 8.399909
> limite_sup
para σ en el ejercicio 9.11 deCon
2
la un 98% de confianza la varianza
página 283.
poblacional de las calificaciones
2 2
se σ /σ en el eje
para A B
[1] 39.82848
9.75 Construya un encuentra
intervalo de confientre
anza8.4
dely 39.8
99% ¿Tendría que utilizar la
para σ en el ejercicio 9.12 de la página 283. varianza?
1.851 < < 7.549.
σ2
Como este intervalo no permite la posibilidad de que σ1
suponer que σ1 ≠ σ2 o σ 21 ≠ σ 22 en el ejemplo 9.12.
Ejemplo
Ejercicios
9.71 Un fabricante de baterías para automóvil afirma 9.76 Construya un i
que sus baterías durarán, en promedio, 3 años con una para σ en el ejercicio 9
varianza de 1 año. Suponga que 5 de estas baterías tie-
nen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años y con 9.77 Construya un in
base en esto construya un intervalo de confianza del para σ1/σ2 en el ejercic
95% para σ 2, después decida si la afirmación del fabri- σ1 y σ2 son, respectivam
cante de que σ 2 = 1 es válida. Suponga que la pobla- para las distancias reco
ción de duraciones de las baterías se distribuye de de los camiones compa
forma aproximadamente normal.
9.78 Construya un i
9.72 Una muestra aleatoria de 20 estudiantes obtuvo para σ 21/σ 22 en el ejerc
una media de x̄ = 72 y una varianza de s2 = 16 en un justifica que supongam
examen universitario de colocación en matemáticas.
Tatiana Jiménez (tjimenez@unisalle.edu.co)
truimos nuestro interva
Suponga que las calificaciones se distribuyen normal-
σ1
1.851 < < 7.549.
σ2
Como este intervalo no permite la posibilidad de que σ1/σ2 sea igual a 1, es correcto
suponer que σ1 ≠ σ2 o σ 21 ≠ σ 22 en el ejemplo 9.12.
Ejemplo
Ejercicios
9.71 Un fabricante de baterías para automóvil afirma 9.76 Construya un intervalo de confianza del 90%

Tatiana Jiménez (tjimenez@unisalle.edu.co)


que sus baterías durarán, en promedio, 3 años con una para σ en el ejercicio 9.13 de la página 283.
varianza de 1 año. Suponga que 5 de estas baterías tie-
nen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años y con 9.77 Construya un intervalo de confianza del 98%
base en esto construya un intervalo de confianza del para σ1/σ2 en el ejercicio 9.42 de la página 295, donde
95% para σ 2, después decida si la afirmación del fabri- σ1 y σ2 son, respectivamente, las desviaciones estándar
cante de que σ 2 = 1 es válida. Suponga que la pobla- para las distancias recorridas por litro de combustible
ción de duraciones de las baterías se distribuye de de los camiones compactos Volkswagen y Toyota.
forma aproximadamente normal.
9.78 Construya un intervalo de confianza del 90%
9.72 Una muestra aleatoria de 20 estudiantes obtuvo para σ 21/σ 22 en el ejercicio 9.43 de la página 295. ¿Se
una media de x̄ = 72 y una varianza de s2 = 16 en un justifica que supongamos que σ 21 ≠ σ 22 cuando cons-
examen universitario de colocación en matemáticas. truimos nuestro intervalo de confianza para µ1 – µ2?
Suponga que las calificaciones se distribuyen normal-
mente y con base en esto construya un intervalo de con- 9.79 Construya un intervalo de confianza del 90%
> qqnorm(duracion)
fianza del 98% para σ 2. para σ 21/σ 22 en el ejercicio 9.46 de la página 295. ¿De-
> qqline(duracion)
9.73 Construya un intervalo de confianza del 95% beríamos suponer que σ 21 = σ 22 cuando construimos
para σ 2 en el ejercicio 9.9 de la página 283. nuestro intervalo de confianza para µI – µII?
σ1
1.851 < < 7.549.
σ2
Como este intervalo no permite la posibilidad de que σ1/σ2 sea igua
suponer que σ1 ≠ σ2 o σ 21 ≠ σ 22 en el ejemplo 9.12.
Ejemplo
Ejercicios
9.71 Un fabricante de baterías para automóvil afirma 9.76 Construya un intervalo de c

Tatiana Jiménez (tjimenez@unisalle.edu.co)


que sus baterías durarán, en promedio, 3 años con una para σ en el ejercicio 9.13 de la pági
varianza de 1 año. Suponga que 5 de estas baterías tie-
nen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años y con 9.77 Construya un intervalo de c
base en esto construya un intervalo de confianza del para σ1/σ2 en el ejercicio 9.42 de la
95% para σ 2, después decida si la afirmación del fabri- σ1 y σ2 son, respectivamente, las des
cante de que σ 2 = 1 es válida. Suponga que la pobla- para las distancias recorridas por lit
ción de duraciones de las baterías se distribuye de de los camiones compactos Volkswa
forma aproximadamente normal.
9.78 Construya un intervalo de c
9.72 Una muestra aleatoria de 20 estudiantes obtuvo para σ 2/σ 2 en el ejercicio 9.43 de
> limite_sup<-4*var(duracion)/qchisq(0.025,4,lower.tail = TRUE) Con2un 95% de confianza, 1 la 2varianza
una media de x̄ = 72 y una varianza de s = 16 en un 2
> limite_inf<-4*var(duracion)/qchisq(0.025,4,lower.tail = FALSE) justifica que
poblacional se encuentra entre 0.29 y 6.73.que σ 1 ≠
supongamos
> limite_inf examen universitario de colocación en matemáticas. truimos nuestro intervalo de confianz
[1] 0.2925528 Suponga que las calificaciones se distribuyen normal-
> limite_sup Como el valor 1 se encuentra el el Intervalo
mente y con base en esto construya un intervalo de con- 9.79 Construya un intervalo de c
[1] 6.729717 de confianza, la afirmación del fabricante
fianza del 98% para σ 2. 2 2
parece ser válida. para σ 1/σ 2 en el ejercicio2
9.46 de la
2
9.73 Construya un intervalo de confianza del 95% beríamos suponer que σ 1 = σ 2 cu
IC(σ2, 95%) = [0.29; 6.73]
2 nuestro intervalo de confianza para µ
Intervalo de confianza
para π

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Requisitos para construir el
intervalo de confianza

Tatiana Jiménez (tjimenez@unisalle.edu.co)


À  La muestra debe ser aleatoria simple.
À  Se debe cumplir con las características de una distribución binomial
À  La cantidad de éxitos y fracasos deben ser de al menos 5
de confianza del 96% para la parte de la población rencia en e
votante que está a favor del juicio. encuestados
b) ¿Qué podemos afirmar con 96% de confianza dense debe
Ejemplo
acerca de la posible magnitud de nuestro error, si tamaño deb
estimamos que la fracción de votantes que está a encuesta si
favor del juicio de anexión es 0.57? el porcentaj

Tatiana Jiménez (tjimenez@unisalle.edu.co)


je verdader
9.54 Un fabricante de reproductores de MP3 utiliza
un conjunto de pruebas exhaustivas para evaluar el fun- 9.59 ¿Qué
cionamiento eléctrico de su producto. Todos los repro- mos tener u
ductores de MP3 deben pasar todas las pruebas antes ción de la m
de ser puestos a la venta. De una muestra aleatoria de 0.02 de la f
500 reproductores, 15 no pasan una o más de las prue- 9.60 ¿Qué
bas. Calcule un intervalo de confianza del 90% para la seamos tene
proporción de los reproductores de MP3 de la pobla- porción de
ción que pasan todas las pruebas. del 0.05 de
9.55 Se está considerando un nuevo sistema de lanza- ciudad que
miento de cohetes para el despliegue de cohetes peque- calefacción
dador espacial es una buena inversión es de 2/3?
votantes en una ciudad y se encuentra que 114
apoyan un juicio de anexión. Calcule el intervalo 9.58 En el artículo del periódico al que se hace refe-
de confianza del 96% para la parte de la población rencia en el ejercicio 9.57, 32% de los 1600 adultos
encuestados dijo que el programa espacial estadouni-
votante que está a favor del juicio.
b) ¿Qué podemos afirmar con 96% de confianza Ejemplo
dense debería enfatizar la exploración científica. ¿Qué
acerca de la posible magnitud de nuestro error, si tamaño debería tener una muestra de adultos para la
estimamos que la fracción de votantes que está a encuesta si se desea tener un 95% de confianza en que
favor del juicio de anexión es 0.57? el porcentaje estimado esté dentro del 2% del porcenta-

Tatiana Jiménez (tjimenez@unisalle.edu.co)


je verdadero?
9.54 Un fabricante de reproductores de MP3 utiliza
un conjunto de pruebas exhaustivas para evaluar el fun- 9.59 X¿Qué
:= cantidad de MP3
tamaño debería que
tener unapasan la si
muestra prueba
desea-
n = 500
mos tener un 96% de confianza en que nuestra propor-
cionamiento eléctrico de su producto. Todos los repro- x = 485
ductores de MP3 deben pasar todas las pruebas antes ción de la muestra en el ejercicio 9.53 esté dentro del
de ser puestos a la venta. De una muestra aleatoria de 0.02 dep la
= fracción
485/500 verdadera de la población votante?
q = 15/500
500 reproductores, 15 no pasan una o más de las prue- 9.60 ¿Qué tamaño debería tener una muestra si de-
bas. Calcule un intervalo de confianza del 90% para la seamos tener un 99% de confianza en que nuestra pro-
proporción de los reproductores de MP3 de la pobla- porción de la muestra en el ejercicio 9.51 esté dentro
ción que pasan todas las pruebas. del 0.05 de la proporción verdadera de viviendas en esa
9.55 Se está considerando un nuevo sistema de lanza- ciudad que utilizan petróleo como combustible para la
> limite_inf<-(485/500-qnorm(0.05,mean=0,sd=1,lower.tail = calefacción?
miento de cohetes para el despliegue de cohetes peque-
FALSE)*sqrt((485/500*15/500)/500))
> ños, de corto alcance. La probabilidad de que el sistema
limite_sup<-(485/500+qnorm(0.05,mean=0,sd=1,lower.tail = 9.61 IC(π;
¿Qué 90%) = [0.96
tamaño ; 0.98]
debería tener una muestra en el
FALSE)*sqrt((485/500*15/500)/500))
existente tenga un lanzamiento exitoso se representa con ejercicio 9.52 si deseamos tener un 98% de confianza
> limite_inf Lanuestra
proporción de MP3
= 0.8. Se toma una muestra de 40 lanzamientos expe-
p 0.9574516
[1] en que proporción de laque pasan
muestra estéladentro del
> rimentales
limite_sup con el nuevo sistema y 34 resultan exitosos.
prueba
0.05 de se encuentra
la proporción entre
verdadera 0.96 y 0.98
de defectuosos?
[1]a)
0.9825484
Construya un intervalo de confianza del 95% para p.
miento de cohetes para el despliegue de cohetes peque-
ños, de corto alcance. La probabilidad de que el sistema 9.61 ¿Qué tama
existente tenga un lanzamiento exitoso se representa con ejercicio 9.52 si d
p = 0.8. Se toma una muestra de 40 lanzamientos expe-Ejemplo
en que nuestra pro
rimentales con el nuevo sistema y 34 resultan exitosos. 0.05 de la proporc
a) Construya un intervalo de confianza del 95% para p. 9.62 Una conjet
b) ¿Con base en sus resultados, concluiría que el nue- to de microbiolog
vo sistema es mejor? la Universidad de
9.56 Un genetista está interesado en determinar la afirma que un pa
proporción de hombres africanos que padecen cierto proporciona sufic
trastorno sanguíneo menor. En una muestra aleatoria de los dientes. ¿Qué
100 hombres africanos encuentra que 24 lo padecen. estimar el porcent
a) Calcule un intervalo de confianza del 99% para la están a favor de te
proporción de hombres africanos que padecen este menos un 99% d
trastorno sanguíneo. dentro del 1% del

Tatiana Jiménez (tjimenez@unisalle.edu.co)


ños, de corto alcance. La probabilidad de que el sistema 9.61 ¿Qué tamaño debería tener una muestra en el
existente tenga un lanzamiento exitoso se representa con ejercicio 9.52 si deseamos tener un 98% de confianza
p = 0.8. Se toma una muestra de 40 lanzamientos expe- en que nuestra proporción de la muestra esté dentro del
rimentales con el nuevo sistema y 34 resultan exitosos.
a) Construya un intervalo de confianza del 95% para p. Ejemplo
0.05 de la proporción verdadera de defectuosos?
9.62 Una conjetura de un catedrático del departamen-
b) ¿Con base en sus resultados, concluiría que el nue- to de microbiología, de la Facultad de Odontología de
vo sistema es mejor? la Universidad de Washington, en St. Louis, Missouri,

Tatiana Jiménez (tjimenez@unisalle.edu.co)


9.56 Un genetista está interesado en determinar la afirma que un par de tasas diarias de té verde o negro
proporción de hombres africanos que padecen cierto proporciona suficiente
X := cantidad flúor paraafricanos
de hombres evitar el deterioro
que de
trastorno sanguíneo menor. En una muestra aleatoria de los padecen
dientes. ¿Qué tan grandesanguíneo
el trastorno debería ser la muestra para
100 hombres africanos encuentra que 24 lo padecen. estimar el porcentaje de habitantes de cierta ciudad que
n = 100
a) Calcule un intervalo de confianza del 99% para la están
x =a 24
favor de tener agua fluorada, si se desea tener al
proporción de hombres africanos que padecen este menos
p = un 99% de confianza en que el estimado está
24/100
trastorno sanguíneo. dentro
q = del 1% del porcentaje verdadero?
76/100

> limite_inf<-(24/100-qnorm(0.025,mean=0,sd=1,lower.tail =
FALSE)*sqrt((24/100*76/100)/100))
> limite_sup<-(24/100+qnorm(0.025,mean=0,sd=1,lower.tail =
FALSE)*sqrt((24/100*76/100)/100)) IC(π; 95%) = [0.16 ; 0.32]
> limite_inf
[1] 0.1562932
> limite_sup 302
P_Walpole-09.indd La proporción de hombreas africanos
[1] 0.3237068 que padecen este trastorno sanguíneo
está entre 0.16 y 0.32
Ejemplo

29. Selección del género El Genetics and IVF Institute realizó una prueba clínica del método
XSORT, diseñado para incrementar la probabilidad de concebir una niña. Para cuando se escribía
este libro, ya habían nacido 574 bebés de padres que utilizaron el método XSORT, y 525 de esos
bebés eran niñas.
a) ¿Cuál es la mejor estimación puntual de la proporción poblacional de niñas nacidas de padres
que usaron el método XSORT?
b) Utilice los datos muestrales para construir un intervalo de confianza del 95% para el porcen-
taje de niñas nacidas de padres que utilizaron el método XSORT.
c) Con base en el resultado, ¿parece que el método XSORT es eficaz? ¿Por qué?

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Resumen

Tatiana Jiménez (tjimenez@unisalle.edu.co)


1.  Identifique el parámetro de interés.
2.  Calcule (o identifique, según el caso) el valor del mejor estimador puntual para el parámetro.
3.  Calcule el error estándar del estimador.
4.  Utilice la distribución de probabilidad adecuada para obtener el valor que representa la confianza
del intervalo.
5.  Obtenga el límite inferior y superior del intervalo de confianza.
6.  Interprete el resultado obtenido.
7.  De respuesta a la pregunta realizada.
8.  Verifique SIEMPRE el supuesto de comportamiento NORMAL (utilizando la grafica qq o con el
enunciado del ejercicio)
Resumen instrucciones en R

Tatiana Jiménez (tjimenez@unisalle.edu.co)


À  Gráfico de probabilidad normal > qqnorm(X)
> qqline(X)
À  Valor de la distribución normal > qnorm(α/2,mean=0,sd=1,lower.tail = FALSE)
À  Valor de la distribución t > qt(α/2, gl, lower.tail = FALSE)
À  Valor inferior de la distribución χ2 > qchisq(α/2, gl, lower.tail = FALSE)
À  Valor superior de la distribución χ2 > qchisq(α/2, gl, lower.tail = TRUE)
Pruebas de hipótesis

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Prueba de hipótesis

À  Una hipótesis es una afirmación que se realiza sobre el comportamiento de una población.

À  Una hipótesis estadística es la afirmación traducida en términos de parámetros y valores.

À  Una prueba de hipótesis es un procedimiento estadístico para verificar los valores propuestos en
la hipótesis estadística.

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Procedimiento de prueba de
hipótesis

Identificar Determinar Calcular Tomar


Establecer
afirmación valores valor de decisión Concluir
Ho e Ha
general críticos prueba estadística

Se encuentra en Se construyen las Se identifican los Con los datos de Se compara el Según la
el contexto del dos, a partir de valores críticos la muestra se valor del decisión
ejercicio o la afirmación en la distribución calcula el valor estimador con estadística se
investigación general, muestral del del estimador los valores concluye sobre
identificando el estimador críticos y se toma la afirmación
parámetro de la decisión general
interés y el valor estadística
propuesto

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Hipótesis nula e hipótesis alterna

À  Hipótesis nula: Representa las expresiones de: igualdad (=), mayor o igual (≥) y menor o igual (≤),
entre el parámetro y el valor específico.
À  Hipótesis alterna: Representa las expresiones de: diferente a (≠), mayor (>) y menor (<), entre el
parámetro y el valor específico.

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Ejemplos
Establecer
Ho e Ha

À  La edad media de los estudiantes en la universidad es de 21 años


À  La velocidad media de los autos en carretera es a lo sumo 80Km por hora
À  La edad media de los vicepresidentes corporativos no es inferior a 49 años
À  El pesos promedio de los jugadores del equipo de fútbol de este año es diferente al peso promedio de los
jugadores del año pasado , el cual fue de 210 libras.
À  Más del 90% de las personas sin hogar son adictas al alcohol o a sustancias tóxicas
À  El promedio de estudiantes hombres supera a 3.4
À  No más del 80% de los presos en la cárcel distrital son arrestados por cargos relacionados con drogas

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Tipo de prueba de hipótesis
Para
establecer
valores
críticos

À  Dependiendo de la HIPÓTESIS ALTERNA, se definen tres tipos de pruebas de hipótesis:

À  Si la hipótesis alterna está definida con “<“, entonces se tiene una prueba de hipótesis denominada
PRUEBA DE COLA IZQUIERDA

À  Si la hipótesis alterna está definida con “≠“, entonces se tiene una prueba de hipótesis denominada
PRUEBA DE DOS COLAS

À  Si la hipótesis alterna está definida con “>“, entonces se tiene una prueba de hipótesis denominada
PRUEBA DE COLA DERECHA

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Tipos de error en pruebas de
hipótesis

Decisión Estadística
La afirmación en la (se toma sobre Ho)
población es:
Rechazar No rechazar
Verdadera Error tipo I No hay error
Falsa No hay error Error tipo II

El nivel de significancia (α) es la probabilidad de cometer el error tipo I

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Tipos de error en pruebas de hipótesis
(Ejemplo)

En el sistema legal, al acusado se le considera inocente hasta que se demuestre que es culpable.

En este caso

•  Hipótesis nula à “el acusado es inocente”


•  Hipótesis alterna à “el acusado es culpable”
El jurado decidió
El acusado es:
Un jurado tiene dos posibles decisiones: Encarcelar Exonerar
Inocente
•  Encarcelar al acusado (Declararlo culpable)
•  Exonerarlo (Declararlo inocente) Culpable

¿Cuál es el error Tipo I en este caso?


¿Cuál es el error Tipo II en este caso?

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Valores críticos y zonas críticas
(Distribución muestral à normal)
Valores
críticos
À  Dependiendo del tipo de hipótesis y del tamaño del nivel de significancia se
establecen los valores críticos y las zonas criticas.

Zona de
NO Zona de Zona de
rechazo NO NO
para Ho rechazo rechazo
para Ho para Ho

-Zα/2 Zα/2 -Zα Zα

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Valores críticos y zonas críticas
(Distribución muestral à t-student)
Valores
críticos
À  Dependiendo del tipo de hipótesis y del tamaño del nivel de significancia se
establecen los valores críticos y las zonas criticas.

Zona de
Zona de Zona de
NO
NO NO
rechazo
rechazo rechazo
para Ho
para Ho para Ho

-tα/2,v tα/2,v -tα,ν tα,ν

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Valores críticos y zonas críticas
(Distribución muestral à ji-cuadrado)
Valores
críticos
À  Dependiendo del tipo de hipótesis y del tamaño del nivel de significancia se
establecen los valores críticos y las zonas criticas.

Zona de Zona de Zona de


NO NO NO
rechazo rechazo rechazo
para Ho para Ho para Ho

χ2(1-α/2),n-1 χ2α/2,n-1 χ2(1-α),n-1 χ2α,n-1

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Valores críticos y zonas críticas
(Distribución muestral à F)

À  Dependiendo del tipo de hipótesis y del tamaño del nivel de significancia se


establecen los valores críticos y las zonas criticas.

Zona de Zona de Zona de


NO NO NO
rechazo rechazo rechazo
para Ho para Ho para Ho

1/Fα/2,v2,v1 Fα/2,v1,v2 1/Fα,v2,v1 Fα,v1,v2

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Resumen de Valores críticos
Determinar
valores Distribución Ha cola izquierda Ha cola derecha Ha de dos colas
críticos

Tatiana Jiménez (tjimenez@unisalle.edu.co)


-Zα/2
Normal -Zα Zα

Zα/2
-tα/2, n-1
t(α,n-1)
t-student -tα,n-1 tα/2, n-1


χ(1-α/2,n-1)
ji-cuadrado χ(1-α,n-1) χ(α,n-1)
χ(α/2,n-1)

F(1-α/2,n1-1,n2-1)
F(α,n1-1,n2-1)
F F(1-α,n1-1,n2-1) F(α/2,n1-1,n2-1)
Valores de prueba
para comprobación de hipótesis
Calcular
valor de
prueba

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Toma de decisión estadística
Tomar
decisión
estadística

Rechazar Ho si No rechazar Ho si

El valor de prueba es menor Si el valor de prueba es mayor


Ha cola izquierda
al valor crítico. o igual al valor crítico.

El valor de prueba es mayor Si el valor de prueba es


Ha cola derecha
al valor crítico. menor o igual al valor crítico.

Si el valor de prueba se Si el valor de prueba se


encuentra por fuera del encuentra dentro del
Ha de dos colas
intervalo definido por los intervalo definido por los
valores críticos. valores críticos.

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Definición de p-valor
El p_valor es la probabilidad observada de cometer el error tipo I.

p_valor = P(Rechazar Ho | Ho es verdadera; a partir de los datos de muestra) à probabilidad empírica


se puede resumir de la siguiente manera:
Región crítica en la cola izquierda: Valor P = área a la izquierda del estadístico
de prueba
Región crítica en la cola derecha: Valor P = área a la derecha del estadístico de
prueba
Región crítica en dos colas: Valor P = dos veces el área de la cola más allá
del estadístico de prueba
La hipótesis nula se rechaza si el valor P es muy pequeño, como 0.05 o menos. La si-
guiente es una herramienta para la memoria que sirve para interpretar el valor P:
Si P es un valor bajo, la hipótesis nula se rechaza.
Si P es un valor alto, la hipótesis nula se queda.

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Tatiana Jiménez (tjimenez@unisalle.edu.co)
Ejemplos
1.  Identificar el parámetro de interés (µ, π, σ)
2.  Identificar la afirmación que se quiere probar
3.  Traducirla a hipótesis estadística
4.  Realizar la prueba correspondiente
Tatiana Jiménez (tjimenez@unisalle.edu.co)
Prueba de hipótesis
para la proporción
poblacional π.
Ejemplo 1
12. Pruebas para el consumo de mariguana La compañía Drug Test Success ofrece la prueba
“1-Panel-THC” para el consumo de mariguana. De 300 sujetos sometidos a prueba, los resulta-
dos de 27 fueron incorrectos (es decir, fueron falsos positivos o falsos negativos). Utilice un nivel de
significancia de 0.05 para someter a prueba la afirmación de que menos del 10% de los resultados
de prueba son incorrectos. ¿Parece que la prueba es buena para la mayoría de los propósitos?

Parámetro de interés à π (proporción poblacional)


Afirmación à “Menos del 10% de los resultados de la prueba son incorrectos” π < 0.10 à Ha

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Solución Ejemplo 1

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Ho: π ≥ 0.10
Ha: π < 0.10 El valor de prueba se encuentra en la
zona de NO rechazo para Ho
prueba de Al 5% de significancia no hay evidencia para
cola izquierda Zona de rechazar Ho
NO
rechazo
para Ho La proporción de resultados incorrectos de
pruebas es de al menos 10%
-Zα=-1.645
La prueba no parece buena a sus propósitos

> pnorm((27/300-0.10)/sqrt(0.10*0.9/50),mean=0, sd=1,lower.tail =


TRUE)
[1] 0.4068319

p-valor > α, por lo tanto no hay evidencia para rechazar Ho.


Ejemplo 2

Tatiana Jiménez (tjimenez@unisalle.edu.co)


10. Votación por el ganador En una elección presidencial, 308 de 611 votantes encuestados
dijeron haber votado por el candidato ganador (según datos de ICR Survey Research Group). Uti-
lice un nivel de significancia de 0.01 para someter a prueba la afirmación de que, de todos los
votantes, el porcentaje que dice haber votado por el candidato ganador es igual al 43%, que es el
porcentaje real de personas que votaron por el candidato ganador. ¿Qué sugieren los resultados
sobre la percepción de los votantes?

Parámetro de interés à π (proporción poblacional)


Afirmación à “el porcentaje que dice haber votado por el candidato ganador es igual a 43%”

π = 0.43 à Ho
Solución Ejemplo 2

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Ho: π = 0.43
Ha: π ≠ 0.43 El valor de prueba se encuentra en la
zona de Rechazo para Ho
prueba de dos
Zona de
colas NO
rechazo Al 1% de significancia hay evidencia para
para Ho rechazar Ho

-Z0.005 = -2.575 Z0.005 = 2.575


La proporción personas que dicen haber
votado por el candidato ganador no es de
43%

> 2*pnorm((308/611-0.43)/sqrt(0.43*0.57/611),mean=0, sd=1,lower.tail


= FALSE)
[1] 0.0002162045
Ejemplo 3
16. Predicción del sexo del bebé En el ejemplo 3 de esta sección se realizó una prueba de
hipótesis sobre las mujeres embarazadas y su capacidad para predecir el sexo de sus bebés. En el
mismo estudio, 45 mujeres embarazadas tenían más de 12 años de escolaridad, y 32 de ellas
hicieron predicciones correctas. Utilice estos resultados para someter a prueba la afirmación de
que las mujeres con más de 12 años de escolaridad tienen una proporción de predicciones correc-
tas que es mayor que la proporción de 0.5 esperada por el azar. Utilice un nivel de significancia
de 0.01. ¿Parece que estas mujeres tienen la capacidad de predecir correctamente el sexo de sus
bebés?
Parámetro de interés à π (proporción poblacional)
Afirmación à “las mujeres con más de 12 años de escolaridad tienen una proporción de
predicciones correctas que es mayor que la proporción de 0.5 esperada por el azar”

π > 0.50 à Ha

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Solución Ejemplo 3

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Ho: π ≤ 0.50
Ha: π > 0.50 El valor de prueba se encuentra en la
zona de Rechazo para Ho
prueba de Al 1% de significancia hay evidencia para
cola derecha Zona de rechazar Ho
NO
rechazo
para Ho Las mujeres mayores de 12 años de
escolaridad tienen una proporción de
Z0.01 = 2.33 predicciones correctas mayor a 0.50

> pnorm((32/45-0.50)/sqrt(0.50*0.5/45),mean=0, sd=1,lower.tail = FALSE)


[1] 0.002310342

p_valor < α, por lo tanto hay evidencia suficiente para rechazar Ho


Tatiana Jiménez (tjimenez@unisalle.edu.co)
Prueba de hipótesis
para la media
poblacional µ.

Con varianza poblacional conocida


Ejemplo 4
¿Qué sugieren esos resultados respecto del consejo del manual?
8. Conteo de glóbulos rojos en la sangre Se obtiene una muestra aleatoria simple de 50
adultos, y se hace un conteo de los glóbulos rojos en la sangre de cada persona (en glóbulos por
microlitro). La media muestral es 5.23; la desviación estándar poblacional de los conteos de gló-
bulos rojos es de 0.54. Utilice un nivel de significancia de 0.01 para someter a prueba la afirma-
ción de que la muestra proviene de una población con una media menor que 5.4, que es un valor
que a menudo se utiliza como límite superior para el rango de los valores normales. ¿Qué sugieren
los resultados sobre el grupo de la muestra?

Parámetro de interés à µ (media poblacional)


Afirmación à “la muestra proviene de una población con una media menor que 5.4”

µ < 5.4 à Ha

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Solución Ejemplo 4
Ho: µ ≥ 5.4
Ha: µ < 5.4 El valor de prueba se encuentra en la
zona de NO rechazo para Ho
prueba de
cola izquierda Zona de
NO Al 1% de significancia no hay evidencia para
rechazo
para Ho rechazar Ho

-Z0.01 = -2.33
La media poblacional no es menor 5.4

> pnorm((5.23-5.4)/(0.54/sqrt(50)),mean=0, sd=1,lower.tail = TRUE)


[1] 0.01300452

dado que el p_valor > α, no hay evidencia para rechazar la


hipótesis nula
Tatiana Jiménez (tjimenez@unisalle.edu.co)
Ejemplo 5

10. Temperaturas corporales humanas El conjunto de datos 2 del apéndice B incluye una
muestra de 106 temperaturas corporales, con una media de 98.20°F. Suponga que se sabe que s es
0.62°F. Utilice un nivel de significancia de 0.05 para someter a prueba la afirmación de que la
temperatura media corporal de la población es igual a 98.6°F, como suele creerse. ¿Existe evidencia
suficiente para concluir que esta creencia es errónea?

Parámetro de interés à µ (media poblacional)


Afirmación à “la temperatura media corporal de la población es igual a 98.6ºF”

µ = 98.6 à Ho

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Solución Ejemplo 5

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Ho: µ = 98.6
Ha: µ ≠ 98.6 El valor de prueba se encuentra en la
zona de rechazo para Ho
prueba de dos
Zona de
colas NO
rechazo Al 5% de significancia hay evidencia para
para Ho rechazar Ho

-Z0.025 = -1.96 Z0.025 = 1.96


La media real de la temperatura corporal no
es de 98.6

> 2*pnorm((98.20-98.6)/(0.62/sqrt(106)),mean=0, sd=1,lower.tail = TRUE)


[1] 3.087375e-11

Como p_valor < α, hay evidencia suficiente para rechazar Ho.


Ejemplo 6

14. Pesos de osos La salud de la población de osos del Yellowstone National Park es vigilada por
medio de las medidas periódicas que se realizan a osos anestesiados. Una muestra de 54 osos tiene
un peso medio de 182.9 libras. Suponiendo que sabemos que s es igual a 121.8 libras, utilice un
nivel de significancia de 0.05 para someter a prueba la afirmación de que la media poblacional de
todos estos pesos de osos es mayor que 150 libras.

Parámetro de interés à µ (media poblacional)


Afirmación à “la media poblacional de todos estos pesos de osos es mayor que 150 libras”

µ > 150 à Ha

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Solución Ejemplo 6
Ho: µ ≤ 150
Ha: µ > 150 El valor de prueba se encuentra en la
zona de Rechazo para Ho
prueba de Al 5% de significancia hay evidencia para
cola derecha Zona de
rechazar Ho
NO
rechazo El peso promedio de los osos es mayor a 150
para Ho libras.
Z0.01 = 1.645

> pnorm((182.9-150)/(121.8/sqrt(54)),mean=0, sd=1,lower.tail = FALSE)


[1] 0.02357606

p_valor < α, hay evidencia suficiente para rechazar Ho.

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Prueba de hipótesis
para la media
poblacional µ.

Con varianza poblacional desconocida

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Ejemplo 7
15. Alquitrán en cigarrillos Se obtiene una muestra aleatoria simple de 25 cigarrillos de 100 mm
con filtro, y se mide el contenido de alquitrán de cada uno. La muestra tiene una media de 13.2 mg
y una desviación estándar de 3.7 mg (de acuerdo con el conjunto de datos 4 del apéndice B). Uti-
lice un nivel de significancia de 0.05 para someter a prueba la afirmación de que el contenido
medio de alquitrán de cigarrillos de 100 mm con filtro es menor que 21.1 mg, que es la media para
los cigarrillos tamaño grande sin filtro. ¿Qué sugieren los resultados sobre la eficacia de los filtros?

Parámetro de interés à µ (media poblacional)


Afirmación à “El contenido medio de alquitrán de cigarrillos de 100mm con filtro es menor
que 21.1mg”

µ < 21.1 à Ha

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Solución Ejemplo 7
Ho: µ ≥ 21.1
Ha: µ < 21.1 El valor de prueba se encuentra en la
zona de rechazo para Ho
prueba de Al 5% de significancia hay evidencia para
cola izquierda Zona de rechazar Ho
NO
rechazo
para Ho El contenido medio de alquitrán de cigarrillos
de 100mm con filtro es menor que 21.1mg
-t0.05,24 = -1.711

> pt((13.2-21.1)/(3.7/sqrt(25)),24,lower.tail = TRUE)


[1] 6.75214e-11

p_valor < α, por lo tanto hay suficiente evidencia para rechazar Ho.

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Ejemplo 8
diantes es mayor que 4.5 años.
20. Alimentación eléctrica ininterrumpida (UPS). El conjunto de datos 13 del apéndice B
incluye las medidas de voltaje del UPS de respaldo del autor (APC modelo CS 350). Según el fa-
bricante, el voltaje normal de salida es de 120 volts. Las 40 medidas de voltaje del conjunto de
datos 13 tienen una media de 123.59 volts y una desviación estándar de 0.31 volts. Utilice un nivel
de significancia de 0.05 para someter a prueba la afirmación de que la muestra proviene de una
población con una media igual a 120 volts.
Parámetro de interés à µ (media poblacional)
Afirmación à “La muestra proviene de una población con una media igual a 120 volts.”

µ = 120 à Ho

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Solución Ejemplo 8
Ho: µ = 120
Ha: µ ≠ 120 El valor de prueba se encuentra en la
zona de rechazo para Ho
prueba de dos Al 5% de significancia hay evidencia para
Zona de
colas NO rechazar Ho
rechazo
para Ho
La media real del voltaje de salida no es de
120Volts.
-t0.025 ,39 = -2.023 t0.025,39 = 2.023

> 2*pt((123.59-120)/(0.31/sqrt(40)),39,lower.tail = FALSE)


[1] 2.206922e-43

p_valor < α, hay suficiente evidencia para rechazar Ho

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Ejemplo 9

22. Exceso de velocidad en California Se obtiene una muestra aleatoria simple de 40 velo-
cidades (en mi/h) de automóviles que viajaban en una sección de la carretera 405 en Los Ángeles.
La muestra tiene una media de 68.4 mi/h y una desviación estándar de 5.7 mi/h (según datos de
Sigalert). Utilice un nivel de significancia de 0.05 para someter a prueba la afirmación de que la ve-
locidad media de todos los automóviles es mayor que la velocidad máxima permitida de 65 mi/h.

Parámetro de interés à µ (media poblacional)


Afirmación à “La velocidad media de todos los automóviles es mayor que la velocidad
máxima permitida de 65mi/h”

µ > 65 à Ha

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Solución Ejemplo 9

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Ho: µ ≤ 65
Ha: µ > 65 El valor de prueba se encuentra en la
zona de Rechazo para Ho
prueba de Al 5% de significancia hay evidencia para
cola derecha Zona de rechazar Ho
NO
rechazo
para Ho La velocidad media de todos los automóviles
excede el límite de velocidad.
t0.05,39 = 1.684

> pt((68.4-65)/(5.7/sqrt(40)),39,lower.tail = FALSE)


[1] 0.0002685321

p_valor < α, hay suficiente evidencia para rechazar Ho


Prueba de hipótesis
para la varianza
poblacional σ.

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Ejemplo 10
14. Calificaciones en examen de estadística Los exámenes en los grupos de estadística del
autor tienen calificaciones con una desviación estándar igual a 14.1. Uno de sus últimos grupos
tuvo 27 calificaciones de examen con una desviación estándar de 9.3. Utilice un nivel de significan-
cia de 0.01 para someter a prueba la afirmación de que este grupo tiene menos variación que otros
grupos anteriores. ¿Una desviación estándar menor sugiere que a este último grupo le fue mejor?

Parámetro de interés à σ (desviación estándar poblacional)


Afirmación à “Este grupo tiene menos variación que otros grupos anteriores”

σ < 14.1 à Ha

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Solución Ejemplo 10
Ho: σ ≥ 14.1
Ha: σ < 14.1 El valor de prueba se encuentra en la
zona de rechazo para Ho
prueba de Al 1% de significancia hay evidencia para
cola izquierda rechazar Ho
Zona de
NO
rechazo La desviación estándar poblacional de este
para Ho
grupo es menor a los anteriores.
χ2(1-0.01),27-1 = 12.198

> pchisq(26*9.3^2/14.1^2,26,lower.tail = TRUE)


[1] 0.005564992

p_valor < α, hay evidencia suficiente para


rechazar Ho.

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Ejemplo 11
15. Pulsos de mujeres Una muestra aleatoria simple de los pulsos de 40 mujeres tiene una desvia-
ción estándar de 12.5 latidos por minuto (de acuerdo con el conjunto de datos 1 del apéndice B).
El rango normal del pulso de adultos suele reportarse entre 60 y 100 latidos por minuto. Si la regla
práctica de las desviaciones se aplica al rango normal, el resultado es una desviación estándar de
10 latidos por minuto. Utilice los resultados muestrales con un nivel de significancia de 0.05 para
someter a prueba la afirmación de que los pulsos de mujeres tienen una desviación estándar igual
a 10 latidos por minuto.
Parámetro de interés à σ (desviación estándar poblacional)
Afirmación à “Los pulsos de las mujeres tienen una desviación estándar igual a 10 latidos
por minuto”
σ = 10 à Ho

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Solución Ejemplo 11
Ho: σ = 10
Ha: σ ≠ 10 El valor de prueba se encuentra en la
zona de rechazo para Ho
prueba de dos Al 5% de significancia hay evidencia para
colas Zona de rechazar Ho
NO
rechazo
para Ho La desviación estándar del pulso de las
mujeres no es igual a 10.
χ20.975,39 χ20.025,39
24.433 59.342

> 2*pchisq(39*12.5^2/10^2,39,lower.tail = FALSE)


[1] 0.02770279

p_valor < α, hay evidencia suficiente para rechazar Ho

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Ejemplo 12
10. Pulsos de hombres Una muestra aleatoria simple de 40 hombres da como resultado una
desviación estándar de 11.3 latidos por minuto (de acuerdo con el conjunto de datos 1 del apén-
dice B). El rango normal del pulso de adultos suele reportarse entre 60 y 100 latidos por minuto.
Si la regla práctica de las desviaciones se aplica al rango normal, el resultado es una desviación es-
tándar de 10 latidos por minuto. Utilice los resultados muestrales con un nivel de significancia
de 0.05 para someter a prueba la afirmación de que los pulsos de hombres tienen una desviación
estándar mayor que 10 latidos por minuto.
Parámetro de interés à σ (desviación estándar poblacional)
Afirmación à “Los pulsos de los hombres tienen una desviación estándar mayor a 10 latidos
por minuto”
σ > 10 à Ha

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Solución Ejemplo 12
Ho: σ ≤ 10
Ha: σ > 10 El valor de prueba se encuentra en la
zona de no rechazo para Ho
prueba de Al 5% de significancia no hay evidencia para
cola derecha Zona de rechazar Ho
NO
rechazo
para Ho La desviación estándar del pulso de los
hombres es igual a 10.
χ20.05,39
55.758

> pchisq(39*11.3^2/10^2,39,lower.tail = FALSE)


[1] 0.1152255

p_valor > α, no hay evidencia para rechazar Ho

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Resumen
Instrucciones en R, calculo del p_valor

Tatiana Jiménez (tjimenez@unisalle.edu.co)


Dos colas Dos colas Cola derecha
Distribución Cola izquierda (estimador menor al (estimador mayor al
valor de comparación) valor de comparación)

> pnorm(Zp, mean=0, sd=1, > 2*pnorm(Zp, mean=0, > 2*pnorm(Zp, mean=0, > pnorm(Zp, mean=0, sd=1,
Normal
lower.tail = TRUE) sd=1, lower.tail = TRUE) sd=1, lower.tail = FALSE) lower.tail = FALSE)

> 2*pt(tp, gl, lower.tail = > 2*pt(tp, gl, lower.tail = > pt(tp, gl, lower.tail =
t > pt(tp, gl, lower.tail = TRUE)
TRUE) FALSE) FALSE)

> pchisq (χ2p, gl, lower.tail = > 2*pchisq (χ2p, gl, > 2*pchisq(χ2p, gl, lower.tail > pchisq(χ2p, gl, lower.tail =
Chi-cuadrado
TRUE) lower.tail = TRUE) = FALSE) FALSE)

Potrebbero piacerti anche