Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Guía de estudio
1. Definiciones básicas
5. Ejercicios
holger.benalcazar@epn.edu.ec
holgerben@hotmail.com
agosto - 2014
1. Definiciones básicas
Una hipótesis estadística es una declaración acerca del valor de un parámetro poblacional. El procedimiento
que permite decidir acerca de la verdad o falsedad de la hipótesis se denomina prueba de hipótesis y se plantea
mediante dos tipos de hipótesis: la hipótesis nula (Ho) y la hipótesis alternativa (Ha).
La hipótesis nula especifica un determinado valor o para el parámetro . En cambio, la hipótesis alternativa
propone cualquiera de las tres opciones siguientes: que el valor del parámetro tiene un valor distinto a o, o
que el valor del parámetro es menor a o, o el valor del parámetro es mayor a o. Los tres tipos de pruebas de
hipótesis se representan por:
En la prueba bilateral, la hipótesis alternativa de que el parámetro tiene un valor diferente a o significa que el
parámetro puede ser mayor o menor a o. En la prueba de hipótesis superior, la hipótesis nula de que el
parámetro es igual a o es equivalente a decir que el valor de es menor o igual a o. En la prueba de hipótesis
inferior, la hipótesis nula de que el parámetro es igual a o es equivalente a decir que el valor de es mayor o
igual a o. Así, en cualquiera prueba de hipótesis, las declaraciones de las hipótesis nula y alternativa dividen el
intervalo (-, +) en dos subconjuntos complementarios, teniendo como referencia el valor propuesto o.
La decisión sobre cual de las dos hipótesis es la más probable se realiza utilizando la información muestral, que
por su característica de aleatoriedad, puede introducir dos tipos de errores en la decisión:
Las probabilidades de cometer los errores tipo I y tipo II se denotan por y , respectivamente; de donde:
Los dos tipos de errores tienen consecuencias no deseables en la práctica, por lo que es necesario en las pruebas
de hipótesis mantener sus probabilidades de ocurrencia bajas. Se sabe que las probabilidades y se comportan
de manera inversa, mientras la una decrece la otra crece, ventajosamente, aumentando el tamaño de la muestra
es posible reducir ambas probabilidades a valores suficientemente pequeños.
Se conoce como potencia de una prueba de hipótesis, a la probabilidad de que una hipótesis nula falsa se rechace
correctamente; por lo que, a mayor potencia menor será el error tipo II. La potencia se expresa por:
2- Establecer las hipótesis nula y alternativa. La hipótesis nula podría formularse considerando experiencias
anteriores, razones teóricas, especificaciones de diseño o requerimientos de contratos. La hipótesis
alternativa se plantea en base a los resultados sugeridos por la muestra.
5- Tomar la decisión de aceptar o rechazar la hipótesis nula según el valor del estimador o del estadístico.
En los resultados que siguen se identificará a la prueba de hipótesis bilateral como (a), a la prueba de hipótesis
superior como (b), y a la prueba de hipótesis inferior como (c).
Ho: = o
(a) Ha: o
(b) Ha: > o
(c) Ha: < o
(b) x > o + Z / n
(c) x < o - Z / n
Si = - o, donde es el valor verdadero de la media poblacional y o es el valor propuesto para la media
poblacional en la hipótesis nula, entonces, en esta prueba de hipótesis es posible determinar exactamente el
valor de , la probabilidad de cometer el error tipo II. Si (.) es la función de distribución normal estándar,
entonces se tiene:
(a) = ( Z/2 - n ) - ( -Z/2 - n )
(b) = ( Z - n )
(c) = 1- ( -Z - n )
Elegidos los valores de y con que se quiere trabajar, el tamaño de muestra n puede determinarse por:
La media de la muestra de 158 psi podría ser un indicio de que la media poblacional es ahora menor
a 160 psi, el nivel requerido. Luego, necesitamos probar las hipótesis:
Rechazaremos la hipótesis nula si x es menor a (o -Z / n )= 157.5. Como este no es el caso, no
podemos rechazar H0; esto es, la muestra no brinda suficiente evidencia como para asegurar que la resistencia
promedio a la rotura haya bajado de 160 psi.
Con ese tamaño de muestra, ¿cuál es la probabilidad de seguir aceptando que la resistencia promedio a
la rotura se mantiene mayor o igual a 160 psi, si en realidad ha bajado a 158.5 psi?
Lo que necesitamos calcular es la probabilidad del error tipo II. Luego, el valor = - o es igual a
158.5 –160 = -1.5, y con =0.05 obtenemos que:
Es decir, el 74.1% de las veces podríamos seguir aceptando que 160 a pesar de que la media poblacional
real pudo haber disminuído a 158.5.
Dado que la probabilidad de cometer un error tipo II es muy alta, ¿cuál es el tamaño de muestra que
debemos seleccionar para mantener la probabilidad de un error tipo I en 0.05 y la probabilidad de un
error tipo II en 0.10, cuando la media poblacional disminuya en 1.5 o más?
Como deseamos que =0.05 y = 0.10, tenemos que el tamaño de muestra adecuado es:
(b) x > o + t s / n
(c) x < o - t s / n
Los valores de la distribución t de Student se buscan con (n-1) grados de libertad.
Para calcular la probabilidad del error tipo II se utiliza la curva de potencia generada por algún software
estadístico. Se considera = - o, la mínima diferencia a detectar, donde es el valor verdadero de la media
poblacional y o es el valor propuesto para la media poblacional en la hipótesis nula.
Para calcular el tamaño de muestra que garantice unas probabilidades α y dadas, cuando la mínima diferencia
a detectar es = - o, se utiliza algún software estadístico.
8.6849 7.7030 7.7399 8.8277 6.8743 5.2801 5.6382 7.42342 [ x =7.27144, s=1.28948]
Ho: ≤ 7
Ha: > 7
Rechazamos la hipótesis nula si x es mayor a (o + t s / n )= 7.84916, trabajando con =0.05. Luego, no
podemos rechazar que la media poblacional del porcentaje de desperdicio es menor o igual al 7%
Si se desea detectar un incremento igual o mayor a = 1, con el diseño de la prueba de hipótesis anterior,
¿cuál es la probabilidad de cometer un error tipo II?
De la curva de potencia se deslinda que 0.39; con lo que, es bastante probable cometer un error
tipo II.
Si es importante detectar un incremento igual o mayor a = 1, con probabilidad de al menos 0.90, cuál es
el tamaño de muestra mínimo que debe emplearse?
Lo que se requiere es tener =0.05 y = 0.10 en la prueba de hipótesis anterior. El tamaño de muestra
debe ser al menos de 16 días
Ho: 2 = 2o
(a) Ha: 2 2o
(b) Ha: 2 > 2o
(c) Ha: 2 < 2o
Para calcular la probabilidad del error tipo II se utiliza la curva de potencia generada por algún software
estadístico. Se considera = - o, la mínima diferencia a detectar, donde es el valor verdadero de la
desviación estándar poblacional y o es el valor propuesto para la desviación estándar poblacional en la
hipótesis nula.
Para calcular el tamaño de muestra que garantice unas probabilidades α y dadas, cuando la mínima diferencia
a detectar es = - o, se utiliza algún software estadístico.
Ejemplo: Un fabricante de balanzas de precisión afirma que la desviación típica en el empleo de sus balanzas
es de 0.00002 g. Un analista interesado en comprar dichas balanzas, toma una balanza y pesa 8 veces un
mismo objeto, obteniendo una desviación típica de 0.00005 plg.
Si la distribución de las mediciones es normal, utilizando =0.01, ¿está justificada la afirmación del
fabricante?
Aquí hay que probar la hipótesis nula 2=(0.00002)2 frente a la hipótesis alternativa 2 >(0.00002)2.
La región de rechazo está definida por 2o / (n-1) = (0.00003)2, por lo que la varianza muestral al ser
mayor, cae en la región de rechazo; luego se rechaza la hipótesis nula (esto es, la afirmación del fabricante
debe rechazarse).
En este caso, =0.00003 - 0.00002 =0.00001. Como =0.01, la curva de potencia muestra que es
aproximadamente igual a 0.69.
Ho: p = po
(a) Ha: p po
(b) Ha: p > po
(c) Ha: p < po
p̂ p oq o p̂ p oq o
(a) < po - Z/2 , ó, > po + Z/2
n n
p̂ p oq o
(b) > po + Z
n
p̂ p oq o
(c) < po - Z
n
Para calcular la probabilidad del error tipo II se utiliza la curva de potencia generada por algún software
estadístico. Se considera = p - po, la mínima diferencia a detectar, donde p es el valor verdadero de la
proporción poblacional y po es el valor propuesto para la proporción poblacional en la hipótesis nula.
Para calcular el tamaño de muestra que garantice unas probabilidades α y dadas, cuando la mínima diferencia
a detectar es = p - po, se utiliza algún software estadístico.
Los resultados son válidos si np o >5 para po 0.5 o cuando nqo >5 para qo 0.5.
Ejemplo: Se cree que el 75% de los casos de cáncer pulmonar son mortales. Se tomó una muestra de 1000
casos y se verificó que en 699 de ellos, el paciente falleció.
Ho: p ≥ 0.75
Ha: p < 0.75
Como la proporción muestral es menor a 0.727, valor que define la región de rechazo, consideramos que hay
evidencia para rechazar la hipótesis nula.
Si se requiere detectar disminuciones en la tasa de mortalidad mayores o iguales a un 5%, con =0.05 y
= 0.10, ¿cuál es el tamaño de muestra mínimo que debe emplearse?
5. Ejercicios
1- Se está estudiando el rendimiento de un proceso químico. Durante los últimos 5 días de operación de la
planta se han obtenido los siguientes rendimientos (en porcentajes): 81.6, 88.75, 90.8, 89.95, 91.3.
a- Se cree que la varianza del rendimiento de este proceso, es de 5 (porcentaje2).¿Es razonable este
supuesto?
d- ¿Qué tamaño de muestra sería necesario para detectar un rendimiento medio verdadero del 85% con una
probabilidad del 0.90?
2- Hace 10 años, la estatura promedio de los hombres de cierta raza era 164 cm. El pasado mes, un antropólogo
tomó una muestra de 30 estaturas y obtuvo un promedio de 170 cm. El antropólogo considera que el crecimiento
promedio de la población es significativo si es por 5 cm o más. ¿Es justificado que el antropólogo comunique
un crecimiento promedio significativo en los hombres de dicha raza?
a- Responda utilizando como desviación estándar de la población la estimación obtenida hace 10 años, que
resultó ser de 5.1 cm.
b- Responda utilizando la desviación estándar de la nueva muestra, que resultó ser de 6.4 cm.
4- Una investigación advierte que en Europa el cáncer prostático tiene una mortalidad del 60%. Un grupo de
investigadores encontraron que en 58 pacientes de una muestra de 120 pacientes ecuatorianos el cáncer
prostático ganó la batalla. Si una diferencia de 7% o más se considera significativo a nivel poblacional, ¿somos
los ecuatorianos menos afectados por dicha enfermedad que los europeos?
5- Una nueva combinación de temperatura y tiempo de secado proporcionó una desviación típica de 0.8
newtons en la resistencia de ciertas baldosas de cerámica en una muestra de 50 baldosas. Con la