Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
8.1 INTRODUCCION
La prueba de hipótesis comienza con:
1. una suposición (valor para una media de la población), llamada hipótesis, que hacemos con
respecto a la población.
2. recolectamos datos de una muestra
3. producimos estadísticas de muestra (determinación de la diferencia entre el valor hipotético y
el valor real de la media de la muestra).
4. uso de la información para tomar una decisión con respecto a nuestra hipótesis (juzgamos si
la diferencia es significativa o no).
¿Cuándo aceptar o rechazar una hipótesis? Una hipótesis solo puede ser aceptada si los cálculos
y resultados obtenidos se encuentran dentro de los parámetros establecidos en nuestra hipótesis,
de lo contrario es rechazada. No obstante y a pesar de los resultados, en la toma de decisiones
habrá que enfrentar la incertidumbre.
Interpretación del nivel de significancia. El objetivo de la prueba de hipótesis es hacer un juicio con
respecto a la diferencia entre esa estadística de muestra y un parámetro de población hipotetizado.
1
decidir que criterio utilizar para aceptar o rechazar la hipótesis nula. En el ejemplo de la pag.
422 se obtuvo una probabilidad de 4.5% de ocurrencia de esta diferencia entre la media de la
muestra y la de la población hipotetizada y por tanto se rechaza la hipótesis nula, este valor se
le conoce como “nivel de significancia” (a).
Si suponemos que la hipótesis es correcta, entonces el nivel de significancia indicará el porcentaje
de medias de muestra que está fuera de ciertos límites. Ver figuras 8-2 y 8-3 de páginas 426 y 427.
Ahora bien, el hecho de aceptar una hipótesis no prueba que nuestra hipótesis nula (H 0) sea cierta,
simplemente no nos proporciona evidencia estadística o que los datos son insuficientes como para
rechazarla.
Selección de un nivel de significancia. No existe un nivel de significancia único estándar o universal
para probar hipótesis, los investigadores pueden utilizar el que crean conveniente pero debemos
recordar que entre más alto sea ese nivel, mayor será la probabilidad de rechazar una hipótesis
nula cuando es cierta. Ver la figura 8-4 y tal como se ve la gráfica del inciso c) el nivel de
significancia es tan alto que sería raro aceptar la hipótesis nula cuando no sea cierta, pero al
mismo tiempo la rechazaríamos cuando es cierta.
En algunos casos es preferible el error tipo I (si la H 0 fuera agua contaminada y la rechazamos) y
en otros el error tipo II (si se acepta la hipótesis anterior siendo falsa). La probabilidad de cometer
un tipo de error puede reducirse incrementando la probabilidad de cometer el otro tipo de error.
Ej.: (pag. 433) Un fabricante suministra ejes traseros para camiones que deben soportar 80,000 lb
por pulg2 en pruebas de carga, pero un eje excesivamente fuerte eleva los costos de producción.
La experiencia indica que la desviación estándar de la fuerza de los ejes es de 4,000 lb por pulg 2.
2
Se selecciona una muestra de 100 ejes, se prueban y se detecta que la capacidad de carga
promedio es de 79,600 lb por pulg 2. a un a = 0.05 en la prueba, ¿Satisfarán los ejes sus
requerimientos de carga? Los datos se resumen de la siguiente manera:
µH0 = 80.000 n = 100 δ = 4,000 X = 79,600 a = 0.05
1. Planteamiento de hipótesis
H0: µ = 80,000 La media real es 80,000 lb por pulg 2
H1: µ ≠ 80.000 La media real no es 80,000 lb por pulg2
a = 0.05 Nivel de significancia para probar esta hipótesis
2. Cálculo del error estándar. Se conoce la δ y n es grande por lo tanto se trata de una
población infinita.
δx = (δ/√n) = 4,000/√100 = 400
3. Cuando a = 0.05 el N.C. = 0.95 (o sea 1 – 0.05), recuerde que esta prueba es de 2
extremos o colas que hace dividir 0.95/2 = 0.475; luego en la tabla de la distribución normal
estándar se busca un valor igual o lo mas cercano posible a 0.475, dando un resultado de
Z = 1.96.
80,000 ± 1.96 (400) LSC = 80,000 + 1.96 (400) = 80,784 lb por pulg2
3
aleatoriamente 50 dosis y encuentra que la media de estas dosis es de 99.75 cc. El Hospital
establece un a = 0.10 y pregunta si las dosis de esta remesa son demasiado pequeñas.
Los datos se resumen de la siguiente manera:
µH0 = 100 n = 50 δ = 2 X = 99.75 a = 0.10
1. Planteamiento de hipótesis
H0: µ = 100 La media de las dosis de la remesa es 100 cc.
H1: µ < 100 La media es menor que 100 cc.
a = 0.10 Nivel de significancia para probar esta hipótesis
2. Cálculo del error estándar. Se conoce la δ y n es grande por lo tanto se trata de una población
infinita.
δx = (δ/√n) = 2/√50 = 0.2829
3. Cuando a = 0.10 el N.C. = 0.90 Esta prueba es de extremo inferior por lo que a una mitad del
área bajo la curva (0.50) se le resta 0.10 = 0.40; luego en la tabla de la distribución normal
estándar se busca un valor igual o lo mas cercano posible a 0.40, el resultado de Z = 1.28.
Se debe recordar que la binomial es la distribución teóricamente correcta para usarse al trabajar
con porciones, porque los datos son discretos no continuos. Al aumentar el tamaño de la muestra,
la distribución binomial se aproxima a la normal en sus características y se puede usar la
distribución normal para aproximar la distribución de muestreo, siempre y cuando np y nq ≥ 5.
Ejemplo. Corporación Cresida está evaluando la promoción de sus empleados, es decir, está
determinando la porción de aquellos cuya capacidad, capacitación y experiencia de supervisión los
califican para promocionarlos al siguiente nivel de administración. El gerente de Recursos
Humanos dice que el 80% de los empleados son promocionables. El presidente de la empresa
reúne un comité especial para evaluar la capacidad de los empleados y éste realiza entrevistas con
150 empleados y encuentra que solo el 70% califica para promoción. Se desea probar al a = 0.05
la hipótesis de que el 80% de los empleados son sujetos a promoción.
1. Planteamiento de hipótesis
H0: P = 0.80 80% de los empleados son promocionables.
H1: P ≠ 0.80 La porción de empleados promocionables no es 80%.
a = 0.05 Nivel de significancia para probar esta hipótesis
4
5. Interpretación de los resultados. En la gráfica se observa que la porción de la muestra (-3.06)
cae en el área de rechazo, en cuyo caso el presidente de la empresa debe rechazar la H 0, e
inferir que la porción real de empleados promocionables no es de 80%.
1. Planteamiento de hipótesis
H0: P = 0.60 La porción de plantas que cumplen con los estándares de contaminación es 0.60.
H1: P< 0.60 La porción que cumplen con los estándares de contaminación no es 0.60.
n.c. = 0.98 Nivel de confianza para probar esta hipótesis
Ej.: Un fabricante de blusas para mujer, sabe que su marca se vende en 19% de las tiendas de
ropa en Comayagüela. Se toma una muestra de 85 tiendas en Tegucigalpa y se detecta que solo el
14.12% de ellas vende su producto. A un a = 0.04 ¿existe evidencia que en Tegucigalpa hay una
peor distribución? Es una prueba de extremo inferior.
Z = -1.15 (calculado) Z = -1.75 (tabla) LIC = 0.1155 se acepta la hipótesis nula.
Ej.: El Gerente de Recursos Humanos del Banco Central de Honduras, está reclutando personal
para un puesto en el extranjero y cree que la puntuación promedio será de aproximadamente 90.
Cuando la Administración revisa 20 de estos resultados encuentra que la puntuación promedio es
84 con una S = 11 y desea probar su hipótesis a un a = 0.10 ¿Cuál es el procedimiento a seguir?
Es una prueba de 2 extremos, µH0 = 90 n = 20 S = 11 X = 84 a = 0.10
1. Planteamiento de hipótesis
5
H0: µ = 90 La media real es 90
H1: µ ≠ 90 La media real no es 90
a = 0.10 Nivel de significancia para probar esta hipótesis
Interpretación de los resultados. En ambas gráficas siguientes se puede observar que la media de
la muestra X = 84 y t = 2.44, caen en el área de rechazo, por tanto se rechaza la H 0, que es la
afirmación del gerente de Recursos Humanos acerca de que la puntuación media real de los
empleados examinados es 90.
Ej.: Un documental de televisión afirmaba que los hondureños tienen un sobrepeso aproximado de
10 lb. en promedio. Se examinó a 18 personas y se encontró que su sobrepeso promedio es de
12.4 lb. con una S = 2.7 lb. A un a = 0.01 ¿hay razón para dudar de la validez del valor aproximado
de 10 lb?
t = ± 2.898 Límites = (8.16, 11.84)
6
9. El valor 1 2b se conoce como la potencia de la prueba.
10. Después de realizar una prueba de una cola y rechazar H0, se da cuenta de que debió haber
hecho una prueba de dos colas, al mismo nivel de significancia. También rechazará H0 para esa
prueba.
11. A menudo, aunque no siempre, es posible establecer el valor de a de manera que obtengamos
un trueque sin riesgos en la prueba de hipótesis.
12. Imagine que efectúa una prueba de hipótesis de dos colas sobre una media de población y ha
establecido a 5 0.05. Si el estadístico muestral cae dentro de 0.95 del área alrededor de mH0,
usted ha probado que la hipótesis nula es cierta.
13. Si las pruebas de hipótesis se hicieran a un nivel de significancia de 0.60, la hipótesis nula
generalmente se aceptaría cuando no es cierta.
14. Si mH0 5 50 y a 5 0.05, entonces 1 2b debe ser igual a 0.95 cuando m 5 50.
15. Para un nivel de significancia dado, los valores críticos de t se acercan a cero cuando crece el
tamaño de la muestra.
16. Elegir el nivel de significancia apropiado es más fácil que elegir la prueba correcta que se debe
utilizar.
17. Existen métodos matemáticos que garantizan que el nivel de significancia seleccionado
siempre será el adecuado.
18. La prueba de hipótesis nos ayuda a sacar conclusiones sobre parámetros estimados.
VF
7
CAPITULO 9. PRUEBA DE HIPOTESIS CON DOS MUESTRAS
Prueba de hipótesis para diferencias entre medias. En muchas situaciones de toma de decisiones
se necesita determinar si los parámetros de 2 poblaciones son parecidos o diferentes, por ejemplo:
un médico receta una misma medicina a 2 personas que padecen la misma enfermedad, la
reacción de la medicina en una de las personas es positiva, sin embargo en la otra persona no
produce la misma reacción. Otro ejemplo se presenta en algunas empresas en puestos cubiertos
por hombres y mujeres que desarrollan las mismas funciones pero el salario devengado por los
hombres es mejor que el de las mujeres.
Para el análisis de esta situación, estudiaremos la DISTRIBUCION DE MUESTREO PARA LA
DIFERENCIA ENTRE 2 PARAMETROS DE POBLACION. Para una mejor comprensión, veamos
las figuras siguientes:
entre medias.
NOTA. Si la desviación estándar de la población ( δ) es desconocida entonces hay que estimar el
error estándar a partir de la S o S2.
Ambas poblaciones (1 y 2) tienen su propia µ y δ y además su distribución de muestreo de la
media (µȾ= µ) y su error estándar de la media ( δȾ) construidos a partir de todas las muestras
posibles de un tamaño dado que pueden tomar de la distribución de la población correspondiente.
Si se toma una muestra de cada población y se calcula la diferencia entre medias ( Ⱦ1 - Ⱦ2), se
pueden presentar los resultados siguientes:
a) > 0 == Ⱦ1 > Ⱦ2
b) < 0 == Ⱦ1 < Ⱦ2
c) = 0 == Ⱦ1 = Ⱦ2
Todas las diferencias posibles de las medias nos conducen a una distribución de muestreo de la
diferencia entre las medias de las muestras (µȾ1 - Ⱦ2 = µȾ1 - µȾ2). Si µ1= µ2 == µȾ1- µȾ2 = 0.
La desviación estándar de la distribución de la diferencia entre las medias de muestras se conoce
como ERROR ESTANDAR DE LA DIFERENCIA ENTRE DOS MEDIAS, su fórmula es:
2 2
δȾ - Ⱦ
1 2 =√ (δ 1/n1 + δ 2/n2) donde: δȾ1- Ⱦ2 = Error estándar de la diferencia entre dos medias
δ21 = Varianza de la población 1
δ22 = Varianza de la población 2
n1 = Tamaño de la muestra de la población 1
n2 = Tamaño de la muestra de la población 2
si no se conocen las dos desviaciones estándar de población se puede estimar el error estándar a
partir de las desviaciones de las muestras.
Prueba de diferencia entre medias. Tamaños de muestra grandes. Dos extremos.
A un estadístico en recursos humanos se le pide determinar si los salarios por hora de los
trabajadores especializados son los mismos en 2 ciudades distintas. El resultado de la
investigación es el siguiente: