Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1. INTRODUCCION
El propósito de análisis estadístico es reducir el nivel de incertidumbre en el proceso
de decisiones. Los gerentes pueden tomar mejores decisiones solo si tienen
suficiente información a su disposición. La prueba de hipótesis es una alternativa
analítica muy efectiva para obtener esta valiosa información. Por ejemplo el gerente
de sistemas de una empresa desea determinar si el tiempo de vida medio de
computadoras de la marca COMPAQ es mayor de 10 años ( µ = 10 ). Un productor de
software de computador desea certificar que la proporción de sus productos que son
defectuosos es menor del 3% ( p < 0.03 ). El gerente de una empresa desea saber si
la implementación de un nuevo programa de capacitación mejora la productividad de
sus vendedores respecto al número de clientes que desean tener una tarjeta de
crédito ( µ > 30 ).
Las ilustraciones de esta naturaleza son virtualmente ilimitadas en diferentes
escenarios productivos, de negocios, económicos, financieros, laborales, etc. Si se
pueden obtener respuestas a estas preguntas y a muchas otras con algún grado de
garantía la toma de decisiones se vuelve más segura y es menos probable que
conduzca a un error costoso.
2. DEFINICIONES GENERALES
A continuación daremos a conocer algunas definiciones generales que se usan para
llevar a cabo una prueba de hipótesis:
Todas estas hipótesis tienen algo en común, las poblaciones de interés son tan
grandes que no es factible estudiar todos sus elementos. Como ya sabemos, una
alternativa a estudiar la población entera es tomar una muestra de la población de
1
interés. De esta manera podemos probar una afirmación para determinar si la
evidencia soporta o no la afirmación.
c.1.) Hipótesis nula (Ho): Es aquella que establece que el parámetro tiene
determinado valor y se formula con la intención de rechazarla.
La hipótesis nula es una afirmación que será aceptada si los datos de la muestra no
nos proveen de evidencia convincente de que es falsa, es decir, si se acepta la
hipótesis nula decimos que la evidencia no es suficiente para rechazarla pero no
podemos afirmar que es verdadera.
2
ESTADO DE LA NATURALEZA
DECISIÓN
Ho verdadera Ho falsa
1-α β
Aceptar Ho Decisión correcta Error Tipo I
α 1− β
Rechazar Ho Error Tipo I Decisión correcta
Es obvio quien toma las decisiones, quiere reducir al máximo las probabilidades de
cometer cualquiera de estos dos tipos de errores, esto no es fácil, pues las
probabilidades de cometer error tipo I y II son inversamente proporcionales, para
cualquier prueba dada. De ahí que, cuanto menor es el riesgo de cometer un error
tipo I, tanto mayor es la probabilidad de cometer un error tipo II y viceversa. Sin
embargo dada la regla de decisión, es posible reducir ambos tipos de errores en
forma simultánea, aumentando el tamaño de la muestra.
No hay un nivel de significancia para todos los estudios, se puede utilizar cualquier
valor de probabilidad entre 0 y 1. Tradicionalmente, el nivel de 0.05 es aplicado a
proyectos de investigación, el nivel 0.01 a control de calidad, y 0.10 a sondeos
políticos. Usted como investigador debe decidir el nivel de significancia antes de
colectar la muestra de datos.
Los niveles de significación más usados son: α = 0.05 y 0.01. Estos dos números
son usados tan frecuentemente que cuando Ho es rechazada en α = 0.05,
podemos decir que el resultado es significativo y cuando Ho es rechazada en
3
α = 0.01, decimos que el resultado es altamente significativo.
f (θˆ / H 0 ) f (θˆ / H1 )
1-α 1-β
β α
R.A. C R.R.
fig. 16
f) Tipos de prueba:
• Prueba de cola izquierda: Si la región de rechazo está a la izquierda del
punto crítico C.
f (θˆ / H 0 )
1-α
α
R.R. C R.A.
fig. 17
4
• Prueba de cola derecha: Si la región de rechazo está a la derecha del junto
crítico C.
f (θˆ / H 0 )
1-α
R.A. C R.R.
fig. 18
• Prueba bilateral: Si la región de aceptación es un intervalo cerrado entre los
puntos crítico C1 y C2.
f (θˆ / H 0 )
1-α
α /2 α /2
R.R. C1 R.A. C2 R.R.
fig. 19
5
TEMA 16: PRUEBA DE HIPÓTESIS PARA LA MEDIA POBLACIONAL
La media poblacional es un parámetro de decisión muy importante. Es de interés
conocer si una media poblacional ha aumentado, disminuido o ha permanecido
inalterado, o también podemos estar interesados en determinar si una media
poblacional es significativamente mayor o menor que un valor supuesto.
1. Formulación de hipótesis:
a) Ho: µ ≥ µo b) Ho: µ ≤ µo c) Ho: µ = µo
H1: µ < µo H1: µ > µo H1: µ ≠ µo
2. Nivel de significancia: α
3. Estadística de prueba:
• Para i y iii
x− µ 0
Z= → n (0,1)
σ/ n
• Para ii
x− µ 0
Z= → n (0,1)
s/ n
6
4. Establecimiento de los criterios de decisión:
• Prueba de cola izquierda :
1- α
α
0
-Z1- α
R.R R.A.
1-α
α
0 Z1- α
R.A. R.R.
7
• Prueba bilateral :
1-α .
α/2 α/2
-Z1- α/2
0 Z1- α/2
5. Cálculos:
Obtención del valor experimental.
• Para i y iii
x− µ 0
Zk =
σ / n
• Para ii
x− µ0
Zk =
s/ n
6. Decisión:
Se compara el valor experimental con el valor crítico.
Si Zk ∈ R.A., se acepta HO.
Si Zk ∈ R.R., se rechaza HO.
8
NOTA: Si se tiene una población finita de tamaño N se corrige la estadística
de prueba de la siguiente manera:
x− µ 0 x− µ 0
Z= Z=
σ N− n s N− n
n N− 1 n N− 1
Ejemplo 1:
El gerente de una empresa selecciona aleatoriamente entre sus trabajadores una
muestra de 169 y anota el número de horas de trabajo que cada uno de ellos ha
perdido por causa de accidentes laborales en el año 2001. A partir de la información
obtenida determina, en esos 169 trabajadores, un número medio de horas perdidas
por accidentes laborales en el 2007 de 36,5 horas y una desviación estándar de 10
horas.
a) ¿Podríamos rechazar, con un nivel de significación del 1% la hipótesis de que el
número medio de horas perdidas a causa de accidentes laborales en esa empresa
durante el año 2007 fue de 35 horas?
b) ¿Y para un nivel de significación del 5%?
3. Estadística de prueba:
Análisis: x = 36.5
● n=169
(n>30) s = 10
9
● Varianza poblacional desconocida (se obtiene a través de la muestra)
s = 10 ⇒ s 2 = 100
● Población no normal
● Usar Estadística Z – Caso I - ii
1- α = 0.99
α/2=0.05 α/2=0.05
-2.576 0 2.576
R.R. R.A. R.R.
5. Cálculos :
x − µ 0 36.5 − 35
Zk = = = 1.95
s / n 10 / 169
6. Decisión :
Zk=1.95<2.576, aceptamos Ho.
No se rechaza la hipótesis ; es decir el número medio de horas pérdidas a
causa de accidentes laborales es de 35 horas.
b) Si el nivel de significación fuera del 5%, entonces 1.95 <1.96 y también se acepta
HO. Entonces no se rechaza la hipótesis ; es decir el número medio de horas
pérdidas a causa de accidentes laborales es de 35 horas.
Ejemplo 2:
Una empresa estudia introducir un nuevo sistema de producción para mejorar su
productividad media establecida actualmente por persona y día. Se estima que el
10
cambio no será rentable si no consigue elevar dicho número por encima de 45
unidades. Realizada una prueba con la nueva tecnología aplicada a 35 personas, se
obtuvo una producción media de 46.5 y no se observó ningún cambio apreciable en
la dispersión que estaba establecida en σ = 1.5 u. por día ¿Se debe efectuar el
cambio tecnológico. A un nivel de significancia del 5%.
3. Estadística de prueba :
Análisis:
● n=35 x = 46.5
(n>30)
● Varianza poblacional conocida.
σ =1.5 σ 2= 2.25
● Población no normal
● Usar Estadística Z – Caso I - i
x − µ0
Z= → n(0,1)
σ/ n
1 - α =0.95
0.05
0 1.645
R.A. R.R.
11
5. Cálculos:
x − µ 0 46.5 − 45
Zk = = = 0.17
σ / n 1.5 / 35
6. Decisión :
ZK = 0.17 < 1.645, entonces aceptamos Ho.
No se debe efectuar el cambio tecnológico.
Ejemplo 3:
Tiendas Metro, una cadena de tiendas de artículos de consumo extendida por todo
el país, afirmaba en Radio Programas del Perú que no abren tienda en ninguna
localidad a menos que la renta media de la vecindad sea de 1200 dólares como
mínimo. Una encuesta de 200 familias en una localidad determinada da una renta
media de 1182 dólares, con una desviación estándar de 157 dólares. ¿Deben abrir
la tienda si se cumplen todos los demás criterios de emplazamiento deseable a un
nivel de significancia del 1%?
Solución:
1. Formulación de la hipótesis:
H0 : µ ≥ 1200
H1 : µ < 1200
3. Estadística de prueba:
Análisis: x = 1182
● n=200
(n>30) s = 157
● Varianza poblacional desconocida (se obtiene a través de la muestra)
s = 157 ⇒ s 2 = 24649
● Población no normal
● Usar Estadística Z – Caso I - ii
x− µ0
Z= → n(0,1)
s/ n
12
4. Establecimiento de los criterios de decisión:
1-α = 0.99
α = 0.01
-2.326 0
R.R. R.A
.
R.A.: ZK ≥ -2.326, se acepta HO.
R.R.: ZK < -2.326, se rechaza HO.
5. Cálculos:
x − µ 0 1182 − 1200
Zk = = = − 1.62
s/ n 157 / 200
6. Decisión:
Zk = -1.62 > -2.326, entonces aceptamos Ho.
13
1. Formulación de hipótesis estadística:
2. Nivel de significancia: α
3. Estadística de prueba:
x− µ0
t= → t n−1
s/ n
1-α
-t1-α, n-1 0
R.R.. R.A.
14
• Prueba de cola derecha:
1- α
α
0 t1-α, n-1
R.A R.R
• Prueba bilateral :
1-α
α/2 α/2
− t1− α / 2,n − 1 0 t1− α / 2, n − 1
R.R. R.A. R.R.
15
5. Cálculos:
x− µ 0
tk =
s/ n
6. Decisión:
Se compara el valor experimental con el valor crítico
Si t k ∈ RA. , aceptamos Ho.
Si t k ∈ R.R. , rechazamos Ho.
Ejemplo 4:
En una ciudad se quiere hacer un estudio rápido para valorar el consumo de agua
en los domicilios particulares durante los meses de mayor sequía. Para ello se
seleccionaron al azar 15 domicilios y se midieron sus consumos en metros cúbicos
durante el mes de agosto y su obtuvo un consumo medio muestral de x = 18.7 m 3 y
una desviación estándar muestral de s = 6 m 3 . Se sabe además que el consumo de
agua se distribuye normalmente. En vista de estos datos. ¿Hay suficiente evidencia
estadística al nivel de 0.05, a favor de la hipótesis de que el consumo medio de los
particulares durante el mes de agosto es mayor que 18 m 3?
Solución:
1. Formulación de la hipótesis:
H0 : µ = 18
H1 : µ > 18
16
3. Estadística de prueba:
Análisis:
x = 18.7
● n=15
(n<30) s= 6
s = 6 ⇒ s 2 = 36
● Población normal
● Usar Estadística T – Caso II
x− µ0
t = → t n−1
s/ n
t → t14
1 - α = 0.95
α=0.05
0 1.761
R.A R.R
17
5. Cálculos:
x − µ 0 18.7 − 18
tk = = = 0.45
s/ n 6 / 15
6. Decisión:
tk=0.45 < 1.761, entonces aceptamos H o. El consumo medio de agua de los
particulares en el mes de agosto no es mayor de 18m 3.
Ejemplo 5:
Una Marca discográfica preocupada por el creciente desarrollo de los Vendedores
informales de mùsica en CD emprende una investigación sobre esta variante de la
Economía informal, la Gerencia cree que mantienen una venta media de 50 CD`s en
un fin de semana. Para realizar la investigación se entrevistaron 20 vendedores
desplegados en la Av. Abancay de la Ciudad de Lima, registrando el siguiente
resultado:
Ventas de CD's (copias):
55 51 50 51 71 65 60 55 50 50
59 50 77 76 53 57 66 72 46 47
Solución: Caso II
1. Formulación de Hipótesis :
H0 : µ = 50
H1 : µ ≠ 50
3. Estadística de prueba :
Análisis:
x = 58.55
● n=20
s = 9.64
(n<30)
18
● Varianza poblacional desconocida (se obtiene a través de la muestra)
s = 9.64 ⇒ s 2 = 92.93
● Población normal
● Usar Estadística T – Caso II
x− µ0
t = → t n−1
s/ n
t → t19
1- α =0.95
α=0.025 α=0.025
-2.093 0 2.093
R.R R.A R.R
5. Cálculos :
x− µ0 58.55 − 50
tk = → = 3.97
s/ n 9.64 / 20
6. Decisión:
tk = 3.97 ∈ R.R., por lo tanto se rechaza H o. No es cierta la sospecha del
gerente, la venta media de CDs en el mercado informal es mayor.
19
Ejemplo 6:
Solución:
1. Formulación de la hipótesis:
H0 : µ ≥ 8.5
H1 : µ < 8.5
3. Estadística de prueba:
Análisis: x = 8.4
● n=10
s = 0.1
(n<30)
● Varianza poblacional desconocida (se obtiene a través de la muestra)
s = 0.1 ⇒ s 2 = 0.01
● Población normal
● Usar Estadística T – Caso II
x− µ0
t = → t n−1
s/ n
t → t9
20
4. Establecimiento de los criterios de decisión:
1-α = 0.90
α = 0.1
-1.383 0
R.R. R.A.
5. Cálculos:
x − µ 0 8.4 − 8.5
Zk = = = − 3.16
s / n 0.1/ 10
6. Decisión:
Zk = -3.16<-1.383, entonces rechazamos HO.
21