Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
INDUSTRIAL
TEMA 01
PRUEBA DE HIPOTESIS
Ing. William Len Velsquez
CONTENIDO
CONCEPTOS BSICOS DE
PRUEBA DE HIPTESIS
PRUEBA DE HIPTESIS PARA
MUESTRAS GRANDES
PRUEBA DE HIPTESIS PARA
DOS MUESTRAS GRANDES
CONCEPTOS BSICOS DE
PRUEBA DE HIPOTESIS
HIPTESIS ESTADSTICA
Las hiptesis estadsticas es una
afirmacin o suposicin sobre
un parmetro de la poblacin,
Ejemplo:
La media poblacional.
La proporcin poblacional
Una
Prueba
de
Hiptesis
estadstica es un procedimiento
basado en
evidencia de la
muestra y la teora de la
probabilidad para determinar si la
hiptesis es una afirmacin
razonable
DETERMINACIN DE LA HIPTESIS
ESTADSTICA
El valor del parmetro de la poblacin especificado en la
hiptesis se determina de tres maneras:
a.
Como resultado de la
experiencia o conocimientos
pasados de un proceso, o
incluso de experimentacin
previa.
El objetivo de la prueba de
hiptesis es determinar si la
situacin
experimental
ha
cambiado.
Ing William Len V
DETERMINACIN DE LA HIPTESIS
ESTADSTICA
b.
DETERMINACIN DE LA HIPTESIS
ESTADSTICA
c. Como
resultado
de
consideraciones experimentales,
como las especificaciones de
diseo o ingeniera, o de
obligaciones contractuales.
El objetivo de la prueba de
hiptesis es la prueba de
conformidad.
IDENTIFICACIN DE HIPTESIS
En
una
prueba
de
hiptesis
se
empieza
IDENTIFICACIN DE HIPTESIS
Hiptesis nula Ho
Hiptesis. Alternativa H1
La que se contrasta
Los datos pueden
rechazarla
No debera ser rechazada
sin una buena razn.
H 0 :
H1 :
Ing William Len V
Es la negacin de la H0
Los datos pueden mostrar
evidencia a favor
No debera ser aceptada sin
una gran evidencia a favor.
p 0.5
p 0.5
, ,
9
EJEMPLO
Debo tomar Aspirina o Ibuprofeno para el dolor de
cabeza?
Laboratorios Bayer me dice que tome Aspirina
Existe teora (antigua) de que lo mejor es Aspirina
Laboratorios Cinfa me dice que tome Ibuprofeno
Existe teora (nueva) de que lo mejor es Ibuprofeno
DEFINICIONES
Cul es H0?
Problema: El tiempo de vida promedio
de una determinada pieza usada en el
ensamblaje de una marca de
computadoras es de 20,000 horas.
Solucin:
20,000
Traducir a lenguaje estadstico:
Establecer su opuesto:
20,000
Seleccionar la Hiptesis
1 : 20,000
alternativa
Seleccionar la hiptesis nula H 0 : 20,000
Cul es H0?
Problema: El colesterol medio para la
dieta de los trabajadores de las empresas
textiles es 6 mmol/l?
Solucin:
Traducir a lenguaje estadstico:
Establecer su opuesto:
6
6
H0 : 6
Cul es H0?
Problema: La altura media o promedio de
los obreros de la empresa pesquera es de
1.60 m?
Solucin:
Traducir a lenguaje estadstico:
Establecer su opuesto:
1.60
1.60
H 0 : 20,000
Cul es H0?
Problema: El porcentaje de
personas atacadas por cierta
enfermedad laboral en una fabrica
grande, no es mayor del 10%.
Solucin:
p 0.10
p 0.10
1 : > 0.10
H 0 : p 0.10
Cul es H0?
Problema: El estrs laboral est
relacionada con el gnero?
Solucin:
Traducir a lenguaje
estadstico:
Establecer su opuesto:
p 0.5
Seleccionar la Hiptesis
alternativa
Seleccionar la hiptesis nula
p 0.5
1 : 0.5
H 0 : p 0.5
Regin de
no rechazo
Nivel de significacin:
Nmero pequeo: 1% , 5%
Fijado de antemano por el
investigador
Es la probabilidad de
rechazar H0 cuando es cierta
a=0.05
Reg. Crit.
Reg. Crit.
No rechazo
H0
H
: =40
Ing0William Len V
PRUEBA: UNILATERAL Y
BILATERAL
Las pruebas pueden ser unilaterales o
bilaterales (tambin llamados de una o dos
colas) segn establezcamos las hiptesis,
Si se define en trminos de igual y
diferente se esta ante una hiptesis
bilateral,
Si se coloca una direccin (en
trminos de mayor o menor) se esta
ante uno unilateral
20
Bilateral
H1: 40
Unilateral
Unilateral
H1: < 40
H1: >40
Ing William Len V
21
SIGNIFICACIN: p
El grado de significacin 'p' o 'sig' es la
probabilidad de error al rechazar la hiptesis
nula.
22
SIGNIFICACIN: p
El grado de significacin est relacionado con el
nivel de significacin es decir con el riesgo de error
que se est dispuesto a asumir en caso de rechazar la
hiptesis nula.
23
SIGNIFICACIN: p
El grado de significacin se calcula 'a posteri', es decir
cuando se conoce el resultado de haber aplicado una
prueba de significacin.
El grado de significacin indica la probabilidad de error
calculada al rechazar la hiptesis nula.
24
SIGNIFICACIN: p
H0: =40
H1: >40
P
P
X 43
SIGNIFICACIN: p
H0: =40
H1: >40
a
a
La verificacin es
estadsticamente
significativa
cuando p <
Es decir, si el
resultado
experimental
discrepa ms de lo
tolerado a priori.
X 50
Ing William Len V
26
Sobre p
Conocido a sabemos
todo sobre la regin
crtica
Es
conocido
realizar
experimento
Conocido p sabemos
todo
sobre
el
resultado
del
experimento
tras
el
rechazarla
No se rechazar si las
pruebas no indican lo
contrario
Rechazarla por error tiene
graves consecuencias
28
29
30
31
32
La nica forma de
disminuir ambos a la
vez es aumentar el
tamao
de
la
muestra.
Ing William Len V
33
Inocente
OK
Culpable
Error
Menos grave
Culpable Error
OK
Muy
grave
Ing William Len V
34
No Rechazo H0
H0 cierta
Correcto
H0 Falsa
Error de tipo II
El tratamiento no
El tratamiento si tiene
tiene efecto y as se efecto pero no lo
decide.
percibimos.
Probabilidad
Rechazo H0
Acepto H1
Error de tipo I
El tratamiento no
tiene efecto pero se
decide que s.
Probabilidad
Ing William Len V
Correcto
El tratamiento tiene
efecto y el experimento
lo confirma.
35
PRUEBA DE HIPOTESIS
PARA LA MEDIA.
MUESTRAS GRANDES
z
Ing William Len V
38
39
Ho: = 16
Ing William Len V
40
41
42
43
X
z
n
Ing William Len V
44
45
46
hiptesis
47
48
49
50
Decidir si H0 no se rechaza o se
rechaza.
Y Concluir en trminos del contexto
del problema.
51
Solucin:
Paso 1
Las hiptesis se expresan de la siguiente manera:
H0 : = 60,000 Km
La duracin de las llantas es de 60,000 Km
H1 : 60,000 Km
La duracin de las llantas es distinta a 60,000 Km
Solucin:
Paso 2
El estadstico de prueba mas apropiado.
Teniendo en cuenta que se tiene una muestra de 48
llantas y se conoce la desviacin estndar de la
poblacin
n = 48 llantas
= 5,000 Km
Se utilizar la distribucin Z
Solucin:
Paso 3
El nivel de significancia es de 0.05
Y por la hiptesis alternativa:
H1 : 60,000 Km
Se trata de una prueba bilateral
En el siguiente paso vamos a obtener el valor de Z y
para ello vamos a apoyarnos en la grfica siguiente:
*Se
Solucin:
Paso 4
Se Calcular el estadstico de prueba a partir de los
datos muestrales considerando H0 como verdadera
59,500 60,000
Z
721.71
Z 0.693
Donde:
5000
48
5000
=721.71
6.928
Solucin:
Paso 5
Solucin:
Desarrollando bajo el enfoque del intervalo de confianza:
Primero, se va a calcular el error estndar de la media y
para ello emplearemos la expresin del error estndar:
Solucin:
Se va a determinar los lmites superior e inferior de
confianza para el intervalo de la media poblacional
ya que se trata de una prueba de dos extremos.
Se aplica la expresin siguiente:
Lc H 0 Z x
Sustituyendo valores en ella, se tiene:
Lc = 60,000 1.96 (721.69)
Ls = 60,000 + 1,414.51 Ls = 61,414.51 Km.
Li = 60,000 1,414.51 Li = 58,585.49 Km
Entonces la media de la poblacin flucta entre 58,585.49 y
61,414.51 millas en un nivel de confianza del 95%.
Ing William Len V
Solucin:
Al regresar a la grfica anterior se observa los lmites
de confianza y la media muestral.
Con ello se analiza si no se rechaza la hiptesis nula
adems de verificar si es verdadera o falsa.
Solucin:
La media muestral se ubica dentro de la zona de no
rechazo, por lo que podemos decir que la hiptesis
nula es verdadera,
Entonces la media muestral se ubica en -0.693 = -0.693(721.69)
500.13 60,000-500 = 59,500
y se confirma que cae en la zona de no rechazo
Concluimos que la duracin media de las llantas es muy
cercana a la que afirma el fabricante de 60,000 millas, con un
nivel de significancia de 0.05.
__
Ejemplo 2
Una cadena de restaurantes afirma que el tiempo medio de espera
de clientes por atender est distribuido normalmente con una
media de 3 minutos y una desviacin estndar de 1 minuto.
Su departamento de aseguramiento de la calidad hall en una
muestra de 50 clientes en un cierto establecimiento que el tiempo
medio de espera era de 2.75 minutos. Al nivel de significacin de
0.05,
Es dicho tiempo menor de 3
minutos?
Datos:
= 3 minutos.
= 1minuto.
n = 50 clientes.
a = 0.05
x = 2.75 minutos.
Ing William Len V
Ejemplo 2.Paso 1
Las hiptesis se expresan de la siguiente manera:
Ho : = 3
El tiempo promedio de espera es de 3 minutos.
H1 : 3
El tiempo promedio de espera es menor de 3 minutos.
Solucin:
Paso 2
El estadstico de prueba mas apropiado.
Teniendo en cuenta que se tiene una muestra de 50 clientes
y se conoce la desviacin de la poblacin
n = 50 clientes
= 1 minuto
Entonces
Se utilizar la distribucin Z
Ing William Len V
Solucin:
Paso 3
El nivel de significancia es de 0.05
Y por la hiptesis alternativa:
H1 : 3 Se trata de una prueba unilateral
En el siguiente paso vamos a obtener el valor de Z y para
ello vamos a apoyarnos en la grfica siguiente:
Solucin:
Paso 4
Se Calcular el estadstico de prueba a partir de los
datos muestrales considerando H0 como verdadera
2.75 3
0.1414
0.25
0.1414
Z 1.77
Solucin:
Paso 5
Se va ha decidir si H0 no se rechaza o se
rechaza.
Como -1.77 es mayor que -1.64 se rechaza la hiptesis
nula
Es decir el z de los datos se encuentra en la zona de
rechazo
Entonces se concluye que el tiempo medio de espera
de clientes por atender en este establecimiento es
menor de 3 minutos.
1
50
1
7.07
x 0.1414
PRUEBA DE HIPTESIS DE 2
MEDIAS POBLACIONALES
PRUEBA DE HIPTESIS DE 2
MEDIAS POBLACIONALES
Se tienen dos poblaciones y se toman
muestras aleatorias independientes de
tamaos n1 y n2, se puede comparar el
comportamiento de dichas poblaciones a
travs de los promedios.
Las muestras se obtienen de poblaciones
con distribucin normal
El estadstico de trabajo depende de las
caractersticas de las poblaciones y del
tamao de las muestras.
Ing William Len V
72
PRUEBA DE HIPTESIS DE 2
MEDIAS POBLACIONALES
Se puede plantear uno de los siguientes tres tipos de hiptesis:
- Prueba de hiptesis a dos colas
H0 : 1=2 H0 : 1-2 = 0
H1 : 12 H1 : 1-2 0
- Prueba de hiptesis a una cola superior
H0 : 1=2
H0 : 1-2 = 0
H1 : 1>2
H1 : 1-2 > 0
- Prueba de hiptesis a una cola inferior
H0 : 1=2
H0 : 1-2 = 0
H1 : 1<2
H1 : 1-2 < 0
Ing William Len V
73
PRUEBA DE HIPTESIS DE 2
MEDIAS POBLACIONALES
PRUEBA DE HIPTESIS DE 2 MEDIAS POBLACIONALES
1 y 2
n1 y n2>=30
Si tienen varianzas
poblacionales desconocidas
Si tienen varianzas
poblacionales conocidas
desconocidos
n1 y n2<30
2 conocidos
Varianzas iguales
Varianzas diferentes
2 diferentes
Ing William Len V
2 iguales
74
Estaremos interesados en la
prueba de la hiptesis de que
las medias 1y 2 sean
iguales.
Ing William Len V
75
H0 : 1-2 = 0
H1 : 1-2 0
Donde
H0 = Hiptesis nula
H1 = Hiptesis alternativa.
1= media de la poblacin 1
2= media de la poblacin 2
(1 2 ) (1 2 )
21 2 2
+
1
2
1 = media de la muestra 1
1 = media de la muestra 2
1 2 = varianza de la poblacin 1
2 2 = varianza de la poblacin 2
1 = tamao de la muestra 1
2 = tamao de la muestra 2
Se estar interesado en la
prueba de la hiptesis de que
las medias 1y 2 sean
iguales.
Ing William Len V
80
(1 2 ) (1 2 )
21 2 2
+
1
2
1 = media de la muestra 1
2 = media de la muestra 2
1 2 = varianza de la muestra 1
2 2 = varianza de la muestra 2
1 = tamao de la muestra 1
2 = tamao de la muestra 2
1 1 2 1 + 2 1 2 2 1
1 +2 2
1
1
2
Donde:
1 = media de la muestra 1
2 = media de la muestra 2
1 2 = varianza de la muestra 1
2 2 = varianza de la muestra 2
(1 2 ) (1 2 )
=
= tamao de la muestra 1
2 = tamao de la muestra 2
EJEMPLO 1
El salario promedio mensual para una muestra de 30
empleados de una empresa manufacturera es de
$280.000, con desviacin estndar de $14.000.
En otra empresa del mismo tipo, una muestra aleatoria
de 40 empleados, tiene un salario promedio de
$270.000, con una desviacin estndar de $10.000.
No se suponen iguales las
desviaciones estndar de las
poblaciones. Se requiere probar
la hiptesis de que no existe
diferencia entre los salarios
promedios mensuales de las
dos empresas, utilizando un
nivel de significancia del 5%.
Ing William Len V
83
EJEMPLO 1
1.- Establecer las hiptesis
0 : 1 2 = 0, o que 0 : 1 = 2
No existe diferencia entre los salarios
promedios mensuales de las dos empresas
0 : 1 2 0, o que 0 : 1 2
Existe diferencia entre los salarios
promedios mensuales de las dos empresas
84
EJEMPLO 1
2.- Elegir el modelo probabilstico:
Como n> 30
Se utiliza la curva Z:
85
EJEMPLO 1
3.- Establecer el criterio de contraste
/2=0.025
/2=0.025
REGION DE NO
RECHAZO
Z1=-1.96
=0.5
Z2=1.96
86
EJEMPLO 1
4.- Calcular el valor del estadstico de prueba
La desviacin estndar de cada una de las
muestras es:
1
14000
=
1
30
= 2556.04
2
10000
=
=
= 1581.14
2
40
1 =
2
=
1 2 + 2 2 =
2556.04
+ 1581.14
= 3005.53
3005.55
Ing William Len V
87
EJEMPLO 1
5.- Tomar una decisin e interpretar
Como Z = 3.33 no se encuentra en
El Intervalo critico de Z. 1.96 < < 1.96
No se encuentra en la regin de NO RECHAZO
segn la grafica de la Campana de Gauss.
Por ello se rechaza la Hiptesis nula y se
acepta la hiptesis alternativa:
El salario promedio mensual de las dos
empresas es diferente.
88
EJEMPLO 2
Un analista de salarios consideraba que el salario
promedio de la primera empresa era mayor que en
la segunda empresa.
Con el objeto de someter su posicin a una prueba
critica, le da el beneficio de la duda a la posibilidad
contraria y plantea la hiptesis nula de que el
salario promedio de la primera empresa es igual o
menor que el de la segunda.
Con los datos del ejemplo 1
Pruebe la hiptesis, con el nivel
de significancia del 1%.
Se
supone
que
las
desviaciones estndar de las
dos poblaciones son iguales.
Ing William Len V
89
EJEMPLO 2
1.- Establecer las hiptesis
0 : 1 = 2 o 1 2 = 0
El salario promedio de la primera
empresa es igual que en la segunda
empresa.
1 : 1 > 2 o 1 2 > 0
El salario promedio de la primera
empresa es mayor que en la segunda
empresa.
90
EJEMPLO 2
2.- Elegir el modelo probabilstico:
Como n> 30
Se utiliza la curva Z:
91
EJEMPLO 2
3.- Establecer el criterio de contraste
REGION DE NO
RECHAZO
=0.01
0
=0.5
Z2=2.33
92
EJEMPLO 2
4.- Calcular el valor del estadstico de
prueba
Hallamos el z para comparar.
1 2 280000 270000
=
=
= 3.33
3005.55
93
EJEMPLO 2
5.- Tomar una decisin e interpretar
94
EJEMPLO 3
95
EJEMPLO 3
1.- Establecer las hiptesis
Se desea probar si la diferencia entre los ingresos
de la ciudad 1 y la 2 es de $1,500 o ms, por lo
tanto:
H0 : 1 2 = 1,500
La diferencia en el ingreso promedio de la primera
ciudad con respecto al promedio de la segunda
ciudad es de $1.500 mensuales.
H1 : 1 2 < 1,500
La diferencia en el ingreso promedio de la primera
ciudad con respecto al promedio de la segunda
ciudad es menor de $1.500 mensuales.
Ing William Len V
96
EJEMPLO 3
2.- Elegir el modelo probabilstico:
El tamao de las muestras es grande y las
varianzas poblacionales son conocidas, por
consiguiente la estadstica de trabajo a utilizar es
la distribucin Z:
97
EJEMPLO 3
3.- Establecer el criterio de contraste
Para un nivel de confianza del 95 por ciento, el alfa
ser 0.05
Y la hiptesis alternativa es:
H1 : 1 2 < 1,500 por lo tanto se trata de una prueba
unilateral negativa
De la tabla de la distribucin
normal se tiene un valor de Z de
-1.64..
98
EJEMPLO 3
4.- Calcular el valor del estadstico de prueba
Se halla el z de la prueba, para comparar.
n1=30
= 35,500
1=1,800
1 2 =
n2=40
= 34,600
2=2,400
1-=0.95
1 2 (1 2 )
12 =
21 2 2
+
1
2
35,50034,600 1.500
=-1.195
2
2
1,800
2,400
+
30
99
EJEMPLO 3
-1.195
100
EJEMPLO 4
Se realiz un estudio con un nivel de significancia de 0.05 para
investigar si la prensa popular est ms orientada hacia temas
sexuales que la prensa dirigida a la clase media. Se
101
EJEMPLO 4
1.- Establecer las hiptesis
Ho: 1 = 2
Ho: La orientacin hacia contenidos
sexuales en la prensa popular y en la prensa
de clase media son iguales
Ha: 1> 2
Ha: La orientacin hacia contenidos
sexuales es mayor en la prensa popular que
en la prensa de clase media .
102
EJEMPLO 4
2.- Elegir el modelo probabilstico:
Para determinar que tipo de distribucin se
utilizar:
Si n1 + n2 - 2 > 30 entonces se busca en la
tabla el valor de z correspondiente a /2.
Si n1 + n2 2 30 se busca en la tabla el valor t
correspondiente a = n1+n2-2 y /2.
Entonces n > 30 y por lo tanto se utiliza la
distribucin normal a travs de la tabla z con
= .05
En este ejemplo, = n1 + n2 - 2 = 40 + 40 - 2 =
78
Ing William Len V
103
EJEMPLO 4
3.- Establecer el criterio de contraste
Como en este problema, = .05 y la hiptesis alterna contiene
el signo (>) el problema es de una cola, es decir, la regin crtica
se ubica en el extremo derecho de la curva.
Luego se aplica la frmula de interpolacin:
0.05
104
EJEMPLO 4
4.- Calcular el valor del estadstico de prueba con varianzas
iguales
Se calcula el error estndar de la diferencia de las medias
1 1 2 1 + 2 1 2 2 1
1 +2 2
1
1
2
105
EJEMPLO 4
5.- Tomar una decisin e interpretar
El estadstico de prueba queda localizado fuera de
la zona crtica, entonces no se rechaza la hiptesis
nula ( Ho),
Por lo tanto se concluye lo siguiente:
No hay evidencia suficiente, con un nivel de
significancia de .05, de que la prensa popular tenga
una mayor orientacin al tema sexual que la prensa
de clase media
106
FIN
wjleonv@yahoo.com