Sei sulla pagina 1di 34

Estadística Aplicada

Universidad Maimónides
2016

Clase 6 – Contraste de Hipótesis

Pedro Elosegui

1
9-3

Definición de Hipótesis
• La Hipótesis es un enunciado acerca de una población
que se elabora con el propósito de ponerla a prueba.
• Ejemplos de hipótesis acerca de un parámetro de
población son:
– la media mensual de ingresos para analistas de
sistemas es $3625
– el 20% de los delincuentes juveniles son capturados y
sentenciados a prisión
– una persona acusada de un delito es culpable o
inocente?
9-3

Que errores se pueden cometer?

Una persona acusada de un delito es culpable o inocente?

“en caso de duda vale más libertar un


culpado, que condenar un inocente”

General José de San Martín (Instalación de la Corte


Suprema de Perú, 1821)
9-3

Que errores se pueden cometer?

Hipótesis Situación Real No rechazo Rechazo

Hipótesis nula H0: Verdadera (es inocente)


INOCENTE

Hipótesis nula H0: Falsa (no es inocente)


INOCENTE

- Error Tipo I: rechazar la hipótesis nula cuando en realidad es


verdadera

- Error Tipo II: No rechazar la hipótesis nula cuando en realidad es


falsa.
9-3

Que errores se pueden cometer?


Hipótesis Situación Real No rechazo Rechazo

Hipótesis nula H0: Verdadera (es inocente) OK Error Tipo I


INOCENTE

Hipótesis nula H0: Falsa (no es inocente) Error Tipo II OK


INOCENTE

Un médico que le da una medicación a un paciente sano estaría


cometiendo un Error Tipo I

Un médico que NO le da una medicación a un paciente enfermo estaría


cometiendo un Error Tipo II
9-4

De que se trata una prueba de hipótesis?

- Es un procedimiento basado en la evidencia muestral y


en la teoría de probabilidad

- Se emplea para determinar si la hipótesis es:


– razonable y no debe rechazarse
– NO es razonable y debe ser rechazada
9-5

Prueba de hipótesis
P a s o 1 : p la n t e a r la s h i p ó te s is n u la y a lt e r n a

P a s o 2 : s e le c c i o n a r u n n i v e l d e s i g n i f ic a n c ia

P a s o 3 : i d e n t i f ic a r e l v a lo r e s ta d ís t i c o d e p r u e b a

P a s o 4 : f o r m u la r u n a r e g l a d e d e c i s i ó n

P a s o 5 : t o m a r u n a m u e s t r a , lle g a r a u n a d e c is i ó n

N o r e c h a z a r la R e c h a z a r l a h i p ó t e s i s n u la
h i p ó t e s i s n u la y a c e p t a r la a l t e r n a
9-6

Definiciones
• Hipótesis nula H0: afirmación acerca del valor de un
parámetro poblacional
• Se plantea con el objetivo de probar y supone que “no hay
cambio”
• Por esta razón siempre incluye el signo “=“

• Hipótesis alterna H1: afirmación que se aceptará si los


datos muestrales proporcionan evidencia de que la
hipótesis nula es falsa

• Nivel de significancia: probabilidad de rechazar la


hipótesis nula cuando es verdadera
9-7

Definiciones
• Valor crítico
- el valor que divide la región de aceptación y la región de
rechazo de la hipótesis nula
- Corresponde al valor z que surge del nivel de significancia
elegido

• Estadístico de prueba
- valor obtenido a partir de la información muestral
- se utiliza para determinar si se rechaza o no la hipótesis
nula
- En las pruebas acerca de la media poblacional el
Estadístico de prueba es
9-8

Prueba de significancia de una cola

• Una prueba es de una cola cuando la hipótesis alterna, H1,


establece una dirección, como:
– H0 : el ingreso medio de las mujeres es menor o igual al
ingreso medio de los hombres.

– H1 : el ingreso medio de las mujeres es mayor que el de


los hombres.
 

Distribución demuestreo para el valor estadístico z,


r a l i t r b u i o n : = 0 , = 1

prueba de una cola, nivel de significancia de .05


0 . 4

.95 probabilidad
0 . 3

.05 región de
rechazo
0 . 2
f ( x

0 . 1
Valor
crítico
z = 1.65
. 0

- 5

0 1 2 3 4

© 2001 Alfaomega Grupo Editor


9-10

Prueba de significancia de dos colas

• Una prueba es de dos colas cuando no se establece


una dirección específica de la hipótesis alterna H1,
como:
– H0 : el ingreso medio de las mujeres es igual al
ingreso medio de los hombres.
– H1 : el ingreso medio de las mujeres no es igual al
ingreso medio de los hombres.
 

Distribución de muestreo para el valor estadístico z, prueba


r a l i t r b u i o n : = 0 , = 1

de dos colas, nivel de significancia de 0.05


0 . 4

.95 probabilidad
0 . 3

2 .025 regiones
de rechazo
0 . 2
x

Valor
f (

0 . 1

crítico
z = 1.96
. 0

- 5

-4 -3 -2 -1 0 1 2 3 4

© 2001 Alfaomega Grupo Editor


9-12

Prueba para la media poblacional: muestra grande,


desviación estándar poblacional conocida

• Cuando se hace una prueba para la media poblacional de una


muestra grande y se conoce la desviación estándar, el estadístico de
prueba está dado por:

X 
z
/ n
9-13

EJEMPLO 1

• Los fabricantes de Fries’ Catsup indican en su etiqueta


que el contenido de la botella es de 16 onzas. Cada
hora se toma una muestra de 36 botellas y se pesa el
contenido. La muestra de la última hora tiene un peso
medio de 16.12 onzas con una desviación estándar de .
5 onzas. ¿Está el proceso fuera de control para un nivel
de significancia de .05?
9-14

EJEMPLO 1 continuación

• Paso 1: establezca la hipótesis nula y alterna


• Paso 2: establezca la regla de decisión:

H0 :   16 H1:   16
• Paso 3: calcule el valor del estadístico de prueba:
H0 se rechaza si z <- 1.96 o z > 1.96

• Paso 4: decisión sobre H0: no se rechaza H0 porque 1.44 es


menor que el valor crítico 1.96

z  [1612
.  16] / [.5 / 36 ]  144
.
9-15

Valor p en la prueba de hipótesis

• Valor p: es la probabilidad de observar un valor muestral tan


extremo o más que el valor observado, dado que la hipótesis
nula es verdadera.
• Si el valor p es menor que el nivel de significancia, H0 se
rechaza.
• Si el valor p es mayor que el nivel de significancia, H0 no se
rechaza.
9-16

Cálculo del valor p

• Prueba de una cola: valor p = P { z  el valor absoluto del


estadístico de prueba calculado}
• Prueba de dos colas: valor p = 2P { z el valor absoluto
del estadístico de prueba calculado}
• Para el EJEMPLO 1, z = 1.44, y para una prueba de dos
colas, el valor p = 2P { z  1.44} = 2(.5-.4251) = .1498.
Como .1498 > .05, no se rechaza H0.
9-17
Prueba para la media poblacional: muestra
grande, desviación estándar poblacional
desconocida
• Aquí  es desconocida, así que se estimará con la
desviación estándar de la muesta s.
• Siempre que el tamaño de muestra n  30,
z puede aproximarce con:

X 
z
s/ n
9-18

EJEMPLO 2
• La cadena Roder’s Discount emite su propia tarjeta de
crédito. Lisa, la gerente de crédito, quiere encontrar si la
media mensual de saldos no pagados es mayor que $400.
El nivel de significancia es de .05. Una revisión al azar de
172 saldos reveló que la media muestral es $407 y la
desviación estándar muestral es $38. ¿Debe Lisa concluir
que la población media es mayor que $400, o es razonable
suponer que la diferencia de $7 ($407-$400) se debe al
azar?
9-19

EJEMPLO 2 continuación

• Paso 1: H0 :   400 H1:   400

• Paso 2: H0 se rechaza si z > 1.645

• Paso 3: z  [407  400] /[38 / 172 ]  2.42

• Paso 4: H0 se rechaza. Lisa puede concluir que la


media de saldos no pagados es mayor que $400.
9-20

Prueba de hipótesis: dos medias poblacionales

• Suponga que los parámetros para dos poblaciones son:


1 ,  2 ,  1 y  2

• Para muestras grandes el estadístico de


prueba es:

X1  X 2
z 2 2
s1 s2

n1 n2
9-21

Prueba de hipótesis: dos medias poblacionales

• Cuando  1 y  2 no se conocen pero el tamaño de muestra


n1 y .n2 es mayor o igual que 30, el estadístico de prueba
es

X1  X 2
z 2 2
s s2
1

n1 n2
9-22

EJEMPLO 3
• Se realizó un estudio para comparar los años
promedio de servicio de quienes se retiraron en
1979 con los que se retiraron el año anterior en
Delong Manufacturing Co. Con un nivel de
significancia de .01 ¿podemos concluir que los
trabajadores que se retiraron el año pasado
trabajaron más años según la siguiente muestra?
Nota: sea población #1= año anterior.
Característica 1979 Año anterior
Media de la muestra 25.6 30.4
Desviación estándar 2.9 3.6
de la muestra
Tamaño de la muestra 40 45
9-23

EJEMPLO 3 continuación

• Paso 1: H0 : 2  1 H1: 2  1

• Paso 2: Rechace H0 si z > 2.33


30.4  25.6
z 2 2
 6.80
• Paso 3: 3.6 2.9

45 40
• Paso 4: Como z = 6.80 > 2.33, H0 se rechaza.
9-24

Pruebas respecto a relaciones proporcionales


• Relación proporcional: parte fraccional o porcentaje que
indica la parte de la población o muestra que tiene un
atributo particular de interés.
• La relación proporcional muestral se representa por
donde p

número de éxitos en la muestra


p=
número muestreado
9-25

Estadístico de prueba para ensayos con una sola


relación proporcional de población
p 
z
 (1   )
n
  relación proporcional poblacional
p  relación proporcional muestral
9-26

EJEMPLO 4

• En el pasado, 15% de la propaganda por correo para


donativos dio como resultado contribuciones. Se
mandó una nueva carta a una muestra de 200 personas
y 45 enviaron un donativo. Para .05 de significancia, ¿se
puede concluir que la nueva carta fue más efectiva?
9-27

EJEMPLO 4 continuación

• Paso 1: H0 : p .15 H1: p .15


• Paso 2: H0 se rechaza si z > 1.645

• Paso 3: 45
.15
z  200  2.97
(.15)(.85)
200

• Paso 4: como z = 2.97 >1.645, H0 se rechaza. La nueva carta


es más efectiva.
9-28

Prueba donde interviene la diferencia entre dos


relaciones proporcionales de población
• El estadístico de prueba en este caso es:

p1  p2
z
pc (1  pc ) pc (1  pc )

n1 n2
9-29

Prueba donde interviene la diferencia entre dos


relaciones proporcionales de población (cont.)

• pc es la media ponderada de las dos relaciones


proporcionales, calculadas por:

número total de éxitos X1 + X 2


pc = =
número total de muestras n1 + n2
9-30

EJEMPLO 5

• ¿Es más probable que los trabajadores solteros falten más


que los trabajadores casados? Una muestra de 250
trabajadores casados indicó que 22 faltaron más de 5 días
el año pasado, mientras que una muestra de 300
trabajadores solteros indicó que 35 faltaron más de 5 días.
Utilice .05 de nivel de significancia. Nota: sea población #1
= trabajadores solteros.
9-31

EJEMPLO 5 continuación

• Paso 1: H0 : p2  p1 H1: p2  p1
• Paso 2: H0 se rechaza si z > 1.645
• Paso 3:

22  35
p .1036
250  300
.1167 .0880
z
.1036(1.1036) .1036(1.1036)

300 250
9-32

EJEMPLO 5 continuación

• Paso 4: H0 no se rechaza. No existe diferencia entre la


proporción de trabajadores casados y solteros que faltan más
de 5 días al trabajo.
• El valor p = P{ z > 1.1} = .1357

Potrebbero piacerti anche