Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
EA-100
Capítulo 6
Test de Hipótesis
2
1. Introducción
Un método para formular inferencias acerca
de una población consiste en producir
intervalos de confianza para los parámetros
en cuestión.
Pero frecuentemente estamos solo
interesados en verificar una suposición, o
hipótesis, concerniente a un parámetro, y
no en su localización, ni en la longitud del
intervalo de confianza.
3
1. Introducción
Por ejemplo, considere que un componente
electrónico es garantizado para durar al
menos 200 horas.
En ese caso, podríamos estar interesados
en chequear la hipótesis de que la media es
al menos 200 o que es menor a 200 horas.
Un intervalo de confianza en si no seria de
gran interés, aún cuando provee el
mecanismo para testar la hipótesis.
4
1. Introducción
El test de hipótesis es una consecuencia
natural del método científico.
Primero observamos la naturaleza, luego
formulamos una teoría, para finalmente
testar la teoría usando observaciones.
El test de hipótesis requiere una decisión
cuando la muestra observada es
comparada con la teoría.
5
1. Introducción
¿Como decidimos si la muestra corrobora la
hipótesis?
¿Cuando debemos rechazar la hipótesis y
cuando no?
¿Cual es la probabilidad de que tomemos una
mala decisión?
¿Que función dependiente de las observaciones
debemos emplear en el proceso de toma de
decisiones?
Las respuestas a estas preguntas recaen en el
estudio del test de hipótesis.
6
2. Terminología
7
2. Terminología
Suponga una muestra aleatoria de tamaño
n tomada de una población con media
desconocida .
Es razonable usar la media de la muestra
como una estimativa de la media
poblacional, con información adicional
provista por la varianza de la población o
por su estimador .
8
2. Terminología
Una hipótesis es una afirmación acerca de
un parámetro de la población.
Existen 2 tipos de hipótesis: nula y
alternativa.
La hipótesis nula usualmente
representa el procedimiento operacional
estándar de un sistema o especificaciones
conocidas. Inicialmente este estado se
asume como verdadero.
9
2. Terminología
La hipótesis alternativa ( , también
conocida por H1) es la afirmación alternativa
propuesta y es también denominada como
la hipótesis de investigación.
La hipótesis alternativa especifica los
valores de los parámetros que representan
un cambio importante respecto al
procedimiento operacional estándar o
especificaciones conocidas. Es una
contradicción a la hipótesis nula.
10
2. Terminología
¿Como decidimos qué afirmación es la
verdadera?
Observaciones serán recolectadas para
determinar si los datos confirman una u
otra.
Un estadístico de prueba (test statistic,
TS) es una función de datos muestrales en
los que nos basamos para rechazar o no .
11
2. Terminología
La región de rechazo, RR (o región
crítica) es el conjunto de valores del
estadístico de prueba que producen el
rechazo de la hipótesis nula.
El valor crítico (critical value, CV) es la
frontera entre la región de rechazo y la
región de aceptación.
12
2. Terminología: ej. 1
La profundidad aceptable de un proceso de
taladrado es 2”.
Una pequeña variación en la profundidad
de los agujeros es aceptable, pero medias
muy grandes o muy pequeñas no son
aceptables.
Identifique los parámetros y el par de
hipótesis que son de interés.
13
2. Terminología: ej. 1
Aquí estamos interesados en hacer una
inferencia acerca de la media de la
profundidad de los agujeros taladrados .
Podemos hipotetizar que , por
tanto, .
La región de rechazo
estará en ambas colas
de la distribución.
Este test se denomina
test de dos colas.
14
2. Terminología: ej. 2
Se sabe que un proceso de manufactura
produce 1% de piezas defectuosas.
Recientemente fueron realizados algunos
cambios estructurales en el proceso de
fabricación.
Cualquier reducción en el porcentaje de
defectos es bienvenido, sin embargo,
cualquier incremento es indeseable.
Identifique el parámetro de interés y
formule las hipótesis a ser testadas.
15
2. Terminología: ej. 2
Aquí estamos interesados en la proporción
p de defectos en un proceso de
manufactura.
Ya que los valores deseables de p están
debajo de 1%, , por tanto,
vvvvvv .
Si la región de rechazo
está a la derecha se
denomina test de cola
superior (o derecha).
16
2. Terminología: ej. 3
Una máquina corta varillas con diámetro
medio de 5 mm y varianza 0.5 mm2.
Se realizan ciertos ajustes en el proceso
para mejorar la precisión del proceso de
corte.
¿Cual es el parámetro de interés y cuales
las hipótesis a ser testadas para verificar
que los ajustes han reducido la variación en
los diámetros?
17
2. Terminología: ej. 3
En este caso estamos interesados en ,
que es la varianza de los diámetros de las
varillas cortadas.
Podríamos asumir que la hipótesis nula
corresponde a la situación en la que no se
presenta una mejora , por
tanto, .
Un test como este se deno-
mina test de cola inferior
(o izquierda).
18
2. Errores
El valor real del parámetro es desconocido
y la decisión de no rechazar (o rechazar)
es basada en un estadístico de prueba.
Por tanto, habrán 2 tipos de errores en el
proceso de decisión:
Además:
21
2. Errores
Considerando una muestra grande para
estimar la media (la distribución muestral
de será aprox. normal), podemos
visualizar y .
23
2. Errores
Para una muestra de tamaño fijo, no
podemos disminuir la probabilidad de
ambos errores.
Si disminuimos , se incrementa y
viceversa.
El valor de K se puede determinar
especificando y usando propiedades de la
distribución normal:
24
2. Errores: ej. 5
Los errores del tipo I y II para el ej. 1 serán:
Tipo I: Concluir que la media de las
profundidades taladradas no es aceptable,
cuando si lo es.
Tipo II: Concluir que la media de las
profundidades taladradas es aceptable,
cuando no lo es.
25
2. Errores: ej. 6
Los errores del tipo I y II para el ej. 2 serán:
Tipo I: Concluir que el proceso produce más
errores de lo deseado, cuando los errores
están en un nivel aceptable.
Tipo II: Concluir que el proceso produce
errores aceptables, cuando en realidad se
requieren ajustes.
26
2. Errores: ej. 7
Los errores del tipo I y II para el ej. 3 serán:
Tipo I: Concluir que los ajustes realizados al
proceso son efectivos en reducir la
variación, cuando no han habido cambios.
Tipo II: Concluir que los ajustes realizados
han fallado, cuando en si han tenido efecto
positivo.
27
3. Muestra simple
28
3.1 Test para la media -
distribución genérica
Una de las situaciones más comunes y
simples en el test de hipótesis surge
cuando el tamaño de la muestra es grande.
Suponga la afirmación de que toma el
valor específico y deseamos testar la
validez de la hipótesis.
Si no está en el intervalo ,
entonces:
29
3.1 Test para la media -
distribución genérica
Es decir:
30
3.1 Test para la media -
distribución genérica
Mientras se denominó coeficiente
de confianza en problemas de estimación,
será llamado nivel de significancia en
problemas de test de hipótesis.
31
3.1 Test para la media -
distribución genérica: ej. 1
La profundidad deseada de agujeros
taladrados es 2”.
Podríamos hipotetizar que la media es
efectivamente 2”.
Para verificar la hipótesis tomamos una
muestra de 100 agujeros taladrados, cuya
media es 2.005”, con desviación estándar
0.03”.
Para , puede ser rechazada la
hipótesis?
32
3.1 Test para la media -
distribución genérica: ej. 1
La hipótesis es rechazada si:
34
3.1 Test para la media -
distribución genérica
Al testar,
consideramos solo el intervalo de confianza
de una cola para .
Si es mayor que un límite de confianza
superior para , entonces rechazamos:
35
3.1 Test para la media -
distribución genérica
Rechazaremos en favor de cuando
mmmm , o equivalentemente,
cuando:
36
3.1 Test para la media -
distribución genérica: ej. 2
El departamento de calidad de una
empresa afirma que el número promedio de
llamadas de reclamos es no mayor a 15 por
semana.
Para testar la afirmación, se recabaron
aleatoriamente datos de 36 semanas, con
los resultados y .
¿Los resultados confirman o contradicen la
afirmación al 5% de nivel de significancia?
37
3.1 Test para la media -
distribución genérica: ej. 2
La hipótesis a ser testada es:
38
3.1 Test para la media -
distribución genérica: ej. 2
Es decir, la media muestral observada es 4
desviaciones estándar más grande que el
valor hipotetizado
En este caso tene-
mos suficiente evi-
dencia para rechazar
la hipótesis, es decir,
el número promedio
de llamadas excede-
rá 15.
39
3.1 Test para la media -
valor p
El test de hipótesis presentado requiere
especificar un nivel de significancia , hallar
vv (o en tests de una cola), calcular el
valor de Z y rechazar si .
En este proceso es determinado mas o
menos arbitrariamente, con un valor igual a
0.05 usado muy comúnmente.
Una alternativa a especificar es hallar el
nivel de significancia más pequeño para el
cual el valor observado producirá el rechazo
de .
40
3.1 Test para la media -
valor p
Este valor es conocido como valor p del
test, o nivel de significancia observado.
Rechazaremos para valores p pequeños,
pero para valores grandes, digamos
mayores a 0.05, habrá poca evidencia para
rechazar .
El valor p será la probabilidad de observar
un estadístico de prueba tan extremo como
el valor calculado de la muestra, si es
verdadera.
41
3.1 Test para la media -
valor p: ej. 3
Halle el valor p para los datos del ej. 2.
Este valor es
mayor a 0.05,
por tanto, no
será rechazada.
43
3.1 Test para la media -
distribución genérica
En general, seguiremos los siguientes 4 pasos
para resolver problemas de test de hipótesis:
45
3.1 Test para la media -
distribución genérica: ej. 5
La hipótesis a ser testada es:
O si:
49
3.2 Test para la media -
distribución normal
Cuando las muestras son muy pequeñas, el
Teorema del Límite Central no dará una
buena aproximación para .
Cuando la población es al menos
aproximadamente normal,
tendrá una distribución t con (n-1) grados
de libertad.
Por tanto, el estadístico de prueba será:
50
3.2 Test para la media -
distribución normal: ej. 7
Una corporación está en el proceso de
determinar el presupuesto anual para una
planta nueva.
Para ello asume que el costo semanal
promedio de reparaciones es .
Para verificar esta afirmación, se obtienen
datos de plantas similares de 10 semanas.
Ello resulta en y .
Considerando ¿La muestra indicaría
que $1200 no es buena suposición?
51
3.2 Test para la media -
distribución normal: ej. 7
Desearemos testar:
52
3.2 Test para la media -
distribución normal: ej. 7
De manera similar, si usamos el abordaje del
valor p, el área encima de , será
igual a 0.0147. El doble de este valor será
0.0294, que es menor a 0.05.
http://www.stat.tamu.edu/~west/applets/tdemo.html 53
3.2 Test para la media -
distribución normal
54
3.4 Test para la varianza -
distribución normal
Generalmente, la varianza de la población
será desconocida.
Frecuentemente desearemos testar una
hipótesis acerca del valor de .
Para ello, podemos usar el estadístico
presentado en la estimación de intervalos
de confianza para , donde:
56
3.4 Test para la varianza -
distribución normal: ej. 8
En este caso testaremos:
57
3.4 Test para la varianza -
distribución normal: ej. 8
Ya que , no
rechazaremos la hipótesis nula.
58
3.4 Test para la varianza -
distribución normal
59
3.5 Test para dif. entre medias -
distribución genérica
Considerando muestras grandes, el
estimador tendrá
aproximadamente una distribución normal.
Por tanto, para testar ,
podemos usar el estadístico:
De tablas, encontramos .
El valor del estadístico de prueba será:
63
3.5 Test para dif. entre medias -
distribución genérica
64
3.6 Test para dif. entre medias -
distribución normal
Debido a razones financieras, técnicas,
limitaciones de tiempo, etc. muchas veces no
será posible contar con grandes muestras.
Si ambas poblaciones parecen tener
distribuciones normales con varianzas iguales,
usaremos el estadístico de prueba:
67
3.6 Test para dif. entre medias -
distribución normal : ej. 10
De tablas, para 16 grados de libertad,
obtenemos =1.746. Al ser este valor
mayor a 1.65, nos encontraremos en la
región de no rechazo:
68
3.6 Test para dif. entre medias -
distribución normal
69
3.6 Test para dif. entre medias -
distribución normal
70