ContrastesI PDF

4.
Contrastes de Hipótesis (I)
Profesora: Marı́a José Lombardı́a Cortiña

maria.jose.lombardia@udc.es
Departamento de Matemáticas. Universidade da Coruña
Programa Oficial de Postgrado en Estadı́stica e Investigación Operativa

Máster en Técnicas Estadı́sticas
M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 1 / 88

1 Introducción
2 Hipótesis Estadı́stica
3 Planteamiento
4 Tipos de error
5 Criterios de decisión
6 Etapas en la resolución de un contraste
7 Nivel crı́tico o p-valor
8 Potencia de un contraste
9 Contraste de razón de verosimilitud

Introducción
Introducción
Los objetivos de los procedimientos de inferencia estadı́stica expuestos

hasta el momentos han sido dos:
Estimación puntual: determinar el valor concreto de los parámetros
poblacionales de interés.
Intervalos de confianza: construir una región aleatoria que contenga
al parámetro con una probabilidad fijada de antemano
Contrastes de Hipótesis
En este tema se estudia como contrastar una hipótesis realizada sobre la
población en estudio.
Comprobar empı́ricamente que la información que proporciona la muestra
es compatible con la hipótesis realizada.

Introducción
Introducción
Ejemplo 1
Las especificaciones de su fabricante sitúan en 5 años la vida media (sin
fallos) de una determinada marca de baterı́as. Una organización de
consumidores mantiene que este promedio no se cumple y para
comprobarlo experimentalmente realizará un seguimiento sobre 50 nuevos
usuarios de este tipo de baterı́as.

Introducción
Introducción
Ejemplo 2
Un inversor se dispone a adquirir un paquete de acciones que cotizan en
bolsa. Se trata de una inversión a largo plazo y por ello prefiere comprar
acciones cuyo valor fluctúe poco en el mercado, aunque ello posiblemente
le suponga menores beneficios. De entre dos tipos de acciones, A y B, un
especialista en bolsa le ha asegurado que las de tipo A son más estables
que las de tipo B. Como no se fı́a en exceso decide comprobar la veracidad
de su afirmación observando en una revista especializada la evolución de
los dos tipos de acciones en los 36 últimos meses

Introducción
Introducción
Ejemplo 3
El ala más radical del partido polı́tico gobernante sostiene que como
mı́nimo el 60% de los votantes apoyarı́a la entrada del paı́s en una
organización militar internacional. Sin embargo, el gobierno sólo estarı́a
dispuesto a convocar un referéndum si esa afirmación pudiera ser avalada
empı́ricamente. Con tal objetivo el partido opta por realizar una encuesta
al respecto a 2.500 personas

Introducción
Introducción
Ejemplo 4
El “cuello amarillo común” y el “malviz pardo” son dos especies de aves
muy similares que comparten un medio común. Un grupo de cientı́ficos
afirma que la duración del canto en segundos del “cuello amarillo” es
superior a la del “malviz pardo” y sugieren que esta caracterı́stica es la
adecuada para su identificación. Los cientı́ficos se disponen a medir la
duración del canto en una muestra de cada especie con el objeto de poder
reafirmarse en su tesis.

Introducción
Introducción
En todos los casos la toma de datos precede a alguna afirmación no

probada sobre determinados parámetros poblacionales.
La motivación y el objetivo último de la experimentación es avalar o
rechazar tales afirmaciones y no la estimación de los valores reales.
Este es el planteamiento general de los contrastes de hipótesis:
se formula una hipótesis, se experimenta (la propia hipótesis sugiere
cómo diseñar el muestreo), se juzga si los resultados del experimento
apoyan estadı́sticamente la hipótesis de partida.
Esta decisión se realiza en términos probabilı́sticos: Si los resultados
obtenidos son admisibles (ocurren con alta probabilidad) cuando la
hipótesis de partida es cierta, entonces la ACEPTAMOS la hipótesis
inicial. En otro caso, la alta discrepancia (en términos de escasa
probabilidad) entre lo observado y lo supuesto lleva al RECHAZO de
la hipótesis inicial.

Hipótesis Estadı́stica
Definición
Se denomina hipótesis estadı́stica a cualquier conjetura sobre una o varias
caracterı́sticas de interés de un modelo de probabilidad.

Ejemplo 1
Las especificaciones de un fabricante sitúan en 5 años la vida media (sin
Se afirma que la vida media de las baterı́as es µ = 5.

Ejemplo 2
Un inversor se dispone a adquirir un paquete de acciones que cotizan en
bolsa. Se trata de una inversión a largo plazo y por ello prefiere comprar
acciones cuyo valor fluctúe poco en el mercado, aunque ello posiblemente
le suponga menores beneficios. De entre dos tipos de acciones, A y B, un
especialista en bolsa le ha asegurado que las de tipo A son más estables
que las de tipo B. Como no se fı́a en exceso decide comprobar la veracidad
de su afirmación observando en una revista especializada la evolución de
los dos tipos de acciones en los 36 últimos meses
El experto bursátil asegura que las acciones en A fluctúan menos que

las acciones en B, σA < σB

Ejemplo 3
El ala más radical del partido polı́tico gobernante sostiene que como
mı́nimo el 60% de los votantes apoyarı́a la entrada del paı́s en una
organización militar internacional. Sin embargo, el gobierno sólo estarı́a
dispuesto a convocar un referéndum si esa afirmación pudiera ser avalada
empı́ricamente. Con tal objetivo el partido opta por realizar una encuesta
al respecto a 2.500 personas
Un sector del partido polı́tico gobernante sostiene que p ≥ 0.6.

Ejemplo 4
El “cuello amarillo común” y el “malviz pardo” son dos especies de aves
muy similares que comparten un medio común. Un grupo de cientı́ficos
afirma que la duración del canto en segundos del “cuello amarillo” es
superior a la del “malviz pardo” y sugieren que esta caracterı́stica es la
adecuada para su identificación. Los cientı́ficos se disponen a medir la
duración del canto en una muestra de cada especie con el objeto de poder
reafirmarse en su tesis.
Se desea comparar la duración del canto entre dos especies de aves,

para verificar si la duración del canto en segundos del “cuello
amarillo” es superior a la del “malviz pardo”, µx > µy .

Ejemplos
Concretar el valor o rango de valores de algún vector de parámetros:
σ = 150, µ = 5 y p ≥ 00 6, respectivamente.
Establecer comparaciones entre los valores de los parámetros de
distintas poblaciones: σA < σB , µX > µY y pX > pY .
Especificar alguna caracterı́stica sobre la forma de una distribución: la
distribución es simétrica, tiene 2 modas, etc.
Determinar la forma de la distribución de probabilidad: los datos son
gaussianos.
Determinar la relación funcional entre dos variables aleatorias
cuantitativas.
Asumir que una muestra ha sido tomada al azar.
Afirmar que dos caracterı́sticas de una población son independientes:
el hábito de fumar no aumenta el riesgo de problemas digestivos,...
Definición
Una hipótesis paramétrica es una afirmación sobre los valores de
parámetros poblacionales desconocidos.
Definición
Una hipótesis paramétrica se dice simple si especifica un único valor para
cada parámetro poblacional desconocido (σ = 150, µX = µY , . . . ).
Definición
Una hipótesis paramétrica se dice compuesta si asigna un conjunto de
valores posibles a parámetros poblacionales desconocidos (2 < µ < 5,
σ 2 > 1, µX ≥ µY , pX > pY , . . . ).

Planteamiento
Las hipótesis nula y alternativa
Definición
Se denomina hipótesis nula, que habitualmente se denota por H0 , a la
hipótesis que se contrasta.
La hipótesis nula debe ser la hipótesis que se asume como correcta y

que no necesita ser probada.
La aceptación de H0 no implica que ésta sea correcta o que haya sido
probada, sino que los datos no han proporcionado evidencia suficiente
como para refutarla.
Si se quiere respaldar con contundencia un determinado argumento es
debido a que éste no puede ser asumido gratuitamente y, por tanto,
sólo podrá ser defendido a través del rechazo del argumento contrario
(el establecido en H0 ).

Planteamiento
Ejemplos
Se quiere avalar empı́ricamente que una nueva vacuna es efectiva.
H0 : “la vacuna no es efectiva”.
Se quiere mostrar que una máquina se ha desajustado y no produce el
promedio de piezas preespecificado (1.000).
H0 : “el promedio diario de piezas producido por la máquina es 1.000”.
Un programador quiere probar que el tiempo medio de ejecución del
programa A (µA ) es superior al tiempo medio de ejecución del
programa B (µB ).
H 0 : µA ≤ µB .

Planteamiento
Hipótesis alternativa
Rechazar la hipótesis nula implica asumir como correcta una hipótesis
complementaria hipótesis alternativa, que suele denotarse por H1 y
representa cualquier forma de negación de la hipótesis nula.
Ejemplos
En los ejemplos anteriores las hipótesis alternativas H1 son:
H1 : “la vacuna es efectiva”,
H1 : “el promedio diario de piezas producido por la máquina es
distinto de 1.000”
H1 : µA > µB .

Planteamiento
El estadı́stico de contraste
Planteado el contraste y recogida la muestra, hay que establecer algún

criterio estadı́stico que permita decidir hasta qué punto los datos están de
acuerdo o no con la hipótesis nula.
Definición
Cualquier función de los datos muestrales y del valor del parámetro
especificado por la hipótesis nula, con distribución conocida cuando H0 es
cierta, se denomina estadı́stico de contraste o medida de discrepancia.

Planteamiento
Si H0 es cierta, se conoce la probabilidad de superar el valor que el

estadı́stico de contraste haya tomado para una muestra concreta.
Si esta probabilidad es “grande”, no hay razones para sospechar que

la hipótesis nula sea falsa.
Si, en cambio, es “pequeña”, sólo puede ser atribuido a dos posibles
causas:
I la aleatoriedad de la muestra, MALA SUERTE
I la distribución teórica supuesta para el estadı́stico de contraste es
errónea. La hipótesis nula es falsa. SE RECHAZA H0 .

Planteamiento
Quedan por resolver todavı́a dos cuestiones esenciales:

¿Qué criterio permitirá seleccionar el estadı́stico de contraste
más adecuado?
¿Cómo juzgar si esa discrepancia es suficiente o no para

rechazar la hipótesis nula?

Planteamiento
Ejemplo
La vida media de las baterı́as es de cinco años:
H0 : µ = 5,
La vida de las baterı́as no es de cinco años:
H1 : µ 6= 5
Estadı́stico del contraste bajo H0 cierta:

X −5
√ ∈ N(0, 1).
σ/ n
Tipos de error
Tipos de error
la decisión que se tome en favor de una u otra hipótesis esta basada en la

discrepancia observada entre la hipótesis nula y la información
suministrada por una única muestra de tamaño n, esta decisión conlleva
un margen de error.
Definición
La decisión de rechazar la hipótesis nula cuando es cierta se denomina
error de tipo I.
Definición
La decisión de no rechazar la hipótesis nula cuando es falsa se denomina
error de tipo II.

Tipos de error
Tipos de error
Situaciones posibles en un contraste de Hipótesis:
Situación real:
H0 es cierta H0 es falsa
No se rechaza H0 DECISIÓN CORRECTA ERROR DE TIPO II
Se rechaza H0 ERROR DE TIPO I DECISIÓN CORRECTA

Criterios de decisión
La decisión que se tome está sujeta a error y son conocidos los dos
tipos de error posibles (error tipo I y error tipo II).
Por tanto, el criterio que se utilice para decidir entre ACEPTAR o
RECHAZAR la hipótesis nula debe controlar el riesgo de equivocarse.
En este sentido pueden hacerse dos planteamientos:
Criterio 1: Que únicamente se controle el riesgo de cometer
un error de tipo I.
Criterio 2: Que se controlen las probabilidades para los dos
tipos de error. Se prefijan de antemano.

Criterio 1: Acotar la probabilidad de error de tipo I

Este enfoque se utiliza cuando el experimentador otorga todo su crédito
inicial a la hipótesis nula y sólo está dispuesto a rechazarla si la evidencia
en su contra es muy importante, preocupándose en menor medida de
aceptarla erróneamente o, equivalentemente, de incurrir en un error de
tipo II.

El planteamiento es similar al de un proceso judicial en el que se ha

de decidir entre la inocencia (hipótesis nula) o la culpabilidad del reo
(hipótesis alternativa).
Sólo se rechaza la inocencia del acusado si la evidencia de las pruebas
acerca de su culpabilidad va más allá de cualquier duda razonable.
Se impone el criterio judicial de considerar más grave declarar
culpable a una persona inocente (error de tipo I) que emitir un
veredicto de inocencia siendo culpable (error de tipo II).
Con este criterio y dado que el estadı́stico de contraste tiene distribución

conocida cuando H0 es cierta (único supuesto donde es factible incurrir en
un error de tipo I), basta con prefijar de antemano la probabilidad de
cometer un error de tipo I.

Nivel de significación
Definición
Se llama nivel de significación de un contraste, se denota por α, a la
probabilidad de cometer un error de tipo I.
α = P (“rechazar H0 ” / “H0 es cierta”)

Nivel de significación
Si H0 es una hipótesis compuesta, entonces el nivel de significación

del contraste es un valor α tal que
P (“rechazar H0 ” / “θ ∈ H0 es cierto”) ≤ α, ∀θ ∈ H0
Fijar el nivel de significación equivale a decidir de antemano la

probabilidad máxima que se está dispuesto a asumir de rechazar la
hipótesis nula cuando es cierta.
El nivel de significación lo elige el experimentador y puede tomarlo

tan pequeño como desee. Lo habitual es tomar una de los siguientes
valores: 00 10, 00 05 o 00 01.

Región de aceptación y de rechazo

Definición
La selección de un nivel de significación α lleva a dividir en dos regiones el
conjunto de posibles valores del estadı́stico de contraste:
Una de probabilidad α (bajo H0 ) que se denomina región de rechazo
o región crı́tica
Otra de probabilidad 1 − α que se denomina región de aceptación.
Si el estadı́stico de contraste toma un valor perteneciente a la región

de aceptación, entonces no existen razones suficientes para rechazar
la hipótesis nula con un nivel de significación α y el contraste se dice
estadı́sticamente no significativo.
Si el valor del estadı́stico cae en la región de rechazo, entonces
asumimos que los datos no son compatibles con la hipótesis nula y la
rechazamos a un nivel de significación α. El contraste es
estadı́sticamente significativo.
Comentarios:
1. La forma de las regiones de rechazo y aceptación depende del tipo de
hipótesis alternativa.
El método expuesto propone rechazar H0 para valores del estadı́stico
de contraste distantes del valor indicado en H0 . Es razonable que ese
distanciamiento se valore en la dirección señalada por H1 ya que ésta
será aceptada al ser rechazada H0 .

Comentarios:
2. Para una hipótesis nula simple del tipo H0 : θ = θ0 y denotemos D el
estadı́stico de contraste y dα al valor tal que
α = P (D ≥ dα / θ = θ0 ).
Las hipótesis alternativas más importantes son:

Contraste bilateral: ambas colas

H0 : θ = θ0 , H1 : θ 6= θ0 .
0.4
La región de rechazo
(RR) la forman la dos
colas de D bajo H0 .
0.3
Normalmente se eligen
con igual probabilidad
f H_0
0.2
(α/2). Por tanto RR es:

RRα = −∞, d1−α/2 ∪ dα/2 , ∞ 0.1
0.025 0.025
− z_(α 2) z_(α 2)
0.0
−4 −3 −2 −1 0 1 2 3 4

Región rechazo: cola dcha.
0.4
H0 : θ = θ 0 , H 1 : θ > θ 0 .
0.3
La RR es la cola derecha:
f H_0
RRα = (dα , ∞)
0.2
0.1
0.05
z_(α)
0.0
−4 −3 −2 −1 0 1 2 3 4

Región rechazo: cola izda.
0.4
H0 : θ = θ 0 , H 1 : θ < θ 0 .
La RR es la cola
0.3
izquierda:
f H_0
0.2
RRα = (−∞, d1−α )
0.1
0.05
− z_(α)
0.0
−4 −3 −2 −1 0 1 2 3 4


Definición
Un contraste de hipótesis cuya región de rechazo esté formada por las dos
colas de la distribución del estadı́stico de contraste bajo H0 se dice
bilateral o de dos colas.
Definición
Un contraste de hipótesis cuya región de rechazo sea una cola de la
distribución del estadı́stico de contraste bajo H0 se dice unilateral o de una
cola.
La decisión tomada sobre un contraste debe realizarse fijado el nivel

de significación α.
De hecho cualquier contraste puede ser significativo (no significativo)
con tal de elegir un nivel de significación suficientemente grande
(pequeño).
Ejemplo
Contraste de Hipótesis H0 : µ = 5, H1 : µ 6= 5 (bilateral).

Estadı́stico del contraste bajo H0 cierta:
X −5
√ ∈ T49 .
S/ 50
b
Fijamos el nivel de significación α = 0.05.

Región de rechazo:
RR0.05 = (−∞, −t0.025 ) ∪ (t0.025 , ∞) = (−∞, −2) ∪ (2, ∞).
Regla de decisión: si el estadı́stico del contraste cae en RR0.05 se
rechaza H0 .
Prefijar la probabilidad de ambos errores
Comentarios:
Los contrastes resueltos conforme al criterio 1 no se preocupan de
controlar el riesgo de incurrir en un error de tipo II.
Por eso algunos autores se refieren a ellos como contrastes de

significación.
El enfoque anterior es inadecuado cuando incurrir en un error de tipo

II resulta tanto o más grave que cometer un error de tipo I.


Ejemplo
En la ejecución de una prueba para detectar la presencia de un virus, cuyo
desarrollo puede ser mortal si no es medicado a tiempo, se realizó el
siguiente contraste:

H0 : “el virus no está presente”
H1 : “el virus sı́ está presente”
Un error de tipo I implica admitir la existencia del virus erróneamente.

Sin embargo, la gravedad de incurrir en un error de tipo II es
evidente, dado que equivale a descartar el virus cuando el paciente sı́
lo ha adquirido.
En estas situaciones además de prefijar el nivel de significación, es
conveniente precisar también la probabilidad de incurrir en un error de
tipo II.
Probabilidad de error de tipo II

Si β denota la probabilidad de error de tipo II, entonces:
β = P (“no rechazar H0 ” / “H1 es cierta”)
y dado que H1 es, por norma general, una hipótesis compuesta, β será
función de θ, con θ ∈ H1 .


Si se contrasta H0 : µ >= 12, H1 : µ < 12,
la probabilidad del error de tipo II se representa en la siguiente figura
β = P (“no rechazar H0 ” / “H1 cierta”)


Si la hipótesis nula es falsa, la probabilidad de aceptarla es tanto más
pequeña cuanto más diste de ella el verdadero valor de la alternativa.
Es decir, fijado el nivel de significación, la probabilidad de error de
tipo II disminuye con la distancia entre H0 y H1 .

La probabilidad de incurrir en un error de tipo II disminuye (aumenta)

si se aumenta (disminuye) la probabilidad de cometer un error de tipo
I.

Tan sólo es posible disminuir simultáneamente las probabilidades de

ambos errores aumentando el tamaño muestral (disminuyendo la
varianza).

Etapas en la resolución de un contraste
Paso 1: Especificar las hipótesis nula (H0 ) y alternativa (H1 ).
Paso 2: Elegir un estadı́stico de contraste apropiado D.
Paso 3: Fijar el nivel de significación α según cómo de importante se

considere una decisión errónea en favor de la hipótesis
alternativa.
Paso 4: Prefijado α y elegido D, proceder a construir las regiones de

rechazo y de aceptación de H0 , según se trate de un
contraste uni o bilateral.

Paso 5: Determinar cuál es el primer valor de la hipótesis alternativa

(θ1 ) que, de ser correcto, deseamos detectar con el contraste.
Simultáneamente, especificar el tamaño del error de tipo II
(β(θ1 )) que estamos dispuestos a asumir.
Paso 6: A partir de las probabilidades α y β calcular el tamaño

muestral n adecuado para garantizar ambas probabilidades
de error.
Paso 7: Tomar la muestra x1 , x2 , . . . , xn y evaluar el estadı́stico de

contraste D para obtener el valor de db = D(x1 , x2 , . . . , xn ).
Paso 8: Concluir si el test es estadı́sticamente significativo o no al

nivel de significación α según que el valor del estadı́stico esté
en la región de rechazo o en la región de aceptación,
respectivamente.


Comentarios:
1. Si no interesa controlar el riesgo de cometer un error de tipo II,
entonces los pasos 5 y 6 serán omitidos.
2. Si no es posible seleccionar previamente el tamaño muestral se
deberán omitir los pasos 5 y 6, puesto que fijando α, D y n se
determina implı́citamente el valor de β(θ) para todo θ ∈ H1 .
3. Cuando la probabilidad de error de tipo II no ha sido prefijada de
antemano, debemos ser muy cautos con una conclusión final en favor
de la hipótesis nula.
I Si la decisión ha sido rechazar la hipótesis nula, nada que objetar, pues
con tal decisión sólo se ha podido cometer un error de tipo I (acotada
previamente esa probabilidad a nuestro antojo).
I Si la conclusión final ha sido NO rechazar la hipótesis nula, el error
posible es el de tipo II (β), que estamos suponiendo fuera de nuestro
control. Podrı́a suceder que el tamaño muestral no ha sido
suficientemente grande como para detectar una diferencia real entre H0
y H1 .
Ejemplo


Paso 1: Contraste de Hipótesis H0 : µ = 5, H1 : µ 6= 5 (bilateral).
Paso 2: Estadı́stico del contraste bajo H0 cierta:
X −5
D= √ ∈ T49 .
S/
b 50
Paso 3: Fijamos el nivel de significación α = 0.05.

Paso 4: Región de rechazo:
RR0.05 = (−∞, −t0.025 ) ∪ (t0.025 , ∞) = (−∞, −2) ∪ (2, ∞).
Paso 7: Tomar la muestra de tamaño x1 , ...x50 y evaluar el valor
del estadı́stico D,
4.7 − 5
db = √ = −4.243
0.5/ 50
Paso 8: Regla de decisión: Test estadı́sticamente significativo para

α = 0.05, pues db ∈ RR0.05 .
Nivel crı́tico o p-valor
El concepto de nivel crı́tico proporciona una filosofı́a alternativa para la

resolución de un contraste de hipótesis.
Considérese un estadı́stico de contraste D y sea db el valor observado para
una muestra determinada x1 , x2 , . . . , xn , es decir, db = D (x1 , x2 , . . . , xn ).
Definición
Se denomina nivel crı́tico p-valor a la probabilidad de obtener una
discrepancia mayor o igual que db cuando H0 es cierta.
En la definición anterior, la expresión “mayor o igual” se refiere al

distanciamiento de H0 en la dirección de H1 .

0.4
Si el contraste es
H0 : θ = θ 0 , H 1 : θ > θ 0
0.3
(unilateral a la derecha).
El nivel crı́tico del
f H_0
0.2
contraste
viene dado por
p = P D ≥ db / H0 .
0.1
p−valor= 0.046
d
0.0
−4 −3 −2 −1 0 1 2 3 4

0.4
Si el contraste es
H0 : θ = θ 0 , H 1 : θ < θ 0
0.3
(unilateral a la izda).
f H_0
0.2
contraste
viene dado por
p = P D ≤ db / H0 .
0.1
p−valor= 0.106
d
0.0
−4 −3 −2 −1 0 1 2 3 4

0.4
Si el contraste es
H0 : θ = θ0 , H1 : θ 6= θ0
0.3
(bilateral).
f H_0
0.2
contraste
viene dado por
p = P |D| ≥ db / H0 .
0.1
p−valor/2= 0.07 p−valor/2= 0.07
−d d
0.0
−4 −3 −2 −1 0 1 2 3 4

Comentarios:
1. El nivel crı́tico sólo puede calcularse una vez tomada la muestra,
obteniéndose, en general, niveles crı́ticos distintos para cada muestra.
2. El nivel crı́tico p puede interpretarse como un nivel mı́nimo de

significación:
p ≥ α ⇒ Aceptar H0 ,
p ≤ α ⇒ Rechazar H0 .


0.4
0.4
0.3
0.3
f H_0
f H_0
0.2
0.2
0.1
0.1
p−valor= 0.248 α = 0.1

α = 0.1 p−valor= 0.023
d z_(α) z_(α) d
0.0
0.0
−4 −3 −2 −1 0 1 2 3 4 −4 −3 −2 −1 0 1 2 3
D D

3. Cuanto menor sea p, mayor será el grado de incompatibilidad de la

muestra con la hipótesis nula.
4. El cálculo del nivel crı́tico o p-valor no proporciona de modo

sistemático una decisión entre H0 y H1 . Con carácter general y a
modo orientativo, un p-valor inferior a 00 01 sugiere el rechazo de H0 ,
un p-valor superior a 00 1 indica su aceptación y, finalmente, un p-valor
comprendido entre 00 01 y 00 1 no suele considerarse determinante.

Ejemplo


Paso 1: Contraste de Hipótesis H0 : µ = 5, H1 : µ 6= 5 (bilateral).
X −5
D= √ ∈ T49 .
S/ 50
b

4.7 − 5
db = √ = −4.243
0.5/ 50
Paso 8: Regla de decisión: p = P (|D| ≥ 4.243/H0 ) =

P (D ≥ 4.243/H0 )+P (D ≤ −4.243/H0 ) = 2·4.883045e−05.
Entonces, p − valor < 0.01 por tanto el contraste es
estadı́sticamente significativo.

Paso 1: Contraste de Hipótesis H0 : µ = 5, H1 : µ < 5 (unilateral).

X −5
D= √ ∈ T49 .
S/ 50
b

4.7 − 5
db = √ = −4.243
0.5/ 50
Paso 8: Regla de decisión:

p = P (D ≤ −4.243/H0 ) = 4.883045e − 05. Entonces,
p − valor < 0.01 por tanto el contraste es estadı́sticamente
significativo.
Potencia de un contraste
Fijado el tamaño muestral n y el nivel de significación α, la probabilidad
de cometer un error de tipo II, β, solo depende de la distribución del
estadı́stico de contraste, D, y del verdadero valor del parámetro sobre el
que se realiza el contraste. Por ello se debe seleccionar aquel estadı́stico de
contraste que conduzca a probabilidades de error de tipo II lo más
pequeñas posibles.
Fijados α, n y un estadı́stico de contraste D.

Definición
Se denomina potencia del contraste a la función, π, que asigna a cada
posible valor del parámetro θ la probabilidad de rechazar la hipótesis nula
cuando θ es cierto. Es decir:
π : Θ −→ [0, 1]
θ −→ π(θ) = P (“rechazar H0 ” / θ)

1. Se deduce que
∀θ ∈ H1 , π (θ) = 1 − β(θ)
Si H0 , es simple, (H0 : θ = θ0 ), entonces π(θ0 ) = α.

Para hipótesis nulas compuestas, se obtiene
∀θ ∈ H0 , π (θ) ≤ α
2. A la gráfica de la potencia de un contraste se la denomina curva de

potencia.
En ocasiones se utiliza también la denominada curva caracterı́stica de
operación que se obtiene representando gráficamente β(θ).

3. Cuanto más lejana se encuentre la hipótesis alternativa de la hipótesis

nula, menor será la probabilidad de incurrir en un error de tipo II (β)
y, por consiguiente, más próxima a 1 está la potencia.
4. Si la potencia permanece siempre muy próxima a 1, entonces se dice

que el estadı́stico de contraste es muy potente para contrastar H0 ya
que en ese caso las muestras resultarán, con alta probabilidad,
incompatibles con H0 cuando H1 sea cierta.
Por tanto, la potencia de un contraste puede interpretarse como su
sensibilidad o capacidad para detectar una hipótesis alternativa.





Ejercicio
Representa la función potencia del contraste:
H0 : µ ≥ 10
con α = 0.10

5. Fijado el nivel de significación α, un contraste con función de

potencia π1 se dice más potente que otro contraste con función de
potencia π2 para contrastar H0 si
π1 (θ) ≥ π2 (θ), ∀θ ∈ H1 .



Ejercicio
Dada una población N(µ, 1) de la que se toma una m.a.s. de tamaño 1, se
contrasta la hipótesis nula H0 : µ = 1 versus la alternativa H1 : µ = 2.
Determinar el nivel de significación y la potencia del test para las
siguientes regiones de rechazo:
(a) RR = (2.036, ∞)
(b) RR = (1.100, 1.300) ∪ (2.461, ∞)

Ejercicio
(a) RR = (2.036, ∞)
α = P(X > 2.036|H0 cierta) = P(X > 2.036|N(1, 1))

= P( X 1−1 > 2.036−1
1 ) = P(Z > 1.036) = 0.150
β = P(X ≤ 2.036|H1 cierta) = P(X ≤ 2.036|N(2, 1))

= P( X 1−2 ≤ 2.036−2
1 ) = P(Z ≤ 0.036) = 0.514
Potencia = 1 − β = 1 − 0.514 = 0.486

Errores tipo I y II.
0.5
0.4
0.3
H_0 H_1
0.2
0.1
2.036
0.0
−5 −4 −3 −2 −1 0 1 2 3 4 5
D
Ejercicio
(b) RR = (1.100, 1.300) ∪ (2.461, ∞)
α = P(1.100 < X < 1.300|H0 cierta) + P(X > 2.461|H0 cierta)

= P(1.100 < X < 1.300|N(1, 1)) + P(X > 2.461|N(1, 1))
= 0.150
β = P(X ≤ 1.100|H1 cierta) + P(1.300 ≤ X ≤ 2.461|H1 cierta)

= P(X ≤ 1.100|N(2, 1)) + P(1.300 ≤ X ≤ 2.461|N(2, 1))
= 0.620
Potencia = 1 − β = 1 − 0.620 = 0.380

Contraste de razón de verosimilitud
El concepto de función de verosimilitud de un parámetro θ

proporciona de manera intuitiva un procedimiento de construcción
de estadı́sticos de contraste para hipótesis referidas a θ.

Función de verosimilitud
Definición
Sea X1 , X2 , . . . , Xn una muestra aleatoria simple de una población cuya
distribución depende de un parámetro, θ, que deseamos estimar.
En el caso discreto, se denomina función de verosimilitud a
l(θ) = Pθ (X1 = x1 , . . . Xn = xn ) = Pθ (X = x1 ) · . . . · Pθ (X = xn )
En el caso continuo, se denomina función de verosimilitud
l(θ) = fθ (x1 , x2 , . . . , xn ) = fθ (x1 ) · fθ (x2 ) · · · fθ (xn )
donde fθ es la función de densidad de X .

El estimador de máxima verosimilitud
Para valores fijos de la muestra la función de verosimilitud es una función

de θ.
Definición
El estimador de máxima verosimilitud de θ es el que maximiza la función
de verosimilitud.

Considérese una muestra X1 , X2 , . . . , Xn de una población cuya

distribución depende de un parámetro desconocido θ y sean, l(θ) la
función de verosimilitud y θbMV el valor de θ que maximiza dicha función.
Definición
Se denomina verosimilitud relativa de θ0 , o razón de verosimilitud de θ0
frente a θbMV , al valor del cociente
l(θ0 )
R(θ0 ) =
l(θbMV )

Se puede utilizar R(θ0 ) como una medida de discrepancia entre la

hipótesis nula H0 : θ = θ0 y la alternativa H1 : θ 6= θ0 .
l(θ0 )
Valores de R(θ0 ) = ≈ 1 indican que la muestra discrepa poco
l(θbMV )
de la hipótesis nula.
l(θ0 )
Valores de R(θ0 ) = ≈ 0 indican una fuerte discrepancia entre
l(θbMV )
la muestra y θ0 y nos lleva a rechazar H0

Esta idea puede generalizarse para contrastar dos hipótesis cualesquiera,

sin más que considerar el cociente entre las verosimilitudes relativas
maximizadas bajo cada una de las dos hipótesis.
Definición
Un contraste de hipótesis cuyo estadı́stico viene dado por
maxθ∈H1 l(θ)
R=
maxθ∈H0 l(θ)
se conoce con el nombre de contraste de razón de verosimilitud.

Comentarios:
1. Cuanto mayor sea el valor de R menor es el grado de compatibilidad
entre la muestra y la hipótesis nula.
Por tanto se rechaza H0 cuando R > rα , donde rα verifica que
P (R > rα / H0 ) = α.
2. Muchas veces es difı́cil deducir la distribución de probabilidad de R

bajo H0 . En ese caso se puede utilizar como medida de discrepancia
cualquier función de R estrictamente monótona.
Definición
Se suele utilizar la función
D = 2 ln R
que se denomina estadı́stico de razón de verosimilitud.


La ventaja del estadı́stico de razón de verosimilitud es que para
muestras grandes, su distribución bajo H0 puede aproximarse por una
χ2 de Pearson.
Sea θ un vector de parámetros que puede tomar valores en un espacio
Θ.
Se desea realizar el contraste paramétrico:

H0 : θ ∈ Θ0 ⊂ Θ
H1 : θ ∈ Θ − Θ0
Se verifica que el estadı́stico de la razón de verosimilitud para este
contraste se distribuye asintóticamente de acuerdo a una χ2g cuando
H0 es cierta, siendo
g = dim (Θ − Θ0 ) − dim (Θ0 )
donde dim (Θ) denota la dimensión de Θ.

Comentarios
1. En los casos de mayor interés dim (Θ − Θ0 ) = dim (Θ) = p y

dim (Θ0 ) = q, q < p, siendo q el número de componentes
desconocidas de θ bajo H0 . Por tanto, g = p − q.
2. En un contraste de tipo bilateral H0 : θ = θ0 frente a H1 :

θ 6= θ0 , θ ∈ R, se tiene que p = 1 (sólo existe un parámetro
desconocido, θ) y q = 0 pues θ = θ0 y, por consiguiente, el número
de parámetros desconocidos bajo H0 es 0. Se concluye que g = 1.

Comentarios
3. Los contrastes de razón de verosimilitud tienen varias ventajas:

I Están basados en la función de verosimilitud y por ello son menos
arbitrarios.
I Pueden aplicarse en situaciones donde es difı́cil disponer de contrastes
exactos.
I Son óptimos (los más potentes) cuando se enfrentan dos hipótesis
simples.
I Permiten contrastar valores de vectores de parámetros, etc.
4. Su mayor desventaja suele ser la necesidad de realizar muchos más

cálculos que en otros contrastes.

Contraste de razón de verosimilitud. Ejemplo
Ejemplo
Sea X1 , X2 , . . . , Xn una muestra aleatoria simple de una distribución
exponencial de media θ.
Establecer el estadı́stico de contraste de razón de verosimilitud para el
contraste de H0 : θ = θ0 frente H1 : θ 6= θ0 .


En este caso la función de verosimilitud (función de θ) es
n n
!
Y X
θ−1 exp −θ−1 Xi = θ−n exp −θ−1

l(θ) = Xi
i=1 i=1
El estadı́stico del contraste de razón de verosimilitud en este caso es
maxθ6=θ0 l(θ)
R=
l(θ0 )
El valor de θ que maximiza el numerador es el estimador máximo

verosı́mil:
T
θbMV = X = ,
n
X n
donde T = Xi .
i=1
Sustituyendo
maxθ6=θ0 l(θ)
R = l(θ0 )
−n −1
θbMV exp(−θbMV T)
R = θ0−n exp(−θ0−1 T )
n
(n/T )n exp(−n) nθ0 T
R = θ0−n exp(−θ0−1 T )
= T exp θ0 −n
Finalmente, el estadı́stico de la razón de verosimilitud viene dado por

nθ0 2T
D = 2 ln R = 2n ln + − 2n
T θ0
que, asintóticamente y bajo H0 , se distribuye según una χ21 .

Ejemplo
La suma de los valores de una muestra de tamaño 10 es 312 y θ0 = 20, el
valor del estadı́stico resulta

200 2 · 312
d = 20 ln
b + − 20 = 20 306
312 20
y el nivel crı́tico
p = P D > 20 306 ' P χ21 > 20 306 = 00 129

lo que sugiere ACEPTAR la hipótesis nula.

ContrastesI PDF

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

ContrastesI PDF

Caricato da

Copyright:

Formati disponibili

4.

Contrastes de Hipótesis (I)

Profesora: Marı́a José Lombardı́a Cortiña

Departamento de Matemáticas. Universidade da Coruña

Programa Oficial de Postgrado en Estadı́stica e Investigación Operativa

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 1 / 88

6 Etapas en la resolución de un contraste

7 Nivel crı́tico o p-valor

9 Contraste de razón de verosimilitud

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 2 / 88

Los objetivos de los procedimientos de inferencia estadı́stica expuestos

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 3 / 88

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 4 / 88

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 5 / 88

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 6 / 88

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 7 / 88

En todos los casos la toma de datos precede a alguna afirmación no

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 8 / 88

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 9 / 88

Se afirma que la vida media de las baterı́as es µ = 5.

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 10 / 88

El experto bursátil asegura que las acciones en A fluctúan menos que

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 11 / 88

Un sector del partido polı́tico gobernante sostiene que p ≥ 0.6.

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 12 / 88

Se desea comparar la duración del canto entre dos especies de aves,

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 13 / 88

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 15 / 88

Las hipótesis nula y alternativa

La hipótesis nula debe ser la hipótesis que se asume como correcta y

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 16 / 88

Las hipótesis nula y alternativa

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 17 / 88

Las hipótesis nula y alternativa

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 18 / 88

Planteado el contraste y recogida la muestra, hay que establecer algún

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 19 / 88

Si H0 es cierta, se conoce la probabilidad de superar el valor que el

Si esta probabilidad es “grande”, no hay razones para sospechar que

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 20 / 88

Quedan por resolver todavı́a dos cuestiones esenciales:

¿Cómo juzgar si esa discrepancia es suficiente o no para

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 21 / 88

La vida media de las baterı́as es de cinco años:

La vida de las baterı́as no es de cinco años:

Estadı́stico del contraste bajo H0 cierta:

la decisión que se tome en favor de una u otra hipótesis esta basada en la

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 23 / 88

Situaciones posibles en un contraste de Hipótesis:

No se rechaza H0 DECISIÓN CORRECTA ERROR DE TIPO II

Se rechaza H0 ERROR DE TIPO I DECISIÓN CORRECTA

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 24 / 88

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 25 / 88

Criterio 1: Acotar la probabilidad de error de tipo I

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 26 / 88

El planteamiento es similar al de un proceso judicial en el que se ha

Con este criterio y dado que el estadı́stico de contraste tiene distribución

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 27 / 88

α = P (“rechazar H0 ” / “H0 es cierta”)

M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 28 / 88

Si H0 es una hipótesis compuesta, entonces el nivel de significación

Fijar el nivel de significación equivale a decidir de antemano la

El nivel de significación lo elige el experimentador y puede tomarlo