Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
2 Hipótesis Estadı́stica
3 Planteamiento
4 Tipos de error
5 Criterios de decisión
8 Potencia de un contraste
Introducción
Contrastes de Hipótesis
En este tema se estudia como contrastar una hipótesis realizada sobre la
población en estudio.
Comprobar empı́ricamente que la información que proporciona la muestra
es compatible con la hipótesis realizada.
Introducción
Ejemplo 1
Las especificaciones de su fabricante sitúan en 5 años la vida media (sin
fallos) de una determinada marca de baterı́as. Una organización de
consumidores mantiene que este promedio no se cumple y para
comprobarlo experimentalmente realizará un seguimiento sobre 50 nuevos
usuarios de este tipo de baterı́as.
Introducción
Ejemplo 2
Un inversor se dispone a adquirir un paquete de acciones que cotizan en
bolsa. Se trata de una inversión a largo plazo y por ello prefiere comprar
acciones cuyo valor fluctúe poco en el mercado, aunque ello posiblemente
le suponga menores beneficios. De entre dos tipos de acciones, A y B, un
especialista en bolsa le ha asegurado que las de tipo A son más estables
que las de tipo B. Como no se fı́a en exceso decide comprobar la veracidad
de su afirmación observando en una revista especializada la evolución de
los dos tipos de acciones en los 36 últimos meses
Introducción
Ejemplo 3
El ala más radical del partido polı́tico gobernante sostiene que como
mı́nimo el 60% de los votantes apoyarı́a la entrada del paı́s en una
organización militar internacional. Sin embargo, el gobierno sólo estarı́a
dispuesto a convocar un referéndum si esa afirmación pudiera ser avalada
empı́ricamente. Con tal objetivo el partido opta por realizar una encuesta
al respecto a 2.500 personas
Introducción
Ejemplo 4
El “cuello amarillo común” y el “malviz pardo” son dos especies de aves
muy similares que comparten un medio común. Un grupo de cientı́ficos
afirma que la duración del canto en segundos del “cuello amarillo” es
superior a la del “malviz pardo” y sugieren que esta caracterı́stica es la
adecuada para su identificación. Los cientı́ficos se disponen a medir la
duración del canto en una muestra de cada especie con el objeto de poder
reafirmarse en su tesis.
Introducción
Hipótesis Estadı́stica
Definición
Se denomina hipótesis estadı́stica a cualquier conjetura sobre una o varias
caracterı́sticas de interés de un modelo de probabilidad.
Hipótesis Estadı́stica
Ejemplo 1
Las especificaciones de un fabricante sitúan en 5 años la vida media (sin
fallos) de una determinada marca de baterı́as. Una organización de
consumidores mantiene que este promedio no se cumple y para
comprobarlo experimentalmente realizará un seguimiento sobre 50 nuevos
usuarios de este tipo de baterı́as.
Hipótesis Estadı́stica
Ejemplo 2
Un inversor se dispone a adquirir un paquete de acciones que cotizan en
bolsa. Se trata de una inversión a largo plazo y por ello prefiere comprar
acciones cuyo valor fluctúe poco en el mercado, aunque ello posiblemente
le suponga menores beneficios. De entre dos tipos de acciones, A y B, un
especialista en bolsa le ha asegurado que las de tipo A son más estables
que las de tipo B. Como no se fı́a en exceso decide comprobar la veracidad
de su afirmación observando en una revista especializada la evolución de
los dos tipos de acciones en los 36 últimos meses
Hipótesis Estadı́stica
Ejemplo 3
El ala más radical del partido polı́tico gobernante sostiene que como
mı́nimo el 60% de los votantes apoyarı́a la entrada del paı́s en una
organización militar internacional. Sin embargo, el gobierno sólo estarı́a
dispuesto a convocar un referéndum si esa afirmación pudiera ser avalada
empı́ricamente. Con tal objetivo el partido opta por realizar una encuesta
al respecto a 2.500 personas
Hipótesis Estadı́stica
Ejemplo 4
El “cuello amarillo común” y el “malviz pardo” son dos especies de aves
muy similares que comparten un medio común. Un grupo de cientı́ficos
afirma que la duración del canto en segundos del “cuello amarillo” es
superior a la del “malviz pardo” y sugieren que esta caracterı́stica es la
adecuada para su identificación. Los cientı́ficos se disponen a medir la
duración del canto en una muestra de cada especie con el objeto de poder
reafirmarse en su tesis.
Hipótesis Estadı́stica
Ejemplos
Concretar el valor o rango de valores de algún vector de parámetros:
σ = 150, µ = 5 y p ≥ 00 6, respectivamente.
Establecer comparaciones entre los valores de los parámetros de
distintas poblaciones: σA < σB , µX > µY y pX > pY .
Especificar alguna caracterı́stica sobre la forma de una distribución: la
distribución es simétrica, tiene 2 modas, etc.
Determinar la forma de la distribución de probabilidad: los datos son
gaussianos.
Determinar la relación funcional entre dos variables aleatorias
cuantitativas.
Asumir que una muestra ha sido tomada al azar.
Afirmar que dos caracterı́sticas de una población son independientes:
el hábito de fumar no aumenta el riesgo de problemas digestivos,...
M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 14 / 88
Hipótesis Estadı́stica
Hipótesis Estadı́stica
Definición
Una hipótesis paramétrica es una afirmación sobre los valores de
parámetros poblacionales desconocidos.
Definición
Una hipótesis paramétrica se dice simple si especifica un único valor para
cada parámetro poblacional desconocido (σ = 150, µX = µY , . . . ).
Definición
Una hipótesis paramétrica se dice compuesta si asigna un conjunto de
valores posibles a parámetros poblacionales desconocidos (2 < µ < 5,
σ 2 > 1, µX ≥ µY , pX > pY , . . . ).
Definición
Se denomina hipótesis nula, que habitualmente se denota por H0 , a la
hipótesis que se contrasta.
Ejemplos
Se quiere avalar empı́ricamente que una nueva vacuna es efectiva.
H0 : “la vacuna no es efectiva”.
Se quiere mostrar que una máquina se ha desajustado y no produce el
promedio de piezas preespecificado (1.000).
H0 : “el promedio diario de piezas producido por la máquina es 1.000”.
Un programador quiere probar que el tiempo medio de ejecución del
programa A (µA ) es superior al tiempo medio de ejecución del
programa B (µB ).
H 0 : µA ≤ µB .
Hipótesis alternativa
Rechazar la hipótesis nula implica asumir como correcta una hipótesis
complementaria hipótesis alternativa, que suele denotarse por H1 y
representa cualquier forma de negación de la hipótesis nula.
Ejemplos
En los ejemplos anteriores las hipótesis alternativas H1 son:
H1 : “la vacuna es efectiva”,
H1 : “el promedio diario de piezas producido por la máquina es
distinto de 1.000”
H1 : µA > µB .
El estadı́stico de contraste
El estadı́stico de contraste
El estadı́stico de contraste
Ejemplo
Las especificaciones de su fabricante sitúan en 5 años la vida media (sin
fallos) de una determinada marca de baterı́as. Una organización de
consumidores mantiene que este promedio no se cumple y para
comprobarlo experimentalmente realizará un seguimiento sobre 50 nuevos
usuarios de este tipo de baterı́as.
H0 : µ = 5,
H1 : µ 6= 5
Tipos de error
Definición
La decisión de no rechazar la hipótesis nula cuando es falsa se denomina
error de tipo II.
Tipos de error
Situación real:
H0 es cierta H0 es falsa
Criterios de decisión
La decisión que se tome está sujeta a error y son conocidos los dos
tipos de error posibles (error tipo I y error tipo II).
Por tanto, el criterio que se utilice para decidir entre ACEPTAR o
RECHAZAR la hipótesis nula debe controlar el riesgo de equivocarse.
En este sentido pueden hacerse dos planteamientos:
Criterio 1: Que únicamente se controle el riesgo de cometer
un error de tipo I.
Criterio 2: Que se controlen las probabilidades para los dos
tipos de error. Se prefijan de antemano.
Criterios de decisión
Criterios de decisión
Nivel de significación
Definición
Se llama nivel de significación de un contraste, se denota por α, a la
probabilidad de cometer un error de tipo I.
Nivel de significación
P (“rechazar H0 ” / “θ ∈ H0 es cierto”) ≤ α, ∀θ ∈ H0
Comentarios:
1. La forma de las regiones de rechazo y aceptación depende del tipo de
hipótesis alternativa.
El método expuesto propone rechazar H0 para valores del estadı́stico
de contraste distantes del valor indicado en H0 . Es razonable que ese
distanciamiento se valore en la dirección señalada por H1 ya que ésta
será aceptada al ser rechazada H0 .
Comentarios:
2. Para una hipótesis nula simple del tipo H0 : θ = θ0 y denotemos D el
estadı́stico de contraste y dα al valor tal que
α = P (D ≥ dα / θ = θ0 ).
Las hipótesis alternativas más importantes son:
0.4
La región de rechazo
(RR) la forman la dos
colas de D bajo H0 .
0.3
Normalmente se eligen
con igual probabilidad
f H_0
0.2
(α/2). Por tanto RR es:
RRα = −∞, d1−α/2 ∪ dα/2 , ∞ 0.1
0.025 0.025
− z_(α 2) z_(α 2)
0.0
−4 −3 −2 −1 0 1 2 3 4
0.4
H0 : θ = θ 0 , H 1 : θ > θ 0 .
0.3
La RR es la cola derecha:
f H_0
RRα = (dα , ∞)
0.2
0.1
0.05
z_(α)
0.0
−4 −3 −2 −1 0 1 2 3 4
0.4
H0 : θ = θ 0 , H 1 : θ < θ 0 .
La RR es la cola
0.3
izquierda:
f H_0
0.2
RRα = (−∞, d1−α )
0.1
0.05
− z_(α)
0.0
−4 −3 −2 −1 0 1 2 3 4
Definición
Un contraste de hipótesis cuya región de rechazo sea una cola de la
distribución del estadı́stico de contraste bajo H0 se dice unilateral o de una
cola.
Ejemplo
Las especificaciones de su fabricante sitúan en 5 años la vida media (sin
fallos) de una determinada marca de baterı́as. Una organización de
consumidores mantiene que este promedio no se cumple y para
comprobarlo experimentalmente realizará un seguimiento sobre 50 nuevos
usuarios de este tipo de baterı́as.
Comentarios:
Los contrastes resueltos conforme al criterio 1 no se preocupan de
controlar el riesgo de incurrir en un error de tipo II.
y dado que H1 es, por norma general, una hipótesis compuesta, β será
función de θ, con θ ∈ H1 .
Ejemplo
Las especificaciones de su fabricante sitúan en 5 años la vida media (sin
fallos) de una determinada marca de baterı́as. Una organización de
consumidores mantiene que este promedio no se cumple y para
comprobarlo experimentalmente realizará un seguimiento sobre 50 nuevos
usuarios de este tipo de baterı́as.
0.4
Si el contraste es
H0 : θ = θ 0 , H 1 : θ > θ 0
0.3
(unilateral a la derecha).
El nivel crı́tico del
f H_0
0.2
contraste
viene dado por
p = P D ≥ db / H0 .
0.1
p−valor= 0.046
d
0.0
−4 −3 −2 −1 0 1 2 3 4
0.4
Si el contraste es
H0 : θ = θ 0 , H 1 : θ < θ 0
0.3
(unilateral a la izda).
El nivel crı́tico del
f H_0
0.2
contraste
viene dado por
p = P D ≤ db / H0 .
0.1
p−valor= 0.106
d
0.0
−4 −3 −2 −1 0 1 2 3 4
0.4
Si el contraste es
H0 : θ = θ0 , H1 : θ 6= θ0
0.3
(bilateral).
El nivel crı́tico del
f H_0
0.2
contraste
viene dado por
p = P |D| ≥ db / H0 .
0.1
−d d
0.0
−4 −3 −2 −1 0 1 2 3 4
Comentarios:
1. El nivel crı́tico sólo puede calcularse una vez tomada la muestra,
obteniéndose, en general, niveles crı́ticos distintos para cada muestra.
p ≤ α ⇒ Rechazar H0 .
0.4
0.3
0.3
f H_0
f H_0
0.2
0.2
0.1
0.1
d z_(α) z_(α) d
0.0
0.0
−4 −3 −2 −1 0 1 2 3 4 −4 −3 −2 −1 0 1 2 3
D D
Ejemplo
Las especificaciones de su fabricante sitúan en 5 años la vida media (sin
fallos) de una determinada marca de baterı́as. Una organización de
consumidores mantiene que este promedio no se cumple y para
comprobarlo experimentalmente realizará un seguimiento sobre 50 nuevos
usuarios de este tipo de baterı́as.
Potencia de un contraste
Fijado el tamaño muestral n y el nivel de significación α, la probabilidad
de cometer un error de tipo II, β, solo depende de la distribución del
estadı́stico de contraste, D, y del verdadero valor del parámetro sobre el
que se realiza el contraste. Por ello se debe seleccionar aquel estadı́stico de
contraste que conduzca a probabilidades de error de tipo II lo más
pequeñas posibles.
Potencia de un contraste
1. Se deduce que
∀θ ∈ H1 , π (θ) = 1 − β(θ)
∀θ ∈ H0 , π (θ) ≤ α
Potencia de un contraste
Potencia de un contraste
Potencia de un contraste
Potencia de un contraste
Potencia de un contraste
Potencia de un contraste
Ejercicio
Representa la función potencia del contraste:
H0 : µ ≥ 10
con α = 0.10
Potencia de un contraste
π1 (θ) ≥ π2 (θ), ∀θ ∈ H1 .
Potencia de un contraste
Potencia de un contraste
Potencia de un contraste
Ejercicio
Dada una población N(µ, 1) de la que se toma una m.a.s. de tamaño 1, se
contrasta la hipótesis nula H0 : µ = 1 versus la alternativa H1 : µ = 2.
Determinar el nivel de significación y la potencia del test para las
siguientes regiones de rechazo:
(a) RR = (2.036, ∞)
Potencia de un contraste
Ejercicio
(a) RR = (2.036, ∞)
Potencia de un contraste
Errores tipo I y II.
0.5
0.4
0.3
H_0 H_1
0.2
0.1
2.036
0.0
−5 −4 −3 −2 −1 0 1 2 3 4 5
D
M.J. Lombardı́a Cortiña (UDC) 4. Contrastes de Hipótesis (I) Curso 2011-2012 73 / 88
Potencia de un contraste
Potencia de un contraste
Ejercicio
(b) RR = (1.100, 1.300) ∪ (2.461, ∞)
Función de verosimilitud
Definición
Sea X1 , X2 , . . . , Xn una muestra aleatoria simple de una población cuya
distribución depende de un parámetro, θ, que deseamos estimar.
En el caso discreto, se denomina función de verosimilitud a
l(θ) = Pθ (X1 = x1 , . . . Xn = xn ) = Pθ (X = x1 ) · . . . · Pθ (X = xn )
Definición
El estimador de máxima verosimilitud de θ es el que maximiza la función
de verosimilitud.
Definición
Se denomina verosimilitud relativa de θ0 , o razón de verosimilitud de θ0
frente a θbMV , al valor del cociente
l(θ0 )
R(θ0 ) =
l(θbMV )
l(θ0 )
Valores de R(θ0 ) = ≈ 1 indican que la muestra discrepa poco
l(θbMV )
de la hipótesis nula.
l(θ0 )
Valores de R(θ0 ) = ≈ 0 indican una fuerte discrepancia entre
l(θbMV )
la muestra y θ0 y nos lleva a rechazar H0
Definición
Un contraste de hipótesis cuyo estadı́stico viene dado por
maxθ∈H1 l(θ)
R=
maxθ∈H0 l(θ)
Comentarios:
1. Cuanto mayor sea el valor de R menor es el grado de compatibilidad
entre la muestra y la hipótesis nula.
Por tanto se rechaza H0 cuando R > rα , donde rα verifica que
P (R > rα / H0 ) = α.
Comentarios
Comentarios
Ejemplo
Sea X1 , X2 , . . . , Xn una muestra aleatoria simple de una distribución
exponencial de media θ.
Establecer el estadı́stico de contraste de razón de verosimilitud para el
contraste de H0 : θ = θ0 frente H1 : θ 6= θ0 .
maxθ6=θ0 l(θ)
R=
l(θ0 )
Sustituyendo
maxθ6=θ0 l(θ)
R = l(θ0 )
−n −1
θbMV exp(−θbMV T)
R = θ0−n exp(−θ0−1 T )
n
(n/T )n exp(−n) nθ0 T
R = θ0−n exp(−θ0−1 T )
= T exp θ0 −n
Ejemplo
La suma de los valores de una muestra de tamaño 10 es 312 y θ0 = 20, el
valor del estadı́stico resulta
200 2 · 312
d = 20 ln
b + − 20 = 20 306
312 20
y el nivel crı́tico