Sei sulla pagina 1di 18

Tema 4.

Intervalos de confianza

Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 1


Definición y construcción

Sea X1 , . . . , Xn una muestra aleatoria de una población X con


función de distribución Fθ , siendo θ un parámetro desconocido.
Fijamos 0 < α < 1. Sea (T1 , T2 ) un intervalo tal que
Ti = Ti (X1 , . . . , Xn ) para i = 1, 2 y

1 − α = Pθ {T1 (X1 , . . . , Xn ) < θ < T2 (X1 , . . . , Xn )}


= Pθ {θ ∈ (T1 , T2 )}.

Entonces, para cada observación (x1 , . . . , xn ) de la muestra, el


intervalo (T1 (x1 , . . . , xn ), T2 (x1 , . . . , xn )) es un intervalo de
confianza para θ al nivel de confianza 1 − α.

Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 2


Construcción de un intervalo de confianza:

• Buscamos una cantidad pivotal para θ, que es una función


C (X1 , . . . , Xn ; θ) cuya distribución no depende de θ.

Ejemplo 4.1:
Sea (X1 , . . . , X10 ) una muestra aleatoria de X ∼ N(µ, 1). Entonces
una cantidad pivotal para µ es

• A continuación buscamos dos valores c1 y c2 tales que

Pθ {c1 < C (X1 , . . . , Xn ; θ) < c2 } = 1 − α.

Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 3


Ejemplo 4.1 (cont.):

• Finalmente se despeja θ de la desigualdad c1<C (X1 , . . . , Xn ; θ)<c2 .

Ejemplo 4.1 (cont.):

Para la muestra 1,7 2,1 2,3 2,4 1,9 1,6 2,0 2,1 2,1 1,8
tenemos x̄ = e IC0,95 (µ) =

Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 4


Si se observan 100 muestras de tamaño n de X ∼ Fθ y se
construyen los correspondientes 100 intervalos de confianza para θ,
IC1−α (θ), aproximadamente en (1 − α)100 de ellos está el
parámetro desconocido θ:
(1) (1) (1)
x1 , . . . , xn → IC1−α (θ)
(2) (2) (2)
x1 , . . . , xn → IC1−α (θ)
..
.
(100) (100) (100)
x1 , . . . , xn → IC1−α (θ)

Ver fichero Excel 100Ics.xlxs.

Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 5


Distribuciones asociadas a la normal
Son distribuciones de probabilidad de ciertos estadı́sticos
construidos a partir de muestras de distribuciones normales.
La distribución χ2 de Pearson
Sean X1 , . . . , Xn v.a. independientes idénticamente distribuidas
(i.i.d.) con distribución N(0, 1). La variable aleatoria ni=1 Xi2
P
sigue una distribución χ2 de Pearson con n grados de libertad:
Xn Densidad de la χ2n
2 2
Xi ∼ χn
χ21
i=1 1
χ22
0.8 χ23
χ24
0.6
χ25
0.4

0.2

0
0 2 4 6 8
Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 6
La distribución t de Student
Sean Y , X1 , . . . , Xn v.a.i.i.d. con distribución N(0, 1). La variable
Y
aleatoria q P sigue una distribución t de Student con n
1 n 2
n i=1 Xi
grados de libertad, tn .
Densidad de la t
0.4 N(0,1)
t5

0.3 t2

0.2

0.1

0
−5 0 5

Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 7


La distribución F de Fisher
Sean X1 , . . . , Xm , Y1 , . . . , Yn v.a.i.i.d. con distribución N(0, 1). La
v.a.
1 Pm 2
m i=1 Xi
1 P n 2
n j=1 Yj
sigue una distribución F de Fisher con m y n grados de libertad,
Fm,n .
Densidad de la F
0.7
F5,3
0.6
F4,6
0.5

0.4

0.3

0.2

0.1

0
0 1 2 3 4 5 6

Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 8


Intervalos de confianza en poblaciones normales
Propiedad: Sea X1 , . . . , Xn una muestra aleatoria de
X ∼ N(µ, σ). Entonces X̄ y S 2 son v.a. independientes,
 
σ n−1 2 X̄ − µ
X̄ ∼ N µ, √ , 2
S ∼ χ2n−1 y ∼ tn−1
n σ √S
n

• Sea x1 , . . . , xn una muestra de X ∼ N(µ, σ). Si σ es conocido un


intervalo de confianza para µ al nivel de confianza 1 − α es
   
σ σ σ
IC1−α (µ) = x̄ − zα/2 √ , x̄ + zα/2 √ = x̄ ∓ zα/2 √ .
n n n
 
s
• Si σ es desconocido, IC1−α (µ) = x̄ ∓ tn−1;α/2 √ y
n
!
2 (n − 1)s 2 (n − 1)s 2
IC1−α (σ ) = , , .
χ2n−1;α/2 χ2n−1;1−α/2

Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 9


Ejemplo 4.2: Se utilizó una disolución 0,1M de ácido para valorar
10 ml de una solución de álcali 0,1M, registrándose los siguientes
volúmenes de ácido:

9,88 10,18 10,23 10,39 10,21 ml.

Suponiendo normalidad calcular un intervalo de confianza para el


volumen medio de ácido y decidir si hay alguna evidencia de error
sistemático.
El error sistemático es el que provoca que todas las observaciones
de un experimento sean erróneas en el mismo sentido, demasiado
grandes o demasiado pequeñas. Entonces las medidas tienen sesgo.

Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 10


• Sean x1 , . . . , xm e y1 , . . . , yn muestras independientes de
X ∼ N(µ1 , σ) e Y ∼ N(µ2 , σ) respectivamente (σ desconocido).
Entonces
r !
1 1
IC1−α (µ1 − µ2 ) = x̄ − ȳ ∓ tm+n−2;α/2 sp + ,
m n

donde
(m − 1)s12 + (n − 1)s22
sp2 =
m+n−2
es una media ponderada de las cuasivarianzas muestrales
m n
1 X 1 X
s12 = (xi − x̄)2 y s22 = (yi − ȳ )2 .
m−1 n−1
i=1 i=1

Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 11


Ejemplo 4.3: Se quiere comparar la grasa corporal (en kg) entre
nadadoras y corredoras olı́mpicas. Se observan los siguientes datos:
Corredoras Nadadoras
11.2 7.6 8.2 9.2 14.1 12.7 9.2 10.7
10.1 7.3 3.7 5.5 15.1 13.7 8.7 14.3
9.4 6.9 8.3 5.0 11.4 11.9
Suponiendo que estas variables siguen distribuciones normales
homocedásticas, calcular un intervalo de confianza para la
diferencia media de grasa entre ambos tipos de deportistas.

Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 12


• Sean x1 , . . . , xm e y1 , . . . , yn muestras aleatorias independientes
de X ∼ N(µ1 , σ1 ) e Y ∼ N(µ2 , σ2 ) respectivamente (σ1 y σ2
desconocidas). Entonces
 2 
s12 /s22 s12 /s22

σ1
IC1−α = , .
σ22 Fm−1;n−1;α/2 Fm−1;n−1;1−α/2

1
Observación: Fm;n;1−α =
Fn;m;α
Ejemplo 4.3 (cont.): Suponiendo que la distribución de la grasa
corporal en nadadoras y corredoras es normal con distintas medias
y distintas varianzas, calcular un intervalo de confianza al 90%
para el cociente de las varianzas.

Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 13


• Sean x1 , . . . , xm e y1 , . . . , yn muestras independientes de
X ∼ N(µ1 , σ1 ) e Y ∼ N(µ2 , σ2 ) respectivamente (σ1 6= σ2 ).
Entonces, si σ1 y σ2 son desconocidas, un intervalo de confianza al
nivel 1 − α para la diferencia de esperanzas de X e Y es
r !
s12 s22
IC1−α (µ1 − µ2 ) = x̄ − ȳ ∓ tf ;α/2 +
m n
donde f es el entero más próximo a
s22 2
 2 
s1
m + n
.
(s12 /m)2 (s22 /n)2
m−1 + n−1

Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 14


• Datos emparejados: Sea (X1 , Y1 ), . . . , (Xn , Yn ) una muestra
aleatoria de (X , Y ) donde X e Y no son independientes, pero los
pares (Xi , Yi ) son independientes entre sı́.
Denotemos E (X ) = µ1 y E (Y ) = µ2 y supongamos que
D = X − Y ∼ N(µ = µ1 − µ2 , σ). Entonces
D1 = X1 − Y1 , . . . , Dn = Xn − Yn es una muestra aleatoria de D.
Podemos construir intervalos de confianza para µ = µ1 − µ2 y para
σ como se indicó en la página 9.

Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 15


Ejemplo 4.4 (Ensayo clı́nico cruzado): Se quiere comparar el
efecto X de un nuevo medicamento con el efecto Y de otro ya
comercializado. Se administran ambos a 14 personas con
insuficiencia respiratoria, asignando aleatoriamente a cada paciente
un tratamiento, y manteniéndolo durante un mes. Luego se le da
el tratamiento alternativo durante otro mes. En la cuarta semana
de cada tratamiento se observa FEV1 (forced expiratory volume),
el volumen de aire que un paciente expulsa en un segundo, tras
una inhalación profunda.
Paciente X Y D Paciente X Y D
1 2.9 3.9 -1.0 8 3.9 2.4 1.5
2 4.0 3.9 0.1 9 2.5 3.6 -1.1
3 3.4 3.3 0.1 10 6.5 2.1 4.4
4 3.2 4.3 -1.1 11 5.5 4.0 1.5
5 3.8 3.2 0.6 12 4.0 3.9 0.1
6 5.2 3.5 1.7 13 5.3 4.0 1.3
7 3.9 2.7 1.2 14 4.3 2.3 2.0
Calcular un intervalo de confianza al 90% para la diferencia media
de FEV1 con ambos medicamentos.
Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 16
Intervalo de confianza para la esperanza µ de una
distribución no gaussiana
Sea X1 , . . . , Xn una muestra de una v.a. X con E (X ) = µ y
varianza V (X ) = σ 2 , ambas desconocidas. Por el TCL,
   
aprox σ σ̂
X̄ ∼ N µ, √ ' N µ, √ ,
n n
siendo σ̂ un estimador puntual de σ. Por tanto,
 
σ̂ (aproximadamente,
IC1−α (µ) = x̄ ∓ zα/2 √
n para n grande)
Ejemplo 4.5: Un laboratorio de cosmética se plantea comercializar
una crema para tratar una afección cutánea especı́fica. Para
conocer la eficacia de la crema se prueba en una muestra de 50
personas con dicha enfermedad cutánea. Al cabo de un mes de su
uso continuado se observa una clara remisión de la enfermedad en
38 de los voluntarios. Construir un intervalo de confianza para la
probabilidad de que el producto sea efectivo.
Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 17
Mı́nimo tamaño muestral

El error cometido al estimar un parámetro θ mediante un intervalo


de confianza IC1−α (θ) es la semi-amplitud del intervalo.

Observación: Esta definición tiene sentido principalmente en


intervalos del tipo IC1−α (θ) = (θ̂ ∓ semilongitud).

Objetivo: Determinar el mı́nimo tamaño muestral n necesario para


que el error cometido al estimar θ mediante un intervalo de
confianza sea menor que una cierta cantidad.
Motivación: Queremos que la estimación por intervalo de
confianza tenga una determinada precisión.

El valor de n obtenido debe tomarse como orientativo,


especialmente cuando la semilongitud del intervalo dependa de la
muestra observada.

Estadı́stica (Quı́mica). Profesora: Amparo Baı́llo Tema 4: Intervalos de confianza 18