Sei sulla pagina 1di 40

Tema 4

Intervalos de confianza
Jose R. Berrendero
Departamento de Matem
aticas
Universidad Aut
onoma de Madrid

Estructura de este tema


I

Que es un intervalo de confianza (IC)?

IC en problemas relacionados con una muestra:


I
I
I
I

IC
IC
IC
IC

para
para
para
para

la media de una poblaci


on normal.
una proporci
on.
el parametro de una distribuci
on de Poisson.
la varianza de una poblaci
on normal.

IC en problemas relacionados con dos muestras:


I

I
I

IC para la diferencia de medias: muestras independientes y


datos emparejados.
IC para la diferencia de proporciones.
IC para el cociente de varianzas.

Intervalos de confianza
Un intervalo de confianza (IC) para un parametro es un
intervalo, calculado a partir de la muestra, que contiene al
parametro con un alto grado de seguridad.
La f
ormula general de la mayora de los intervalos que vamos a
estudiar es:
[Estimador Margen de error]
El centro del intervalo es el estimador del parametro en el que
estamos interesados.
El margen de error depende
I

de la precision del estimador utilizado,

del grado de seguridad con el que queremos que el intervalo


contenga al parametro (el nivel de confianza).

IC para la media de una poblacion normal


(varianza conocida)
Queremos estimar el contenido medio en grasas (en g/100 g) de la
carne de cerdo, . Para ello disponemos de una muestra de 12
piezas de carne para la que el contenido medio es x = 24.93.
Esto significa que 24.93. Por supuesto, 6= 24.93. Si
tomaramos otras 12 piezas distintas nos habra resultado una
estimacion de diferente.
Un IC es una forma de precisar que significa 24.93.
Suponemos que la poblaci
on es normal y que la desviacion tpica
de la poblacion es conocida y vale = 0.25.

Como x N(, 0.25/ 12), sabemos que valores podramos


esperar si tomaramos muchas muestras de tama
no 12.

Aproximadamente para el 95% de las muestras de tama


no 12 se
cumple:
0.072 1.96 < x < 0.072 1.96.
Las desigualdades anteriores son equivalentes a:
x 0.072 1.96 < < x + 0.072 1.96.

Aproximadamente para el 95% de las muestras de tama


no 12 se
cumple que [
x 0.1411].
Confiamos (con un nivel del 95%) en que la u
nica muestra de la
que disponemos sea una de las que verifican la condicion.
Decimos que [24.93 0.1411] es un IC para de nivel 95%.

Cuestiones:
I

Con los mismos datos del ejemplo anterior calcula dos


intervalos cuyos niveles de confianza sean 90% y 99%.

Se ha obtenido x = 24.93 pero la muestra era de 36 piezas en


lugar de 12. Calcula un intervalo de nivel 95%.

Se ha obtenido x = 24.93 con una muestra de 36 piezas pero


= 1 en lugar de = 0.25. Calcula un intervalo de nivel
95%.

F
ormula general: Un IC con nivel de confianza 1 para la
media de una poblacion normal con conocida viene dado por:



IC1 () = x z/2
n

Interpretacion del nivel de confianza


I

Poblacion: normal con media = 0 y = 1.

Se extraen 100 muestras de tama


no n = 20.

Para cada muestra se calcula x y el intervalo de confianza para


de nivel 95% (suponemos varianza poblacional conocida):

[
x z0.025 / n].

Se representa un histograma de las 100 medias obtenidas, as


como los 100 intervalos (en verde si contienen el valor 0 y en
rojo si no).

Interpretacion del nivel de confianza


Intervalos

15

10

5
0

Frecuencias

20

25

Medias

0.4

0.2

0.0

0.2

0.4

0.6

1.5

1.0

0.5

0.0

0.5

1.0

1.5

Si no es conocida y la poblacion no es normal


Como no conocemos , sustituimos en la f
ormula por su
estimador s calculado a partir de la muestra.
Debido al TCL, cuando el tama
no muestral n es suficientemente
grande la formula sigue dando un intervalo de confianza
aproximadamente valido:


s

IC1 () x z/2
.
n
El nivel de confianza ya no es exactamente 1 . Este nivel es
aproximado.

Margen de error
Al radio del intervalo se le suele llamar margen de error, E . En la
situacion anterior:
s
E = z/2 .
n
El margen de error depende de:
I

El nivel de confianza deseado, a traves de z/2 . Se suele


tomar = 0.05 lo que da z0.025 = 1.96 2.

La heterogeneidad de la poblaci
on, medida a traves de s.

El tama
no muestral n.

Si no es conocida y la poblacion es normal

Cuando la poblaci
on es normal y no es conocida, es posible
dar un IC exacto incluso cuando el tama
no muestral es
peque
no.

Para ello, basta mirar en unas tablas distintas. En lugar de


buscar z/2 en las tablas de la normal, buscamos tn1,/2 en
las tablas de la distribuci
on t de Student. La formula del IC
queda


s
IC1 () = x tn1,/2 .
n

Distribucion t de Student
I

La distribucion t de Student con n 1 grados de libertad


(tn1 ) es la distribuci
on de
x

s/ n
en una poblacion normal.

La forma de la densidad de tn es similar a la de la normal. Es


simetrica alrededor de cero.

Sin embargo, la distribuci


on tn da mas probabilidad a valores
lejanos al centro.

Si n es grande tn
= N(0, 1).

Funcion de densidad de la distribucion t-Student


Densidad de la t
0.4

N(0,1)
t5

0.3

t2

0.2

0.1

0
5

P[ t > 1.812] = 0.05


P[ t < -1.812] = 0.05

Tablas de la distribucion t-Student


D

0,25

0,2

0,15

0,1

0,05

0,025

0,01

0,005

0,0005

1
2
3
4
5

1,000
0,816
0,765
0,741
0,727

1,376
1,061
0,978
0,941
0,920

1,963
1,386
1,250
1,190
1,156

3,078
1,886
1,638
1,533
1,476

6,314
2,920
2,353
2,132
2,015

12,706
4,303
3,182
2,776
2,571

31,821
6,965
4,541
3,747
3,365

63,656
9,925
5,841
4,604
4,032

636,578
31,600
12,924
8,610
6,869

6
7
8
9
10

0,718
0,711
0,706
0,703
0,700

0,906
0,896
0,889
0,883
0,879

1,134
1,119
1,108
1,100
1,093

1,440
1,415
1,397
1,383
1,372

1,943
1,895
1,860
1,833
1,812

2,447
2,365
2,306
2,262
2,228

3,143
2,998
2,896
2,821
2,764

3,707
3,499
3,355
3,250
3,169

5,959
5,408
5,041
4,781
4,587

11
12
13
14
15

0,697
0,695
0,694
0,692
0,691

0,876
0,873
0,870
0,868
0,866

1,088
1,083
1,079
1,076
1,074

1,363
1,356
1,350
1,345
1,341

1,796
1,782
1,771
1,761
1,753

2,201
2,179
2,160
2,145
2,131

2,718
2,681
2,650
2,624
2,602

3,106
3,055
3,012
2,977
2,947

4,437
4,318
4,221
4,140
4,073

16
17
18
19
20

0,690
0,689
0,688
0,688
0,687

0,865
0,863
0,862
0,861
0,860

1,071
1,069
1,067
1,066
1,064

1,337
1,333
1,330
1,328
1,325

1,746
1,740
1,734
1,729
1,725

2,120
2,110
2,101
2,093
2,086

2,583
2,567
2,552
2,539
2,528

2,921
2,898
2,878
2,861
2,845

4,015
3,965
3,922
3,883
3,850

21
22
23
24
25

0,686
0,686
0,685
0,685
0,684

0,859
0,858
0,858
0,857
0,856

1,063
1,061
1,060
1,059
1,058

1,323
1,321
1,319
1,318
1,316

1,721
1,717
1,714
1,711
1,708

2,080
2,074
2,069
2,064
2,060

2,518
2,508
2,500
2,492
2,485

2,831
2,819
2,807
2,797
2,787

3,819
3,792
3,768
3,745
3,725

26
27
28
29
30

0,684
0,684
0,683
0,683
0,683

0,856
0,855
0,855
0,854
0,854

1,058
1,057
1,056
1,055
1,055

1,315
1,314
1,313
1,311
1,310

1,706
1,703
1,701
1,699
1,697

2,056
2,052
2,048
2,045
2,042

2,479
2,473
2,467
2,462
2,457

2,779
2,771
2,763
2,756
2,750

3,707
3,689
3,674
3,660
3,646

40
60
120

0,681
0,679
0,677
0,674

0,851
0,848
0,845
0,842

1,050
1,045
1,041
1,036

1,303
1,296
1,289
1,282

1,684
1,671
1,658
1,645

2,021
2,000
1,980
1,960

2,423
2,390
2,358
2,326

2,704
2,660
2,617
2,576

3,551
3,460
3,373
3,290

Un ejemplo resuelto
El envenenamiento por DDT causa temblores y convulsiones. En un estudio se ha
administrado una dosis de DDT a 4 ratones y se ha medido posteriormente en cada
uno el periodo absolutamente refractario, es decir, el tiempo que tardan sus nervios en
recuperarse tras un estmulo. Las 4 medidas en milisegundos son:
1.7 1.6 1.8 1.9
(a) Estima el periodo absolutamente refractario medio para toda la poblaci
on de
ratones de la misma cepa sujeta al mismo tratamiento con DDT.
(b) Calcula el error tpico de la estimaci
on anterior.
(c) Calcula un intervalo de confianza para con nivel de confianza 90%. (Se supone
normalidad).
(d) Calcula otro intervalo, pero ahora con un nivel del 95%

(a) La estimacion de es la media muestral:


x =

1.7 + 1.6 + 1.8 + 1.9


= 1.75.
4

(b) Para calcular el error tpico, primero hay que calcular la


varianza muestral:
(1.7 1.75)2 + (1.6 1.75)2 + (1.8 1.75)2 + (1.9 1.75)2
3

Por lo tanto s 2 0.017 y s = 0.017 0.13.

s2 =

El error tpico es s/ n = 0.13/2 = 0.065.

(c) Como t3,0.05 = 2.353, un I.C. con nivel de confianza


1 = 0.90 es
[1.75 2.353 0.065] = [1.597 , 1.903].
Podemos afirmar que 1.597 < < 1.903 con un nivel de confianza
del 90%.
(d) Como t3,0.025 = 3.182, un I.C. con nivel de confianza
1 = 0.95 es
[1.75 3.182 0.065] = [1.543 , 1.957].
Podemos afirmar que 1.543 < < 1.957 con un nivel de confianza
del 95%.

IC para una proporcion


Las ideas para construir un IC en este caso son exactamente las
mismas que en el caso de la media.
Sabemos que para la distribuci
onpde Bernoulli =
se puede estimar mediante
= p(1 p).
La formula del intervalo es
"

p z/2

p(1 p)
n

p
p(1 p) que

y es valida para n grande, ya que se basa en el TCL.


El margen de error en este caso es
r
E = z/2

p(1 p)
.
n

Un ejemplo resuelto
En una encuesta para estudiar la preocupaci
on de la poblacion por
su alimentacion, se ha preguntado a 965 personas si han seguido
alguna dieta en los u
ltimos 5 a
nos. De ellas, 406 han respondido
afirmativamente. Con esta informaci
on:
(a) Estima la proporci
on p de la poblaci
on que ha seguido alguna
dieta en los u
ltimos 5 a
nos.
(b) Calcula el error tpico del estimador anterior.
(c) Calcula un intervalo de confianza para p con un nivel de
confianza del 95%
(d) Si para un nuevo estudio se desea estimar p con un margen de
error de 1% y un nivel de confianza del 95%, a cuantas
personas hay que entrevistar aproximadamente?

(a) El estimador de p a partir de los datos disponibles es la


proporcion muestral p = 406/965 = 0.421.
(b) El error tpico de este estimador es
r
r
p(1 p)
0.421 (1 0.421)
=
= 0.0159
n
965
(c) Como z0.025 = 1.96, un I.C. con nivel de confianza
1 = 0.95 es
[0.421 1.96 0.0159] = [0.39 , 0.45].
Podemos afirmar que 0.39 < p < 0.45 con un nivel de confianza
del 95%.

(d) Para calcular n despejamos en la ecuaci


on:
r
0.421 (1 0.421)
1.96
= 0.01
n
De aqu obtenemos:
n=

0.421 (1 0.421) 1.962


= 9364.246 9365.
0.012

4,4

3 ( Nov. 2000)

NS/NC

NS/NC

7,2

8,5

Monrquico

9 ( Nov. 2000)

9 ( Nov. 2000)

Mala

Nov.
2000

,4

n
-

67 ( Nov. 2000)

Ficha
e17,6cnica 6de una encuesta
Regular t

aloracin de la
edero de la
pe Felipe?

,6

72 ( Nov. 2000)

28

A favor

Est a favor o en contra de que


se modifique la Constitucin
para abolir la preferencia del
hombre sobre la mujer en la
sucesin al trono?

2,7

55

3
2

NS/NC

NS/NC
En contra

83,4

6,4

56

6,5

56

45

En %

A favor

6,4

En %

Usted se considera
monrquico o republicano?

En %

Muy mala 2,5

51,4

83,4

En contra

Es partidario de que esa


reforma se realice cuanto antes?

NS/NC

NO

28

10,2

Republicano

29

16

NS/NC

27

Monrquico

45

NS/NC

NS/NC

NS/NC

10,2

16

27

FICHA TCNICA

bajo de campo: la encuesta ha sido realizada por el Instituto Opina los das 7 y 8 de noviembre de 2005. mbito geogrfico: Espaa. Recogida de
nte entrevista telefnica asistida por ordenador (CATI). Universo de anlisis: poblacin mayor de 18 aos residente en hogares con telfono. Tamao
0 entrevistas proporcionales. Error muestral: el margen de error para el total de la muestra es de 3,10% para un margen de confianza del 95% y bajo
ma indeterminacin (p=q=50%). Procedimiento de muestreo: seleccin polietpica del entrevistado: unidades primarias de muestreo (municipios)
ma aleatoria proporcional para cada provincia. Unidades secundarias (hogares) mediante la seleccin aleatoria de nmeros de telfono. Unidades
segn cuotas cruzadas de sexo, edad y recuerdo de voto en las elecciones generales de 2004.

a
n
l
s

Realizacin del trabajo de campo: la encuesta ha sido realizada por el Instituto Opina los das 7 y 8 de noviembre de 2005. mbito geogrfico: Espaa. Recogida de
informacin: mediante entrevista telefnica asistida por ordenador (CATI). Universo de anlisis: poblacin mayor de 18 aos residente en hogares con telfono. Tamao
de la muestra: 1.000 entrevistas proporcionales. Error muestral: el margen de error para el total de la muestra esentrevistados
de 3,10% para unahora
margen deseala
confianzaquedel 95% y bajo
la figura del Rey sigue siendo necesaria, un porcentaje sensibleel supuesto de mxima indeterminacin (p=q=50%). Procedimiento de muestreo: seleccin polietpica del entrevimente
stado: unidinferior
ades primariaals de muestreo
(municipios)
de 2000
(72%), mientras que crece del
19%
al
34%
el
segmento
de
seleccionadas de forma aleatoria proporcional para cada provincia. Unidades secundarias (hogares) mediante la selqueeccipiensan
n aleatoria que
de nmeros
de telfono.losUnidades
el Monarca ya
ha cumplido su misin.
ltimas (individuos) segn cuotas cruzadas de sexo, edad y recuerdo de voto en las elecciones generales de 2004. Un 70% considera que la acEL PAS

tuacin del heredero de la Corona, el prncipe Felipe, es buena


o muy buena. Una inmensa mayora (83%) se muestra a favor
de que se modifique la Constitucin para eliminar la preferencia del varn sobre la mujer en
la sucesin al trono, mientras

EL PAS

Explicacion
I

El margen de error del intervalo de confianza de una


proporcion verifica
r
r
p(1 p)
1
z/2
 = z/2
n
4n
ya que el caso p = q = 1/2 (q = 1 p) es el mas
desfavorable.

Seg
un la ficha tecnica, n = 1000 y 1 = 0.95
(z0.025 = 1.96), por lo que en el caso mas desfavorable:
r
1
0.031.
 = 1.96
4000

El valor que da la f
ormula es consistente con el margen de
error de 3.10% para los porcentajes estimados en el sondeo.

IC para el parametro de una Poisson

Sea X1 , . . . , Xn una muestra aleatoria de X P().


Como = 2 = , el TCL implica
x
p
= N(0, 1)
/n
De aqu se deduce el siguiente IC de confianza aproximada 1 ,
"
r #
x
(aproximadamente,
IC1 () x z/2
para n grande)
n

IC para el parametro de una Poisson


Ejemplo: Lord Ernest Rutherford, el famoso fsico britanico de
principios del siglo XX, se dedic
o a observar desintegraciones
radiactivas en su laboratorio. Rutherford tom
o n = 2608 intervalos
de 7.5 segundos cada uno y contabiliz
o el n
umero X de partculas
que alcanzaban un contador en cada uno de esos intervalos. Sus
observaciones fueron
Num. de partculas
por intervalo de
tiempo (x)
Num. de intervalos
de tiempo con x
partculas observadas

10

57

203

383

525

532

408

273

139

45

27

16

Suponiendo que X sigue una distribuci


on de Poisson(), calcular
un intervalo de confianza al 95% para .

Distribucion de la varianza en una poblacion normal


Si sumamos n v.a. normales estandar independientes elevadas al
cuadrado, obtenemos una v.a. cuya distribuci
on se llama 2 con n
grados de libertad (gl). Usamos la notaci
on 2n .
Los gl corresponden al n
umero de sumandos al cuadrado
independientes.
Si x1 , . . . , xn son v.a. con distribuci
on N(, ) independientes,
entonces

n 
X
xi 2
2n

i=1

Si sustituimos por x en la expresi


on anterior se pierde un gl:

n 
X
xi x 2 (n 1)s 2
=
2n1

2
i=1

Funcion de densidad de la distribucion 2


Densidad de la 2
n
2
1

2
2
2
3

0.8

2
4

0.6

2
5

0.4
0.2
0
0

libertad

Tablas de la distribucion

P [

2
0.75

0.5

0.25

0.1

0.05

2


> 15.99] = 0.10

0.025

0.01

0.005

0.995

0.99

0.975

0.95

0.9

3.93E-05
1.00E-02
7.17E-02
0.207
0.412

1.57E-04
2.01E-02
0.115
0.297
0.554

9.82E-04
5.06E-02
0.216
0.484
0.831

3.93E-03
0.103
0.352
0.711
1.145

1.58E-02
0.211
0.584
1.064
1.610

0.102
0.575
1.213
1.923
2.67

0.455
1.386
2.37
3.36
4.35

1.323
2.77
4.11
5.39
6.63

2.71
4.61
6.25
7.78
9.24

3.84
5.99
7.81
9.49
11.07

5.02
7.38
9.35
11.14
12.83

6.63
9.21
11.34
13.28
15.09

7.88
10.60
12.84
14.86
16.75

1
2
3
4
5

6
7
8
9
10

0.676
0.989
1.344
1.735
2.16

0.872
1.239
1.647
2.09
2.56

1.237
1.690
2.18
2.70
3.25

1.635
2.17
2.73
3.33
3.94

2.20
2.83
3.49
4.17
4.87

3.45
4.25
5.07
5.90
6.74

5.35
6.35
7.34
8.34
9.34

7.84
9.04
10.22
11.39
12.55

10.64
12.02
13.36
14.68
15.99

12.59
14.07
15.51
16.92
18.31

14.45
16.01
17.53
19.02
20.5

16.81
18.48
20.1
21.7
23.2

18.55
20.3
22.0
23.6
25.2

6
7
8
9
10

11
12
13
14
15

2.60
3.07
3.57
4.07
4.60

3.05
3.57
4.11
4.66
5.23

3.82
4.40
5.01
5.63
6.26

4.57
5.23
5.89
6.57
7.26

5.58
6.30
7.04
7.79
8.55

7.58
8.44
9.30
10.17
11.04

10.34
11.34
12.34
13.34
14.34

13.70
14.85
15.98
17.12
18.25

17.28
18.55
19.81
21.1
22.3

19.68
21.0
22.4
23.7
25.0

21.9
23.3
24.7
26.1
27.5

24.7
26.2
27.7
29.1
30.6

26.8
28.3
29.8
31.3
32.8

11
12
13
14
15

16
17
18
19
20

5.14
5.70
6.26
6.84
7.43

5.81
6.41
7.01
7.63
8.26

6.91
7.56
8.23
8.91
9.59

7.96
8.67
9.39
10.12
10.85

9.31
10.09
10.86
11.65
12.44

11.91
12.79
13.68
14.56
15.45

15.34
16.34
17.34
18.34
19.34

19.37
20.5
21.6
22.7
23.8

23.5
24.8
26.0
27.2
28.4

26.3
27.6
28.9
30.1
31.4

28.8
30.2
31.5
32.9
34.2

32.0
33.4
34.8
36.2
37.6

34.3
35.7
37.2
38.6
40.0

16
17
18
19
20

21
22
23
24
25

8.03
8.64
9.26
9.89
10.52

8.90
9.54
10.20
10.86
11.52

10.28
10.98
11.69
12.40
13.12

11.59
12.34
13.09
13.85
14.61

13.24
14.04
14.85
15.66
16.47

16.34
17.24
18.14
19.04
19.94

20.3
21.3
22.3
23.3
24.3

24.9
26.0
27.1
28.2
29.3

29.6
30.8
32.0
33.2
34.4

32.7
33.9
35.2
36.4
37.7

35.5
36.8
38.1
39.4
40.6

38.9
40.3
41.6
43.0
44.3

41.4
42.8
44.2
45.6
46.9

21
22
23
24
25

26
27
28
29
30

11.16
11.81
12.46
13.12
13.79

12.20
12.88
13.56
14.26
14.95

13.84
14.57
15.31
16.05
16.79

15.38
16.15
16.93
17.71
18.49

17.29
18.11
18.94
19.77
20.6

20.8
21.7
22.7
23.6
24.5

25.3
26.3
27.3
28.3
29.3

30.4
31.5
32.6
33.7
34.8

35.6
36.7
37.9
39.1
40.3

38.9
40.1
41.3
42.6
43.8

41.9
43.2
44.5
45.7
47.0

45.6
47.0
48.3
49.6
50.9

48.3
49.6
51.0
52.3
53.7

26
27
28
29
30

40
50
60
70

20.7
28.0
35.5
43.3

22.2
29.7
37.5
45.4

24.4
32.4
40.5
48.8

26.5
34.8
43.2
51.7

29.1
37.7
46.5
55.3

33.7
42.9
52.3
61.7

39.3
49.3
59.3
69.3

45.6
56.3
67.0
77.6

51.8
63.2
74.4
85.5

55.8
67.5
79.1
90.5

59.3
71.4
83.3
95.0

63.7
76.2
88.4
100.4

66.8
79.5
92.0
104.2

40
50
60
70

80
90
100

51.2
59.2
67.3

53.5
61.8
70.1

57.2
65.6
74.2

60.4
69.1
77.9

64.3
73.3
82.4

71.1
80.6
90.1

79.3
89.3
99.3

88.1
98.6
109.1

96.6
107.6
118.5

101.9
113.1
124.3

106.6
118.1
129.6

112.3
124.1
135.8

116.3
128.3
140.2

80
90
100

-2.58

-2.33

-1.96

-1.64

-1.28

-0.674

0.000

0.674

1.282

1.645

1.96

2.33

2.58

1
2
3
4
5

Z


Para


> 100 tmese




Z


2I

. Z


es la desviacin normal estandarizada correspondiente al nivel de

IC para la varianza en una poblacion normal


El intervalo para la varianza 2 en una poblaci
on normal es
#
"
(n 1)s 2 (n 1)s 2
2
,
IC1 ( ) =
2n1;/2 2n1;1/2
El valor del estimador de 2 no es el centro del intervalo de
confianza en este caso. Esto es debido a la asimetra de la
distribucion 2 .
Ejemplo: En una explotaci
on minera, las rocas excavadas se someten a un an
alisis
qumico para determinar su contenido porcentual de cadmio. Se puede suponer que
este contenido es una variable con distribuci
on normal de media y varianza 2 .
Despu
es de analizar 25 rocas se obtiene un contenido porcentual medio de 9.77 con
una cuasidesviaci
on tpica de 3.164. Calcula un IC de nivel 95% para la varianza de la
poblaci
on.

IC para la diferencia de medias (muestras independientes)


Datos
Muestra 1 x1
Muestra 2 y1

xm
yn

Hip
otesis sobre los datos
I

Las dos muestras proceden de poblaciones normales con


medias poblacionales 1 y 2 respectivamente.

Las dos varianzas poblacionales son iguales: 12 = 22 = 2 .

Las dos muestras son independientes.

Objetivo
Calcular un IC para 1 2 .

Ejemplo
Se han determinado los valores de epicatequina (una sustancia
fenolica) en 10 muestras de vino tinto, encontrando que la media
muestral era 195.1 mg/l y el error tpico 10.051. Los
correspondientes valores para 10 muestras de cerveza fueron 65.5
mg/L y 3.4184. Se desea calcular un IC de nivel 95% para la
diferencia del contenido medio de epicatequina en el vino y en la
cerveza.
En
este ejemplo, m = n= 10, x = 195.1, y = 65.5,
s1 / 10 = 10.051 y s2 / 10 = 3.4184.
El centro del intervalo es x y = 129.6.
Vamos a ver como se determina correctamente el margen de error.

IC para la diferencia de medias (muestras independientes)


Como las muestras son independientes,
r

x y N 1 2 ,

1
1
+
n1 n2

Si es conocido, un IC para 1 2 es (se razona igual que en el


caso de una u
nica media):
"
#
r
1
1
IC1 (1 2 ) = (
x y ) z/2
+
m n
En la practica nunca se conoce as que es necesario estimarlo a
partir de los datos.

Estimador combinado de la varianza


Como 2 es la misma para los dos grupos, para estimarla podemos
combinar las desviaciones de las dos muestras
Pm
P
(xi x)2 + ni=1 (yi y )2
(m 1)s12 + (n 1)s22
=
sp2 = i=1
m+n2
m+n2
Por que se divide por m + n 2?
Si reemplazamos por su estimador sp , la distribucion es t de
Student en lugar de normal. El IC resultante es:
"
#
r
1
1
IC1 (1 2 ) = (
x y ) tm+n2;/2 sp
+
m n

Ejemplo (cont.)
Estimador combinado de la varianza:
9 31.78412 + 9 10.80992
= 563.5415
18

ya que s1 = 10.051 10 = 31.7841 y s2 = 3.4184 10 = 10.8099.


Sp2 =

Error tpico de la diferencia:


p
p

Sp 1/n1 + 1/n2 = 563.5415 2/10 = 10.61642.

Como t18,0.025 = 2.101, el IC de nivel 95% es


IC1 (1 2 ) = [129.6 2.101 10.61642]

Ejercicio: Cual sera el IC si no suponemos que las varianzas


poblacionales son iguales?

IC para la diferencia de medias (datos emparejados)


Sea (X1 , Y1 ), . . . , (Xn , Yn ) una muestra de pares de v.a. (X , Y ),
donde X e Y tienen distribuci
on normal pero no son
independientes.
Si E (X ) = 1 y E (Y ) = 2 , entonces
D = X Y N(D = 1 2 , D )
Las diferencias D1 = X1 Y1 , . . . , Dn = Xn Yn son una muestra
de la v.a. D = X Y .
Por lo tanto, podemos construir intervalos de confianza para
D = 1 2 y para D como hicimos en la primera parte de este
tema.

Ejemplo
Se quieren comparar los efectos X de un nuevo medicamento con
Y , los de otro ya comercializado. Se administran ambos a 14
personas con insuficiencia respiratoria, asignando aleatoriamente a
cada paciente un tratamiento, y manteniendolo durante un mes.
Luego se le da el tratamiento alternativo durante otro mes. En la
cuarta semana de cada tratamiento se observa la FEV1 (forced
expiratory volume), el volumen de aire que un paciente expulsa en
un segundo, tras una inhalaci
on profunda.
Paciente
1
2
3
4
5
6
7

X
2.9
4.0
3.4
3.2
3.8
5.2
3.9

Y
3.9
3.9
3.3
4.3
3.2
3.5
2.7

D
-1.0
0.1
0.1
-1.1
0.6
1.7
1.2

Paciente
8
9
10
11
12
13
14

X
3.9
2.5
6.5
5.5
4.0
5.3
4.3

Y
2.4
3.6
2.1
4.0
3.9
4.0
2.3

D
1.5
-1.1
4.4
1.5
0.1
1.3
2.0

Calcular un intervalo de confianza al 90% para la diferencia media


de FEV1 con ambos medicamentos.

IC para la diferencia de proporciones


Sean X1 , . . . , Xm e Y1 , . . . , Yn muestras independientes de
X Bernoulli(p1 ) e Y Bernoulli(p2 ).
Por el TCL sabemos que
!
r
p1 (1 p1 )

X = N p1 ,
m

e Y
= N p2 ,

p2 (1 p2 )
n

y p2 = Y .
donde p1 = X
El IC para la diferencia de proporciones p1 p2 es
"
#
r
x(1 x) y (1 y )
IC1 (p1 p2 ) (
x y ) z/2
+
m
n
(aproximadamente, para m y n grandes).

Ejemplo
Se ha estudiado la prevalencia de caries en un grupo de ni
nos que
siguieron un plan de prevenci
on de la enfermedad y en otro grupo
de ni
nos que no siguieron el plan y que fueron seleccionados como
control. Los datos son los siguientes:

Grupo control
Grupo prevencion

Ni
nos con caries
10
6

Ni
nos sin caries
26
32

Calcula un intervalo de confianza de nivel 95% para la diferencia


entre las proporciones de ni
nos con caries en ambas poblaciones (la
de los ni
nos que no siguen el plan de prevenci
on y la de los ni
nos
que s lo siguen).

IC para el cociente de varianzas


Si X 2m e Y 2n son dos v.a. independientes, entonces la
distribucion del cociente
X /m
Y /n
se denomina F con m y n gl. (y se denota Fm,n ).
La distribucion del cociente de cuasivarianzas muestrales de dos
muestras independientes de poblaciones normales con tama
nos m y
n es
s12 /12
Fm1,n1
s22 /22
Un IC para el cociente de varianzas 12 /22 es
 2 

1
s12 /s22
s12 /s22
IC1
=
,
Fm1;n1;/2 Fm1;n1;1/2
22

Tablas de la distribucion F
n2
1
1 161
4052
2 18.51
98.50
3 10.13
34.12
4 7.71
21.20
5 6.61
16.26
6 5.99
13.75
7 5.59
12.25
8 5.32
11.26
9 5.12
10.56
10 4.96
10.04

2
199
4999
19.00
99.00
9.55
30.82
6.94
18.00
5.79
13.27
5.14
10.92
4.74
9.55
4.46
8.65
4.26
8.02
4.10
7.56

3
216
5404
19.16
99.16
9.28
29.46
6.59
16.69
5.41
12.06
4.76
9.78
4.35
8.45
4.07
7.59
3.86
6.99
3.71
6.55

4
225
5624
19.25
99.25
9.12
28.71
6.39
15.98
5.19
11.39
4.53
9.15
4.12
7.85
3.84
7.01
3.63
6.42
3.48
5.99

5
230
5764
19.30
99.30
9.01
28.24
6.26
15.52
5.05
10.97
4.39
8.75
3.97
7.46
3.69
6.63
3.48
6.06
3.33
5.64

6
234
5859
19.33
99.33
8.94
27.91
6.16
15.21
4.95
10.67
4.28
8.47
3.87
7.19
3.58
6.37
3.37
5.80
3.22
5.39

5 % (normal) y 1 % (negritas) puntos para la distribucin de F


n1 grados delibertad (para el mayor cuadrado medio)
7 8 9 10 11 12 14 16 20 24
237 239 241 242 243 244 245 246 248 249
5928 5981 6022 6056 6083 6107 6143 6170 6209 6234
19.35 19.37 19.38 19.40 19.40 19.41 19.42 19.43 19.45 19.45
99.36 99.38 99.39 99.40 99.41 99.42 99.43 99.44 99.45 99.46
8.89 8.85 8.81 8.79 8.76 8.74 8.71 8.69 8.66 8.64
27.67 27.49 27.34 27.23 27.13 27.05 26.92 26.83 26.69 26.60
6.09 6.04 6.00 5.96 5.94 5.91 5.87 5.84 5.80 5.77
14.98 14.80 14.66 14.55 14.45 14.37 14.25 14.15 14.02 13.93
4.88 4.82 4.77 4.74 4.70 4.68 4.64 4.60 4.56 4.53
10.46 10.29 10.16 10.05 9.96 9.89 9.77 9.68 9.55 9.47
4.21 4.15 4.10 4.06 4.03 4.00 3.96 3.92 3.87 3.84
8.26 8.10 7.98 7.87 7.79 7.72 7.60 7.52 7.40 7.31
3.79 3.73 3.68 3.64 3.60 3.57 3.53 3.49 3.44 3.41
6.99 6.84 6.72 6.62 6.54 6.47 6.36 6.28 6.16 6.07
3.50 3.44 3.39 3.35 3.31 3.28 3.24 3.20 3.15 3.12
6.18 6.03 5.91 5.81 5.73 5.67 5.56 5.48 5.36 5.28
3.29 3.23 3.18 3.14 3.10 3.07 3.03 2.99 2.94 2.90
5.61 5.47 5.35 5.26 5.18 5.11 5.01 4.92 4.81 4.73
3.14 3.07 3.02 2.98 2.94 2.91 2.86 2.83 2.77 2.74
5.20 5.06 4.94 4.85 4.77 4.71 4.60 4.52 4.41 4.33

n2
30
250
6260
19.46
99.47
8.62
26.50
5.75
13.84
4.50
9.38
3.81
7.23
3.38
5.99
3.08
5.20
2.86
4.65
2.70
4.25

40
251
6286
19.47
99.48
8.59
26.41
5.72
13.75
4.46
9.29
3.77
7.14
3.34
5.91
3.04
5.12
2.83
4.57
2.66
4.17

50
252
6302
19.48
99.48
8.58
26.35
5.70
13.69
4.44
9.24
3.75
7.09
3.32
5.86
3.02
5.07
2.80
4.52
2.64
4.12

75
253
6324
19.48
99.48
8.56
26.28
5.68
13.61
4.42
9.17
3.73
7.02
3.29
5.79
2.99
5.00
2.77
4.45
2.60
4.05

100
253
6334
19.49
99.49
8.55
26.24
5.66
13.58
4.41
9.13
3.71
6.99
3.27
5.75
2.97
4.96
2.76
4.41
2.59
4.01

200
254
6350
19.49
99.49
8.54
26.18
5.65
13.52
4.39
9.08
3.69
6.93
3.25
5.70
2.95
4.91
2.73
4.36
2.56
3.96

500
254
6360
19.49
99.50
8.53
26.15
5.64
13.49
4.37
9.04
3.68
6.90
3.24
5.67
2.94
4.88
2.72
4.33
2.55
3.93

254
6366
19.50
99.50
8.53
26.13
5.63
13.46
4.37
9.02
3.67
6.88
3.23
5.65
2.93
4.86
2.71
4.31
2.54
3.91

1
2
3
4
5
6
7
8
9
10

Potrebbero piacerti anche