Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Intervalos de confianza
Jose R. Berrendero
Departamento de Matem
aticas
Universidad Aut
onoma de Madrid
IC
IC
IC
IC
para
para
para
para
I
I
Intervalos de confianza
Un intervalo de confianza (IC) para un parametro es un
intervalo, calculado a partir de la muestra, que contiene al
parametro con un alto grado de seguridad.
La f
ormula general de la mayora de los intervalos que vamos a
estudiar es:
[Estimador Margen de error]
El centro del intervalo es el estimador del parametro en el que
estamos interesados.
El margen de error depende
I
Cuestiones:
I
F
ormula general: Un IC con nivel de confianza 1 para la
media de una poblacion normal con conocida viene dado por:
IC1 () = x z/2
n
[
x z0.025 / n].
15
10
5
0
Frecuencias
20
25
Medias
0.4
0.2
0.0
0.2
0.4
0.6
1.5
1.0
0.5
0.0
0.5
1.0
1.5
IC1 () x z/2
.
n
El nivel de confianza ya no es exactamente 1 . Este nivel es
aproximado.
Margen de error
Al radio del intervalo se le suele llamar margen de error, E . En la
situacion anterior:
s
E = z/2 .
n
El margen de error depende de:
I
La heterogeneidad de la poblaci
on, medida a traves de s.
El tama
no muestral n.
Cuando la poblaci
on es normal y no es conocida, es posible
dar un IC exacto incluso cuando el tama
no muestral es
peque
no.
Distribucion t de Student
I
s/ n
en una poblacion normal.
Si n es grande tn
= N(0, 1).
N(0,1)
t5
0.3
t2
0.2
0.1
0
5
0,25
0,2
0,15
0,1
0,05
0,025
0,01
0,005
0,0005
1
2
3
4
5
1,000
0,816
0,765
0,741
0,727
1,376
1,061
0,978
0,941
0,920
1,963
1,386
1,250
1,190
1,156
3,078
1,886
1,638
1,533
1,476
6,314
2,920
2,353
2,132
2,015
12,706
4,303
3,182
2,776
2,571
31,821
6,965
4,541
3,747
3,365
63,656
9,925
5,841
4,604
4,032
636,578
31,600
12,924
8,610
6,869
6
7
8
9
10
0,718
0,711
0,706
0,703
0,700
0,906
0,896
0,889
0,883
0,879
1,134
1,119
1,108
1,100
1,093
1,440
1,415
1,397
1,383
1,372
1,943
1,895
1,860
1,833
1,812
2,447
2,365
2,306
2,262
2,228
3,143
2,998
2,896
2,821
2,764
3,707
3,499
3,355
3,250
3,169
5,959
5,408
5,041
4,781
4,587
11
12
13
14
15
0,697
0,695
0,694
0,692
0,691
0,876
0,873
0,870
0,868
0,866
1,088
1,083
1,079
1,076
1,074
1,363
1,356
1,350
1,345
1,341
1,796
1,782
1,771
1,761
1,753
2,201
2,179
2,160
2,145
2,131
2,718
2,681
2,650
2,624
2,602
3,106
3,055
3,012
2,977
2,947
4,437
4,318
4,221
4,140
4,073
16
17
18
19
20
0,690
0,689
0,688
0,688
0,687
0,865
0,863
0,862
0,861
0,860
1,071
1,069
1,067
1,066
1,064
1,337
1,333
1,330
1,328
1,325
1,746
1,740
1,734
1,729
1,725
2,120
2,110
2,101
2,093
2,086
2,583
2,567
2,552
2,539
2,528
2,921
2,898
2,878
2,861
2,845
4,015
3,965
3,922
3,883
3,850
21
22
23
24
25
0,686
0,686
0,685
0,685
0,684
0,859
0,858
0,858
0,857
0,856
1,063
1,061
1,060
1,059
1,058
1,323
1,321
1,319
1,318
1,316
1,721
1,717
1,714
1,711
1,708
2,080
2,074
2,069
2,064
2,060
2,518
2,508
2,500
2,492
2,485
2,831
2,819
2,807
2,797
2,787
3,819
3,792
3,768
3,745
3,725
26
27
28
29
30
0,684
0,684
0,683
0,683
0,683
0,856
0,855
0,855
0,854
0,854
1,058
1,057
1,056
1,055
1,055
1,315
1,314
1,313
1,311
1,310
1,706
1,703
1,701
1,699
1,697
2,056
2,052
2,048
2,045
2,042
2,479
2,473
2,467
2,462
2,457
2,779
2,771
2,763
2,756
2,750
3,707
3,689
3,674
3,660
3,646
40
60
120
0,681
0,679
0,677
0,674
0,851
0,848
0,845
0,842
1,050
1,045
1,041
1,036
1,303
1,296
1,289
1,282
1,684
1,671
1,658
1,645
2,021
2,000
1,980
1,960
2,423
2,390
2,358
2,326
2,704
2,660
2,617
2,576
3,551
3,460
3,373
3,290
Un ejemplo resuelto
El envenenamiento por DDT causa temblores y convulsiones. En un estudio se ha
administrado una dosis de DDT a 4 ratones y se ha medido posteriormente en cada
uno el periodo absolutamente refractario, es decir, el tiempo que tardan sus nervios en
recuperarse tras un estmulo. Las 4 medidas en milisegundos son:
1.7 1.6 1.8 1.9
(a) Estima el periodo absolutamente refractario medio para toda la poblaci
on de
ratones de la misma cepa sujeta al mismo tratamiento con DDT.
(b) Calcula el error tpico de la estimaci
on anterior.
(c) Calcula un intervalo de confianza para con nivel de confianza 90%. (Se supone
normalidad).
(d) Calcula otro intervalo, pero ahora con un nivel del 95%
s2 =
p z/2
p(1 p)
n
p
p(1 p) que
p(1 p)
.
n
Un ejemplo resuelto
En una encuesta para estudiar la preocupaci
on de la poblacion por
su alimentacion, se ha preguntado a 965 personas si han seguido
alguna dieta en los u
ltimos 5 a
nos. De ellas, 406 han respondido
afirmativamente. Con esta informaci
on:
(a) Estima la proporci
on p de la poblaci
on que ha seguido alguna
dieta en los u
ltimos 5 a
nos.
(b) Calcula el error tpico del estimador anterior.
(c) Calcula un intervalo de confianza para p con un nivel de
confianza del 95%
(d) Si para un nuevo estudio se desea estimar p con un margen de
error de 1% y un nivel de confianza del 95%, a cuantas
personas hay que entrevistar aproximadamente?
4,4
3 ( Nov. 2000)
NS/NC
NS/NC
7,2
8,5
Monrquico
9 ( Nov. 2000)
9 ( Nov. 2000)
Mala
Nov.
2000
,4
n
-
67 ( Nov. 2000)
Ficha
e17,6cnica 6de una encuesta
Regular t
aloracin de la
edero de la
pe Felipe?
,6
72 ( Nov. 2000)
28
A favor
2,7
55
3
2
NS/NC
NS/NC
En contra
83,4
6,4
56
6,5
56
45
En %
A favor
6,4
En %
Usted se considera
monrquico o republicano?
En %
51,4
83,4
En contra
NS/NC
NO
28
10,2
Republicano
29
16
NS/NC
27
Monrquico
45
NS/NC
NS/NC
NS/NC
10,2
16
27
FICHA TCNICA
bajo de campo: la encuesta ha sido realizada por el Instituto Opina los das 7 y 8 de noviembre de 2005. mbito geogrfico: Espaa. Recogida de
nte entrevista telefnica asistida por ordenador (CATI). Universo de anlisis: poblacin mayor de 18 aos residente en hogares con telfono. Tamao
0 entrevistas proporcionales. Error muestral: el margen de error para el total de la muestra es de 3,10% para un margen de confianza del 95% y bajo
ma indeterminacin (p=q=50%). Procedimiento de muestreo: seleccin polietpica del entrevistado: unidades primarias de muestreo (municipios)
ma aleatoria proporcional para cada provincia. Unidades secundarias (hogares) mediante la seleccin aleatoria de nmeros de telfono. Unidades
segn cuotas cruzadas de sexo, edad y recuerdo de voto en las elecciones generales de 2004.
a
n
l
s
Realizacin del trabajo de campo: la encuesta ha sido realizada por el Instituto Opina los das 7 y 8 de noviembre de 2005. mbito geogrfico: Espaa. Recogida de
informacin: mediante entrevista telefnica asistida por ordenador (CATI). Universo de anlisis: poblacin mayor de 18 aos residente en hogares con telfono. Tamao
de la muestra: 1.000 entrevistas proporcionales. Error muestral: el margen de error para el total de la muestra esentrevistados
de 3,10% para unahora
margen deseala
confianzaquedel 95% y bajo
la figura del Rey sigue siendo necesaria, un porcentaje sensibleel supuesto de mxima indeterminacin (p=q=50%). Procedimiento de muestreo: seleccin polietpica del entrevimente
stado: unidinferior
ades primariaals de muestreo
(municipios)
de 2000
(72%), mientras que crece del
19%
al
34%
el
segmento
de
seleccionadas de forma aleatoria proporcional para cada provincia. Unidades secundarias (hogares) mediante la selqueeccipiensan
n aleatoria que
de nmeros
de telfono.losUnidades
el Monarca ya
ha cumplido su misin.
ltimas (individuos) segn cuotas cruzadas de sexo, edad y recuerdo de voto en las elecciones generales de 2004. Un 70% considera que la acEL PAS
EL PAS
Explicacion
I
Seg
un la ficha tecnica, n = 1000 y 1 = 0.95
(z0.025 = 1.96), por lo que en el caso mas desfavorable:
r
1
0.031.
= 1.96
4000
El valor que da la f
ormula es consistente con el margen de
error de 3.10% para los porcentajes estimados en el sondeo.
10
57
203
383
525
532
408
273
139
45
27
16
i=1
2
i=1
2
2
2
3
0.8
2
4
0.6
2
5
0.4
0.2
0
0
libertad
Tablas de la distribucion
P [
2
0.75
0.5
0.25
0.1
0.05
2
0.025
0.01
0.005
0.995
0.99
0.975
0.95
0.9
3.93E-05
1.00E-02
7.17E-02
0.207
0.412
1.57E-04
2.01E-02
0.115
0.297
0.554
9.82E-04
5.06E-02
0.216
0.484
0.831
3.93E-03
0.103
0.352
0.711
1.145
1.58E-02
0.211
0.584
1.064
1.610
0.102
0.575
1.213
1.923
2.67
0.455
1.386
2.37
3.36
4.35
1.323
2.77
4.11
5.39
6.63
2.71
4.61
6.25
7.78
9.24
3.84
5.99
7.81
9.49
11.07
5.02
7.38
9.35
11.14
12.83
6.63
9.21
11.34
13.28
15.09
7.88
10.60
12.84
14.86
16.75
1
2
3
4
5
6
7
8
9
10
0.676
0.989
1.344
1.735
2.16
0.872
1.239
1.647
2.09
2.56
1.237
1.690
2.18
2.70
3.25
1.635
2.17
2.73
3.33
3.94
2.20
2.83
3.49
4.17
4.87
3.45
4.25
5.07
5.90
6.74
5.35
6.35
7.34
8.34
9.34
7.84
9.04
10.22
11.39
12.55
10.64
12.02
13.36
14.68
15.99
12.59
14.07
15.51
16.92
18.31
14.45
16.01
17.53
19.02
20.5
16.81
18.48
20.1
21.7
23.2
18.55
20.3
22.0
23.6
25.2
6
7
8
9
10
11
12
13
14
15
2.60
3.07
3.57
4.07
4.60
3.05
3.57
4.11
4.66
5.23
3.82
4.40
5.01
5.63
6.26
4.57
5.23
5.89
6.57
7.26
5.58
6.30
7.04
7.79
8.55
7.58
8.44
9.30
10.17
11.04
10.34
11.34
12.34
13.34
14.34
13.70
14.85
15.98
17.12
18.25
17.28
18.55
19.81
21.1
22.3
19.68
21.0
22.4
23.7
25.0
21.9
23.3
24.7
26.1
27.5
24.7
26.2
27.7
29.1
30.6
26.8
28.3
29.8
31.3
32.8
11
12
13
14
15
16
17
18
19
20
5.14
5.70
6.26
6.84
7.43
5.81
6.41
7.01
7.63
8.26
6.91
7.56
8.23
8.91
9.59
7.96
8.67
9.39
10.12
10.85
9.31
10.09
10.86
11.65
12.44
11.91
12.79
13.68
14.56
15.45
15.34
16.34
17.34
18.34
19.34
19.37
20.5
21.6
22.7
23.8
23.5
24.8
26.0
27.2
28.4
26.3
27.6
28.9
30.1
31.4
28.8
30.2
31.5
32.9
34.2
32.0
33.4
34.8
36.2
37.6
34.3
35.7
37.2
38.6
40.0
16
17
18
19
20
21
22
23
24
25
8.03
8.64
9.26
9.89
10.52
8.90
9.54
10.20
10.86
11.52
10.28
10.98
11.69
12.40
13.12
11.59
12.34
13.09
13.85
14.61
13.24
14.04
14.85
15.66
16.47
16.34
17.24
18.14
19.04
19.94
20.3
21.3
22.3
23.3
24.3
24.9
26.0
27.1
28.2
29.3
29.6
30.8
32.0
33.2
34.4
32.7
33.9
35.2
36.4
37.7
35.5
36.8
38.1
39.4
40.6
38.9
40.3
41.6
43.0
44.3
41.4
42.8
44.2
45.6
46.9
21
22
23
24
25
26
27
28
29
30
11.16
11.81
12.46
13.12
13.79
12.20
12.88
13.56
14.26
14.95
13.84
14.57
15.31
16.05
16.79
15.38
16.15
16.93
17.71
18.49
17.29
18.11
18.94
19.77
20.6
20.8
21.7
22.7
23.6
24.5
25.3
26.3
27.3
28.3
29.3
30.4
31.5
32.6
33.7
34.8
35.6
36.7
37.9
39.1
40.3
38.9
40.1
41.3
42.6
43.8
41.9
43.2
44.5
45.7
47.0
45.6
47.0
48.3
49.6
50.9
48.3
49.6
51.0
52.3
53.7
26
27
28
29
30
40
50
60
70
20.7
28.0
35.5
43.3
22.2
29.7
37.5
45.4
24.4
32.4
40.5
48.8
26.5
34.8
43.2
51.7
29.1
37.7
46.5
55.3
33.7
42.9
52.3
61.7
39.3
49.3
59.3
69.3
45.6
56.3
67.0
77.6
51.8
63.2
74.4
85.5
55.8
67.5
79.1
90.5
59.3
71.4
83.3
95.0
63.7
76.2
88.4
100.4
66.8
79.5
92.0
104.2
40
50
60
70
80
90
100
51.2
59.2
67.3
53.5
61.8
70.1
57.2
65.6
74.2
60.4
69.1
77.9
64.3
73.3
82.4
71.1
80.6
90.1
79.3
89.3
99.3
88.1
98.6
109.1
96.6
107.6
118.5
101.9
113.1
124.3
106.6
118.1
129.6
112.3
124.1
135.8
116.3
128.3
140.2
80
90
100
-2.58
-2.33
-1.96
-1.64
-1.28
-0.674
0.000
0.674
1.282
1.645
1.96
2.33
2.58
1
2
3
4
5
Z
Para
Z
2I
. Z
xm
yn
Hip
otesis sobre los datos
I
Objetivo
Calcular un IC para 1 2 .
Ejemplo
Se han determinado los valores de epicatequina (una sustancia
fenolica) en 10 muestras de vino tinto, encontrando que la media
muestral era 195.1 mg/l y el error tpico 10.051. Los
correspondientes valores para 10 muestras de cerveza fueron 65.5
mg/L y 3.4184. Se desea calcular un IC de nivel 95% para la
diferencia del contenido medio de epicatequina en el vino y en la
cerveza.
En
este ejemplo, m = n= 10, x = 195.1, y = 65.5,
s1 / 10 = 10.051 y s2 / 10 = 3.4184.
El centro del intervalo es x y = 129.6.
Vamos a ver como se determina correctamente el margen de error.
1
1
+
n1 n2
Ejemplo (cont.)
Estimador combinado de la varianza:
9 31.78412 + 9 10.80992
= 563.5415
18
Ejemplo
Se quieren comparar los efectos X de un nuevo medicamento con
Y , los de otro ya comercializado. Se administran ambos a 14
personas con insuficiencia respiratoria, asignando aleatoriamente a
cada paciente un tratamiento, y manteniendolo durante un mes.
Luego se le da el tratamiento alternativo durante otro mes. En la
cuarta semana de cada tratamiento se observa la FEV1 (forced
expiratory volume), el volumen de aire que un paciente expulsa en
un segundo, tras una inhalaci
on profunda.
Paciente
1
2
3
4
5
6
7
X
2.9
4.0
3.4
3.2
3.8
5.2
3.9
Y
3.9
3.9
3.3
4.3
3.2
3.5
2.7
D
-1.0
0.1
0.1
-1.1
0.6
1.7
1.2
Paciente
8
9
10
11
12
13
14
X
3.9
2.5
6.5
5.5
4.0
5.3
4.3
Y
2.4
3.6
2.1
4.0
3.9
4.0
2.3
D
1.5
-1.1
4.4
1.5
0.1
1.3
2.0
X = N p1 ,
m
e Y
= N p2 ,
p2 (1 p2 )
n
y p2 = Y .
donde p1 = X
El IC para la diferencia de proporciones p1 p2 es
"
#
r
x(1 x) y (1 y )
IC1 (p1 p2 ) (
x y ) z/2
+
m
n
(aproximadamente, para m y n grandes).
Ejemplo
Se ha estudiado la prevalencia de caries en un grupo de ni
nos que
siguieron un plan de prevenci
on de la enfermedad y en otro grupo
de ni
nos que no siguieron el plan y que fueron seleccionados como
control. Los datos son los siguientes:
Grupo control
Grupo prevencion
Ni
nos con caries
10
6
Ni
nos sin caries
26
32
Tablas de la distribucion F
n2
1
1 161
4052
2 18.51
98.50
3 10.13
34.12
4 7.71
21.20
5 6.61
16.26
6 5.99
13.75
7 5.59
12.25
8 5.32
11.26
9 5.12
10.56
10 4.96
10.04
2
199
4999
19.00
99.00
9.55
30.82
6.94
18.00
5.79
13.27
5.14
10.92
4.74
9.55
4.46
8.65
4.26
8.02
4.10
7.56
3
216
5404
19.16
99.16
9.28
29.46
6.59
16.69
5.41
12.06
4.76
9.78
4.35
8.45
4.07
7.59
3.86
6.99
3.71
6.55
4
225
5624
19.25
99.25
9.12
28.71
6.39
15.98
5.19
11.39
4.53
9.15
4.12
7.85
3.84
7.01
3.63
6.42
3.48
5.99
5
230
5764
19.30
99.30
9.01
28.24
6.26
15.52
5.05
10.97
4.39
8.75
3.97
7.46
3.69
6.63
3.48
6.06
3.33
5.64
6
234
5859
19.33
99.33
8.94
27.91
6.16
15.21
4.95
10.67
4.28
8.47
3.87
7.19
3.58
6.37
3.37
5.80
3.22
5.39
n2
30
250
6260
19.46
99.47
8.62
26.50
5.75
13.84
4.50
9.38
3.81
7.23
3.38
5.99
3.08
5.20
2.86
4.65
2.70
4.25
40
251
6286
19.47
99.48
8.59
26.41
5.72
13.75
4.46
9.29
3.77
7.14
3.34
5.91
3.04
5.12
2.83
4.57
2.66
4.17
50
252
6302
19.48
99.48
8.58
26.35
5.70
13.69
4.44
9.24
3.75
7.09
3.32
5.86
3.02
5.07
2.80
4.52
2.64
4.12
75
253
6324
19.48
99.48
8.56
26.28
5.68
13.61
4.42
9.17
3.73
7.02
3.29
5.79
2.99
5.00
2.77
4.45
2.60
4.05
100
253
6334
19.49
99.49
8.55
26.24
5.66
13.58
4.41
9.13
3.71
6.99
3.27
5.75
2.97
4.96
2.76
4.41
2.59
4.01
200
254
6350
19.49
99.49
8.54
26.18
5.65
13.52
4.39
9.08
3.69
6.93
3.25
5.70
2.95
4.91
2.73
4.36
2.56
3.96
500
254
6360
19.49
99.50
8.53
26.15
5.64
13.49
4.37
9.04
3.68
6.90
3.24
5.67
2.94
4.88
2.72
4.33
2.55
3.93
254
6366
19.50
99.50
8.53
26.13
5.63
13.46
4.37
9.02
3.67
6.88
3.23
5.65
2.93
4.86
2.71
4.31
2.54
3.91
1
2
3
4
5
6
7
8
9
10