Sei sulla pagina 1di 38

Intervalos de Confianza

M. C. Jos Juan Rincn Pasaye


UMSNH FIE Mayo de 2003
Contenido
Estimacin de parmetros
Estimacin de intervalos
Intervalo de confianza para la media
Intervalo de confianza para la varianza
Otros Intervalos de Confianza
Intervalos de tolerancia
Ints. de confianza y regresin lineal
UMSNH-FIE
Estimacin de Parmetros
Parmetros poblacionales y Estadsticos Muestrales
UMSNH - FIE
Datos
(Poblacin de Inters)
Muestras
-4 -2 0 2 4
0
20
40
60
80
100
120
140
160
Histograma de la Poblacion
Clases
F
r
e
c
u
e
n
c
i
a
-4 -2 0 2 4
0
2
4
6
8
10
12
14
16
Histograma de la Muestra
Clases
F
r
e
c
u
e
n
c
i
a
Parmetros:
Media ()
Varianza(o
2
)
Desv. Est. (o)
Etc.
Estadsticos:
Promedio ( )
Varianza muestral(S
2
)
Desv. Est. muestral(S)
Etc.
Inferencias
Muestreo
X
Estimacin de Parmetros
Ejemplo: Estimacin de la media de una poblacin
UMSNH - FIE
Estimador: La media muestral ( ) que se calcula a partir de una muestra de
N datos como sigue:
X
) x ... x (x
N
1
N 2 1
____
X
+ + + =
Parmetro que se pretende estimar : La media de la poblacin ( ) que en
general no se conoce, no se puede conocer, o se conoce slo un valor terico:
El estimador (en el ejemplo la media muestral) puede tomar diferentes
valores (aleatorios) dependiendo de la muestra (aleatoria) considerada, es
decir, el estimador es una variable aleatoria
Es natural preguntarse : Cul ser la distribucin de probabilidad del
estimador? De hecho cules sern sus parmetros? tendrn que ver con los
de la poblacin?
Estimacin de Parmetros
Ejemplo: Lanzamiento de un dado
UMSNH - FIE
Estimador: La media muestral ( ) X ) x ... x (x
N
1
N 2 1
____
X
+ + + =
Poblacin de inters : El conjunto de datos obtenidos al lanzar un dado legal
en diversas ocasiones
Parmetro de inters : La media () de la poblacin
Experimento aleatorio : Lanzar un dado
Variable aleatoria X= nmero obtenido en la cara superior
Espacio muestral = {1, 2 , 3, 4, 5 , 6}
Distribucin de la variable aleatoria X: Uniforme
Media terica: =3.5
Estimacin de Parmetros
Ejemplo: Lanzamiento de un dado
UMSNH - FIE
Distribucin de la variable aleatoria (X) del experimento
Funcin de Probabilidad: f(x) = P(X=x)
x 1 2 3 4 5 6
f(x) 1/6 1/6 1/6 1/6 1/6 1/6
1 2 3 4 5 6
0
0.05
0.1
0.15
0.2
x
f
(
x
)

Funcin de Probabilidad

Estimacin de Parmetros
Ejemplo: Lanzamiento de un dado
UMSNH - FIE
Distribucin del estadstico .
Muestra
x
1
x
2
x
3
x
4
x
5
x
6
x
7
x
8
x
9
x
10
1 1 3 5 1 1 2 2 4 2 2 2.1
2 1 5 3 6 3 3 6 4 2 5 3.8
3 6 1 5 3 5 4 5 3 2 2 3.2
4 2 5 2 4 1 5 3 6 6 4 3.8
5 3 6 5 4 5 4 3 2 3 4 3.7
... ...
X
X
X
Cada muestra puede considerarse como:
10 valores de la variable aleatoria X,
1 slo valor para 10 variables aleatorias X
1
,X
2
,...,X
10
Diferentes clculos de para N=10:
Estimacin de Parmetros
Ejemplo: Lanzamiento de un dado
UMSNH - FIE
Distribucin del estadstico . X
X Si obtenemos 1000 muestras, obtendremos 1000 valores de , para
estos 1000 valores realizamos el histograma:
1 2 3 4 5 6
0
0.05
0.1
0.15
0.2
0.25
X
f
r
e
c
u
e
n
c
i
a

r
e
l
a
t
i
v
a

Distribucin de la media muestral
Estimacin de Parmetros
Ejemplo: Lanzamiento de un dado
UMSNH - FIE
Cdigo en Matlab:
%se simula el dado
x=round(rand(N,n)*6+0.5);
M=sum(x)/N;
[X,c]=hist(M,15);
%se grafica el histograma de frecuencia relativa en p.u.
X=X/n;
bar(c,X)
Recordatorio: Cada muestra puede considerarse como:
10 valores de la variable aleatoria X,
1 slo valor para 10 variables aleatorias X
1
,X
2
,...,X
10
Estimacin de Parmetros
En general: un estadstico que pretende estimar un parmetro
u es una v. a. Que depende de las N variables aleatorias que
forman una muestra, es decir
UMSNH - FIE
O
^
O
^
= f(X
1
,X
2
,...,X
N
)
As, una muestra es un conjunto de valores (x
1
,x
2
,...,x
N
) tomados
por las variables aleatorias (X
1
,X
2
,...,X
N
).
O
^
u
^
u
^
Es natural suponer que la distribucin f(X
i
)=P(X
i
=x
i
) de cada
variable de la muestra es igual a la de la poblacin
Sin embargo, la distribucin f( ) = P( = ) del estadstico
como se vi en el ejemplo del dado es otra cosa.
Estimacin de Intervalos
En la explicacin previa, un estimador produce un valor
que pretende aproximar a un parmetro u. A este enfoque se le
llama estimacin puntual
UMSNH - FIE
O
^
En el enfoque de estimacin de intervalos, para un parmetro u
no se estima un valor, sino un intervalo de la forma l s u s u,
donde los valores extremos l, u dependen del valor numrico del
estadstico para una muestra en particular y de la distribucin
de muestreo de
O
^
u
^
u
^
Es decir, l,u dependen de la muestra, por lo tanto son valores de
variables aleatorias L, U
Estimacin de Intervalos
Partiendo de la distribucin de muestreo para , es posible
determinar valores de L,U tales que se cumpla lo siguiente:
UMSNH - FIE
P(L s u s U) =1 o
Donde 0 < o < 1
Es decir, se puede garantizar con una probabilidad de 1-o que
la muestra elegida contendr el valor verdadero de u
O
^
Al intervalo resultante l s u s u se le conoce como el intervalo
de confianza del 100(1 o) para el parmetro desconocido u
Estimacin de Intervalos
Ejemplo: Construccin repetida de un intervalo de confianza
para la media :
UMSNH - FIE
Si los intervalos de confianza mostrados son del 95% significa
que si se construye un gran nmero de ellos, el 95% de ellos
contendr a la media

Estimacin de Intervalos
En la prctica se obtiene solamente una muestra y se calcula con
ella un intervalo de confianza dicho intervalo contiene o no
contiene a , no es razonable asignar una probabilidad a este
evento.
UMSNH - FIE
La proposicin a decuada es que el intervalo contiene a con
una confianza del 95%
La longitud del intervalo de confianza (u-l) es una medida de la
calidad de la informacin obtenida en la muestra, al semi
intervalo u-u, o u-l se le llama Precisin del estimador.
Qu significado tiene un intervalo grande?
s deseable que sea grande o que sea pequeo?
Qu relacin tiene con el valor de 1-o?
Estimacin de Intervalos
Intervalo para la Media (Varianza conocida)
UMSNH - FIE
Situacin: Se tiene una poblacin con media desconocida , pero
se supone conocida la varianza o
2
.
Se toma una muestra aleatoria (X
1
,X
2
,...,X
N
). Con esta muestra
se calcula el estadstico el cual es un estimador puntual
insesgado para la media desconocida. Se puede obtener un
intervalo de confianza del 100(1-o) % para si consideramos
los siguientes hechos acerca de la distribucin de :
X
X
Intervalo para la media
Intervalo para la Media (Varianza conocida)
UMSNH - FIE
1. Si la poblacin es Normal, la distribucin de es Normal

2. Si la poblacin no es Normal, el Teorema del lmite central nos
garantiza una distribucin de aproximadamente normal
cuando N

3. La media de es ( es insesgado)

4. La varianza de es o
2
/N
Teorema del Lmite Central:
Afirma que la media muestral tiene una distribucin Normal
aunque la poblacin original no la tenga, siempre y cuando la
muestra sea muy grande (de manera prctica N>30)
X
X
X
X
X
Intervalo para la media
Intervalo para la Media (Varianza conocida)
UMSNH - FIE
De acuerdo a lo anterior, podemos suponer que la variable


Tiene una distribucin N(0,1)

de la figura: P{-z
o/2
s Z s z
o/2
}=1-o.
Con lo cual el intervalo de confianza del 100(1-o)% para la media es
N /

X
___
Z

=
-z
o/2
z
o/2
Z
o/2 o/2
N / z N / z
/2
__
/2
__
x x
+ s s
Intervalo para la media
Intervalo para la Media (Varianza conocida)
UMSNH - FIE
Ejemplo: Los siguientes son datos de conductividad trmica de cierto tipo de
hierro (en BTU/hr-ft-F):
41.60 41.48 42.34 41.95 41.86
42.18 41.72 42.26 41.81 42.04
Una estimacin puntual para la media, es = 41.924. Hallar un intervalo de
confianza del 95 % y uno del 99% para la media.
Se supone que la poblacin tiene una distribucin Normal con o=0.3
Usamos la expresin para encontrar el
intervalo de confianza para la media: Usando Matlab para calcular z
o/2
=
norminv(0.025,0,1)
l = 41.924 - 1.96(0.3)/\10 = 41.738, u = 41.924+1.96(0.3)/\10 = 42.110
Entonces el intervalo de confianza del 95% es
41.738 s s 42.11
Y la longitud de este intervalo es 3.92o/ \N
N / z N / z
/2
__
/2
__
x x
+ s s
X
Intervalo para la media
Intervalo para la Media (Varianza conocida)
UMSNH - FIE
Seleccin del tamao de la muestra:
La precisin del intervalo de confianza es z
o/2
o/\N esto significa
que al usar para estimar , el error de estimacin, dado por
E=| - | es menor o igual que z
o/2
o/\N, con una confianza de
100(1-o)%.
El problema inverso consiste en calcular N para obtener un error
E con una confianza del 100(1-o)% previamente especificado:
N
1/2
= z
o/2
o/E
X
X
Ejercicio: Calcular el tamao adecuado de la muestra para lograr
que el error de estimacin de conductividad del hierro sea menor
de 0.05 Btu/hr-ft-F con una confianza del 95%
Intervalo para la media
Intervalo para la Media (Varianza desconocida)
UMSNH - FIE
Si no se conoce la varianza o
2
de la poblacin, una posibilidad es
utilizar la varianza muestral S
2
en las ecuaciones obtenidas para
estimar intervalos en el caso de varianza conocida

Este procedimiento funciona para muestras grandes (N>30), por
ello los intervalos de confianza anteriores se les suele llamar
intervalos de confianza para muestras grandes.
Si las muestras son pequeas el enfoque anterior no funciona y
para lograr un procedimiento vlido se supondr que la poblacin
tiene una distribucin Normal
Intervalo para la media
Intervalo para la Media (Varianza desconocida)
UMSNH - FIE
Si la poblacin es Normal, la siguiente estadstica



Tiene una distribucin t con N-1 grados de libertad
T=
X
S/ N
-t
o/2,N-1
t
o/2,N-1
T
o/2 o/2
Intervalo para la media
Intervalo para la Media (Varianza desconocida)
UMSNH - FIE
de la figura: P{-t
o/2,N-1
s T s t
o/2,N-1
}=1-o. Con lo cual el
intervalo de confianza del 100(1-o)% para la media es
T=
X
S/ N
-t
o/2,N-1
t
o/2,N-1
T
o/2 o/2
x t
/2,N1
s/ N x + t
/2,N1
s/ N
Ejercicio: Repetir el ejemplo de la conductividad del hierro
suponiendo que no se conoce la varianza
Intervalo para la Varianza
Intervalo para la Varianza de una distribucin
Normal
UMSNH - FIE
Si la Poblacin es Normal, la distribucin muestral del estadstico
siguiente

Donde S
2
es la varianza muestral usada como estimador puntual de o
2
Es de tipo Ji-cuadrada con N-1 grados de libertad
X = (N 1)
S
2

2
0 _
2
o/2,N-1
_
2
1o/2,N-1
X
o/2 o/2
Intervalo para la Varianza
Intervalo para la Varianza de una distribucin Normal
UMSNH - FIE
De acuerdo a la figura, P(_
2
1-o/2,N-1
s X s _
2
o/2,N-1
) = 1-o
Por lo tanto, el intervalo de confianza del 100(1-o)% buscado
para la varianza es
X = (N 1)
S
2

2
0 _
2
o/2,N-1
_
2
1o/2,N-1
X
o/2 o/2
(N 1)s
2

1/2,N1
2

2

(N 1)s
2

/2,N1
2
Ejercicio: Hallar el intervalo de confianza del 95% para la
varianza en el ejemplo de la conductividad del hierro
Intervalo para la Varianza
Intervalo para la Varianza de una distribucin Normal
UMSNH - FIE
Intervalos de confianza unilaterales.- En el caso de la varianza es
ms comn buscar cotas inferiores o superiores que ambas a la vez
(N 1)s
2

1,N1
2

2
Intervalo de confianza inferior.- Se obtiene reemplazando el lmite
superior por y _
2
1o/2,N-1 por
_
2
1o,N-1
, obteniendo:
Intervalo de confianza superior.- En forma similar, se reemplaza el
lmite inferior por 0 y _
2
o/2,N-1 por
_
2
o,N-1
, obteniendo:

(N 1)s
2

,N1
2
Intervalo para la Varianza
Intervalo para la Varianza de una distribucin Normal
UMSNH - FIE
Ejercicio: Un fabricante de detergente lquido est interesado
en la efectividad de su proceso para llenar envases de
detergente. La norma dice que no se debe tener una desviacin
estndar o en el proceso mayor de 0.15, ya que de lo contrario
habr envases ms vacos de lo permitido.
Se toma una muestra aleatoria de 20 envases y se obtiene una
varianza muestral s
2
=0.0153 onzas
2
. Es esta medicin una
evidencia de que se est cumpliendo la norma con una
confianza del 95% ?

Sugerencia: se puede usar la funcin chi2inv de Matlab
Otros intervalos de Confianza
Intervalo de confianza para una Proporcin
UMSNH - FIE
Se toma una muestra de tamao N de una poblacin muy grande y
resulta que X datos de la muestra pertenecen a alguna clase de
inters. Entonces un estimador puntual de la proporcin p de los
datos de la poblacin que pertenecen a la clase en cuestin es:
Ntese que N y p son los parmetros de una distribucin binomial
La distribucin de muestreo de se puede considerar
aproximadamente Normal con media p y varianza p(1-p)/N,
siempre que p no est muy cerca de 0 o de 1 y si N es
relativamente grande
P
^
P=X/N
^
Otros intervalos de Confianza
Intervalo de confianza para una Proporcin
UMSNH - FIE
De lo anterior, la distribucin de la variable


Es aproximadamente N(0,1)
Entonces, partiendo de P{-z
o/2
s Z s z
o/2
}=1-o
Obtenemos el siguiente intervalo de confianza aproximado del
100(1-o)% para la proporcin p de la poblacin que pertenece a la
clase dada:
Z =
Pp
p(1p)
N
p z
/2
p(1p)
N
p p + z
/2
p(1p)
N
Otros intervalos de Confianza
Intervalo de confianza para una Proporcin
UMSNH - FIE
Ejemplo: De 1000 casos de cncer pulmonar seleccionados al
azar, 823 son de pacientes que fallecieron. Construya un intervalo
de confianza del 95% para la tasa de mortalidad del cncer
pulmonar
Solucin: La tasa de mortalidad es la proporcin de los que
mueren a los que contraen el cncer pulmonar, de la muestra
tenemos que = 0.823. Por otro lado z
0.025
=1.96, entonces:


Es decir, 0.799 sps0.847
0.823 1.96
0.823(10.823)
1000
p 0.823 + 1.96
0.823(10.823)
1000
p
^
Otros intervalos de Confianza
Intervalo de confianza para el cociente de varianzas de dos
distribuciones Normales
UMSNH - FIE
Situacin: Se tienen dos poblaciones normales e independientes
con varianzas desconocidas o
1
2
, o
2
2
respectivamente. Se tienen
disponibles dos muestras aleatorias de tamaos N
1
, N
2
una de
cada poblacin respectivamente. Sean S
1
2
S
2
2
las varianzas
muestrales respectivas. Se busca un intervalo de confianza del
100(1-o)% del cociente de varianzas o
1
2
/ o
2
2
Para hallar el intervalo de confianza se debe recordar que la
distribucin de muestreo del estadstico siguiente


Es de tipo F con N
2
-1 y N
1
-1 grados de libertad en el numerador y
denominador respectivamente. (Ver la figura siguiente)
F =
S
2
2
/
2
2
S
1
2
/
1
2
Otros intervalos de Confianza
Intervalo de confianza para el cociente de varianzas de dos
distribuciones Normales
UMSNH - FIE
As, de la figura: P{f
o/2,N2-1,N1-1
s F s f
1o/2,N2-1,N1-1
}=1-o
Por lo tanto, el intervalo de confianza buscado es:
F =
S
2
2
/
2
2
S
1
2
/
1
2
0 f
o/2,N2-1,N1-1
f
1o/2,N2-1,N1-1
F
o/2 o/2
S
1
2
S
2
2
f
/2,N
2
1,N
1
1

1
2

2
2

S
1
2
S
2
2
f
1/2,N
2
1,N
1
1
f
/2,N
2
1,N
1
1
=
1
f
1/2,N
2
1,N
1
1
Otros intervalos de Confianza
Intervalo de confianza para el cociente de varianzas de dos
distribuciones Normales
UMSNH - FIE
Ejemplo: Una compaa fabrica piezas para turbinas. Tiene dos procesos distintos para
hacer el esmerilado de las piezas y ambos procesos producen terminados con la misma
rugosidad promedio. El ingeniero del proceso desea seleccionar el proceso con la menor
variabilidad en la rugosidad de la superficie. Para ello toma una muestra de 12 piezas
del primer proceso, obteniendo una desviacin estndar muestral s
1
= 5.1 micropulgadas,
luego toma una muestra de 15 piezas del segundo proceso, obteniendo s
2
= 4.7. Puede
elegir el primer poceso con una confianza del 90% de tener menor variabilidad en la
rugosidad?
Solucin: Suponiendo que los dos procesos son Normales e independientes.
Usando la funcin finv de Matlab, obtenemos f
0.95
=2.7386 y f
0.05
=0.3898, por
lo tanto,

Haciendo operaciones:
Como el intervalo incluye la unidad, no se puede concluir que los procesos
tengan variabilidad sgnificativamente diferente con una confianza del 90%
5.1
2
4.7
2
(0.3898)
1
2
/
2
2

5.1
2
4.7
2
(2.7386)
0.46
1
2
/
2
2
3.23
Otros intervalos de Confianza
Resumen de intervalos de confianza
UMSNH - FIE
Parmetros de inters Suposiciones
La media
Dist. Muestral Normal (o N grande) o
2
conocida
o
2
desconocida (Dist. Muestral T)
La varianza o
2
Dist. Normal (Dist. Muestral Ji
2
)
Proporcin p Dist. Muest. Normal (N grande, p alejado de 0 y de 1)
Cociente de varianzas
o
1
2
/o
2
2
Dos poblaciones Normales e independientes (Dist.
Muestral tipo F)
Diferencia de medias

2
Distribuciones
normales,
o
1
2
y o
2
2
conocidas
o
1
2
= o
2
2
desconocidas (Dist muest T)
o
1
2
= o
2
2
desconocidas (Dist muest T)
Diferencia entre dos
proporciones p
1
-p
2
Dist. Muestral Normal (N
1
y N
2
grandes, p
1
y p
2

alejados de 0 y de 1)
Otras... (Ver libros de estadstica)
Intervalos de Tolerancia
Concepto
UMSNH - FIE
En ocasiones no nos interesa estimar algn parmetro, sino
establecer un rango en donde se puede esperar que caigan
observaciones (datos) individuales en un proceso.
La respuesta es muy sencilla si se conoce la distribucin y los
parmetros de la poblacin, por ejemplo, si se obtuvo una muestra
aleatoria de una poblacin Normal con media y varianza o
2

conocidas, se esperar que el 95% de los datos caern entre los
lmites
1.96o
A este intervalo se le llama intervalo de tolerancia y si y o son
conocidos la cobertura del 95% es exacta
Intervalos de Tolerancia
Concepto
UMSNH - FIE
Si y o son desconocidos a veces se puede determinar una
constante k tal que los lmites ko constituyan un intervalo de
tolerancia para una distribucin normal
En este caso los lmites del intervalo son variables aleatorias y la
proporcin de datos cubierta por el intervalo no es exacta.
Entonces se debe introducir un intervalo de confianza para la
proposicin de los lmites del intervalo de tolerancia.
En la bibliografa se pueden consultar tablas para elegir estos
lmites dada una confianza deseada para el caso Normal.
x
Intervalos de Confianza y Regresin Lineal
Intervalo de Confianza para la Respuesta Media
UMSNH - FIE
En la regresin lineal se supone un modelo de la forma
y = mx + b
Para describir la respuesta y del proceso bajo la entrada x
Para una muestra de N puntos (valores de x, y) se calculan valores
estimados m, b de m, b resolviendo las ecuaciones normales, de
manera que se obtiene un modelo estimado y = mx + b
Se puede encontrar un intervalo de confianza para la respuesta
media
y/xo
dado un valor x
0
como se explica a continuacin
As, para un dato x
0
, se puede estimar una prediccin puntual para

y/xo
(respuesta media) mediante:
y/xo
= mx
0
+ b
^ ^
^ ^
^
^ ^
^
Intervalos de Confianza y Regresin Lineal
Intervalo de Confianza para la Respuesta Media
UMSNH - FIE
Un intervalo de confianza alrededor de la respuesta media
y/xo

del 100(1-o)% para el valor de x=x
0
est dado por:


Donde
y/xo
se calcula a partir del modelo de regresin estimado
Adems, o
2
= E(y
i
- (m x
i
+b) )
2
/(N-2) y S
xx
= E(x
i
-x)
2
.
Obsrvese que el ancho de este intervalo de confianza es mnimo
para x
0
= x y crece a medida que |x
0
- x| aumenta. En la siguiente
grfica se muestra un comportamiento tpico de este intervalo
^
_
_

Yx
0
t
/2

2
1
N
+
(x
0
x)
2
S
xx

Yx
0

Yx
0
+ t
/2

2
1
N
+
(x
0
x)
2
S
xx
_
^
^
Intervalos de Confianza y Regresin Lineal
Intervalo de Confianza para la Respuesta Media
UMSNH - FIE
Recta de regresin
Puntos experimentales
Lmites del intervalo de confianza
para la respuesta media
Observacin: Estos lmites de intervalo estn basados en los puntos experimentales
dados, no se pueden usar para predecir intervalos sobre datos nuevos. A los lmites
para nuevos datos se les llama lmites de prediccin y son ms amplios que los lmites
para la respuesta media

Potrebbero piacerti anche