Sei sulla pagina 1di 35

Mdulo 1

Unidad 1
Lectura 1
Inferencia Estadstica









Materia: Herramientas Matemticas V Estadstica II
Profesora: Mgter. Vernica Herrero

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|2


Unidad 1: Estimadores

1.1. Estimacin

La mayora de las aplicaciones actuales de la Estadstica se relacionan con
la obtencin de conclusiones referidas a la poblacin a partir de la evidencia
recogida en una muestra correspondiente a una pequea porcin de casos,
en situaciones prcticas como las siguientes:

Analizar la evolucin del total de desempleados en las grandes
ciudades de un pas
Medir el gasto promedio de las familias en cierto rubro de inters
Cuantificar la variabilidad de un producto surgido de cierto proceso
industrial estandarizado.
Conocer el porcentaje de votantes que prefieren a cierto candidato
con anterioridad a una eleccin

Las tcnicas correspondientes a la Inferencia estadstica permiten dar
respuesta a estos interrogantes, utilizando slo una pequea porcin de
casos de la poblacin de inters. Para los objetivos de informacin
propuestos como ejemplos previamente, podran tomarse muestras de las
poblaciones:

Seleccionando individuos residentes en las ciudades de inters, y
registrando su estado ocupacional.
Obteniendo por muestreo un conjunto de familias, y consultndolas
sobre el gasto en ese rubro.
Estudiando por muestreo la caracterstica de anlisis de un grupo de
productos elaborados en tal sistema.
Indagando a un conjunto representativo de votantes del lugar en
cuestin.

Como primer paso en este estudio de la Estadstica inferencial, nos
detendremos en este mdulo en las diferentes tcnicas que permiten dar
considerado plausible acerca de un valor de un parmetro poblacional de
inters (tales como la media poblacional, la varianza poblacional, la
proporcin poblacional, o las diferentes entre medias o entre proporciones).
Bibliografa Bsica
Para cumplir con los
objetivos de la Unidad 1
del programa, es necesario
profundizar en los temas
desarrollados en el
Captulo 9 y 10 del texto
de Bibliografa Bsica.
(Berenson & Levine,
1996), relacionndolos
con los comentarios,
ejemplos y
recomendaciones de las
lecturas del mdulo.

Captulos: 9 y 10
(Apartados 10.1, 10.2, 10.3,
10.4, 10.5, 10.6, 10.7,
10.8,10.9)

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|3



1.1.1 Parmetros y estadgrafos

En primer lugar, recordemos la diferencia entre Parmetro y Estadgrafo.

Los parmetros son las medidas de resumen poblacionales que permiten
describir el conjunto de datos analizados. Ejemplos de parmetros son la
media poblacional, la varianza poblacional, etc.

Los estadgrafos son las medidas anlogas obtenidas a partir de datos
muestrales. Este tipo de medida incluye a la media muestral, la varianza
muestral, la proporcin muestral, entre otras. Estos valores, tambin
conocidos como estimadores, se utilizan para proporcionar una idea del
valor de la medida poblacional correspondiente, pero considerando slo
datos muestrales.

1.1.1.1 Estimadores: caractersticas de un
buen estimador

Comenzaremos estudiando la media muestral, el estimador natural de la
media poblacional, que es la medida de tendencia central ms utilizada. La
medida a su vez, es la medida ms adecuada para describir un conjunto de
datos que se distribuye siguiendo el modelo normal.

Las tres propiedades que nos interesa destacar de la media muestral como
estimador de la media poblacional son:
1. Imparcialidad (insesgada)
2. Eficiencia
3. Consistencia

Imparcialidad
Decimos que un estimador es imparcial o insesgado cuando su valor
esperado coincide con el parmetro poblacional que estima.
En el caso de la media muestral, esta propiedad se demuestra muy
fcilmente con unos pocos pasos algebraicos:

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|4


Partiendo de la frmula de clculo de la media muestral, estudiada en el
curso anterior de estadstica:

n
x
x
n
i
i
=
=
1


La esperanza o valor esperado de la media muestral es:

=

=
n
x
E x E
n
i
i
1
) (

Como la esperanza de una constante es la constante, resulta:
n
x E
x E
n
i
i

=

=1
) (
Como la esperanza de una suma es igual a la suma de las esperanzas:
n
x E
x E
n
i
i

=

=1
) (
) (

Y como sabemos que la esperanza de la variable estudiada es :

n
n
x E
.
) ( =
Simplificando resulta:

= ) (x E

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|5




Eficiencia

Un estimador es eficiente si en promedio se acerca ms al parmetro
estimado que cualquier otro estimador.

La media muestral cumple este requisito para la media poblacional, ya que
tiene la mnima varianza entre los estimadores de la media poblacional.

Consistencia

Decimos que un estimador es consistente si a medida que se aumenta el
tamao de la muestra, el estimador se aproxima sistemticamente al valor
del parmetro poblacional.

Al aumentar el tamao de la muestra, cada vez, las diferencias entre la
media muestral y la media poblacional se van haciendo ms reducidas.

El cumplimiento de estas propiedades hace de la media muestral el mejor
estimador de la media poblacional.

Error estndar de la media
Es intuitivamente fcil de visualizar que a medida que mayor es la muestra
(es decir, ms elementos de la poblacin se incluyen para estimar la media
muestral), menor ser la dispersin de los valores respecto de la media
muestra, ya que el efecto de un valor extremo tiende a diluirse a medida que
ms elementos se toman en consideracin para el clculo.
Por esto, la desviacin estndar de la media muestral, conocido como error
estndar de la media, se relaciona de la siguiente manera con la desviacin
estndar poblacional:
n
x
x

=
Error estndar de la
media
Es el nombre que recibe la
desviacin estndar de
la media muestral. Es
decir, es la desviacin
estndar de la distribucin
de muestreo de la media.

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|6



Como puede observarse, la frmula anterior refleja la relacin indicada
entre la dispersin de la muestra y el tamao muestral.
Distribucin en el muestreo de la proporcin
Para las variables categricas, en las cuales es registra la posesin o no de
una caracterstica, el parmetro poblacional de inters es la proporcin, que
indica justamente qu parte de la poblacin posee una caracterstica.
Por ejemplo, si en una poblacin de 10.000 individuos, 2400 tiene ojos
claros, decimos que

N
X
P =
10000
2400
= P
es la proporcin de individuos con ojos claros en la poblacin.

Donde X es la cantidad de casos de la poblacin que tienen la caracterstica,
conocidos habitualmente como xitos. N es el tamao de la poblacin.

El estimador de P ser p, la proporcin muestral. Para obtener p:


n
x
p =

Donde x es la cantidad de xitos en la muestra, y n es el tamao de la
muestra.

Como puede observarse la proporcin se ubica en el intervalo [0,1], siendo
los extremos del intervalo las situaciones extremas en las que ningn
individuo posee la caracterstica o bien, cuando la poseen todos. Estos dos
casos extremos son los que implican la menor dispersin entre los
individuos (ya que por tener o por no tener la caracterstica, los individuos
Distribucin de
muestreo de un
estimador
La distribucin de
probabilidades de los
valores posibles que
puede asumir un
estadstico muestral,
calculados a partir de
muestras del mismo
tamao y extrado en forma
aleatoria de la misma
poblacin, se llama
distribucin muestral de
ese estadstico.

Por ejemplo, puede ser la
distribucin de muestreo
de la media como vimos
en el punto anterior, o de
la proporcin, entre
otros.

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|7

se parecen), y en cambio, la mayor dispersin ocurre en los valores


intermedios (cuando p=0,5), ya que es mxima la cantidad de individuos
que difieren de p.

n
P P
p
) 1 (
=

La distribucin muestral de la proporcin sigue una distribucin
binomial, que puede aproximarse a la normal cuando se cumplen las
siguientes condiciones:

5 > np
y
5 ) 1 ( > p n

Estas condiciones implican requerimientos de muestras de tamao
considerables para las estimaciones de proporciones.

Muestreo de poblaciones finitas

Cuando se selecciona una muestra, debe establecerse con precisin cul fue
el mecanismo con el que se procedi a escoger a los elementos que
componen la muestra.

El diseo bsico que est implcito en muchos de los desarrollos estadsticos
supone que los elementos fueron seleccionados con reemplazo. Esto
implica que una vez que se seleccion un individuo o elemento, ste vuelve
a formar parte de los casos seleccionables, por lo que la probabilidad de
seleccin de los distintos casos no cambia a medida que se va construyendo
la muestra.

En diversas situaciones de aplicacin de muestreo esto no ocurre de esta
manera por diferentes razones. Por ejemplo, cuando realizamos una
encuesta para un estudio de mercado, no tiene demasiado sentido encuestar
dos veces al mismo individuo en un estudio; incluso en ocasiones, como las

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|8

aplicaciones para control de calidad, pueden implicar la destruccin del


caso seleccionado en la muestra, tal como cuando se analiza la duracin de
una pieza, por lo que difcilmente en tales casos usemos un muestreo con
reposicin.

En todas estas situaciones debemos introducir una correccin a las
frmulas que ajuste la diferente probabilidad de seleccin que tienen los
sucesivos casos que integran la muestra.

Esta correccin se conoce como factor de correccin para poblaciones
finitas (fcpf) y se obtiene a travs del siguiente cociente:

1

=
N
n N
fcpf

Con esta frmula se ajusta tanto el error estndar de la media muestral:
1

=
N
n N
n
x
x



como el error estndar de la proporcin muestral:

1
) 1 (


=
N
n N
n
P P
p

El fcpf siempre ser menor que 1, lo cual implica que en este tipo de
muestreo, las estimaciones surgidas de este tipo de muestreo resultan ms
exactas, o lo que es lo mismo tienen menos dispersin en el muestreo.
Preguntas de reflexin:

Por qu usamos los estimadores habituales para estimar la media
poblacional o la proporcin poblacional?
Cmo se comporta el error estndar si tomamos muestras ms
grandes?
Qu debe verificarse para que la proporcin muestral se distribuya
normal? Qu implicancias tiene para la muestra?
Por qu se usa el fcpf? Cmo afecta al error estndar?
Factor de Correccin
para poblaciones
finitas
Dado que este factor ser
siempre menor que 1, su
aplicacin reducir el
error estndar, haciendo
las estimaciones ms
exactas.

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|9


1.1.1.2 Estimacin puntual y por intervalos

Hasta ahora hemos visualizado el proceso de estimacin simplemente como
proporcionar un valor nico que sirva como referencia indicativa del valor
que suponemos que alcanza el parmetro poblacional de inters. En
definitiva, como se indica en Berenson y Levine (p. 344):

La estimacin puntual consiste en una sola estadstica de
muestra que se utiliza para estimar el valor verdadero del
parmetro de la poblacin.

Tabla: Estimadores puntuales

Parmetros Estimadores puntuales ms
usuales

Media poblacional


Media muestral
Proporcin poblacional

Proporcin muestral
Varianza poblacional Varianza muestral

Sin embargo, debido con este procedimiento no estamos aprovechando
realmente la potencialidad de conocer con qu probabilidad de acertar
hacemos nuestra afirmacin. Debemos considerar la variabilidad posible
que es propia de un estimador, ya que el valor de ste depender de la
muestra que haya sido seleccionada.
Para tener en cuenta esta caracterstica, la estimacin por intervalos
considera justamente las distribuciones en el muestreo de los respectivos
estimadores.
Cuando obtengamos un intervalo, estaremos considerando una
determinada confianza de estimar acertadamente el parmetro.

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|10

En definitiva vamos a poder decir, a travs del intervalo, con una confianza
establecida por el investigador (por ejemplo para la estimacin de la media
poblacional) que un intervalo a partir de la estimacin puntual ms /
menos un cierto margen de error o error de muestreo, atrapa al
verdadero valor del parmetro. Los intervalos en este caso tendrn la
siguiente estructura:

x margen de error

Estimacin por intervalo de la media
Caso: Desviacin estndar conocida

Por el Teorema del lmite central (que Ud. conoce la materia previa,
pero recordaremos ms adelante en el mdulo), sabemos que es posible
determinar qu porcentaje de las medias muestrales se ubican a
determinada distancia de la media de la poblacin, teniendo en cuenta la
distribucin de la medias muestrales.

Si bien tenemos en cuenta ese razonamiento, permanentemente en las
diferentes investigaciones que llevemos a cabo, tomaremos una nica
muestra, a partir de la cual haremos la estimacin, considerando lo que
probabilsticamente podemos deducir de la distribucin de muestreo de la
media.

La idea de este tipo de estimacin es considerar que la muestra que fue
seleccionada nos proporciona una de las medias muestrales posibles, que
con una probabilidad 1-a, se encuentra a una distancia de

n
Z
x

2
1


con respecto del valor de la media poblacional.
Donde,
2
1

Z es el valor de la tabla estandarizada normal, que tiene


acumulado hasta ese valor
2
1

de probabilidad. Este valor se denomina
Bibliografa Bsica
Captulo 9: Repaso de
conceptos como
distribucin de muestreo
y Teorema Central del
Lmite.
Captulo 10: Desarrollo
de los procedimientos
para estimacin de la
media y la proporcin.
Error de muestreo de
la media
Es la diferencia entre la
media de la muestra y la
media de la poblacin. Su
frmula es:
n
Z
x

2
1

Observe que debe
diferenciarse del error
estndar de la media,
dado que debe
multiplicarse por Z.

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|11

valor crtico de la distribucin. Algunos de los valores crticos ms usados,


correspondientes a los niveles de confianza (1-) usuales, son:

(1-)
2
1

Z

95%

1,96
99%

2,575
90%

1,645


Por lo tanto a travs de la construccin de un intervalo de confianza, con un
nivel de confianza de 1-, podemos decir que la media poblacional es
atrapada por el intervalo:

[ ]

+ =

n
Z x
n
Z x LS LI
x x


2
1
2
1
; ,

Donde LI = lmite inferior y LS= lmite superior.

Si se tomaran todas las muestras posibles de tamao n de la poblacin bajo
estudio, en el (1-)% de los intervalos surgidos de tales estimaciones de la
media poblacional, la media poblacional (que es fija aunque desconocida
para nosotros) quedara incluida en tales intervalos. Como destacamos
antes, ya que en cualquier estimacin trabajaremos con una muestra al
azar, podemos decir que la probabilidad de que se cumpla la condicin
detallada es (1-).


Tabla de la
distribucin normal
Es importante que Ud.
pueda manejar con
suficiente solvencia la
tabla de la distribucin
normal. En el anexo del
mdulo tiene disponible
una tabla y en los anexos
del texto de bibliografa
bsica otra con un
formato diferente.
Verifique cul le resulta
ms prctica para
trabajar. A modo de
ejercitacin, intente
encontrar los valores
crticos ms usados que se
presentan en la tabla a la
derecha.

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|12

Veamos un ejemplo:

Deseamos estimar la altura promedio de una poblacin de
estudiantes varones de esta Universidad.
Utilizaremos para ello una muestra aleatoria de 10 estudiantes. Los
valores obtenidos de la medicin de la altura son:

Caso Altura (en cm.)
1 162
2 176
3 169
4 165
5 171
6 172
7 169
8 168
9 175
10 167


De un estudio previo se conoce que la varianza de esta poblacin es
16 cm
2
.
Cmo podemos estimar la altura promedio?
En primer lugar veamos una estimacin puntual de la media, que va
a estar dada por la media muestral.

n
x
x
n
i
i
=
=
1

cm x 4 , 169 =

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|13

Para obtener el intervalo de confianza suponemos que la variable


aleatoria se distribuye normal, y calculamos cada uno de los valores
que indicamos. Trabajaremos con un 1-=0,95.

96 , 1
2
1
=

Z

4 =
x


10 = n


Por lo tanto el intervalo que surge ser:
[ ] [ ] 879 , 171 ; 920 , 166 , = LS LI

Y podemos expresar la conclusin: Con un nivel de confianza del
95%, la altura promedio de los varones de la poblacin de
estudiantes de la Universidad es atrapada por el intervalo [166,92
cm; 171,88 cm].
Como puede analizarse a partir del ejemplo, el intervalo que surge depende
de la muestra que ha sido seleccionada, en el caso de haber elegido a otros
estudiantes y no a esos, el resultado de la media muestra podra haber sido
distinto, y en consecuencias tambin el intervalo obtenido.






Estimacin por intervalo de la media
Caso: Desviacin estndar desconocida

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|14


En general, cuando no se dispone de informacin referida a la media
poblacional, tampoco resulta conocido el valor de la varianza poblacional.
Si tal es la situacin, no podemos aplicar la distribucin normal para la
estimacin por intervalos de la media poblacional.

Para solucionar esta situacin, se aplica la distribucin t, que
presentaremos, para calcular el intervalo de confianza.

Distribucin t de Student
1


La distribucin t de Student fue estudiada por William Gosset (1876-1937)
quien se ocupaba de tareas de control de calidad en la fbrica de cervezas
Guiness, en Irlanda.

Figura: Comparacin de la distribucin t y la normal estndar para
diferentes grados de libertad

1
La nota que se indica est basada en:
http://www.matematicasvisuales.com/html/probabilidad/varaleat/tstudent.html. En
este sitio se pueden realizar visualizaciones de las diferentes distribuciones que
estudiaremos en este mdulo, simplemente ajustando los parmetros de las
mismas. En la pgina
http://www.matematicasvisuales.com/html/probabilidad/varaleat/tstudentprob.html
pueden calcularse y compararse las respectivas probabilidades de la tabla normal
y la tabla t de Student.
Distribucintcon2gradosde
libertad
Grficodeladistribucin
normal:lnearoja
Grficodeladistribucint:azul
Tabla de la
distribucin t
Es importante que Ud.
pueda manejar con
suficiente solvencia la
tabla de la distribucin t
de Student. En el anexo
del mdulo tiene
disponible una tabla. Ms
adelante en el mdulo se
explica cmo trabajar con
la tabla.

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|15




Fuente: Elaboracin propia en base a herramienta de simulacin provista
por:
http://www.geogebra.org/en/upload/files/Juan%20de%20Jesus%20Sand
oval/la_distribucion_normal_t_student.html

Desarroll trabajos acerca de esta distribucin que le permitiera analizar
muestras pequeas. Debido a ciertas restricciones que le impona la fbrica,
no pudo publicar sus trabajos con su nombre y us el seudnimo de
Student, dado que consider que su aporte podra servir a otros.

La distribucin t, en realidad est conformada por una familia de variables
aleatorias continuas. Esta familia se diferencia entre s de acuerdo con un
parmetro que se denomina "grados de libertad".
Distribucintcon5gradosde
libertad

Distribucintcon15gradosde
libertad

Distribucintcon30gradosde
libertad
Observarcmoprcticamente
nohaydiferenciaentreambas
distribuciones.

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|16



La distribucin t es similar a la distribucin normal estndar: tiene forma
de campana, su media es 0 y es simtrica. Su varianza es mayor que 1.
Cuanto ms grados de libertad posee, ms cercana a 1 es la varianza y ms
se aproxima la distribucin t de Student a la normal estndar. Si trabajamos
con ms de 30 grados de libertad, se considera despreciable la diferencia
entre la t de Student y la normal estndar.

Para buscar valores de t en la tabla se procede de manera similar a la
correspondiente a la bsqueda en la tabla normal estndar. En este caso
debern considerarse los grados de libertad (indicados en las filas de las
tablas).

Por ejemplo, si queremos buscar el t (con 25 grados de libertad) que
acumula 0,90 de probabilidad hasta ese valor, en primer lugar ubicamos la
fila que corresponde a esos grados de libertad. Como la tabla que
presentamos en este caso seala las probabilidades a la derecha del valor
respectivo, se debe seleccionar el valor de t asociado con una probabilidad a
la derecha de 0,10. A continuacin recuadramos el valor de t buscado.

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|17



En otras ocasiones, como ya han aprendido para la distribucin normal,
queremos conocer cul es la probabilidad acumulada hasta determinado
valor de la variable aleatoria. Podemos querer saber qu probabilidad hay
de que una variable t, con 17 grados de libertad sea menor o igual a 2,1098.
Nuevamente, buscamos en la tabla la fila correspondiente a los grados de
libertad que nos interesan. Luego, entre los valores de la fila, identificamos
el valor que nos interesa. En este caso, la columna donde se ubica el 2,1098
nos seala que la probabilidad de obtener un nmero mayor a ese valor de t
es 0,025. Por lo tanto, la probabilidad acumulada hasta ese nmero ser su
complemento: 1 0,025 = 0,975.





Para los diversos problemas en los cuales es requieren valores de t o
probabilidades asociadas con valores de la variable t se pueden utilizar las
tablas que indicamos a continuacin. Existen diversas tablas publicadas. La
nica recomendacin importante para el uso es considerar cuidadosamente
qu probabilidad estn informando, y hacer uso de la propiedad de simetra
de la distribucin t (que se debe aplicar de manera anloga a la de la
distribucin normal, ya conocida del curso anterior).
Estadstica I
En el curso anterior se ha
estudiado la
distribucin normal,
sus parmetros y la
manera de obtener
probabilidades en la
tabla correspondiente. Su
Ud. no recuerda esos
conceptos y
procedimientos deber
repasarlos a partir del
material de ese curso.

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|18

Figura: Valores de la Tabla t (segn la probabilidad de la cola superior)




Fuente: Anderson , David y Sweeney, (2008) Dennis J. Estadstica para
administracin y economa. 10 edicin. Cengage Learning. Mxico.

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|19


Figura: Valores de la Tabla t (segn la probabilidad de la cola superior)
Continuacin


Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|20

Las distribuciones t de Student son parecidas a la normal. Se pueden


utilizar para hacer estimaciones de la media cuando se desconoce la
varianza (situacin que de ms est decirlo es la habitual) y se usan
muestras pequeas.

Los intervalos as obtenidos son, no podra ser de otra manera, ms grandes
y menos precisos que los que se obtendran si conocemos la varianza en una
distribucin normal.

Si la variable aleatoria X es normal, el estadstico:

n
s
x


Se distribuye t con n-1 grados de libertad.


Para buscar valores de probabilidad o de la variable aleatoria en la tabla t,
se deben considerar los grados de libertad de la variable que se est
analizando.

Grados de libertad

La idea de grados de libertad remite a la cantidad de valores de una muestra
que podran asumir cualquier valor. Si nosotros conocemos o calculamos en
funcin de tales datos un estadstico, podemos perder grados de libertad o
valores que pueden variar, del total de datos disponibles de la muestra. El
Diccionario de metodologa estadstica (Gonzalo Gonzalvo Maynar, 1978,
Morata Ed., Madrid) indica que cuando un estadstico se usa en la
estimacin de un parmetro poblacional, los grados de libertad dependen
de las restricciones impuestas sobre las observaciones: cada restriccin
hace perder un grado de libertad.


Tabla de la
distribucin t
En el punto 10.3 del texto
de Berenson & Levine
(1996) se desarrolla el
tema de estimacin de un
intervalo de confianza de
la media cuando la
desviacin estndar es
desconocida. Le
recomendamos que siga
con detalle los ejemplos
propuestos en el texto,
verificando si llega a los
mismos resultados.

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|21


Estimacin del intervalo de confianza

El intervalo de confianza para la media se construir segn el siguiente
esquema:

Nivel de confianza: (1-)%

Lmites del intervalo:
Inferior:
n
s
t x
n 1 ;
2
1




Superior:
n
s
t x
n 1 ;
2
1
+



Veamos un ejemplo:

Repitamos el ejercicio vinculado con la altura promedio de una
poblacin de estudiantes varones de esta Universidad, pero ahora
suponiendo que no conocemos la varianza poblacional.

Supongamos que estimamos con los datos de la muestra la varianza
muestral, s
2
= 16,16 cm
2
.

Trabajaremos con un 1-=0,95.

cm x 4 , 169 =

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|22



02 , 4 = s

10 = n


Por lo tanto el intervalo que surge ser:
[ ] [ ] 26 , 172 ; 52 , 166 , = LS LI

La conclusin en este caso ser: Con un nivel de confianza del 95%,
la altura promedio de los varones de la poblacin de estudiantes de
la Universidad es atrapada por el intervalo [166,52 cm; 172,26 cm].
Si comparamos el resultado con el caso de varianza conocida (a
pesar de la pequea diferencia de varianzas implicadas), el intervalo
que surge de considerar que no conocemos la varianza implica un
intervalo ms amplio (menos preciso), lo cual est asociado con un
mayor margen de seguridad debido a que no conocemos el
verdadero valor de la varianza.

2622 , 2
2
1 ; 9
=

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|23



Estimacin por intervalo de la proporcin

En el caso de datos categricos tambin podemos aplicar estimacin por
intervalos de la proporcin poblacional de casos que poseen cierta
caracterstica.

Tal como sealamos en el caso de la estimacin puntual, la base de la
estimacin va a estar dada por la proporcin muestral.

La propiedad que permite hacer uso de la distribucin normal en este caso
es la aproximacin de la distribucin binomial a la normal cuando se
verifican las condiciones:

P.n5

y

(1-P).n5

Con esta premisa, los lmites del intervalo van a estar dados por:

[ ]

=

n
p p
Z p
n
p p
Z p LS LI
) 1 (
;
) 1 (
,
2
1
2
1



Donde:

Bibliografa Bsica
En el punto 10.6 del texto
de Berenson & Levine
(1996) se desarrolla el
tema de estimacin de un
intervalo de confianza
para la proporcin. Le
recomendamos que siga
con detalle los ejemplos
propuestos en el texto,
verificando si llega a los
mismos resultados.

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|24

normal n distribuci la de crtico valor Z


muestra la de tamao n
l poblaciona proporcin P
muestral proporcin p
=
=
=
=


Veamos un ejemplo de estimacin de una proporcin poblacional.
En un estudio de opinin pblica, en el cual se quiere estimar la proporcin
de votantes que elegirn a un candidato, se realiza una encuesta a una
muestra representativa de votantes. El tamao de la muestra es 400 casos.

Tras procesar las encuestas se obtiene que 178 individuos estn seguros que
elegirn al candidato en cuestin en la eleccin.

Cmo se estima la proporcin de electores que tendr el candidato en la
eleccin, con un nivel de confianza del 99%?
La estimacin puntual que surge de la proporcin muestral es:
445 , 0
400
178
=
=
p
p


Veamos si se cumplen las condiciones para aproximar la distribucin
binomial a la distribucin normal.

n . p = 400 . 0,445

= 178

n (1-p) = 400 . 0,555

= 222

En ambos casos se cumple la condicin.

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|25


Ahora procedamos a estimar el intervalo de confianza:

[ ]

=

n
p p
Z p
n
p p
Z p LS LI
) 1 (
;
) 1 (
,
2
1
2
1



El estadstico Z que tiene acumulada una probabilidad de 0,995,

576 , 2
2
1
=

Z

[ ]

=
400
) 445 , 0 1 ( 445 , 0
576 , 2 445 , 0 ;
400
) 445 , 0 1 ( 445 , 0
576 , 2 445 , 0 ,LS LI


[ ] [ ] 51 , 0 ; 38 , 0 , = LS LI

Como conclusin, podemos decir que con un nivel de confianza del 99%, el
intervalo [0,38; 0,51] atrapa el verdadero valor poblacional de la proporcin
de votantes que tienen decidido votar al candidato. Observe que,
dependiendo de los porcentajes de otros candidatos, esto podra significar
que pierda la eleccin (si obtiene un porcentaje inferior al 50% de los votos,
algn otro candidato puede alcanzar un porcentaje mayoritario) o bien que
gane (si obtiene un valor mayor al 50% de los votos), en ambos casos, con el
nivel de confianza definido, que siendo tan elevado, le permite estar casi
seguro de que el resultado se encuentra en el intervalo estimado.





Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|26




Resumen de casos de estimacin

La siguiente figura resume los casos presentados de estimacin por
intervalos.
Figura:


Fuente: Elaboracin propia
Cundo aplicar cada estadstico?
Como mencionamos, para estimar el intervalo para la media
poblacional, se aplica distribucin normal, en caso de distribucin
normal de la variable de estudio, o en su defecto, si la muestra es
superior a 30 casos.

El uso de la distribucin t en la estimacin por intervalos de la
media poblacional es un requisito cuando desconocemos la varianza
poblacional, con distribucin de la variable de estudio normal si la
muestra es menor a 30 casos, y es recomendable, en idnticas
condiciones, an cuando la muestra es mayor. De hecho, los
paquetes estadsticos, usan las pruebas t, en los casos en los que se
necesita estimar la varianza.
Anexo de Ejercitacin
Adems de los ejemplos
presentados en la lectura y
el texto bsico, Ud.
encontrar en el anexo del
mdulo una gua de
ejercicios y sus
respectivas soluciones.
Le recomendamos que
realice toda la ejercitacin
posible para identificar con
claridad las situaciones en
las que se aplica cada
prueba estudiada.

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|27


Para la estimacin de la proporcin poblacional, debe verificarse que
tanto p.n5 y (1-p).n5.

Determinacin del tamao de la muestra
Hasta ahora, se ha estudiado el modo de realizar la estimacin de
parmetros poblacionales a partir de una muestra de tamao n. Sin
embargo, una cuestin fundamental en la estadstica inferencial es
determinar cul es el tamao de muestra ptimo para lograr resultados
dentro de un error mximo tolerable, minimizando los recursos empleados.
1. Determinacin del tamao de la muestra para la media
La frmula que permite obtener el tamao adecuado de la muestra para la
estimacin de la media es la siguiente:

Esta frmula se obtiene despejando la frmula del error de muestreo e.
Esto puede verse con detenimiento en el punto 10.7 del texto de Berenson &
Levine (1996). Como se observa, son datos necesarios para el clculo:
conocer el nivel de confianza deseado (a partir del cual se obtiene Z), tener
en cuenta el error mximo permitido o aceptable en cada caso (e) y la
desviacin estndar de la poblacin (posiblemente a partir de datos
histricos o conocidos por la experiencia del investigador)
2. Determinacin del tamao de la muestra para la
proporcin

La frmula que permite obtener el tamao adecuado de la muestra para la
estimacin de la proporcin es la siguiente:


Al igual que en el caso anterior, esta frmula se desprende de la expresin
del error de muestreo (en este caso para la proporcin). Adems de los
datos sobre el nivel de confianza deseado y el error mximo tolerable, debe
conocerse alguna estimacin o dato histrico sobre para p. De lo contrario,
una regla prctica consiste en darle a p el valor 0,5. De esta manera, la
expresin p (1-p) ser la mayor posible, al igual que el tamao de muestra
determinado.
3. Determinacin del tamao de la muestra para la
poblaciones finitas.
Bibliografa Bsica
Le recomendamos que
revise en detalle este tema
en el texto de Berenson
y Levine (1996). Los
puntos 10.7, 10.8 y 10.9
desarrollan estos
conceptos. Preste
atencin a los ejemplos
all propuestos.
Si se cuenta con una
estimacin de p
En este caso, la regla
prctica indica que se
utilizar un valor de
p=0,5 dado que es un
criterio conservador
(que dar un mayor valor
de la varianza y del
tamao de la muestra.
Ver Berenson & Levine
(1996) punto 10.8

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|28

Tal como se estudi en los casos anteriores la frmula para obtener el


tamao de la muestra se obtiene despejando n de la frmula del error (en el
que se utilizar el factor de correccin por poblacin finita. (Ver punto 10.9
del texto).

1.1.2 Concepto de Distribucin de muestreo
Dada una poblacin, si se consideran todas las muestras posibles de un
mismo tamao, n, para las que se calcula un estadstico determinado (por
ejemplo, la media o la proporcin), la distribucin de los resultados
obtenidos de esas muestras recibe el nombre de distribucin de
muestreo.

Un resultado fundamental para la Inferencia estadstica:

Si bien este tema fue desarrollado en Estadstica I, es muy importante
recordarlo, ya que es un concepto fundamental para la Inferencia
estadstica, del cual se nutren los contenidos de este y los siguientes
mdulos.

1.1.2.1 Teorema Central del lmite

Este resultado nos indica que:

Cuando el tamao es suficientemente grande, la distribucin de la variable
aleatoria media muestral puede aproximarse a la distribucin normal. Y
esta relacin es vlida, cualquiera sea la distribucin de los datos de la
variable original.

Por ejemplo, si estamos interesados en analizar la media de ingresos en
cierta poblacin, an cuando la distribucin de ingresos en esa poblacin
no sea normal, si tomamos muestras suficientemente grandes, la
distribucin en el muestreo de las medias muestrales de ingresos, tendrn
una forma aproximadamente normal.

Analicemos un ejemplo:
Bibliografa Bsica
Le recomendamos que
revise en detalle este
tema en el texto de
Berenson y Levine
(1996). El Captulo 9,
tambin estudiado en
Estadstica I, trata el
tema de la distribucin
de muestreo y el
Teorema Central del
Lmite.

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|29


Analizamos la supervivencia adulta en una pequea poblacin rural. Uno de
los datos que analizamos es el nmero de hermanos tenidos en promedio.
Consideremos la siguiente tabla que indica el nmero de hermanos tenidos
por todos los residentes.
Tabla: Datos de anlisis
Caso Nmero de
hermanos
Caso Nmero de
hermanos
1 8 26 4
2 4 27 2
3 1 28 6
4 5 29 4
5 2 30 3
6 6 31 1
7 4 32 7
8 6 33 3
9 4 34 5
10 2 35 2
11 5 36 4
12 3 37 5
13 2 38 9
14 6 39 4
15 2 40 3
16 1 41 5
17 4 42 4
18 5 43 3
19 4 44 1
20 3 45 4
21 7 46 5
22 4 47 6
23 5 48 3
24 2 49 8
25 4 50 3

La informacin que proveemos en la tabla anterior corresponde a los 50
residentes mayores de 40 aos del paraje.

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|30


Vamos a analizar qu hubiramos estimado si las muestras hubieran sido
de tamaos: 3, 5 y 7 casos. Para ejemplificar, tomamos 10 muestras de cada
tamao, de entre todas las posibles de ese tamao.

Tamao 3
Muestra Casos
seleccionados
1 24 14 7
2 37 4 49
3 11 41 48
4 21 7 8
5 6 50 30
6 10 40 48
7 4 26 34
8 3 11 17
9 47 40 9
10 31 47 11


Tamao 5
Muestra Casos seleccionados
1 9 45 21 14 15
2 33 41 33 16 38
3 34 49 22 35 17
4 49 30 17 15 8
5 39 21 35 2 28
6 11 26 40 24 45
7 42 5 31 23 19
8 19 38 46 50 6
9 37 33 31 8 48
10 34 46 33 46 37


Tamao 7

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|31

Muestra Casos seleccionados


1 40 41 20 14 7 17 8
2 32 30 50 23 45 21 4
3 13 37 30 4 2 13 22
4 1 17 35 10 25 19 28
5 17 14 2 42 6 28 31
6 41 9 27 36 10 14 20
7 38 1 36 2 18 38 48
8 18 7 48 35 6 46 17
9 2 23 39 14 33 19 48
10 8 13 49 20 27 48 34


Ahora, para muestra, calculemos la media muestral:

Tamao 3
Muestra Valores de los
casos de la
muestra
seleccionada
Media muestral
1 2 6 4 4
2 5 5 8 6
3 5 5 3 4,33
4 7 4 6 5,67
5 6 3 3 4
6 2 3 3 2,67
7 5 4 5 4,67
8 1 5 4 3,33
9 6 3 4 4,33
10 2 6 5 4,33




Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|32


Tamao 5
Muestra Valores de los casos de la
muestra seleccionada
Media muestral
1 4 4 7 6 2 4,6
2 3 5 6 1 9 4,8
3 5 8 4 2 4 4,6
4 8 3 4 2 6 4,6
5 4 7 2 4 6 4,6
6 5 4 3 2 4 3,6
7 4 2 1 5 4 3,2
8 4 9 5 3 6 5,6
9 5 3 1 6 3 3,6
10 5 5 3 5 5 4,6


Tamao 7
Muestra Valores de los casos de la muestra
seleccionada
Media
muestral
1 3 5 3 6 4 4 6 4,43
2 7 3 3 5 4 7 5 4,86
3 2 5 3 5 4 2 4 3,57
4 8 4 2 2 4 4 6 4,28
5 4 6 4 4 6 6 1 4,43
6 5 4 2 4 2 6 3 3,71
7 9 8 4 4 5 9 8 6,71
8 5 4 3 2 6 5 4 4,14
9 2 5 4 6 3 4 3 3,86
10 6 2 8 3 2 3 5 4,14

Veamos a continuacin cmo se distribuyen las medias muestrales
obtenidas en cada tamao de muestra, a travs de histogramas de
frecuencia:

Figura: distribucin de medias muestrales de muestras de tamao 3

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|33


Figura: distribucin de medias muestrales de muestras de tamao 5



Figura: distribucin de medias muestrales de muestras de tamao 7

Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|34



A partir de este ejemplo, qu reflexin puede hacer, teniendo en cuenta el
Teorema del Lmite central, vinculada con la media muestral que se analiza
de una muestra en particular (y el tamao de una muestra que se
considere), y la probabilidad de aproximarse lo ms posible al verdadero
valor del parmetro poblacional de inters?



Bibliografa Lectura 1
Berenson & Levine (1996). Estadstica para administracin y
economa. Sexta Edicin. Ed. Prentice Hall Hispanoamericana. Mxico.



www.uesiglo21.edu.ar



Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|35

Potrebbero piacerti anche