Sei sulla pagina 1di 13

Facultad Catlica de Qumica e Ingeniera Fray Rogelio Bacon Pontificia Universidad Catlica Argentina

Estimacin

Ctedra: Estadstica
Docente: Prof. Lic. Luciana Ruiz e-mail: lucianaruiz@uca.edu.ar

Inferencia estadstica
n

A partir de la informacin muestral (estadstica) se desea inferir o tomar decisiones respecto de la poblacin (parmetro).

Ejemplo: para estimar el % de votantes que elegir a cierto candidato se utiliza el % de personas que afirman que lo votar en un total de encuestados (muestra).

Estimadores
n

Llamamos estimador de un parmetro desconocido a la estadstica que se utiliza para estimar su valor a partir de una muestra. El valor numrico particular que toma el estimador, calculado a partir de datos muestrales, se denomina estimacin.

Estimador puntual vs. estimador por intervalos


n

Estimacin puntual: estadstica que produce un slo valor numrico como estimacin del parmetro desconocido. Estimador por intervalos: intervalo dentro del cual puede encontrarse el valor real del parmetro. Va acompaado de una medida de la confianza que se da a su exactitud. Ejemplo: el encuestador podr concluir que el porcentaje poblacional de votantes a favor del candidato est entre 30% y 36%.

Distribuciones muestrales
n

Las estadsticas por lo general difieren de una muestra a otra por lo que pueden considerarse como variables aleatorias. La distribucin de probabilidad de todos los resultados posibles de una estadstica para un mismo tamao de muestra se conoce como la distribucin muestral de la estadstica.

Ejemplo: Distribucin de la proporcin. Un almacn contiene 10 mquinas impresoras, 4 de las cuales son defectuosas. Se desea seleccionar al azar 5 de esas mquinas para estimar la proporcin de mquinas defectuosas. 1. Calcule la proporcin de mquinas defectuosas en la poblacin (parmetro p). 2. Obtener todas las muestras posibles. 3. Construir la distribucin muestral de la proporcin de mquinas defectuosas en la muestra. 4. Calcular esperanza y variancia.

Ejemplo:
Se desea estimar la fraccin defectuosa de un lote grande de componentes. Se decide seleccionar al azar 5 componentes con Proporcin reposicin y utilizar la muestral Probabilidad proporcin defectuosa en 0 0,07776 la muestra como 0,2 0,2592 estimador de la verdadera 0,4 0,3456 proporcin defectuosa en 0,6 0,2304 el lote. La distribucin muestral 0,8 0,0768 del estimador sra:
1 0,01024

Parmetros
Como cualquier distribucin, las distribuciones muestrales se pueden caracterizar a travs de sus parmetros estadsticos: Esperanza y Variancia. El desvo estndar del estimador se denomina Error Estndar.
Ejemplo: La distribucin muestral de la proporcin se distribuye segn una ley binomial con Esperanza = p y Variancia = p(1-p)/n donde p es la proporcin poblacional. (Demostrar)

Muestra aleatoria
Cuando se extrae una muestra aleatoria simple (MAS) de tamao n de una poblacin finita con reposicin o de una poblacin infinita podemos describir las n observaciones por el modelo matemtico de n variables aleatorias independientes igualmente distribuidas (c/u una rplica de la distribucin de la poblacin)

Distribucin muestral de la media


n

Para la mayor parte de las distribuciones poblacionales, sin importar su forma, la distribucin muestral de la media se aproxima a la distribucin normal si n 30 (Teorema Central del Lmite) Si la distribucin de la poblacin es bastante simtrica, la distribucin muestral de la media se aproxima a la normal si n 15. Si la poblacin tiene una distribucin normal, la distribucin muestral de la media tiene distribucin normal (para cualquier n).

Esperanza y Error estndar de la media


n

E [(x)/n] = 1/n E (x) = 1/n . n = Var [(x)/n] = 1/n2 Var (x) = n/n2 2 = 2/n Error estndar = / n

Propiedades de los estimadores Un buen estimador es el que est cerca del parmetro que se estima en el sentido de que tiene altas chances de brindar estimaciones cercanas al parmetro. La calidad de un estimador se evala en funcin de sus propiedades: n Insesgabilidad
n n n

Eficiencia Consistencia Suficiencia

Insesgabilidad
Se dice que un estimador es insesgado si su valor esperado es idntico al parmetro poblacional que se estima. es insesgado E() = e

Eficiencia
Si dos estimadores, 1 y 2, son insesgados, se dice que 1 es ms eficiente que 2 para e si: Var (1) < Var(2)
Cuanto ms pequea es la variancia de un estimador, ms concentrada est su distribucin alrededor del parmetro que se estima.

Consistencia
Se dice que un estimador es consistente si la probabilidad de que se aproxime al parmetro que se estima se acerca a 1 a medida que n crece. lim P(| e| < ) = 1
n

Suficiencia
Se dice que un estimador es suficiente si aporta tanta informacin como sea posible acerca del parmetro de modo que cualquier otro estimador puede proporcionar slo escasa informacin adicional.

Estimacin puntual
n

Consiste en seleccionar una muestra y calcular el valor del estimador o estimacin. Debe indicarse su precisin a travs del error estndar del estimador. Si en el error estndar intervienen parmetros desconocidos, stos deber ser estimados con la muestra y se obtendr entonces un error estndar estimado.

Estimacin por intervalo


n

Consiste en seleccionar una muestra y calcular dos valores, L y U, que son los lmites inferior y superior del intervalo dentro del cual se tiene cierta confianza en que est contenido el parmetro. Indica el error de dos maneras: por la extensin del intervalo y por la probabilidad de que el parmetro se encuentre dentro del intervalo.

Ejemplo:
Se desea estimar, con una confianza del 95,45%, el n medio de horas que durarn los focos fabricados por una mquina, tomando una muestra aleatoria de 40 focos. Se sabe que la duracin de estos focos tiene una distribucin normal con = 4,3 horas. Dado que la media muestral tiene distribucin normal,
Z = (X - m)/
__

s
n

~ N(0; 1) 2) = 0,9545 y

=>

P(-2 ( X - m ) /
__

__

s
n
__

P( X - 2

s
n

X+ 2

s
n

) = 0,9545

Ejemplo (continuacin):
Una vez extraida la muestra, el tiempo medio de funcionamiento de los 40 focos observados fue de 1,416 horas. Luego, el intervalo de confianza del 95,45%:
__

x 2

s
n

= 1,416 2

4,3 = (0,056; 2,776) 40

permite concluir: Se estima, con una confianza del 95,45%, que los focos producidos por la mquina tienen una duracin media de entre 0,056 y 2,776 horas.

10

Interpretacin del nivel de confianza


La estimacin obtenida para una muestra dada contiene o no al verdadero parmetro. El procedimiento permite construir estimaciones que a la larga sern correctas en una proporcin de veces igual al nivel de confianza utilizado. Sin embargo, no podemos saber si una estimacin en particular es correcta. Podemos tener confianza en que es una de las tantas correctas que arroja el procedimiento pero siempre existe un riesgo de que sea una estimacin errnea.

Confianza vs. precisin


n

En un intervalo de confianza el coeficiente que acompaa al error estndar del estimador se denomina multiplicador de confianza. Este valor depende de la distribucin del estimador y de la confianza escogida. Niveles y coeficientes ms utilizados: Usualmente se fija la confianza en un nivel alto, 90, 95 99%. A estos niveles les corresponden los coeficientes 1,64; 1,96 y 2,58 respectivamente. Puede apreciarse que a mayor nivel de confianza, mayor multiplicador, por tanto, el intervalo ser ms ancho y ser menor la precisin de la estimacin.

11

Intervalo de confianza para la media con variancia desconocida (n grande): __

x z

Se utiliza la desviacin estndar de la muestra para estimar la desviacin estndar de la poblacin. Con esto se introduce mayor aleatoriedad en las estadsticas L y U. Sin embargo, cuando n es grande, an es vlida la aproximacin normal. Para tamaos de muestra menores, si la poblacin puede suponerse normal, se utiliza la distribucin t de Student.

Distribucin t de Student
Gosset demostr que cuando se toman muestras pequeas de poblaciones normales, la estadstica: t = ( X - ) /
__

~ tn-1

La grfica de esta distribucin es similar a la normal estandar pero con mayor dispersin.

Intervalo de confianza para la media con variancia desconocida (n pequeo): __

x t n -1

12

Estimacin por intervalo para la proporcin


Para tamaos de muestra grandes:
= p X ~ N(p; pq/n) n

=>

- p) / (p

pq ~ N(0; 1) n

Para el clculo del intervalo de confianza debe estimarse el error estndar de la proporcin muestral.

Intervalo de confianza para la proporcin: q p (n grande) z p


n

Determinacin del tamao de muestra Deben fijarse el nivel de confianza y la precisin que se desean para la estimacin. La precisin suele expresarse en trminos de e. Igualando e a la semiamplitud del intervalo se obtiene una ecuacin de la cual puede obtenerse el valor de n mnimo requerido. Para la media: n = (z./e)2 Para la proporcin: n = z2.p.q/e2

13