Sei sulla pagina 1di 40

Estadsticas

Semestre 2017-1

Estimacin y Estimadores
IC para la diferencia de dos poblaciones

Tambin existen mtodos basados en intervalos de confianza para


estimar algunos parmetros de dos poblaciones.

Un importante problema de inferencia estadstica es la comparacin de


dos medias de poblaciones que siguen una distribucin normal o la
comparacin de dos proporciones de grandes poblaciones.

Segn la disponibilidad de informacin, el anlisis considera muestras


dependientes e independientes de cada poblacin, as como el
conocimiento o desconocimiento de las varianzas poblacionales.

Tambin existen mtodos para estimar la varianza de una poblacin


basada en intervalos de confianza.

2
IC de la diferencia
entre dos varianzas poblacionales

Intuitivamente, podramos comparar las varianzas de dos


poblaciones, 21 y 22, utilizando la razn de las varianzas
muestrales S21 / S22.

Si dicha relacin es casi igual a 1, se tendr poca


evidencia para indicar que 21 y 22 no son iguales. Por
otra parte, un valor muy grande o muy pequeo
proporcionar evidencia de una diferencia en las varianzas
de las poblaciones.

3
IC de cociente
de dos varianzas poblacionales

Para encontrar un intervalo de confianza para el cociente


de dos varianzas, empleamos la distribucin F que es
similar a como hicimos en el caso de una sola varianza
empleando la distribucin ji-cuadrado, slo que ahora
usamos el estadstico definido por

Despejando

4
IC de la diferencia
entre dos varianzas poblacionales

Supngase que se tienen dos poblaciones normales e


independientes con varianzas desconocidas 21 y 22,
respectivamente.

De este par de poblaciones, se tienen disponibles dos


muestras aleatorias de tamaos n1 y n2, respectivamente,
siendo S1 y S2 las dos varianzas muestrales. Se desea
conocer un intervalo de confianza del 100(1-)% para el
cociente de las dos varianzas, 21/22.

Para construir el intervalo de confianza para el cociente de


dos varianzas poblacionales, se coloca la varianza
5
muestral mayor en el numerador del estadstico F.
IC de la diferencia
entre dos varianzas poblacionales

Esto nos da permite calcular la probabilidad de que el


cociente se encuentre entre dos valores de F. Entonces:

En este caso se requiere calcular los grados de libertad del


numerador que son v1=n1-1 y los del denominador que son
v2=n2-1.
6
IC de la diferencia
entre dos varianzas poblacionales

Donde

7
IC de la diferencia
entre dos varianzas poblacionales

Ejemplo:

Un fabricante de automviles pone a prueba dos nuevos


mtodos de ensamblaje de motores respecto al tiempo en
minutos. El mtodo 1, con una muestra de 31 presenta una
varianza de 50, y el mtodo dos, con una muestra de 25
presenta una varianza de 24. Construya un intervalo de
confianza del 90% para cociente de las varianzas de
ambos mtodos.

8
IC para la diferencia de medias
Muestras dependientes

Consideramos que las muestras son dependientes si en los


valores de una de las muestras influyen los de otra. En este
sistema, los miembros de las muestras se eligen por pares, uno
de cada poblacin, por lo que este mtodo se conoce a menudo
con el nombre de datos pareados.

La idea es que los miembros de estos pares deben parecerse lo


mas posible para poder hacer directamente la comparacin que
interesa.

Uno de los enfoques y aplicaciones posibles de este mtodo es


la evaluacin de intervenciones en la poblacin (polticas
publicas, programas, tratamientos, entre otros).
9
IC para la diferencia de medias
Muestras dependientes

En este caso, cada par de observaciones consiste en las


mediciones antes y despus de la intervencin.

El caso de n pares de observaciones, se representan por


(x1,y1), (x2,y2), (x3,y3)..(xn,yn) estimadas de poblaciones
de medias x y y.

10
IC para la diferencia de medias
Muestras dependientes

Muestras pareadas

Individuo 1 2
Diferencia
(par) medicin medicin
1 x1 y1 d1=x1-y1
2 x2 y2 d2=x2-y2
3 x3 y3 d3=x3-y3

n xn yn dn=xn-yn

Intervencin / tratamiento 11
IC para la diferencia de medias
Muestras dependientes

Supongamos que tenemos una muestra aleatoria de n pares de


observaciones pareadas provenientes de distribuciones normales de
medias x y y, es decir, sean x1, x2,.xn, los valores de la poblacin
que tiene la media x; e y1, y2,.,yn los valores correspondientes de la
poblacin que tiene la media y.

Sean d y Sd la media y la desviacin tpica muestrales observadas de


la n diferencias di = xi yi. Si se supone que la distribucin poblacional
de las diferencias es normal

El problema es que generalmente 2d es desconocido, por lo que se


reemplaza por S2d
12
IC para la diferencia de medias
Muestras dependientes

13
IC para la diferencia de medias
Muestras dependientes

Siendo la desviacin tpica de las diferencias y el margen


de error

14
IC para la diferencia de medias
Muestras dependientes

Y es el nmero para el que

La variable aleatoria tn-1 tiene una distribucin t de Student


con n-1 grados de libertad.

15
IC para la diferencia de medias
Muestras dependientes

Ejemplos:

Se realiz un estudio para comprobar la diferencia de eficacia de dos


insecticidas (A y B) utilizados para controlar una plaga de polillas. Se
utilizan ensayos pareados de 10m2 de superficie para controlar la
variacin en el numero de ejemplares de la plaga. Las plantas de cada
ensayo tienen las mismas caractersticas (especie, numero de plantas,
tamao, edad y manejo agronmico. Se administra una misma dosis
del insecticida A en un ensayo seleccionado aleatoriamente en cada
par, y una dosis del insecticida B en el otro ensayo del par. Tras un
determinado periodo de tiempo, se cuentan los ejemplares de la plaga.
Considerando una muestra aleatoria de 8 pares de ensayos. Estime
con un nivel de confianza del 99% la diferencia de media de eficacia
entre los dos insecticiditas para controlar la plaga.
16
IC para la diferencia de medias
Muestras dependientes

Par Insecticida Insecticida Diferencia


A B
1 29 26 3
2 32 27 5
3 31 28 3
4 32 27 5
5 32 30 2
6 29 26 3
7 31 33 -2
8 30 36 -6

17
IC para la diferencia de medias
Muestras independientes, varianzas conocidas

Para esta estimacin, se extraen muestras independientes de las dos


poblaciones, no necesariamente del mismo tamao, que siguen una
distribucin normal y tienen varianzas poblacionales conocidas, por lo
que la pertenencia a una de las muestras no influye la pertenencia a la
otra.

Si las dos poblaciones son normales y tienen varianzas conocidas, es


lgico basar la inferencia en la diferencia entre las medias muestrales
correspondientes

18
IC para la diferencia de medias
Muestras independientes, varianzas conocidas

Y como las muestras son independientes

Puede demostrarse que su distribucin es normal

19
IC para la diferencia de medias
Muestras independientes, varianzas conocidas

Supongamos que tenemos dos muestras aleatorias independientes de


nx y ny observaciones procedentes de poblaciones que siguen una
distribucin normal de medias x y y, y varianzas 2x y 2y . Si las
medias muestrales observadas son e , entonces obtenemos un
intervalos de confianza al 100(1-)% de (x y) segn:

Donde el margen de error es

20
IC para la diferencia de medias
Muestras independientes, varianzas conocidas

Ejemplos:

Se pide a muestras independientes de jugadores de dos


equipos de futbol que indiquen el nmero de horas extras que
dedican a entrenar, fuera de su jornada habitual. La muestra de
321 jugadores del equipo A presenta un tiempo promedio de
3,01 horas semanales de entrenamiento y la muestra de 94
jugadores del equipo B tiene un tiempo medio de 2,88 horas
semanales. Basndose en temporadas anteriores, se supone
que la desviacin tpica poblacional de los jugadores del equipo
A es de 1,09 y que la deviacin tpica de los jugadores del
equipo B es 1,01. Halle el intervalo de confianza al 95% para la
diferencia de media en los tiempos de entrenamiento extra que
presentan los jugadores de ambos equipos. 21
IC para la diferencia de medias
Muestras independientes, varianzas conocidas

El nivel educacional es diferenciador en las expectativas


salariales?. Para demostrarlo se entrevistaron a 25
personas que completaron su enseanza media y a 16 que
no la completaron. Quienes completaron la enseanza
media reciben, en promedio, una remuneracin mensual
de M$450 y quienes no la completaron slo reciben, en
promedio M$380. Histricamente, la desviacin tpica de
quienes completan su educacin es de M$50 y de quienes
no la completan de M$30. Halle el intervalo de confianza al
90% para la diferencia de medias salariales de quienes
terminaron la enseanza media respecto de quienes no la
terminaron.
22
IC para la diferencia de medias
Muestras independientes, varianzas desconocidas

En este caso, existen dos situaciones:

1. Se asume que las varianzas poblacionales


desconocidas son iguales

2. No se asume que las varianzas poblacionales


desconocidas son iguales

23
IC para la diferencia de medias
Muestras independientes, varianzas desconocidas

Varianzas desconocidas que se supone son iguales

Supongamos que tenemos dos muestras aleatorias


independientes de nx y ny observaciones procedentes de
poblaciones que siguen una distribucin normal de medias
x y y, y una varianza poblacional comn pero
desconocida. Si las medias muestrales observadas son
e , y las varianzas muestrales observadas son S2x y S2y ,
se obtiene un intervalo de confianza al 100(1-)% de (x
y), segn:

24
IC para la diferencia de medias
Muestras independientes, varianzas desconocidas

Si n es pequeo (nx + ny -2 <= 30)

25
IC para la diferencia de medias
Muestras independientes, varianzas desconocidas

Donde el margen de error es:

Y la varianza muestral agrupada (o conjunta) S2p es

26
IC para la diferencia de medias
Muestras independientes, varianzas desconocidas

es el nmero para el que:

La variables aleatoria t, es una aproximadamente una


distribucin t de Student con nx+ny-2 grados de libertad.

27
IC para la diferencia de medias
Muestras independientes, varianzas desconocidas

Ejemplos:
Los residentes de la Regin Metropolitana se quejan de que las multas
por exceso de velocidad son ms altas en su regin que las que se
imponen en la Regin de OHiggins. Las autoridades acordaron
estudiar el problema para ver si las quejas son razonables. Se
obtuvieron muestras aleatoria independientes de las multas pagadas
por los residentes de cada una de las regiones durante tres meses. El
valor de estas multas fue:

Metropolitana 100 125 135 128 140 142 128 137 156 142
OHiggins 95 87 100 75 110 105 85 95

Construya el intervalo de confianza al 95% de la diferencia entre las


multas medias pagadas en ambas regiones.

28
IC para la diferencia de medias
Muestras independientes, varianzas desconocidas

Varianzas desconocidas que no se supone sean iguales

Supongamos que tenemos dos muestras aleatorias


independientes de nx y ny observaciones procedentes de
poblaciones que siguen una distribucin normal de medias
x y y, y supongamos que las varianzas poblacionales.
Si las medias muestrales observadas son e y las
varianzas muestrales observadas son S2x y S2y , se obtiene
un intervalo de confianza al 100(1-)% de (x y) segn:

29
IC para la diferencia de medias
Muestras independientes, varianzas desconocidas

Donde el margen de error es:

30
IC para la diferencia de medias
Muestras independientes, varianzas desconocidas

Y los grados de libertad v son:

Ahora, si las muestras son del mismo tamao, entonces


los grados de libertad se reducen a:

31
IC para la diferencia de medias
Muestras independientes, varianzas desconocidas

Ejemplo:

Un auditor tom una muestra aleatoria de facturas pendientes para


pago de las oficinas Norte y Sur de la empresa XXX. El auditor quera
estimar con esas dos muestras independientes la diferencia entre los
valores medios de las facturas pendientes para pago.

Oficina Norte Oficina Sur


Media muestral M$290 M$250
Tamao muestra 16 11
Desviacin tpica M$15 M$50

No asumiendo que las varianzas poblacionales desconocidas son


iguales, estimar la diferencia entre los valores medios de las facturas
pendientes para pago de las dos oficinas. Utilice un nivel de confianza
32
de un 95%.
IC de la diferencia
entre dos proporciones poblacionales

Supongamos que una muestra aleatoria de nx


observaciones procedentes de una poblacin que tiene
una proporcin Px de xitos genera una proporcin
muestral px, y que una muestra aleatoria independiente de
ny observaciones procedentes de una poblacin que tiene
la proporcin Py de xitos genera la proporcin py.

Como los que nos interesa es la diferencia poblacional (Px-


Py), es lgico examinar la variable aleatoria (px-py)

33
IC de la diferencia
entre dos proporciones poblacionales

Y como las muestras se toman independientes, la varianza

Adems, si el tamao de esta muestra es grande, la distribucin


de esta variable aleatoria es aproximadamente normal, por lo
que restando su media y dividindola por su desviacin tpica,
obtenemos una variable aleatoria estndar normal.

34
IC de la diferencia
entre dos proporciones poblacionales

Sea px la proporcin observada de xitos en una muestra


aleatoria de nx observaciones procedentes de una
poblacin que tiene una proporcin Px de xitos, y sea py la
proporcin de xitos observada en una muestra aleatoria
independiente de ny observaciones procedentes de una
poblacin que tiene una proporcin Py de xitos.

En este caso, si las muestras son de gran tamao


(generalmente al menos 40 observaciones cada una), se
obtiene un intervalo de confianza al 100(1-)% de la
diferencia entre proporciones poblacionales (Px-Py) segn:

35
IC de la diferencia
entre dos proporciones poblacionales

Donde el margen de error es:

36
IC de la diferencia
entre dos proporciones poblacionales

Ejemplos:

Durante un ao de elecciones se realizan muchos


pronsticos para averiguar como perciben los electores a
un determinado candidato. En una muestra aleatoria de
120 posibles votantes del distrito A, 107 declararon que
apoyaran al candidato de un determinado pacto. En una
muestra independiente de 141 posibles votantes del
distrito B, slo 73 declararon que apoyaban al mismo
candidato. Si las proporciones poblacionales respectivas
se representan por medio de PA y PB, halle el intervalo de
confianza, al 95% de la diferencia poblacional PA PB.
37
IC de la diferencia
entre dos proporciones poblacionales

Debido a los ltimos acontecimientos, el Gobierno decide


aplicar un nuevo tributo para recaudar fondos y destinarlos
a la reconstruccin, el cual afectara a empresarios y
profesionales. Antes de su implementacin, decide llevar a
cabo una encuesta destinada a evaluar el nivel de apoyo al
nuevo impuesto. A una muestra aleatoria de 100
empresarios, 35 declararon estar de acuerdo con la nueva
medida. Por otro lado, de una muestra independiente de
200 profesionales, solo 100 sealaron estar de acuerdo.
Construya un intervalo de confianza al 90% para la
diferencia de proporciones entre empresarios y
profesionales.
38
IC de la diferencia
entre dos proporciones poblacionales

Un investigador seala que a las mujeres les gusta el


futbol tanto o ms que a los hombres. Para demostrarlo,
consulta a 100 mujeres de las cuales 40 se consideran
fanticas del futbol, mientras que de una muestra de 100
hombres slo 35 se declaran fanticos. Mediante un
intervalo de confianza al 95% para la diferencia de
proporciones, evalu si el investigador tiene o no razn.

39
Estadsticas
Semestre 2-2016

Estimacin y Estimadores

Potrebbero piacerti anche