Sei sulla pagina 1di 36

Muestreo y

Distribuciones en el
Muestreo

Poblacin y muestras
Poblacin es la totalidad de elementos sobre los
que se desea estudiar un tema en particular.
Muestra es un subconjunto de elementos de una
poblacin.
ESTADISTICO MUESTRAL
PARAMETRO
Medida que se calcula
POBLACIONAL
con los elementos de
Medida que se calcula
una muestra.
con todos los elementos
que componen la
, s, p
poblacin
Variable.
,INFERENCIA
P
ESTADSTICA: esConocido.
la parte de
la
Desconocido.
Fijo.
estadstica que
comprende una serie de tcnicas
para generalizar a una poblacin los resultados
obtenidos de una muestra.

Muestreo
Es el procedimiento por el cual se selecciona un
(sub)conjunto de elementos de una poblacin.
Utilizamos el muestreo cuando no es posible contar o
medir todos los elementos de la poblacin.
Para que los resultados de una muestra sirvan para
efectuar inferencias confiables, la muestra debe ser
seleccionada aleatoriamente.
Una muestra es aleatoria si se obtiene de manera que
todos los elementos de la poblacin tienen una
probabilidad conocida de ser seleccionados.

Diseo de muestras
Contempla una serie de pasos a seguir para obtener
la muestra:
1. Definir la poblacin. Identificar los elementos, lugar
fsico y tiempo en el que se recogen los datos.

2. Identificar el marco de muestreo (listado de todas las


unidades de muestreo que pueden ser seleccionadas)

3.
4.
5.
6.

Determinar el tamao de la muestra (ms adelante)


Elegir un mtodo de seleccin de muestra
Seleccionar la muestra
Definir un procedimiento de estimacin (ms
adelante)

7. Obtener las estimaciones y los errores del


muestreo (ms adelante)

Mtodo de seleccin de muestras.


El muestreo puede ser:
Probabilstico
-Se usan muestras
aleatorias.
-Cada muestra tiene una
probabilidad conocida de
ser seleccionada.
-Se usa la teora de
probabilidades.
-Es posible conocer el error
de muestreo.
-Conocemos la precisin
del estimador
PODEMOS HACER

No Probabilstico
-Cada muestra tiene una
probabilidad desconocida de
ser seleccionada.

-No es posible conocer el


error de muestreo.
-No conocemos la precisin
del estimador.
NO PODEMOS HACER
INFERENCIA

Mtodos de seleccin de
muestras
Muestreo
probabilstico

Aleatorio simple
Estratificado
Sistemtico
Por
Conglomerados

Muestreo no probabilstico
Por conveniencia
(personas en la caja de
supermercado, voluntarios para
una prueba, etc)

Por juicio (se elije una


escuela, un barrio..)

Por cuotas (se establecen


cantidades de personas con
alguna caracterstica (edad y
sexo))

Muestreo aleatorio simple


Cada posible muestra tiene igual
probabilidad de ser seleccionada y cada
elemento de la poblacin total tiene una
oportunidad igual de ser incluido en la
muestra.
Se usan nmeros aleatorios
(muestras con y sin reemplazo)

Muestreo sistemtico
Los elementos son seleccionados de la
poblacin dentro de un intervalo uniforme.
Se determina un salto p=N/n.
Se sortea un arranque (valor menor a p).
Se saltean p elementos y se selecciona el siguiente.

Menos costo que un aleatorio simple


En este tipo de muestreo, existe el problema de
introducir un error en el proceso de muestreo.

Muestreo estratificado
Se divide a la poblacin en grupos
relativamente homogneos
(ESTRATOS)
Dentro de cada estrato se selecciona
aleatoriamente un conjunto de
elementos
(asignacin proporcional, o no
proporcional)

Supone que los estratos son


homogneos al interior,

Muestreo por
conglomerados
Se divide a la poblacin en
conglomerados.
Se sortean aleatoriamente. Al interior
de los sorteados, se sortean los
elementos.
Supone que los conglomerados son
homogneos entre s, heterogneos
al interior.

Si el mtodo de seleccin de muestras


es probabilstico:
La seleccin de la muestra es un
EXPERIMENTO ALEATORIO en el que:
Cada muestra posible es un evento
aleatorio.
Podemos identificar:
la probabilidad de cada una y
la distribucin de probabilidad de las muestras.

Podemos definir una variable aleatoria

Ejemplo

Tenemos una poblacin compuesta por 4


escuelas rurales:
A, B, C y D.

Si queremos seleccionar muestras con reemplazo


de tamao n=2, hay 16 muestras posibles:
Muestra 1
Muestra 2
Muestra 3
Muestra 4
Muestra 5
Muestra 6
Muestra 7
Muestra 8
Muestra 9
Muestra
10
Muestra
11
Muestra
12
Muestra
13
Muestra
14

AA
AB
AC
AD
BA
BB
BC
BD
CA

Probabilidad
de cada
muestra
1/16
1/16
1/16
1/16
1/16
1/16
1/16
1/16
1/16

CB

1/16

CC

1/16

CD

1/16

DA

1/16

DB

1/16

CADA MUESTRA TIENE UNA PROBABILIDAD


CONOCIDA DE SER SELECCIONADA.

Ejemplo (continuacin)
Se
quiere estudiar el promedio de maestros por escuela, siendo
que: A=2 maestros; B=4 maestros; C=6 maestros; D=8 maestros .
X= Media de maestros por escuela ().
ALEATORIA.
Media de
Muestr Seleccio maestros por
a
escuela
na
Muestra 1
Muestra 2
Muestra 3
Muestra 4
Muestra 5
Muestra 6
Muestra 7
Muestra 8
Muestra 9
Muestra
10
Muestra
11
Muestra
12
Muestra
13
Muestra
14

AA
AB
AC
AD
BA
BB
BC
BD
CA

2
3
4
5
3
4
5
6
4

CB

CC

CD

DA

DB

es una VARIABLE

Distri
= Media de
b
maestros por proba
escuela
b.P()
2
3
4
5
6
7
8

1/16
2/16
3/16
4/16
3/16
2/16
1/16

0.300
0.250
0.200
0.150
0.100
0.050
0.000
2

ES UNA VARIABLE ALEATORIA del tipo


MEDIA MUESTRAL

Ejemplo (continuacin)
En el ejemplo, as como definimos la variable
aleatoria Media muestral, podramos haber
definido la variable: Proporcin de escuelas
Proporcin de
con ms
de
escuelas
con 5 maestros (p).
Muestra Seleccin
Muestra 1
AA
Muestra 2
AB
Muestra 3
AC
Muestra 4
AD
Muestra 5
BA
Muestra 6
BB
Muestra 7
BC
Muestra 8
BD
Muestra 9
CA
Muestra
10
CB
Muestra
11
CC
Muestra
12
CD
Muestra
13
DA
Muestra
14
DB
Muestra

ms de 5
maestros
0
0
0,5
0,5
0
0
0,5
0,5
0,5
0,5
1

x=
proporcin de
escuelas p
P(X)
0
4/16
0,5
8/16
1
4/16

1
0,5
0,5

p ES UNA VARIABLE ALEATORIA del tipo


PROPORCIN MUESTRAL

Vamos a estudiar 2 variables aleatorias:


Media muestral

Proporcin muestral

Como con todas las v.a, queremos


conocer: la media, la varianza y la
distribucin.
(ES UN EJERCICIO TEORICO!!! )
(No tiene sentido aplicarlo en la
prctica!!)

Cul es el sentido de estudiar y p?


Si realizamos varias muestras, sabemos
que cada una puede dar resultados
diferentes.
Queremos conocer cul sera el
comportamiento de todas las muestras
posibles.
En la prctica, vamos a tener slo una
muestra. Sabiendo cul es el
comportamiento de todas las muestras
posibles, vamos a poder hacer inferencia

V.A Media Muestral

La media (o valor esperado) de todas las medias


obtenidas en infinitas muestras sacadas de una
poblacin ser igual a la media de la poblacin.

x
x X
n

NO podemos saber cul ser la media de una muestra, pero podemos ver
que cualquiera sea su valor fluctuar en torno a su media, con una
dispersin conocida s:

La desviacin estndar de la variable Media Muestral ( o


error tpico/estandar) ser igual a las desviacin
estandar de la poblacin dividida por la raz cuadrada
(Factor de
del nmero de casos de la muestra:

S
correccin

n
s

x grande o muestra con reemplazo


s

Poblacin
Poblacin pequea) o muestra
x
n
n
sin reemplazo
n N 1
Y la distribucin???

Teorema Central del Lmite


(TCL)
Si
se extraen infinitas muestras de
una poblacin con distribucin
normal, o si la distribucin no es
normal, pero su tamao es
suficientemente grande (>=30) la
distribucin de los estadsticos
suma ser NORMAL.
Estadsticos
SUMA

Media Muestral
Proporcin Muestral p

Distribucin
de media de
muestras
para
distintas
poblaciones
y distintos
tamaos de
muestra

Por el TCL, la Distribucin de la


variable Media Muestral es
Normal

en smbolos:

(siempre que la distribucin de la variable sea Normal o


n>=30)
Propiedades de la distribucin normal:
-Simtrica
-Conocida la media y la desviacin, se puede conocer la proporcin
de casos comprendidas en cualquier intervalo de la distribucin

-Se puede conocer la probabilidad de obtener un determinado


valor (una determinada media muestral)

Para qu sirve?
SI
EL MUESTREO ES PROBABILISTICO, la distribucin de la
variable media muestral es NORMAL, por lo que podemos
conocer la probabilidad de obtener cada media en cada
muestra (es decir, la probabilidad de las medias
muestrales).
Por ejemplo, sabemos que el 95,4%
de las medias
x
muestrales se encontrar entre la media de medias
muestrales (que es igual al parmetro Media de la
Poblacin ) y 2 unidades de desvos estndar .
En smbolos: P( =95,4%
Si obtengo una nica muestra, cul es la probabilidad de
que la media (muestral) se encuentre entre la media de la
poblacin y 2 unidades de desvo? 95,4%

En trminos generales:
P(
=??
La proporcin/probabilidad est determinada por z:
Para un z=2, la Proporcin es 95,4%
P(-2 z 2)=0,954

Para un z=1,96, la Proporcin es 95,0%


P(-1,96 z 1,96)=0,95

Para un z=2,57, la Proporcin es 99,0%


P(-2,57 z 2,57)=0,99

P( =

P(a x b)=?

P(
- 2 x + 2 )=0,955

Surge de despejar
en:

P(
- 3 x + 3 )=0,997
P(
- z x + z )=??

P(z z )=
P( z )=
Porque z=

Segn cul sea la


incgnita, vamos a
necesitar una u
otra frmula
(ver ejemplos a
continuacin)

Ejemplo
Sabemos
que la altura promedio de la poblacin de

nios de 12 aos de Crdoba es de =1,4m, con una
desviacin de =1m.
Si se realizan muestras de n=100 nios, entre qu valores
quedar comprendido el 95,4% de las medias de las
muestras ? Y el 95%?
P( =
1= ; 2 =
P(1 =?

La incgnita son los


lmites del intervalo
(1; 2)

Resuelvo:
P( =95,4%
P( =95%

Si las muestras son de n=400 nios, entre qu valores quedar


comprendido el 95% de las medias de las muestras?
P( <=95%

Ejemplo (cont)
Si elijo una nica muestra de n=400,
cul es la probabilidad que de su
media quede comprendida entre
0,05 (es decir, entre 1,35-1,45)?
1

= = 1,35

== 1,45

Convierto a unidades estandarizadas

P(1,35<<1,45)=?
P( <z<)=?

La incgnita es la
proporcin/probabili
dad (P=?), para un
determinado
intervalo. Despejo z
para entrar a la
tabla Normal.

Si
la incgnita son los lmites del
intervalo uso:
P( =
Si la incgnita es la probabilidad de
que la media de la muestra se
encuentre en un intervalo dado, uso:
P( z )=?

V.A Proporcin
Muestral
Proporcin=xitos/eventos posibles

Proporcin=casos favorables/total casos.


Ej: proporcin de ocupados; proporcin de votos
de un candidato; proporcin de pobres, etc etc.

V.A Proporcin
Muestral

El valor esperado/esperanza matemtica/media


de la Proporcin Muestral ser igual a la
Proporcin Poblacional

() =
(la media de todas las proporciones muestrales p ser
parmetro P)

La desviacin de p muestral ser igual a


Siendo P: probabilidad de xito en la poblacin,
Q: probabilidad de fracaso (=1-P) en la poblacin;
n= tamao de la muestra.

La distribucin ser Normal (por TCL).

(Poblaciones grandes o
igual
al con
muestras
reemplazo)

Ejemplo
La
pobreza en Crdoba alcanza el 20% de la poblacin.
Si se realizan infinitas muestras de n=100, entre qu
niveles (proporciones) de pobreza quedar
comprendido
La incgnita son los
el 95% central de las muestras?
lmites del intervalo (1; 2)
para una determinada
P( =95 %
probabilidad

P( =95%
Si las muestras son de n=500 casos?
Si se extrae una nica muestra de 500 casos, cul es la
La incgnita
es la
probabilidad de que el nivel de pobreza
de la muestra
probabilidad p
sea menor a un 25% en esa muestra?
P( 25%)=?
P(z )=?

Para un determinado valor de z, P y Q, los


lmites del intervalo varan segn el
tamao de la muestra:
Por ejemplo, interesa conocer entre qu valores se
encuentra el 95% central de las proporciones
muestrales, de una poblacin en la que el
parmetro es P=20% (y Q=80%).

20,0
P=
%
80,0 (95%central de la
Z=1,96
distribucin)
Q=
%
Estos
n lmites variarn segn
p1 el tamao
p2 de la
muestra:
n
p1
p2
100
0,079
(12,1%
27,9%)
100
(12,1%
400 0,079
0,039
16,1% 27,9%)
23,9%
400 0,039
16,1% 23,9%
500 0,035
16,5% 23,5%
500 0,035
16,5% 23,5%
1000
17,5%
1000 0,025
0,025
17,5% 22,5%
22,5%
2000 0,018
18,2% 21,8%

P(< =
P(<=

Si la muestra es de 100
casos, el 95% central de
las muestras tendr una
proporcin entre 12,1% y
27,9%

1000
40
0
10
0

Ejercicio 1
En una poblacin (grande) el 25% de los
ciudadanos tienen la intencin de votar al
candidato A. Si se extraen infinitas muestras
probabilsticas de 100 casos:
1. entre qu valores quedar comprendida la
proporcin de votantes a ese candidato en el 95%
central de las muestras?
2. si las muestras son de 500 casos, entre qu
valores queda comprendido el 95% central de las
muestras?
3. cul es la probabilidad de obtener una muestra
en la que la proporcin de votantes al candidato A
sea menor a 20%? (para n=100 y n=500)

Resolucin ejercicio 1
P=0,25
1.
n=100
P( =95 %

P( =95 %
2. n=500
P( =95 %
3. P( 0,2)=?
P(z )=?

Z= )= = Z1 (buscamos en la tabla Z1 )

Ejercicio 2
En una poblacin, el 15% de hogares viven bajo la
lnea de pobreza. Si se extraen infinitas muestras
probabilsticas de 200 casos,
1. entre qu proporciones de pobreza quedar
comprendido el 95% central de las muestras?
2. si las muestras son de 800 casos, entre qu
valores queda comprendido el 95% central de las
muestras?
3. se realiz una muestra de 100 hogares en la que
30 hogares eran pobres. cul es la probabilidad de
encontrar una muestra con esas caractersticas?

Resolucin ejercicio 2
P=0,15
1.
n=200
P( =95 %

P( =95 %
2. n=800
P( =95 %
3. n=100 con 30 hogares pobres.
P( 0,3)=?
P(z )=?
Z1= )= = Z1 (buscamos en la tabla Z1 )