Sei sulla pagina 1di 8

Matemticas. Tema 58.

Pg. 1
TEMA 58

POBLACIN Y MUESTRA. CONDICIONES DE REPRESENTATIVIDAD


DE UNA MUESTRA. TIPOS DE MUESTREO. TAMAO DE UNA
MUESTRA

ndice
1. Introduccin......................................................................................................................................1
2. Poblacin y muestra.........................................................................................................................1
3. Tipos de muestreo. Condiciones de representatividad de una muestra. ..........................................2
3.1. Muestreo aleatorio simple.........................................................................................................2
3.2. Muestreo aleatorio estratificado................................................................................................3
3.3. Muestreo por conglomerado.....................................................................................................3
3.4. Muestreo sistemtico................................................................................................................4
4. Errores de muestreo..........................................................................................................................4
4.1. Error de muestreo de la media y de las proporciones...............................................................4
4.2. Error mximo admisible...........................................................................................................5
4.3. Factores que determinan el error..............................................................................................6
5. Tamao de la muestra ......................................................................................................................6
6. Bibliografa.......................................................................................................................................7

1. Introduccin
Uno de los objetivos de la estadstica es hacer una inferencia con respecto a un colectivo
(poblacin), basndose en la informacin contenida en parte de ese colectivo (muestra). Ahora bien,
la recoleccin de datos acerca de un fenmeno, una situacin particular, no es una tarea trivial.

2. Poblacin y muestra
En estadstica, se llama poblacin al conjunto de individuos o elementos cuyo estudio nos
interesa.
No siempre es posible analizar cada elemento de una poblacin, ya sea por razones econmicas,
de rapidez en la obtencin de la informacin deseada, por personal disponible, porque los elementos
se destruyen al analizarlos, etc. De ah que slo se examine una parte.
Llamamos muestra a un subconjunto limitado extrado de una poblacin, con objeto de reducir
el nmero de experiencias.
Si la investigacin se dirige a toda la poblacin diremos que estamos realizando un censo. Si
recogemos datos de informacin slo de una muestra, diremos que estamos realizando una encuesta
o sondeo. A veces se habla de encuesta exhaustiva para referirse a un censo.
Al efectuar un censo, podemos observar el valor que toma una caracterstica X en cada uno de los

Matemticas. Tema 58.

Pg. 2

individuos de la poblacin, y por tanto se conoce la distribucin de la variable X, luego no es


necesario utilizar mtodos de inferencia estadstica.
Si, por el contrario, la caracterstica X la observamos en una muestra de la poblacin, para
utilizar adecuadamente la inferencia estadstica, hemos de pedir a la muestra que nos proporcione
alguna informacin interesante de la poblacin, es decir, hemos de prescindir de las muestras
seleccionadas segn criterios personales o no aleatorios. Surge, pues, de modo natural la necesidad
de cuantificar los errores de muestreo, esto es, los errores que cometemos al efectuar la estimacin.
Los elementos de la muestra han de ser elegidos por procedimientos aleatorios, a los que podremos
aplicar los mtodos de la inferencia estadstica para medir los errores de muestreo. Operando de esta
forma estamos ante un muestreo probabilistico y estamos obteniendo muestras representativas.
Cuando la seleccin de los elementos de la muestra no se hace as, estamos ante un muestreo
opintico y no vamos a poder medir la diferencia existente entre el valor observado en la muestra y
el verdadero valor en la poblacin.
En poblaciones homogneas, es decir, poblaciones en las que cualquier subconjunto tiene
caractersticas anlogas al conjunto, las muestras suelen ser muy representativas.

3. Tipos de muestreo. Condiciones de representatividad de una


muestra.
La clave de un procedimiento de muestreo es garantizar que la muestra sea representativa de la
poblacin y aleatoria. La condicin de representatividad est asociada al tamao de la muestra
(mientras ms grande, ms informacin proporcionar y por tanto, ms representativa ser). Y si la
muestra no es aleatoria, corremos el peligro de coger una subpoblacin que cumpla una
determinada condicin, con lo que perdemos el principio de representatividad.
Para aumentar la representatividad sin aumentar el tamao de la muestra, se recurre al muestreo
o tcnicas de muestreo. Hay varios tipos de muestreo.

3.1. Muestreo aleatorio simple.


Decimos que una muestra es aleatoria simple cuando:
1. Cada elemento de la poblacin tiene la misma probabilidad de ser elegido
2. Las observaciones se realizan con reemplazamiento, de manera que la poblacin es idntica en
todas las extracciones.
La representatividad viene garantizada por tener cada elemento la misma probabilidad de ser
elegido. As, si un 30% de la poblacin tiene una caracterstica dada, se obtendr por trmino medio
un 30% de los elementos de la muestra con esa caracterstica.
Para seleccionar una muestra por ste mtodo de una poblacin finita se utilizan frecuentemente
los nmeros aleatorios de la siguiente forma: se numeran los elementos de la poblacin de 1 a N y
se toman nmeros de tantas cifras como tenga N. El valor del nmero aleatorio indicar el elemento
a seleccionar.
Debe utilizarse cuando los elementos de la poblacin son homogneos respecto a la caracterstica
a estudiar.

Matemticas. Tema 58.

Pg. 3

3.2. Muestreo aleatorio estratificado.


Cuando disponemos de informacin sobre la poblacin es conveniente tenerla en cuenta. En estos
casos interesa que la muestra tenga una composicin anloga a la poblacin. (Por ejemplo, en las
encuestas de opinin, los elementos de la poblacin (personas) son heterogneas en razn a su edad,
sexo, profesin, etc.)
Se denomina muestreo estratificado aqul en que los elementos de la poblacin se dividen en
clases o estratos. La muestra se toma asignando un nmero o cuota (ni) de mienbros a cada estrato y
escogiendo los elementos por muestreo aleatorio simple dentro del estrato.
Para determinar la cuota de cada estrato denominaremos por N1, , Nk al tamao de cada estrato,
por lo que ser N = N1 + + Nk el tamao total de la poblacin. Existen dos criterios para
garantizar la representatividad:
a) la cuota de cada estrato es proporcional al tamao de la misma. Se tomarn cuotas
n j=n

Nj
,
N

n=n 1nk

b) la cuota es proporcional a la variabilidad de cada estrato. Si las desviaciones tpicas de cada


estrato son 1 , , k , las cuotas valdran:
n j=n

jN j
k

n=n1n k

iN i
i=1

Funciona tanto mejor cuanto mayores sean las diferencias entre los estratos y ms homogneos
sean estos internamente.

3.3. Muestreo por conglomerado.


Existen situaciones en las que no se dispone de una lista con el nmero de elementos de la
poblacin ni de los posibles estratos. Sin embargo, los elementos de la poblacin se encuentran de
manera natural agrupados en conglomerados, cuyo nmero s se conoce. Por ejemplo, la poblacin
se divide en provincias, los habitantes de una ciudad en barrios, etc.
Si podemos suponer que cada uno de estos conglomerados es una muestra representativa de la
poblacin total respecto a la variable que se estudia, podemos seleccionar alguno de estos
conglomerados al azar y, dentro de ellos, analizar todos sus elementos o una muestra. Este mtodo
se conoce como muestreo por conglomerados o de rea.
Un inconveniente es que si los conglomerados son heterogneos entre s, como slo se analizan
algunos de ellos, la muestra final puede no ser representativa de la poblacin.
Como ventaja, simplifica mucho la recogida de informacin de la muestra.
Funcionan si hay muy pocas diferencias entre ellos y son muy heterogneos internamente
(incluyen toda la variedad de la poblacin dentro de cada uno de ellos).

Matemticas. Tema 58.

Pg. 4

3.4. Muestreo sistemtico


Cuando los elementos de la poblacin estn ordenados en listas, puede utilizarse el muestreo
sistemtico. Consiste en elegir el primer elemento de la muestra al azar y los restantes
seleccionarlos conforme a una regla predeterminada, por ejemplo, seleccionar los que ocupan un
lugar mltiplo de tres a partir del primero elegido.
Si el orden de los elementos en la lista es al azar, este procedimiento tendr la misma
representatividad que en el muestreo aleatorio simple, aunque resulta ms fcil de llevar a cabo sin
errores. Si el orden de los elementos es tal que los individuos prximos tienden a ser ms
semejantes que los alejados, el muestreo sistemtico tiende a ser ms preciso que el aleatorio, al
cubrir ms homogneamente toda la poblacin.
El muestreo sistemtico puede utilizarse conjuntamente con el estratificado para seleccionar la
muestra dentro de cada estrato.

4. Errores de muestreo
La muestra es un subconjunto o parte de una poblacin y por bien que la elijamos siempre
existir una diferencia entre los resultados obtenidos en la muestra y los que pudieran obtenerse al
utilizar la poblacin entera.
El error muestral se obtendr al realizar el estudio a la muestra y el estudio a la poblacin, pero
esto en la prctica es imposible. Por eso cuando se habla de error muestral, se entiende no a ste
error, sino a un error muestral determinado estadsticamente, vlido para todas las posibles muestras
del mismo tamao.
La media de las muestras, si los procedimientos de eleccin de la muestra no son sesgados, debe
coincidir con la media poblacional.
Se define pues, el error muestral o error de muestreo como la desviacin tpica de la
distribucin muestral de las medias o de las proporciones.

4.1. Error de muestreo de la media y de las proporciones.


El error muestral de la media viene dado por:
X=

N n

,
n N 1

donde N = tamao de la poblacin, n = tamao de la muestra y = desviacin tpica de la


poblacin.
Si se desconoce la desviacin tpica de la poblacin ( ), pero se conoce la de la muestra ( s ),
entonces queda:
X=

s
N n

,
n1 N

donde N = tamao de la poblacin, n = tamao de la muestra y s = desviacin tpica de la


muestra.

Matemticas. Tema 58.

Pg. 5

Llamaremos Factor de correccin para poblaciones finitas (c.p.f.) a

N n , y para
N 1

poblaciones muy grandes (N 100.000) tiende a 1, quedando el error de muestreo para poblaciones
infinitas reducido a:
X=

El error de muestreo de la proporcin viene dado por:


p=

pq N n

,
n N 1

donde N = tamao de la poblacin, n = tamao de la muestra , p = proporcin y q = 1 p.


Igualmente, para N 100.000, p=

pq
n

4.2. Error mximo admisible


Se acepta un riesgo razonable de equivocarnos ya que a mayor seguridad, mayor ser el tamao
de la muestra y mayores los costes en tiempo y dinero.
La probabilidad de que la media muestral X y la media poblacional se diferencien en menos
de una cantidad d (error mximo admisible o error probable) nos la da el nivel de confianza
elegido (1 ):
P X d =1

Desarrollando:

(1)

P X d X d =1

Se define, por tanto, el nivel de confianza como la probabilidad de que la diferencia entre el
estimador y el parmetro que se quiere estimar sea menor que la cota de error.
El nivel de confianza suele establecerse entre 0,95 y 0,99. Un nivel de confianza establecido da
lugar a un intervalo de confianza o de seguridad formado por X d ( X d , X d ).

en la expresin (1) y tipificando, se tiene:


n

Tomando d =k
P

X
k =1

P Zk =1 ,

donde Z~ N 0,1

es decir, Z sigue una distribucin normal de media 0 y varianza 1.


Por lo tanto, tenemos que k =Z .
2

En general, d =k x
Igualmente, es vlido para una distribucin de muestra conocidas las proporciones: d =k p

Matemticas. Tema 58.

Pg. 6

4.3. Factores que determinan el error.


Resumiendo, podemos destacar como factores principales que determinan el error los siguientes:
1. Tamao de la poblacin. Puede ser finita o infinita.
2. Tamao de la muestra. Cuanto mayor es, menor es el error muestral.
3. Nivel de confianza. Representa el porcentaje de probabilidad o seguridad elegida. Cuando no
nos lo indiquen, tendremos que elegirlo nosotros. Si (1 ) % es el nivel de confianza, % es el
nivel de rechazo o nivel de riesgo.
4. Desviacin tpica. A mayor desviacin tpica, mayor error.

5. Tamao de la muestra
En un estudio muestral, hay dos cuestiones fundamentales: cmo elegir la muestra? cul debe
ser el tamao de la muestra?
Intuitivamente, parece lgico que si la muestra sobre la que se hace la encuesta tiene un tamao
pequeo, los resultados o conclusiones que de ella se extraigan sern poco fiables. Por otra parte, si
el tamao de la muestra es muy grande, resulta enormemente costosa, por lo que su realizacin no
ser conveniente. Es cierto que cuanto mayor sea el tamaode la muestra, mayor ser la precisin
obtenida, pero llegar un momento en que el aumento de los gastos no se ver compensado con un
aumento significativo de la precisin.
El tamao de la muestra depende del tamao de la poblacin, del nivel de confianza adoptado,
del error mximo admisible y de la desviacin tpica.
Para obtener el tamao de la muestra, partimos de la expresin del error mximo admisible; por
ejemplo en funcin de la media:
N n

, para una poblacin finita.


n N 1

d = k X = k
Despejando n, queda:

NK 2 2
n =
N 1 d 2 K 2 2
Si la poblacin es infinita, los clculos se reducen bastante, pues el coeficiente de correccin
(c.p.f) para poblaciones infinitas se hace uno y queda:

d = k

n =

k 2 2
d2

Si partimos de la expresin del error mximo admisible en funcin de la proporcin tendremos:


d = k p =
Y despejando n, queda:

pq N n

, para una poblacin finita.


n N 1

Matemticas. Tema 58.

Pg. 7

NK 2pq
n =
N 1 d 2 K 2pq
Si la poblacin es infinita, la expresin se reduce a n =

K 2pq
d2

Cuando el error admisible d viene expresado en porcentaje, tambin se expresan p y q en


porcentaje.
Cuando no se conoce la proporcin p se estima para el caso ms desfavorable, es decir, que tanto
K2
p como q valgan 0,5 , quedando n =
2 , y expresando el error admisible en tanto por
4d
uno.

6. Bibliografa

Sixto Rios. Mtodos estadsticos

Cramer. Mtidos matemticos de Estadstica

Cramer. Teora de probabilidades y aplicaciones

Potrebbero piacerti anche