Sei sulla pagina 1di 5

Qu es el muestreo?

El muestreo es el proceso de seleccionar un conjunto de individuos de una


poblacin con el fin de estudiarlos y poder caracterizar el total de la poblacin.
La idea es bastante simple. Imagina que queremos saber algo de un universo o
poblacin, por ejemplo, qu porcentaje de los habitantes de Mxico fuma
habitualmente. Una forma de obtener este dato sera contactar con todos los
habitantes de Mxico (122 millones de personas) y preguntarles si fuman. La
otra forma sera seleccionar un subconjunto de individuos (por ejemplo, 1.000
personas), preguntarles si fuman y usar esta informacin como una
aproximacin de la informacin que busco. Pues bien, este grupo de 1.000
personas que me permiten conocer mejor cmo se comportan el total de
mexicanos es una muestra, y la forma en que los selecciono es el muestreo.
En la definicin anterior hemos introducido dos trminos fundamentales a lo
largo de esta serie de posts:

Universo o poblacin: Es el total de individuos que deseo estudiar o


caracterizar. En el ejemplo anterior es la poblacin de Mxico, pero
podemos pensar en todo tipo de universos, ms generales y ms
concretos. Por ejemplo, si quiero saber cuanto fuman de media los
fumadores de Mxico, el universo en este caso seran los fumadores de
Mxico.

Muestra: Es el conjunto de individuos del universo que selecciono para


estudiarlos, por ejemplo a travs de una encuesta.

Por qu funciona el muestreo?


El muestreo es til gracias a que podemos acompaarlo de un proceso inverso,
que llamamos generalizacin. Es decir, para conocer un universo lo que
hacemos es (1) extraer una muestra del mismo, (2) medir un dato u opinin y
(3) proyectar en el universo el resultado observado en la muestra. Esta
proyeccin o extrapolacin recibe el nombre de generalizacin de resultados.
La generalizacin de resultados aade cierto error al mismo. Imagina que
tomamos una muestra al azar de 1.000 personas de Mxico y les preguntamos
si fuman. Obtengo que el 25% de la muestra fuma. La simple lgica nos dice
que si de 1.000 mexicanos elegidos al azar el 25% fuma, este dato debera ser
indicativo de lo que obtendramos si preguntsemos a los 122 millones de
mexicanos. Ahora bien, el azar podra haber hecho que haya escogido para mi

muestra ms fumadores de lo que correspondera a la proporcin exacta que


hay en el universo o, por el contrario, que en mi muestra los fumadores estn
algo infra-representados. El azar podra hacer que el porcentaje de fumadores
en la poblacin fuese algo diferente del 25% que hemos observado en la
muestra (tal vez un 25,2%, por ejemplo). Por lo tanto, la generalizacin de
resultados de un muestra a un universo conlleva aceptar que cometemos cierto
error, tal y como ilustra el siguiente esquema.

Afortunadamente, el error que cometo al generalizar resultados puede acotarse


gracias a la estadstica. Para ello usamos dos parmetros: el margen de error,
que es la mxima diferencia que esperamos que haya entre el dato
observado en mi muestra y el dato real en el universo, y el nivel de confianza,
que es el nivel de certeza que tengo de que realmente el dato real est dentro
del margen de error.
Por ejemplo, en nuestro caso de fumadores mexicanos, si selecciono una
muestra de 471 individuos y les pregunto si fuman, el resultado que obtenga

tendr un margen de error mximo de +-5% con un nivel de confianza del 97%.
Esta forma de expresar los resultados es la correcta cuando usamos muestreo.
El tamao de la muestra
Qu tamao de muestra necesito usar para estudiar cierto universo? Depende
del tamao del universo y del nivel de error que est dispuesto a aceptar, tal y
como explicbamos en su da en este post. Cuanta ms precisin exija, mayor
muestra necesito. Si quiero tener una certeza absoluta en mi resultado, hasta el
ltimo decimal, mi muestra tendr que ser tan grande como mi universo.
Pero el tamao de la muestra tiene una propiedad fundamental que explica
porqu el muestreo se usa tanto en tantos mbitos del conocimiento. Esta
propiedad podra resumirse como sigue: a medida que estudio universos
mayores, el tamao de muestra que necesito cada vez representa un
porcentaje menor de dicho universo.
Este fenmeno lo explican de forma muy didctica en Gaussianos.com, un
interesante blog dedicado a las matemticas. Supongamos que queremos
hacer una encuesta para saber un porcentaje (podra ser el de gente que fuma)
con un nivel de error determinado, por ejemplo un margen de error del 5% y
una confianza del 95%. Si el universo a estudiar fuese de tan slo 100
personas, mi muestra tendra que ser de 79,5 individuos (es decir, 79,5% del
universo, lo que representa un parte muy importante del total del universo). Si
el universo fuese de 1.000 personas, mi muestra debera ser de 277,7
personas (27,7% del universo). Y si mi universo fuese de 100.000 personas, la
muestra necesaria sera de 382,7 personas (3,83% del universo).
Por lo tanto, a medida que trabajo con universos ms grandes, la muestra que
necesito debe ir creciendo pero de forma no proporcional, tiende a estancarse y
cada vez representa un porcentaje ms pequeo del universo. De hecho, a
partir de cierto tamao de universo (en torno a 100.000 individuos), el tamao
de la muestra ya no necesita crecer ms. La siguiente tabla nos muestra
algunos ejemplos:
Tamao de muestra necesaria para tener un error del 5% con un nivel de
confianza del 95%

Universo

Muestra
necesaria

10

10

100%

100

80

80%

1.000

278

27,8%

10.000

370

3,7%

100.000

383

0,38%

1.000.000

384

0,038%

10.000.000

385

0,004%

100.000.000 385

0,0004%

Los datos anteriores nos dicen que por grande que sea el universo, con 385
personas puedo estudiar cualquier dato con el mismo nivel de error (margen de
5%, confianza de 95%). Por esta razn el muestreo es tan poderoso: nos
permite hacer afirmaciones altamente precisas de una gran cantidad de
individuos a travs de un parte muy pequea de los mismo.
Como contrapartida, el ejemplo anterior ilustra que el muestreo no funciona
bien en universos pequeos. Si tengo una clase de 10 alumnos, la opinin de
cada uno de ellos es fundamental para conocer la opinin global, no puedo
prescindir de ninguno. Si no quiero superar el error que nos hemos propuesto,
en un universo de 10 individuos necesito encuestar a todos ellos.
Ventajas e inconvenientes del muestreo
Resumimos a continuacin las principales ventajas e inconvenientes de usar
muestreo frente a estudiar todo un universo.
Ventajas:

Necesitamos estudiar menos individuos, necesitamos menos recursos


(tiempo y dinero).

La manipulacin de datos es mucho ms simple. Si con una muestra de


1.000 personas tengo suficiente, para qu quiero analizar un fichero de
millones de registros?

Inconvenientes:

Introducimos error (controlado) en el resultado, debido a la propia


naturaleza del muestreo y a la necesidad de generalizar resultados.

Tenemos el riesgo de introducir sesgos debido a una mala seleccin de


la muestra. Por ejemplo, si la forma en que selecciono individuos para la
muestra no es aleatoria, mis resultados pueden verse seriamente
afectados.

La muestra aleatoria simple: definicin y alternativas


La teora del muestreo se basa en el concepto de muestra aleatoria simple.
Una muestra aleatoria simple es aquella muestra en la que se seleccionan
individuos del universo de forma totalmente aleatoria. Esto implica que todos
los individuos deben tener idntica probabilidad (no nula) de ser seleccionados
en mi muestra.
Pero una cosa es la teora y otra la prctica. Slo en entornos muy controlados
es posible hacer muestras aleatorias. Por otra parte, cuando tenemos
universos compuestos por grupos homogneos (entre si) de personas,
podemos aprovechar esta agrupacin para mejorar la calidad de mi muestra (o
reducir el tamao de la misma).

Potrebbero piacerti anche