Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
EL MUESTREO: QU ES Y POR
QU FUNCIONA
Escrito por Carlos Ochoa el 19 de febrero 2015
Cada vez que miro las estadsticas de este modesto blog,
siempre observo la misma pauta: el trfico de visitas cumple
de forma precisa el principio de Pareto: el 20% de los posts
generan el 80% de las visitas. Y entre este 20% de posts ms
visitados destacan con mucha diferencia los posts dedicados
a cmo calcular el tamao de una muestra representativa
para hacer un estudio de opinin.
Viendo el gran inters que despierta esta cuestin, nos
proponemos inaugurar hoy una serie de posts dedicados al
muestreo: qu es, tcnicas de muestreo, cuando conviene
usar una tcnica u otra, etc. Esperamos que estos contenidos
sean de utilidad, ya sea a estudiantes de investigacin,
personas con curiosidad en estos temas o profesionales que
tengan estos conceptos un poco oxidados.
Qu es el muestreo?
El muestreo es el proceso de seleccionar un conjunto de
individuos de una poblacin con el fin de estudiarlos y poder
caracterizar el total de la poblacin.
La idea es bastante simple. Imagina que queremos saber algo
de un universo o poblacin, por ejemplo, qu porcentaje de
los habitantes de Mxico fuma habitualmente. Una forma de
obtener este dato sera contactar con todos los habitantes de
Mxico (122 millones de personas) y preguntarles si fuman.
La otra forma sera seleccionar un subconjunto de individuos
(por ejemplo, 1.000 personas), preguntarles si fuman y usar
esta informacin como una aproximacin de la informacin
que busco. Pues bien, este grupo de 1.000 personas que me
permiten conocer mejor cmo se comportan el total de
mexicanos es una muestra, y la forma en que los selecciono
es el muestreo.
En la definicin anterior hemos introducido dos trminos
fundamentales a lo largo de esta serie de posts:
Universo o poblacin: Es el total de individuos que
deseo estudiar o caracterizar. En el ejemplo anterior
es la poblacin de Mxico, pero podemos pensar en
todo tipo de universos, ms generales y ms
concretos. Por ejemplo, si quiero saber cuanto fuman
de media los fumadores de Mxico, el universo en este
caso seran los fumadores de Mxico.
El tamao de la muestra
Qu tamao de muestra necesito usar para estudiar cierto
universo? Depende del tamao del universo y del nivel de
error que est dispuesto a aceptar, tal y como explicbamos
Universo
Muestra
necesaria
10
10
100%
100
80
80%
1.000
278
27,8%
10.000
370
3,7%
100.000
383
0,38%
1.000.000
384
0,038%
10.000.000
385
0,004%
100.000.000
385
0,0004%
Los datos anteriores nos dicen que por grande que sea el
universo, con 385 personas puedo estudiar cualquier dato con
el mismo nivel de error (margen de 5%, confianza de 95%).
Por esta razn el muestreo es tan poderoso: nos permite
hacer afirmaciones altamente precisas de una gran cantidad
de individuos a travs de un parte muy pequea de los
mismo.
Como contrapartida, el ejemplo anterior ilustra que el
muestreo no funciona bien en universos pequeos. Si tengo
una clase de 10 alumnos, la opinin de cada uno de ellos es
fundamental para conocer la opinin global, no puedo
prescindir de ninguno. Si no quiero superar el error que nos
hemos propuesto, en un universo de 10 individuos necesito
encuestar a todos ellos.
MUESTREO PROBABILSTICO O
NO PROBABILSTICO
Escrito por Carlos Ochoa el 27 de febrero 2015
Vimos en un reciente post qu es el muestreo y qu ventajas
nos ofrece cuando queremos estudiar una poblacin. Hoy
veremos las dos grandes famlias de tcnicas de muestreo
existentes. Para ello, empezaremos definiendo el concepto
de marco muestral.
Marco muestral
MUESTREO PROBABILSTICO:
MUESTREO ESTRATIFICADO
Escrito por Carlos Ochoa el 16 de abril 2015
Vimos en un post anterior la definicin, ventajas e
inconvenientes del muestreo aleatorio simple. Veamos ahora
el muestreo estratificado.
Poblacin
42,4M
37,6M
23,5M
Proporcin
41,0%
36,3%
22,7%
Muestra
410
363
227
Poblacin
42,4M
37,6M
23,5M
Proporcin
41,0%
36,3%
22,7%
Muestra
334
333
333
(respecto
la
MUESTREO PROBABILSTICO:
MUESTREO SISTEMTICO
Escrito por Carlos Ochoa el 5 de mayo 2015
Siguiendo con nuestra serie de posts dedicados a las tcnicas
de muestreo y tras examinar el muestreo estratificado, hoy
echaremos un vistazo al muestreo sistemtico.
MUESTREO PROBABILSTICO:
MUESTREO POR
CONGLOMERADOS
Escrito por Carlos Ochoa el 18 de mayo 2015
Con este post dedicado al muestreo por conglomerados
cerramos el primer gran bloque de posts dedicados
almuestreo probabilstico. A partir de la prxima publicacin
abordaremos tcnicas de muestreo no probabilstico, las ms
habituales cuando hablamos de investigacin online.
del
muestreo
por
MUESTREO NO
PROBABILSTICO: MUESTREO
POR CONVENIENCIA
Escrito por Carlos Ochoa el 29 de mayo 2015
Iniciamos con este post la segunda parte de nuestra serie
dedicada a tcnicas de muestreo. Esta segunda parte
describir las tcnicas de muestreo no probabilstico.
Recordemos: hablamos de muestreo no probabilstico cuando
no tenemos acceso a una lista completa de los individuos que
forman la poblacin (marco muestral) y, por lo tanto, no
conocemos la probabilidad de que cada individuo sea
seleccionado para la muestra.
La principal consecuencia de esta falta de informacin es que
no podremos generalizar resultados con precisin estadstica.
El muestreo por conveniencia
MUESTREO NO
PROBABILSTICO: MUESTREO
POR CUOTAS
Escrito por Carlos Ochoa el 12 de junio 2015
Llegamos al fin, en nuestra serie de posts dedicada al
muestreo, al mtodo estrella entre los muestreos no
probabilsticos: el muestreo por cuotas. Esta tcnica es la que
suele usarse en investigacin online a travs de
paneles. Podemos ver el muestreo por cuotas como la versin
no probabilstica del muestreo estratificado. Consta de
tres fases:
1. Segmentacin
En primer lugar, dividimos la poblacin objeto de estudio en
grupos de forma exahustiva (todos los individuos estn en un
grupo) y mutuamente exclusiva (un individuo slo puede
estar en un grupo), de forma similar a la divisin en estratos
empleada en el muestreo estratificado. Normalmente esta
segmentacin
se
hace
empleando
alguna
variable
sociodemogrfica como sexo, edad, regin o clase social.
2. Fijamos el tamao de las cuotas
A continuacin, fijamos el objetivo de individuos a encuestar
para cada uno de estos grupos. Normalmente definiremos
estos objetivos de forma proporcional al tamao del grupo en
la poblacin. Por ejemplo, si hemos definido unos segmentos
por sexo en una poblacin en la que hay un 60% de mujeres y
un 40% de hombres, y queremos obtener una muestra de
1.000 personas, definiremos un objetivo de 600 mujeres y 400
hombres. Estos objetivos se conocen como cuotas. En este
ejemplo, tendramos una cuota por sexo de 600 mujeres y
400 hombres. En ocasiones se definen cuotas no
proporcionales a la poblacin, por ejemplo para poder
profundizar en el anlisis de un grupo especfico.
3. Seleccin de participantes y comprobacin de cuotas
Por ltimo, se buscan participantes para cubrir cada una de
las cuotas definidas. En este punto es donde nos alejamos de
un muestreo probabilstico: en el muestreo por cuotas
aceptamos que la seleccin de individuos no sea
aleatoria, puede ser una seleccin mediante muestreo por
conveniencia. Por ejemplo, en un estudio en el que hayamos
definido una cuota de 100 personas menores de 25 aos y
100 personas de 25 o ms aos, podramos salir a la calle y
abordar a las personas que encontramos a nuestro paso,
preguntarles su edad y encuestarlas si no hemos cubierto
nuestro objetivo.
La eleccin de variables
Ventajas e inconvenientes
Algunos ejemplos:
Cuotas geogrficas
MUESTREO NO
PROBABILSTICO: MUESTREO
POR BOLA DE NIEVE
Escrito por Carlos Ochoa el 30 de junio 2015
Finalizamos con este post nuestra serie dedicada a tcnicas
de muestro. Hoy vamos a hablar de una tcnica conocida
como bola de nieve (snowball sampling).
Proceso
El proceso de creacin de una muestra mediante bola de
nieve se fundamenta en usar la red social de unos individuos
iniciales para acceder a un colectivo. Podramos dividir este
proceso en los siguientes pasos:
1. Definir un programa de participacin, en el que se
describa el proceso por el que un individuo invita o
refiere a otros para que participen.
2. Identificar colectivos u organizaciones que puedan
facilitar el acceso a unos individuos iniciales que
cumplan con el rasgo caracterstico del estudio.
3. Obtener contactos iniciales y pedirles su participacin.
Esta parte sera similar a una tcnica de muestreo
convencional, pero destinada a obtener un tamao de
muestra reducido.
4. Solicitar a los participantes, una vez finalizada la
entrevista, el acceso a otros contactos.
5. Asegurar la diversidad de contactos mediante una
correcta seleccin de los individuos iniciales y
promoviendo que la recomendacin no se limite a
contactos muy cercanos.
Ventajas e inconvenientes
Las principales ventajas de esta tcnica son:
Permite muestrear a poblaciones de difcil acceso.
Es un proceso econmico y sencillo.
Otras consideraciones
Sin duda, el principal problema de la bola de nieve es
el riesgo de sesgos de comunidad: accedemos a un
subgrupo de individuos dentro de nuestro target y el
reclutamiento de nuevos miembros no logra salir de ese
subgrupo. El nico remedio contra este mal es hacer una
buena seleccin inicial de individuos, que nos garantice que
cualquier subgrupo existente sea accesible en la red de
contactos de los individuos iniciales.
Cabe destacar que esta tcnica muchas veces es la nica
posible cuando nos dirigimos a colectivos reducidos en los
que no es posible tener un marco muestral. Es por ellos que
muchos investigadores trabajan en perfeccionar la tcnica
para corregir sus sesgos. En concreto, una de las tcnicas ms
prometedores
en
las
que
se
trabaja
se
conoce
como Respondent Driven Sampling, un sistema que trata de