Sei sulla pagina 1di 57

MUESTREO

 ¿Qué es el muestreo?
 El muestreo es el proceso de seleccionar un conjunto
de individuos de una población con el fin de
estudiarlos y poder caracterizar el total de la
población.
Ejemplo
 Imaginemos que queremos saber algo de un
universo o población, por ejemplo, qué porcentaje de
los habitantes de Guatemala fuma habitualmente.

 Una forma de obtener este dato sería contactar con
todos los habitantes de Guatemala (16 millones de
personas) y preguntarles si fuman.
 La otra forma sería seleccionar un subconjunto de
individuos (por ejemplo, 1,000 personas),
preguntarles si fuman y usar esta información como
una aproximación de la información que buscamos.

 Pues bien, este grupo de 1,000 personas que me


permiten conocer mejor cómo se comportan el total
de guatemaltecos es una Muestra, y la forma en que
los selecciono es el Muestreo.
 En la definición anterior hemos introducido
dos términos fundamentales Universo o población:
Es el total de individuos que deseo estudiar o
caracterizar.

 En el ejemplo anterior es la población de Guatemala,


pero podemos pensar en todo tipo de universos, más
generales y más concretos. Por ejemplo, si quiero
saber cuántos fumadores hay en Guatemala, el
universo en este caso serían “los fumadores de
Guatemala”.
MUESTRA
 Es el conjunto de individuos del universo que selecciono
para estudiarlos, por ejemplo a través de una encuesta.
 ¿Por qué funciona el muestreo?
 El muestreo es útil gracias a que podemos acompañarlo
de un proceso inverso, que llamamos generalización. Es
decir, para conocer un universo lo que hacemos es:
 (1) Extraer una muestra del mismo,
 (2) Medir un dato u opinión y
 (3) Proyectar en el universo el resultado observado en la
muestra. Esta proyección o extrapolación recibe el
nombre de Generalización de resultados.
 La generalización de resultados añade cierto error al
mismo. Imagina que tomamos una muestra al azar de
1,000 personas de Guatemala y les preguntamos si
fuman.
 Obtengo que el 25% de la muestra son fumadores. La
simple lógica nos dice que si de 1,000 guatemaltecos
elegidos al azar el 25% fuma, este dato debería ser
indicativo de lo que obtendríamos si preguntásemos
a los 16 millones de guatemaltecos
 Afortunadamente, el error que cometo al generalizar
resultados puede acotarse gracias a la estadística.
Para ello usamos dos parámetros:
 El Margen de error, que es la máxima diferencia que
esperamos que haya entre el dato observado en mi
muestra y el dato real en el universo, y el nivel de
confianza, que es el nivel de certeza que tengo de
que realmente el dato real esté dentro del margen de
error.
 Por ejemplo, en nuestro caso de fumadores
guatemaltecos, si selecciono una muestra de 471
individuos y les pregunto si fuman, el resultado que
obtenga tendrá un margen de error máximo de +-5%
con un nivel de confianza del 97%. Esta forma de
expresar los resultados es la correcta cuando usamos
muestreo.
El tamaño de la muestra

 ¿Qué tamaño de muestra necesito usar para estudiar


cierto universo? Depende del tamaño del universo y
del nivel de error que esté dispuesto a aceptar.
Cuanta más precisión exija, mayor muestra necesito.

 Si quiero tener una certeza absoluta en mi resultado,


hasta el último decimal, mi muestra tendrá que ser
tan grande como mi universo.
 Pero el tamaño de la muestra tiene una propiedad
fundamental que explica porqué el muestreo se usa
tanto en tantos ámbitos del conocimiento.

 Esta propiedad podría resumirse como sigue: a


medida que estudio universos mayores, el tamaño de
muestra que necesito cada vez representa un
porcentaje menor de dicho universo.
 Supongamos que queremos hacer una encuesta para
saber un porcentaje (podría ser el de gente que
fuma) con un nivel de error determinado, por
ejemplo un margen de error del 5% y una confianza
del 95%. Si el universo a estudiar fuese de tan sólo
100 personas, mi muestra tendría que ser de 79.5
individuos (es decir, 79.5% del universo, lo que
representa un parte muy importante del total del
universo).
 Si el universo fuese de 1.000 personas, mi muestra
debería ser de 277.7 personas (27.7% del universo). Y
si mi universo fuese de 100,000 personas, la muestra
necesaria sería de 382.7 personas (3.83% del
universo).
 Por lo tanto, a medida que trabajo con universos más
grandes, la muestra que necesito debe ir creciendo
pero de forma no proporcional, tiende a estancarse y
cada vez representa un porcentaje más pequeño del
universo.

 De hecho, a partir de cierto tamaño de universo (en


torno a 100,000 individuos), el tamaño de la muestra
ya no necesita crecer más.
 La siguiente tabla nos muestra algunos ejemplos:
Tamaño de muestra necesaria para
tener un error del 5% con un nivel de
confianza del 95%
 Universo Muestra necesaria %
 10 10 100%
 100 80 80%
 1.000 278 27.8%
 10.000 370 3.7%
 100.000 383 0.38%
 1.000.000 384 0.038%
 10.000.000 385 0.004%
 100.000.000 385 0.0004%
 Los datos anteriores nos dicen que por grande que
sea el universo, con 385 personas puedo estudiar
cualquier dato con el mismo nivel de error (margen
de 5%, confianza de 95%).

 Por esta razón el muestreo es tan poderoso: nos


permite hacer afirmaciones altamente precisas de
una gran cantidad de individuos a través de un parte
muy pequeña del mismo.
 Como contrapartida, el ejemplo anterior ilustra que el
muestreo no funciona bien en universos pequeños.
 Si tengo una clase de 10 alumnos, la opinión de cada
uno de ellos es fundamental para conocer la opinión
global, no puedo prescindir de ninguno. Si no quiero
superar el error que nos hemos propuesto, en un
universo de 10 individuos necesito encuestar a todos
ellos.
 Inconvenientes:
 Introducimos error (controlado) en el resultado,
debido a la propia naturaleza del muestreo y a la
necesidad de generalizar resultados.
 Tenemos el riesgo de introducir sesgos debido a una
mala selección de la muestra.
 Por ejemplo, si la forma en que selecciono individuos
para la muestra no es aleatoria, mis resultados
pueden verse seriamente afectados.

LA MUESTRA ALEATORIA SIMPLE
 Definición y alternativas
 Muestra aleatoria simple:

 Una muestra aleatoria simple es aquella muestra en


la que se seleccionan individuos del universo de
forma totalmente aleatoria. Esto implica que todos
los individuos deben tener idéntica probabilidad (no
nula) de ser seleccionados en mi muestra.
 Pero una cosa es la teoría y otra la práctica. Sólo en
entornos muy controlados es posible hacer muestras
aleatorias. Por otra parte, cuando tenemos universos
compuestos por grupos homogéneos (entre sí) de
personas, podemos aprovechar esta agrupación para
mejorar la calidad de mi muestra (o reducir el tamaño
de la misma)
MUESTREO
PROBABILÍSTICO O NO
PROBABILÍSTICO
 Marco muestral
Es una lista de elementos que componen el universo
que queremos estudiar y de la cual se extrae la
muestra. Estos elementos a investigar pueden ser
individuos, pero también pueden ser hogares,
instituciones y cualquier otra cosa susceptible de ser
investigada. Cada uno de estos elementos presentes en
el marco muestral se conoce como unidades
muestrales.
 Ejemplo:
 Supongamos que queremos medir la satisfacción de
los clientes de una empresa. Para poder generar un
marco muestral, podríamos acceder al sistema
informático de la empresa y extraer una lista de todas
las personas que han contratado un producto en el
último año. Cada una de las personas de esa lista
serían unidades muestrales. Seleccionando un
conjunto de estos clientes, obtendría una muestra.
 La proporción existente entre el tamaño de la
muestra y el tamaño del marco muestral se conoce
como fracción muestral, y ya vimos en un post
anterior que esta fracción junto al tamaño del marco
muestral, define la precisión de los resultados que
obtendré al encuestar la muestra.
 El muestreo probabilístico:
 Es una técnica de muestreo en virtud de la cual las
muestras son recogidas en un proceso que brinda a
todos los individuos de la población las mismas
oportunidades de ser seleccionados.
 En esta técnica de muestreo, el investigador debe
garantizar que cada individuo tenga las mismas
oportunidades de ser seleccionado y esto se puede
lograr si el investigador utiliza la aleatorización
 La ventaja de utilizar una muestra aleatoria es la
ausencia de sesgos de muestreo y sistemáticos. Si la
selección aleatoria se hace correctamente, la muestra
será representativa de toda la población.
 Muestreo probabilístico
 Hablaremos de muestro probabilístico siempre que
se cumplan dos condiciones:

(1) Todos los elementos de mi población tienen una


probabilidad mayor de cero de ser seleccionados en la
muestra.
(2) Conozco de forma precisa dicha probabilidad para
cada elemento, lo que se conoce como probabilidad de
inclusión.
 El cumplimiento de ambos criterios es el que hace
posible obtener resultados no sesgados cuando se
estudio la muestra.
 En ocasiones, estos resultados no sesgados requieren
usar técnicas de ponderación , pero esta ponderación
es posible precisamente porque conozco qué
probabilidad tengo de que cada individuo sea
seleccionado en mi muestra. Las muestras generadas
en estas condiciones se conocen también
como muestras probabilísticas.
 La definición anterior nos lleva a concluir que sólo
podemos hacer muestreo probabilístico si dispongo
de un marco muestral.
 El censo de un país, el conjunto de direcciones de
hogares en una población o la lista de clientes de una
empresa, son ejemplos de marcos muestrales que
hacen posible un muestreo probabilístico.
 En cada uno de estos casos, el universo a estudiar es
diferente: habitantes de un país, hogares de una
población y clientes de una empresa,
respectivamente.
 Una vez tengo un marco muestral, la forma exacta
que empleo para seleccionar mi muestra define las
diferentes técnicas de muestreo probabilístico:
 Muestreo aleatorio simple, muestreo sistemático,
muestreo estratificado, muestreo por
conglomerados, muestreo desproporcionado… etc.
 Muestreo no probabilístico

 El muestreo no probabilístico es una técnica de


muestreo donde las muestras se recogen en un
proceso que no brinda a todos los individuos de la
población iguales oportunidades de ser
seleccionados.
 La mayoría de los investigadores tienen limitaciones
temporales, monetarias y de mano de obra y, gracias
a ellas, es casi imposible tomar una muestra aleatoria
de toda la población.
 Generalmente, es necesario emplear otra técnica de
muestreo, la técnica de muestreo no probabilístico
 A diferencia del muestreo probabilístico, la muestra
no probabilística no es un producto de un proceso de
selección aleatoria.
 Los sujetos en una muestra no probabilística
generalmente son seleccionados en función de su
accesibilidad o a criterio personal e intencional del
investigador.
 La desventaja del método de muestreo no
probabilístico es que no se toman pruebas de una
porción desconocida de la población. Esto implica
que la muestra puede representar a toda la población
con precisión o no. Por lo tanto, los resultados de la
investigación no pueden ser utilizados
en generalizaciones respecto de toda la población
TIPOS DE MUESTREO NO
PROBABILÍSTICO
1. EL MUESTREO POR CONVENIENCIA:
 Es probablemente la técnica de muestreo más
común. En el muestreo por conveniencia, las
muestras son seleccionadas porque son accesibles
para el investigador.
 Los sujetos son elegidos simplemente porque son
fáciles de reclutar. Esta técnica es considerada la más
fácil, la más barata y la que menos tiempo lleva.
 2. MUESTREO CONSECUTIVO:
 Es muy similar al muestreo por conveniencia, excepto
que intenta incluir a TODOS los sujetos accesibles
como parte de la muestra.
 Esta técnica de muestreo no probabilístico puede ser
considerada la mejor muestra no probabilística, ya
que incluye a todos los sujetos que están disponibles,
lo que hace que la muestra represente mejor a toda
la población.
 3. MUESTREO POR CUOTAS:

 Es una técnica de muestreo no probabilístico en


donde el investigador asegura una representación
equitativa y proporcionada de los sujetos, en función
de qué rasgo es considerado base de la cuota.
 Por ejemplo, si la base de la cuota es de nivel de año
en la universidad y el investigador necesita una
representación igual, con un tamaño de muestra de
100, debe seleccionar 25 estudiantes de 1º año, 25
de 2° año, 25 de 3º año y 25 de 4º año.
 Las bases de la cuota generalmente son la edad, el
género, la educación, la etnia, la religión y el nivel
socioeconómico.
 4. MUESTREO DISCRECIONAL:

 Es más comúnmente conocido como muestreo


intencional. En este tipo de toma de muestras, los
sujetos son elegidos para formar parte de la muestra
con un objetivo específico.
 Con el muestreo discrecional, el investigador cree
que algunos sujetos son más adecuados para la
investigación que otros. Por esta razón, aquellos son
elegidos deliberadamente como sujetos.
5. MUESTREO DE BOLA DE NIEVE:
 Se lleva a cabo generalmente cuando hay una
población muy pequeña. En este tipo de muestreo, el
investigador le pide al primer sujeto que identifique a
otro sujeto potencial que también cumpla con los
criterios de la investigación. La desventaja de usar
una muestra de bola de nieve es que difícilmente sea
representativa de la población.

ERROR DE MUESTREO

 El error de muestreo es la desviación de la muestra


seleccionada de las verdaderas características, rasgos,
comportamientos, cualidades o figuras de toda la
población
¿Por qué sucede este error?

 El error del proceso de muestreo ocurre cuando los


investigadores toman diferentes sujetos de la misma
población, y aún así, los sujetos tienen diferencias
individuales. Hay que recordar que cuando se toma
una muestra, se trata de un subconjunto de toda la
población y, por lo tanto, puede haber una diferencia
entre la muestra y la población.
 La causa más frecuente de dicho error es un
procedimiento de muestreo sesgado. Todo
investigador debe tratar de establecer una muestra
que esté libre de sesgos y sea representativa de toda
la población. Así, el investigador es capaz de
minimizar o eliminar el error de muestreo.
 El resultado más común de error de muestreo es
el error sistemático en donde los resultados de la
muestra difieren significativamente de los resultados
de toda la población.
 Se entiende que si la muestra no es representativa
de toda la población, lo más probable es que los
resultados de la muestra difieran de los resultados de
toda la población.
EL SESGO:

 Sesgo proviene de sesgar, un verbo que hace


referencia a torcer o atravesar algo hacia uno de
sus lados. El término, por lo tanto, se utiliza para
hablar de algo torcido, cortado o que se sitúa de
forma oblicua.
 Es la inclinación del temperamento o la razón hacia
un punto de vista, posición o creencia determinada, a
tal punto que se vuelve complicado incluso el
considerar los méritos de otros posibles puntos de
vista.
 La gente puede tener sesgos que se inclinen hacia
una determinada ideología política, religión, clase
social, raza, sexo o asunto social, por mencionar
algunos.
 SESGO ESTADISTICO
 Propiedad de una muestra estadística que hace que
los resultados no sean representativos de toda la
población. Si hacemos una prueba en una sola
escuela para tratar de obtener la habilidad
matemática de nuestros estudiantes sólo porque la
ubicación es conveniente, los resultados podrían no
ser representativos de todos los estudiantes en todo
el país. Los resultados están sesgados.
CASO PRACTICO
 Siguiendo con el tema de proyectos de investigación ,
aquí tenemos un ejemplo practico para calcular el
tamaño de la muestra, se emplea la siguiente
ecuación:


DONDE
 Z=% de fiabilidad deseado para la media muestral
E=error máximo permitido para la media muestra
σ= varianza de la población
N=tamaño de la población
P=% de veces que se supone que ocurre un
fenómeno en la población
q= es la no ocurrencia el fenómeno, (1-p)
Normalmente se desconocerá la varianza de la
población. En estas situaciones, puede ser sustituidas
por la varianza de una submuestra (que puede ser la
misma sub muestra que la usada para el test del
cuestionario).
EJEMPLO
 Se pretende establecer el tamaño de una muestra
sobre una población de 54,000 individuos,
intentando no incurrir en un menor al 7% y con una
fiabilidad del 95 %. Un problema con que nos
encontramos es el desconocimiento de las
proporcione existentes de la variable principal dentro
de la población. Al tratarse de proporciones podemos
calcular cual es el valor máximo de la varianza, se
corresponde con la situación en que p=q.
A continuación se presenta una tabla de valores de z,
para diferentes grados de confianza deseada.
GRACIAS POR SU
ATENCION

Potrebbero piacerti anche