Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
El problema
Cuando quiero fijar el máximo error que estoy dispuesto a aceptar en una
encuesta, lo habitual es referirnos a dos parámetros: el margen de error y el
nivel de confianza. ¿Qué significa cada cosa?
El margen de error es el intervalo en el cuál espero encontrar el dato que quiero
medir de mi universo. El dato puede ser en general de dos tipos: una media o una
proporción. Por ejemplo, si quiero calcular la media de hijos que tienen los
habitantes de Brasil entre 15 y 65 años, me gustaría poder decir que la media es
2,1 hijos/persona con un margen de error del 5%. Eso significaría que espero que la
media esté entre 2,1 - 5% y 2,1 + 5%, lo que da un intervalo de 2,00 <-> 2,21.
Si quisiera definir un margen de error para una proporción, procedería de forma
similar. Por ejemplo, me gustaría poder estimar el número de personas de Brasil
entre 15 y 65 años que viven en un piso de propiedad, afirmando que son un total
de 61.35 millones personas (45% de la población) con un margen del 5% de error,
lo que significaría que la realidad está entre 68 millones (50%) y 54,5 millones
(40%).
El nivel de confianza expresa la certeza de que realmente el dato que buscamos
esté dentro del margen de error. Por ejemplo, siguiendo con el caso anterior, si
obtenemos un nivel de confianza del 95%, podríamos decir que el porcentaje de
personas de mi universo que viven en un piso de propiedad, en el 95% de los casos
se encontrará entre el 40% y el 50%. O dicho de otra manera, si repitiese 100
veces mi encuesta seleccionando muestras aleatorias del mismo tamaño, 95 veces
la proporción que busco estaría dentro del intervalo y 5 veces fuera.
Gracias al teorema del límite central, cuando calculamos una media (p.e. hijos por
persona) o una proporción (p.e. % de personas con piso de propiedad) sobre una
muestra, podemos saber cuál es la probabilidad de que el universo tenga ese
mismo valor o un valor parecido. El valor que calculemos en la muestra será el
más probable para nuestro universo y a medida que nos alejamos de este valor
(por arriba o por abajo) cada vez serán valores menos probables. En mi ejemplo, si
el 45% de mi muestra de brasileños tiene piso de propiedad, puedo afirmar que
45% es el valor más probable del universo estudiado. Un porcentaje de 44% será
algo menos probable, 43% aún menos, etc... Lo mismo sucede para valores
superiores: 46% es menos probable que 45%.
Donde:
Debo encuestar por lo tanto a 384 personas para mantenerme dentro de los
niveles de error definidos.
Donde
σ2: Es la varianza que esperamos encontrar en la población (es el cuadrado de la
desviación estándar, σ). Nuevamente, es un dato que debemos obtener de un
estudio previo o de una estimación propia.
En donde
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de proporción)