Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Docencia Universitaria-EEES
ELABORACIN, ANLISIS E
INTERPRETACIN DE ENCUESTAS,
CUESTIONARIOS Y ESCALAS DE OPININ
A. Alaminos Chica y J.L. Castejn Costa
FOTOCOPIAR LIBROS
NO ES LEGAL
Producto
Ecolgico
TEMA 2
EL MUESTREO EN LA INVESTIGACIN SOCIAL
Antonio Alaminos
Como en todas las inferencias inductivas y el muestreo es una operativizacin de ello las generalizaciones inductivas van ms all de los hechos observados, considerando que no se observa toda la poblacin. Por ello, lo mejor que
se puede decir de una afirmacin inductiva basada en una observacin muestral
es que sera probablemente cierta. Nos estamos refiriendo, si bien desde el mbito de la induccin lgica, a los mismos problemas que se consideran en el mbito de la teora del muestreo.
Precisamente algunos principios de la teora del muestreo garantizan hasta
cierto punto que algunos argumentos inductivos sean ms slidos que otros. En
principio, la solidez de un argumento inductivo depende de lo razonable que sea
suponer que los elementos observados (pertenecientes a una determinada clase)
sean representativos de la clase completa. Toda aquella estrategia que garantice
la similitud entre clase total y observaciones tender a apoyar la solidez de un
argumento inductivo. Barker (1974) sugiere las siguientes reflexiones, donde las
tres primeras son totalmente pertinentes para el caso del muestreo.
a) En general, cuanto ms parecidas sean las observaciones, en caractersticas diferentes a las evaluadas, ms dbil ser la inferencia. Es decir, si los
casos son homogneos en muchas caractersticas, tendern a parecer casos
particulares dentro de una clase total ms diversa.
b) Y la afirmacin complementaria, cuanto ms diversos son los casos, es
decir, heterogneos en caractersticas diferentes a la considerada, ms
slido ser el argumento inductivo.
c) Asimismo, en principio, cuanto mayor sea el nmero de observaciones
que apoyan la inferencia, ms slido es el argumento, siempre que se
suponga una asociacin entre el incremento del nmero de casos y el
incremento de la heterogeneidad de los casos.
d) Otro criterio importante es que cuanto ms vinculada est la hiptesis con
otras de importancia para el rea de conocimiento, ms slido ser el argumento. As, si postulamos una hiptesis entre sindicalismo y partidos polticos, podra estar relacionada con otras sobre ideologa poltica y
posicionamiento social.
e) En todo caso, cuanto ms amplia o extensa es la generalizacin, menor
ser la probabilidad de ser aceptada, y su argumentacin ser ms dbil.
As, para el caso de todos los jvenes son . su probabilidad de ser
aceptada es baja. Si se restringe la generalizacin a slo un segmento, por
ejemplo, todos los jvenes estudiantes en la ciudad de el argumento
tendr ms probabilidades de ser aceptado.
En definitiva, para evaluar la fuerza de un argumento inductivo, Barker propone que deben considerarse de modo conjunto los cinco factores mencionados.
As, hay que evaluar el nmero de observaciones que da pie a la induccin, en
conjuncin con el grado de heterogeneidad de dichos casos, el alcance y la pre43
treo, sea este probabilstico o no. Cada situacin debe de ser evaluada en la fase
de diseo y resultar en tantas tcnicas y mtodos como requiera para la obtencin
de la informacin que se necesita, considerando siempre el equilibrio ptimo
entre el coste de la investigacin y la importancia de los resultados que se vayan
a conseguir. Como todo investigador sabe, el coste de la investigacin es el autntico lmite al diseo de sta, imponiendo restricciones sobre lo que es posible
hacer. El investigador no puede, sin embargo, en ese probable sacrificio de estrategias complementarias de investigacin, someterse a la buena o mala imagen de
cada tcnica. El criterio debe de ser emplear la tcnica que afronte ptimamente
la obtencin de la informacin que se requiere y no otro. Esta es una situacin
demasiado frecuente, donde el que solicita la investigacin quiere que se aplique una tcnica concreta, cuando para el investigador es evidente que esa informacin necesita, exige, otras tcnicas. El conflicto no es fcil de solventar, pero
la solucin nunca debera de pasar por ocultar el hecho de que la tcnica que se
pide no es la correcta, an cuando su realizacin sea ms rentable.
2. MUESTREO NO PROBABILSTICO
En general, se pueden considerar tres formulaciones bien diferenciadas en la
teora de un muestreo no probabilstico. Se trata del muestreo de conveniencia,
el muestreo por cuotas y el intencional. El muestreo de conveniencia est en los
lmites ms perifricos del concepto metodolgico de muestreo. En lo que se
refiere al muestreo por cuotas posee una estructura de muestreo probabilstico
siendo un sucedneo econmico de ste, mientras que el muestreo intencional es
el que desarrolla autnticamente, y en un mayor grado, la potencialidad de un
muestreo no probabilstico. En lo que se refiere a la realizacin de encuestas
sociales, los ms extendidos entre los no probabilsticos son el muestreo por cuotas para efectuar muestreos, y el de conveniencia para testar cuestionarios de
nuevo diseo.
2.1. MUESTREO DE CONVENIENCIA
El muestreo de conveniencia es tambin llamado fortuito o accidental. Consiste, simplemente, en que el investigador selecciona los casos que estn ms
disponibles. Es un muestreo fcil, rpido y barato, pero los resultados que se
obtengan no pueden generalizarse ms all de los individuos que componen la
muestra. Un ejemplo de esto es cuando una emisora de radio o t.v. pide la opinin sobre algo a los individuos que va seleccionando en la calle. Ese tipo de
muestreo de conveniencia no permite ninguna inferencia sobre la poblacin, y
las conclusiones deben de referirse exclusivamente sobre la misma muestra. Las
encuestas por internet, sin marco muestral y diseo previo, como las que efectan los medios de comunicacin son ejemplos de este tipo de muestreo. Hacer
46
1.
51
blema, se convierte mediante este tipo de muestreo intencional en una potencialidad, partiendo del siguiente principio: Cualquier pauta comn que surja de una
gran variacin posee un inters particular. As pues, el propsito central en un
muestreo de mxima variacin ser, paradjicamente, buscar la homogeneidad
que puede suponer la existencia de pautas comunes.
El procedimiento para conseguir la mxima variacin en la muestra consiste
en seleccionar una serie de caractersticas que sern empleadas para estructurar
el diseo de esa diversidad que se pretende, por ejemplo, las variables raza, religin, cultura, etc. Esas variables son las que van a determinar la composicin de
la muestra, y con ello garantizar, al igual que en el sistema de cuotas, la presencia de esa diversidad de caractersticas.
Una vez que se ha diseado la muestra a partir de dichas caractersticas, es
necesario emplear un procedimiento de recoleccin de datos que implique una
descripcin detallada y exhaustiva de cada caso en relacin al tema objeto de
estudio. Por ejemplo, de aplicar entrevistas en profundidad, es aconsejable emplear una gua de la entrevista lo bastante detallada, que estructure lgicamente la
recogida de la informacin y potencie la comparabilidad entre los casos.
Una vez en el anlisis, la idea central es concentrarse en la deteccin de pautas comunes compartidas entre los elementos de la muestra. La fiabilidad, validez e importancia de los hallazgos que se obtengan vendrn avalados,
precisamente, por la heterogeneidad intencionada de la muestra.
2.7. MUESTREO DE SUBGRUPOS HOMOGNEOS
Una estrategia de muestreo intencionado que emplea una lgica semejante, si
bien en sentido inverso, es el de escoger una muestra pequea lo ms homognea posible. En el desarrollo de una investigacin puede surgir la necesidad de
recoger informacin en profundidad sobre uno o varios grupos. En este tipo de
muestra se renen una serie de individuos de condiciones sociales y experiencias
semejantes. Obviamente, la saturacin de la informacin que se quiere conseguir
se obtiene relativamente ms rpido en el seno de un grupo homogneo, que
efectuando la recoleccin de datos a los individuos aislados que componen la
muestra. As, por ejemplo, una tcnica que se apoya sobre este tipo de muestreo
intencional es la entrevista colectiva, tambin llamada grupo de discusin. Este
tipo de tcnica se caracteriza por la recoleccin en conjunto de la informacin
generada desde la muestra. La composicin de sta se define por criterios tcnicos internos a la investigacin o mediante estratificacin de algn tipo, como
rea geogrfica, sexo, edad, etc.
2.8. MUESTREOS ESTRUCTURALES
Los muestreos estructurales se caracterizan, a diferencia de los anteriores,
porque los individuos que componen la muestra son seleccionados en virtud a
52
Sern estos casos contradictorios los que buscarn las teoras rivales para criticar las conclusiones a que haya podido llegarse. Por lo tanto, la bsqueda de
casos contradictorios e integrarlos en la explicacin que se ofrece es fundamental. En ese sentido, se tratara de localizar excepciones que confirmen la regla,
es decir, excepciones que puedan ser correcta y completamente explicados desde
las conclusiones que se propone.
Ninguna de las estrategias de muestreo que aqu se han desarrollado son
excluyentes entre s, sino que por el contrario, un buen diseo puede integrar, en
la medida que suponga una solucin ptima, varios de estos muestreos. En todo
caso, debe de mantenerse muy presente que la credibilidad ltima que se obtenga, para las conclusiones basadas en muestreos intencionados, no depende del
tamao de la muestra ni de la forma de extraccin y seleccin de los individuos,
sino de la garanta que ofrezca la riqueza de informacin que posean los casos
considerados.
3. EL MUESTREO PROBABILSTICO
El muestreo probabilstico posee una potencialidad muy especial dentro de la
investigacin cientfica. Para ello la herramienta fundamental es la estadstica
inferencial. Tal y como expresa El propsito principal de los mtodos estadsticos es legitimar generalizaciones sobre poblaciones usando datos de muestras.
No es habitual el emplear censos (es decir estudios de la poblacin completa) en
los cuales la estadstica adecuada es la descriptiva. Ciertamente, una media obtenida de una muestra tiene un margen de error, un intervalo de confianza dentro
del cual se encuentra probablemente el valor real de la poblacin. Si los datos
proceden de toda la poblacin, la media calculada es la media. Posiblemente
pueda contener otros errores o deficiencias (no respuesta, falta de comprensin
en los contenidos, respuestas sistemticas, etc.) pero no tiene sentido aplicar la
estadstica inferencial.
Cuando se aplica la tcnica de encuestas a una muestra de la poblacin implica: identificar una poblacin, determinar el diseo de una muestra, seleccionar
una muestra representativa, obtener datos de esa muestra, grabarlos y tratarlos
estadsticamente para su anlisis de forma que puedan efectuarse inferencias
sobre el conjunto de la poblacin. Como ya se indic, la ventaja del muestreo
probabilstico reside en su capacidad para estimar el posible error que afecte a la
medicin (estimado muestral) en su intencin de determinar el valor del parmetro poblacional. A cambio de esa potencialidad, el diseo muestral probabilstico est sujeto a fuertes restricciones tcnicas, que son las que permite que
estadsticamente exista un aval respaldando los resultados de una encuesta. En
ese sentido, el muestreo aleatorio simple, por ejemplo, que es el menos complejo tericamente hablando es, en un sentido prctico, el ms difcil de utilizar.
55
Esto quiere decir que la teora del muestre se complicar en tanto en cuanto
intente formular estrategias que sean tiles en la prctica para la investigacin.
Entre una bolsa opaca llena de canicas de colores y las formas de asentamiento
territorial y de convivencia de los individuos existen ciertamente diferencias
notables.
El hecho bsico es que la teora del muestro, en sus nociones centrales, es
bastante asequible, y las complejidades que llega a adquirir son precisamente
consecuencia de la diferencia entre la sociedad real y una situacin experimental (por ejemplo, una bolsa llena de bolas blancas y negras). Una estrategia complicada de muestreo probabilstico acostumbra a ser la respuesta a que la
realidad social que lo es an ms. Si existiera un ordenador accesible que contuviera el censo de poblacin, y de un modo rpido y econmico pudiese extraer
muestras aleatorias, los problemas seran exclusivamente de tipo econmico para
recoger dichas muestras. Cada elemento muestral tendra nombre y direccin, y
la extraccin sera directa.
Esa situacin ideal no existe, y lo que se hace es emplear datos agregados del
censo, o del padrn municipal, para el diseo de la muestra y recurrir a mecanismos probabilsticos para la solucin final. Queremos, en este sentido concluir
con una idea que no por conocida parece ser fcil de aceptar por algunos investigadores: la complejidad de los diseos muestrales responde a problemas reales
de investigacin. En otras palabras, toda esa complejidad est en definitiva intentando superar las dificultades de seleccin muestral en determinadas circunstancias.
Lo habitual es que el muestreo est integrado en una estrategia ms amplia de
investigacin y, evidentemente, hay otras decisiones que influirn en el tipo de
muestra que se efecte. Entre esas decisiones se encuentra el factor econmico.
El diseo muestral que se elija tiene, generalmente, una gran dependencia de los
recursos econmicos de que se dispone. As pues, el diseo muestral forma parte
de un proceso de investigacin en el que se integra, donde existe un tema de estudio, unas tcnicas de aplicacin para los instrumentos de recoleccin de datos y
una poblacin sobre las que aplicarlo.
Vamos a considerar el muestreo en dos apartados. El primero est referido a
los aspectos donde el investigador debe tomar decisiones sobre las limitaciones
que la realidad impone sobre un diseo basado en muestras. Aqu y sobre estos
aspectos, el investigador adquiere un claro conocimiento de la capacidad de inferencia de las mediciones que realice. Una encuesta efectuada por Internet solo
llega a los que emplean Internet y quieren contestarla. La inferencia es limitada
a esa poblacin. Una encuesta telefnica est limitada a los que tengan telfono
y consten en la gua de telfonos. La relacin entre los sujetos alcanzables y la
poblacin es una dimensin cualitativa y de reflexin por parte del investigador. En un segundo momento trataremos las cuestiones estadsticas, relacionadas
56
con el diseo formal de la muestra. Aqu las decisiones estn muy codificadas,
en el sentido de que las preguntas y opciones de respuesta estn consideradas de
forma sistematizada por la estadstica inferencial.
El punto de partida para afrontar un diseo muestral es definir cul es la
poblacin a estudiar. Este concepto de poblacin es empleado en un sentido
tcnico indicando la totalidad de los elementos en estudio o universo. Por elementos se entiende la unidad de anlisis. La unidad de anlisis no tiene por qu
estar compuesta por individuos, sino que puede tratarse de otros tipos, por ejemplo instituciones. Si quisiramos saber la recaudacin media de los teatros en
Espaa, la poblacin estara constituida por todos los teatros en funcionamiento
en Espaa, donde la unidad de anlisis o elemento sera cada teatro. No debe, por
lo tanto, confundirse unidad de anlisis con individuos, en la medida que una
unidad de anlisis puede tambin ser una fbrica, una empresa, un grupo de presin, una ciudad, una regin o un estado.
Es fundamental una buena definicin de la poblacin de acuerdo a los objetivos del estudio, dado que los resultados que se obtengan dependern directamente de ello.
Cuando se habla de poblacin general, se entiende que la poblacin sobre la
que se efecta el estudio est compuesta por hombres y mujeres de ms de 18
aos de edad, que habitan dentro de un rea geogrfica definida. Este tipo de
poblacin general es bastante empleado en los estudios de opinin pblica. Otro
ejemplo son los estudios sobre la juventud, que acostumbran a emplear un tramo
de edad ms corto, entre 15 y 29 por ejemplo. Los estudios de fecundidad definen otro tipo de poblacin especfica (mujeres en edad frtil), y as un largo etctera en lo que a definicin de poblaciones se refiere. El decidir a qu poblacin
se dirige el estudio sirve para tener presente qu elementos forman parte de la
poblacin y cules no. Esto es ms inmediato cuando las poblaciones sobre las
que se efectuar el muestreo son especficas, como la juventud, donde el problema consiste en ajustar un tramo de edad socialmente significativo al concepto.
Pero en el caso de poblacin general, hay que recordar que se excluyen los
ingresados en hospitales, crceles, hoteles y cuarteles, as como los que se
encuentran de viaje en el extranjero, y determinados segmentos sociales, tanto
por clase alta, como baja. En el caso de encuestas a estudiantes, realizadas en el
aula, se pueden producir fuertes sesgos, consecuencia de la falta de asistencia de
parte de los alumnos. En ese sentido, la poblacin que alcanza y de la que pueda
ser representativa la muestra son en la prctica los estudiantes que asisten a clase
y no los estudiantes matriculados. Es casi imposible entrevistar en los barrios
residenciales de clase social muy alta, tanto como en las barriadas marginales de
chabolas. Podramos seguir enunciando elementos excluidos en la prctica de la
poblacin, pero lo importante es evaluar en qu grado su presencia o no presencia puede afectar al estudio. En todo caso, tener siempre presente cul es la
57
para localizar y seleccionar los casos. En el caso que se posea un listado con
todos los elementos de la poblacin, ese constituir el marco muestral. El
poseer un buen marco muestral que facilite como mnimo de un medio para
identificar y localizar los elementos, as como el modo en que este organizada
esta informacin, tiene una influencia sustancial en el diseo muestral. Un
marco muestral organizado por reas geogrficas lleva directa mente a un
muestreo por agrupamiento, mientras que si estn organizadas por factores
relevantes para la investigacin puede sugerir un muestreo estratificado. En todo
caso, la calidad de la informacin que constituye el marco muestral es esencial para un muestreo eficaz y fiable. Los problemas ms frecuentes que pueden
aparecer en un marco muestral son los cuatro considerados por Kish (1965):
elementos perdidos, elementos extraos, agrupaciones y duplicaciones.
La situacin por la que determinados elementos no aparecen en el marco
muestral puede deberse a que ste sea inadecuado. Es decir, que la intencin
con la que se genera ese marco muestral no pretenda abarcar a toda la poblacin que va a ser objeto del estudio o porque este sea incompleto, ya que pretendiendo cubrir toda la poblacin falla en ese intento. Las dos pueden ser causa
de elementos perdidos, debiendo analizarse detalladamente tanto si el marco
muestral es el adecuado, como su completitud. De todos modos, es ms fcil
identificar un marco muestral inadecuado que uno incompleto, y de hecho las
posibles soluciones son ms accesibles para el primer caso. Los elementos perdidos constituyen un problema bastante serio pues esos casos no poseen ninguna probabilidad de estar incluidos en la muestra, con lo que sta dejar de ser
representativa de la poblacin.
Algunas veces es posible evitar el problema de los elementos perdidos redefiniendo la poblacin de forma que los excluya. Esto es especialmente fcil de
hacer en el caso de los marcos muestrales inadecuados, aunque es evidente
que constituye una solucin bastante imperfecta. Se debe intentar completar el
marco muestral reuniendo a otras posibles fuentes alternativas, si bien esto
nos llevara al problema de la posible duplicacin de elementos.
Los elementos pueden aparecer duplicados, por encontrarse en diferentes listados, lo que incrementa su probabilidad de ser seleccionado para la muestra.
Este es un riesgo serio al emplear diferentes fuentes secundarias. Otro problema
importante es cuando los posibles listados que estn disponibles presentan datos
excesivamente agregados, con lo que obstaculizan el problema de afijacin y
seleccin de la muestra. Por ltimo, los listados o datos estadsticos pueden recoger elementos que no estn incluidos en la poblacin objeto del estudio, con lo
que afectarn al proceso de diseo muestral.
Se debe de intentar la mayor coincidencia posible entre el marco muestral
y la poblacin objeto de estudio, dado que, estrictamente hablando, slo puede
efectuarse inferencias sobre elementos presentes en el marco muestral.
59
(menores de 71 en este ejemplo) y no repetidos. Los espacios en blanco se introducen para facilitar la legibilidad de los nmeros, de forma que su agrupacin en
columnas es arbitraria y debe ignorarse en la secuencia de extraccin del
siguiente elemento muestral.
Una alternativa a la extraccin aleatoria anterior, es la extraccin mediante
procedimiento sistemtico. No obstante, no existe una teora estadstica que legitime de manera precisa la exactitud de las estimaciones mediante este procedimiento. En la prctica, se las trata como si fuesen muestras aleatorias. Como
podemos apreciar, la aleatoriedad, es decir, la posibilidad de participar en la
muestra, debe mantenerse desde el diseo inicial, hasta la extraccin misma de
la muestra. En el caso de las encuestas de opinin pblica, la aleatoriedad en la
extraccin final se intenta garantizar mediante los sistemas de rutas aleatorias,
donde el entrevistado (ante la imposibilidad evidente de mezclar a la poblacin)
se mezcla segn criterios de aleatoriedad (eligiendo calles, eligiendo portales,
eligiendo viviendas, eligiendo al entrevistado dentro de la vivienda normalmente segn tabla de nmeros aleatorios). Existen varios procedimientos que aplican
en la prctica la opcin de rutas aleatorias. En general, la idea es que los agrupamientos de individuos (colas en el mercado, en el cine, etc.) pueden contener
algn sesgo en el sentido de acentuar la homogeneidad. Por ello, la fragmentacin de la extraccin donde los individuos se seleccionan uno a uno, aplicando
algn criterio de mezcla entre cada entrevistado.
Considerando la estadstica que existe detrs de la teora del muestreo encontramos las ideas clsicas de la probabilidad. El muestreo se apoya fuertemente
en la idea de las repeticiones a largo plazo. Por ejemplo, que si se arroja una
moneda al aire muchas veces, saldr cara un 50% de las veces. Y de forma consecuente: si extraes un nmero elevado de muestras de una poblacin, a largo
plazo las muestras mostrarn representatividad de la poblacin. As, la cuestin
se reduce a obtener una muestra aleatoria y determinar la probabilidad de que
reproduzca las mismas caractersticas que la poblacin de la que ha sido tomada. El valor que pueda poseer un coeficiente en la poblacin (una media, una
proporcin, una desviacin, etc.) se denomina parmetro, mientras que el
obtenido mediante una muestra se le llama estimado.
La confianza en que un estimado est prximo al parmetro se incrementa
con el tamao muestral. En el extremo, una muestra que contenga el 100% de la
poblacin (sera un censo) tendra una confianza del 100% respecto a contener
las caractersticas de la poblacin. En general, decidiremos qu confianza queremos antes de disear la muestra. Porcentajes de confianza del 99%, del 95% o
del 68%, aproximadamente, son los que habitualmente se emplean como referencia (al coincidir con las desviaciones tpicas en la distribucin normal). Pero,
obviamente, el investigador decide cul es la confianza requerida. Una confianza del 60% puede ser suficiente si existen razones para ello.
61
teorema ms importante en estadstica desde el punto de vista terico y aplicado (Snedecor y Cochran, 1980) y uno de los teoremas ms notables en todas
las matemticas (Mood y Graybill, 1963).
Es muy importante apreciar que este teorema fundador de la teora del muestreo no afirma nada sobre la distribucin o las observaciones en la poblacin de
la que se extrae la muestra. Independientemente de la distribucin en la poblacin, la forma de la distribucin de muestreo de la media se aproxima a la distribucin normal si n es lo bastante grande. Una vez explicitada la regularidad,
debemos tener en cuenta las caractersticas de la distribucin en la poblacin
para determinar el tamao muestral suficientemente grande para dar sustento al
teorema. El tamao adecuado de las muestras para obtener la normalidad en las
distribuciones de estimados, depende de la forma de la distribucin de la poblacin origen. Solamente en el caso de distribuciones muy atpicas, un tamao
muestral de 25 generar una distribucin de estimados prximos a la distribucin
normal. Incluso para poblaciones de origen no normales, la forma de las distribuciones de muestreo rpidamente se aproximan a la normalidad a medida que
el tamao muestral aumenta. Adems, conforme el tamao muestral se incrementa, la variabilidad de las distribuciones de muestreo disminuye incluso si la
poblacin de origen no es normal.
Gracias a esta propiedad es posible cuantificar el error que pueda contener un
estimado en relacin al valor real en la poblacin. Cuando el tamao muestral se
incrementa, la distribucin que adoptan los estimados muestrales (la media de
cualquier cosa) se prxima a una distribucin normal independientemente de la
forma que tenga en la poblacin de origen. Es importante apreciar la idea de
repetir la extraccin de mltiples muestras, cada una de ellas con su propia
media.
Es bien conocido que si en una distribucin normal sabemos su media y la
desviacin tpica, sabemos todo lo que necesitamos. En ese sentido, al efectuar
un muestreo vamos a considerar la relacin entre la media que nos ofrece nuestra muestra con la media de la distribucin de muestras que sabemos coincide
con el valor real en la poblacin. A partir de esta relacin, se derivan toda una
serie de consecuencias muy tiles y especialmente la que conduce al nivel de
confianza, la construccin de intervalos de confianza y la cuantificacin de un
error estimado.
Aproximadamente el 95% de los valores en una distribucin normal se
encuentran entre dos desviaciones estndar de la media. Una muestra grande de
medias (procedentes de varias muestras) estar normalmente distribuida y su
desviacin estndar se denomina error estndar de la media. As, existe un 95%
de probabilidad de que la media estimada en una muestra cualquiera se encuentre dentro de un error estndar de la media de 1,96 (es decir, valor z expresando
el nmero de desviaciones estndar respecto a la media) alrededor de la media
63
(parmetro o valor real) de la poblacin. Es decir, tendremos un 95% de confianza en que, media estimada de una muestra cualquiera = media de la poblacin [ 1,96 x (desviacin estndar en la poblacin / del tamao muestral] o
planteando al revs esta relacin media de la poblacin = media estimada de una
muestra cualquiera [ 1,96 x (desviacin estndar de la muestra / del tamao
muestral]
En la prctica esto es muy simple de aplicar. Supongamos que tenemos una
titulacin y extraemos una muestra con las calificaciones de 50 alumnos y estimamos que la calificacin media es de 6,7 con una desviacin estndar de 2,3.
Podramos decir con un 95% de confianza que,
Nota media de todos los alumnos de la titulacin = 6,7 [ 1,96 x (2,3/50]
luego podemos afirmar con un 95% de confianza que la nota media de la titulacin se encuentra dentro de un intervalo entre 6,7 0,63; es decir, entre 6 y 7,3
Como ya advertamos, los intervalos de confianza dependen del nivel de confianza. El nivel de confianza viene expresado en puntuaciones Z (dispersin
entorno a la media). Algunas puntuaciones Z importantes y su nivel de confianza son:
Puntuacin Z
Nivel de confianza
(rea entre las colas)
68,26
1,64
90
1,96
95
95,4
2,58
99
67