Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
www.mipagina.cantv.net/hamletmatamata
POBLACIN Y MUESTRA
Una poblacin est determinada por sus caractersticas definitorias. Por lo tanto, el conjunto de
elementos que posea esta caracterstica se denomina poblacin o universo. Poblacin es la totalidad del
fenmeno a estudiar, donde las unidades de poblacin poseen una caracterstica comn, la que se
estudia y da origen a los datos de la investigacin.
Entonces, una poblacin es el conjunto de todas las cosas que concuerdan con una serie determinada de
especificaciones. Un censo, por ejemplo, es el recuento de todos los elementos de una poblacin.
Cuando seleccionamos algunos elementos con la intencin de averiguar algo sobre una poblacin
determinada, nos referimos a este grupo de elementos como muestra. Por supuesto, esperamos que lo
que averiguamos en la muestra sea cierto para la poblacin en su conjunto. La exactitud de la
informacin recolectada depende en gran manera de la forma en que fue seleccionada la muestra.
Cuando no es posible medir cada uno de los individuos de una poblacin, se toma una muestra
representativa de la misma.
La muestra descansa en el principio de que las partes representan al todo y, por tal, refleja las
caractersticas que definen la poblacin de la que fue extrada, lo cual nos indica que es representativa.
Por lo tanto, la validez de la generalizacin depende de la validez y tamao de la muestra.
El mtodo de muestreo se basa en ciertas leyes que le otorgan su fundamento cientfico, las cuales son:
De estas dos leyes fundamentales de la estadstica, se infieren aquellas que sirven de base ms
directamente al mtodo de muestreo:
Ley de la inercia de los grandes nmeros: esta ley es contraria a la anterior. Se refiere al hecho
de que en la mayora de los fenmenos, cuando una parte vara en una direccin, es probable
que una parte igual del mismo grupo, vare en direccin opuesta.
La inferencia estadstica es el proceso a travs del cual se extraen conclusiones relativas a una
poblacin a partir de una muestra . La expresin inferencia se utiliza tambin para designar su
resultado y la rama de la estadstica que se ocupa de ella.
Los estadsticos son funciones de los valores observados en la muestra. (ya se han visto algunos, como
la media, la desviacin tpica, percentiles)
Por ser funciones de una variable aleatoria, los estadsticos son tambin variables aleatorias y por lo
tanto a cada uno de ellos se le puede asociar una distribucin de probabilidad llamada distribucin
en el muestreo del estadstico dado. Es posible pasar de la Teora de la Probabilidad a la
Inferencia Estadstica.
En la mayor parte de las tcnicas que se describen aqu, las inferencias (conclusiones) se refieren a
parmetros poblacionales. Sin embargo, es posible realizar inferencias que no se relacionen con
parmetros (ver anlisis de frecuencias). Segn la finalidad de la Inferencia Estadstica se puede
dividir en:
* TEORA DE LA ESTIMACIN.
Los dos problemas fundamentales que estudia la inferencia estadstica son el "Problema de la
estimacin" y el "Problema del contraste de hiptesis". Cuando se conoce la forma funcional de la
funcin de distribucin que sigue la variable aleatoria objeto de estudio y slo tenemos que estimar los
parmetros que la determinan, estamos en un problema de inferencia estadstica paramtrica; por el
contrario cuando no se conoce la forma funcional de la distribucin que sigue la variable aleatoria
objeto de estudio, estamos ante un problema de inferencia estadstica no paramtrica.
En lo que sigue nos vamos a limitar a problemas de inferencia estadstica paramtrica, donde la
variable aleatoria objeto de estudio sigue una distribucin normal, y slo tendremos que tratar de
estimar los parmetros que la determinan, la media y la desviacin tpica.
Esta situacin se presenta con frecuencia debido a que es posible a menudo conocer la forma funcional
de la distribucin de probabilidad, por consideraciones tericas, quedando nicamente indeterminados
los parmetros que determinan la funcin de distribucin.
Como las poblaciones en las que se pretende estudiar una determinada variable aleatoria, son grandes,
es muy caro o imposible, estudiar a todos sus individuos; lo que se hace, es estudiar una muestra ( una
parte) de la poblacin. En todos estos problemas que estudia la inferencia estadstica juega un papel
fundamental la "Teora de la Probabilidad" (distintas formas funcionales de las distribuciones de
probabilidad) y la "Teora de Muestras" (procedimientos para tomar muestras de manera apropiada).
La teora de muestreo frecuentemente es llamada teora de Nyquist o Shannon por los investigadores
del primer trabajo sobre el tema, lo cual ocurri en los aos cuarenta.Conceptualmente definida como
el estudio de las relaciones existentes entre una poblacin y muestras extradas de la misma. La teora
del muestreo tiene especial utilidad para determinar si las diferencias que se pueden observar entre dos
muestras son debidas a la aleatoriedad de las mismas o si por el contrario son realmente significativas;
lo que nos lleva a los procesos denominados ensayos e hiptesis de significacin, fundamental para
comprensin de la teora de la decisin, en el rea de la inferencia estadstica. Abarca el estudio de las
relaciones que existen entre una poblacin y las muestras extradas de la misma. Permite estimar los
parmetros poblacionales (media, varianza, etc.) a partir de los correspondientes valores muestrales,
denominados estadsticos. La teora del muestreo tambin permite determinar si las diferencias
observadas entre dos muestras son significativas o, por el contrario, debidas al azar, lo que supone la
realizacin de ensayos e hiptesis de significacin.
Pues bien, la teora del muestreo estudia las tcnicas y procedimientos que debemos emplear para que
las muestras sean representativas de la poblacin que pretendemos estudiar, de forma que los errores en
la determinacin de los parmetros de la poblacin objeto de estudio sean mnimos. Para conseguirlo,
la muestra tiene que ser representativa de la poblacin. Para que la extraccin de la muestra sea
representativa se deben cumplir dos principios bsicos:
Que todos los individuos tengan la misma probabilidad de ser incluidos en la muestra.
El propsito de un estudio estadstico suele ser, extraer conclusiones acerca de la naturaleza de una
poblacin. Al ser la poblacin grande y no poder ser estudiada en su integridad en la mayora de los
casos, las conclusiones obtenidas deben basarse en el examen de solamente una parte de sta, lo que
lleva, en primer lugar a la justificacin, necesidad y definicin de las diferentes tcnicas de muestreo.
Los primeros trminos obligados a los que se debe hacer referencia, sern los de estadstico y
estimador.
Dentro de este contexto, ser necesario asumir un estadstico o estimador como una variable aleatoria
con una determinada distribucin, y que ser la pieza clave en las dos amplias categoras de la
inferencia estadstica: la estimacin y el contraste de hiptesis.
Cmo deducir la ley de probabilidad sobre determinado carcter de una poblacin cuando slo se
conoce una muestra?
Este es un problema que se enfrenta cuando por ejemplo se trata de estudiar la relacin entre el
fumar y el cncer de pulmn y se intenta extender las conclusiones obtenidas sobre una muestra al
resto de individuos de la poblacin.
Las tcnicas estadsticas para ser utilizados requieren datos, cuya adquisicin es un compromiso difcil.
La teora de muestras o muestreo tiene por objeto proporcionar una metodologa que gue los
problemas de recogida de datos, es decir, cmo se hace para recoger esos datos. Por lo tanto, El
muestreo es una herramienta de la investigacin cientfica. Su funcin bsica es determinar que parte
de una realidad en estudio (poblacin o universo) debe examinarse con la finalidad de hacer inferencias
sobre dicha poblacin. El error que se comete debido a hecho de que se obtienen conclusiones sobre
cierta realidad a partir de la observacin de slo una parte de ella, se denomina error de muestreo.
Obtener una muestra adecuada significa lograr una versin simplificada de la poblacin, que
reproduzca de algn modo sus rasgos bsicos.
En el muestreo se utilizan por lo general las siguientes Terminologas:
UNIVERSO: Se define como un conjunto finito o infinito de elementos, seres o cosas que presentan
caractersticas comunes entre si.
POBLACIN: Est constituida por el conjunto de medidas de las variables en estudio, en cada una de
las unidades que conforman el universo. Es decir, cada una de las variables en estudio constituye una
poblacin que viene dada por el conjunto de valores que ella toma de la realidad que conforman el
universo.
UNIDAD DE ANLISIS: Est definida como el elemento que se examina y del que se busca la
informacin dentro de la unidad de investigacin. Es por lo tanto el objeto o individuo del que hay que
obtener la informacin.
UNIDADES DE MUESTREO: Son aquellas que contienen las unidades de anlisis de la poblacin y
que se utilizarn para confeccionar o seleccionar la muestra. En general, es la seleccin de los
conjuntos que sern tomados en cuenta para la conformar la muestra final en la investigacin. En otras
palabras es un nmero de elementos de la poblacin, no reservados, que se van a estudiar. Todo
miembro de la poblacin pertenecer a una y slo una unidad de muestreo.
MARCO MUESTRAL: Es el proceso de definir y enumerar los elementos sobre los cuales se realizan
las inferencias estadsticas en el muestreo probabilstica. Es importante la construccin de un marco
muestral lo ms perfecto posible a fin de que exista una correspondencia biunvoca entre las unidades
muestrales poblacionales y las listas fsicas que lo conforman. Entre los factores que contribuyen a
distorsionar la calidad de un buen marco muestral estn: a) Elementos faltantes, b) Unidades ocultas
por estar pareadas con otras, c) Unidades muestrales repetidas y d) Elementos extraos.
Estadstico. Son los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimacin
de los parmetros.
Por lo tanto p es la probabilidad de error al comparar dos o ms muestras o grupos cuando aseguramos
que ambos son diferentes. O sea que p es la probabilidad en el sentido de la significacin estadstica.
Obtener una p < 0.05 significa que tenemos un 5% de probabilidades de error en las conclusiones, por
lo cual la probabilidad de equivocarnos es baja. En otras palabras, en la estadstica, se dice que un
evento, suceso o valor, es significativo, cuando es poco probable y por lo tanto, seguramente no se debe
al azar, sino a factores especficos.
Proceso de seleccin: Reglas y operaciones mediante las cuales se incluyen algunas unidades de la
muestra.
Proceso de estimacin: A partir de los datos seleccionados se estiman ciertos valores desconocidos de
la muestra.
El uso de una encuesta por muestreo tiene una serie de ventajas, como que su coste es mucho menor, es
ms rpida de realizar y los datos se obtienen con mayor exactitud debido al poco volumen de
encuestados.
a) Costos reducidos.
d) Factibilidad de hacer el estudio cuando la toma de datos implica tcnicas destructivas, por ejemplo:
- Pruebas de germinacin.
- Anlisis de sangre.
- Control de calidad.
Tipos de muestreo
Los investigadores proponen diversos criterios de clasificacin para los diferentes tipos de muestreo,
aunque en general pueden dividirse en dos grandes grupos: mtodos de muestreo probabilsticas y
mtodos de muestreo no probabilsticas.
Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para
formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamao n tienen la
misma probabilidad de ser elegidas. Slo estos mtodos de muestreo probabilsticos nos aseguran la
representatividad de la muestra extrada y son, por tanto, los ms recomendables. Dentro de los
mtodos de muestreo probabilsticos encontramos los siguientes tipos:
a) Existe la posibilidad de definir inequvocamente un conjunto de muestras M1, M2, .... , Mt mediante la
aplicacin del procedimiento a una poblacin. Esto significa que podemos indicar cuales unidades de
muestreo pertenecen a M1, M2 y as sucesivamente.
c) Seleccionamos una de las Mi por un proceso mediante el cual, cada Mi tiene una probabilidad Pi de ser
seleccionada.
d) El mtodo de estimacin se realiza en base a la muestra, siendo nico para cualquiera de las posibles
muestras Mi.
Definicin de objetivos: Esta etapa comprende la identificacin del problema y el establecimiento de las
metas del estudio.
Definicin del marco de muestreo: El marco de muestreo es el conjunto de las unidades de muestreo que
constituyen una poblacin. Este generalmente puede ser de dos tipos:
a) Marco lista: Es una lista depurada (sin traslapes o duplicaciones) que permite identificar a cada unidad
de muestreo. Por ejemplo, una lista que contenga el nombre de todos los proveedores de caa de azcar de
un ingenio. Es recomendable que adems de identificar a cada unidad muestral, incluya algunas otras
caractersticas de inters, por ejemplo, tamao de la finca de cada proveedor.
b) Es un plano o mapa que permite identificar pequeas reas usadas como unidades de muestreo en las
que se ha dividido el rea total.
Variables a medir y Mtodos de medicin: Es importante considerar el tipo de variable a medir, por
ejemplo: si se va a estudiar el rendimiento de caa de azcar, la variable es de tipo continuo, si interesa
estimar la proporcin de agricultores que utilizan herbicidas para el control de malezas, se medir una
variable de tipo binomial. El tipo de variable a medir ayuda a definir el esquema o tipo de muestreo. Los
mtodos de medicin deben de tener las siguientes caractersticas:
a) uniformidad.
b) practicabilidad.
c) deber ser comprensibles para el grupo de trabajo.
Tipo o Esquema de Muestreo: Existen actualmente una gran variedad de tipos o esquemas de muestreo
que han sido desarrollados para diferentes situaciones, entre los ms usados estn: muestreo simple
aleatorio, muestreo aleatorio estratificado, muestreo sistemtico.
Determinacin del tamao de muestra (n): Este punto depende de que es lo que se desea estimar y el
esquema o tipo de muestreo seleccionado.
Seleccin de las unidades de muestreo: Consiste en extraer un nmero n de unidades muestrales de una
poblacin de tamao N.
c) Estimar costos.
Organizacin del trabajo de campo: Incluye la capacitacin de personal y todas las operaciones
necesarias para obtener la informacin buscada.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la poblacin
que estamos manejando es muy grande.
El procedimiento o sistema utilizado para la seleccin de las unidades de la muestra reviste vital
importancia, ya que de dicha mtodo depende bsica y fundamentalmente el carcter representativo de
la misma y la validez de la induccin estadstica.
Si el mtodo de seleccin, no esta suficientemente ajustado a la condicin casual de las unidades, la
muestra estara expuesta a una inclinacin viciada, perjuicio o preferencia que desvirtuara sus
resultados.
En la seleccin no pueden intervenir fuerzas especiales que efecten la. Composicin de la muestra,
ya que la extraccin de las unidades deben ser resultado de una combinacin de factores
entremezclados y exentos de propensin es decir, que la seleccin antes que todo debe hacerse de
acuerdo al conjunto de causas fluctuantes conocidas como azar. Es necesario recalcar que la seleccin
final de los elementos de la muestra habr de estar basada en un mtodo de azar, sea cual fuere el tipo
de muestreo probabilstica que se piensa utilizar.
En relacin con la pregunta, cmo tomamos una muestra aleatoria en la prctica, por suerte podemos
tomarla sin recurrir en realidad al tedioso proceso de citar todas las muestras posibles. En cambio
podemos citar los N elementos individuales de una poblacin finita y despus tomar una muestra
aleatoria mediante la seleccin de los elementos que se incluirn en la muestra, uno a la vez sin
sustitucin, asegurndonos que en cada una de las elecciones sucesivas, cada uno de los elementos
restantes de la poblacin tenga la misma oportunidad de ser seleccionado. Esto nos conduce a la misma
probabilidad de cada muestra posible. Por ejemplo, para tomar una muestra aleatoria de 20 cuentas
vencidas de un archivo de 257 cuenta de este tipo, se pudiese escribir cada nmero de cuenta en un
pedazo de papel, colocar los papeles en una caja y mezclarlos vigorosamente; luego tomaramos (sin
ver) 20 papeles, uno tras otro, sin sustitucin.
Existen diferentes mtodos de seleccin al azar de uso frecuente, entre 1os que se pueden considerar
los siguientes:
Bajo este mtodo se enumera correlativamente la totalidad del universo y se procede ms o menos
similarmente a como se realiza un sorteo de lotera preparndose bolitas o similares que representan el
universo y que son introducidas en una bolsa, bombo, globo, etc. , las cuales deben
ser mezcladas y extradas al azar tal como se efecta un sorteo cualquiera. Los numeras extrados en
esa forma se confrontan con las unidades cuyos nmeros concuerdan en la lista previamente
elaborada, constituyendo los elementos de la muestra.
El objeto de las tablas de nmeros aleatorios es facilitar la obtencin de los elementos que han de
constituir la muestra, sin tener que usar bombos, cajas para bolas u otros utensilios m s o menos
complicados, pero consiguiendo que el procedimiento de seleccin no est influenciado por la
caracterstica en estudio.
Las tablas de numeras al azar son tablas con miles de nmeros obtenidos por un procedimiento como
el de la lotera, es decir, por un procedimiento al azar. La tabla puede empezarse a leer en cualquier
parte, pero debe escogerse al azar la columna y fila de comienzo para lo cual es suficiente colocar a
ciegas un dedo sobre el cuerpo de la tabla y empezar desde ese sitio la lectura.
1).- Se obtiene un listado de todos los N elementos (unidades de muestreo) que componen a la
poblacin.
3).- En una tabla de nmeros aleatorios, se elige al azar una columna (o fila) comenzando en cualquier
lugar. Se recomienda no comenzar en el mismo sitio si hay que tomar varias muestras.
4).- Una vez elegida la columna se procede a seleccionar los nmeros que estn comprendidos entre 1
y N. Desechando aquellos que estn fuera de este intervalo y los nmeros que aparezcan repetidos se
consideran slo una vez.
EJEMPLO: Supongamos que tenemos una poblacin hipottica de 12 personas y queremos tomar una
muestra aleatoria de 4 individuos, mediante el uso de una tabla de nmeros aleatorios.
Para realizar este problema, se siguen los pasos dados anteriormente.1).- Obtencin del listado de los
individuo de la poblacin. Los nombres de los electos son:
Juan Rojas
Luis Mata
Pedro Rodrguez
Miguel Jurez
Nicols Mata
Juan Marn
Jos Mota
Maria Pea
Carlos Mata
Ligia Larez
Ral Ron
Magdalys Medas
Si sucediera que el nmero de individuos a seleccionar no se alcance con las dos primeras columnas
seleccionadas, se contina con las dos siguientes columnas hasta completar el tamao de la muestra
requerida.
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente
relacin:
N .S 2 Z 2 2
n
N .d 2 S 2 Z 2 2
de donde:
n = tamao de la muestra.
N = tamao de la poblacin.
S = varianza de la muestra.
= Nivel de significancia.
Generalmente es necesario hacer un premuestreo de 30 elementos, con el objetivo de hacer una primera
estimacin de S.
Ejemplo: En un lote de frascos para medicina, con una poblacin de 8000 unidades, se desea estimar la
media de la capacidad en centmetros cbicos de los mismos.
DATOS:
Z 2 = 1.96
Solo faltara muestrear 204 frascos, pues los datos de los 35 frascos del premuestreo siguen siendo vlidos.
N . p.q.Z 2 2
n
N .d 2 p.q.Z 2 2
De donde:
p = probabilidad de xito.
q = probabilidad de fracaso.
d = precisin expresada en porcentaje.
a) hacer un premuestreo.
b) asumir varianza mxima.
Ejemplo: En una investigacin, se desea determinar en que proporcin los nios de una regin toman
leche en el desayuno. Si se sabe que existen 1.500 nios y deseamos tener una precisin del 10 %, con un
nivel de significancia del 5 % . De que tamao debe de ser la muestra?
DATOS:
N = 1500; d = 10 % = 0.1; = 5 %
p = 0.5 y q = 0.5 (asumiendo varianza mxima).
Z/2 = 1.96
Muestreo aleatorio sistemtico: es cuando los elementos de la poblacin estn ordenados por
listas. Se elige un individuo al azar y a continuacin a intervalos constantes se eligen todos los dems
hasta completar la muestra. Si el orden de los elementos es tal que los individuos prximos tienden a
ser ms semejantes que los alejados, el muestreo sistemtico tiende a ser ms preciso que el aleatorio
simple, al cubrir ms homogneamente toda la poblacin.
Este procedimiento exige, como el anterior, numerar todos los elementos de la poblacin, pero en lugar
de extraer n nmeros aleatorios slo se extrae uno. Se parte de ese nmero aleatorio i, que es un
nmero elegido al azar, y los elementos que integran la muestra son los que ocupan los lugares i, i + k,
i + 2k, i + 3k,...,i + (n-1) k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el
tamao de la poblacin entre el tamao de la muestra: k = N/n. El nmero i que empleamos como
punto de partida ser un nmero al azar entre 1 y k.
El riesgo se este tipo de muestreo est en los casos en que se dan periodicidades en la poblacin ya que
al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la poblacin. Imaginemos que estamos seleccionando una muestra sobre
listas de 10 individuos en los que los 5 primeros son varones y los 5 ltimos mujeres, si empleamos un
muestreo aleatorio sistemtico con k =10 siempre seleccionaramos o slo hombres o slo mujeres, no
podra haber una representacin de los dos sexos.
Muestreo aleatorio estratificado: es aquel que se utiliza cuando se esta interesado en que la
muestra tenga la misma composicin a la de la poblacin la cual se divide en clases o estratos. Si por
ejemplo en la poblacin el 20% son mujeres y el 80% hombres, se mantendr la misma proporcin en
la muestra. Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos
y suelen reducir el error muestral para un tamao dado de la muestra. Consiste en considerar categoras
tpicas diferentes entre s (estratos) que poseen gran homogeneidad respecto a alguna caracterstica (se
puede estratificar, por ejemplo, segn la profesin, el municipio de residencia, el sexo, el estado civil,
etc.). Una muestra aleatoria estratificada es la obtenida mediante la separacin de los elementos de la
poblacin en grupos que no se oculten maliciosamente (traslapen), llamados estratos y la seleccin
posterior de una muestra irrestrictamente aleatoria simple en cada estrato. En resumen, los motivos
principales para utilizar un muestreo aleatorio estratificado son los siguientes:
a) La estratificacin puede producir un error de estimacin ms pequeo que el que generara una muestras
del mismo tamao. Este resultado es particularmente cierto si las mediciones dentro de los estratos son
homogneas.
b) El costo por observacin en la encuesta puede ser reducido mediante la estratificacin de los elementos
de la poblacin en grupos convenientes.
Lo anterior debe de tomarse en cuenta cuando se est planeando estratificar o no una poblacin o
decidiendo en que forma se definirn los estratos.
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de inters estarn
representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formarn parte de la muestra. En ocasiones las dificultades que plantean son demasiado
grandes, pues exige un conocimiento detallado de la poblacin (tamao geogrfico, sexos, edades,...).
La distribucin de la muestra en funcin de los diferentes estratos se denomina afijacin, y puede ser
de diferentes tipos:
Afijacin ptima: Se tiene en cuenta la previsible dispersin de los resultados, de modo que se
considera la proporcin y la desviacin tpica. Tiene poca aplicacin ya que no se suele conocer la
desviacin.
Para conocer el tamao de cada estrato en la muestra no tenemos ms que multiplicar esa proporcin
por el tamao muestral.
Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacin:
N i2 Si2
wi
n
N 2D N i Si2
De donde:
Ni = tamao del i simo estrato.
N = tamao de la poblacin.
Si = varianza del i simo estrato.
wi = importancia o peso del i simo estrato.
B2
D , Donde B = Precisin
4
Ejemplo: En un Ingenio, se desea hacer una estimacin del promedio de grados Brix con que llega la caa
a la fbrica. Para tal el efecto, se desea realizar un muestreo aleatorio estratificado, puesto que la caa
proviene de tres tipos de proveedores. Proveedor tipo A (estrato 1) la caa proviene de lotes de la misma
finca. Proveedor tipo B (estrato 2) la caa proviene de fincas de particulares en donde el ingenio ha
prestado servicios. Proveedor tipo C (estrato 3) la caa proviene de fincas de particulares en donde el
ingenio no ha tenido ningn servicio. De estudios anteriores, se conoce el tamao y desviacin estndar de
cada estrato y adems se desea tener una precisin de un grado brix en el estudio. De que tamao debe de
ser la muestra total y de cada estrato? En es siguiente cuadro se presentan los datos de Ni, Si, y Wi de los
diferentes estratos.
DATOS:
ESTRATO Ni Si wi*
Total 998
* con distribucin proporcional.
N = Ni = 998
N12 Si2
wi
n
N 2D N i Si2
N i
2
S i2
N12 S12 N 22 S 22 N 32 S 32
wi w1 w2 w3
N i
2
S i2
(558) 2 (3.5) 2 (190) 2 (5.4) 2 (250) 2 (6.2) 2
wi 0.56 0.19 0.25
N i
2
S i2
3814209 1052676 2402500
wi 0.56 0.19 0.25
N i
2
S i2
6811087,5 5540400 9610000
wi
N i
2
S i2
21961487.5
wi
N S i i
2
N1 S12 N 2 S 22 N 3 S 32
N S i i
2
558(3.5) 2 190(5.4) 2 250(6.2) 2
N S i i
2
6835.5 5540.4 9610
N S i i
2
21985.9
La.. Pr esision..B..es..1.
B 2 12
D 0.25
4 4
N D (998) 2 (0.25) 249001.
2
N i
2
S i2
wi 21961487.5 21961487.5
n 81,..es..el ..tamao..de.
N D N i Si
2 2
249001 21986 270987
.la..muestra..total .
Como se utiliz distribucin proporcional, a cada estrato le tocara el siguiente tamao de muestra:
Muestreo polietpico o por conglomerados: Los mtodos presentados hasta ahora estn
pensados para seleccionar directamente los elementos de la poblacin, es decir, que las unidades
muestrales son los elementos de la poblacin. En el muestreo por conglomerados la unidad muestral es
un grupo de elementos de la poblacin que forman una unidad, a la que llamamos conglomerado. Las
unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son
conglomerados naturales.
En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas
electorales. Cuando los conglomerados son rea geogrfica suele hablarse de "muestreo por reas". El
muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de
conglomerados (el necesario para alcanzar el tamao muestral establecido) y en investigar despus
todos los elementos pertenecientes a los conglomerados elegidos. En una investigacin en la que se
trata de conocer el grado de satisfaccin laboral los profesores de instituto necesitamos una muestra de
700 sujetos. Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra
por conglomerados. Sabiendo que el nmero de profesores por instituto es aproximadamente de 35, los
pasos a seguir seran los siguientes:
Se selecciona una muestra de tamao Sencillo y de fcil comprensin. Requiere que se posea de
n de una poblacin de N unidades, Clculo rpido de medias y antemano un listado completo de
Aleatorio cada elemento tiene una probabilidad varianzas. Se basa en la teora toda la poblacin. Cuando se
simple de inclusin igual y conocida de n/N. estadstica, y por tanto existen trabaja con muestras pequeas es
paquetes informticos para analizar posible que no represente a la
los datos poblacin adecuadamente.
Se realizan varias fases de muestreo Es muy eficiente cuando la El error estndar es mayor que en
sucesivas (polietpico) La necesidad poblacin es muy grande y el muestreo aleatorio simple o
Conglomerados de listados de las unidades de una dispersa. No es preciso tener un estratificado. El clculo del error
etapa se limita a aquellas unidades de listado de toda la poblacin, slo de estndar es complejo.
muestreo seleccionadas en la etapa las unidades primarias de muestreo.
anterior.
Las ventajas de estudiar una poblacin a partir de sus muestras son principalmente:
Coste reducido:
Si los datos que buscamos los podemos obtener a partir de una pequea parte del total de la
poblacin, los gastos de recogida y tratamiento de los datos sern menores. Por ejemplo, cuando
se realizan encuestas previas a un referndum, es ms barato preguntar a 4.000 personas su
intencin de voto, que a 30.000.000;
Mayor rapidez:
Estamos acostumbrados a ver cmo con los resultados del escrutinio de las primeras mesas
electorales, se obtiene una aproximacin bastante buena del resultado final de unas elecciones,
muchas horas antes de que el recuento final de votos haya finalizado;
Ms posibilidades:
Para hacer cierto tipo de estudios, por ejemplo el de duracin de cierto tipo de bombillas, no es
posible en la prctica destruirlas todas para conocer su vida media, ya que no quedara nada que
vender. Es mejor destruir slo una pequea parte de ellas y sacar conclusiones sobre las dems.
De este modo se ve que al hacer estadstica inferencial debemos enfrentarnos con dos problemas:
En los muestreos no probabilsticos no se usa el azar, sino el criterio del investigador, suele presentar
grandes sesgos y es poco fiable; no garantizan la representatividad de la muestra y por lo tanto no
permiten realizar estimaciones inferenciales sobre la poblacin.
Muestreo por cuotas: Tambin denominado en ocasiones "accidental". Se asienta generalmente sobre
la base de un buen conocimiento de los estratos de la poblacin y/o de los individuos ms
"representativos" o "adecuados" para los fines de la investigacin. Mantiene, por tanto, semejanzas con
el muestreo aleatorio estratificado, pero no tiene el carcter de aleatoriedad de aqul.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de individuos que renen
unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 aos, de sexo femenino y
residentes en Gijn. Una vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas caractersticas. Este mtodo se utiliza mucho en las encuestas de opinin.
Por ejemplo, la Oficina de Sanidad desea estudiar la incidencia de las drogas en la adolescencia. Lo que
deberamos hacer sera: conocer por los informes de la Consejera de Educacin cuales son los centros
ms afectados por el problema, fijar un nmero de sujetos a entrevistar proporcional a cada uno de los
estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos
concretos se deber entrevistar
Muestreo opintico o intencional: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras "representativas" mediante la inclusin en la muestra de grupos supuestamente
tpicos. Es muy frecuente su utilizacin en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto.
A veces no es fcil lograr una muestra aleatoria. Si la poblacin de que se trata es pequea, uno de los
mtodos ms sencillos para obtenerla es formular una lista de integrantes (en pequeas tiras de papel) y
escoger la muestra al azar.
Cuando se trata de poblaciones ms grandes, se puede asignar un nmero entero a cada miembro y usar
una tabla de nmeros aleatorios, integrada por dgitos escogidos al azar. Para lograr la muestra
aleatoria, se comienzan a leer los nmeros de la tabla en un lugar tambin escogido al azar, as, para
cada nmero seleccionado el miembro de la poblacin consta de 100 miembros, se pueden asignar los
nmeros de 10 al 99. Si en la tabla se leen los nmeros 2, 7, 22, 34, etc., se incluan dichos nmeros en
la muestra aleatoria. La muestra en estudio en cualquier investigacin debe ser representativa del
universo estadstico (poblacin ideal que abarca a todos los individuos que posean las mismas
caractersticas y en la misma proporcin del colectivo). Cuando ms grande sea la muestra, ms
representativa resultar; sin embargo, no necesita ser ms grande cuando es suficiente representativa.
Esta es la prueba de estabilidad de la muestra.
TAMAO DE LA MUESTRA
A la hora de determinar el tamao que debe alcanzar una muestra hay que tomar en cuenta varios
factores: el tipo de muestreo, el parmetro a estimar, el error muestral admisible, la varianza
poblacional y el nivel de confianza. Por ello antes de presentar algunos casos sencillos de clculo del
tamao muestral delimitemos estos factores.
Para calcular el tamao de una muestra hay que tomar en cuenta tres factores:
1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacin total.
2. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin.
3. El nivel de variabilidad que se calcula para comprobar la hiptesis.
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los
resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe
ninguna duda para generalizar tales resultados, pero tambin implica estudiar a la totalidad de los casos
de la poblacin. Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
prcticamente imposible el estudio de todos los casos, entonces se busca un porcentaje de confianza
menor. Comnmente en las investigaciones sociales se busca un 95%.
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hiptesis que sea falsa
como si fuera verdadera, o la inversa: rechazar a hiptesis verdadera por considerarla falsa. Al igual
que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%,
entonces la muestra es del mismo tamao que la poblacin, por lo que conviene correr un cierto riesgo
de equivocarse.
Que sea representativa: esto quiere decir que los elementos seleccionados debern presentar
caractersticas similares a las de la poblacin o universo.
Al utilizar muestras en lugar de universos tenemos grandes ventajas, algunas de las ms importantes
son:
El costo se reduce, pues los gastos sern nicamente los ocasionados por una parte del universo
(muestra tomada) y no por la totalidad de l.
Como solamente se estudia una parte del universo, la informacin obtenida se realiza en menor
tiempo.
Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacin y difcil de contestar,
sobre todo por falta de informacin del problema, es: cuntas observaciones se deben obtener para que
el tamao de la muestra sea realmente representativo del universo estadstico? En este sentido -la
decisin del tamao de la muestra de una poblacin -, es necesario considerar que las muestras varan
en su composicin de una a otra. La magnitud de la variacin depende del tamao de la muestra y de la
variabilidad original de la poblacin. As, el tamao de la muestra queda determinada por el grado de
precisin que se desea obtener y por variabilidad inicial de la poblacin.
1. Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a
dicho nivel de confianza, un nivel de confianza igual o mayor al 92% es aceptable estadsticamente.
2. Evaluar la probabilidad a favor de que suceda un evento o situacin esperada (esta probabilidad se le
denomina p).
4. Determinar el error (e) mximo para el nivel de precisin que vayamos a permitir en los resultados
(error mximo de estimacin), comnmente se trabaja con errores de estimacin entre el 2% y el 6%,
ya que la validez de la informacin se reduce demasiado para valores mayores del 6%.
5.- Se elige la frmula a utilizar para calcular el tamao de la muestra; dependiendo de si la poblacin o
universo sujeto a estudio se va a considerar infinito infinito. (Una poblacin o universo se considera
infinito si el nmero de elementos de los que consta es igual o mayor a 500,000 y es considerado finito
si el nmero de elementos es menor a esta cantidad).
Nivel de Confianza 99.73% 99% 98% 96% 95.45% 95% 90% 80% 68.27% 50%
Valores de Z 3.00 2.58 2.33 2.05 2.00 1.96 1.645 1.28 1.00 0.6745
TAMAO DE LA MUESTRA
Una de las primeras preguntas que debe realizarse antes de emprender cualquier encuesta o estudio es:
qu tamao de muestra necesito? La respuesta depender del diseo del estudio; es decir, de los
objetivos, naturaleza y alcance del mismo, y del resultado previsto del mismo. Todo esto deber tenerse
en cuenta en la fase de planificacin del estudio.
El tamao de la Muestra es importante porque tiene relacin estrecha con el costo de la Muestra. Para
reducir Costos se procura tomar una Muestra menor pero representativa y significativa.
La cuestin de que tan grande tomar una muestra surge inmediatamente en la planificacin de cualquier
investigacin o experimento. Esto es muy importante y no debe tratarse con ligereza. Tomar una
muestra ms grande de lo necesario para alcanzar los resultados deseados, es un desperdicio de
recursos y tiempo, mientras que muestras muy pequeas pueden conducir a conclusiones errneas. El
tamao de la muestra depende de la desviacin estndar (S), del grado de confiabilidad (Z) y del ancho
del intervalo de confianza (e), o precisin.
Z 2 pq
2
Z Z2
n , Si p = q = 50 %, entonces: n n 2 .(1)
e2 2e 4e
Cuando se requiere determinar el tamao de la muestra para estimar una proporcin se tienen que
definir tres incgnitas:
l.-En muchas situaciones se cuenta con informacin anterior o con experiencias relevantes que
permiten obtener un estimado o informacin de p.
2.- Si no se cuenta con informacin anterior o con experiencias relevantes se intenta proporcionar un
valor para p que nunca subestime el tamao de la muestra necesaria Es conveniente determinar el valor
de p de una forma tal que el producto p.q sea lo mayor posible, alcanzndose el mximo producto
cuando p = q = 0.50, entonces p.q = 0.25. Por lo tanto cuando se desconoce o no hay un estimado
previo de la proporcin real de p se debe utilizar un p = 0.5 como la forma mas conservadora para
determinar el tamao de la muestra. Sin embargo, la utilizacin de p puede dar como resultado una
sobrestimacin en el tamao de la muestra, pero es un riego que se debe asumir.
SOLUCIN: Se puede observar que ante el desconocimiento, por cualquier medio, del parmetro p,
debemos obtener el tamao de la muestra requerida para satisfacer las exigencias del investigador por
medio de la expresin:
2
Z Z2
n n 2
2e 4e
Donde se tendr que sustituir tanto el valor de Z correspondiente a un coeficiente de confianza de 99 %
que no es otro que 2,58 como el error mximo admitido que es 0.15 y como no se conoce un valor
estimado para p y q se tomara el mximo valor para este producto, es decir, p = q = 0.5. Luego se
aplica la formula:
2
Z Z2 (2.58) 2 6.66
n n 2 70.0 . Por lo tanto el tamao de la muestra ser de 74.
2e
2
4e 4(0.15) 4(0..023)
2.- Supngase que por estudios anteriores se tenga el conocimiento de que la proporcin de deportistas
entre los estudiantes de una universidad es de 0.65. Se pregunta Qu tamao de muestra deber
tomarse si se quiere que el error no exceda del 15 % Y con un grado de confianza del 99 %.
SOLUCIN: Tomando en cuenta que se tiene conocimiento de que la proporcin de estudiantes que
practican algn deporte, en esa universidad, es de 0.65, se puede utilizar este valor como una
estimacin de la proporcin verdadera, en cuyo caso nos valdremos de la siguiente formula matemtica
para obtener el tamao de la muestra necesaria. Entonces, p 0.65,.q 0.35,.e 0.15.. y..Z 2.58.
2
2
Z 2 pq
n , sustituyendo los datos conocidos en esa formula se tiene:
e2
Puede observarse como el conocimiento de alguna estimacin del parmetro p ha hecho disminuir el
tamao de la muestra necesaria para satisfacer la misma precisin. Esto demuestra que el valor que
tiene la informacin de experiencias pasadas sobre el hecho que se estudia.
Z2 2 N . p.q
n , esta.. formula..se..usa.. para..N 30.
e 2 N Z2 2 p.q
Z2 2 N . p.q
n .
e 2 ( N 1) Z2 2 p.q
Donde
n es el tamao de la muestra;
Z es el nivel de confianza;
p es la variabilidad positiva;
q es la variabilidad negativa;
N es el tamao de la poblacin;
e es la precisin o el error.
Al conocer exactamente el tamao de la poblacin, el tamao de la muestra resulta con mayor precisin
y se pueden incluso ahorrarse recursos y tiempo para la aplicacin y desarrollo de una investigacin.
Ejemplo 1: En los Colegios de Curas extendido por todo Amrica del sur, se desea realizar una
investigacin sobre los alumnos inscritos en primer y segundo aos, para lo cual se aplicar un
cuestionario de manera aleatoria a una muestra, pues los recursos econmicos y el tiempo para procesar
la informacin resultara insuficiente en el caso de aplicrsele a la poblacin estudiantil completa.
En primera instancia, suponiendo que no se conoce el tamao exacto de la poblacin pero con la
Z 2 pq
seguridad de que sta se encuentra cerca de los diez millardo, se aplicar la formula n 22 .
e
Se considerar una confianza del 95 %, un porcentaje de error del 5% y la mxima variabilidad (p.q)
por no existir antecedentes en la institucin sobre la investigacin y porque no se puede aplicar una
prueba previa.
Primero habr que obtener el valor de Z de tal forma que la confianza sea del 95 %, es decir, buscar un
valor de Z tal que P(-Z<z<Z) = 0.95. Utilizando las tablas resulta que Z = 1.96.
Z 2 pq
De esta manera se aplica la formula n 2
, se realiza la sustitucin y se obtiene n as:
e2
Con lo que se tiene una cota mnima de 370 alumnos para la muestra y as poder realizar la
investigacin sin ms costo del necesario, pero con la seguridad de que las condiciones aceptadas para
la generalizacin (confiabilidad, variabilidad y error) se mantienen. Es importante destacar que el
resultado que se obtiene cuando no se conoce N (384) es muy similar al que se obtiene cuando N es
conocida (370).
EJEMPLO 2: El jefe del Departamento de Control de Estudio del IUTJAA, quiere comprobar a travs
de una muestra aleatoria la proporcin de estudiantes que han desertado del IUTJAA, cuya poblacin
esta constituida por 7.000 alumnos. El jefe del departamento especifica que el error mximo admisible
no debe ser ms de 5 % de la verdadera proporcin, para el trabajo se requiere un nivel de confianza de
98 %, y el valor de p es estimado en 50 %. Encuentre el tamao de la muestra requerido.
DATOS:
N = 7000
e = 0.05
Z al 98 % =2.33
P = 0.5
q = 0.5
n =?
SOLUCIN: Como lo muestra solicitada se refiere a las proporciones se aplicara la siguiente formula:
Luego el tamao de la muestra necesario para el estudio es de 427 alumnos, que tendr que Tamar por
un muestreo del total.
Cuando el muestreo es sin reemplazo a partir de una poblacin finita, SUPONIENDO UNA
DISTRIBUCIN NORMAL, se requiere la correccin por poblacin finita, entonces la ecuacin para
obtener el TAMAO DE LA MUESTRA para la estimacin de la media poblacional, queda as:
ZS N n
e
n N 1
N 2 Z2 2
n
e 2 ( N 1) 2 Z2 2
Los investigadores consideran que esta formula solo se utiliza cuando N<30.
N 2 Z2 2
n , Se utiliza para N>30..
e 2 N 2 Z2 2
Donde
n = es el tamao de la muestra;
Z = es el nivel de confianza o valor critico correspondiente al nivel de confianza elegido
Varianza poblacional o en su defecto la desviacin tpica muestral (S).
N = es el tamao de la poblacin o universo muestral
e es la precisin o el error.
La formula para el tamao de la muestra requiere que se conozca 2 pero, generalmente este
parmetro no se conoce; entonces hay que estimarla. Las fuentes de estimacin para la varianza
poblacional son:
Se puede extraer una muestra piloto para usarse la varianza calculada a partir de la muestra como una
estimacin de 2 .
EJEMPLO 1: Se desea determinar el tamao de una muestra apropiada para medir la longitud de una
serie de tubos para hacer un gasducto, con una precisin de 5 cm. en la longitud de cada tubo y un
nivel de confianza de 95 %. Para tal efecto se tomo una muestra piloto de 10 tubos que arrojo una
varianza de 30.
DATOS:
N = 20
2 = 30
Z = 1.96
e=5
SOLUCIN: Como se sabe que nmero de tubos por lotes es de 20, se requiere la correccin por
poblacin finita; luego se aplica la formula as:
N 2 Z2 2 20.30(1.96) 2 2304.96
n 2 4.0
e 2 ( N 1) 2 Z2 2 5 (19) 30(1.96) 2
590.25
Se concluye que con la variacin observada y la precisin escogida, el tamao de muestra adecuada es
4 tubos por lote.
EJEMPLO 2: Sea una poblacin de obreros de tamao N = 2000, de la que nos proponemos obtener
una muestra mediante un muestreo aleatorio, para estimar el sueldo promedio. Se quiere que la
estimacin muestral no se aparte en ms de 0.5 puntos (error mximo admisible) del promedio
verdadero, con un nivel de confianza de 95 %. La varianza poblacional es de 2.5 puntos.
DATOS:
N = 2000
e = 0.5
Z al 95 % = 1.96
2 = 2.5
n =?
Entonces el nmero de obreros que hay que seleccionar para que la estimacin est en el intervalo
( 0.5;.. 0.5) con un nivel de confianza del 95 % es de n = 38 obreros.
El Teorema Central del Lmite dice que si tenemos un grupo numeroso de variables independientes y
todas ellas siguen el mismo modelo de distribucin (cualquiera que ste sea), la suma de ellas se
distribuye segn una distribucin normal.
Es decir, Si x1, x2,.....en son variables aleatorias independientes cada una con media i y
Ejemplo: La variable "tirar una moneda al aire" sigue la distribucin Binomial. Si lanzamos la moneda
al aire 50 veces, la suma de estas 50 variables (cada una independiente entre si) se distribuye segn una
distribucin normal.
Este teorema se aplica tanto a suma de variables discretas como de variables continuas. Los parmetros
de la distribucin normal son:
Varianza: n.
2
individuales)
Ejemplo: Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y si sale sello el valor
0. Cada lanzamiento es una variable independiente que se distribuye segn el modelo Binomial, con
media 0,5 y varianza 0,25. Calcular la probabilidad de que en estos 100 lanzamientos salgan ms de 60
caras.
La variable suma de estas 100 variables independientes se distribuye, por tanto, segn una distribucin
normal.
Para ver la probabilidad de que salgan ms de 60 caras calculamos la variable normal tipificada
equivalente:
X 60 50
Z
5*
(*) 5 es la raz cuadrada de 25, o sea la desviacin tpica de esta distribucin
Por lo tanto:
Es decir, la probabilidad de que al tirar 100 veces la moneda salga ms de 60 caras es tan slo del
2,28%