Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
MUESTREO
Es sumamente importante mencionar las diferentes alternativas que existen para realizar
una investigacin, en cada uno de las cuales, el objetivo final es calcular el tamao de la
Muestra para realizar inferencias confiables.
La investigacin puede ser original o puede basarse en antecedentes.
A partir de este hecho, los diferentes indicadores que se necesitan para el clculo del
tamao de muestra mediante el Marco Terico Estadstico Matemtico se obtiene del
antecedente o antecedentes las referencias ms importantes.
Se hace uso de una muestra piloto o encuesta piloto. Los diferentes indicadores que se
necesitan para calcular el tamao de muestra se obtienen de los resultados obtenidos en
la evaluacin realizada en la Muestra Piloto.
1
Son dos alternativas sumamente importantes de trabajo, las cuales al cumplirlas
estrctamente estamos en condiciones de obtener el tamao muestral esperado para lograr
inferencias confiables.
TIPOS DE MUESTREO
La muestra dirigida est constituida por una parte de la poblacin que el investigador
considera representativa del universo, como en el caso de seleccionar diez (10)
familias ubicadas en un barrio de la ciudad, para que opinen sobre la seguridad o
medidas de vigilancia en la zona. Tambin pudo haberse hecho un llamado a las
familias del barrio para que se presentaran voluntariamente a dar su opinin; en este
caso el proceso se denomina muestreo de voluntarios.
2
establecimiento. Si se desea practicar examen de sangre a un paciente, el resultado
ser el mismo aunque la muestra vare de 1 cm3 a un litro.
Muestreo Aleatorio:- Una muestra es aleatoria cuando los elementos que constituyen
la poblacin o universo tienen la misma posibilidad de ser seleccionados.
Existen numerosos procedimientos en la aplicacin del muestreo aleatorio. Los ms
importantes son:
1.- Muestreo Aleatorio Simple:- Con reposicin de las unidades, corresponde a una
distribucin binomial; sin reposicin, a una distribucin hipergomtrica.
3
2.- Muestreo Aleatorio Estratificado:- se le domina tambin como muestreo
aleatorio restringido. Este procedimiento implica una divisin de la poblacin en grupos,
denominados estratos, en tal forma que el elemento presenta una caracterstica tan
definida que slo le permitir pertenecer a un nico estrato. Por lo tanto, para que la
divisin por grupos sea efectiva, los factores de estratificacin debern guardar
estrecha relacin con las caractersticas que se investigan y con el objetivo o finalidad
del estudio. De esta manera se logra una mayor precisin en los resultados.
Supongamos que se quiere hacer una investigacin sobre el transporte urbano en una
determinada ciudad, con el fin de establecer los costos de operacin por pasajero. En
este caso, una muestra aleatoria simple de 300 vehculos no nos da garanta de que
los diferentes tipos de vehculos, buses, busetas, micros y colectivos queden bien
representados en la muestra, si se tiene en cuenta que puede haber grandes
diferencias, no slo en cuanto a capacidad del vehculo, sino en su recorrido. En este
caso, es preferible establecer estratos o grupos mediante la clasificacin segn el tipo
del vehculo.
4
b) Afijacin Proporcional o Asignacin Proporcional:- los elementos se distribuyen
en los estratos muestrales, en la misma proporcin en que se distribuyen los
elementos en la poblacin.
c) Afijacin ptima:- cuando el tamao, tanto de la muestra general como para cada
uno de los estratos muestrales, dependen del grado de variabilidad de la
caracterstica en cada estrato y del costo mnimo para una precisin dada.
4.- Muestreo Doble:- denominado tambin bifsico porque se efecta en dos fases.
Es aplicado de preferencia, cuando no existe informacin auxiliar que permita conocer
los tamaos poblacionales de los estratos, ni la identificacin de las unidades; en este
caso, primero se realiza una muestra aleatoria simple, generalmente grande, en forma
rpida y sencilla para conocer en forma muy general algunas de las caractersticas
objeto del estudio, luego se procede a una segunda muestra extrada de la anterior, la
que podra considerarse como submuestra con la cual se hacen las estimaciones. Si se
utilizan ms de dos fases, se habla de muestreo mltiple o polifsico.
5
elementales de la poblacin. El muestreo por conglomerados se utiliza cuando o bien,
no existe listado, o las unidades estn demasiado dispersas.
Esto nos obliga a sustituir las unidades fsicas o elementos, por grupos de unidades,
que llamaremos conglomerados; generalmente son superficies o reas en las que se
ha dividido el espacio ocupado por la poblacin. Supongamos que se desean realizar
estudios a familias en una ciudad. Cada unidad o familia se constituye en un
conglomerado, por tal razn se aplica el muestreo aleatorio monoetpico, es decir, se
realiza la investigacin en una sola etapa.
Si anteriormente se realiz una seleccin de manzanas de cada una de estas
manzanas, se selecciona otra muestra correspondiente a familias, el mtodo ser
bietpico o multietpico. Obsrvese que hay una modificacin con respecto al anterior
mtodo, ya que los elementos no forman parte de los conglomerados, sino que son una
muestra o sub-muestra de cada uno de ellos.
6.- Sub-muestras Interpenetrantes:- en este mtodo las submuestras, cada una con
un nmero de unidades, son seleccionadas aleatoriamente de la poblacin. Este
metido es utilizado en general para medir la concordancia entre los resultados
obtenidos de muestras sucesivas.
6
MARCO
Para la seleccin de las unidades se requiere de un listado, que en algunos casos debe
prepararse, en otras, tan slo se actualiza. Este listado debe corresponder al total de
las unidades o elementos que integran la poblacin a investigar o a seleccionar que, a
su vez, constituyen el marco de referencia o marco muestral, constituido por la
poblacin objetivo. Por ejemplo, la nmina de pago, ya sea para un grupo de
trabajadores en una fbrica o reempleados en una empresa, podra ser el marco; otro
ejemplo podra ser el listado de matrculas de los estudiantes en una universidad.
Sin embargo, el marco no siempre estar representado por un listado, podra ser
tambin un mapa o fotografas areas. En el marco no deben aparecer unidades falsas;
ejemplo: en el listado de matriculas no deben figurar aquellos estudiantes que se han
realizado por diferentes causas, pero que se alcanzaron a matricular.
En el muestreo por etapas mltiples, debe existir un marco para cada etapa.
En marco en cada etapa, debe ser suficiente detallado en cuanto a la
identificacin de sus unidades de tal manera que si una de ellas es incluida
en la muestra, puede ser ubicada e investigada rpidamente sin que ello
implique que se especifique la informacin que debe suministrar cada
unidad.
Rara vez los marcos son perfectos y lo comn es que sean inexactos,
inadecuadamente descritos, desactualizados o con unidades duplicadas; por tal motivo,
deben ser revisados y actualizados de manera que permitan una fiabilidad razonable
por cuanto la muestra se basa en ellos.
7
a) El grado de precisin requerido en los estimadores.
b) Tamao de la muestra.
c) Costo y tiempo.
Se les llama estimadores, ya que se les considera como el mejor valor que sustituye a los
valores numricos poblacionales, generalmente desconocidos, a los que se llega por
medio de datos proporcionados por la muestra, , en tanto que un parmetro describe una
determinada caracterstica de las unidades en la poblacin.
Si para cada parmetro desconocido se calcula una cifra nica, la estimacin se denomina
puntual o estimacin de punto.
Sise establece un intervalo o rango de valores, dentro de los cuales se espera encontrar el
parmetro, con cierto grado de confianza, se le denomina estimacin de intervalo. Los
lmites que definen el intervalo se conocen como limites de confianza.
8
c. Consistente:- se obtiene cuando el tamao de la muestra se incrementa en tal
forma que la varianza desminuya, siendo menor la diferencia entre el valor real y el
estimado.
d. Suficiente: es un estimador que utiliza toda la informacin que posee una muestra
sobre el parmetro que se estima.
En el clculo del tamao ptimo, se deben tener en cuenta, los siguientes componentes:
(1) El error de Muestreo:- es la diferencia que puede haber entre el valor poblacional y la
estimacin de la misma (estimacin puntual o estadgrafo), obtenida por medio de una
muestra aleatoria, observada en una de las tantas muestra posibles de una poblacin
dada. La totalidad de estos errores, genera la distribucin de muestreo empleada para
estimar el valor poblacional.
E x x Media muestral
xE Media poblacional.
En muchos casos, el error ser determinado por el investigador, por ejemplo: si para un
sector de la economa se quiere estimar el promedio de salarios y se sabe por
observaciones aisladas o por experiencia, que el ingreso promedio para ese sector es,
aproximadamente, de 480.000, el error respecto al parmetro podra ser: 480.000
E. de acuerdo a la finalidad de la investigacin podra considerarse, para este caso,
que un error de 60.000 o cualquier otro valor es ms que suficiente, dado el grado
de variabilidad que supuestamente tengan los salarios en dicho sector. Sin embargo,
este procedimiento requiere, adems de cierta experiencia, un conocimiento previo
9
sobre el comportamiento de la caracterstica en la poblacin que se estudia, de ah que
es mucho ms practico determinar el error como un porcentaje, en la mayora de los
casos no mayor del 10%, aplicando a la medida aritmtica, generalmente obtenida en
una encuesta preliminar: E (%)(x )
El porcentaje podra considerarse en algunos casos como un complemento del nivel de
confianza as que una confianza del 95% dara un error del 5%, pero no siempre ser el
complemento, ya que este porcentaje podr aumentarse o disminuirse dependiendo del
grado de precisin con que se desea hacer la estimacin.
Pero hay otro tipo de error que no tiene nada que ver con el muestreo y que no se
puede medir. Estos errores denominados ajenos al muestreo, no muestrales o
sistemticos, se consideran como el resultado de instrumentos de medicin
incorrectos, cuestionarios mal definidos, errores que comete el entrevistador al efectuar
las preguntas o al interpretar las respuestas, preguntas vagas o ambiguas; en otros
casos, son consecuencia de la influencia negativa del entrevistador, del mal diseo del
formulario. Tambin podra ser el resultado de los procesos de crtica, codificacin,
tabulacin, en los cuales se pueden cometer errores ajenos al muestreo.
(2) La varianza:- del grado de variabilidad, varianza, depende en gran parte el tamao de
la muestra. Por ejemplo, el mdico que realiza un anlisis de sangre, el panadero que
se come un pan, el cocinero que paladea una cucharada de sopa; cada uno de ellos ha
hecho uso de una muestra. Obsrvese que con un centmetro de sangre, un pan o una
cucharada de sopa se puede determinar el comportamiento de la totalidad (sangre del
paciente, total de panes producidos en una jornada, total de sopa preparada para el
almuerzo) y se debe al grado de homogeneidad que presenta la caracterstica
observada; cualquier muestra que se tome de estas poblaciones se espera que d un
resultado igual, representativo del total.
10
En el clculo del tamao de la muestra, lo ideal sera que la varianza correspondiera a
la poblacin investigada, pero en la mayora de los casos esto no es posible, de ah
que exista la necesidad de estimarla mediante:
a). Encuestas preliminares, piloto o pretest, sistema que consiste en la realizacin de
una pequea encuesta, cuyo tamao por lo general se toma en forma abierta, fijndose
un porcentaje que debe ser aplicado al tamao poblacional. Esta varianza resultante de
la encuesta se considera que puede ser un buen sustituto al de la poblacin.
b). El empleo de la varianza, obtenida en censos o investigaciones similares, realizadas
con anterioridad.
c). Otras veces son el resultado de conjeturas sobre la poblacin.
De igual modo la encuesta preliminar permite hasta cierto punto, probar gran parte de
los mecanismos tcnicos de muestreo, establecer los costos, localizar las unidades,
comprobar si la medicin es exacta, etc.
DISEO DE MUESTREO
11
El diseo y el tamao de la muestra nos van a determinar la cantidad de la informacin
necesaria respecto a los objetivos de la encuesta. Recordemos que el objetivo del
muestreo es contar con el mayor nmero de unidades, con la mayor cantidad de
informacin, pero al menor costo posible.
A veces se cree que con mucha informacin se logran buenas estimaciones; sin embargo,
generalmente ocasionan despilfarro de dinero, prdida intil de tiempo y complicaciones
en la organizacin y anlisis de los datos. Otras veces se peca por poca informacin, que
hace temer por el xito de la investigacin. Los dos casos se deben a que la muestra no
fue correctamente diseada.
Para el diseo de la muestra y clculo del tamao, se requiere que se hayan adelantado
algunas etapas, tales como:
12
c) Debemos determinar la poblacin objetivo, que debe estar claramente definida y
plenamente identificable al iniciar el proceso de seleccin y la entrevista. Implica
identificar la unidad o el elemento, la cual debe ser: clara, mensurable, adecuada y
comparable. En nuestro problema, la unidad corresponde a aquellas familias que
viven en el barrio objeto de investigacin. Observemos que la familia es, en nuestro
caso, la unidad de seleccin.
13
h) A esta altura se han desarrollado otras etapas tales como: la elaboracin del
instrumento de recoleccin, la seleccin y preparacin del personal, se ha hecho el
examen de la documentacin en especial para determinar si este tipo de estudio ya
fue realizado y si existe alguna metodologa que se haya aplicado a una
investigacin similar, con buenos resultados; adems, se cuenta con los recursos
necesarios que permitan el buen desarrollo y terminacin del trabajo.
En el diseo y determinacin del tamao de la muestra se hicieron algunas
consideraciones que se deben tener en cuenta en una investigacin, siendo una de
ellas el grado de homogeneidad que presenten las caractersticas que se vana
investigar, pues nos permite tomar decisiones respecto al mtodo de muestreo que
debe corresponder a la investigacin que repiensa realizar.
FORMULARIO O CUESTIONARIO
14
Realizada el departamento N 001
de investigacin cientfica
I GENERALIDADES
Nombre del
informante: _______________________________
II..
3, Consumo diario
carne ___________ Gramos
15
Datos correspondientes a 355 familias que residen en el barrio X
Tamao de la Muestra
Clculo del Tamao de la muestra cuando no se conoce la Varianza Poblacional:- En
la prctica es muy frecuente que no se conozca la varianza de la caracterstica en la
poblacin ( S 2 ); en tales casos se debe recurrir a censos, a investigaciones similares
realizadas con anterioridad o a investigaciones preliminares, denominadas encuestas
piloto. Este ltimo procedimiento es el que ms se emplea para determinar el tamao de la
muestra, partiendo del supuesto de que no existe informacin sobre la poblacin. En
primer lugar, se elabora un listado de familias a investigar y que conforman el marco
muestral, tal como aparece en el cuadro precedente. Despus de haber identificado la
poblacin a la cual se va a investigar, definida claramente la unidad de investigacin y las
caractersticas que tiene que ver con el estudio, se procede a establecer el tamao ptimo
para la muestra.
16
familias. La familia o unidad de investigacin se ha definido como el conjunto de personas,
(del barrio X) que viven bajo un mismo techo, ligadas por un lazo de consanguinidad y
dependencia econmica. Una vez identificada y enumerada la poblacin se procede a
calcular el tamao de la muestra, mediante la frmula:
n0 S2
n Z 2S 2 NZ 2 S 2 E
(1) n0 Donde n0 (2) n (3) E S2
1 E2 NE 2 Z 2 S 2 ( )2
N Z N
Como se conocen las varianzas poblacionales de una o algunas de las caractersticos que
tienen que ver con el objetivo principal de la investigacin, se procede a estimarlas
mediante una encuesta piloto o preliminar, siendo:
4 4
n piloto n piloto (355) 14
100 100
17
Informacin obtenida mediante La Encuesta Preliminar o Piloto
Consumo
N Nmeros Ingresos Vivienda N Total Diario
M F Trabajando
de
Orden Aleatorios (miles $) Propia personas de carne (grs.)
1 335 242 si 3 1 2 1 760
2 004 106 si 3 1 2 1 765
3 289 286 no 3 1 2 2 592
4 128 232 no 3 1 2 2 520
5 097 112 si 3 1 2 1 610
6 271 250 si 5 1 4 2 636
7 253 193 si 2 0 2 2 650
8 348 102 si 3 2 1 1 605
9 202 196 si 2 1 1 1 642
10 349 11 no 2 0 2 1 520
11 197 97 no 2 1 1 1 508
12 018 179 no 4 2 2 1 767
13 020 225 no 3 1 2 2 842
14 207 175 si 2 0 2 1 684
x
x i
2506
179 E 0.05( x ) 0.05(179) 9 (Nueve mil pesos)
n 14
x 2
i nx 2 501.554 14(179) 2
s 2
4.075,38
n 1 14 1
Z 2 S 2 2 2 (4.075,38)
n0 181.11
E2 92
n0 181.11
n 120 familias
n0 181.11
1 1
N 355
NZ 2 S 2 355(22 )(4.075,38)
n 120 familias
NE 2 Z 2 S 2 355(92 ) 2 2
18
Tambin se puede calcular mediante:
S2 4.075,38
n 120 familias
( E / Z ) S / N (9 / 2) 4.075,38 / 355)
2 2 2
Algunos utilizan la formula con correccin, ya que se considera que la varianza obtenida
mediante una encuesta preliminar, cuando est es muy pequea, se hace poco
representativa, es decir, que el resultado de n es menor que el obtenido con varianza
poblacional.
Procedemos al clculo de n con correccin:
206,98
Z 2S 2 2 2 2 (4.075,38) 2 n 131 familias
n0 2 1 1 206,98 206,98
E n1 9 2
14 1
355
181.11
22 (355)(4.075.38) n 120 familias
n0 650.07 1
181,11
3.1952 94
x x 2
9.101 i nx 2 6054.547 14(650,07) 2
10.634,38
i
x 650.07 s 2
n 14 n 1 14 1
s = 103.12
E = 0.05 ( x ) = 0.05 (650.07) = 32.50 E 2 1.056,48
n 40,26
Z 2S 2 2 2 (10.634,38) n 0 37 familias
n0 40, 26 , n0 40,26
E 2
1.056,48 1 1
N 355
19
Tambin se puede calcular mediante la frmula:
SZ 2 S 2 355( 2) 2 (10.634,38)
n n 37 familias
NE 2 Z 2 S 2 355(32,50) 2 22 (10.634,38)
S2 10.634,38
n 2
n 2
37 familias
E S ; siendo: 32.5
2
10.634,38
Z N 2 355
s 103.12
CV 100 CV 100 15.89%
x 650.07
En el caso del ingreso por familia se puede observar que el CV es del 36%, superior al
30%, establecido, por tal razn, la muestra obtenida debe ser mayor a la del consumo,
siendo n = 120 familias. Nos quedan dos alternativas, si la caracterstica principal es el
ingreso, debemos trabajar con las 120 familias, lo cual implica un mayor costo, tiempo y
recursos humanos, o aplicar el mtodo de Muestreo Aleatorio Estratificado, disminuyendo
los tres factores antes mencionados; adems, se obtiene una mejor estimacin.
P
a i
8
0.57
2
s p pq 0.57(0.43) 0.2451 E 8% 0.08
n 14
2 2
Z 2 PQ Z S p 2 2 (0.2451)
n0 2 ; n0 153.18 ;
E E2 0.082
20
n0 153.18
n 107 familias
n0 153.18
1 1
N 355
Tambin:
SZ 2 S 2 355(2) 2 (0.57)(0.43)
n 107 familias
NE 2 Z 2 PQ 355(0.08) 2 2 2 (0.57)(0.43)
21
prctica, pues casi siempre se trabajaron muestras grandes (n > 30) donde utilizamos
Z. La muestra como en todos los procesos, va a ser aleatoria y el mtodo aplicado ser
el muestreo aleatorio simple, donde las probabilidades de seleccin de cada unidad
van a ser constantes y la seleccin va a ser sin repeticin.
170 045 186 217 076 213 132 087 006 163 312
111 248 018 096 22 303 196 230 286 032 168
318 009 144 250 036 095
22
Informacin obtenida en la muestra de 28 familias. Datos sin agrupar
Consumo
N Nmeros Ingresos Vivienda N Total Diario
M F Trabajando
de
Orden Aleatorios (miles $) Propia personas de carne (grs.)
1 170 270 si 3 1 2 2 812
2 045 192 si 2 1 1 2 630
3 186 88 no 3 1 2 1 510
4 217 86 si 5 2 3 1 506
5 076 184 no 5 1 4 2 620
6 213 186 no 3 2 1 1 716
7 132 126 si 3 2 1 1 520
8 87 206 si 5 1 4 2 780
9 006 170 no 2 1 1 2 895
10 163 96 no 3 2 1 1 520
11 312 189 no 4 3 1 2 576
12 11 111 si 3 1 2 1 620
13 248 198 si 3 1 2 2 586
14 18 179 no 5 1 4 2 760
15 96 100 no 2 0 2 2 650
16 224 152 no 6 2 4 2 666
17 303 346 si 4 1 3 3 718
18 196 95 no 3 1 2 1 515
19 230 98 si 2 1 1 1 560
20 286 195 si 5 1 4 2 710
21 032 96 si 2 1 1 1 782
22 168 164 no 5 2 3 2 720
23 318 176 si 2 1 1 1 543
24 009 282 no 4 2 2 3 742
25 144 188 no 3 1 2 2 560
26 250 206 no 2 1 1 2 616
27 036 145 no 2 1 1 2 580
28 095 101 no 2 1 1 1 630
4625 12(si) 93 36 57 47 18043
Los lmites para los estimadores se fijarn con una confianza del 95%. En caso de que la
muestra sea grande (n 30) se utiliza Z = 1.96. En este caso, siendo n 30 se utiliza la
t Stundet; en primer lugar se establecen los grados de libertad (letra griega nu) igual a
(n 1) o sea 28 1 = 27, siendo 0.05 complemento del 95%, tomada como nivel de
confianza (la suma ser del 100%); por lo tanto el valor de t para este ejercicio ser igual
a 2.052.
Veamos ahora los estimativos puntuales y de intervalo para cada una de las caractersticas
de las que se recolect informacin.
23
ESTIMACION DE PROMEDIOS Y TOTALES
(1) Promedio de Ingresos por familia:- Los estimativos de promedio y total de los
ingresos (miles de $) por familia, se calcula de la siguiente manera:
x 2
i nx 2 874.163 28(165.18) 2
s 2
4.081,93 s 4.081,93 = 63,89
n 1 28 1
n 28
f = fraccin de muestreo t 0.078
N 355
63,89
= 189,0 = $189,000
X s 165,18 2,052 1 0,076
28 = 141,4 = $141,400
24
Por otra parte, en el proceso de una investigacin por muestreo, es comn la formulacin
de hiptesis las que deben ser comprobadas. Por ejemplo: el investigador de las 355
familias puede considerar como hiptesis que su ingreso es de $175.000 (175) ante la
alternativa de que sea diferente, es decir, que puede ser mayor o menor a 175. E n este
caso el procedimiento que se sigue para contrastar esta hiptesis es:
3. s X S 189
(Lmites de confianza)
i X i 141
que el ingreso es de $175 cuando en realidad fue $178,2; por tanto se ha cometido un
error de tipo II. Si lo que se quiere probar es que el grupo familiar investigado tiene un nivel
de ingresos inferior a 175 (miles de $), no se deben utilizar los lmites de confianza, para
contrastar la hiptesis; por tanto el procedimiento a seguir es:
1. H 0 : 175 2. 0.05
H a 175
x 165,2 175
3. t 0.81
s n 63.9 28
v = n -1 =27
0.10 t = 1.703
25
El valor de t = -0.81, est dentro de la zona de aceptacin, por tanto es vlida la hiptesis
nula ( H 0 ). A un nivel de significacin del 5% los resultados obtenidos ( x 165.2) , no
permiten afirmar que los ingresos de estas familias sean inferiores a 175 (miles de $).
(2) Estimacin total de Ingresos para las 355 familias:- En algunos casos se requiere
realizar estimativos de totales y para tal efecto se procede de la siguiente manera:
Ns
X s Nx 1 1
n
= 67.092,8(miles $)
355(63,89)
X s 355(165.18) 2.052 1 0,078 = 59.199,2(miles $)
28
Con los anteriores resultados se concluye que el ingreso total de las 355 familias deber
estar entre $ 67095.800 y $50199.200, valor que se encuentra comprendido dentro de
estos lmites de confiabilidad.
26
y 'i 1 y 'i ni yi yi ni 2
yi ni
84,1 128 10 108 1,080 116,640
128,1 172 4 152 608 92.416
172,1 216 11 196 2.156 422.576
216,1 260 - 240 -- --
260,1 304 2 284 568 161.312
304,1 348 1 328 328 107.584
y
yn i i
4.740
169,29
n 28
y 2
i ny 2 900.528 28(169,29) 2
S 2
3.633,84
n 1 28 1
s 3.633,84 60,28
yi Marcas de clase
y
yn i i
459,8
16,42
n 28
ni Frecuencia absoluta
y 2
i ni ny 2 8.774,68 28(16.42) 2
s 2
45,34
n 1 27
s 45,34 6,73
X
x i
93
3,3214 s
x i
2
nx 2
351 28(3,3214) 2
1,2488 1,25
n 28 n 1 27
3,79
s 3(355)(1,25)
X s x t 1 f X 355(3,32) 2,052 1 0.078 2,85
n 28
(2) Total de personas para las 355 familias, ser obtenido as: 1.343,8
27
Ns (355)(1,25)
X s Nx t 1 t X s 355(3,32) 2,052 1 0,078
n 28
1.013,4
Se puede afirmar que, aproximadamente, el nmero total de personas para las 355
familias es de 1.179; sin embargo con una confianza del 95%, el total poblacional deber
estar entre 1.013 y 1.344, comparando el total poblacional (1.164) con el estimado puntual,
se aprecia una pequea diferencia y, como en los casos anteriores, se encuentra incluida
dentro de los lmites de confianza.
28
Nmeros de personas por familia
Yi ni yi ni 2
yi ni
2 9 18 36 y
yn i i
93
3,32
3 9 27 81 n 28
4 6 12 48
y
2
5 6 30 150 i ni ny 2 351 28(3,32) 2
s 1,248 1,25
6 1 6 36 n 1 27
28 93 351
Los resultados obtenidos con la relacin a la variable discreta son iguales, tanto para datos
sin agrupar como para datos agrupados, por tanto, no es necesario repetir el proceso de
asignacin de lmites de confianza para el promedio.
12
p a / n = 28 0,4286 o 42,86%
i
2
so pq (0,4286)(0,5714) 0.2449
El 42,86%, es el estimado puntual, es decir, se estima que el 42,86% de las familias son
propietarias de vivienda.
29
En la formulacin de hiptesis, se procede en forma similar al promedio. Supongamos que
el investigador asegura que el 45% de las familias son propietarias de vivienda.
1. H 0 : P 0.45 2. 0.05
H a P 0.45
3. Como 0,45 est dentro de los lmites de confianza, se acepta la hiptesis nula, es
decir, que el 45% de las familias son propietarias. Ahora, si observamos la
proporcin verdadera del 48,73% notamos que se ha cometido un error de tipo II
(aceptar algo falso). En una prueba unilateral,, se presenta por ejemplo; si el
investigador considera que el porcentaje puede ser inferior al 45%, en este caso se
deber proceder de la siguiente manera:
1. H 0 : P 0.45 2. 0.05
H a P 0.45
pP 0,4286 0,45
t 0.22
3. pq 0,2449
n 1 27
t = -0.22 n 1 27
RR/ H 0 RA/ H 0
t = -1,703
El valor de t (t = -0.22) se ubica en la zona de aceptacin, por lo tanto, al nivel del 5% no
existe suficiente razn para considerar que el porcentaje de familias propietarias sea
inferior al 45%, aqu tambin se comete un error de tipo II, dado que el promedio
verdadero es superior al 45%.
(2). Total de familias con vivienda:- Para la estimacin de totales, se aplica la siguiente
frmula:
218,77
pq 0,2449
As Np tN 1 t As 355(0,4286) 2,052(355) 1 0,078
n 1 27
85,54
30
El estimado puntual (total) es de 152 familias con vivienda propia; con intervalos, el
nmero verdadero de propietarios de vivienda deber estar entre 86 y 219 familias, con
una seguridad del 95%.
Generalidades
El Muestreo Aleatorio Estratificado, denominado tambin muestreo aleatorio
restringido, es un mtodo que permite una seleccin ms eficiente que el obtenido
mediante el muestreo aleatorio simple, en especial cuando la caracterstica que reinvestiga
es de gran variabilidad, lo cual, implica un tamao muestral relativamente gran de en
comparacin al obtenido mediante el muestreo aleatorio estratificado.
Es necesario entender que un estrato es una subpoblacin y, como tal, cada uno se
constituye como un dominio de estudio.
Los estratos pueden o no estar compuesta del mismo nmero de unidades, por tal
razn la fraccin de muestreo (f) puede variar de un estrato a otro.
Al conformar los estratos, lo primero que se debe seleccionar, siempre que sea.
posible, es la caracterstica de inters principal, que guarde relacin, para lo cual debe
elevarse una distribucin de frecuencias, lo que a su vez, se corta en un nmero adecuado
de intervalos, de tal forma que el estrato genere la mayor homogeneidad posible. Las
investigaciones de sondeo o las encuestas preliminares ayudan no slo a identificar las
caractersticas de la poblacin, si no que permiten una buena estratificacin.
31
En resumen, se puede decir que la estratificacin logra:
e. Ventajas administrativas
32
a. Muestras de igual tamao, denomina tambin Afijacin igual y consiste en
establecer el mismo nmero de unidades para cada estrato muestral.
SIMBOLOGA
N h N N1 + N 2 + N 3 +. N M
Yh
Y hi
Y1
Y 1
Y2
Y 2
Y3
Y 3
NH N1 N2 N3
Yst
Y N
h h
Y st Y W h h
N
Wh Proporcin de elementos en cada estrato
Nh N1 N2 N3
Wh W1 W2 W3
N N N N
W h W1 + W2 + W2 + WM 1
33
Y
2
2 2 hi N hYh
S h Varianza Poblacional en cada estrato S h
Nh 1
n = Nmero de unidades que contiene la muestra total.
nh Nmero de unidades que contiene la muestra en cada estrato muestral.
n h n n1 n2 n3 ......
yh
Y hu
y1
y 1
y2
y 2
y3
y 3
nh n1 n2 n3
yst
N h yh
Y st yW
h h
N
y
2
2 2 hi nh yh
sh Varianza Poblacional en cada estrato sh
nh 1
Dependiendo de la manera como se distribuyen los elementos dentro de los estratos
muestrales, se ha dicho que se tienen tres mtodos, los que sern tratados en forma
independiente:
a) Asignacin Igual:- se ha dicho que este mtodo implica que los tamao
muestrales en cada estrato sean iguales:
n1 n2 n3 , etc.
34
355 familias. Los niveles de ingresos para los diferentes estratos fueron fijados en
forma caprichosa, de tal manera que permitan la explicacin de algunos resultados,
no esperados.
35
Veamos la aplicacin de las frmulas. En primer lugar, si consideramos que no existe
forma alguna de obtener las varianzas poblacionales para cada estrato, hay necesidad de
realizar una encuesta preliminar. Supongamos, arbitrariamente, que el tamao de la
encuesta preliminar es de 4% del tamao poblacional, tal como lo hicimos en el Muestreo
Aleatorio Simple.
Estrato II
N Nmero Ingreso Propiedad Nmero de Personas Consumo diario
de (Miles de carne en
orden aleatorio $) Vivienda Total Hombres Mujeres Trabajan grs.
1 028 205 Si 3 2 1 2 630
2 126 205 Si 3 2 1 2 630
3 096 193 Si 2 0 2 2 650
4 056 208 No 3 1 2 2 638
5 088 196 No 3 1 2 2 584
Estrato III
N Nmero Ingreso Propiedad Nmero de Personas Consumo diario
36
de (Miles de carne en
orden aleatorio $) vivienda Total Hombres Mujeres Trabajan grs.
1 23 273 si 3 3 2 2 816
2 55 296 no 2 2 1 2 555
3 09 395 no 5 5 3 3 680
4 18 323 si 7 7 5 3 744
5 46 293 si 3 3 2 2 686
A continuacin se calcula la varianza y la media del ingreso por familia en cada uno de los
3 estratos.
2 2
E 9,19
22,0
z
1,96
N1 162 N 2 132
X1 0,4563 0,46 O 46% W2 0,3718 0.37 O 37%
N 355 N 355
37
N3 61
W3 0,1718 0,17 O 17%
N 355
Tamao de la Muestra
2 2
1 Wh S h 1 E2 E
2
n0
W n0
Wh Sh
2
Siendo: V
z2 z
h
n0 NZ 2 Wh Sh
2
n
Y n Tambin se puede calcular mediante: n
1 0 NE 2 Z 2 Wh S h
2
N
La confianza es considerada del 95%, o sea z = 1.96
1 1
Wh S h n0 0,46(1.488,5) 0,37( 42,3) 0,17( 2.267) 49,35
2
n0
22
n0 49,35 NZ 2 Wh Sh
2
n 44 familias
n0 49,35 Si: n
1 1 NE 2 Z 2 Wh S h
2
N 355
44
N h nh 15 n1 15 n2 15 n3 15 , n n1 n2 n3 45
3
38
b) En la estimacin de proporciones, hay necesidad primero que todo de familiarizarse
con la simbologa a utilizar, tanto para la aplicacin de las medidas muestrales como
para los parmetros.
N = tamao de la poblacin
Ah Ahi Numero de unidades que presenta la caracterstica, en cada estrato
poblacional.
poblacional.
Ph
A hi
P1
A 1i
P2
A 2i
P3
A 3i
N N1 N2 N3
2 2 2 2
S p h Varianza en los estratos poblacionales S p h PhQh S p1 P1Q1 S p 2 P2Q2
2
S p3 P3Q3
n = Tamao de la muestra
ph
a hi
p1
a 1i
a1
p2
a 2i
a2
n n1 n1 N2 n2
Dentro del esquema que se ha venido siguiendo, en primer lugar se deben calcular los
tamaos muestrales para realizar estimativos de proporciones y totales, cuando se
conocen y desconocen las varianzas poblacionales.
39
Con la informacin obtenida sobre familias propietarias de la vivienda, a travs de la
encuesta preliminar a 15 familias, se tendr:
3 3 3
p1 0,6 p2 0,6 p3 0,6
5 5 5
(Coincidencial es el hecho de que las proporciones sean iguales para los 3 estratos)
Estos datos permiten trabajar con las frmulas anteriores vistas. En primer lugar
veamos su aplicacin, para obtener el valor de n en los estimativos de una proporcin,
con un error del 10% y una confianza del 95%.
n
W P Q
n n n n
n0
E Z 2 n
1 0
N
1
n 2
0,46(0,6)(0,4) 0,37(0,6)(0,4) 0,17(0,6)(0,4) 92,20
0,10 ;
1,96
96,15
n 76 familias
96,15
1
355
N 2 Z 2 Wn PnQn
Tambin podemos tabular n mediante la frmula: n
NE 2 Z 2 Wn PnQn
40
CALCULO DE ESTIMATIVOS Y FIJACION DE LMITES
En primer lugar consideraremos que el tamao de la muestra (n) es igual a 36, en lugar de
los resultados anteriores obtenidos. Teniendo en cuenta la caracterstica (variable)
ingresos, una confianza del 95%, con los cuales procederemos a calcular el estimador del
promedio y fijar los lmites de confianza.
Siendo n = 36, por el mtodo de Afijacin igual, se tendrn los siguientes tamaos
muestrales para cada uno de los estratos:
n 36
nh 12 n1 12 n2 12 n3 12 n = 36
L 3
Determinando los tamaos muestrales, se har la seleccin de las unidades en cada uno
de los estratos, con el fin de recoger la informacin para cada una de las familias:
41
MUESTREO ASIGNACION IGUAL
Estrato I
Estrato II
42
Estrato III
Con las anteriores tablas se pueden obtener los diferentes estimadores para:
proporciones, razones y proporciones en conglomerados, fijando lmites de confianza para
cada estimador puntual.
x1
x 1i
1.214
101,17 x2
x 2i
2.333
194,42
n1 12 n2 12
x3
x 3i
3.859
321,58,17
n3 12
43
Las desviaciones tpicas para cada estrato sern:
s1
x 1
2
n1 x1
2
127.366 12(101,17) 2
20,33 s 21 413,61
n1 1 12 1
x
2
n2 x 2 2 457.021 12(194,42) 2
s2 i
17,70 s 2 2 313,36
n1 1 12 1
s3
x 3
2
n3 x 23
1.292,413 12(321,58) 2
68,37 s 23 4.674,81
n3 1 12 1
La media muestral estratificada ser igual a:
1 s
2
X xst t 2 N h ( N h nh ) h
N nh
Al fijar los lmites de confianza del 95% para el promedio, el valor de t, ser:
n1 n2 n3 3 12 12 12 3 33
182,04=$182.049,96
X st 173,14 2.035 19,17
164,23=$164.230,05
44
2
Sh
X st NX st N h ( N h nh ) nh
2
sh
Vx st N h nh )
nh
64.627,55 $64.627.550
X st xst
1 f
n Wh S h
2
36
1 355
V x st 0,465( 413.61) 0,37(313,36) 0,17( 4.674,81) 27, 48
36
183,67
X st 173 2,035 27,48 ( milesde$)
162,33
La diferencia observada es mnima; anteriormente el estimador haba sido de 19.17 y
ahora es de 27,48. Al hacer calculada con todos los decimales, el resultado deber ser
exactamente igual. Algo similar sucede con la siguiente frmula, para calcular el
estimador de la varianza.
2
s (1 f h ) )
2
W 2 h sh 2
v W
x st
h h
nh
Siendo: X st xst t (1 f n )
nh
45
0,462 (413,61) 12 1,37 2 (313,36) 12 0.17 (4.67,81 12
V x st 1 1 1 19.05
12 162 12 132 12 61
b) Para el clculo del promedio y total de personas por familia, el procedimiento es igual
al utilizado para los ingresos.
2 2 2
x1 2,75 x2 3,92 x3 3,5 s1 1,84 s2 0,81 s3 1,55
1.320,06=1.321
c) Si se desea estimar y fijar lmites de confianza del 95% para el consumo promedio y
total de carne diario de las familias, se tendr:
2
s3 13.226,45;
235.79, 10
X st s 355(629,46) 355(34,74) (Total de consumo para las 355 familias)
i
211.125,6
46
ESTIMACION DE UNA PROPORCION Y TOTAL
p1
a 1
4
0,33 q1 0,67 p2
a 2i
7
0,58 q2 0,42
n1 12 n2 12
a 7 N Ph
W
3i
p3 0,58 q3 0,42 Siendo: pst h
h ph
n3 12 N
1 f
V PST
1
N 2
Wh ph qh 1 pq
Siendo: Pst pst t 2 N h ( N h n ) h h
n N nh h
1 f
V p st Wh ph qh 1 f
Siendo: Pst pst Wh ph qh
n n
47
36
1
355 0,46(0,33)(0,67) 0,37(0,58)(0,42) 0,17(0,58)(0,42) 0,0058 Y por el
v p st
36
tercer procedimiento, para el clculo del estimador de la varianza se tendr:
Wh 2 ph qh Wh 2 ph qh
V p st n 1 f n
Siendo: Pst pst n 1 f n
h
h
Los lmites de confianza del 95% para la proporcin de familias con vivienda se tendrn:
63,4%
29,6%
Y los lmites de confianza del 95% para el total de familias con vivienda sern:
225
A st s Npst tN V p st
A st s i 355(0, 465) 355(0,169)
i 105
Nh nh
Wh wh Siendo: Wh wh
N n
48
posible contener en la muestra, unidades de todos los tipos y caractersticas, hacindola
de esta manera mucho ms representativa de la poblacin.
Tamao de la Muestra
Recordemos que en la asignacin igual, el nmero de unidades es igual para cada uno de
los estratos muestrales. En la encuesta preliminar de 14 familias, esta fue la razn por la
cual se distribuyeron un total de (5) cinco familias para cada estrato; en cambio en la
asignacin proporcional, las 14 unidades se distribuyen en la muestra en la misma
proporcin como se distribuyen en la poblacin.
N1 162 N 2 132 N3 61
W1 0,46 W2 0,37 W3 0,17
N 355 N 355 N 355
Los anteriores resultados sern utilizados para calcular los tamaos de la muestra en la
encuesta preliminar, para cada uno de los estratos.
En esta forma se tendr que el peso relativo en la muestra deber ser igual al de la
poblacin:
n1 7 n2 5
w1 0,47 w1 W1 w2 0,33 w2 W2
n 15 n 15
n3 3
w3
n 15
0,20 w3 W3 w h w1 w2 w3 1 100%
49
Las diferencias que resultan de las operaciones anteriores, se debe a las aproximaciones
realizadas para calcular los tamaos muestrales en cada estrato, pero de todas maneras
debern considerarse como iguales. Las diferencias que se presentan carecen de
importancia.
Una vez determinados los tamaos muestrales para la encuesta preliminar, se procede a
la seleccin de las unidades requeridas, que permitirn obtener informacin y as, calcular
la varianza y el error:
ESTRATO II
ESTRATO III
50
N de Nmero Ingresos Propiedad Nmero de personas Consumo de
carne diario
orden Aleatorio (Miles $) Vivienda Total Masc. Fem. Trabajando grs.
1 03 306 SI 5 4 1 3 804
2 28 296 NO 5 2 3 3 558
3 11 289 NO 4 2 2 2 770
2 2 2
x1 114,7 x2 198,8 x3 297,0 s1 839,24 s2 414,7 s3 73,0
W S
2
h h 0,46(839,24) 0,37(414,7) 0,17(73,0) 27,13
n0 27,13 n 26 familias
E Z 2
8,84
1,96
2
1
27,13
355
NZ 2 Wh Sh
2
Veamos ahora como sera el clculo n en una proporcin. Para ello consideramos como
caracterstica cualitativa a las familias propietarias de vivienda; adems, para este caso se
establece una confianza del 95% y un error del 10%.
3 4 1
p1 0,43 p2 0,8 p3 0,33
7 5 73
51
n0
W p q
h h h
0,46(0,43)(057) 0.37(0,8)(0,2) 0,17(0,33)(0,67)
80,49
E Z 2
0,10
1,96
2
80,49 NZ 2 Wh ph qh
n0 66 familias
80,49 Tambin mediante la aplicacin de: n
1 NE 2 Z 2 Wh ph q
355
52
Tabla N 14.11 Muestra de Asignacin Proporcional
Estrato I
N de Nmero Ingresos Propiedad Nmero de personas Consumo de
carne diario
orden Aleatorio (Miles $) Vivienda Total Masc. Fem. Trabajando grs.
1 063 135 No 2 2 0 1 638
2 160 124 No 2 2 0 1 580
3 124 101 No 4 1 3 1 520
4 008 79 Si 3 1 2 1 620
5 096 113 Si 6 2 4 1 700
6 110 85 No 4 1 3 1 520
7 073 89 Si 3 2 1 1 520
8 037 126 No 3 1 2 1 580
9 021 106 No 3 1 2 1 730
10 056 95 Si 2 1 1 1 578
11 116 108 Si 4 1 3 2 716
12 141 95 Si 2 1 1 1 520
13 003 108 No 3 2 1 1 735
14 018 86 No 1 0 1 1 510
15 076 126 No 3 1 2 1 516
16 020 95 No 3 1 2 1 620
17 133 99 Si 3 1 3 1 512
Estrato II
Estrato III
53
N de Nmero Ingresos Propiedad Nmero de personas Consumo de
carne diario
orden Aleatorio (Miles $) Vivienda Total Masc. Fem. Trabajando grs.
1 31 321 No 4 2 2 2 806
2 42 296 No 3 1 2 2 684
3 53 346 Si 4 1 3 3 718
4 20 687 No 4 1 3 2 735
5 06 260 Si 4 2 2 2 752
6 38 299 No 4 2 2 2 755
Para este mtodo, nicamente se calculara el estimador del promedio y del total de
ingreso por familia, dejando al lector la aplicacin de las frmulas para hallar promedio de
personas por familia y consumo diario de carne (en gramos), toda vez que el proceso es
similar al utilizado para este ejercicio en la asignacin igual.
Las medias aritmticas y varianzas del ingreso (en miles $) por familia son:
2 2 2
x1 104,11 x2 201,15 x3 318,17 s1 266,11 s2 404,31 s3 1952,57
s1 163 s2 201 s3 442 n1 17 n2 13 n3 6
184,41= $184.410
X st s xst s tsx st X st s 176,41 2,035(3,93)
168,41= $168.410
54
n1 n2 n3 3 17 13 6 3 33 Siendo 0.05 , el valor de t =2,035
1 ph qh
Psi pst t V p st V p st 2
N
N h ( N h nh )
nh
244,11 244
NP tN V
A 355(0,53) 2,035(355) 0,006
A Familias
si st p st su
132,19 132
55
Se estima que el total, 188 familias son propietarias de vivienda y el verdadero valor estar
entre 132 y 244 familias.
MUESTREO SISTEMATICO
a) supongamos que la poblacin estudiada est compuesta por 360 familias (en vez de
las 355 familias con las cuales se ha venido trabajando), adems el tamao de la
muestra (muestreo aleatorio simple o el obtenido por el mtodo de Afijacin) es de 30
familias; con esta informacin se podr determinar el intervalo de seleccin,
simbolizada por I.
I N
I
1 I Reemplazando, se tiene: I
360
12 cuando es un nmero entero.
f n n 30
N
56
denomina punto de arranque. Se ha hecho la primera seleccin dentro del intervalo, en
razn a ser el intervalo (I) un nmero entero.
004 016 028 040 052 064 076 088 100 112 124 136 148
160 172 184 196 208 220 232 244 256 268 280 292 304
316 328 340 352
N 355
I 11,83 12
n 30
Una vez calculado el valor del intervalo, deber redondearse al nmero inmediatamente
superior por pequea que sea la fraccin.
57
Observemos los niveles de ingresos para cada uno de los nmeros aleatorios obtenidos:
N aleatorio 4 016 028 040 052 064 076 088 100 112
Ingreso (miles $) 106 206 114 95 386 186 184 285 202 262
Propiedad-vivienda si si si si no no no no si si
N aleatorio 124 168 148 160 172 184 196 208 220 232
Ingreso (miles $) 84 102 186 88 195 287 95 389 262 102
Propiedad-vivienda No Si Si Si Si Si No No No Si
N aleatorio 244 256 268 280 292 304 316 328 340 352
Ingreso (miles $) 226 214 105 128 79 279 111 286 132 124
Propiedad-vivienda Si No No No No Si No Si No No
s
X si x t 1 f (nota: se trabaj en la calculadora con el programa estadstica)
n
89,12 30 215.20=$215.200
X su 183,3 2,045 1 183,3 31,9
30 355
151,40=$151.400
58
15
En esta proporcin se tendr: p 0,50
30
0,68=68%
pq 0,05(05) 30
PS i p t 1 f PS i 0,5 2,045 1
n 1 30 1 355 0.32=32%
N aleatorio N N
Equivalencia Estrato Equivalencia Estrato Equivalencia Estrato
anterior aleatorio aleatorio
004 004 I 124 124 I 244 082 II
016 016 I 136 136 256 094 II
018 028 I 148 148 268 1069 II
040 040 I 160 160 280 118 II
052 052 I 172 010 292 130 II
064 064 I 184 022 304 10 III
076 076 I 196 034 316 22 III
088 088 I 208 046 328 34 III
100 100 I 222 058 340 46 III
112 112 I 232 070 352 58 III
59
ESTRATO II
ESTRATO I
N de Nmero x1 a1
orden aleatorio
1 004 08 No
2 016 83 Su
3 028 95 Si
4 040 135 Si
5 052 156 No
6 064 130 Si
7 076 126 No
8 088 88 No
9 100 162 No
10 112 163 No
11 124 101 No
12 136 146 Si N de Nmero
13 148 98 Si x1 a1
orden aleatorio
14 160 124 no 1 172 206 No
2 184 187 No
3 196 202 Si
4 208 232 No
5 220 206 Si
6 232 236 No
7 244 186 Si
8 256 199 No
9 268 208 No
10 280 166 Si
11 292 165 no
ESTRATO III
N de Nmero
x1 a1
orden aleatorio
1 304 286 si
2 316 332 si
3 328 362 si
4 340 293 si
5 352 286 si
6
x1 120,5 x2 199,36 x3 311,18 p1 0,43
14
2 2 2
s1 878,57 s2 520,25 s3 1.153,20 p2 0,36
60
Lo primero que observamos es la forma como los elementos se distribuyen en la muestra,
igual a la obtenida mediante la asignatura proporcional. El tratamiento que se d, para el
clculo de los estimadores puntual e intervalos de confianza, es exactamente igual al
utilizado para este mtodo.
2
1 s
X st xst t 2 h
N ( N h nh ) h
N nh
192,29=$192.2900
X st 182,2 2,052 24,19 182,2 10,09
172,11=$172,110
0,66=66%
Pst 0,50 2,052 0,005985 0,50 0,16
0,34=34%
61
Los intervalos son:
(Intervalos de seleccin)
En cada estrado
N1 162 132 61
I1 17 I2 14 I3 7
n1 10 10 10
62
otra parte en la aplicacin de este mtodo se hace necesaria la enumeracin u ordenacin
de los elementos en la poblacin, lo cual en algunos casos es casi imposible.
63
MUESTREO POR CONGLOMERADOS
UNA ETAPA
Si una poblacin se divide en grupos y se toma una muestra, se dice que se ha realizado
una muestra por conglomerados en una etapa, en la cual cada grupo sirve como unidad de
muestreo. Recordemos que los estratos se definen como grupos o mas o menos
homogneos en cuanto a su composicin interna; en cambio, en los conglomerados, se
espera que la composicin sea mas heterognea posible de tal forma que cada
conglomerado represente en lo posible a la poblacin. Es muy comn que estos
conglomerados hagan referencia a superficies o reas en que se ha dividido el terreno, por
ejemplo, un barrio o una manzana que pueden considerarse como conglomerados; el
primero como un grupo de manzanas, el segundo como un grupo de viviendas. Este
mtodo permite reemplazar a las unidades mas pequeas (unidades de seleccin) de las
poblaciones cuando ellas no puedan ser enumeradas, por unidades ms grandes que las
contiene, hacindolas fciles de listar y de manejar y desde luego resulta menos costoso
que los mtodos anteriormente prestados. Sin embargo, vale la pena sealar que entre
ms pequeo sea el conglomerado, ms exacto ser el estimador.
a a i 2 p a i mi p mi
2 2 2
1 f
P
I
V p
n i nm
2
n 1
64
sistemtica de 30 familias de una poblacin estratificada, para la cual hemos
calculado el intervalo se seleccin.
355
I 12
30
Se podr decir que aproximadamente se tienen 12 grupos o conglomerados de 30
unidades cada uno. Mostraremos algunos de esos conglomerados, para que el
lector se forme una idea de su conformacin.
Conglomerado N 2
Conglomerado N 01
N de Nmero x1 a1
orden aleatorio
1 001 92 si
2 013 126 No
3 025 135 Si
4 037 126 Si
5 049 101 No
6 061 113 No
7 073 89 No
8 085 101 Si
9 097 114 Si
10 109 102 No
- --- - -
- --- - -
- -- - -
28 325 321 Si
29 337 328 Si
30 349 296 Si
65
N de Nmero
x1 a1
orden aleatorio
1 002 106 Si
2 014 104 No
3 026 125 Si
4 038 95 Si
5 050 100 No
6 062 84 No
7 074 106 Si
8 086 163 Si
9 098 96
10 110 85
- --- - -
- --- - -
- -- - -
28 326 324 Si
29 338 386 Si
30 350 329 Si
66
Conglomerado N 03 Conglomerado N 12
N de Nmero
N de Nmero
x1 a1 x1 a1
orden aleatorio
orden aleatorio
1 012 79 No
1 003 108 No
2 024 84 Si
2 015 145 No
3 036 79 No
3 027 105 Si
4 048 89 Si
4 039 98 No
5 060 98 Si
5 051 112 Si
6 072 106 No
6 063 135 No
7 084 88 No
7 075 86 No
8 087 113 Si
8 086 103 Si
9 108 96 no
9 099 93 No
10 120 - -
10 111 145 Si
- --- - -
- --- - -
- --- - -
- --- - -
- -- - -
- -- - -
27 324 284 No
28 327 386 Si
28 324 296 No
29 339 261 Si
29 348 279 Si
30 351 286 Si
67
M
M (Tamao medio de los conglomerados)
N
yi j Valor de la variable
mi
yi yi j
mi
y ij
y (Media del conglomerado)
n
y yi
n mi
y y
=Media general de la muestra Siendo: y
mi m
y
y
y =Medida de totales o total medio por conglomerado, en la muestra: y
n
pst
M p h h
Siendo: ph
a hu
M h m hi
V ost
2
n m
h h nh 1
68
En primer lugar, para el muestreo por conglomerados iguales, supongamos que la
poblacin de 355 familias se ha dividido en 71 conglomerados y cada conglomerado
se encuentra conformado por 5 familias, as que todos contienen el mismo nmero
de familias, por tal razn de las denomina conglomerados iguales.
i x1 xi xi
2
x
x i
35,2
2,93 3
n 12
1 15 3,0 9,00
N n xi nx
2 12 2,4 5,76 2 2
2
3 19 3,8 14,44 s
4 15 3,0 9,00 x Nn n 1
5 17 3,4 11,56
6 14 2,8 7,84 2 71 12 105,76 12(2,93) 2
s
7 15 3,0 9,00 12 1
x
71(12)
8 16 3,2 10,24
9 13 2,6 6,76 s
2
(0,0692)(0,2492) 0,017
10 11 2,2 4,84 x
11 12 2,4 5,76
12 17 3,4 11,56
176 35,2 105,76
El anterior resultado nos indica que en promedio ( x ) se tiene 3 personas por familia
69
Para el caso de muestreo por conglomerados desiguales con probabilidades
iguales, supongamos ahora que el barrio de 355 familias est compuesto por 35
manzanas y cada una de ellas se constituye en un conglomerado desigual con
respecto al nmero de vivienda.
i
mi yi 2
Conglomerados yi
m
2
Personas i 1,189
Vivienda
1 5 18 324
2 12 48 2,304 y i
2
15,631
3 8 40 1,600
4 10 36 1,296 m i 105
5 14 30 900
6 11 45 2,025 y i 379
7 13 34 1,156
8 9 28 784 m y i i 4,182
9 8 39 1,521
10 15 61 3,721
105 379 15,631
M
M i
330
13.2(Promedio de viviendas por conglomerado)
N 25
y
y i
Promedio de personas por conglomerado en la muestra
n
379 14 Ny
y
10
37,9 y
Mn
yi
M
y Estimador de la media por elemento
1
y (379) 2,87;
13,2(10)
70
25(37,9) 947,5
Tambin se puede calcular: y 2,8725 Promedio de personas por
330 330
vivienda.
1 f yi ny
2 2
1 0,4 15.631 10(37,9) 2
V 2 V
2
y n M n 1 y
10(13,2) 10 1
n 10
f 0,4 V
y
(0,00034)(140,7667) 0.048
N 25
V
N n 1
2 y i
2
ny 2
y
Nn( n 1) M
25 10 1
V
2
15.631 10(37.9) 2 ) 0,048
y
25(10 )(9 ) (13, 2)
V
N
1 f
1
yi
2 yi
2
y
M n( n 1) n
10 25 1
2
(379) 2
V
1 15.631 0.048
y
25 330 20(19) 10
V 2
nM
y n 1
10
1 25 15.631 2( 2.87)( 4.182) 2.87 2 (1.189)
V
2 0.054 S y 0.23
y
10(13.2) 10 1
71
MUESTREO BIETPICO
A este mtodo se le denomina muestreo por etapas. Cuando son dos, recibe el nombre de
bietpico y si son ms de dos etapas se le considera polietpico. Este mtodo puede
considerarse como un sub muestreo y se trata de una modificacin del mtodo de
muestreo por conglomerados, ya que la primera muestra est conformada por unidades
que son consideradas como conglomerados, una vez seleccionados stos, se efecta una
nueva seleccin o submuestreo dentro de cada conglomerado para la segunda etapa y as
sucesivamente.
Son muchos los ejemplos que se podran citar, en el caso del muestreo por etapas. En
primer lugar para la realizacin de la encuesta de hogares, podramos dividir la ciudad en
barrio (clasificados por niveles de ingresos, que seria los estratos); en esta etapas se
eligen en forma aleatoria o sistemtica, (de acuerdo al procedimiento adoptado), las
unidades que conforman el tamao de la muestra, cuya unidad de seleccin es el barro; la
segunda etapa consistira en elegir las manzanas en cada uno de los barrios
seleccionados en la primera etapa. En la tercera etapa podran seleccionarse las
viviendas, tomadas de las manzanas obtenidas en la etapa anterior. De continuarse con la
etapa cuarta, si se tiene como unidad de seleccin a la familia y una ltima podra ser,
cuando la unidad es el individuo.
Si una empresa tiene el sistema de venta a crdito, para cada deudor se tendr un tarjeta,
lo que implica tener varias gavetas, cada un de ellas con un nmero dado de tarjetas. El
proceso a seguir aplicando el mtodo bietpico, consiste en enumerarlas y seleccionar una
72
muestra cuya unidad sea la gaveta, luego se vuelve a muestrear, enumerando las tarjetas
en cada una de esas gavetas para efectuar una nueva seleccin, teniendo como unidad
final las tarjetas.
Para el muestreo bietpico estratificado tambin hay frmulas especiales que pueden ser
consultadas en los diferentes textos de muestreo, lo mismo sucede para el muestreo
trietpico o polietpico, y algo similar cuando se trata de atributos. Para estudio de estos
mtodos se recomienda al lector consultar el libro del profesor Francisco Azorin Poch (ver
bibliografa) que lo presenta en forma bastante comprensible esta teora; no se exponen en
este texto, por ser considerados extensos para los objetivos propuestos.
Este mtodo facilita la elaboracin del marco de la primera etapa y luego el de la segunda,
siendo ms econmico que el obtenido mediante el muestreo aleatorio estratificado.
Supongamos que una firma tiene 110 fbricas distribuidas por todo el territorio nacional y
desea estimar el tiempo y nmero de mquinas que duraron paralizadas, ya sea por
73
mantenimiento o por dao, durante un trimestre. Por tiempo y distancia se disea una
investigacin aplicando el muestreo por conglomerados en dos etapas, para ello procede
a realizar una muestra de 12 fbricas y se toma, en la segunda etapa, una muestra del
20% de las mquinas de cada una de ellas.
M 5.500
M Tamao promedio del conglomerado M 55
N 110
mi Numer de elementos en cada conglomerado
2
Fbrica M i mi Tiempo sin funcionar (horas) xi si
1 46 9 3 5 0 0 0 8 6 0 2,44 10,03
2 38 8 4 0 0 6 10 0 5 3,13 14,13
3 52 10 0 0 0 6 0 4 8 1 0 2,50 10,06
4 60 12 3 3 0 1 1 0 0 5 0 2 1,33 2,31
5 55 11 0 0 3 0 0 6 0 0 1 0 155 6,87
6 40 8 2 1 5 0 0 0 0 2,00 8,86
7 40 8 4 0 0 6 10 2 6 3,50 13,43
8 36 7 0 0 3 7 0 1 2 1,86 6,48
9 30 6 5 0 6 0 0 4 2,50 7,9
10 64 13 0 0 0 6 5 0 10 0 0 0 0 1 2,15 11,47
11 70 14 2 0 0 0 4 6 2 0 6 2 0 0 0 1,79 4,95
12 50 10 2 3 5 0 0 0 0 0 2 1,30 2,90
N M i xi 1,216.09(110 )
Clculo del estimador de la media: Xc 2,03
Mn 5.500(12)
74
M i 46 38 52 60 .... 581
X x t N n 1 s 2 1 M (M m ) si
2
c c N nM 2 b nNM 2 i i i m
i
2 1
sp
n 1
( M i x 2 Mxc M i xi n( Mxc )
2 2
2 1
sb
132.247,64 2 55 2.031.216,09 12 55 2.03 934.86
2
12 1
2
si 10.03 14.13
M i M i mi mi
46( 46 9)
9
38(38 8)
8
.... 18.571,91
110 12 1 1
X c 2.03 2.201 2
934.86 2
18.571,91
110 12 55 12110 55
2.40
X c 2.03 0.37 Horas
1.66
Para el total, los lmites del 95% de confianza sabiendo que M = 5.500
110 12 1 1
X c 5.500 2.03 5.500 2.201 2
934.48 2
18.571,91
10 12 55 12110 55
13.200
X c 11 .165 2.035 Horas
9.130
75
b) Cuando no se conoce el valor de M i , las frmulas anteriores sufren una ligera
modificacin:
M i xi 1.216,09
x 2,09
Mi
c
581
2 1
SR
M i x 2 2 xc M i 2 xi xc 2 M i 2
N 1
M
2
i 462 382 522 602 552 ..... 29.781
2 1
SR
12 1
132.247.64 2 2.09 60.207,47 2.09 29.781 969.71
2
Los lmites de confianza del 95% para el estimador del promedio sern:
110 12 1 1
xc 2.09 1.201 969.71 2
18.571,91
110 12 49 2
12110 49
2.51
M
M u
581
49 X c 2.09 0.42 Horas
n 12
1.67
110 12 1 1
X c 5.390 2.09 1100 969.71 2
18.571,91
12 49 2
12110 49
13.528,9
76
Nota:- en la tabla N 14, 13, puede estar dado nicamente el tiempo sin funcionar
para que el estudiante calcule cada uno de x1 y x2 ; tambin puede suministrar
solamente las dos ltimas columnas, evitando su clculo.
a) Se conoce el valor de M
Cuando se conoce M. Se va a estimar la proporcin de mquinas que se paralizan
en el trimestre ya sea por mantenimiento y/o reparacin.
N de
Fbrica M i mi paralizados p qi
1 46 9 4 0,44 0,56 Se encuentra el nmero de mquinas que
2 38 8 4 0,50 0,50 fueron reparadas o se les hizo
3 52 10 5 0,50 0,50 mantenimiento. Informacin adicional.
4 60 12 7 0,58 0,42
5 55 11 4 0,36 0,64 M i 581
6 40 8 4 0,50 0,50 N = 110
M = 5.500
7 40 8 5 0,63 0,37
M 5.500
8 36 7 4 0,57 0,43 M 55
9 30 6 3 0,50 0,50 N 110
M
2
10 64 13 5 0,38 0,62 i 29.781
11
12
70
50
14
10
7
5
0,50
0,50
0,50
0,50 M
M i
581
49 (Cuando se estima)
n 12
M 110
Pc
nM
M P 12 5.500 284.88 0.4748 47,48 47%
i i
Los lmites de confianza para el estimador se obtienen mediante la siguiente
frmula:
N n 1 2 1 pq
Pc pc t 2 sb 2 M i M i mi i i
N nM nNM mi
2
Siendo: sb
n 1
M i qu 2 2 pc M M i pi n Mpc
1
2
reemplazando se tiene
que:
1
s 2b
7.172,31 2 0.47 49 284.88 12 55 0.47 188.12
2
12 1
77
M p 46 0.44 38 0.5 52 0.05 ........ 7.172.31
2 2 2 2
i i
110 12 1 1
Pc 0.47 2.201 2
188.12 2
580.24
110 12 55 1210 55
3.119
834
A Mquinas
c 1.451
b) No se conoce M
Cuando no se conoce M se procede de la siguiente manera:
2 1
sr M i pi 2 2 pc M 2
i
pi pc
2
M i
2
n 1
2 1
sr
7.172,31 2 0.4914.435,24 0.492 29.781 16.02
n 1
pc
M p i i
284.88
0.49 49%
M i 581
110 12 1 1
Pc 0.44 2.201 2
16.02 2
580.24
110 12 49 12119 49
78
0.69=69%
0.49 0.20
Pc
0.29=29%
Para el estimador del total, con una confianza del 95% sern:
3.709
2.641 1.064
A Mquinas
c 1.573
79