Sei sulla pagina 1di 97

CUANDO UTILIZAR CENSO

Cuando se necesita informacin por cada elemento de la poblacin.


Cuando la poblacin es muy pequea.

CUANDO UTILIZAR MUESTREO

Cuando la poblacin sea infinita.
Cuando aun siendo finita es muy numerosa.
Cuando el tiempo en que se toma la informacin sea mayor que el requerido.
Cuando el costo de la investigacin sea superior a los recursos disponibles.
Cuando las observaciones impliquen destruccin de los elementos.
Cuando la poblacin es muy homognea

DISEO DE LA INVESTIGACIN POR MUESTREO

Levy Lemeshow (1999) describe de manera clara los cuatro pasos a seguir para el diseo de una
investigacin por muestreo. Ellas son:
El diseo muestral
Las mediciones a tomar
El trabajo de campo
El anlisis estadstico

EL DISEO MUESTRAL: Incluye el tipo de muestreo, los niveles de confianza, el margen
de error, las variables a estimar (media, total, proporcin, razn, etc)
LAS MEDICIONES A TOMAR: A esta parte se define como se tomar la informacin, s es
por observacin directa telefnica, correo, a travs de un entrevista.
EL TRABAJO DE CAMPO: Una vez definido el tipo de muestreo y la manera como se
medirn las variables, se proceder a planificar la captura de la informacin, s se hace
Alvaro Trejos Facultad de Ingeniera Industrial UTP 1

necesario organizar un dispositivo de campo entrenando encuestadores, supervisores,
coordinadores de campo.
EL ANLISIS ESTADSTICO: Una vez se posee la informacin esta debe ser procesada
adecuadamente en un paquete estadstico como SPSS, SAS, MINITAB, o en una hoja de
calculo. Es bueno recordar que se esta estudiando caractersticas de la poblacin y que por lo
tanto los resultados estn sujetos a errores mustrales y no mustrales.

TIPOS DE MUESTREO

a. MUESTREO NO PROBABILSTICO M. por Juicio
M. de Conveniencia
M. por Cuota

b. MUESTREO PROBABILSTICO Aleatorio Simple
Estratificado
Sistemtico
Conglomerado

NOTA: Defina cada uno de los anteriores muestreos probabilsticos, pagina 24 del libro gua.

MUESTREO NO PROBABILSTICO

Este tipo de muestreo es utilizado cuando no existe o es muy difcil conseguir un marco muestral
bien definido, o en situaciones en que se requiera rapidez en los resultados de la investigacin.

Las conclusiones o estadsticas generadas por este tipo de muestreo no pueden inferirse a la
poblacin; sus conclusiones o resultados estarn dirigidos a los n elementos encuestados.

Muestreo por Conveniencia:

Las unidades, elementos o personas se seleccionan debido a la conveniencia del investigador o
a su fcil disponibilidad en el momento de brindar la informacin. Por ejemplo:

Alvaro Trejos Facultad de Ingeniera Industrial UTP 2

Pedir a las personas que colaboren voluntariamente para probar los productos y luego utilizar
estas mismas personas para que conceptualicen sobre el mismo producto.
Solicitar la opinin de personas que transiten por un centro comercial.
Hacer que un grupo de encuestadores realice entrevistas con personas de la calle.

Muestreo por Juicio:
Se selecciona con base en lo que algn experto considera acerca de la contribucin que esas
unidades o elementos de muestreo en particular harn para responder a la pregunta de inmediato.
Ejemplo:

Se les pregunta a un conjunto de expertos del Hospital San Jorge su opinin sobre el SIDA.
En la investigacin de mercado industrial la decisin de entrevistar un agente de compra a
cerca de un determinado producto. Constituye una muestra por juicio.

Muestreo por Cuotas:
En este caso, la poblacin es dividida por una caracterstica de control como la edad, el sexo, la
nacionalidad, etc. En este tipo de muestreo debe sacarse una muestra por cada divisin de la
variable de control. Ejemplo:

Se realiza una investigacin en el rea metropolitana centro occidente, por lo tanto se
encuesta a personas de La Virginia, Dosquebradas y Pereira.

Un encuestador realiza el 50% de las encuestas a las personas menores de 30 aos y el otro
50% al las mayores de 30 aos.

MUESTREO PROBABILSTICO

Antes de realizar cualquier tipo de muestreo probabilstico, deber definirse los siguientes
conceptos:

UNIDAD DE OBSERVACIN:
Alvaro Trejos Facultad de Ingeniera Industrial UTP 3

Es el objeto sobre el cual se realiza una medicin en las investigaciones, en la empresa la unidad
de observacin puede ser el producto, el obrero, etc.

POBLACIN OBJETIVO:
Corresponde a la lista de observaciones que deseamos estudiar. Definir la poblacin objetivo es
importante para la investigacin y en ocasiones es algo difcil de realizar. Ejemplo:

En una encuesta poltica, la poblacin objetivo puede ser:
Todos los adultos que pueden votar.
Todos los votantes registrados.
Todas las personas que votaron en las ltimas elecciones.

La definicin de la poblacin objetivo definir la poblacin sobre la cual se har la
generalizacin de los resultados estadsticos en las observaciones.

UNIDAD DE MUESTREO:
Es la unidad donde realizamos la muestra. Por ejemplo, podramos querer estudiar los gustos de
las amas de casa para comprar el mercado, pero normalmente no se tiene una lista de ellas.

En lugar de las amas de casa, las familias sirven como unidad de muestreo siendo las amas de
casa las unidades de observacin.

MARCO DE MUESTREO:
Es la lista de las unidades de muestreo. Para las encuestas telefnicas, el marco muestral, podra
ser el directorio telefnico.

Para una encuesta familiar, el marco muestral podra ser un listado de todas las viviendas o
direcciones de la ciudad que se encuentren en la oficina de planeacin.
Para una encuesta agrcola, el marco muestral seria un listado de todas las fincas o haciendas que
reposan en la oficina de planeacin u otras dependencias.
Ejemplo:
Alvaro Trejos Facultad de Ingeniera Industrial UTP 4

Se realizara una encuesta para determinar las preferencias polticas de los electores por algn
candidato en particular. Defina la unidad de observacin, la de muestreo, la poblacin objetivo
y el marco muestral.

Unidad de observacin: Cada persona adulta que pueda y quiera votar.
Poblacin objetivo: El listado de todas las personas adultas del municipio que puedan y
quieran votar.
Unidad de muestreo: Cada lado de manzana del municipio que se halla en un plano
estratificado.
Marco de muestreo: El conjunto de todos los lados de manzana del municipio
clasificados por estrato socio-econmico.

ESTRATO 1 216
ESTRATO 2 780
ESTRATO 3 500
ESTRATO 4 400
ESTRATO 5 300
ESTRATO 6 30

TOTAL 2226

En una encuesta ideal, la poblacin objetivo debiera ser igual a la poblacin definida en el marco
muestral; pero por lo general, la poblacin objetivo es mayor al marco muestral.

Ejemplo: la poblacin objetivo y el marco muestral en una encuesta telefnica de posibles
votantes.
Alvaro Trejos Facultad de Ingeniera Industrial UTP 5



SESGOS EN EL MUESTREO
SESGOS DE SELECCIN
NOTA: Colocar a los estudiantes lecturas de las paginas 4 a 10 del libro gua.


Cuando la poblacin objetivo es mayor a la poblacin muestreada (ver ejemplo en el cuadro
anterior).

SESGOS DE MEDICIN
Esto ocurre cuando el verdadero valor de las caractersticas difiere del valor registrado. Ocurre
por un mal diseo en las preguntas del cuestionario o cuando no son claras, por errores de
medicin, en los instrumentos como pesas, metros, voltmetros, etc.

Alvaro Trejos Facultad de Ingeniera Industrial UTP 6

ERRORES EN LA INVESTIGACIN


Margen de error definido
ERRORES MUESTRALES de carcter probabilstico
debido a no realizar un censo


ERRORES NO MUSTRALES Sesgo de seleccin
Sesgo de medicin


VARIABLES, PARMETROS POBLACIONES

El objetivo mas importante de las investigaciones que tienen que ver con la estimacin de ciertos
valores de la distribucin de una variable en la poblacin. Las variables son definidas una vez se
conocen las caractersticas de inters a estudiar. Las caractersticas que pueden ser medidas
cuantitativamente son consideradas como variables discretas (numero de miembros por hogar,
numero de automviles por familia, numero de cursos por semestre) o continuas (Peso en Kg.,
estatura en cm, ingreso por familia en pesos, rendimiento por hectrea en Lb.) y aquellas que
simplemente clasifican o caracterizan sectores de la poblacin se conocen como atributos o
caractersticas cualitativas.
Los valores que identifican la distribucin de una variable en una poblacin estadstica se
denominan parmetros y para un universo dado ellos son constantes. En forma general se
n
Y para la n-sima unidad elemental.
determinaran por , pero en casos especficos cada uno de ellos tendr su propia representacin.
El tamao de la poblacin de muestreo se defino como el umero total de unidades elementales
accesibles y se denota por N. Una variable caracterstica a medir se indica como una letra como
Y, X , o Z. El valor de la variable
i = 1,.......,N, se representa por Y
i
.
La descripcin bsica de una poblacin estadstica esta dada por sus parmetros principales, los
cuales de alguna manera estn representando las caractersticas de la poblacin.
El total poblacional (Y) representa el tamao absoluto total de la variable que s esta estudiando.
La media (Y ) es una medida de la tendencia central de todos los valores.
Alvaro Trejos Facultad de Ingeniera Industrial UTP 7

La varianza o cuasivarianza (S
2
) mide la dispersin absoluta, algunas veces difcil de entender
por restar definida en unidades al cuadrado de la variable de estudio.
a desviacin estndar (S), tambin es una medida de dispersin absoluta, pero de utilizacin
mismas unidades de la variable.
l coeficiente de variacin (CV) es considerado una medida de dispersin relativa o de
resado en nmeros reales, sin ningn tipo de
nidades asociadas.
En
es necesario recurrir a subndices para diferenciarlos adecuadamente (S
2
x
, S
z
, CV
y
)
Existen tambin algunos parmetros de inters cuando se estudian simultneamente dos
pob el
coeficiente de correlacin lineal (
x,y
), que expresa el grado de dependencia lineal entre las dos
variables.
Cuando la caracterstica de medir es la presencia o no de un atributo la media poblacional se
convierte en una proporcion poblacional (P), que re
poblacin que poseen el atributo considerado (propor
de hombres en una empresa) Si el atributo puede calificarse en
de diferentes proporciones poblacionales, asociadas a cada una de estas
(P
1
, P
2
, ........., P
varianzas, desviaciones estndar y coeficientes de variacin como un caso especifico de las
formulas generales.

1. P

Generalmente las variables m itativo. A continuacin se
definen


L
mas frecuente en estudios descriptivos por estar definida en las
E
homogeneidad de los valores, y es de gran utilidad cuando se trata de comparar grupos de datos
correspondientes a diferentes variables, por estar exp
u
el caso de los tres ltimos parmetros cuando se estudia mas de una caracterstica o variable
laciones. Los mas importantes son la covarianza (S
xy
), medida de variacin conjunta y
presenta la proporcin de elementos en la
cin de hogares en la zona rural, proporcin
k categoras distintas, se har uso
k categoras consideradas
k
). De la misma manera como se definen las proporciones, pueden definirse sus
ARMETROS EN VARIABLES CUANTITATIVAS
s importantes a estudiar son de tipo cuant
los parmetros mas frecuentemente usados.
El total poblacional es la suma de todos los valores de la variable en la poblacin y es
dado por la formula:
Alvaro Trejos Facultad de Ingeniera Industrial UTP 8

Total poblacional:

=

=
N
i
i
y t
1

La media poblacional es la media aritmtica de todos los valores, y se representa como:
Media poblacional:
N
Y
N
y
N
i
i
= =

=
La varianza (cuasivarianza) poblacional es el pr
todos los valores con respecto a la m
1

omedio de las desviaciones al cuadrado de
edia y se obtiene como:
Varianza (cuasivarianza) poblacional:
( )
1
1
2
2

=

=
N
Y y
i
i

La justificacin de la utilizacin de la cuasivarianza en vez de la varianza propiamente
dicha (donde el denominador es N en ves de N-1 ) es la presentacin mas simple de los
resultados en el proceso de estimaci
N
n.
ber:
Desviacin estndar poblacional:
La desviacin estndar es la raz cuadrada positiva de la varianza, a sa

2
=
El coeficiente de variacin poblacional es el cociente entre la desviacin estndar y la
media, esto es:

Coeficiente de variacin poblacional:

= CV
El coeficiente de variacin generalmente se expresa en forma de porcentaje, para facilitar
su interpretacin.
Es comn considerar el coeficiente de variacin como medida de homogeneidad de los
datos. Aunque puede ser peligroso generalizar, se dice, por ejemplo, que un grupo de
ogeneidad moderada mientras que
aquellos superiores al 30% ya podran indicar una significativo heterogeneidad en el
datos (poblacin o muestra) es homogneo s su coeficiente de variacin es menor de
15%. Valores entre 15 y 30% son asociados a una hom
grupo de datos. Estos limites han sido establecidos principalmente con base en la
experiencia. En algunos casos ellos no funcionan adecuadamente como, por ejemplo,
cuando la media toma valores cercanos a cero, (en experimentos qumicos, cuando se
mide la concentracin de ciertas sustancias en algunos lquidos y esta concentracin es
Alvaro Trejos Facultad de Ingeniera Industrial UTP 9

pequea) o cuando toma valores negativos (en climatologa cuando se desea media la
temperatura en grados Fahrenheit) Estas situaciones originan frecuentemente valores
cambios dramticos en su
La varianza relativa es de gran utilidad en la determinacin del tamao de muestra a
ecciona una p lacin
ando s onside dos ctersticas (po ciones adstic en misma
blacin ten do edidas de gran importancia, las cuales se presentan seguidamente.
covari entre s varia X y Y, correspondientes a los mism elementos de una
blacin a defin a com
extremadamente grandes para el coeficiente de variacin, o inclusive negativos, no
interpretables. Igualmente conviene anotar la gran sensibilidad de este coeficiente a
cambios pequeos en la escala de una variable, lo cual genera
valor, cuando la homogeneidad de los datos, entendida esta como el grado de similitud de
los elementos, no debera afectarse.
La varianza relativa es igual al cuadrado del coeficiente de variacin.
Varianza relativa: Vrel = (CV)
2
sel r de ob .
Cu e c ran cara bla est as) una
po exis s m
La anza do bles os
po , est id o:
( )( )
1
1


=

=
N
Y X x
N
i
i

coefici de c laci e dos variable y Y correspondientes a los mismos
entos de una poblacin, se obtiene como
y
i
xy

El ente orre n entr s X


elem :
y s
S S
xy
y x

=
,

Este coeficiente toma valores entre 1 y 1 es decir, 1
,

y x
. Valores altos (negativos o
dican una alta dependencia lineal entre las dos variables.
a dbil dependencia lineal. S
. Sin
s del alfabeto, su numero total de estudiantes y su carcter de funcionamiento (0 =
ficial, P = privado) aparece en la tabla que se muestra continuacin.
positivos) de este coeficiente in
Si el valor del coeficiente se acerca a 0, estara indicando un
dos variables son independientes, su coeficiente de correlacin es igual a cero
embargo, un coeficiente de correlacin igual a 0 no implica necesariamente que la dos
variables sean independientes.
EJEMPLO: Considrese la poblacin de colegios de una ciudad. La lista de ellos, identificados
con dos letra
o
Alvaro Trejos Facultad de Ingeniera Industrial UTP 10

El universo esta compuesto por el conjunto de todos los colegios de la ciudad. S se define la
aracterstica Y como el tamao de los colegios (numero de estudiantes), entonces se puede
por los valores correspondientes al
umero de estudiantes de cada uno de ellos. Los parmetros de la poblacin son:
c
hablar de un primera poblacin estadstica conformada
n

Nro. Orden Identif. Carcter Nro estud.
1 AA P 240
15 IB P 246
16 IC O 41
2 AB P 360
3 AC O 1338
4 AD P 845
2
17 ID O 602
18 IF P 446
19 IG O 712
5 AF O 664
6 AG P 540
20 IH P 126
21
7 AH P 788
IM P 377
22 OB P 265
8 EC P 446
9 ED P 360
23 OC P 332
24 OD P 459
10 EF O 880 25 OF O 824
11 EG P 1180
12 EH P 244
26 OG O 1455
27 OH
13 EJ O 1124
P 326
28 OM P 548
14 EM O 440

t= 16.579 estudiantes (total de estudiantes en los colegios de la ciudad)
= 592,11 estudiantes / colegio ( en este caso, por tratarse de una variable discreta, y para fines
de presentacin de resultados, se sugiere aproximar este valor al entero mas prximo, o sea, 592)
2
= 117.515 (varianza poblacional)
= 342,80 estudiantes / colegio (desviacin estndar poblacional)
CV = 0,5789 (Coeficiente de variacin poblacional. En forma de porcentaje seria 58.96%)
Como se deduce de los parmetros anteriores, la poblacin de los establecimientos educativos es
bastante hetereogneo en lo que al numero de estudiantes se refiere. El numero de estudiantes de
los esta
estudia




2. PAR

blecimientos tiende a alejarse bastante del valor promedio que en este caso fue de 592
ntes.
METROS EN VARIABLES CUALITATIVAS
Alvaro Trejos Facultad de Ingeniera Industrial UTP 11
12
En el caso de que la caracterstica sea un atributo, los parmetros de inters pueden derivarse de
las formulas presentadas anteriormente, definiendo los valores para la variable Y como:

Con base a esta asignacin, se dan las siguientes definiciones.

El numero total de elementos en la poblacin que poseen el atributo considerado es:
i
i
1
l atributo deseado est dada por:

=
N
y A
=
La proporcin poblacional con e
N
A
N
P
i
= =
y
N
i
=

La varianza (cuasivarianza) poblacional se define como:
1
PQ
N
N
P
1
2

=
Donde Q = 1 P, es la proporcin de elementos de la poblacin que no poseen el atributo
considerado.
La desviacin estndar poblacional, raz cuadrada de la varianza, se representa por
( ) PQ
N
P


=
1

El coeficiente de variacin se defin
N

e como

=
P N
CV
1


Q N
El coeficiente de variacin en variables cualitativas no puede considrese siempre como
s. Cuando P <= 0.5 el coeficiente toma
itarse a otros aspectos como, por ejemplo, a la determinacin de un
butos sean las caractersticas importantes o
(antes que la homogeneidad) de dos o ms
distribuciones.
una medida de la homogeneidad de los dato
valores mayores o iguales al 100%, difciles de interpretar. La utilidad del coeficiente en
estos casos debe lim
tamao de muestra en un estudio donde los atri
a la comparacin entre la dispersin relativa
Alvaro Trejos Facultad de Ingeniera Industrial UTP 12
13

de valores unos y ceros
onforman una segunda poblacin estadstica, cuyos parmetros son:

A =18 (Numero total de colegios privados)
EJEMPLO: Considerando de nuevo el ejemplo de los colegios, se puede definir a Y como el
atributo ser de carcter privado. Por tanto Y
i
tomara el valor 1 s el i-simo colegio es de
carcter privado y 0 en otro caso (carcter oficial). El conjunto
c
P = 18/28 = 0,6429 (Proporcin de colegios privados en la ciudad, en forma de porcentaje seria
64,29%)
2
P
= 0,2381 (varianza de la variable Y)
P
= 0,4879 (Desviacin estndar de la variable Y)
CV = 0,7590 (75,90% coeficiente de variacin de Y)

El atributo de los colegios de pertenecer al sector privado u oficial presenta una gran variabilidad.
Puede observarse que casi las dos terceras partes de los establecimientos pertenecen al sector
privado lo cual corresponde a un porcentaje relativamente alto. Sin embargo, el coeficiente de
variacin nos esta dando un valor aproximado del 76% que correspondera a una alta
eteroegeneidad, la cual no parece realmente estar presente. Lo que s estara mostrando esta
nt
La interpretacin del coeficiente de variacin debe ser cuidadosa, como puede deducirse de los
valo io es de carcter oficial y 0 en otro caso. Los

A = olegios oficiales)
35,7
h
ca idad es una importante dispersin relativa con respecto al promedio (proporcin).
clculos que a continuacin se presentan.
Supngase que el atributo Y se define como pertenecer al sector oficial. En este caso los
res de y
i
tomaran el valor 1 s el i-simo coleg
parmetros entonces serian:
10 (Numero total de c
P = 10/28 = 0,3571 (Proporcin de colegios oficiales en la ciudad. En forma de porcentaje seria
1%)
2
P
= 0,2381 (Varianza de la variable Y)
P
= 0,4879 (Desviacin estndar de la variable Y)
Alvaro Trejos Facultad de Ingeniera Industrial UTP 13
14
CV = 1,3663 (136,63%, coeficiente de variacin Y)

Curiosamente se est considerando el mismo grupo de elementos (solo se ha considerado en este
caso el complemento de la caracterstica que se estimo anteriormente), no obstante, la medida de
homogeneidad es completamente diferente en los dos casos.

MUESTRA, MARCOS MUSTRALES Y ESTADSTICOS

En las investigaciones por muestreo el objetivo principal es estimar los parmetros de la
poblacin a partir de una muestra seleccionada. La muestra seleccionada puede ser una muestra
probabilstica o no-probabilstica. En las muestras probabilsticas cada elemento de la poblacin
tiene una probabilidad conocida, diferente de cero, de formar parte de la muestra. Esto permite
n
e muestreo.

El m zado de una forma sistemtica (por ejemplo, las unidades
ordenadas en forma geogrfica o por tamao).
El marco debe contener un vector de informacin adicional para cada unidad, informacin
que ue involucren
Cuando se requiere estimacin para dominios (subpoblaciones), el marco debe especificar el
dominio al cual pertenece cada unidad.

Nin ajeno a la poblacin de inters debe estar presente en el marco.
obtener, a partir de ella, estimaciones validas desde el punto de vista estadstico matemtico, lo
cual no es posible en las muestras no-probabilsticas.
Cualquier material o mecanismo (listas, mapas, registros) que permite delimitar o identificar en
forma apropiada los elementos de una poblacin, recibe el nombre de marco muestral. Un marco
puede ser un listado o identificacin directa de los elementos o una lista o identificacin de
conjuntos de eleme tos. Srndal y otros (1992) enumeran elementos en forma directa. Ellos son:

Las unidades en el marco deben identificarse a travs de algn cdigo de 1 hasta N
M
, donde
N
M
es el nmero de unidades d
Cada unidad debe tener factibilidad de ser hallada si es seleccionada en la muestra.
arco debe estar organi
puede ser usada eficientemente en la construccin de estimadores q
variables auxiliares.
Todo elemento de la poblacin de inters debe estar presente solamente una vez en el marco.
gn elemento
Alvaro Trejos Facultad de Ingeniera Industrial UTP 14
15
Todo elemento en la poblacin de inters debe aparecer en el marco.

En investigaciones de gran escala, como por ejemplo en las Encuestas Nacionales de Hogares
que se llevan a cabo peridicam
multietpico, donde se requieren diferentes m rcos mustrales para cada una de las etapas
establecidas (seleccin de municipios del pas, de sectores dentro de los municipios, de manzanas
dentro de los sectores y de hogares dentro de ustrales reciben
entonces el nombre de unidades primarias de muestreo, secundarias, etc; dependiendo de la etapa
respectiva en que pueden ser seleccionadas. Las unidades finales de muestreo (o unidades de
enumeracin) son las que generalmente proporcionan la informacin en la encuesta y
generalmente comprenden mas de una unidad elemental (Un hogar esta conformado por una o
ms personas)
Un estadstico es una funcin de los valores mustrales (valores obtenidos al registrar las
mediciones de los elementos seleccionados en la muestra), siendo por tanto una variable aleatoria
ya que su valor cambia de muestra a muestra con los resultados del proceso de seleccin
aleatoria. Los estadsticos pueden ser calculados con fines meramente descriptivos o para estimar
los parmetros poblacionales. En este ultimo caso reciben el nombre de estimadores. En general
se designaran por pero para cada caso especial su identificacin cambiara. Al valor que toma
un estim enomina estimacin.
La definicin de los principales estadsticos, usados frecuentemente para la estimacin de los
parmetr
tral es la suma de todos los valores de la caracterstica (variable) Y en la
tos seleccionados)
La media muestral, promedio de la caracterstica (variable) Y en la muestra, se obtiene
como:
ente en algunos pases, el diseo muestral es un diseo muestral
a
manzanas). Las unidades m

ador en una muestra especifica se le d


os, sigue a continuacin:
El total mues
muestra y esta dado por:

=
=
n
i
i
y y
1

donde n es el tamao de la muestra (numero de elemen
n
y
n
i
y
i=
=
1

Alvaro Trejos Facultad de Ingeniera Industrial UTP 15
16
La varianza muestral, medida de dispersin de la caracterstica (variable) Y en la
muestra es:
( )
1
1 2

=
2

=
y y
n
n
s
i
i

La desviacin estndar muestral, raz cuadrada de la varianza, de la caracterstica
(variable) Y en la muestra est dada por:
2
s s =
El coeficiente de variacin muestral est representado por:
y
s
cv =

Para el caso de variables dicotmicas, y teniendo en cuenta la definicin de la variable indicadora
correspondiente, se tienen las siguientes definiciones:
El nmero de elementos que poseen el atributo deseado en la muestra es el mismo total
rcin muestral es la misma media muestral
muestral.

=
=
n
i
i
y a
1

La propo
n
a
p =

La varianza muestral est dada por
pq
n
s
1
=
donde q es la proporcin de elementos en la muestra que no poseen el atributo
considerado.
La desviacin estndar muestral, obtenida como la raz cuadrada de la varianza es:
n
2
pq
n 1
n
s =
El coeficiente de variacin muestral se expresa como:
Alvaro Trejos Facultad de Ingeniera Industrial UTP 16

Alvaro Trejos Facultad de Ingeniera Industrial UTP 17
17
p
q
n
n
cv
1
=

S

La d i tro basadas en todas las muestras posibles
que pueden ser generadas por el plan muestral particular se denomina distribucin muestral del
estimador.
No siem
del plan in embargo, en cualquiera de los casos,
una
otras car r considerado (como, por ejemplo,
el coeficiente de variacin o el error cuadrado medio, medida que ser definida mas adelante)
Es conv
distinto
estimaci
posibles
en form
haciendo


DISTRIBUCIONES MUESTRALE
istr bucin de todas las estimaciones de un parme
pre todas las muestras posibles tienen la misma probabilidad de seleccin. Esto depende
de muestreo especifico que se este aplicando. S
vez determinadas estas probabilidades, es posible definir tanto la media como la varianza y
actersticas importantes de la distribucin del estimado
eniente anotar que dos estimaciones pueden coincidir (muestras con elementos
s que, sin embargo, toman valores iguales). Esto significa que el numero mximo de
ones distintas (valores diferentes del estimador) ser igual al numero total de muestras
que se puede extraer. Las principales caractersticas de la distribucin de un estimador,
a similar a las caractersticas de una poblacin finita pueden, entonces, ser definidas
uso de la teora estadstica.
La media de la distribucin de un estimador se define como:
[ ]

=
=
v
i
i i
E
1


Donde:
= i-sima estimacin diferente del parmetro ,

i
= probabilidad de que el estimador tome el valor de .Esta probabilidad es igual a
la frecuencia relativa de las estimaciones por tratarse de una variable discreta.

Desde el punto de vista estrictam atem itarnos a las
poblaciones finitas, conlleva a que el numero de posible de muestras a seleccionar sea siempre
ente estadstico m tico, el hecho de lim
18
finito au
de valore in de probabilidad discreta.

La varianza de la distribucin de un estimador
nque en algunos casos sea muy grande) y por tanto tambin ser finito el numero posible
s del estimador, originndose, de esta manera, una distribuc
esta dado por:
[ ] [ ] ( )

=
=
v
i
i i
E VAR
1
2


La desviacin estndar de la distribucin de un estimador se denomina
frecuentemente error estndar de estimacin y se define:
[ ] [ ]

VAR EE =
El coeficiente de variacin para un estimador est dado por:
[ ]
[ ]
[ ]

E
EE
CV =
El coeficiente de variacin de un estimador mide la variabilidad muestral de la

edio de un estimador es una medida de dispersin con respecto al


verdadero parmetro poblacional y se obtiene como:
estimacin relativa al parmetro a ser estimado.
El error cuadrtico m
[ ] [ ] ( )

=
i i
2


Stuart (1976) dice que la importancia de un estimador solo puede juzgarse examinando
igualmente aceptables. Es por ello necesario definir algunas de
a l p
s son el insesgamiento, la consistencia y la eficiencia
relativa.
d

= =
v
i
i
E ECM
1
2


su distribucin muestral. Como las estimaciones pueden variar considerablemente de
muestra a muestra, el anlisis debe hacerse sobre la distribucin muestral como un todo.
A menudo es posible tener diferentes estimadores para un mismo parmetro. No
obstante, todos no son
las propiedades principales que ellos deben tener, basadas en sus distribuciones
mustr les, para ser considerados en e roceso de estimacin. Las ms importantes y
mas frecuentemente estudiada
El sesgo de un estima or , B[ ], se define como la diferencia entre la m dia de la
distribucin muestral y el va r
e
lo verdadero del parmetro desconocido, esto es,
Alvaro Trejos Facultad de Ingeniera Industrial UTP 18
19
[ ] [ ] =

E B
Un estimador se denomina insesgado s el valor promedio de las estimaciones obtenidas
para todas las muestras posibles es igual al verdadero parmetro poblacional. Una
definicin formal se da seguidamente.
Un estimador se dice que es insesgado si B[ ] = 0
Si un estimador es insesgado, su varianza es igual a su error cuadrado medio. En
general, la relacin entre los dos parmetros est dada por:
[ ] [ ] [ ] B VAR ECM + =

La precisin de un estimador se refiere a qu tan lejos se encuentra un valor particular estimado
del verdadero valor del parmetro y se acostumbra medir haciendo uso del E.C.M del estimador o
de su raz cuadrada. Entre menor sea el E.C.M, mayor es la precisin de la estimacin.

2
El concepto de sesgo est ligado a lo que se conoce como la validez de la estimacin. Esta se
refiere a , difiere
del verdadero parmetro. Entre menor sea el sesgo del estimador, mayor es la validez del proceso
ultneamente dos estimadores
l modo como la media de las estimaciones, en sucesivas repeticiones del proceso
de estimacin (Levy, P.S, y Lemeshow S. 1999)
Cuando se analizan sim , , de dos parmetros en la misma
anlisis
son la covarianza y el coeficiente de correlacin entre los estimadores.
La covarianza entre
poblacin de elementos, existen dos medidas muy importantes que son esenciales en el
estadstico, ellas
, , dos estimadores distintos de , con medias E[ ] y
E[ ], se define como
[ ] [ ] [ ] [ ]
2 1 2 1 2 1

,

E E E COV =
El coeficiente de correlacin entre dos estimadores y distintos de , con errores
estndar EE[ ] y EE[ ], esta dado por
[ ]
[ ] [ ]
2 1
2 1

2 1


EE EE
COV
=
Otro concepto s que o eficiencia de la estimacin. Ella se refiere a
que tan parecidas son las estimacio generando. Entre menor sea el error estndar
importante e lo se conoce com
nes que se van
Alvaro Trejos Facultad de Ingeniera Industrial UTP 19
20
de un estimador, mayor ser su eficiencia. Cuando se desea comparar dos estimadores se habla
entonces de eficiencia relativa.
Sean y dos estimadores distintos de , con varianzas dadas por VAR[ ] y
VAR[ ], respectivamente. Si VAR[ ] > 0, la eficiencia relativa (EFR) de con
e a resp cto est dada por:
( )
[ ]
[ ]
2
2 1

VAR
1



VAR
EFR =
Segn que EFR[ , ] sea inferior, igual o superior a la unidad, se dir que es
al o menos eficiente que ms, igu

Es frecuente comparar la varianza de un estimador correspondiente a un diseo especifico con la
varianza del estimador del mismo parmetro derivando del muestreo aleatorio simple el cual se
onsidera el diseo ms simple. El cociente correspondiente se conoce como el efecto del diseo
e muestra que se necesitara con el
ecisin que se obtiene a travs del muestreo aleatorio
simple. Esto puede ser de gran importancia en aquellos casos donde los costos de obtencin de la
e ntes diseos sugeridos.
Estimadores consistentes son aquellos basados en procedimientos de estimacin donde la
obable se pueden reducir aumentando el tamao de
muestra, hasta eliminarlos completamente cuando este iguala el tamao de la poblacin. A pesar
r e isten algunos casos de estimadores
ente cuando los tamaos de muestra son pequeos.

MARCO DE REFERENCIA PARA EL MUESTREO PROBABILSTICO
Con l
conjun
Denota
= {1,
c
y permite hacer una aproximacin bastante valida del tamao d
diseo especifico si se deseara la misma pr
informacin son muy diferentes para los dif re
magnitud de los errores de estimacin pr
de que esta es un propiedad deseable par a los estimado es, x
no consistentes que son de utilidad, especialm
e fin de ilustrar como funciona el muestreo probabilstico, daremos a continuacin un
to de ejemplos:
remos la poblacin finita de N unidades, o Universo de la siguiente manera:
2, N}

Alvaro Trejos Facultad de Ingeniera Industrial UTP 20
21
Eje l
Supong estras
istintas de tamao 2 (sin repeticin y sin orden):


S
5
= S
6
conocida de ser elegida y la
des de las posibles muestras es igual a uno (1).
ara el ejemplo anterior, suponemos que cada muestra tiene las siguientes probabilidades:
(S
1
) = 2
mp o1:
amos que una poblacin tiene 4 unidades, U = {1, 2, 3, 4}, y elegimos mu
d

4C2

= 4 = 4 ! = 24 = 6
2 (4 - 2)! 2! 4

S
1
=

1 , 2 S
2
= 1 , 3

S
3
= 1 , 4 S
4
= {2 , 3 }
2 , 4 = 3 , 4


En el muestreo probabilstico, cada muestra tiene una probabilidad
suma de las probabilida
P
P
6
P (S
2
) = 1 S = P(S
5
) = P(S
3
) = 0
6

(S
6
) = 3
P (
4
)
P
6
a probabilidad de encontrar un elemento en particular en la muestra es igual a la suma de las
prob i contienen el emento.

Llam ento.

1
= ( ) + P(S
3
) =

L
ab lidades de las muestras que el
aremos
j
a la probabilidad de encontrar el elem
2
1
0
6
1
6
2
= + + P x = 1) = P(S
1
) + P(S
2
3
1
6
2
0 0 = P(x = 2) = P(S ) +
2 1 4 5
P(S ) + P(S ) =
6
2
= = + +

3
= P(x = 3) = P(S
2
) + P(S
4
) + P(S
6
) =
3
2 4 3 1
6 6
0
6
= = + +
Alvaro Trejos Facultad de Ingeniera Industrial UTP 21
22

4 3 5 6
= P(x = 4) = P(S ) + P(S ) + P(S ) = 0 + 0 +
6
3
=
6
3
=
2
1



CARACTERSTICAS DEL MUESTREO PROBABILSTICO


a ext mu ho ms difcil de extraer que una no
probabilstica (construccin del marco muestral, diseo del muestreo y seleccin
tico, no se puede cambiar la encuesta, a una persona
ia

En el muestreo p lstico c perso emento tiene una probabilidad de ser
elegida y proporcionar informacin al estadstico calculado en la muestra.

C una m a probabil e puede truir valo de c a, ya que se conoce la
d ibuci estadstic puede con que probabilidad un parmetro se encuentra
dicho intervalo.
el fin rificar las terstica muestreo probabilstico y repasar algunos conceptos
feren adstica y bilidade plant siguiente o.
plo 2
ne l ente situa pottica cual mos el valor de Y
i


para cada uno de
unid e la pobla = 9 , N , 2, 3 , 7, 8, 9)
alor
i
son:
1 2 3 4 5 6 7 8 9
L racc de m c in una uestra probabilstica es
aleatoria). En el muestreo probabils
ag e que radabl la de perso una na m en alg da.
robabi ada na o el
on uestr stica s cons un inter onfianz
istr n del o y se inferir

Con de cla carac s del
de in cia est proba s, se eara el ejempl
Ejem :
Se tie a sigui cin hi en la conoce
las 9 ades d cin N = (1 , 4, 5, 6
Los v

es de Y



I
Yi 1 3 5 5 7 2 3 5 9




Alvaro Trejos Facultad de Ingeniera Industrial UTP 22
23
Algunos p tros de es lacin so sigu
P je del num :
arme ta pob n los ientes:

orcenta ero 5 333 . 0 =
9
3
= P
T la poblac
i
y
M e la pobla
otal de in: t

= = 40
edia d cin: 444 . 4
9
= =
40
=

N
y

D in estnd
i

esviac ar:
Y
36 . 2 =

El ejercic iste en:
allar las posibl stras de o
n ca estra estim total, la o el porcentaje de y = 5 en la
obla
allar tribucin abilida el e r del tota dia y la proporcin.
alla r esperad arianza error ico medio de cada estimador.
rafic istribuci uestreo cada or.
ARR :
tota s muestras aleatorias sin repeticin, esta dado por la siguiente expresin:
= =


MU A VALORES TOTAL M PORCENTAJE
io cons
a) H todas es mue tama 3.
b) E da mu ar el media de y, as com
p cin.
c) H la dis de prob d para stimado l, la me
d) H el valo o, la v y el cuadrt
e) G ar la d n del m para estimad

DES OLLO
a) El l de la

N 9 84
n 3


ESTR EDIA
1 123 123 18 2,00 0,00
2 124 123 18 2,00 0,00
3 125 125 24 2,67 0,33
4 126 125 24 2,67 0,33
5 127 125 24 2,67 0,33
6 128 127 30 3,33 0,00
7 129 129 36 4,00 0,00
8 134 133 21 2,33 0,00
9 135 135 27 3,00 0,33
10 136 135 27 3,00 0,33
11 137 135 27 3,00 0,33
Alvaro Trejos Facultad de Ingeniera Industrial UTP 23
24
12 138 137 33 3,67 0,00
13 139 139 39 4,33 0,00
14 145 135 27 3,00 0,33
15 146 135 27 3,00 0,33
16 147 135 27 3,00 0,33
17 148 137 33 3,67 0,00
18 149 139 39 4,33 0,00
19 156 155 33 3,67 0,67
20 157 155 33 3,67 0,67
21 158 157 39 4,33 0,33
22 159 159 45 5,00 0,33
23 167 155 33 3,67 0,67
24 168 157 39 4,33 0,33
25 169 159 45 5,00 0,33
26 178 157 39 4,33 0,33
27 179 159 45 5,00 0,33
28 189 179 51 5,67 0,00
29 234 233 24 2,67 0,00
30 235 235 30 3,33 0,33
31 236 235 30 3,33 0,33
32 237 235 30 3,33 0,33
33 238 237 36 4,00 0,00
34 239 239 42 4,67 0,00
35 245 235 30 3,33 0,33
36 246 235 30 3,33 0,33
37 247 235 30 3,33 0,33
38 248 237 36 4,00 0,00
39 249 239 42 4,67 0,00
40 256 255 36 4,00 0,67
41 257 255 36 4,00 0,67
42 258 257 42 4,67 0,33
43 0,33 259 259 48 5,33
44 267 255 36 4,00 0,67
45 268 257 42 4,67 0,33
46 269 259 48 5,33 0,33
47 278 257 42 4,67 0,33
48 279 259 48 5,33 0,33
49 289 279 54 6,00 0,00
Alvaro Trejos Facultad de Ingeniera Industrial UTP 24
25
50 345 335 33 3,67 0,33
51 346 335 33 3,67 0,33
52 347 335 33 3,67 0,33
53 348 39 337 4,33 0,00
54 349 339 45 5,00 0,00
55 356 355 39 4,33 0,67
56 357 355 39 4,33 0,67
57 358 45 5,00 0,33 357
58 359 359 51 5,67 0,33
59 367 355 39 4,33 0,67
60 368 357 45 5,00 0,33
61 369 359 51 5,67 0,33
62 378 357 45 5,00 0,33
63 379 359 51 5,67 0,33
64 389 379 57 6,33 0,00
65 456 355 39 4,33 0,67
66 457 355 39 4,33 0,67
67 458 357 45 5,00 0,33
68 459 359 51 5,67 0,33
69 467 355 39 4,33 0,67
70 468 357 45 5,00 0,33
71 469 359 51 5,67 0,33
72 478 357 45 5,00 0,33
73 479 359 51 5,67 0,33
74 489 379 57 6,33 0,00
75 567 555 45 5,00 1,00
76 568 557 51 5,67 0,67
77 569 559 57 6,33 0,67
78 0,67 578 557 51 5,67
79 579 559 57 6,33 0,67
80 589 579 63 7,00 0,33
81 678 557 51 5,67 0,67
82 679 559 57 6,33 0,67
83 689 579 63 7,00 0,33
84 789 579 63 7,00 0,33

Alvaro Trejos Facultad de Ingeniera Industrial UTP 25
26
b) En el cuadro anterior, en la 1 columna se hallan todas las posibles muestras de los 9
e o rman la poblacin i = (1, 2, 3, 4, 5, 6, 7, 8, 9).
E c
i
para cada valor de i, as:
L s orresponde a (1, 5, 8) y los valores correspondientes de Y
i
( para i =21) son (1,
5
acin del total lo calculamos con el siguiente estadstico:
lement s que fo
n la 2 olumna se encuentran los valores correspondientes de Y
a mue tra 21 c
, 7).
La estim
39
3
13
* 9
3
) 7 5 1 (
* 9
3
Yi
* 9 Y = N = =
+ +
=


acin de la media la estimamos con el estadstico:

= t
La estim
333 . 4
3
13
3
) 7 5 1 (
3

Yi

= =
+ +
=
uestra se calcula con el siguiente estadstico:
Y =
El porcentaje de sietes ( 5 ) en cada m
N
poblacin la en tica caracters la con unidades de Nmero
= P
Para el caso de la muestra 21, existe un solo 5 en la muestra de tamao 3: 333 . 0
3
1

= = P
A continuacin se presenta un resumen del parmetro y su estimador, as como bin la
frm
tam
ula funcional del estadstico:

PARMETRO ESTADSTICO FUNCIN
Total t
t


Y N
Y
n
Y
i
Y Media
P


n
A
P

Un poco ms adelante demostraremos la razn de ser de cada estimador en el tema llamado

Teora de Aleatorizacin.



Alvaro Trejos Facultad de Ingeniera Industrial UTP 26
27



DISTRIBUCIN DE PROBABILIDAD PARA LA




c. Distribucin de probabilidad
Y

DISTRIBUCION DE PROBABILIDAD
Y P (Y )
2,00 0,02
2,33 0,01
2,67 0,05
3,00 0,07
3,33 0,08
3,67 0,10
4,00 0,07
4,33 0,14
4,67 0,06
5,00 0,13
5,33 0,04
5,67 0,12
6,00 0,01
6,33 0,06
7,00 0,04


La esperanza matemtica o promedio de la variable aleatoria o valor esperado de Y se calcula
as:

= =

5 ) ( ) ( i Y P Y Y E

= ) ( ) ( Yi YiP Y
Alvaro Trejos Facultad de Ingeniera Industrial UTP 27
28



V (Y ) = E (Y
i
- E (Y
i
) )
2


=

(Y
i
-

E (Y
i
))
2
P (Y
i
)

Alvaro Trejos Facultad de Ingeniera Industrial UTP 28
= E (Y
i
- E (

Y
i
) )
2
= (

Y
i
))
2
P ( Y
i
-E ( Y
i
)
= (
2
Y
i
-2 E (Y
i
) Y
i
+ (E (Y
i
)) ) P (
2
Y
i
)

= Y
i
2
P (Y
i
)
-
2 E (Y
i
) Y
i
P (Y
i
)
+
(E (Y
i
))
2

= E
i
2
)

- Y
i
) E (Y
i
) +(E (Y
i
Y

2 (E ( ( ))
2

= E (Y
i
2
)

-2

(E (Y
i
))
2
+ (E (Y
i
))
2

= Y
i
2
) - (E (

E ( Y
i
))
2

Ahora: E(Y
i
2
)

= Y
i
2
P(Y
i
) = 21.15
V(Y ) = 21.15 - (4.44)
2
= 1.39

Otra manera de calcular la varianza del estimador de la media es la siguiente:
( )
( )
39 . 1
3
36 . 2
8
6
1
2
2
=

=
n N
n N
Y V
y


Donde
2
y
es la varianza de la caracterstica

Y definida anteriormente. Este resultado ser
emostrado posteriormente y constituye la base para el clculo del tamao de la muestra para la
ac l. 0.57
DISTRIBUCIN DE PROBABILIDAD PARA EL TOTAL:
P(
d
estimacin de una media pobl iona

)
1 ,00 0,02 8
21,00 0,01
24,00 0,05
27,00 0,07
30,00 0,08
33,00 0,10
36,00 0,07
39,00 0,14
42,00 0,06
45,00 0,13
48,00 0,04

Alvaro Trejos Facultad de Ingeniera Industrial UTP 29
29
51,00 0,12
54,00 0,01
57,00 0,06
63,00 0,04

E ( ) = P( ) =

40

Ahora: V( ) = E ( - E ( ) )

=

(

E ( )) P ( )

=
2


P ( ) - ( E ( ) )
2
= 1713 - 40
2
= 113 = V( )
Otra m ado por la
siguien
= N
t

2 2
t

- t


anera de calcular la varianza del estimador del total de la poblacin esta d
te expresin:
t

Y V( ) = N
2
V( t

Y ) =
n N 1


t

) = 9
n N
N
2
2


V (

DISTRIBUCIN DE PROBABILIDAD PARA LA PROPORCION
2
* 0.857 113 Este resultado lo demostraremos posteriormente

Distribucin de probabilidad del porcentaje de 5


P

P( P

)
0,00 0,24
0,33 0,54
0,67 0,21
1,00 0,01





P

) = P

P( P

) = 33 . 0 E(
30

) = E (
2
- (E( ))
2


( P

) P

V
( P

2
) = P


2

*

P ( P

E ) = 0.17

V( P

) = E ( P

2
)

- (E ( P

))
2


= 0.17- 0.33
2
) = 0.0611
tra manera de calcular la varianza del estadstico muestral es el siguiente estadstico:

V( P

O
V( P

) N n = pq, d p q son las propo s cionales de o r pobla enco nde y cione ntrar el
mero 5. p = 3
N 1 n
n = 0.333 , y, q = 6 = 0.666
9 9



V( P

) = 9 - 3 * 0.333 * 0.666 = 0.0554


8 3

SESGO Y ERROR CUADRATICO MEDIO DE LOS ESTIMADORES EN EL
O
cia entre el valor
o
MUESTREO SIN REEMPLAZ
En la seccin anterior se defini el SESGO de un estimador como la distan
esperado del estimador y el verdadero valor del parmetro: = )

( E
= )

E SESGO )

( E
Los estimadores planteados anteriormente para la media, el total y la proporcion son insesgados.
0 375 . 0 375 . 0 ) ( ) (
0 40 40 )

( )

(
0 5 5 ) ( ) (
= = =
= = =
= = =
P p E p Sesgo
t t E t Sesgo
y E y Sesgo

Debe entenderse el valo do r espera como el promedio ponderado de los valores que toma el
estadistico en las diferentes muestras, la ponderacion se hace por el peso de la
ERROR CUADRTICO MEDIO El estado ideal de los estimadores es el de ser insesgado y
de varianza mnima (eficiente); el error cuadrtico medio es el estadstico que se encarga de
reunir estas dos medidas y se definio anteriormente de la siguiente manera:
probabilidad con que aparece ese valor en particular.

Alvaro Trejos Facultad de Ingeniera Industrial UTP 30



Alvaro Trejos Facultad de Ingeniera Industrial UTP 31
31

ECM = [ ]
2
) -

( E Esto corresponde a la distancia al cuadrado esperado entre el estimador y el


alor del parm
ECM = E ( ) -
2
CM = E( - E ( ) + (E ( ) - ))
2
ECM = E (( - E ( ))
2
-
Como - E( ) = 0 la suma de las distancias de los datos a la media es 0 se tiene
v etro.

- E (

) + E ( )

E
2(

- E (

)) ( E(

) - ) + ( E(

) - ))
2

ECM (

) = [ ]
2
) )

E( - ( E + (E(

) - )
2

= V(

) + (sesgo )
2
Se dice que un estimador es INSESGADO s: E(

) =
Un estimador es PRECISO si su varianza es pequea:




INSESGADO SESGADO INSESGADO
ECISO PRECISO PRECISO
ACTITUD EXACTITUD EXACTITUD



emplo: las familias tienen diferente
nmero de hijos. Las ventas de un negocio no son siempre la misma para varios periodos.
Se define la VARIANZA como: V (Y ) =
2
= E ( Y
1
- E (Y ))
2
=
E [(

- E(

))
2
] = ((

) - E (

))
2
P(

).
Un estimador tiene EXACTITUD si ECM es pequeo:
V (

) + ( sesgo )
2
= E( (

- )
2
)






NO PR
NO EX NO
COEFICIENTE DE VARIACIN
Casi todas las poblaciones exhiben cierta variabilidad, por ej
N
) Y Y (
2
1


X X
X X

XX


X
X

XX
x
32
La DESVIACION ESTANDAR correspondiente a la raz de la varianza:
2
=
Con frecuencia, la desviacin estndar de la poblacin tiene cierta relacin con la media.
es de 1000 Km con una desviacin de
ra edad que hacen deporte caminan en
100
medida de variabilidad relativa que se define como:

EJEMPLO: En una aerolnea el promedio de sus vuelos
100. Sin embargo, un conjunto de personas de la terce
promedio 1000 m con una desviacin estndar de m., el coefeciente de variacin (CV) es una

Y
S
CV =
Si el recorrido de los ancianos se mide en metros, entonces Y y S tambin se miden en

l recorrido de los aviones y de los ancianos tienen la misma variabilidad.
terpretar e coeficiente de variacin, hallar para las poblaciones A y
B el coeficiente de variacin.

Poblacin A: 48 49 51 52
Poblacin B: 1 2 98 99
TEORIA DE LA ALEATORIZACION

han enunciado algunas propiedades y demostrado empricamente que los
estimadores de la media, el total y la proporcin en el muestreo aleatorio sin reemplazo son
insesgados y presentan una varianza que depende del tamao de la poblacin y la muestra. A
travs de la Teora de la Aleatorizacin demostraremos lo enunciado anteriormente.

Definamos la variable indicador 1 i N. Denotaremos por Z
i
aquella variable que toma el
estra,

1 Si la unidad i esta en la muestra
Z
i =

metros y el coeficiente de variacin no depender de las unidades de medida. En este ejemplo,
e

EJEMPLO: con el fin de in l

Hasta este momento se
valor de 1; si dicho elemento pasa a formar parte de la muestra y Z
i
= 0 en caso de que el
elemento i no pertenezca a la mu
Alvaro Trejos Facultad de Ingeniera Industrial UTP 32
33
0 Si la i esma unidad no esta en la muestra

E (Z
i
) = Zi P(Z
i
= 0 * P (Z
i
= 0) + 1* P (Z
i
= 1) =
i
(Z
i
2
) = Zi
2
P(Z
i
)

= 0
2
* P (Z
i
= 0) + 1
2
* P (Z
i
= 1) =
i
(Z
i
) = E (Z
i
)
2

- (E (Z
i
))
2


=

i

-

i
2
= i

( 1 - i

)
)
E
V
P (Z
i
= 1) =
i
N
n
n
N
1 n
1 N
= =


abilidad que un lemento i este en la muestra.

Que corresponde a la prob e


Al reemplazar
i
por
N
se tiene q e:
n
u E (Z
i
) =
N
n
= E(Z
i
2
)
V(Z
i
) = i

( 1 - i

) =


N
n
1
N
n

Otro resultado importante para deducir la varianza de los estimadores es la COVARIANZA (no
se demostrara).
COV (Z
i
Z
j
) = E(Z
i
Z
j
) - E(Z
i
) E(Z
j
)
E(Z
i
Z
j
) = Z
i
Z
j
P(Z
i
= 1 y Z
j
= 1) = 1P(Z 1 y Z
j
= 1)
P(Z
i
= 1 y Z
j
= 1) = P(Z
i
= 1 / Z
j
= 1) P(Z
j
= 1) =
i
=
Ya que Z
i
Z
j
= 1 para Z
i
= 1 y Z
j
= 1 en el resto vale cero
1 N
1 n

*
N
n

COV(Z
r
Z
i
) = E(Z
i
Z
j
) E(Z
i
)

E(Z
j
) =
2
N
n
N
n
1 N
1 n

COV(Z Z) =
r i


n n
1
1


N N 1 N

ESTIMADORES PORCENTAJE

INSESGADOS PARA EL TOTAL, LA MEDIA Y EL
MEDIA:
Se utiliza como estimador
n
Yi
Y

=
Alvaro Trejos Facultad de Ingeniera Industrial UTP 33
34
=
= = =
)
1 1 1
Y
i i i
= = =


= =
) (
1 1
N
Yi
n
Yi
N
n
n
Yi
Zi E
n n
N N N
i i

=

= =

)
Yi
Zi E
Yi
E E
N n
(
(
E
Y

TOTAL:
Se utilizaba como estimador Y N
( )
( ) t t

E =
t Yi N
n
Yi
N
n
YiN ) Zi ( E
n
Yi
Zi E
n
Yi
N E t

N
N n
= = =
=

= =



OPORCIN:
E
1 i 1 i 1 = = =
N N
1 i 1 i = =
i


PR

=
=
n
i
P

n
A
1 i

=

n
Zi

=

= =
N
1 i
n
1 i
Ai
E
n
Ai
E ) P

(
P
N n N n
Zi E = =

=
* ) (
Ai Ai n Ai
N N N
i
=

=1

Utilizando los mismos argum roporciona la Teora de Aleatorizacin se puede deducir
las varianzas para los estimadores:
i i= 1 1
P ) P

( E =
entos que p
n

1 N
n
) Y (
2

=
N
V

( )
n N
n N
2

N t V
2
1


=
Alvaro Trejos Facultad de Ingeniera Industrial UTP 34

Alvaro Trejos Facultad de Ingeniera Industrial UTP 35
35
n
pq
N
n N
P V

=
1
)

(
NAL


VARIANZA Y CUASIVARIANZA POBLACIO

( )
VARIANZA
N
i
Xi
N

=
CUASIVARIANZA
=
1 2

( )
1
1 2

=

=
N
Xi
S
N
i


Se tiene que (N - 1) S
2
= N
2
N
S N
2
2
) 1 (
=

Reemplazando este resultado en las varianzas de los estimadores se tiene una nueva varianza en
a p laci trminos de la cuasi varianza de l ob n:
n N n N N
Y V 1
1
) (

=
S n S N n N
2 2
1
n
S
N
n
N
n
S
N
N
N
n N
N t V
2
2
2
2
1
1
1
)

=
n
PQ
N
n

= 1
n
PQ
N
n N
n
PQ
N
N
N
n N
p

=

=
1
1
) ( V
Un estimador de la cuasi varianza poblacional esta dada por la cuasi varianza muestral:
2 2
) X Xi (
1 n
1
s =
NOTA: En el Muestreo Aleatorio sin repeticin, la cuasi varianza y la varianza muestral son
stimadores insesgados de la cuasi varianza y varianza poblacional. En el Muestreo Aleatorio e
con repeticion o poblaciones infinitas estos son estimadores sesgados.

MUESTREO ALEATORIO SIMPLE M . A . S

36
Este tipo de muestreo es el mas sencillo de todos los muestreos probabilsticos y proporciona
co, Estratificado y por
onglomerado.
n este tipo de muestreo, cada unidad es seleccionada aleatoriamente de una lista (marco
muestreo, la probabilidad de elegir el primer elemento es
todas las bases tericas para desarrollar el Muestreo Sistemti
C
Existen dos formas de extraer una muestra aleatoria simple:

MUESTRA ALEATORIA SIMPLE CON REEMPLAZO C R :
E
muestral), se anota su resultado y se reintegra a la poblacin; se continua este proceso hasta
completar n elementos que corresponde al tamao de la muestra.
En este tipo de
N
1
, del segundo
elemento
N
1
Y asi sucesivamente.
El nmero total de muestreos esta dado por la expresin: N
n
N: tamao de la poblacin
n: tamao de la muestra

JEMPLO: con la siguiente e muestras de tamao 2 y 3
respectivam

n = 2 : 11, 12, , 21, 22, 31, 32,
N
2
= 9

n = 3






E poblacin (1, 2, 3), seleccion
ente.
13 23, 33

1 11 12 13
1) 2 21 22 23
3 31 32 33

1 2 3

1 11 12 13
2) 2 21 22 23
3 31 32 33
Alvaro Trejos Facultad de Ingeniera Industrial UTP 36
37

1 2 3






N
n
= 3
3
= 27
La probabilidad de tener una muestra en ticular ser
1 11 12 13
3) 2 21 22 23
3 31 32 33

1 2 3

par :
n
N
1
MUESTR ALEAT O SIMPLE IN REEMP O S R
En este tipo d uestreo cada unidad que es seleccionada se retiene y se selecciona otra adicional
con igual probabilidad entre las unidades que restan en la poblacin.
En este tipo d uestreo, el nmero de m ento en particular es:
EO ORI S LAZ :
e m
e m uestras que tiene un elem
)! n ( )! 1
)! 1 (
1 1 )! 1 (
)! 1
N
N
n n
N


+ =

=

Por lo tanto, la probabilidad de que un elemento forme parte de la mu r la siguiente:


( ) n (N
(N
1 n

1
=


estra se
! )! (
!
)! ( ) 1 ! (
)! 1
1
1
n n N
N
n N n
n
N
n
N

(N

N
n
N n
n N
=
! )! 1 (
n N n N
n n N N

=

!
! ! 1 ( )! ( )! 1 ( !
! )! *( ) 1

El nmero total de m
)
(
uestra ser:
! )! ( n n N n


Y la probabilidad de seleccionar una muestra en particular de tamao n es:
! N
N
=

!
! )! ( 1 n n N
=
N
n
N

Alvaro Trejos Facultad de Ingeniera Industrial UTP 37


38
EJEMPLO: si se tiene una poblacin de 8 elemen y se selecciona una muestra de tamao 4,
el nmero total de stras es:
tos
mue
70 l
! 4 )! 4 8 (
! 8
4
8
=

a probabilida elegir una m :


70
1
d de uestra en particular es


Para extraer una muestra aleatoria simple, usted necesita una lista de todas las unidades de
lista es el marco muestral en muchas ocasiones.
En este marco muestral la unidad de muestreo y la unidad de observacin coinciden. Para la
seleccin aleatoria de cada unidad normalmente se acostumbra a utilizar uno de estos 3
m
Tabla de nmeros aleatorios
Calculadora cient
Computador, programas como Excel, lenguajes de programacin.
continuacin el
s
ta a continuacin la informacin de 50 estudiantes de un curso:

En la primera columna se encuentra el numero del alumno, en la segunda la edad, en la tercera
una declaracin en cuanto a si el alumno tiene el propsito de tomar el curso de muestreo
tico.

tomar el
urso de muestreo, 0 si el alumno no tiene la intencin de tomar el curso, las otras columnas
na del nmero del estudiante se utiliza nicamente para la extraccin de la muestra.

# ESTU -
DIANTE
E
Xi

NO = 0
X
i
- ( X
i
- )
2
observacin que pertenecen a la poblacin, esta
ecanismos:

fica

EJEMPLO: con el fin de afianzar los conceptos del M.A.S, se presenta a
iguiente ejemplo:
Se presen
probabils
La codificacin para esta variable es el siguiente, 1 si el alumno tiene la intencion de
c
corresponden a clculos que se utilizan para hallar la varianza y otros resultados que se utilizaran.
La colum
CENSO DE 50 ESTUDIANTES Y SU POSIBLE ELECCIN
DEL CURSO DE MUESTREO

DAD
ELECCIN
SI = 1
Alvaro Trejos Facultad de Ingeniera Industrial UTP 38
39
1 25 1 1.3 1.69
2
3
5
6
7
8
9
18
19
20
21
23
24
25
26
30
31
32
36
37
45
46
47
48
27
29
31
25
29
27
24
27
26
28
36
29
26
21
24
22
20
22
24
25
22
23
21
21
20
20
21
20
0
1
1
0
0
0
0
1
0
0
1
0
0
0
0
0
1
0
0
1
1
0
0
0
1
0
1

3.3
5.3
7.3
1.3
5.3
3.3
0.3
3.3
2.3
4.3
12.3
4.3
2.3
-2.7
0.3
-1.7
-3.7
-1.7
0.3
-1.7
-0.7
-2.7
-0.7
-5.7
-2.7
-3.7
-3.7
-2.7
-3.7
7
7

10.89
28.09
53.29
1.69
28.09
10.89
0.09
10.89
5.29
18.49
18.49
5.29
5.29
151.29
18.49
5.29
7.29
0.09
2.89
13.69
2.89
13.69
22.09
0.09
1.69
2.89
0.49
7.29
0.49
32.49
7.29
22.09
0.49
2.89
22.09
13.69
13.69
7.29
13.69
22.09
32.49

4
10
11
12
13
14
28
33
29
1
0
1
4.3
9.3
5.3
18.49
86.49
28.09
15
16
28
26
1
0
4.3
2.3
17 26 1 2.3
22 19 0 -4.7 22.09
27
28
29
19
20
19
1
0
0
-4.7
-3.7
-4.7
22.09
33
34
35
20
21
21
0
1
0
-3.7
-2.7
-2.7
13.69
7.29
7.29
38
39
23
18
40
41
42
19
23
0
0
-4.7
-0.7
43
44
22
19
1
0
-1.7
-4.7
49
50
19
18
0
0
-4.
-5.
0 1.3
0
0
Alvaro Trejos Facultad de Ingeniera Industrial UTP 39
40





Xi=1184

=23.68
X
2
=17

34 . 0
50
17
P = =
(Xi-)=0
1 . 4
898 . 16
50
9 . 844
90 . 844 ) (
2
2
=
= =
=

Xi


Para estimar parmetros todas las edades y la
proporcin de estudiantes que cursarn muestreo probabilstico, elegiremos una muestra
NUMERO EDAD X
i
CURSO DE
MUESTREO
39
44
13
18
2
36
28
19
26
0
0
0
0

6
= 15 890 700

La media y la desviacin estndar muestral son:
como la edad promedio del curso, el total de
aleatoria de tamao 6 con la calculadora

15
18
8 1
1
14


Se ha elegido una muestra posible de las


50

83 . 25
6
155
= = =

n
Xi
X
( )
16 . 44
1
2
=

=
n
S
2

X Xi

2
645 . 6 16 . 44 = = S

ESTIMACIN DE LA MEDIA POBLACIONAL

Alvaro Trejos Facultad de Ingeniera Industrial UTP 40
41
La media poblacional y la desviacin estndar son de 23.68 y 4.1 respectivamente, de manera que
la muestra dio un resultado un poco mayor; esto es debido al error de muestreo.
X es un estimador insesgado de la media poblacional cuya varianza se calcula de la siguiente
manera:

=
50
1
6 N
1
n
) X ( S
2

6 65 . 6 n S
2 2
4869 . 6 ) X (
2
= S
El factor


N
n
1 se conoce como la correccin para poblacin finita. Intuitivamente
debe aplicarse cuando 05 . 0
N
n
, para nuestro ejemplo 12 . 0
50
6
=

Tambin puede observarse que si tamao de muestra es de 50 la varianza de la media muestral
es:
0
N
n
1
n
S
2
=


Lo cual es cierto, puesto ex o tendramos variabilidad.
An :

iste solo una muestra de tamao 50 y n
alicemos el efecto que tiene un tamao de poblacin para la varianza muestral
( )
n
S
N
n
1 x S
2
2

=
= 100 000 y n = 100, se tiene que la varianza muestral es la siguiente:
X V =
Para N
( ) 999 . 0
100
S
00000
99900
2
=
1
*
100
S
2
Para N = 100 000 000
( ) 999999 . 0
100
S
00000000
=
1
99999900
*
100
S
2 2

En los clculos anteriores puede observarse que una muestra de tamao 100 de una poblacin de
100 mil unidades, tiene casi la misma precisin que una muestra de tamao 100 de una poblacin
de 100 millones.
Alvaro Trejos Facultad de Ingeniera Industrial UTP 41
42
Retomando nuestro ejemplo, un estimador insesgado de
4859 . 6 1 ) (
2
2

S
=

= =
N
n
n
S x X

2
V
Un estimador insesgado de S (cuasi varianza poblacional) es:
( )
16 . 44
5
83 . 25 Xi
1 n
) X Xi (
S
2
=

=


Cobra un importante inters para los siguientes temas el error estndar de estimacin
2
( ) 4859 . 6
n
S
N
n
1 X EE
2
=

= = 2.5467

El coeficiente de variacin de una e roporciona una medida de la variabilidad relativa stimacin p
de una estimacin. Es igual al error estndar divido entre la media:
( )
0986 . 0
5467 . 2 X EE
CV = = =
83 . 25 X
ado ya que los resultados para la varianza y para la
media poblacional fueron estim

ESTIMACION PARA EL TOTAL:
Este es un coeficiente de variacin estim
ados a partir de los 6 datos tomados aleatoriamente
t = 118 50 * 68 . 23 N Xi
N
= = =

4
1 i=
Este total poblacional corresponde a la sum
Un estimador del total con nuestra muestra de seleccin es:
a de todas las edades
5 . 1291 83 . 25 * 50 X N
n
Xi
N t

n
1 i
= = = =

=

( ) ( ) ( ) 75 . 16214 4859 . 6 * 50
n N
1 N X V N X N V t V = =

= = =
S n

2
2
2 2

rro estndar del estimador del total esta dado por: * El e r
( ) ( ) 33 . 127 75 . 16214 t

V t

EE = = =
* El coeficiente de variacin para el estimador del total
Alvaro Trejos Facultad de Ingeniera Industrial UTP 42
43
( )
0985 . 0
5 . 1291
33 . 127

) ( = =

=
t
t EE
t CV
Esto demuestra que el coeficiente de variacin del estimador del total es igual al coeficiente de
variacin del estimador de la media:
( ) ( ) X CV t

CV =

DEMOSTRACIN:
( )
( )
( ) X CV
n
S
N
n
1
n
S
N
n
1 N
n
S
N
n
1 N
t

EE
t

CV
2 2 2
2
=


= =
X X N t


En este
probab la materia.
ESTIMACIN PARA UNA PROPORCIN

ejemplo queremos estimar la proporcin de estudiantes que piensan cursar muestreo
ilistico. Definimos X
2
= 1 si piensa cursar, y X
2
= 0 sino piensa cursar
34 . 0
50
17
N
Xi
P
n
1 i
= = =

=
Definimos q como el complemento q = 1 p = 1 0.34 = 0. 66
Estimaremos p con el estads

tico

= = =
6
=
2 Xi

Como
1 i
33 . 0
6 n
P
Y P

= es un estimador insesgado de P.
La cuasi varianza poblacional ser la siguiente:
( )
( )
1 1
1
1 1
2
1
2
1
2 2 2
2 2
2
1 2

+
=

+
=

N
NPQ
N
P NP
N
NP NP
N
NP NP NP
N
NP Yi P Yi
N
P Yi
S
i
Esto se debe a que:

N

NP Yi Yi
N
1 i
N
1 i
2
= =

= =

2
N
1 i
NP 2 PNP 2 Yi P 2 = =

=

Alvaro Trejos Facultad de Ingeniera Industrial UTP 43
44

( )
PQ
N
S N
=

2
1

2
1
S
N
NPQ
=

(1)
De la teora de la aleatorizacin se tiene que:
( ) ( )
n
PQ
N
n N
PQ
N
N
Nn
n N
n
PQ
N
N
N
n
n
S
N
n
P V Y V
1 1
) (
1
) 1 ( ) 1 (

= = =
Reemplazando S
2
de ( 1 ):
( ) 033 . 0
6
66 . 0 * 34 . 0
*
49
6 50
1

=
n
PQ
N
n N
P V
Para la muestra, su cuasivarianza se calcula de la siguiente manera:
( )
(1 P

1 n
n
1 n
P

Yi
S
2
N
1 i 2

) q p
1 n
P

= as que
n
( )
1
) 1 (
1
) 1 ( ) 1 (
2

= =
n
pq
N
n
n
pq
n
n
N
n
n
S
N
n
Y V
( )
1 n
pq
N
n
1 P

=
( ) ( ) 0384 . 0 =
5
67 . 0 * 33 . 0
* 12 . 0 1 P

=
sta varianza del estimador es una estimacin de la cuasi varianza poblacional conocidos p y q, p
= 0
E
.34 y q = 0.66
( ) ( ) 196 . 0 0384 . 0 P

= =
APLICACIONES DEL MUESTREO
P

EE =


a El gasto diario de una familia en una determinada poblacin es de con una
nar una mue toria simple de 100 familias obtenga en ellas un gasto
medio mayor o igual que 5.8. R/ En este caso conocemos la informacin poblacional
(m pide la probabilidad de un suceso aleatorio
refe la media. La distribucin de la variable
aleatoria
) 5 . 6 =
desviacin tpica de 2 . 6 = (miles de pesos) cual es la probabilidad de que al
seleccio stra alea
edia y desviacin tpica o estndar) y se nos
rente a la distribucin de probabilidad de
Xes normal con media y varianza n
2
. Lo anterior por el teorema central
Alvaro Trejos Facultad de Ingeniera Industrial UTP 44
45
del limite y debido a que la fraccin por poblacin finita N n es probablemente muy
pequea, menor a 0.05.
871 . 0 01292 1 ) 13 . 1 Z ( P 1 ) 13 . 1 Z ( P )
100
2 . 6
5 . 6 8 . 5
Z ( P ) 8 . 5 X ( P
)
100
2 . 6
, 5 . 6 ( N )
n
, ( N X
= = = =



La probabilidad de que una muestra de tamao 100 tenga un gasto diario en miles de pesos
mayor a 5.8 es de 0.871

X
5.8 6.5
Calculemos la probabilidad de que el gasto medio de una familia exceda de 5.8

5438 . 0 4562 . 0 1 ) 112 . 0 Z ( P 1 ) 112 . 0 Z ( P ) 8 . 5 X ( P
112 . 0
2 . 6
5 . 6 8 . 5 X
Z
= > >
=


=
= = <

X
5.8 6.5

Esta probabilidad es muy inferior a la anterior, la probabilidad con la media es mayor porque la
n
2

media muestral es un estimador mas preciso, su variabilidad es .



b) La distribucin de los ingresos mensuales de una poblacin de 6400 familias tiene una
media de 365000 = con una desviacin tpica 72000 = , si se extrae una muestra de
tamao 400 sin reemplazo, hallar la esperanza y la desviacin tpica de la media
muestral.
Alvaro Trejos Facultad de Ingeniera Industrial UTP 45
46
R/
Por ser la media un estimador insesgado 365000
X
= =
Como se conoce la desviacin tpica poblacional y el porcentaje de muestreo es mayor a
0.05 ( 062 . 0
6400
400
= ) la desviacin tpica del estimador es
3485
1 6400
400 6400
20
72000
1 N
n N
n
X
=


=
En los clculos anteriores hemos utilizado el hecho de que el muestreo es sin reemplazo. Lo que
ocurre en encuestas de tipo s tien sentido preguntar dos veces a
na misma familia.
o la media y desviacin tpica del estimador
ocioeconmicas puesto que no en
u
Si el muestreo hubiese sido con reemplaz es X
R/
= =
X
) X ( E
3600
400
72000

n
X
= = =
ste valor es un 3.3% superior al que habamos obtenido

E 03299 . 0
3485
) 3485 3600 (
=


La e
hace m
la pobl
En los nteados anteriorm
dif rencia de la desviacin tpica del estimador de la media bajo ambos tipos de muestreo se
enos evidente; cuando el tamao de la muestra es aproximadamente un 5% del tamao de
acin no tiene mucho inters efectuar la correccin para la poblacin finita.
problemas pla ente se conocen los parmetros y por lo que carece
as o supuestos, basadas en la experiencia de funcionamiento de un dete
de sentido seleccionar una muestra con el fin de hacer algn tipo de inferencia.
En los problemas de control de calidad ellos suponen que la caracterstica poblacional son
conocid rminado proceso y
estam s interesados en que la calidad de dicho proceso no se deteriore, lo que ocurrira si varan
las caractersticas de su distribucin de probabilidad. El siguiente ejemplo presenta una situacin
de control de calidad.
c) Una planta empaquetadora de detergentes envasa cada paquete con un promedio de
2000gr y una desviacin tpica de 250gr. Para controlar la calidad del empaquetado se

utilizado si no se quiere detener el proceso mas de uno cada 10 das?
o
toman cada da 64 envases, si el peso medio es inferior a cierto valor critico se reajusta el
proceso de envasado, lo cual es un procedimiento costoso. Cul debe ser el valor critico
Alvaro Trejos Facultad de Ingeniera Industrial UTP 46
47
R/
tien
Por el teorema central del limite o por el supuesto de que el llenado de envase es normal se
e que X sigue una distribucin normal.
X
? 2000

25 . 31
64
250
n
2000 ) X ( E
X
X
= =

=
= = =

Suponem
Z ( P
1

os que la produccin es grande
28 . 1 Z
10 . 0 ) Z
1
=
=

Z
-1.28 0

25 . 31
2000 X
Z
X
=



n
Z =

2000 ) 28 . 1 ( 25 . 31 X
2000 X
28 . + =

=
25 . 31
1

X 1960 =
10 . 0 ) 1960 X ( P ) 28 . 1 Z ( P = =
Decidimos detener el proceso de llenado si el peso medio de los 64 envases medidos es inferior a
196 ero de envases es ilimitado en relacin con el
tam oblacin relacionado con
0 en el ejercicio anterior se supuso que el num
ao de muestra, si este no fuera el caso, es decir, si el tamao de la p
Alvaro Trejos Facultad de Ingeniera Industrial UTP 47
48
64 no es muy grande, habra que aplicar el ajuste por poblacin finita. Supongamos que al da se
envasan 400 recipientes en tal caso la desviacin estandar del estimador es
68 , 28 918 0 25 31
1 400 64
X
l valor critico ser
64 400 250
= = =
X
) . ( .
Y e
29 . 1963
68 . 28
2000 X
28 =

= . 1

X 25 . 31
X
=
1960 2000
sin correccin por poblacin finita
X 68 . 28
X
=
1963 2000
con correccin por poblacin finita


) Se sabe que el 60% de los alumnos de la facultad de Ingeniera Industrial de la
universidad tecn tiene un promedio de
calificacin superior a 3, si tomamos una muestra aleatoria de tamao 100 cual es la
d
olgica de Pereira en la materia de regresin
probabilidad de que de esa muestra, la mitad de los alumnos o ms tengan calificacin
inferior a 3.
049 . 0
100
4 . 0 * 6 . 0
n
pq
60 . 0 P ) P

( E
P

= = =
= =

Esto es bajo la suposicin que el tamao de muestra es pequeo comparado con el de la
poblacin.
Alvaro Trejos Facultad de Ingeniera Industrial UTP 48
49
9793 . 0 0207 . 0 1 ) 04 . 2 Z ( P 1 = = =
) 04 . 2 Z ( P ) 50 . 0 P

( P
04 . 2
049 . 0
60 . 0 50 . 0 P P

Z
P
= >
=

=

Bajo es supuesto que la relacin (n/N) 0.05 se aplica la correccin por poblacin finita para
este ejemplo se toma N=800
1 800
100 800
100
4 . 0 * 6 . 0
1 N
n N
n
pq
P

=
043 . 0
P

=
Se ha reemplazado N = 800
990 . 0 ) 33 . 2 Z ( P 1 ) 33 . 2 Z ( P
0 . 0 50 . 0
=

043 . 0
NOTA: En el ejercicio anterior conocimos pq, de no conocerlos ab
6
Z ( P ) 50 . 0 P

( P = = =
h ra que estimarlos de la
muestra, y el nuevo error estndar o tpico estimador seria
N
n N
1 n
pq



INTERVALOS DE CONFIANZA

En las encuestas por m estr liza una estimacin puntual del parmetro (media,
proporcin, total), tambin se hace necesario realizar una estimacin por intervalos.
Dependiendo del tamao de muestra, de la distribucin de la poblacin, un intervalo de confianza
puede tomar las siguientes formas:
Chebychef: si se desconoce la distribucin de la poblacin, y el tamao de muestra y
poblacin son relativamente pequeos, un intervalo de confianza tiene la siguiente
estructura
u eo adems se rea
2
K
1
1 ) kS X kS X ( P +
para k = 2 se tiene
75 . 0 ) S 2 X S 2 X ( P +
TAREA: Comprobar Chebychef en las 70 muestras
Alvaro Trejos Facultad de Ingeniera Industrial UTP 49
50
( ) 75 . 0 k k P

Aplicacin del teorema central del limite: si n > 30 y el muestreo se hace con repeticin
blaci es g nde el estadstico o el tamao de po n ra X se distribuye normal con media y
desviacin estndar
n

Un intervalo de confianza se representa por


n
Z x

2
+ , esta expresin tambin puede
aplicarse a el caso que n sea pequeo y la poblacin sea normal con varianza conocida


-2 -1 1 2 3

n intervalo de confianza del 95% es:
-3
U
n
2 X
n
Z X
2
=


si desconocemos l

a varianza y el tamao de muestra es pequeo el lugar de la normal se trabaja
on la distribucin de t de student c
n
S
t X
2


1 n
) X X (
S
2
1

=



Hajek (1960) demuestra un teorema de limite central para el muestreo aleatorio simple sin
reemplazo. En trminos prcticos, el teorema de Hajek dice que si se cumplen ciertas
condiciones tcnicas y si n, N, N n son suficientemente grandes entonces la distribucin
muestral de A
n
N
S
)
n
1 (
X
2


es aproximadamente normal con media 0 y desviacin
estndar 1 y el intervalo de confianza quedara de la siguiente manera:
Alvaro Trejos Facultad de Ingeniera Industrial UTP 50
51



n
S
N
n
1 Z X ;
n
S
N
n
1 Z X
2
2
2
2

)) X ( EE Z X ); X ( EE Z X (
2 2

+

-Z 0 Z
-Z Z Z

le sin reemplazo, el 95% de las muestras posibles que pueden
elegirse y al construir un intervalo sobre ellas el 95% de ellas contendr la verdadera media.

Como u tra es pequea y utilizamos la estimacin de la varianza y no la poblacional los
intervalos sern los siguientes:
1. Para la edad promedio
en el muestreo aleatorio simp
Ejemplo: bajo el supuesto que la edad y el curso de muestreo por parte de los estudiantes son
variables distribuidas normal, construir intervalo de un 95% de confianza para la media, el
total y la proporcin.
la m es

+

) X ( EE t X ), X ( EE t X
2

2
; 83 . 25 X = 5706 . 2 t t
975 . 0
= =


2
5467 . 2 ) X ( EE =
(25.83 2.5467*2.5706 , 25.83 + 2.5467*2.5706)
9.28 LS = 32.38
2. Para el total de las edades
LI = 1
(19.28 , 32.38)
la probabilidad de que la media se encuentre en el intervalo (19.28 , 32.38) es de 0.95


Alvaro Trejos Facultad de Ingeniera Industrial UTP 51
52

+ ) ( ), ( (
2 2
t E t t t EE t t


EE(t)=127.33 5 . 1291 t = 5706 . 2
2
=

t
(1291.5 2.5706*127.33 , 1291.5 + 2.5706*127.33 )
(964.18 , 1618.8)
la probabilidad de que la suma total de las edades se halle en el intervalo
(964.18 , 1618.8) es de 0.95

3. Para la proporcin

+ )

);

2 2
P EE t P P EE t P


33 . 0 P

= ; 5706 . 2 t
2
=

; 196 . 0 ) P

( EE =
(0.33 2.5706*0.196 , 0.33 + 2.5706*0.196 )
(-0.17 , 0.833) (0, 0.833) no puede darse una proporcin negativa

La probabilidad de la proporcin de estudiantes que cursa muestreo se halla en el intervalo (0,
0.833) con una probabilidad de 0.95.
Ejemplo: el gobierno de USA realiza un censo de agricultura cada 5 aos; para ello rene
datos de todas las granjas de los 50 estados. El censo proporciona informacin sobre el
uestra aleatoria de tamao 300, la cual arrojo una informacin sobre las
ventas promedio
numero de granjas, los acres dedicados al cultivo, el tamao de cada granja, los resultados de
varias cosechas, esto se hace para cada uno de los 3078 condados.
Se extrajo una m
del ultimo ao, 297897 X = , S = 344551.9 ,
Construir un intervalo de confianza del 95% para las ventas promedio.
ara const ste intervalo la muestra es suficientemente grande como para aplicar el
teorema del limite central de Hajek.
P ruir e
Distribucin normal Estados

+ ) ( ); (
2 2
X EE Z X X EE Z X


Alvaro Trejos Facultad de Ingeniera Industrial UTP 52
53
96 . 1 Z
2
=

, 297897 X =
43 . 18898
3078
300
1 ) (
2
=

=
S
n
X EE
( 297897 1.96(18898.43) ; 297897 + 1.96(18898.43))
334938)
la probabilidad de que las ventas de las cosechas se encuentren en el intervalo (260856 ,
334938) es de 0.95.

CALCULO DEL TAMAO DE MUESTRA
En investigar en un formulario,
para se debe tomar una caracterstica de
s de muestra, una por cada variable de inters y despus
tomar el tamao de muestra mas grande.
Para el calculo del tamao de muestra debem acin por intervalo vista
anteriormente.




TAMAO DE MUESTRA PARA LA MEDIA
media poblacional esta dada por:
(260856 ,

toda investigacin por muestreo existen varias caractersticas a
decidir sobre el tamao de muestra en la investigacin
inters entre todas las que propone el formulario. Si existen varias caractersticas de inters,
podra pensarse en calcular varios tamao
os tomar en cuenta la estim

Un intervalo de confianza para la

2 2

N
n
n
S
Z X X EE Z X 1 ) (
2



Alvaro Trejos Facultad de Ingeniera Industrial UTP 53


54
X
( ) X EE Z X
2

( ) X EE Z X
2

+
d es la distancia de la verdadera media al limite superior o inferior del intervalo de confianza.
Esta distancia depende del nivel de confianza y del error estndar de X .
) (
2
X EE Z d

=

=
N n
Z d 1
n S
2

=
n
Z d
2 2
N
1
n S
2
N
S Z
n
S
Z d
2 2 2
2 2
=
n
S Z
N
S Z
d
2 2 2 2
2
= +

N
S Z
d
S Z
2 2
2
2 2
+
= dividiendo por d
2
n
2
2 2
2
S Z
d
n =
2 2
S Z
1+
Nd

2
2 2
0
d
S Z
n =
N
n
n
n
0
0
1+
=
el tamao de poblacin si el tamao de muestra es pequeo comparado con 05 . 0
0

N
n
o el
ta la poblaci es infinito, el tamao de la muestra se calculara de la siguiente manera: mao de n
2
2 2
d
S Z
n =
Alvaro Trejos Facultad de Ingeniera Industrial UTP 54
55
expresin que no depende de N ya que
n
S
Z d
2
= o
n
S
Z d
2
2 2
= , en caso en que la relacin
05 . 0 >
N
n
, el tamao de muestra se calcula de la siguiente manera:

N
n
n
n
0
0
1+
=
2
2 2
0
d
S Z
n =
De la formula anterior puede sacarse las siguientes conclusiones, todas ellas muy lgicas:
El tamao de muestra es proporcional al nivel de confianza y a la variabilidad de la
caracterstica.
e uestra es inversamente proporcional al error.

Ejemplo 1: Con el objetivo de estimar el precio medio del pollo en un determinado mes, un
ingeniero industrial necesita conocer cuantos puntos de venta debe visitar. Supongamos que
deseamos que el error de estimacin no sea mayor a 50 pesos y la desviacin tpica del precio del
pollo el m ere que nuestra estimacin tenga una confianza del
90%. Hallar el numero de puntos de venta que nuestro encuestador debe visitar.
El tamao d m
es anterior es de 120 pesos, se qui
58 . 15
50 d
120 645 . 1
2
2 2
2
2 2
0
= = =
S Z
n
ustrial debe enviar a su encuestador a 16 puntos de venta.
e

El ingeniero ind
Cuantos puntos de venta debe visitar si se quiere alcanzar una confianza del 95% y 99%
respectivam nte.

23 13 . 22
120 96 . 1
2
2 2
2
2 2
0
= = =
S Z
n
50 d
39 24 . 38
120 58 . 2
2 2 2 2
= = =
S Z
n
50
2 2
0
d
Como puede observarse el numero de puntos de venta que se visitaran aumentan con el nivel de
confianza que se quiere lograr. Si el mximo error admisible fue de 30 pesos, cuantos puntos de
venta sern necesarios visitar a un 90% de confianza.

Alvaro Trejos Facultad de Ingeniera Industrial UTP 55
56
44 29 . 43
30
120
2

645 . 1
2
2
2
2 2
0
= = =
d
S Z
n
Con un error de 30 pesos y una confianza del 95% y 99% el nmero de puntos de venta sern.


62 4 . 61
30
120 96 . 1
2
2 2
2
2 2
0
= = =
d
S Z
n
107
30
120
2
=
58 . 2
2
2
2
2 2
0
= =
d
S Z
n

Supongamos que no se quiere cometer un error mayor a 30 pesos y una confianza del 90% se
visitan 44 puntos de venta dando como resultado el precio medio del pollo es de 3250 pesos por
kilogramo, con una desviacin tpica de 142 pesos por kilogramo, los resultados anteriores hacen
que el error de estimacin sea:

2
2 2
0
d
S Z
n =
o
n
S Z
d
2 2
2
=
o
n
ZS
d =

d = = 21 . 32
142 *

44
645 . 1
es decir el error excede a los 30 pesos que nos habamos fijado como limite. Lo anterior es
debido a que la desviacin estndar paso de 120 a 142 pesos. Para lograr este error debemos de
aumentar el tamao de la muestra.
o
n
ZS
d =
o
n
142 * 645 . 1
30 =
61 6 . 60
142 * 645 . 1
2 2
0
= = n
30
2
para lograr un error de 30 pesos con una confianza de 90% se debe visitar como mnimo 61
puntos de venta.
En los prob anter res no se ha tenido en cuenta la correccin por poblacin finita. lemas io
Alvaro Trejos Facultad de Ingeniera Industrial UTP 56
57
N
n
0
1+
tamao de muestra.
n
n
0
= ya que se supone que el numero de puntos de venta es grande comparado con el
05 . 0
N
n

05 . 0 >
N
n
En el siguiente problema se ilustra una solucin en caso de que
Ejemplo 2: se quiere estimar el precio medio de kilogramos de pollo con un mximo error de 50
pesos y una desviacin tpica de 120 pesos, con una confianza del 90%. El numero total de
puntos de venta es de 100.
2
2 2
0
d
n = =
S Z
2
2 2
50
= 15.58 16
120 645 . 1
N
n
n
n
0
0
1+
= = 14 79 . 13
100
16
1
16
=
+





TAMAO DE LA MUESTRA CUANDO SE DESEA CONTROLAR EL ERROR
MXIMO RELATIVO
l interes del proceso de estimacin esta centrado en controlar el error mximo



No siempre e
absoluto d donde = x d . En muchos casos es mas conveniente tratar de controlar el error
mximo relativo, el cual llamaremos y se puede interpretar de la siguiente manera:

d x
=

=
= d
Alvaro Trejos Facultad de Ingeniera Industrial UTP 57
58

X X
donde representa el porcentaje del promedio en el que se esta dispuesto a equivocarse
El tamao de muestra cuando se desea controlar el error mximo relativo se calcula de la
siguiente manera:
( )
2 2
0
d
n = = remplazando
2 2 2 2
S Z S Z
por su estimador x se tiene:
( )
2
0

n = y
2 2
S Z
N
n
n
0
0
= si
n
1+
05 . 0
N
n

Ejemplo : para estimar la edad promedio de los estudiantes se tomo una muestra piloto de 6
estudiantes con los siguientes resultados: 83 . 25 = X y =44.16, para una confianza del 90 y
del 8%?
2
S
95%, Que tamao de muestra se debe tomar si se desea un error mximo
=
2
d
n
( )
=
0
2 2
S Z
985 . 27
83 . 25 * 08 . 0
2
=
16 . 44 * 645 .
2

1
N
0
1+
n
n
0
= = n 18 944 . 17
50
1+
para un 95%
99 . 29
=
99 . 27
= =
2
2 2
0
d
S Z
n
( )
729 . 39
83 . 25 * 08 . 0
16 . 44 * 96 . 1
2
2
=
N
n
n
23 138 . 22
50
729 . 39
1
729 . 39
=
+

0
0
1+
= = n
En el ejercicio anterior para t estra se presentaron varios supuestos:
La edad de los estud
Los tamaos n, N, N
el calculo del amao de mu
iantes presenta una distribucin normal.
-n son suficientemente grandes.
Alvaro Trejos Facultad de Ingeniera Industrial UTP 58
59
Al menos el ultimo supuest e tamao de muestra se
debe aplicar el criterio de Chebychef as:
o no es cierto por lo tanto para el calculo d
( ) = + 1 2 2 S x S x P
Para k=2
= =
2
0
d
n
( )
2 2
S Z
38 . 41
83 . 25 * 08 . 0
2
=
16 . 44 * 4
N
n
n
n
0
1+
= =
0
23 64 . 22
50
38 . 41
1
38 . 41
=
+
n=23
para garantizar una confianza como mnimo del 75% y un error del 8% se debe tomar una
muestra aleatoria de tamao

Lo anterior es debido a que
23.
( ) 75 . 0
1
=
2
2
1 2 2 + S X S X P
Para 3 desviaciones estndar se tiene
( ) 889 . 0
3
1
1 3 3
2
= + S X S X P
El tamao de muestra para lograr una confianza del 88.9% ser
= =
2
2 2
0
d
S Z
n
( )
077 . 93
16 . 44 * 9
2
=
83 . 25 * 08 . 0
N
n
n
n
0
0
1+
= = 33 53 . 32
50
077 . 93
1
077 . 93
=
+
n=33

TAMAO DE MUESTRA PARA EL TOTAL

lgunos libros de muestreo como Scheaffer y Mendenhall, del grupo editorial Iberoamericana, se A
dan y aplican formulas cuando se quiere hacer estimativos de totales, sin embargo, carecen de
sentido, ya que el valor de n es exactamente igual al obtenido para estimativos de promedio.
A continuacin se demostrara esta afirmacin.
Alvaro Trejos Facultad de Ingeniera Industrial UTP 59
60
Supongamos que se quiere estimar el total de una poblacin. Para ello el intervalo de confianza y
el error de estimacin presentan la siguiente forma.
X
( ) t EE Z t

2

T ( ) t EE Z t

2

+

( )
n
S
N
n
t
2
1

= = N EE
2
n
S
N
n
N 1


2
) = NEE( t

X )
= Z
EE(
Llamaremos
( ) t d
n N

S n
N
2
1


( ) X d
Para el calc estra del total se tiene
= Z
2

ulo del tamao de mu
( ) t d
2
N
2
n N

S n
2
1


2 2
2 2 2
NS Z ( ) t
2
= d
n
S N Z

2
+ = ( ) t
2 2
NS Z
n
S N Z
2 2 2

( )
d
2 2
Z
n =
2
2 2 2
Z d
S N
+

emp zando
NS t
Re la se tiene ( ) t d
2

2 2
2
2 2
2 2 2
1 NS Z
n
S
N
n
N Z
S N Z
n
+


=
Alvaro Trejos Facultad de Ingeniera Industrial UTP 60
61


S Z S n
Z
2
1


=
N n N
S Z
N
N
n
2 2 2
2
2
2

2
( )
N
S Z
X d
S Z
n
2 2
2
2 2
+
=
( ) X d
2
Si dividimos entre
( )
( ) X Nd
S Z
2
1+
X d
S Z
2 2
2
2 2
n =
2
2 2
d
S
se tiene que
0
Z
n =
N
n
0
0

n
n
1+
=
Estas dos ultimas ecuaciones corresponden al tam o de muestra para la media.
Conclusin: el tamao el tamao de muestra
para la media.
de a estimar la media a travs del
a
de muestra para estimar un total equivale a calcular
Una vez elegido el tamao de muestra para la media se proce
estadstico
n
Xi
X
i

n
=
n
Xi
n
=
1
y la estimacin del total se estimara con el estadstico N NX t = =
i

=
odo similar.
1


TAMAO DE MUESTRA PARA PROPORCIONES

Para hallar el tamao de muestra para una proporcin se analiza de m
X
Alvaro Trejos Facultad de Ingeniera Industrial UTP 61
62
( ) P EE Z P


2

P ( ) P EE Z P

+


2

( )
1

pq


N
n N
P d = EE
1

2

n
p n
d


N

N
= Z
q
2 2
Z d =
1
p
N
n N

1
1

q
N
n
n
p
d
2
=
Z
2
=
( )N n
pqn Z
n
pq
1 1
2


Z
2

=
2
d
( ) ( )N 1 n
Z
n N
NZ
2


n N = Z
2
Z pq Z d d
2 2 2

)-
) = +
pqn pq
2
1
=
2
( d ( )) pq
2
- NZ pqn 1
Nn
2
N + N n = pq
n ( N d
2
pq Z
2
N = d
2
pq NZ
2
+
( N d
2
pq Z
2
p Z
2
N
2
q N n + d
pq Z
2
+ N
N p Z
n
2
2 2

d
N
=
d q +

N
N
NpqZ
N
N p Z
n
2
2 2
+
=

+
pqZ
d
pq Z
2
2
2 2

N d q + + d
=
N
d
2
N
= n
N
pqZ
2
d
2
d + pq
2
+
diendo d
2
Z
2
divi por
N d
Z
pq
n
2
2
2
pq

d
Z
2
1+
1 +
= 1
2
2
0
n + =
d
p Z

q
2
2
Z
d
pq
= 1
0
n
N
n
n
n
1
1+
0
0

=
N
n
n
0
1+

0
Alvaro Trejos Facultad de Ingeniera Industrial UTP 62
63
Para poblaciones infinitas o 05 . 0
N
n
el tam o de m s para p porciones a ue tra ro es
2
2
d
=
pq
n ra po nes fi s o
Z
y pa blacio nita 05 . 0 >
N
n

N
n
n
2
2
0
=
d
pq
n
Z
n =
0
0
1+

En el tama e muestra para proporciones, n toma el m o valor cuando p .
E lo on el jetivo realizar a correcta compra de gasolina, una empresa
distribuidora de gasolina quiere estimar con n 90% e nfianz l porcent e sus clientes
que utilizan gasolina sin plomo.
Esta estim dese izarla error no ayor al 0.05%

= q o d xim 5 . 0 =
jemp 1: C ob de un
u d co a e aje d
acin a real con m
2
2
d
=
pq
n
c P e cono e susti e por 0.5
Z

uando s des cido s tuy
2
05 .
2
0
5 . 0 *
n 0.60
Se deberan encuestar 271 clientes. Si la em iento de que la proporcin
de clientes que dema asolin plomo es del 30%, l seria l nuevo ta de muestra?
5 . 0 * 645 . 1
= = 27
presa tuviera el convencim
nda g a sin cu e mao
2
2
d
=
pq
n
Z
= 228
0
7 . 0 * 645 .
2
=

E lo 2 a el e lo ante , supong os que nos afirma ue el tot vehculos del
m pio 3500 l seri nuevo ta o de uestra?
05 .
2
3 . 0 * 1
jemp : Par jemp rior am n q al de
unici es de , cu a el ma m
N
n
n
n
0
0
2
2
0
d
pq
n
Z
= y =
1+
2 = 28
. 0 * 3 . 645 .
2
n
05 . 0
7 0 *
2
1
0
=
Alvaro Trejos Facultad de Ingeniera Industrial UTP 63
64
=
+ 1
=
N
n
n
0
0
n
21 5 05 . 14
350
22
228
+

Calculo El Tamao De Muestra Para Estimar Una Proporcin Cuando Se Conoce El Error
C tic
El tamao de muest a estim una prop cin cuando se conoce el error relativo esta dada
por la siguiente expresin:
2
8
=
0
1
uadr o.
ra par ar or
( ) p p
pq
d
pq
n
2
2
2
2


si
q Z
=
Z
=
Z
=
2

2
0

N
n
0
n
0
n
1
0 . 0 =
E lo 3 a empresa fabric 00 artc s hom os al d un porce de los cuales
resulta defectuoso. De muestr realizad anter m te, se noce qu porcentaje de
e tos lta de sos es l 7.5%, eremo a r el ta o de mu que debemos
to diar nte con el objeto de estimar el porcentaje de elementos defectuosos, si se pretende
tener un error mxim la estim in de 1% se tra ja 90% confianza
N

n
5
+
jemp : Un a 24 ulo og ne a, ntaje
eos os ior en co e el
lemen resu fectuo de qu s h lla ma estra
mar iame
o en ac y ba al de .
07 . 1396
24
333
. 3337
3 333
*
* 45
0
0
2
2
2
2
=
00
43 . 7
1+
43
=
1+
075 . 0 01 . 0
=
925 . 0 6 . 1
0
=
= =
4 . 7
N
n
n
p
q
n


MUESTREO SISTEMTICO

En ocasiones el muestreo sistem como s to del AS cuand se dispone de
una lista de la poblacin o cuando este tiene un orden menos aleatorio.
Para explicar como funciona el M. sistemtico darem u jemplo
E lo 1 una cin d 360 fam s se elige una mu tra de ta 30 (muestra
obtenida aplicando el MAS), definimos k co la razn
n
Z

tico se utiliza su titu M o no


os n e .
jemp : de pobla e ilia es mao
mo k
N
n
= entonces k = 12
360
30
=
La poblacin es dividida en 30 subgrupos conglomerados de tamao 12

Alvaro Trejos Facultad de Ingeniera Industrial UTP 64
65
12
0 k 3k

se procede a elegir un nmero aleatorio entr y 12 p gamos que el nm legido es 0.4,
el cual se le denomina punto de arranque.
U z e cido to de nque se cia el c de se cin siste ca, el segundo
n o el ser y as s sivamente hasta comp ar los nmeros



004 064 124 18 4 304
016 076 136 196 256 316
028 088 148 208 268 328
040 100 160 220 280 340
052 112 172 232 292 352
E aso ue e nera diferente.
E o i fam el tama de mu tra 30 s un intervalo
=
12 12

0.4 2k 30k
e 1 , su on ero e
na ve stable el pun arra ini pro eso lec mti
mer egido el 16 uce let 30 .
4 24

n el c de q el valor d k no sea un nmero entero, se procede de ma
jemplo 2: siend la poblac n de 355 ilias y o es e tendr
igual a k 12 83 . 11 =
30
N
Una vez calculado el valor del intervalo, deber redondearse, tomando s re el nmero
in atam sup por m pequea e sea a ccin. Mediante alculadora se
selecciona un nmero entre 001 y 355. Supongamos que ero elegido fue el 208, este valor
es el nmero de arranque y se va acumulando da 12 m os.

208 268 328 033 093 153
220 280 240 045 105 165
232 292 352 057 117 177
244 304 009 069 129 189
256 316 021 081 141 201
355
=
n
iemp
medi ente erior s qu l fra la c
el nm
ca n er
Alvaro Trejos Facultad de Ingeniera Industrial UTP 65
66
E ceso calcular el intervalo de seleccin sin importar si
e nm ente si pre a decim s, en este ultimo caso se aproxima al nmero
in atam sup luego seleccio aleat a nte (a zar) un n
intervalo 1 k, con el fin de obt er un pun de ar q el cua e le va ac lando el valor
del intervalo, es decir se procede de la mism manera que en el ejemplo 1. Una vez obtenida la
m a si ar la m
La estimac on el treo si mtico son insesgadas y su varianza es menor que la del MAS
en algunas ocasiones. El muestreo sistemtico es preciso cuando las unidades dentro de una
m mu son h gneas s impreciso cuando son homogneas.

ESTR ALEA RIO T ATIFI ADO

Es un tipo de muestreo que perm una sele n ma f nte qu l muestreo aleatorio simple.
En el M.A.E la poblacin se divide en grupos relativamente hom
la caracterstica a investigar al interior en ada g po s hom nea y e una relativa
heterogeneidad de la caracterstica a investigar entre los grupos.
Al dividir la poblacin en subgrupos o estratos, estos deben ser mutuamente excluyentes (un
e to nece a un grupo strato y lectiv ente exhaustivos (se estn
utilizando todas las categoras posibles y por lo tanto un elem to siempre pertenece a una
categora)
En este tipo de muestreo la caracterstica que sirve para clasificar los estratos o subgrupos esta
m laci a con racter a a inves ar.

Ventajas del muestreo aleatorio estratificado

mayor precisin en las estim iones o arar este muestreo con el M.A.S
er in cin d ada por po

Pasos para la aplicacin del Muestreo Aleatorio Estratificado M.A.E

idir l lacin ubgrupo estrat i rnamente homogn
l pro ms utilizado en la practica es el de
s un ero ro o sent ale
medi ente erior, se na ori me l a mero dentro del
en to ran ue l s umu
a
uestr stemtica se procede a estim edia, proporcin o total de la poblacin.
in c mues ste
isma estra etero y e
MU EO TO ES R C
ite cci s e icie e e
ogneos, esto quiere decir, que
c ru e og xiste
lemen perte solo sub o e ) co am
en
uy re onad la ca stic tig
Una ac al c mp
Ten forma etall gru
Div a pob en s s o os nte eos
Alvaro Trejos Facultad de Ingeniera Industrial UTP 66
67
Calcular mar la dia y varianza para cada subgrupo o estrato
cular ao de muestra co a form a e plan remos posteriormente
gir en subgru las muestras de acuerdo a los siguientes criterios:



N n el M

N ao del estrato h
n ao de la muestra el estr
N ao de poblacin N= N
1
+

+ ....... N
h
n ao de la muestra n = n
1
+
h
o esti me
Cal el tam n l ul qu tea
Ele cada po
Asignacin igual
Asignacin proporcional
Asignacin optima
otaci para .A.E
h
Tam
h
Tam en ato h
Tam N
2
Tam n
2
+ .........n
h
ih

h
N
X
ia en trato h
)

= Med el es
(
h
N
h
2

ianza e estrato
i
h
=
2
x

Var n el h
h
ih
n
x
x

= Media esti a en el e ato h mad str
( )
h
h
x
S
2
ianza e ada en e strato

Se denomina estratificada al proceso por el que se asigna, con ciertos criterios, a cada unidad X
i
a
una de las sub-poblaciones que llamaremos estratos. Estos criterios suelen venir definidos por los
valores de determinada variable llamadas variables de estratificacin. Por ejem
Si se quiere estudiar el presupuesto, cantidad e rmeros, psiclogos de los hospitales,
se puede utilizar el tipo de hospital como variable que permite form s estratos (de
pri ivel, do niv tercer ni )
Se quiere realizar una investigacin de mercados unicipio de Pereira, con el fin de
det pradores y el precio que estn dispuestos a pagar por un
ih
x
h
=

2
Var stim l e h
n
plo:
de nfe
ar lo
mer n segun el, vel
en el m
erminar la cantidad de com

Alvaro Trejos Facultad de Ingeniera Industrial UTP 67
68
vehculo, la variable relacionada con el precio y la cantidad es el estrato socio-econmico
(estratos1,2,3,4,5,6)
Para realizar estadsticos relacionados con el sector educativo puede utilizarse la variable
de estratificacin. El nivel de enseanza prima , undar bachiller

ESTR ALEA RIO T ATIFICADO
ASIGNACIN IGUAL
Este mtodo implica que los tam s mustrales sean iguales.
n n
2
= n
inar el tamao de la muestr onsid m la est ificacin poblacin de
355 familias.
n pri er lugar, se hace necesario identificar la caracterstica que se tendr en cuenta al
conform u a m niveles de
ingresos para los diferentes estratos:
Estrato I: Ingresos menores a 16.5 (m s $)
Estrato II: Ingresos entre 16.5 y 25.0 (miles $)
Estrato III: Ingresos superiores a 25.0 (miles $
Esta clasificacin de las 355 fam s por est s pue v e en la guiente ta
ESTRATO I FAMILIAS CON INGRESOS MENORES A $ 16,5 (miles de $)

ria sec ia, ato.
MU EO TO ES R
ao
1
=
3
Antes de determ a, c ere os rat de la
E m
ar gr los pos o estr tos, en este caso, los ingresos de las 355 fa ilias. Los
ile

)
ilia rato de ers si bla:

No. Ingresos Viv a Nume de pe n Trabajando Consumo No. iend ro rso as
orden familias (miles $) propia Total diario M F
de carne

001 003 9,2 no 3 1 2 1 802
002 004 10,5 si 3 1 2 1 765
003 005 10,8 no 3 2 1 1 735
004 010 8 no 3 1 2 1 892
005 012 7,8 si 5 3 2 1 772
006 021 8,3 no 2 1 1 1 813
007 022 16,3 si 1 1 0 1 753
008 024 7,9 si 2 0 2 1 680
009 025 7,9 si 3 1 2 1 620
010 028 11,4 si 4 1 3 1 832
011 032 9,6 si 2 1 1 1 782
012 033 7,9 no 7 3 4 2 620
013 034 12,6 no 2 0 2 1 630
014 035 10,4 no 1 1 0 1 580
Alvaro Trejos Facultad de Ingeniera Industrial UTP 68
69
015 036 14,5 no 2 1 1 2 580
016 037 8,3 si 3 1 2 1 520
017 038 16,2 si 2 1 1 2 570
018 039 8,6 no 1 0 1 1 510
019 040 9,5 si 3 1 2 1 520
020 041 9,5 no 3 1 2 1 620
021 042 10,6 no 3 1 2 1 730
022 044 7,6 no 4 2 2 1 520
023 047 8,4 si 3 1 2 1 610
024 048 8,4 si 4 2 2 1 610
025 049 13,5 no 1 1 0 1 590
026 051 12,5 si 2 1 1 1 750
027 054 10,5 si 3 2 1 1 780
028 057 9,5 si 3 1 2 1 870
029 059 8,4 si 3 1 2 1 630
030 060 8,6 no 1 0 1 1 520
031 061 10,2 si 3 1 2 2 540
032 062 13,4 no 2 1 1 1 600
033 065 7,9 si 3 2 1 1 600
034 068 13,5 no 3 2 1 1 770
035 069 7,6 no 2 1 1 1 530
036 070 7,9 no 1 0 1 1 550
037 071 12,6 no 3 1 2 1 580
038 072 9,5 si 2 1 1 1 520
039 073 9,8 no 3 2 1 1 560
040 075 13,5 si 6 2 4 1 600
041 077 7,8 no 3 2 1 1 570
042 078 8,2 no 2 2 0 1 520
043 082 9,6 no 2 1 1 1 834
044 085 11,2 si 3 1 2 1 716
045 089 15,6 si 3 2 1 1 812
046 090 13,2 no 6 2 4 2 714
047 092 9,6 no 4 1 3 1 775
048 094 8,9 si 2 1 1 1 720
049 095 10,1 no 2 1 1 1 630
050 096 10 no 2 0 2 2 650
051 097 11,2 si 3 1 2 1 610
052 099 15,6 no 4 3 1 1 720
053 101 9,6 no 2 1 1 1 520
054 102 8,4 no 3 1 2 1 560
055 104 10,2 no 1 1 0 1 530
056 108 9,5 si 2 1 1 1 578
057 111 11,1 si 3 1 2 1 620
058 113 8,6 no 3 2 1 1 518
059 114 8,4 si 4 2 2 2 514
060 116 9,8 si 2 1 1 1 516
061 118 11,3 si 4 1 3 1 620
062 124 8,4 no 2 1 1 1 785
063 127 13,5 no 2 2 0 1 638
Alvaro Trejos Facultad de Ingeniera Industrial UTP 69
70
064 129 13 si 2 1 1 1 527
065 131 7,8 no 2 1 1 1 516
066 132 12,6 si 3 2 1 1 520
067 136 10,2 si 2 1 1 1 816
068 137 13,4 si 3 1 2 1 515
069 138 11,6 si 2 1 1 1 516
070 140 8,7 no 3 1 2 2 532
071 142 10,4 si 2 1 1 1 635
0 1 520 72 143 10,6 no 2 0 2
073 149 8,9 si 3 2 1 1 520
074 151 no 2 1 1 1 522 10,6
075 153 si 2 1 1 1 516 8,6
076 159 12,6 no 3 1 2 1 516
077 160 8,8 si 2 1 1 1 508
078 162 11,4 si 2 1 1 1 600
079 163 9,6 no 3 2 1 1 520
0 720 80 168 16,4 no 5 2 3 2
081 171 716 11,3 no 4 2 2 1
082 173 8,6 no 2 1 1 1 510
083 174 8,8 no 3 1 2 2 512
084 176 4 0 4 1 520 8,8 no
085 177 10,1 no 2 1 1 1 606
086 179 16,3 si 3 2 1 1 605
087 182 10,3 si 2 1 1 1 563
088 186 8,8 no 3 1 2 1 510
089 187 11,6 si 2 1 1 1 580
090 188 11,5 si 1 0 1 1 584
091 191 13,4 si 2 1 1 1 620
092 196 9,5 no 3 1 2 1 515
093 197 9,7 no 2 1 1 1 508
094 198 9,9 si 3 1 2 1 506
095 212 16,2 no 2 2 0 1 536
096 215 11,3 si 6 2 4 1 700
097 216 11,4 si 2 1 1 1 520
098 217 9,6 si 5 2 3 1 506
099 218 9,3 no 2 1 1 1 516
100 223 16,3 no 5 4 1 2 650
101 6 2 4 2 666 224 15,2 no
102 225 14,1 si 1 2 1 672 3
103 226 ,6 si 1 13 1 0 1 712
104 227 9,9 si 2 2 0 1 520
105 228 10,4 no 3 1 2 1 542
106 229 9,5 si 4 1 3 1 548
1 i 2 1 0 07 230 9,8 s 1 1 56
108 231 o 3 1 8 9,6 n 2 1 55
1 i 4 2 2 09 232 10,2 s 2 1 56
1 o 4 1 0 10 239 8,5 n 3 1 52
1 i 2 1 2 11 2 2 4 14,5 s 1 1 63
112 245 ,2 no 4 1 600 16 3 2
Alvaro Trejos Facultad de Ingeniera Industrial UTP 70
71
113 246 11,3 no 3 1 1 586 4
114 247 ,5 si 2 1 10 1 1 584
115 251 11,2 si 3 2 1 1 521
116 252 10,8 si 4 1 3 2 716
1 o 3 1 0 17 254 8,6 n 2 1 52
1 i 3 1 1 18 259 9,8 s 2 1 60
1 o 2 1 3 19 262 11,4 n 1 1 61
1 o 2 1 6 20 268 10,5 n 1 1 51
1 o 3 2 0 21 269 11,3 n 1 1 51
122 270 ,6 no 4 2 520 12 2 1
123 275 10,5 no 1 3 1 512 4
124 276 ,1 no 4 1 10 3 1 520
125 277 10,1 si 3 0 3 1 506
126 280 12,8 no 1 1 0 1 516
1 i 3 1 8 27 281 9,6 s 2 1 50
1 o 5 2 4 28 284 16,2 n 3 2 68
1 i 5 2 3 6 29 287 16,3 s 2 65
1 i 4 1 8 30 288 14,2 s 3 2 67
1 o 3 2 9 31 292 7,9 n 1 1 50
132 295 13,6 no 3 0 3 1 805
133 300 9,9 si 3 1 2 1 512
134 301 10,8 no 4 2 2 1 523
135 11,1 si 3 2 1 1 564 306
136 307 14,6 si 3 2 1 1 508
137 311 12,9 no 3 2 1 1 543
138 316 11,1 no 2 2 0 1 500
139 319 10,9 no 3 1 2 1 576
140 12,6 3 1 2 1 580 320 no
141 321 9,5 si 2 1 1 1 520
142 322 9,8 no 3 2 1 1 560
143 324 13,5 si 6 2 4 1 600
144 2 1 1 570 326 7,8 no 3
145 327 8,2 no 2 2 0 1 520
146 331 9,6 no 2 1 1 1 834
147 334 16,2 si 3 1 2 1 716
148 1 1 1 516 338 9,8 si 2
149 si 3 2 1 1 582 339 15,5
150 no 6 2 4 1 714 340 13,2
151 341 12,3 no 3 2 1 1 605
152 1 3 1 580 342 11,5 si 4
153 1 1 1 520 343 9,8 no 2
154 345 13,2 no 3 1 2 1 510
155 347 9,6 no 2 1 1 1 516
156 348 10,2 si 3 2 1 1 605
157 349 11,1 no 2 0 2 1 520
158 350 8,5 no 4 2 2 1 532
159 351 9,6 no 2 1 1 1 526
160 352 12,4 no 2 2 0 1 580
161 354 9,3 no 1 1 0 1 524
Alvaro Trejos Facultad de Ingeniera Industrial UTP 71
72
162 355 14,5 si 2 1 1 1 530


ESTRATO II FAMILIAS CON INGRESOS ENTRE 16,5 Y 25,0 (Miles de $)

No. No. Ingresos Vivienda Numero de personas Trabajando Consumo
orden familias (miles $) propia Total M F diario
de carne

001 001 18,6 si 5 3 2 2 789
002 006 17 no 2 1 1 2 895
003 16,5 no 3 1 2 1 799 007
004 008 19,3 si 5 2 3 2 749
005 011 17,9 no 2 1 1 2 864
006 014 23,5 si 3 2 1 2 732
007 016 20,6 si 3 1 2 1 824
008 017 20 si 3 1 2 1 804
009 018 17,9 no 4 2 2 1 767
010 019 20,6 no 5 1 4 2 760
011 020 22,5 no 3 1 2 2 842
012 023 17,9 no 2 1 1 2 723
013 026 18,2 no 6 3 3 2 816
014 4 2 2 3 714 030 21 no
015 3 1 2 2 852 031 22,5 si
016 143 18,4 no 5 2 3 2 780
017 045 19,2 si 2 1 1 2 630
018 046 21,3 si 2 1 1 2 850
019 050 17,6 si 3 1 2 2 630
020 053 18,8 no 3 1 2 2 880
021 055 17,3 si 4 1 3 2 560
022 058 18,7 no 2 2 0 2 520
023 064 18,6 no 6 1 5 2 720
024 066 21,4 si 5 2 3 3 540
025 067 18,3 si 4 1 3 2 810
026 074 23,6 si 4 2 2 2 716
027 076 18,4 no 5 1 4 2 620
028 08 2 1 2 630 3 20,5 si 3
029 084 5 2 3 2 610 21,3 si
030 3 1 2 1 760 186 24,2 si
031 087 20,6 si 5 1 4 2 780
032 093 18,6 si 5 2 3 2 757
033 098 21,4 si 4 2 2 2 660
034 100 20,2 si 3 1 2 2 680
035 103 19,3 si 4 2 2 2 520
036 105 19,6 si 2 1 1 2 650
037 106 21,4 si 6 2 4 2 520
038 107 18,6 no 3 1 2 2 570
Alvaro Trejos Facultad de Ingeniera Industrial UTP 72
73
039 109 17,2 si 4 2 2 2 580
040 110 23,1 no 5 2 3 2 590
041 117 20,2 no 3 2 1 2 570
042 119 24,5 si 5 2 3 2 636
043 123 18,7 si 3 1 2 2 786
044 4 1 3 2 516 125 20,2 no
045 126 22,6 no 4 2 2 2 634
046 128 23,2 no 3 1 2 2 520
047 2 2 586 130 18,6 no 3 1
048 133 1 1 536 19,4 si 4 3
049 134 20,6 si 5 2 3 2 636
050 139 18,4 no 3 2 1 2 520
051 141 18,8 si 4 1 3 2 630
052 3 1 2 2 560 144 18,8 no
053 145 4 2 2 2 580 16,5 si
054 148 18,6 si 4 1 3 2 640
055 150 19,5 no 4 2 2 2 636
056 152 20,8 no 3 1 2 2 636
057 no 3 1 2 2 732 154 18,4
058 155 20,6 si 1 1 0 1 806
059 157 18,6 no 4 2 2 2 735
060 158 18,9 si 2 1 1 2 738
061 161 18,6 no 4 1 3 2 630
062 164 18,7 no 5 2 3 2 580
063 165 18,6 no 2 1 1 2 586
064 167 20,6 si 4 1 3 2 712
065 172 19,5 si 2 0 2 2 718
066 175 18,6 si 3 1 2 2 512
067 2 1 2 803 178 20,6 no 3
068 180 18,4 no 2 1 1 1 596
069 189 19,8 no 3 0 3 2 636
070 190 23,6 no 4 2 2 2 814
071 192 24,5 si 3 1 2 2 712
072 199 22,6 si 4 1 3 2 514
073 1 1 1 630 200 18,3 no 2
074 201 18,5 si 3 1 2 2 650
075 202 19,6 si 2 1 1 1 642
076 204 21,4 si 4 2 2 2 716
077 206 21,4 no 5 3 2 2 752
078 207 17,5 si 2 0 2 1 684
079 211 20,6 no 5 1 4 2 744
080 213 18,6 no 3 2 1 1 716
081 219 21,5 no 3 1 2 2 613
082 221 18,6 si 4 2 2 2 636
083 222 21,2 si 2 1 1 2 680
084 233 21,3 no 2 1 1 2 616
085 234 21,5 no 3 1 2 2 630
086 236 17,2 no 5 3 2 2 584
087 237 18,3 no 2 1 1 2 586
Alvaro Trejos Facultad de Ingeniera Industrial UTP 73
74
088 238 19,6 no 3 1 2 2 584
089 240 21,4 si 2 1 1 2 601
090 241 24,6 no 3 1 2 2 608
091 243 18,3 si 3 0 3 2 636
092 244 22,6 si 4 2 2 2 650
093 248 19,8 si 3 1 2 2 586
094 249 19,9 no 4 2 2 2 532
095 250 20,6 no 2 1 1 2 616
096 253 19,3 si 2 0 2 2 650
097 255 19,5 no 2 0 2 2 616
098 256 21,4 no 2 0 2 2 624
099 258 19,5 no 5 2 3 2 705
100 260 22,6 si 2 1 1 2 712
101 263 19,3 no 3 0 3 2 626
102 264 18,5 si 5 2 3 2 650
103 266 18,2 no 3 1 2 1 760
104 267 18,8 si 3 2 1 2 731
105 271 25 si 5 1 4 2 636
106 278 20,8 no 2 2 0 2 603
107 2 3 2 700 282 18,4 no 5
108 283 18,8 no 4 2 2 2 705
109 285 21,2 si 6 1 5 2 703
110 286 19,5 si 5 1 4 2 710
111 2 2 2 734 291 20,5 si 4
112 1 2 2 638 293 18,6 si 3
113 296 18,5 no 3 2 1 2 781
114 297 17,6 si 4 2 2 2 629
115 298 19,2 si 5 3 2 2 732
116 302 17,3 no 3 1 2 2 612
117 308 19 no 2 0 2 2 666
118 309 16,6 si 2 1 1 2 578
119 310 23,9 si 6 2 4 3 598
120 312 18,9 no 4 3 1 2 576
121 313 21,8 no 5 2 3 3 687
122 317 16,9 no 2 0 2 2 515
123 318 17,6 si 2 1 1 1 543
124 323 23 716 ,6 si 4 2 2 2
125 325 18,4 620 no 5 1 4 2
126 332 20 630 ,5 si 3 2 1 2
127 333 21,3 si 5 2 3 2 610
128 335 24,2 si 3 1 2 2 760
129 336 20,6 si 5 1 4 2 780
130 344 16,5 no 2 0 2 1 530
131 346 18,4 si 3 2 1 2 520
132 353 17,5 si 3 2 1 2 515

ESTRATO III FAMILIAS CON INGRESOS SUPERIORES A $25,0 (Miles de $)

Alvaro Trejos Facultad de Ingeniera Industrial UTP 74
75
No. No. Ingresos Vivienda Numero de personas Trabajando Consumo
orden familias (miles $) propia Total M F diario
de carne

01 002 38,4 no 6 2 4 3 807
02 009 28,2 no 4 2 2 3 742
03 013 30,6 si 5 4 1 3 804
04 015 34,2 no 4 1 3 3 743
05 027 31,3 no 5 2 3 3 868
06 029 26 si 4 2 2 2 752
07 052 38,6 no 5 2 3 3 750
08 056 26,2 si 5 2 3 2 620
09 063 39,5 no 5 2 3 3 680
10 079 28,6 si 3 1 2 3 510
11 080 28,9 no 4 2 2 2 770
12 081 28,7 no 4 1 3 2 810
13 088 28,5 no 4 3 1 3 801
14 091 31,4 no 3 1 2 3 612
15 112 26,2 si 2 1 1 2 616
16 115 39,6 no 6 2 4 3 520
17 120 36,3 no 3 3 0 3 636
18 121 32,3 si 7 2 5 3 744
19 122 49,6 si 6 2 4 4 700
20 135 38,7 no 4 1 3 2 735
21 146 34,2 si 5 2 3 3 626
22 147 33,2 si 3 1 2 3 635
23 156 27,3 si 3 1 2 2 816
24 166 28,8 si 3 2 1 3 635
25 169 26,8 si 2 1 1 2 760
26 170 27 si 3 1 2 2 812
27 181 39,6 si 4 1 3 2 520
28 183 29,6 no 5 2 3 3 548
29 184 28,7 si 3 1 2 2 555
30 185 28,4 no 2 1 1 2 730
31 193 32,1 no 4 2 2 2 806
32 194 32,4 si 2 1 1 2 794
33 195 38,6 no 5 2 3 3 812
34 203 36,2 si 3 2 1 3 684
35 205 33,2 si 6 3 3 3 750
36 208 38,9 no 3 1 2 3 802
37 209 29,7 no 3 1 2 2 794
38 210 29,9 no 4 2 2 2 755
39 214 26,2 si 4 3 1 2 777
40 220 26,2 no 3 2 1 2 624
41 235 37,9 si 6 2 4 3 642
42 257 29,6 no 3 1 2 2 684
43 261 32,8 no 5 2 3 2 802
44 265 38,6 si 3 1 2 3 830
45 272 26,1 si 2 1 1 2 651
Alvaro Trejos Facultad de Ingeniera Industrial UTP 75
76
46 273 29,3 si 3 1 2 2 686
47 274 29,6 si 4 2 2 2 680
48 279 32,6 si 3 1 2 2 799
49 289 28,6 no 3 1 2 2 592
50 290 29,8 no 3 2 1 2 600
51 294 28,8 si 2 1 1 2 724
52 299 33,5 si 4 1 3 3 814
53 303 34,6 si 4 1 3 3 718
54 304 27,9 si 6 4 2 2 687
55 305 29,6 no 2 1 1 2 555
56 314 32,9 si 6 3 3 3 768
57 315 28,6 si 5 2 3 3 756
58 328 28,6 si 1 2 3 510 3
59 329 ,9 no 2 28 4 2 2 770
60 330 28,7 no 4 1 3 2 810
61 37 28,5 no 4 2 2 1 801

El numero de unidades en cada estrato es:
Estrato I: N 2
II: N 32
ato III: 61
a pro orcin d unidade encada u ratos oblacio ales es:
W =N /N =162/355 =0.4563 =46%
W
3
/N = 61/355 = 0.1718 = 17%

Tamao de la muestra
ara d terminar el tamao de la muestra en una poblacin estratificada, utilizando el mtodo de
afi cion ig al, se d ben apli r ulas de acuerdo a la caracterstica, sea
n
) Estimacin del promedio de ingresos por familia

1
= 16
Estrato
2
= 1
Estr N
3
=
L p e s no de los est p n
1 1
W
2
= N
2
/N = 132/355 = 0.3718 = 37%
3
= N
P e
ja u e ca las guient si es form
cualitativa o cua titativa que se tome como referencia
a

=
h
W
S W
V
h
2
0
1
n
h
O
2

1
=
0 h
S W
V
n
2
h
Siendo:
2

=
z
d
V Y
N
n
n
n
0
0
+
=
1
En la estimacin de totales, el valor de n se obtiene mediante la formula:
Alvaro Trejos Facultad de Ingeniera Industrial UTP 76
77

+
=
2
h h
S N V
N
n Donde:
2 2
h h
S
h
W
2

=
z
Nd
V
S consideramos que no exista forma alguna de obtener varianzas poblacionales para cada
estrato, hay necesidad de realizar una encuesta preliminar. Supongamos arbitrariamente, que
el tamao de la encuesta es del 4% del tamao poblacional
preliminar
=0.04(355) =14.2
Aplicando el mtodo de asignacin igual donde n
1
= n
2
= n
3
, se tendr:
n
5 73 . 4
3
2 . 14
lim
= =
h
n
inar pre

n
1
= 5 n
2
= 5 y n
3
= 5 n
preliminar
= 15
Con los anteriores tamaos para la encuesta preliminar, seleccionamos 5 unidades en cada
uno de los estratos poblacionales.
ESTRATO I
Consumo
No de Numero Ingreso Propiedad NUMERO DE PERSONAS de carne
orden aleatorio (miles $) vivienda Total Hombres Mujeres Trabajan diaria gr
1 136 14,6 si 3 2 1 1 508
2 008 7,9 si 2 0 2 1 680
3 052 15,6 no 4 3 1 1 720
4 036 7,9 no 1 0 1 1 580
5 111 14,5 si 2 1 1 1 632

ESTRATO II
Consumo
No de Numero Ingreso Propiedad NUMERO DE PERSONAS de carne
orden aleatorio (miles $) vivienda Total Hombres Mujeres Trabajan diaria gr
1 028 20,5 si 3 2 1 2 630
2 126 20,5 si 3 2 1 2 630
3 096 19,3 si 2 0 2 2 550
4 056 20,8 no 2 2 636 3 1
5 088 19,6 no 3 1 2 2 584

EST
Consumo
RATO III

No de Nu Ingreso Propiedad UMER DE PER NAS de ca mero N O SO rne
orden aleatorio (miles $) vivienda Tot Hombres Mujeres Trabajan diaria al gr
1 23 2 si 3 1 2 2 816 7,3
2 55 2 no 2 1 1 2 555 9,6
3 09 3 no 5 2 3 3 680 9,5
4 18 3 si 7 2 5 3 744 2,3
Alvaro Trejos Facultad de Ingeniera Industrial UTP 77
78
5 46 2 si 3 1 2 2 686 9,3

A nuac calcu la vari za y l edia del ingreso por fam n cada uno de
los estratos.

conti in se la an a m ilia e
5 n
168 N
14 1 = .89 S
6 S
1
1
2
1
=
=
1 .
1
x

3.8 =
= 12
5 n
132 N
0.42 2 = S
S
2
2
=
14 . x
0.65 =
2
2
=
= 20
2

5 n
61 N
22.67 S
4.76 S
2
3
3
2
3
=
=
=
=
=
6 . 31
3
x

a a es i La media ritmtica estratificad gual a:
39 . 18 ) 6 = . 31 ( 17 . ) 14 . 37 . 0 . 12 ( 46 . +
h st
x W x
Su a qu ror (d) igual % de
d = 0.05 (18.39) = 0.92
0 20 ( ) 1 + 0 =
h
=


pong e el er es al 5
22 . 0
2 2
=

V
La confianza es del 95%, o sea z = 1.96
96 . 1

92 . 0
=

z
d

=
V
2
0
W n
1
h h
S
[ ]
44
355
36 . 9
36 .
6
) 7 . 22 ( 7 3 . 0 ) 89 1 ( 46 . 0
22 . 0
1
0
0
0
= =
+

=
N
n
n
n
Y los tamaos m estrales en cada estrato sern:
4
1+
49
1+
3 . 49
0
= n
6 1 . 0 ) 42 . 0 ( 7 + . 4
n
Siendo

u
15
3 h
1 2
44
=
n
n =15 n =15 n
3
=15
os las varianzas
poblacionales en cada estrato, con el mismo nivel de error y confianza sern:
Los tamaos de la muestra para el promedio de ingresos, si utilizam
Alvaro Trejos Facultad de Ingeniera Industrial UTP 78
79
[ ]
33
355
1
95 . 35
95 . 35
95 . 35 ) 49 . 22 ( 17 . 0 ) 93 . 3 ( 37 . 0 ) 27 . 5 ( 46 . 0
1
0

+
=
= + +

=
n
n

Siendo: n
1
= 11 n
2
= 11 n
3
= 11
l estimativo de totales, en cuanto se refiere
a los ingresos de las familias, utilizando para ello las varianzas de las encuestas
preliminar.
22 . 0
0

Observemos la aplicacin de la formula, para e

=
+
=

Z
Nd
V
S N V
h
W
S N
n
h h
h h
;
2
2 2
;
[ ]
44
93 . 31616
75 . 1365491
) 67 . 22 ( 61 ) 42 . 0 ( 132 899 . 14 ( 162 44 . 27766
17 . 0
) 67 . 22 ( 61
37 . 0
) 42 . 0 ( 132
46 . 0
+
= n
89 . 14
2 2
= =
+ + +
+
n

b) En proporciones, hay necesidad primero que todo de familiarizarse con la simbologa a
utilizar, tanto para el calculo de los estadgrafos como para los parmetros
n cada estrato
oblacional
presenta la caracterstica en el estrato poblacional
( 162
44 . 27766
96 . 1
92 . 0 ) 355 (
2
2
=

= V
N = tamao de la poblacin

=
hj h
A A =Numero de unidades que presenta la caracterstica, e
p
P
h
= Proporcin de elementos que


N
A
P
hi
h

= ;
1
1
1
N
A
P
j
= ;
2
2
2
N
A
P
j
=
=
2
h
P
S Varianza de los estratos poblacionales
n= Tamao de la muestra
Alvaro Trejos Facultad de Ingeniera Industrial UTP 79
80

=
hj
A Numero de unidades que presentan la caracterstica en el estrato muestral
h
hj
h
n
P = ;
A

1
1
1
1
1
n n
P
j
= = ;
a
a

2
2
2
2
2
n n
P
j
= =
a
A


P
st
= Proporcin poblacional estratificada
N
P N
P
h h
st

= ;

=
h h st
P W P
p
st
= Proporcin muestral estratificada
N
p N
p
h
=
h
st
El estimador dela varianza proporcional utilizado en el mtodo de muestreo aleatorio
estratificado por asignacin igual es:
;

=
h h st
p W p
[ ]
( )
h
h h
h h h p
n
q p
n N N
N
V
st

=
2
1


Los limites de confianza para la proporcin son:
( )
h
h h
h h h st
n
q p
n N N
N
Z p P
i
s

=
2
1


Y en el estimador de totales ser:
( )
h
h h
h h h st
n
q p
n N N Z Np A
I
s

=


El tamao de la muestra para el estimador de una proporcin se puede calcular de la
siguiente manera
n
n
n
V
h h h
0
0
=

Q P W n
1
=

N
0
1+

Para estimativos de totales de formula ser:

+
=
h h h
h
h h h
Q P N V
W
Q P N
n
2

Alvaro Trejos Facultad de Ingeniera Industrial UTP 80
81
Dentro del esquema que se ha venido siguiendo, en primer lugar se deben calcular los
tamaos mustrales para estimativos de las proporciones y totales, cuando se conocen y
desconocen las varianzas poblacionales.
Con la informacin obtenida sobre familias propietarias de la vivienda, a travs de la
encuesta preliminar a 15 familias, se tendr:
6 . 0
5
3
1
= = P 6 . 0
5
3
2
= = P 6 . 0
5
3
3
= = P
Adems se sabe que:
W
1
= 0.46 q
1
= 0.4 z = 1.96
3
= 61
estimativos de una proporcin
W
2
= 0.37 q
2
= 0.4 d = 10%
W
3
= 0.17 q
3
= 0.4 N = 355
N
1
= 162 N
2
= 132 N
Estos datos permiten trabajar con las formulas anteriormente vistas. En primer lugar
veamos su aplicacin, para obtener el valor de n en
[ ]
74
355
30 . 92
1
30 . 92
30 . 92 =

n
) 4 . 0 )( 6 . 0 ( 17 . 0 ) 4 . 0 )( 6 . 0 ( 37 . 0 ) 4 . 0 6 . 0 ( 46 . 0
96 . 1
10 . 0
1
0
2
=
+
+ +

n
n

Ahora si consideramos a P
1
= P
2
= P
3
= 0.50 el tamao de la muestra ser el mximo valor
posible; adems si el error es del 10% y la confianza del 95% se tendr:
)(
0
=
=
[ ]
76
355
15 . 996
1
15 . 96
15 . 96
) 5 . 0 )( 5 . 0 ( 17 . 0 ) 5 . 0 )( 5 . 0 ( 37 . 0 ) 5 . 0 )( 5 . 0 ( 46 . 0
0026 . 0
1
0
0
=
+
=
=
+ + =
n
n
n

S en vez de la encuesta piloto se hubiera tenido en cuenta las varianzas de las
proporciones en la poblacin estratificada
46 . 0
162
74
1
= = P 52 . 0
132
69
2
= = P 52 . 0
61
32
3
= = P
Alvaro Trejos Facultad de Ingeniera Industrial UTP 81
82
El tamao de la muestra hubiera sido:
[ ]
75
355
83 . 94
1
83 . 94
83 . 94
) 48 . 0 )( 52 . 0 ( 17 . 0 ) 48 . 0 )( 52 . 0 ( 37 . 0 ) 54 . 0 )( 46 . 0 ( 46 . 0
0026 . 0
1
0
0
=
+
=
=
+ + =
n
n
n

Para estimativos de totales, el tamao de la muestra, en proporciones es igual a:
[ ]
74
96 . 1
=

n
MUESTREO ALEATORIO ESTRATIFICADO
) 4 . 0 )( 6 . 0 ( 61 ) 4 . 0 )( 6 . 0 ( 132 ) 4 . 0 )( 6 . 0 ( 162
) 10 . 0 ( 355
17 . 0
) 4 . 0 )( 6 . 0 ( 61
37 . 0
) 4 . 0 )( 6 . 0 ( 132
46 . 0
) 4 . 0 )( 6 . 0 ( 162
2 2 2
2
2 2 2
+ + +

+ +
= n

ASIGNACIN PROPORCIONAL Y OPTIMA

Asignacin proporcional
Este mtodo nos permite determinar el tamao optimo de la muestra, as como los estimados
puntuales y limites de confianza para el promedio, proporcin, razn, y proporciones en
conglomerados, en forma similar al de la asignacin igual, con la diferencia de que los tamaos
mustrales en cada estrato, en lugar de ser iguales en cuanto al numero de unidades, se
distribuyen en la misma proporcin que las unidades en la poblacin; en otras palabras, el peso
relativo dado por el numero de unidades en cada estrato en relacin al total de elementos de la
poblacin, debe ser igual al obtenido en la muestra.
n
n
W
N
N
W
h
h
h
h
= =
Siendo W
h
= w
h
Mediante este procedimiento, al igual que en el de asignacin igual y optima, se puede obtener
una mejor estimacin que la lograda a travs del muestreo aleatorio simple, ya que es posible
obtener en la muestra unidades de todos los tipos y caractersticas hacindola de esta manera
representativa de la poblacin.

Tamao de la muestra
Alvaro Trejos Facultad de Ingeniera Industrial UTP 82
83
Como en todos los casos tratados, no se conoce la varianza poblacional de la caracterstica
principal, para el calculo del tamao muestral, una de las alternativas consiste en realizar una
encuesta preliminar.
Recordemos que en la asignacin igual, el numero de unidades es igual para cada uno de los
estratos muestrales. En la encuesta preliminar de 14 familias, esta fue la razn por la cual se
distribuyo un total de (5) cinco familias para cada estrato; en cambio en la asignacin
proporcional, las 14 unidades se distribuyen en la muestra en la misma proporcin como el la
poblacin.
El peso relativo sigue siendo:
46 . 0
355
162
1
1
= = =
N
N
W 37 . 0
355
132
2
2
= = =
N
N
W 17 . 0
355
61
3
3
= = =
N
N
W
W
1
+W
2
+W
3
=0.46+0.37+0.17=1
Los anteriores resultados seran utilizados para calcular los tamaos de la muestra en la encuesta
preliminar, para cada uno de los estratos:
n
1
= nW
1
= 14 (0.46) = 7
n
2
= nW
2
= 14 (0.37) = 5
n
3
= nW
3
= 14 (0.17) = 3
En esta forma se tendr, que el paso relativo en la muestra deber ser igual al de la poblacin:
47 . 0
15
7
1
1
= = =
n
n
w 33 . 0
15
5
2
2
= = =
n
n
w 20 . 0
15
3
3
3
= = =
n
n
w
w
1
+w
2
+w =1
La diferencias que resultan de las operaciones anteriores, se deben a las aproximaciones
realizadas para calcular los tamaos muestrales en cada estrato, pero de todas maneras debern
considerarse como iguales. Las diferencias carecen de importancia
Una vez determinados los tamaos muestrales, se procede a la seleccin de las unidades
requeridas para calcular las varianzas y el error, as:
ESTRATO I
Consumo
3
No de Numero Ingreso Propiedad NUMERO DE PERSONAS de carne
orden aleatorio (miles $) vivienda Total Hombres Mujeres Trabajan diaria gr
1 086 16,3 si 3 2 1 1 605
2 151 12,3 no 3 2 1 1 605
3 008 7,9 si 2 0 2 1 680
4 122 12,6 no 4 2 2 1 520
Alvaro Trejos Facultad de Ingeniera Industrial UTP 83
84
5 076 12,6 no 3 1 2 1 516
6 024 8,4 si 4 2 2 1 610
7 055 10,2 no 1 1 0 1 530

ESTRATO II
Consumo
No de ad NUMERO DE PERSONAS de carne Numero Ingreso Propied
orden Total Hombres Mujeres Trabajan diaria gr aleatorio (miles $) vivienda
1 129 20,6 si 5 1 4 2 780
2 063 18,6 no 2 1 1 2 586
3 015 22,5 si 3 1 2 2 852
4 0 039 17,2 si 4 2 2 2 58
5 111 20,8 si 4 2 2 2 734

ESTRATO III
Consumo
No de carne Numero Ingreso Propiedad NUMERO DE PERSONAS de
orden aleatorio (miles $) vivienda Total Hombres Mujeres Trabajan diaria gr
1 03 30,6 si 5 4 1 3 804
2 28 29,6 no 5 2 3 3 548
3 11 28,9 no 4 2 2 2 770

Luego se calcula el tamao de la muestra para la caracterstica ingresos de las familias (miles de
pesos), tanto para el promedio como para el total:
Los promedios y varianzas para cada estrato son:
47 . 11
1
= x 88 . 19
2
= x
70 . 29
3
= x

La media ponderada ser:
39 . 8
2
1
= S 15 . 4
2
2
= S
73 . 0
2
3
= S
68 . 17 ) 70 . 29 ( 17 . 0 ) 88 . 19 ( 37 . 0 ) 47 . 11 ( 46 . 0 = + + = =
h h
x W
r de muestreo ser igual a d = 0.05 (X
st
x
El erro (17.68) = 0.88
La primera aproximacin para n ser
st
) = 0.05
Alvaro Trejos Facultad de Ingeniera Industrial UTP 84
85
26
355
38 . 27
1
38 . 27
38 . 27
96 . 1
88 . 0
) 73 . 0 ( 17 . 0 ) 15 . 4 ( 37 . 0 ) 39 . 8 ( 46 . 0
2 2
2
0
=
+
=
=

+ +
=

n
z
d
S W
n
h h

Veamos ahora el calculo de n en una proporcin. Para ello consideramos como caracterstica
cualitativa a las familias propietarias de vivienda; adems, para este caso se establece una
confianza del 95% y un error del 5%
169
355
98 . 321
1
98 . 321
98 . 321
96 . 1
05 . 0
) 67 . 0 )( 33 . 0 ( 17 . 0 ) 2 . 0 )( 8 . 0 ( 37 . 0 ) 57 . 0 )( 43 . 0 ( 46 . 0
2 2
0
=
+
=
=

+ +
=

=

n
z
d
q p W
n
h h h

Consid ara cada estrato sern:
n
1
= nW
1
= 36 (0.46) = 17
n
2
= nW
2
= 36 (0.37) = 13
n
3
= nW
3
= 36 (0.17) = 6 n = 36
Determinados los tamaos muestrales para cada estrato, seleccionamos aleatoriamente las
unidades para la muestra, con lo cual se explicaran los mtodos de estimacin puntual y de
intervalos.
ESTRATO I
Consumo
eramos a n = 36. Los tamaos muestrales p
No de Numero Ingreso Propiedad NUMERO DE PERSONAS de carne
orden aleatorio (miles $) vivienda Total Hombres Mujeres Trabajan diaria gr
1 063 13,5 no 2 2 0 1 638
2 160 12,4 no 2 2 0 1 580
3 124 10,1 no 4 1 3 1 520
4 008 7,9 si 3 1 2 1 620
5 096 11,3 si 6 2 4 1 700
6 110 8,5 no 4 1 3 1 520
7 3 2 1 1 520 073 8,9 si
8 3 1 2 1 580 037 12,6 no
9 021 10,6 no 3 1 2 1 730
10 056 9,5 si 2 1 1 1 578
11 116 10,8 si 4 1 3 2 716
12 141 9,5 si 2 1 1 1 520
Alvaro Trejos Facultad de Ingeniera Industrial UTP 85
86
13 003 10,8 no 3 2 1 1 735
14 018 8,6 no 1 0 1 1 510
15 076 12,6 no 3 1 2 1 516
16 020 9,5 no 3 1 2 1 620
17 133 9,9 si 3 1 2 1 512

ESTRATO II
Consumo
No de ero Ingreso Propiedad NUMERO DE PERSONAS de carne Num
orden (miles $) vivienda Total Hombres Mujeres Trabajan diaria gr aleatorio
1 006 23,5 si 3 2 1 2 732
2 091 18,3 si 3 0 3 2 636
3 121 21,8 no 5 2 3 3 687
4 034 20,2 si 3 1 2 2 680
5 130 16,5 no 2 0 2 1 530
6 115 19,2 si 5 3 2 2 732
7 081 21,5 no 3 1 2 2 613
8 075 19,6 si 2 1 1 1 642
9 008 20 si 3 1 2 1 804
10 100 22,6 si 2 1 1 2 712
11 019 17,6 si 3 1 2 2 880
12 023 21,4 si 5 2 3 3 540
13 035 19,3 si 4 2 2 2 520

ESTRATO III
Consumo
No de Numero Ingreso Propiedad NUMERO DE PERSONAS de carne
orden aleatorio (miles $) vivienda Total Hombres Mujeres Trabajan diaria gr
1 31 32,1 no 4 2 2 2 806
2 42 29,6 no 3 1 2 2 684
3 53 34,6 si 4 1 3 3 718
4 20 38,7 no 4 1 3 2 735
5 06 26 si 4 2 2 2 752
6 38 29,9 no 4 2 2 2 755

Estimacin de promedios y de totales
Las medias aritmticas y varianzas del ingreso (en miles de $) por familia son:
41 . 10
1
= x 12 . 20
2
= x 82 . 31
3
= x
66 . 2
2
1
= S 04 . 4
2
2
= S 53 . 19
2
3
= S
S
1
=1.
3
=4.42
n
1
=17 n
2
=13 n
3
=6
El estimado puntual se obtiene as:
63 S
2
=2.01 S
64 . 17 ) 82 . 31 ( 17 . 0 ) 12 . 20 ( 37 . 0 ) 41 . 10 ( 46 . 0 = + + = =
h h st
x W x
Alvaro Trejos Facultad de Ingeniera Industrial UTP 86
87
El estimador de la varianza ser:
[ ]
[ ]
3 . 0 1545 = 9 . 0
1545 . 0
6
53 . 19
) 6 61 ( 61
13
04 . 4
) 13 132 ( 132
17
66 . 2
) 17 162 ( 162
355
1

) (
1

2
2
2
=
=

+ + =
=

st
st
st
X
X
h
h
h h h
X
s
V
n
S
n N N
N
V

Y los limites de confianza del 95% para el promedio:
st x st st
s t x x
i
s


85 . 16
79 . 0 69 . 17

=

i
s
st
x

Siendo = 0.05, el valor de t = 2.035
V=n
1
+n +n
3
-3=17+13+6-3=33
Los resultados anteriores nos indican que el promedio estimado de ingresos es de $ 17.640 y el
promedio verdadero (el de la poblacin) deber estar entre $16.850 y $18.430 con una seguridad
o con
Para e tot

=
43 . 18
) 39 . 0 ( 035 , 2 64 , 17

i
s
st
x
2
fianza del 95%
l al estimado se tiene:

=
=
=
=
=
5980450 45 . 5980
6543950 95 . 6543
75 . 281 2 . 6262

) 39 . 0 )( 355 ( 035 . 2 ) 64 . 17 ( 355


i
s
i
s
i
s
st
st
st x st st
x
x
s tN x N x

Se estima que el ingreso, total de las 355 familias ser aproximadamente de $6.262.200 y que el
verdadero total estar entre $5.980.450 y $6.543.950 con una seguridad del 95%

Estimacin de una proporcin y total
Consideramos como ejemplo de una caracterstica cualitativa la propiedad de la vivienda, para
estimar la proporcin y el total de los propietarios, fijando limites de confianza del 95%. Se
tendr:
Alvaro Trejos Facultad de Ingeniera Industrial UTP 87

Alvaro Trejos Facultad de Ingeniera Industrial UTP 88
88
41 . 0
17
7
1
= = p 77 . 0
13
10
2
= = p 33 . 0
6
2
3
= = p
5296 . 0 ) 33 . 0 ( 17 . 0 ) 77 . 0 ( 37 . 0 ) 41 . 0 ( 46 . 0 = + + = =
h h st
P W P
Se estima que el 52.96% de las familias son propietarias de vivienda
[ ]
[ ]
[ ]

= =
=

+ + =

=
=

3711 . 0
6881 . 0
1585 . 0 5296 . 0 006 . 0 035 . 2 5296 . 0

006 . 0
6
) 67 . 0 ( 33 . 0
) 6 61 ( 61
13
) 33 . 0 ( 77 . 0
) 13 132 ( 132
17
) 59 . 0 ( 41 . 0
) 17 162 ( 162
355
1

) (
1


2
2
I
st
P
h
h h
h h h P
P st
I
s
P
V
n
q p
n N N
N
V
V P P
st
st
st

Entre 68.81% y 37.11% deber estar el verdadero porcentaje de familias propietarias de vivienda.
Para calcular el total de las familias propietarias de vivienda, se tendr:
[ ]

= =
=
19 . 132
11 . 244
96 . 55 15 . 188 006 . 0 ) 355 ( 035 . 2 ) 53 . 0 ( 355

I
s
P st
I
s
A
V tN NP A
st

Se estima que en total, 188 familias son propietarias de vivienda y el verdadero valor estar entre
132 y 244 familias.

Asignacin Optima
En este mtodo, el calculo de la muestra depender en muchos casos del costo total de la
investigacin ( C ), del costo fijo (CB
o
B), del costo unitario (CB
h
B); este ultimo podr ser fijo o
variable, para cada uno de los estratos, adems del grado de variabilidad (SP
2
P). En conjunto, los
anteriores factores determinaran con mayor precisin el tamao optimo de la muestra; sin
embargo, adems de los factores anteriores, podrn considerarse como elementos
complementarios, el margen de error y el grado de confianza.
Todo esto resulta expresado en formulas un poco complicadas, que dependen de los factores que
sean considerados para el calculo del tamao muestral, con el nico fin de lograr una mejor
asignacin de unidades dentro de la muestra, en busca de una mayor precisin, que en la practica

Alvaro Trejos Facultad de Ingeniera Industrial UTP 89
89
es sacrificada, mediante la aplicacin de mtodos mas simples, que arrojan resultados
comparativamente tan buenos como los obtenidos mediante la asignacin optima.
En sntesis, el mtodo de asignacin o afijacin optima se reduce a:
a) A una optima distribucin del tamao de la muestra entre los diferentes estratos, de tal
manera que el error de estimacin sea mnimo para un costo total dado.
b) Adems de una ptima distribucin con un costo total mnimo para un error
preestablecido, en algunos casos, se aplica el grado de variabilidad de cada estrato,
combinado con los costos unitarios (fijos o variables) y los tamaos totales de cada
estrato.
Tamao de la muestra
Para el calculo del tamao de la muestra, se usan varias formulas de acuerdo con los factores que
se tomen en cuenta para su obtencin. Se vern algunos de tales procedimientos:
a) En el caso de que tan solo se consideran como factores para el calculo de n, el costo total
de la investigacin (C ), el costo fijo (CB
o
B) y el costo unitario por estrato (CB
h
B), se debe
aplicar la siguiente formula:
n
C
C C
n
0

=
Por ejemplo, si se tiene C = $ 35.000; CB
0
B = $ 25.000 y CB
h
B= $400, el tamao ser
25
400
25000 35000
=

= n
En esta formula no se tiene en cuenta componentes o factores tan importantes como el
grado de variabilidad (varianza) de la caracterstica en cada estrato, tamaos de los
estratos, nivel de confianza y nivel de error.
Como en el ejercicio, el costo unitario es constante para cada uno de los estratos, los
respectivos tamaos muestrales se obtendrn as:

h
h
h h
h
S N
S N
n n o

=
h h
h h
h
S W
S W
n n
En el caso de proporciones, las formulas son:

=
h h h
h h h
h
Q P N
Q P N
n o

=
h h h
h h h
h
Q P W
Q P W
n

Alvaro Trejos Facultad de Ingeniera Industrial UTP 90
90
Si consideramos los resultados obtenidas a travs de la encuesta preliminar de las 158
familias, mediante el mtodo de asignacin proporcional, la varianza de los ingresos en
cada estrato sern:
SB
1
PB
2
P = 8.39 SB
2
PB
2
P = 4.15 SB
3
PB
2
P = 0.73
Las proporciones de familias con vivienda:
PB
1
B = 0.43 PB
2
B = 0.8 PB
3
B = 0.33 Siendo los tamaos en cada estrato
NB
1
B = 162 NB
2
B = 132 NB
3
B= 61
Se tendr que:
26 2 9 15
2 65 . 1
9 5 . 8
15 84 . 14
73 . 0 61 15 . 4 132 39 . 8 162
39 . 8 162
25
3 2 1
3
2
1
1
= + + = + + =
=
=
=

+ +
=
n n n n
n
n
n
n

En las proporciones, utilizando como ponderaciones a WB
h
B:
26 5 8 13
5
8
13
) 67 . 0 ( 33 . 0 17 . 0 ) 2 . 0 ( 8 . 0 37 . 0 ) 57 . 0 ( 43 . 0 46 . 0
) 57 . 0 ( 43 . 0 46 . 0
25
3
2
1
1
= + + =

+ +
=
n
n
n
n
n

b) Otra formula para determinar el tamao optimo de la muestra, previa informacin sobre
costo total de la investigacin ( C), costo fijo (CB
o
B), grado de variabilidad de cada estrato
(SP
2
P), costo unitario (CB
h
B) que puede ser constante o variable para cada uno y tamao
poblacional de los estratos (NB
h
B)
Los anteriores factores determinan un tamao para n como mayor representatividad de la
caracterstica que la anterior, ya que adems de los costos, se tienen en cuenta los tamaos
poblacionales de los estratos, y el grado de variabilidad para cada uno de ellos
( )
h h h
h
h h
C S N
C
S N
C C
n

=
0


Alvaro Trejos Facultad de Ingeniera Industrial UTP 91
91
Si consideramos la siguiente informacin tomada de la encuesta preliminar:
SB
1
B=2.9 SB
2
B=2.04 SB
3
B=0.85
NB
1
B=162 NB
2
B=132 NB
3
B=61
CB
1
B=400 CB
2
B=400 CB
3
B=400
C=35000 CB
0
B=25000
Se tendr que n ser igual a:
[ ]
25
400 ) 85 . 0 ( 61 400 ) 04 . 2 ( 132 400 ) 9 . 2 ( 162
400
) 85 . 0 ( 61
400
) 04 . 2 ( 132
400
) 9 . 2 ( 162
25000 35000
=
+ +

+ +
=
n
n
Puede observarse que hemos utilizado costos unitarios (CB
h
B) constantes, en la formula
anterior.
Coincidencialmente se obtuvo un resultado igual al anterior, sin embargo, puede ser
mayor o menor, dependiendo del grado de variabilidad y tamao de cada estrato.
Supongamos ahora que los costos unitarios (CB
h
B) para cada estrato son variables.
CB
1
B = 200 CB
2
B = 300 CB
3
B = 400
Por lo tanto el valor de n ser
[ ]
42 61 . 41
400 ) 85 . 0 ( 61 300 ) 04 . 2 ( 132 200 ) 9 . 2 ( 162
400
) 85 . 0 ( 61
300
) 04 . 2 ( 132
200
) 9 . 2 ( 162
25000 35000
=
+ +

+ +
=
n
n
En el caso que CB
h
Bsea constante, los nB
h
B se obtienen mediante formulas:

=
h h
h h
h
S N
S N
n n o

=
h h
h h
h
S W
S W
n n
Pero cuando CB
h
Bes variable para cada uno de los estratos, los nB
h
B se calcularan as:

h
h h
h
h h
h
C
S N
C
S N
n n o

h
h h
h
h h
h
C
S W
C
S W
n n
Siendo nB
1
B ; nB
2
B ; nB
3
Biguales a:

Alvaro Trejos Facultad de Ingeniera Industrial UTP 92
92
43 3 13 27
3 11 . 2
13 71 . 12
27 16 . 27
400
) 085 . 0 ( 61
300
) 04 . 2 ( 132
200
) 9 . 2 ( 162
200
) 9 . 2 ( 162
42
3
2
1
1
= + + =
=
=
=

+ +
=
n
n
n
n
n

En el caso de que la caracterstica sea cualitativa utilizamos las proporciones, como en el
caso de las familias propietarias de vivienda. El procedimiento es similar al anterior, tan
solo se reemplaza a SB
x
PB
2
Ppor SB
p
PB
2
P = pq y se tendr que:
( )
[ ]
25
400 ) 67 . 0 ( 33 . 0 61 400 ) 2 . 0 ( 8 . 0 132 400 ) 57 . 0 ( 43 . 0 162
400
) 67 . 0 ( 33 . 0
61
400
) 2 . 0 ( 8 . 0
132
400
) 57 . 0 ( 43 . 0
162 25000 35000
:
0
=
+ +

+ +
=


n
n
Siendo
C Q P N
C
Q P
N C C
n
h h h h
h
h h
h


Si los CB
h
B varan para cada estrato, se tendr:
[ ]
39
400 ) 67 . 0 ( 33 . 0 61 300 ) 2 . 0 ( 8 . 0 132 200 ) 57 . 0 ( 43 . 0 162
400
) 67 . 0 ( 33 . 0
61
300
) 2 . 0 ( 8 . 0
132
200
) 57 . 0 ( 43 . 0
162 25000 35000
=
+ +

+ +
=
n
n

Para calcular los tamaos muestrales en cada estrato, cuando CB
h
Bes variable se proceder
as:

h
h h
h
h
h h
h
h
C
Q P
N
C
Q P
N
n n o

h
h h
h
h
h h
h
h
C
Q P
W
C
Q P
W
n n
Reemplazando se tendr:

Alvaro Trejos Facultad de Ingeniera Industrial UTP 93
93
40 6 12 22
6
12
22
400
) 67 . 0 ( 33 . 0
17 . 0
300
) 2 . 0 ( 8 . 0
37 . 0
200
) 57 . 0 ( 43 . 0
46 . 0
400
) 57 . 0 ( 43 . 0
46 . 0
39
3
2
1
1
= + + =
=
=

+ +
=
n
n
n
n
n

El incremento que presenta el valor de n se debe a las aproximaciones, siendo preferible
en numerosas ocasiones tomar una unidad de mas, que una de menos.
c) El tamao optimo de la muestra, en el muestreo aleatorio estratificada por el mtodo de
asignacin optima, tambin se puede obtener utilizando el nivel de confianza, el error de
muestreo y el costo unitario para cada estrato, mediante la formula:
[ ]

=
2
1
h h
h
h h
h h h
S W
N
V
C
S W
C S W
n
Sabiendo que los CB
h
Bpueden ser constantes o variables, se puede utilizar la formula, con
los datos anteriores, para la cual se determina una confianza del 95.5%, siendo z=2 y un
error del 5%
[ ]
( ) ( ) [ ] 73 . 0 ( 17 . 0 ) 15 . 4 ( 37 . 0 39 . 8 ( 46 . 0
355
1
2
88 . 0
400
) 85 . 0 ( 17 . 0
400
) 04 . 2 ( 37 . 0
400
) 90 . 2 ( 46 . 0
400 ) 85 . 0 ( 17 . 0 400 ) 04 . 2 ( 37 . 0 400 ) 90 . 2 ( 46 . 0
2
+ + +

+ + + +
= n
24 85 . 23
88 . 0 ) 68 . 17 ( 05 . 0
68 . 17
=
= =
=
n
d
x
st

El anterior resultado corresponde al tamao optimo para el estimador del promedio de
ingresos por familia. Veamos cuando CB
h
Bes variable:

Alvaro Trejos Facultad de Ingeniera Industrial UTP 94
94
[ ]
( ) ( ) [ ]
25
204 , 0
043 , 5
73 . 0 ( 17 . 0 ) 15 . 4 ( 37 . 0 39 . 8 ( 46 . 0
355
1
2
88 . 0
400
) 85 . 0 ( 17 . 0
300
) 04 . 2 ( 37 . 0
200
) 90 . 2 ( 46 . 0
400 ) 85 . 0 ( 17 . 0 300 ) 04 . 2 ( 37 . 0 200 ) 90 . 2 ( 46 . 0
2
= =
+ + +

+ + + +
=
n
n

En el caso de estimativos para proporciones, la formula aplicada para determinar el
tamao optimo de la muestra corresponde a:
[ ]

=
h h h
h
h h
h h h h h
Q P W
N
V
C
Q P
W C Q P W
n
1

En la anterior formula CB
h
B puede ser constante o variable. Con los datos que hemos
obtenido a travs de la en cuenta preliminar, reemplazamos en la formula anterior:
[ ]
[ ]
171
) 67 . 0 ( 33 . 0 ) 17 . 0 ( ) 2 . 0 ( 8 . 0 ) 37 . 0 ( ) 57 . 0 ( 43 . 0 ) 46 . 0 (
400
) 67 . 0 ( 33 . 0
17 . 0
400
) 2 . 0 ( 8 . 0
37 . 0
400
) 57 . 0 ( 43 . 0
46 . 0
... *
355
1
2
05 . 0
... * 400 ) 67 . 0 ( 33 . 0 17 . 0 400 ) 2 . 0 ( 8 . 0 37 . 0 400 ) 57 . 0 ( 43 . 0 46 . 0
2
=
+ +

+ +
+

+ +
=
sigue
continua n

En el caso de que CB
h
B sea variable se tendr:
[ ]
[ ]
174
) 67 . 0 ( 33 . 0 ) 17 . 0 ( ) 2 . 0 ( 8 . 0 ) 37 . 0 ( ) 57 . 0 ( 43 . 0 ) 46 . 0 (
400
) 67 . 0 ( 33 . 0
17 . 0
300
) 2 . 0 ( 8 . 0
37 . 0
200
) 57 . 0 ( 43 . 0
46 . 0
... *
355
1
2
05 . 0
... * 400 ) 67 . 0 ( 33 . 0 17 . 0 300 ) 2 . 0 ( 8 . 0 37 . 0 200 ) 57 . 0 ( 43 . 0 46 . 0
2
=
+ +

+ +
+

+ +
=
sigue
continua n

Los dos tamaos muestrales obtenidos anteriormente son grandes, debido a que el error
del 5% es bastante pequeo.
Es necesario anotar, que en la formula anterior se puede prescindir de los costos unitarios
CB
h
B y por tal razn, se obtiene otra formula que nos permite calcular el tamao de la
muestra, denominada por algunos como tamao optimo de Neyman

Alvaro Trejos Facultad de Ingeniera Industrial UTP 95
95
( ) ( )
N
Q P W
V
Q P W
n
N
S W
V
S W
n
h h h
h h h
h h
h h

+
=
+
=
2
2
2
) 2 ) 1
Reemplazando en las formulas anteriores:
[ ]
[ ]
173
355
17 . 0 ) 67 . 0 ( 33 . 0 37 . 0 ) 2 . 0 ( 8 . 0 46 . 0 ) 57 . 0 ( 43 . 0
2
05 . 0
) 67 . 0 ( 33 . 0 17 . 0 ) 2 . 0 ( 8 . 0 37 . 0 ) 57 . 0 ( 43 . 0 46 . 0
) 2
24
355
) 73 . 0 ( 17 . 0 ) 15 . 4 ( 37 . 0 ) 39 . 8 ( 46 . 0
2
88 . 0
) 85 . 0 ( 17 . 0 ) 04 . 2 ( 37 . 0 ) 9 . 2 ( 46 . 0
) 1
2
2
2
2

+ +
+

+ +
=

+ +
+

+ +
=
n
n


Las diferencias obtenidas con la aplicacin de las formulas de Neyman, en relacin con
aquellas en las que se tienen en cuenta los costos unitarios CB
h
B, variables o constantes, son
pequeas
En estos dos casos, los tamaos muestrales para cada uno de los estratos, se pueden
calcular mediante las formulas:

=
h h
h h
h
S N
S N
n n o

=
h h
h h
h
S W
S W
n n


RESUMEN FORMULAS MUESTREO ASIGNACIN OPTIMA


a) Tan solo se considera C, CB
o
B, y CB
h
B (CB
h
B constante)
Tamao de muestra:
h
C
C C
n
0

= donde CB
h
B es constante en cada grupo
Tamao de muestra en cada estrato:

Alvaro Trejos Facultad de Ingeniera Industrial UTP 96
96

=
h h
h h
h
S N
S N
n n

h h
h h
h
S W
S W
n n para estimar una proporcion se reemplaza SB
h
B
por
h h
q p
b) Se considera C, CB
o
B, CB
h
B (puede ser constante o variable), SP
2
PB
h
B, NB
h
B
Tamao de muestra:

( )

=
h h h
h
h h
C S N
C
S N
C C
n
0

Tamao de muestra en cada estrato si CB
h
B es constante

=
h h
h h
h
S N
S N
n n

=
h h
h h
h
S W
S W
n n
Tamao de muestra en cada estrato s CB
h
B es variable

h
h h
h
h h
h
C
S N
C
S N
n n

c) Se considera C, CB
o
B, CB
h
B (puede ser constante o variable), SP
2
PB
h
B, NB
h
B, d, confianza
Tamao de muestra:

( )

=
h
h
h
h h
h h h
S W
N
V
C
S W
C S W
n
2
1

Tamao de muestra en cada estrato cuando CB
h
Bes constante

=
h h
h h
h
S N
S N
n n
Tamao de muestra en cada cuando CB
h
B es variable:

Alvaro Trejos Facultad de Ingeniera Industrial UTP 97
97

h
h h
h
h h
h
C
S N
C
S N
n n

h
h h
h
h h
h
C
S W
C
S W
n n

d) En el muestreo estratificado otra manera de calcular el tamao optimo de muestra es aplicando
la formula de Neyman
Variables continuas:

( )
N
S W
V
S W
n
h
h
h h

+
=
2
2


( )
N
q p W
V
q p W
n
h h h
h h h

+
=
2
para proporciones
Los tamaos de muestra para cada estrato se calcula de la siguiente manera:

=
h h
h h
h
S N
S N
n n

=
h h
h h
h
S W
S W
n n

Potrebbero piacerti anche