Sei sulla pagina 1di 20

Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

UNIDAD 4. MUESTREO.

4.1 DEFINICIÓN DE MUESTREO.

Muestreo. Procedimiento mediante el cual se obtienen una o más muestras de una población.
En muchas ocasiones, al estudiar un fenómeno, se utiliza una parte del universo (una muestra)
cuyo análisis conduce a resultados similares como si se hubiera analizado el universo
completo.

El muestreo es una herramienta de la investigación científica. Su función básica es determinar


que parte de una realidad en estudio (población o universo) debe examinarse con la finalidad
de hacer inferencias sobre dicha población. El error que se comete debido al hecho de que se
obtienen conclusiones sobre cierta realidad a partir de la observación de solo una parte de ella,
se denomina error de muestreo. Obtener una muestra adecuada significa lograr una versión
simplificada de la población, que reproduzca de algún modo sus rasgos básicos.

En todas las ocasiones en que no es posible o conveniente realizar un censo, lo que hacemos
es trabajar con una muestra, entendiendo por tal una parte representativa de la población. Para
que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y
diferencias encontradas en la población, ejemplificar las características de la misma.

Cuando indicamos que una muestra es representativa indicamos que reúne aproximadamente
las características de la población que son importantes para la investigación.

Para que la muestra alcance los objetivos preestablecidos debe reunir las siguientes
características:
1. Ser representativa. Es decir, todos sus elementos deben presentar las mismas
cualidades y características de la población.
2. Ser suficiente. La cantidad de elementos seleccionados, si bien tiene que ser
representativa de la población, debe estar libre de errores.

Las ventajas de utilizar muestras y no población son:


a) Menor costo. Los gastos se harán sobre una mínima parte de la población y no sobre
la totalidad.
b) Menor tiempo. Se obtiene con mayor rapidez la información, ya que sólo se estudia
una pequeña parte de la población.
c) Confiabilidad. Una vez comprobada la representatividad de una muestra, podrá
emplearse con entera confianza el procedimiento de selección en los próximos
estudios de otras poblaciones. Una muestra idónea ofrece 99% de confiabilidad en los
resultados.
d) Control. Es fácil acudir a los resultados finales del estudio, con fines de consulta,
comparación y evaluación.

4.1.1 TIPOS DE MUESTREO ALEATORIO, SISTEMATIZADO, ESTRATIFICADO Y


CONGLOMERADOS.

Métodos de muestreo probabilístico. Son aquellos que se basan en el principio de


equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las
posibles muestras de tamaño “n” tienen la misma probabilidad de ser elegidas. Solo estos
métodos de muestreos probabilísticos nos aseguran la representatividad de la muestra extraída
y son, por tanto, los más recomendables.

Entre los métodos de muestreos probabilísticos más utilizados en investigación encontramos:


 Muestreo aleatorio simple
 Muestreo sistemático
 Muestreo estratificado

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

 Muestreo polietápico o por conglomerados

Muestreo aleatorio simple. Muestreo en el que todas las muestras tienen la misma
probabilidad de ser seleccionadas. Muestreo en el que la muestra está formada por “n”
variables aleatorias independientes e idénticamente distribuidas a la variable aleatoria
poblacional.

El procedimiento empleado es:


1. Se asigna un número a cada individuo de la población.
2. A través de algún medio mecánico (bolas dentro de una bolsa, tablas de números
aleatorios, números aleatorios generadas con una calculadora u ordenador, etc.) se
eligen tantos sujetos como sea necesario para completar el tamaño de la muestra
requerida. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad
práctica cuando la población que estamos manejando es muy grande.

Ejemplos:
1. Consideré una población de 8 estudiantes y una muestra de 2 elementos.
a) Se numeran 8 fichas del 1 al 8 que deberán ser de igual tamaño y color, un número
corresponde a cada uno de los elementos de la población.
b) Se mezclan las fichas en un recipiente, se toma una a ciegas, el estudiante
correspondiente a esa ficha será uno de los dos estudiantes de la muestra.
c) Se mezclan las 7 fichas restantes (sin depositar la ficha escogida en el paso anterior),
se toma otra de la misma manera, el estudiante escogido esta vez, completará la
muestra de 2 estudiantes.

O bien escribir el nombre de cada uno en el pedazo de papel y depositar estos pedazos de
papel en una caja. Después de revolverlos bien, se extraen los dos pedazos de papel al azar.
Este método funciona bien con un grupo pequeño de personas, pero presenta problemas si el
número de la población llega a cantidades del orden de los miles. También está el problema
adicional de no estar seguro de que los pedazos de papel estén bien revueltos.

2. Suponga que hay 100 empleados en una compañía y se desea entrevistar una muestra de
10 de ellos escogidos al azar.

Se podría obtener una muestra aleatoria al asignar a cada empleado un número desde 00 a 99,
mediante una tabla de números aleatorios.

Recorrer de arriba abajo las columnas, comenzando con la columna de la izquierda, y lea solo
los primeros dos dígitos en cada fila, si se llega hasta el final de la última columna de la
derecha y todavía no se tiene completo los 10 números de dos dígitos menores de 99
deseados, puede regresar al principio y comenzar a leer el tercero y cuarto dígito de cada
grupo o conjunto.

TABLA 2.1 NUMEROS ALEATORIOS .

60187 61616 01429 07970 05517 52925 24104 78607 54766 81929 64989 70598

92235 65438 43635 33491 76225 22874 32949 53458 33228 45994 68244 39277

12179 71549 35520 18410 09560 49352 18799 62691 64569 63562 67390 83020

96758 03754 49321 87936 05413 46398 59110 89617 45552 09502 08042 64503

81941 00413 92880 14720 15730 62752 49866 59884 96847 00547 51754 71767

35083 25609 52866 05053 40544 02404 82240 24555 18246 99256 35920 54700

39795 55189 63958 00523 68412 40072 22616 88596 25564 80705 60824 26050

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

04684 48679 83415 37955 65891 01837 83777 80313 00016 44514 36851 82946

95281 22927 92719 81129 38087 75798 34156 26179 64881 64855 04107 77566

61761 72165 93396 24129 57458 02172 99906 48923 58897 10583 55176 42035

89158 23935 85897 17489 96832 74511 10503 38772 75055 60701 49418 22027

87659 49248 75616 55824 70556 60477 49051 95471 54228 45660 34622 53346

61290 29451 81591 71628 69040 24177 00937 14660 43365 81714 26704 07688

22969 39863 79240 69571 06134 07533 11463 67761 19585 32654 46391 25845

88341 53728 54030 57746 38350 59710 07233 02859 18183 29955 37665 51931

76125 84080 57750 44663 65413 52483 16579 28744 59485 29756 10142 65481

57259 72786 58410 09819 21147 35495 36026 04003 53607 73773 59021 21844

78566 78103 72208 95789 90762 58178 98995 29343 25884 64372 91624 00007

98613 40645 38460 72468 57198 12609 59809 56698 64823 42148 33746 65625

24818 22024 90561 66690 10909 24874 00407 39525 45822 06386 39067 91438

16756 20883 99623 18549 48874 79505 07836 64706 86492 43209 66736 02764

58026 16213 45300 99666 30045 33612 71236 32466 14378 77303 53584 82449

92318 78135 77401 05432 80591 01808 06575 19772 18409 62345 48777 52879

79913 64612 46873 29419 94288 43852 96845 07705 56612 49021 59375 54988

47849 82163 92766 91118 43332 00205 73493 31010 64403 60476 71086 11561

65684 90076 46499 99961 04640 65348 62136 60955 20674 37175 12953 96211

85182 02165 00222 79531 88275 32814 05581 57854 07131 98399 27174 34986

93372 81526 44197 77082 39869 27952 63894 62859 07997 02961 70235 33056

69281 06032 02737 31736 33836 03687 16198 33692 08045 81293 55733 22027

05182 73514 43106 08667 06729 58118 52900 85188 47180 91082 06920 67812

33036 62571 36110 24001 54241 04768 77200 26255 01273 91475 07766 54361

54274 46169 71217 95137 10393 81874 95444 03204 25117 44843 51911 28472

64770 80383 57006 16244 07391 18143 32847 65513 77654 36712 12892 35158

88963 89783 95292 58789 28952 25140 79045 74550 88692 88266 43953 78395

66496 15950 48691 87224 02908 36236 26872 28073 94726 00038 69420 73307

92684 52059 10623 90081 24393 97230 75743 88153 65886 66036 82653 71506

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

27802 21872 12534 50258 54590 11102 13500 24100 31779 84086 50011 62043

65323 09748 84002 47292 03963 44708 36373 28247 38510 04319 42977 29398

16068 46960 93170 14690 48202 16681 02606 52528 21671 90897 27346 00489

12277 52468 37647 95714 56936 58653 27709 57958 51261 11305 69391 21469

33591 95745 52924 24746 85429 12795 49179 34693 23400 64321 66840 28311

97913 92870 94060 54543 13067 08226 03552 31939 30547 76205 92949 34667

28460 07667 82973 50836 80117 89671 94457 53871 30010 95490 53393 51668

77765 80720 19097 23378 85256 47852 86389 42395 64323 00360 28498 75145

56455 09554 41277 94829 32407 83852 45307 33502 43459 93587 65021 51088

09340 81273 50194 49264 84016 77208 94425 82524 89131 45144 04900 22490

43427 44132 40201 71909 81544 95475 38893 94075 06065 84857 34524 67346

81452 15910 27522 66755 31080 45973 96723 26980 91803 11635 81915 02134

42060 31261 47032 52807 17822 88687 89641 69164 23536 74493 57168 09503

64625 25286 92781 54268 37993 35873 20539 79859 51385 09655 87352 66894

Muestreo aleatorio sistemático. Este procedimiento exige, como el anterior, numerar todos
los elementos de la población, pero en lugar de extraer “n” números aleatorios sólo se extrae
uno. Se parte de ese número aleatorio “i”, que es un número elegido al azar y los elementos
que integran la muestra son los que ocupan los lugares i, i+k, i+2k, i+3k,…,i+(n-1)k, es decir se
toman los individuos de “k” en “k”, siendo “k” el resultado de dividir el tamaño de la población
entre el tamaño de la muestra. K=N/n. El número “i” que empleamos como punto de partida
será un número al azar entre 1 y k. El riesgo en este tipo de muestreo está en los casos en que
se dan periocidades en la población ya que al elegir a los miembros de la muestra con una
periocidad constante (k) podemos introducir una homogeneidad que no se da en la población.

Ejemplo:
1. Suponga que hay 100 empleados en una compañía y se desea entrevistar una muestra de
10 de ellos escogidos al azar.
K=100/10= 10. Los empleados seleccionados serían 1, 11, 21, 31, etc.

Muestreo aleatorio estratificado. Este muestreo se recomienda cuando la población consiste


en un conjunto de grupos heterogéneos (distintos).

Una muestra aleatoria estratificada es una muestra que se obtiene separando los elementos de
la población en grupos disjuntos, llamados estratos y seleccionando una muestra aleatoria
simple dentro de cada estrato.

Cuando la población es demasiado heterogénea, se requiere formar grupos homogéneos por


ejemplo; de la misma edad, del mismo nivel socioeconómico, del mismo sexo, la misma
profesión, el estado civil, etc. a estos grupos se les denomina estratos.

Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de
interés estarán representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse en ellos el muestreo aleatorio simple o el estratificado
para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la
población. (Tamaño geográfico, sexos, edades, etc).

El muestreo estratificado resulta apropiado cuando la población ya está dividida en grupos


diferentes y deseamos tomar en cuenta esta condición.

La ventaja de las muestras estratificadas es que, cuando se diseñan adecuadamente, reflejan


de manera más precisa las características de la población de la cual fueron elegidas, en
comparación con otro tipo de muestras.

Ejemplos: l
1. Supongamos que los pacientes de un médico están divididos en cuatro grupos de acuerdo
con su edad como se muestra en la tabla. El médico desea averiguar cuántas horas duermen
sus pacientes.
Grupo de edad Porcentaje del total
Nacimiento-19 años 30
20-39 años 40
40-59 años 20
60 años y mayores 10

Para obtener una estimación de esta característica de la población, podría tomar una muestra
aleatoria de cada uno de los cuatro grupos de edades y ponderar las muestras de acuerdo con
el porcentaje de pacientes en ese grupo. Este sería un ejemplo de una muestra estratificada.

2. En un estudio de las actividades de estudiantes con respecto a las políticas de hospedaje en


las instalaciones escolares, es razonable pensar que pueden existir diferencias importantes
entre los estudiantes de licenciatura y los de posgrado, y entre hombres y mujeres. Por lo tanto
debe considerarse un esquema de muestreo estratificado, escogiendo una muestra diferente
en cada uno de los cuatro estratos:

 Hombres que estudian la licenciatura


 Mujeres que estudian la licenciatura
 Hombres que estudian el posgrado
 Mujeres que estudian el posgrado

Muestreo por conglomerados. Es un tipo de muestreo aleatorio en el que los elementos de la


población se dividen en forma natural en subgrupos. Así, se eligen al azar los subgrupos que
forman la muestra.

El muestreo por conglomerado proporciona una cantidad especificada de información o un


costo mínimo cuando:
1. No existe una lista de todos los elementos de la población o sería muy costoso
obtenerla.
2. La población es grande y está dispersa en una región muy extensa.

El uso del muestreo por conglomerados produce normalmente una disminución de los costos,
pero algunas veces es necesario pagar un precio. En ocasiones el error de muestreo aumenta
debido a que los elementos de un conglomerado tienden a tener características comunes. Por
ejemplo, en encuestas de poblaciones humanas, los conglomerados son frecuentemente
vecindarios que son semejantes en los que se refiere a edad, ingreso, antecedentes étnico y
clase ocupacional. Por lo tanto, al seleccionar aleatoriamente los conglomerados para la
encuesta, se corre el riesgo de que algunas clases socioeconómica no estén representados
sino se incluyen sus vecindarios. Por otra parte otras clases pueden estar representadas con
exceso.

Se puede reducir el error de muestreo seleccionando un mayor número de conglomerados


pequeños en lugar de unos cuantos conglomerados grandes. Entre más pequeño es el tamaño

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

de los conglomerados, menor es el riesgo de excluir ciertas clases de elementos de la muestra.


Por lo tanto, seleccionando un mayor número de conglomerados de menor tamaño se obtiene
mayor información acerca de la población.

Una vez especificados los conglomerados, es necesario contar con una lista de todos ellos,
para seleccionar una muestra aleatoria de “m” conglomerados de los “M” de la población, se
usa el muestreo aleatorio simple.

Ejemplos:
1. Si un analista de la secretaría de trabajo necesita estudiar los salarios diarios que se pagan
en un área metropolitana, sería difícil obtener una lista de todos los asalariados de la población
objetivo. Sin embargo, podría obtenerse fácilmente una lista de las empresas de la región. Con
esta lista el analista puede tomar una muestra aleatoria de las empresas identificadas que
representan conglomerados de trabajadores y obtener los salarios que estas empresas les
pagan.

2. Supóngase que un economista desea estimar la cantidad promedio empleada en comida por
vivienda en una ciudad. Para usar muestreo aleatorio simple o muestreo aleatorio estratificado,
el economista debe tener una lista de todas las viviendas para poder seleccionar la muestra.
Sin embargo, obtener una lista de todas las viviendas de una ciudad puede ser muy costoso y
en algunos casos imposibles. Aun en el caso de tener la lista completa, los costos pueden ser
sumamente altos, porque al usar muestreos aleatorio simple o estratificado, las viviendas
escogidas pueden estar muy alejadas unas de otras. Como resultado de lo anterior, el costo de
la encuesta aumenta debido al tiempo de traslado de los entrevistadores y a otros gastos. En
lugar de seleccionar una muestra distribuida en toda la ciudad, el economista podría usar el
muestreo por conglomerados dividiendo la ciudad en conglomerados y obteniendo después
una muestra aleatoria de estos. Esto debe poder efectuarse más fácilmente pues es posible
que exista una lista de los diferentes conglomerados. Debe encuestarse cada uno de las
viviendas que estén en cada uno de los conglomerados escogidos. El costo total de la encuesta
disminuye dado que se ha eliminado la necesidad de elaborar una lista de todas las viviendas
y, dado que las viviendas que pertenecen a un conglomerado puede estar geográficamente
cercana, se reducen los gastos de los entrevistadores.

Muestreo optinático o intencional. Muestreo en el que la persona que selecciona la muestra


procura que esta sea representativa, por consiguiente, la representatividad depende de su
intención u opinión, y la evaluación de la representatividad es subjetiva, no tiene fundamento
probabilístico.

Muestreo por atributos. Muestreo en el que los elementos de la población, y por tanto de la
muestra están clasificados en dos o más categorías según un determinado atributo o
característica cualitativa.

Muestreo por variables. Muestreo en el que los elementos de la población presenta una
característica o variable que sea medible y que es objeto de la inspección.

Muestreo sin normas. Muestreo en el que la muestra se toma de cualquier manera, por
razones de comodidad o capricho. La representatividad de tal muestra suele ser insatisfactoria,
a no ser que la población sea homogénea en el atributo que está considerando, no tiene
fundamento probabilístico.

Ejercicios:

1. Se desea un muestreo de 15 páginas de un libro de estadística ¿qué método es más


conveniente?

2. Asuma que se tiene una población de 10 000 y se desea obtener una muestra aleatoria de
20. ¿Qué método es más conveniente?

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

3. Si usamos un calendario y comenzando con el 6 seleccione cada decimo octavo día. ¿Cuál
es el método?

4. Una población está compuesta por grupos que tiene una amplia variación dentro de cada
uno de ellos pero poca variación de un grupo a otro. Seleccione el tipo apropiado de muestreo
para esta población.

5. La compañía local de televisión por cable está planeando agregar un canal a un servicio
básico, puede escoger de entre 5 canales y por ello desea tener la opinión de sus suscriptores.
Cuenta con 20 000 suscriptores y sabe que el 35% de ellos está compuesto por estudiantes
universitarios, el 45% por empleados administrativos, el 15% por obreros y el 5% por otros. Sin
embargo, la compañía piensa que hay mucha variación dentro de estos grupos. ¿cuál es el
muestreo más adecuado?

6. Un estudio del senado sobre el asunto de la autonomía del distrito, implicó entrevistar a 2000
personas de la población de la ciudad con respecto a su opinión sobre varios aspectos
relacionados con esa autonomía. Coatzacoalcos es una ciudad en la que muchas secciones
son pobres y muchas ricas con muy pocas intermedias. Los investigadores que llevaron a cabo
el sondeo tenían razones para creer que las opiniones expresadas en las diferentes respuestas
dependían frecuentemente del ingreso, ¿qué método es más conveniente?

4.2 CONCEPTO DISTRIBUCIÓN DE MUESTREO DE LA MEDIA.

Una distribución de probabilidad de todas las medias posibles de las muestras es una
distribución de las medias de las muestras. Los especialistas en estadística la conocen como
distribución de muestreo de la media. Por ejemplo suponga que cada una de las muestras
tomadas consta de 10 mujeres de 25 años de edad residentes en una ciudad de 100 000
habitantes (una población infinita, de acuerdo con la terminología que hemos planteado). Al
calcular la estatura media y la desviación estándar correspondiente en cada una de estas
muestras, veríamos rápidamente que la media y la desviación estándar de cada muestra serían
diferentes.

También es posible obtener una distribución de muestreo de una proporción. Supongamos que
hemos determinado la fracción de pinos infectados de escarabajos en una muestra de 100
árboles, escogidos de un bosque muy grande. Hemos tomado un gran número de tales
muestras de 100 elementos si trazamos una distribución de probabilidad de las proporciones
posibles de árboles infectados en todas estas muestras, obtendríamos una distribución de las
proporciones de las muestras. En estadística, a esto se le conoce como distribución de
muestreo de la proporción. (Observé que el término proporción se refiere a la fracción de
arboles infectados.

La distribución de muestreo para la media se describe determinando la media de esta


distribución, que es el valor esperado E(x testada), y la desviación estándar de la distribución
de las medias muestrales, denotado por “x”. Debido a que esta desviación estándar es
indicativa de la exactitud del estadístico muestral como estimador de la media poblacional, a
“x” se le suele llamar error estándar de la media. Cuando se conocen los parámetros de la
población o del proceso, el valor esperado y el error estándar de la distribución de muestreo de
la media son:
E(x)= µ

x 
n

Ejemplo: Suponga que la media de una población muy grande es µ= 50 y que la desviación
estándar =12. La distribución de muestreo para las medias muestrales con tamaño de
muestra n=36, en términos del valor esperado y del error estándar de la distribución se
determina como sigue:

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

E(x)= µ= 50
 12 12
x    2
n 36 6

Cuando se extraen muestras de una población finita y de tamaño limitado existe un factor de
corrección finita para la determinación correcta del error estándar. El efecto de este factor de
corrección siempre es reducir el valor que se calcularía de otra manera. Como regla general, la
corrección es mínima y puede omitirse cuando n<0.05N, es decir, cuando el tamaño de la
muestra sea menor que el 5 % del tamaño de la población. Ya que en general las poblaciones
de las cuales se extraen muestras son grandes. La fórmula para el error estándar de la media
con el factor finito de corrección es:
 N n
x 
n N 1

En la fórmula, el factor de corrección es el que se halla dentro de la raíz cuadrada que se ha


agregado a la fórmula básica para el error estándar de la media. Este mismo factor de
corrección se puede agregar a cualquiera de las fórmulas para el error estándar de la media, de
la diferencia entre medias, de la proporción y de la diferencia entre proporciones.

Ejemplo: Suponga que en el ejemplo anterior n= 36 valores se extrae de una de una población
de solamente 100 valores. Entonces la muestra constituye el 36% de la población. El valor
esperado y el error estándar de la distribución de muestreo para la media son:
E(x)= µ= 50

 N n 12 100  36 12 64
x     1.6080
n N 1 36 100  1 6 99
Si no se conoce la desviación estándar de la población o del proceso, se puede estimar el error
estándar de la media usando la desviación estándar muestral como estimador de la desviación
estándar poblacional. Para diferenciar este error estándar estimado del error estándar exacto
basado en la sigma conocida, se le denota con el símbolo Sx

S
Sx 
n

Ejemplo: Un auditor toma una muestra aleatoria de tamaño n=16 de un conjunto de N= 1 500
cuentas por cobrar. La desviación estándar de los montos en todas las cuentas por cobrar no
se conoce. Sin embargo, la desviación estándar muestral es S= $57. El valor del error estándar
de la distribución de muestreo para la media se determina como sigue:
S 57
Sx    $14.25
n 16

Ejercicios:
1. Se sabe que la vida media de operación de los tubos de cinescopio de TV de una marca
específica es µ= 9 000 hrs. Y la desviación estándar es = 500 hrs. Determine el valor
esperado y el error estándar de la distribución de muestreo para la media dado un tamaño de
muestra de n=25.
Solución:

2. En una población grande de saldos de cuenta con distribución normal, el saldo medio es
µ=$150 y la desviación estándar es =$35, ¿cuál es la probabilidad de que la media de una
muestra aleatoria de n= 40 cuentas sea mayor que 160?
Solución:

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

3. Suponga una población que consiste solamente de los siguientes cuatro valores 3, 5, 7 y 8.
Calcule: a) La media poblacional y b) La desviación estándar
Solución:

4. Suponga que de la población que se describió en el problema anterior, se extraen muestras


aleatorias simples, cada una de tamaño n=2. En cada muestra, el primer elemento que se toma
no se devuelve a la población antes de elegir el segundo elemento.
a) Liste todos los posibles pares de valores que pueden constituir una muestra.
b) Para cada uno de los pares identificados en (a) calcule la media muestral y demuestre que la
media de todas las medias muestrales posibles es igual a la media de la población de la cual se
tomaron las muestras.
Solución:

5. De acuerdo a los dos últimos problemas calcule el error estándar de la media, considerando
que el valor de  se conoce y las muestras se toman de una población finita.
Solución:

6. El valor medio en pesos de los montos de ventas de un producto durante el año pasado por
plaza de venta al menudeo tiene distribución normal con µ=$3 400 y desviación estándar de
=$200. Si hay un gran número de plazas que manejan el producto, determine el error
estándar de la media en una muestra de tamaño n= 25.
Solución:

7. De acuerdo con el problema anterior, ¿Cuál es la probabilidad de que el monto de las ventas
de una plaza de venta al menudeo tomada en forma aleatoria, a) sea mayor que $3 500, b)
esté entre $3 350 y $3 450?, considere que no se conoce la muestra. Respuesta 0.3085 y
0.1974
Solución:

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

8. De acuerdo al mismo problema cuál es la probabilidad de que la media muestral en una


muestra de n= 25, a) sea mayor que $3 500, b) esté entre $3 350 y $3 450? Respuesta 0.0062
y 0.7888
Solución:

4.2.1 DISTRIBUCIÓN MUESTRAL DE LA MEDIA CON Σ2 CONOCIDA Y DESCONOCIDA.


4.2.2 DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA ENTRE DOS MEDIAS CON Σ2
CONOCIDA Y DESCONOCIDA.

Existen muchos problemas estadísticos en los que nos enfrentamos a decisiones sobre
el tamaño relativos de las medias de dos o más poblaciones. Por ejemplo, si dos métodos de
soldadura se consideran para su uso en rieles de ferrocarril, podemos tomar muestras y decidir
cuál es mejor comparando sus resistencias medias; así mismo, si se aplica un examen de
licenciatura a ingenieros graduados de dos universidades diferentes, puede interesarnos decidir
si cualquier diferencia observada entre las medias de los puntajes de los estudiantes de ambas
universidades es significativa o si puede atribuirse al azar, también se puede hacer un análisis
sobre la diferencia entre los niveles salariales de dos empresas.
 
El estimador no sesgado de (μ 1 – μ2) es ( ), de la misma manera, el error estándar de la
x1  x 2
distribución muestral que corresponde en este caso es el de la diferencia entre medias. El uso
de la distribución normal se basa en las mismas condiciones que para el caso de la distribución
muestral de la media, excepto que en este caso hay dos medias. La fórmula que se utiliza para
estimar la diferencia entre las medias de dos poblaciones es:

μ1 – μ2 = x1 - x2

    
2 2     
2 2

x
x1 x2
 
 x1 x2 
1

2x n1 n2
Ejemplo: (de distribución muestral de la diferencia de medias). El salario diario promedio para
una muestra de 30 empleados de una empresa manufacturera grande es de $28,000, con una
desviación estándar de $ 1,400. En otra empresa grande, una muestra aleatoria de 40
empleados tiene un salario promedio diario de $27,000, con desviación estándar muestral de
$1,000. Estimar la diferencia entre los niveles diarios de salarios en las dos empresas.

Solución:
μ1 – μ2 = 28,000 – 27,000 = $1,000

    
2 2
1400 1000
2 2

x
x1 x2
 
    $300.55
1
 x2 n1 n2 30 40

4.2.3 DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN.

Cuando hacemos inferencias acerca de una proporción poblacional, también es


importante comprender el comportamiento de las proporciones muestrales. Definimos la
distribución de proporciones muestrales de la siguiente manera: distribución de probabilidad de
proporciones muestrales, donde todas las muestras tiene el mismo tamaño “n”.

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

Uno de los usos clásicos de la estadística inferencial es el cálculo de alguna proporción


muestral y su aplicación para hacer una inferencia acerca de la proporción poblacional.
Encuestadores de la organización Gallup le preguntaron a 491 adultos que se seleccionaron al
azar si estaban a favor de la pena de muerte para una persona que sentenciaron por homicidio.
Los resultados mostraron que 319 individuos (o el 65% de ellos) se manifestaron a favor. El
resultado muestral conduce a la inferencia de que “el 65% de todos los adultos están a favor
de la pena de muerte para una persona sentenciada por homicidio”. La proporción muestral de
319/491 se utilizó para estimar una proporción poblacional “p”, pero aprenderemos mucho más
si comprendemos la distribución muestral de dichas proporciones.

En muchos casos de los negocios y la economía se usa la proporción muestral “p” para hacer
inferencias estadísticas sobre la proporción poblacional “P”. Este proceso se describe en la
figura 2.4. Podemos predecir que en cada repetición del proceso obtendremos un valor distinto
de la proporción de una muestra “p”. La distribución de probabilidad para todos los valores
posibles de la proporción muestral “p” se llama distribución muestral de la proporción “p”.

Figura 2.4 Proceso estadístico para usar una proporción muestral para hacer
inferencias acerca de una proporción poblacional.

Se selecciona una muestra


Población
aleatoria simple de n
con proporción elementos de la población.

p=?

Los datos muestrales


El valor de p se usa para proporcionan un valor de
hacer inferencias acerca la proporción p de la
del valor de P. muestra. .

Propiedades de la distribución de proporciones muestrales:


Las proporciones muestrales tienden a coincidir con el valor de la proporción poblacional.
En ciertas condiciones, la distribución de proporciones muestrales se aproxima a una
distribución normal.

Para determinar lo cercano que está la proporción muestral “p” de la proporción poblacional “P”,
es necesario comprender las propiedades de la distribución de “p”: su valor esperado, su
desviación estándar y la forma de su distribución.

El valor esperado de “p”, la media de todos los valores posibles de “p”, se puede expresar
como sigue:

E(p) = P

Donde:
E(p) = valor esperado de p
P = proporción poblacional

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

La desviación estándar de “p” se llama error estándar de la proporción. Igual que en el caso

de la media de la muestra x , la desviación estándar de p depende de si la población es finita
o infinita.

Población finita Población Infinita

 N  n   pq  pq
n     n 
 N  1  n  n

Donde: q = 1 – p

Seguiremos la misma regla para la media de muestra, es decir, si la población es finita y n/N ≤
0.05, se utiliza la fórmula para población infinita. Sin embargo, si la población es finita y n/N
≥0.05, se debe usar el factor de corrección para la población finita.

La distribución muestral de”p” se puede aproximar con una distribución de probabilidad normal,
siempre que el tamaño de la muestra sea grande. En el caso de “p”, se puede considerar que el
tamaño de la muestra es grande cuando se cumplen las dos condiciones siguientes:
np ≥ 5
nq ≥ 5

Ejemplo. (De distribución muestral de una proporción). Al director de personal de Electronics


Associates, Inc. (EAI) se le ha asignado la tarea de elaborar un perfil de los 2500 gerentes de la
empresa. Las características por identificar son, entre otras, el sueldo anual promedio y la
proporción de gerentes que terminaron el programa de adiestramiento administrativo de la
empresa. Además, los datos para el estado del programa de capacitación dejan ver que 1500
de 2500 gerentes terminaron el programa.
a) Calcule el valor esperado y error estándar de la proporción con tamaño de muestra 30.
b) Calcule el error estándar de la proporción con tamaño de muestra 100.
c) Determine la forma de distribución para muestra de tamaño 30
d) Con un tamaño de 30 gerentes, calcule la probabilidad de que la proporción en esa muestra
tenga un valor a  0.05 de la proporción de la población.
e) Con un tamaño de 100 gerentes, calcule la probabilidad de que la proporción en esa
muestra tenga un valor a  0.05 de la proporción de la población

Solución:
a) P = 1500/2500 = 0.60
E(p) = 0.60
q = 1 – 0.60 = 0.40
n/N = 30/2500 = 0.012 es menor a 0.05, por lo tanto

σp = √ (p q)/ n
σp = √ (0.60 * 0.40)/ 30
σp = 0.0894

b) n/N = 100/2500 = 0.04 es menor a 0.05, por lo tanto


σp = √ (p q)/ n
σp = √ (0.60 * 0.40)/ 100
σp = 0.0489

c) np = 30 * 0.60 = 18
nq = 30 * 0.40 = 12

Por lo tanto la forma de distribución muestral de “p” se puede aproximar con una curva de
distribución de probabilidad normal como se muestra en la figura.

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

σp = 0.0894

0.60

E(p)

d)

z=p–P= 0.55 – 0.60 = -0.56


σp 0.0894

z=p–P= 0.65 – 0.60 = 0.56


σp 0.0894

P (0.55<p<0.65) = 0.2123 + 0.2123 = 0.4246

0.55 0.60 0.65

e)

z=p–P= 0.55 – 0.60 = -1.02


σp 0.0489

z=p–P= 0.65 – 0.60 = 1.02


σp 0.0489

P (0.55<p<0.65) = 0.3461 + 0.3461 = 0.6922

Como se puede observar, al aumentar el tamaño de la muestra de 30 a 100 se aumenta


también la probabilidad de que la proporción muestral p esté dentro de 0.05 de la proporción
poblacional P.

Para estimar la diferencia entre las proporciones, el estimador no sesgado de (P 1 – P2) es (p1 –
p2). La fórmula para estimar la diferencia de dos proporciones es:

P1 – P2 = p1 – p2

 p1 q1  p2  q2 
 p1 p 2      
p1
2
p2
2

n1

n2

Ejemplo: (de distribución muestral de la diferencia de proporciones). Una empresa de


investigación de mercado entrevista a una muestra aleatoria de 100 hombres de una

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

comunidad grande y encuentra que una proporción muestral de 0.40 de ellos prefieren las
hojas de rasurar fabricada por la empresa cliente de los investigadores, y no las demás marcas.
En otra comunidad grande, 60 hombres de una muestra aleatoria de 200 prefirieron las hojas
de rasurar de la empresa cliente, muestre la distribución de muestreo de diferencia de
proporciones.

Solución:
Para calcular la diferencia de proporciones poblacionales es necesario primero calcular la
proporción poblacional de la segunda comunidad

P2 = 60 / 200 = 0.30

P1 – P2 = 0.40 – 0.30 = 0.10

 0.40  0.60   0.30  0.70


 p1 p 2   0.0587
100 200

4.2.4 DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE DOS PROPORCIONES.

4.3 TEOREMA DEL LÍMITE CENTRAL.

4.4 TIPOS DE ESTIMACIONES Y CARACTERÍSTICAS.

Todo el mundo hace estimaciones. Cuando está por cruzar una calle, hace una
estimación de la velocidad del automóvil que se acerca, de la distancia que hay entre usted y el
auto y de su propia velocidad. Habiendo hecho rápidamente todas estas estimaciones, usted
decide si espera, camina o corre.

Los administradores también deben hacer estimaciones rápidas. El resultado de estas


estimaciones puede afectar sus organizaciones de manera tan seria como el resultado de su
decisión de cruzar la calle. Los jefes de departamentos de una universidad hacen estimaciones
acerca de las inscripciones para el siguiente semestre en las materias. Los directores de
crédito estiman si un cliente pagará o no sus débitos. Todas estas personas hacen
estimaciones sin preocuparse de que si son científicos o no, pero con la esperanza de que las
estimaciones tengan una semejanza razonable con el resultado.

Los administradores utilizan estimaciones porque, hasta en los asuntos más triviales, deben
tomar decisiones racionales sin contar con la información pertinente completa y con una gran
incertidumbre de lo que el futuro pueda deparar.

Tipos de estimaciones. Podemos hacer dos tipos de estimaciones concernientes a una


población: una estimación puntual y una estimación de intervalo.

Una estimación puntual es solo un número que se utiliza para estimar un parámetro de
población desconocido. Por ejemplo si el jefe de departamento de una universidad estaría
haciendo una estimación puntual si afirmará “nuestros datos actuales indican que en esta
materia tendremos 350 estudiantes el siguiente semestre”

A menudo, una estimación puntual es insuficiente debido a que solo tienen dos opciones: es
correcta o está equivocada. Si le dicen solamente que la afirmación sobre la inscripción está
equivocada, no se sabe qué tanto está mal y no puede tener la certeza de que la estimación es
confiable.

Una estimación de intervalo es un rango de valores que se utiliza para estimar un parámetro
de la población. Una estimación de este tipo indica el error de dos maneras: por la extensión
del intervalo y por la probabilidad de que el verdadero parámetro poblacional se encuentre

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

dentro del intervalo. En este caso, el jefe de departamento diría algo como lo siguiente: “estimo
que la inscripción real de este curso para el próximo semestre estará entre 330 y 380, y es muy
probable que la inscripción exacta caiga dentro de este intervalo”.

Estimador y estimaciones. Cualquier estadístico de la muestra que se utilice para estimar un


parámetro poblacional se conoce como estimador, es decir, un estimador es un estadístico de
la muestra utilizado para estimar un parámetro poblacional. La media de la muestra x puede
ser un estimador de la media de la población µ, y la proporción de la muestra se puede utilizar
como un estimador de la proporción de la población. También es posible el rango de la muestra
como un estimador del rango de la población.

Cuando hemos observado un valor numérico específico de nuestro estimador, nos referimos a
ese valor como una estimación. En otras palabras, una estimación es un valor específico
observado de un estadístico. Hacemos una estimación si tomamos una muestra y calculamos
el valor que toma nuestro estimador en esa muestra. Suponga que calculamos la lectura media
de un odómetro (kilometraje) a partir de una muestra de taxis en servicio y encontramos que es
156 000 kilómetros. Si utilizamos este valor específico para estimar el kilometraje de la flotilla
de taxis completa, el valor obtenido de 156 000 kilometraje sería una estimación.

Ejemplos:

1. Considere el caso de una compañía de suministros clínicos que produce jeringas


desechables. Cada jeringa está cubierta por una envoltura estéril que a su vez se empaca en
grandes cajas de cartón corrugado. Debido al proceso de empaque, las cajas de cartón
contienen distintas cantidades de jeringas. Como las jeringas se venden por pieza, la compañía
necesita una estimación del número de piezas que hay por caja para propósitos de facturación.
Tomando una muestra de 35 cajas se registro el número de jeringas contenidas en cada caja.
Los cuales son: 101, 103, 112, 102, 98, 97, 93, 105, 100, 97, 107, 93, 94, 97, 97, 100, 110, 106,
110, 103, 99, 93, 98, 106, 100, 112, 105, 100, 114, 97, 110, 102, 98, 112, 99. Encuentre las
estimaciones puntuales de la media y la varianza de la población
Solución:
 x 3570
x   102 jeringas
n 35
 2
 ( x  x )
2 2 2
(101  102)  (103  102)  ...  (99  102) 1228
S     36.11  6.01
2

n 1 35  1 34
La estimación puntual de la media de la población es de 102 jeringas por caja.

2. Un coliseo estudia la posibilidad de ampliar su capacidad de asientos y necesita conocer


tanto el número promedio de personas que asisten a los eventos como la variabilidad de este
número. Los datos se refieren a la asistencia (en miles) a nueve eventos deportivos
seleccionados al azar. Encuentre las estimaciones puntuales de la media y la varianza de la
población de la que se tomó la muestra: 8.8, 14, 21.3, 7.9, 12.5, 20.6, 16.3, 14.1, 13.
Solución:
 x 128.5
x   14.277 Miles de persona
n 9
 2
 ( x  x) 2 2
(8.8  14.277)  (14  14.277)  ...  (13  14.277)
2

S    21.119
2

n 1 9 1
Miles de persona

3. Una sucursal para distribución de Pizzas ha desarrollado un buen negocio en la ciudad


entregando órdenes de pizzas con prontitud. La sucursal garantiza que sus pizzas se
entregarán en 30 minutos o menos a partir del momento en que se toma el pedido y, si la
entrega se retrasa, la pizza es gratis. El tiempo de entrega de cada pedido se registra en el
“libro oficial de tiempos de pizzas”, el tiempo de entrega con retraso se registra como 30

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

minutos en la lista oficial. Se enumeran 12 registros aleatorios de la lista: 15.3, 29.5, 30, 10.1,
30, 19.6, 10.8, 12.2, 14.8, 30, 22.1, 18.3. Encuentre la media de la muestra
Solución:
 x 242.7
x   20.225 min utos
n 12
Ejercicios:
1. Un meteorólogo que trabaja para la estación de televisión X, le gustaría informar sobre la
precipitación pluvial promedio para ese día en el noticiero de la tarde. Los datos siguientes
corresponden a las mediciones de precipitación pluvial (en centímetros) para 16 años en la
misma fecha, tomados al azar. Determine la precipitación pluvial media de la muestra: 0.47,
0.27, 0.13, 0.54, 0, 0.08, 0.75, 0.06, 0, 1.05, 0.34, 0.26, 0.17, 0.42, 0.50, 0.86
Solución:

2. Un Banco X quiere determinar el número de cajeros disponibles durante las horas pico de
los viernes. El banco ha recolectado datos del número de personas que entraron al banco los
viernes de los últimos 3 meses entre las 11:00 A.M. y la 1:00 P.M. utilice los siguientes datos
para encontrar las estimaciones puntuales de la media y la desviación estándar de la población
de donde se tomó la muestra: 242, 275, 289, 306, 342, 385, 279, 245, 269, 305, 294, 328.
Solución:

3. En una muestra de 400 trabajadores textiles, 184 de ellos expresaron gran insatisfacción con
el plan propuesto para modificar las condiciones de trabajo. Como el descuento de este grupo
fue lo suficientemente fuerte para hacer que la administración de la fábrica considerara la
reacción al plan como altamente negativa, tienen curiosidades de conocer la proporción del
total de trabajadores en contra. Dé una estimación puntual de esta proporción.
Solución:

Ejemplos:
1. Suponga que el director de estudios de mercado de una fábrica de refacciones automotrices
necesita hacer una estimación de la vida promedio de las baterías para automóvil que produce
su compañía. Seleccionamos una muestra aleatoria de 200 baterías, registramos el nombre y
dirección de los propietarios de los automóviles, como están en los registros de ventas,
entrevistamos a estas personas con respecto a la duración de la batería de su automóvil.
Nuestra muestra de 200 usuarios tiene una vida media de las baterías de 36 meses. Si la
desviación estándar de la población es de 10.
a) De una estimación de intervalo.
b) Estime un intervalo el cual tenga un 95.5% de probabilidad que esté dentro de dicho
intervalo.
Solución:
n= 200
= 10
 10 10
x     0.707
n 200 14.142 

x Z x
x  x
2. Para una población 36muestra
con una varianza conocida de 185, una 2(0.707 ) individuos lleva a
de 64
36 0.707
217 como estimación de la media: 36 1.414
35.292,36.707
34.586,37.414

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

a) Encuentre el error estándar de la media.


b) Establezca una estimación de intervalo que incluya la media de la población el 68.3% del
tiempo.
Solución:
= 13.6. n=64, x testada= 217
a) 1.7
b) 215.3, 218.7

3. Eunice es una ahorradora estudiante de licenciatura del tecnológico de la ciudad que está
interesada en comprar un auto usado. Selecciona al azar 125 anuncios y ve que el precio
promedio de un auto en esta muestra es de $3 250. Eunice sabe que la desviación estándar de
los precios de los autos usados en esta ciudad es $615.
a) Establezca una estimación de intervalo para el precio promedio de un automóvil de manera
que Eunice tenga una seguridad del 68.3% de que la media de la población está dentro de este
intervalo.
b) Establezca una estimación de intervalo para el precio promedio de un auto de modo que la
señorita Eunice tenga el 95.5% de certeza de que la media de la población está dentro de este
intervalo.
Solución:
= 615. n= 125, x testada= 3 250, error estándar= 55.01
a) 3 194.99, 3 305.01
b) 3 139.98, 3 360.02

4. El Tecnológico de Coatzacoalcos está llevando un estudio sobre el peso promedio de los


adoquines que conforman los andadores del campus. Se envía a algunos trabajadores a
desenterrar y pesar una muestra de 421 adoquines, y el peso promedio de la muestra resulta
ser 14.2. Todo mundo sabe que la desviación estándar del peso de un adoquín es 0.8 libras.
a) Encuentre el error estándar de la media
b) ¿Cuál es el intervalo alrededor de la media de la muestra que incluirá la población de la
media el 95.5% de las veces?
Solución:
a) 0.0390
b) 14.122, 14.278

4.5 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA DE UNA POBLACIÓN.

Uno de los principales problemas que se deben resolver al efectuar una encuesta por
muestreo es la determinación del tamaño de la muestra. Dado que el muestreo es costoso y
requiere de tiempo, el objetivo al seleccionar una muestra es obtener una cantidad especificada
de información a un costo mínimo. Esto se puede llevar a cabo estableciendo una cota para el
error de estimación y posteriormente aplicando la fórmula apropiada para la estimación del
tamaño de la muestra.

Cuando la población es uniforme, una muestra pequeña produce la misma cantidad de


información que una muestra grande. Por ejemplo un médico puede basar su diagnóstico en el
análisis con una sola gota de sangre del paciente. Por otro lado, si la población consiste en
elementos muy diferentes entre sí, una muestra pequeña puede ser un reflejo muy deficiente
de las características de la población.

Para obtener una mayor exactitud y por lo tanto mayor información sobre la población, es
necesario seleccionar una muestra de mayor tamaño, a mayor variabilidad de la población,
mayor es el tamaño de la muestra que se requiere para mantener un determinado grado de
exactitud en la estimación.

Muestreo aleatorio simple. En el muestreo aleatorio simple, el tamaño de la muestra que se


requiere para estimar la media poblacional (µ) dada una cota B para el error de estimación es:

N2 2
n D B
( N  1) D   2 4
ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

Donde 2 es la varianza poblacional, N es el número de elementos de la población, y B es la


cota para el error de estimación.

Si N es grande, la fórmula del tamaño de la muestra se reduce a:

n  2
4 2
B

Para encontrar (n) es necesario conocer la varianza poblacional, pero para estimarla es
necesario tener un conjunto de mediciones muestrales de la población. La varianza puede
estimarse con el valor de (S2) obtenido de una muestra previa o del conocimiento del recorrido
de las mediciones, usando el estimador:
1 2
2  Aproximación de la varianza.
( recorrido )
16 Ejemplo: El gerente de la división de
créditos de un banco desearía conocer la cantidad promedio de compras mensuales,
efectuadas con tarjeta de crédito por los clientes que tienen tarjetas emitidas por el banco.
Dado que existen 20 000 tarjetas de crédito vigentes emitidas por el banco, sería imposible
efectuar una revisión de cada una de las cuentas. El gerente propone la selección de una
muestra aleatoria simple de las cuentas correspondientes a las tarjetas de créditos vigentes
para estimar el saldo promedio mensual de las cuentas µ, con una cota para el error de B= $10.
A pesar de que no se tiene información previa para estimar la varianza 2, se sabe que la
mayoría de los saldos de las cuentas están entre $50 y $450. Encuentre el tamaño de la
muestra necesario para alcanzar la cota establecida.
Solución:
1 2 1 2
2  (recorrido )  (450  50)  10000
16 16

2 2
(10)
D B   25
4 4
N2 (20000)(10000) 200000000
n    392.176
( N  1) D   2
(20000  1)( 25)  10000 509975

Por lo tanto el gerente de crédito debe seleccionar en forma aleatoria aproximadamente 393
cuentas.

Con N grande:

n  2 
4 2 4(10000)
2
 400
B (10)

Muestreo estratificado. En el muestreo estratificado se selecciona una muestra aleatoria


simple en cada uno de los L estratos. Por lo tanto es imposible determinar (n) mientras no se
conozca su distribución en los diferentes estratos. Al usar el muestreo aleatorio estratificado, se
debe tomar en cuenta el hecho de que las varianzas de los estratos pueden no ser iguales.
Será necesario contar con aproximaciones para cada una de estas varianzas, que pueden
obtenerse de muestras previas o por estimación del recorrido de las mediciones dentro de
cada estratos.
2 1 2
 i  16 (recorrido )

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

Proporciona una estimación rudimentaria de la varianza de las mediciones del estrato (i)
basada en el recorrido de las mediciones contenidas en el estrato (i).

El tamaño de la muestra para la estimación de n en un muestreo aleatorio estratificado es:


L

N  i
2
i
n i 1
1 L 2
 Ni 
ND   2
N i i , D B 2, n i  n 
N i 1 4N N
Donde  i2 y Ni son respectivamente, la varianza y el tamaño
del i-ésimo estrato.

Ejemplo: El decano (Quien dirige una universidad) de una escuela de administración planea
entrevistar a los miembros de la asociación de exalumnos con el propósito de obtener
donativos para el fondo de desarrollo de la escuela. Actualmente la asociación tiene 3 500
miembros de los cuales 2 100 viven en el estado y los demás viven fuera del estado. El decano
ha decidido seleccionar una muestra estratificada de exalumnos para estimar el total de los
donativos, y con base en la evidencia muestral, decidirá si entrevista al resto de los alumnos.
Encuentre el número “n” de exalumnos que deben contactarse si el decano desea estimar el
total de las contribuciones con una cota para el error de estimación de $10 000, ¿cómo debe
distribuirse la muestra entre los exalumnos del estado y de fuera del estado? Con base en
campañas anteriores para la obtención de fondos, las desviaciones estándar para los donativos
de exalumnos del estado y de fuera del estado tienen un valor de $30 y $20, respectivamente.
Solución:
2 2
 1  (30)  900
2 2
 1  ( 20)  400
2 2
(10000)
D B 2   2.04
4N (4) (3500) 2
L

N 
i 1
i
2
i  (2100)(900)  (1400)( 400)  2450000

N  i
2
i
2450000
n i 1
  312.5  313
1 L
 1 
ND  
N i 1
2
N i i (3500)(2.04)   ( 2450000)
 3500 
 N1   2100 
n1  n   313   187.8
N  3500 

 N2   1400 
n 2  n   313   125.2
 N   3500 

4.6 INTERVALOS CONFIANZA PARA MEDIA, CON EL USO DE LA DISTRIBUCIÓN


NORMAL Y “T” STUDENT.
4.6.1 DETERMINACIÓN TAMAÑO MUESTRA CON GRADO DE CONFIANZA Y ESTIMACIÓN
DE µ.

ITESCO
Probabilidad y estadística descriptiva

Unidad IV “Muestreo”

ITESCO

Potrebbero piacerti anche