Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Unidad IV “Muestreo”
UNIDAD 4. MUESTREO.
Muestreo. Procedimiento mediante el cual se obtienen una o más muestras de una población.
En muchas ocasiones, al estudiar un fenómeno, se utiliza una parte del universo (una muestra)
cuyo análisis conduce a resultados similares como si se hubiera analizado el universo
completo.
En todas las ocasiones en que no es posible o conveniente realizar un censo, lo que hacemos
es trabajar con una muestra, entendiendo por tal una parte representativa de la población. Para
que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y
diferencias encontradas en la población, ejemplificar las características de la misma.
Cuando indicamos que una muestra es representativa indicamos que reúne aproximadamente
las características de la población que son importantes para la investigación.
Para que la muestra alcance los objetivos preestablecidos debe reunir las siguientes
características:
1. Ser representativa. Es decir, todos sus elementos deben presentar las mismas
cualidades y características de la población.
2. Ser suficiente. La cantidad de elementos seleccionados, si bien tiene que ser
representativa de la población, debe estar libre de errores.
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
Muestreo aleatorio simple. Muestreo en el que todas las muestras tienen la misma
probabilidad de ser seleccionadas. Muestreo en el que la muestra está formada por “n”
variables aleatorias independientes e idénticamente distribuidas a la variable aleatoria
poblacional.
Ejemplos:
1. Consideré una población de 8 estudiantes y una muestra de 2 elementos.
a) Se numeran 8 fichas del 1 al 8 que deberán ser de igual tamaño y color, un número
corresponde a cada uno de los elementos de la población.
b) Se mezclan las fichas en un recipiente, se toma una a ciegas, el estudiante
correspondiente a esa ficha será uno de los dos estudiantes de la muestra.
c) Se mezclan las 7 fichas restantes (sin depositar la ficha escogida en el paso anterior),
se toma otra de la misma manera, el estudiante escogido esta vez, completará la
muestra de 2 estudiantes.
O bien escribir el nombre de cada uno en el pedazo de papel y depositar estos pedazos de
papel en una caja. Después de revolverlos bien, se extraen los dos pedazos de papel al azar.
Este método funciona bien con un grupo pequeño de personas, pero presenta problemas si el
número de la población llega a cantidades del orden de los miles. También está el problema
adicional de no estar seguro de que los pedazos de papel estén bien revueltos.
2. Suponga que hay 100 empleados en una compañía y se desea entrevistar una muestra de
10 de ellos escogidos al azar.
Se podría obtener una muestra aleatoria al asignar a cada empleado un número desde 00 a 99,
mediante una tabla de números aleatorios.
Recorrer de arriba abajo las columnas, comenzando con la columna de la izquierda, y lea solo
los primeros dos dígitos en cada fila, si se llega hasta el final de la última columna de la
derecha y todavía no se tiene completo los 10 números de dos dígitos menores de 99
deseados, puede regresar al principio y comenzar a leer el tercero y cuarto dígito de cada
grupo o conjunto.
60187 61616 01429 07970 05517 52925 24104 78607 54766 81929 64989 70598
92235 65438 43635 33491 76225 22874 32949 53458 33228 45994 68244 39277
12179 71549 35520 18410 09560 49352 18799 62691 64569 63562 67390 83020
96758 03754 49321 87936 05413 46398 59110 89617 45552 09502 08042 64503
81941 00413 92880 14720 15730 62752 49866 59884 96847 00547 51754 71767
35083 25609 52866 05053 40544 02404 82240 24555 18246 99256 35920 54700
39795 55189 63958 00523 68412 40072 22616 88596 25564 80705 60824 26050
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
04684 48679 83415 37955 65891 01837 83777 80313 00016 44514 36851 82946
95281 22927 92719 81129 38087 75798 34156 26179 64881 64855 04107 77566
61761 72165 93396 24129 57458 02172 99906 48923 58897 10583 55176 42035
89158 23935 85897 17489 96832 74511 10503 38772 75055 60701 49418 22027
87659 49248 75616 55824 70556 60477 49051 95471 54228 45660 34622 53346
61290 29451 81591 71628 69040 24177 00937 14660 43365 81714 26704 07688
22969 39863 79240 69571 06134 07533 11463 67761 19585 32654 46391 25845
88341 53728 54030 57746 38350 59710 07233 02859 18183 29955 37665 51931
76125 84080 57750 44663 65413 52483 16579 28744 59485 29756 10142 65481
57259 72786 58410 09819 21147 35495 36026 04003 53607 73773 59021 21844
78566 78103 72208 95789 90762 58178 98995 29343 25884 64372 91624 00007
98613 40645 38460 72468 57198 12609 59809 56698 64823 42148 33746 65625
24818 22024 90561 66690 10909 24874 00407 39525 45822 06386 39067 91438
16756 20883 99623 18549 48874 79505 07836 64706 86492 43209 66736 02764
58026 16213 45300 99666 30045 33612 71236 32466 14378 77303 53584 82449
92318 78135 77401 05432 80591 01808 06575 19772 18409 62345 48777 52879
79913 64612 46873 29419 94288 43852 96845 07705 56612 49021 59375 54988
47849 82163 92766 91118 43332 00205 73493 31010 64403 60476 71086 11561
65684 90076 46499 99961 04640 65348 62136 60955 20674 37175 12953 96211
85182 02165 00222 79531 88275 32814 05581 57854 07131 98399 27174 34986
93372 81526 44197 77082 39869 27952 63894 62859 07997 02961 70235 33056
69281 06032 02737 31736 33836 03687 16198 33692 08045 81293 55733 22027
05182 73514 43106 08667 06729 58118 52900 85188 47180 91082 06920 67812
33036 62571 36110 24001 54241 04768 77200 26255 01273 91475 07766 54361
54274 46169 71217 95137 10393 81874 95444 03204 25117 44843 51911 28472
64770 80383 57006 16244 07391 18143 32847 65513 77654 36712 12892 35158
88963 89783 95292 58789 28952 25140 79045 74550 88692 88266 43953 78395
66496 15950 48691 87224 02908 36236 26872 28073 94726 00038 69420 73307
92684 52059 10623 90081 24393 97230 75743 88153 65886 66036 82653 71506
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
27802 21872 12534 50258 54590 11102 13500 24100 31779 84086 50011 62043
65323 09748 84002 47292 03963 44708 36373 28247 38510 04319 42977 29398
16068 46960 93170 14690 48202 16681 02606 52528 21671 90897 27346 00489
12277 52468 37647 95714 56936 58653 27709 57958 51261 11305 69391 21469
33591 95745 52924 24746 85429 12795 49179 34693 23400 64321 66840 28311
97913 92870 94060 54543 13067 08226 03552 31939 30547 76205 92949 34667
28460 07667 82973 50836 80117 89671 94457 53871 30010 95490 53393 51668
77765 80720 19097 23378 85256 47852 86389 42395 64323 00360 28498 75145
56455 09554 41277 94829 32407 83852 45307 33502 43459 93587 65021 51088
09340 81273 50194 49264 84016 77208 94425 82524 89131 45144 04900 22490
43427 44132 40201 71909 81544 95475 38893 94075 06065 84857 34524 67346
81452 15910 27522 66755 31080 45973 96723 26980 91803 11635 81915 02134
42060 31261 47032 52807 17822 88687 89641 69164 23536 74493 57168 09503
64625 25286 92781 54268 37993 35873 20539 79859 51385 09655 87352 66894
Muestreo aleatorio sistemático. Este procedimiento exige, como el anterior, numerar todos
los elementos de la población, pero en lugar de extraer “n” números aleatorios sólo se extrae
uno. Se parte de ese número aleatorio “i”, que es un número elegido al azar y los elementos
que integran la muestra son los que ocupan los lugares i, i+k, i+2k, i+3k,…,i+(n-1)k, es decir se
toman los individuos de “k” en “k”, siendo “k” el resultado de dividir el tamaño de la población
entre el tamaño de la muestra. K=N/n. El número “i” que empleamos como punto de partida
será un número al azar entre 1 y k. El riesgo en este tipo de muestreo está en los casos en que
se dan periocidades en la población ya que al elegir a los miembros de la muestra con una
periocidad constante (k) podemos introducir una homogeneidad que no se da en la población.
Ejemplo:
1. Suponga que hay 100 empleados en una compañía y se desea entrevistar una muestra de
10 de ellos escogidos al azar.
K=100/10= 10. Los empleados seleccionados serían 1, 11, 21, 31, etc.
Una muestra aleatoria estratificada es una muestra que se obtiene separando los elementos de
la población en grupos disjuntos, llamados estratos y seleccionando una muestra aleatoria
simple dentro de cada estrato.
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de
interés estarán representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse en ellos el muestreo aleatorio simple o el estratificado
para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la
población. (Tamaño geográfico, sexos, edades, etc).
Ejemplos: l
1. Supongamos que los pacientes de un médico están divididos en cuatro grupos de acuerdo
con su edad como se muestra en la tabla. El médico desea averiguar cuántas horas duermen
sus pacientes.
Grupo de edad Porcentaje del total
Nacimiento-19 años 30
20-39 años 40
40-59 años 20
60 años y mayores 10
Para obtener una estimación de esta característica de la población, podría tomar una muestra
aleatoria de cada uno de los cuatro grupos de edades y ponderar las muestras de acuerdo con
el porcentaje de pacientes en ese grupo. Este sería un ejemplo de una muestra estratificada.
El uso del muestreo por conglomerados produce normalmente una disminución de los costos,
pero algunas veces es necesario pagar un precio. En ocasiones el error de muestreo aumenta
debido a que los elementos de un conglomerado tienden a tener características comunes. Por
ejemplo, en encuestas de poblaciones humanas, los conglomerados son frecuentemente
vecindarios que son semejantes en los que se refiere a edad, ingreso, antecedentes étnico y
clase ocupacional. Por lo tanto, al seleccionar aleatoriamente los conglomerados para la
encuesta, se corre el riesgo de que algunas clases socioeconómica no estén representados
sino se incluyen sus vecindarios. Por otra parte otras clases pueden estar representadas con
exceso.
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
Una vez especificados los conglomerados, es necesario contar con una lista de todos ellos,
para seleccionar una muestra aleatoria de “m” conglomerados de los “M” de la población, se
usa el muestreo aleatorio simple.
Ejemplos:
1. Si un analista de la secretaría de trabajo necesita estudiar los salarios diarios que se pagan
en un área metropolitana, sería difícil obtener una lista de todos los asalariados de la población
objetivo. Sin embargo, podría obtenerse fácilmente una lista de las empresas de la región. Con
esta lista el analista puede tomar una muestra aleatoria de las empresas identificadas que
representan conglomerados de trabajadores y obtener los salarios que estas empresas les
pagan.
2. Supóngase que un economista desea estimar la cantidad promedio empleada en comida por
vivienda en una ciudad. Para usar muestreo aleatorio simple o muestreo aleatorio estratificado,
el economista debe tener una lista de todas las viviendas para poder seleccionar la muestra.
Sin embargo, obtener una lista de todas las viviendas de una ciudad puede ser muy costoso y
en algunos casos imposibles. Aun en el caso de tener la lista completa, los costos pueden ser
sumamente altos, porque al usar muestreos aleatorio simple o estratificado, las viviendas
escogidas pueden estar muy alejadas unas de otras. Como resultado de lo anterior, el costo de
la encuesta aumenta debido al tiempo de traslado de los entrevistadores y a otros gastos. En
lugar de seleccionar una muestra distribuida en toda la ciudad, el economista podría usar el
muestreo por conglomerados dividiendo la ciudad en conglomerados y obteniendo después
una muestra aleatoria de estos. Esto debe poder efectuarse más fácilmente pues es posible
que exista una lista de los diferentes conglomerados. Debe encuestarse cada uno de las
viviendas que estén en cada uno de los conglomerados escogidos. El costo total de la encuesta
disminuye dado que se ha eliminado la necesidad de elaborar una lista de todas las viviendas
y, dado que las viviendas que pertenecen a un conglomerado puede estar geográficamente
cercana, se reducen los gastos de los entrevistadores.
Muestreo por atributos. Muestreo en el que los elementos de la población, y por tanto de la
muestra están clasificados en dos o más categorías según un determinado atributo o
característica cualitativa.
Muestreo por variables. Muestreo en el que los elementos de la población presenta una
característica o variable que sea medible y que es objeto de la inspección.
Muestreo sin normas. Muestreo en el que la muestra se toma de cualquier manera, por
razones de comodidad o capricho. La representatividad de tal muestra suele ser insatisfactoria,
a no ser que la población sea homogénea en el atributo que está considerando, no tiene
fundamento probabilístico.
Ejercicios:
2. Asuma que se tiene una población de 10 000 y se desea obtener una muestra aleatoria de
20. ¿Qué método es más conveniente?
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
3. Si usamos un calendario y comenzando con el 6 seleccione cada decimo octavo día. ¿Cuál
es el método?
4. Una población está compuesta por grupos que tiene una amplia variación dentro de cada
uno de ellos pero poca variación de un grupo a otro. Seleccione el tipo apropiado de muestreo
para esta población.
5. La compañía local de televisión por cable está planeando agregar un canal a un servicio
básico, puede escoger de entre 5 canales y por ello desea tener la opinión de sus suscriptores.
Cuenta con 20 000 suscriptores y sabe que el 35% de ellos está compuesto por estudiantes
universitarios, el 45% por empleados administrativos, el 15% por obreros y el 5% por otros. Sin
embargo, la compañía piensa que hay mucha variación dentro de estos grupos. ¿cuál es el
muestreo más adecuado?
6. Un estudio del senado sobre el asunto de la autonomía del distrito, implicó entrevistar a 2000
personas de la población de la ciudad con respecto a su opinión sobre varios aspectos
relacionados con esa autonomía. Coatzacoalcos es una ciudad en la que muchas secciones
son pobres y muchas ricas con muy pocas intermedias. Los investigadores que llevaron a cabo
el sondeo tenían razones para creer que las opiniones expresadas en las diferentes respuestas
dependían frecuentemente del ingreso, ¿qué método es más conveniente?
Una distribución de probabilidad de todas las medias posibles de las muestras es una
distribución de las medias de las muestras. Los especialistas en estadística la conocen como
distribución de muestreo de la media. Por ejemplo suponga que cada una de las muestras
tomadas consta de 10 mujeres de 25 años de edad residentes en una ciudad de 100 000
habitantes (una población infinita, de acuerdo con la terminología que hemos planteado). Al
calcular la estatura media y la desviación estándar correspondiente en cada una de estas
muestras, veríamos rápidamente que la media y la desviación estándar de cada muestra serían
diferentes.
También es posible obtener una distribución de muestreo de una proporción. Supongamos que
hemos determinado la fracción de pinos infectados de escarabajos en una muestra de 100
árboles, escogidos de un bosque muy grande. Hemos tomado un gran número de tales
muestras de 100 elementos si trazamos una distribución de probabilidad de las proporciones
posibles de árboles infectados en todas estas muestras, obtendríamos una distribución de las
proporciones de las muestras. En estadística, a esto se le conoce como distribución de
muestreo de la proporción. (Observé que el término proporción se refiere a la fracción de
arboles infectados.
Ejemplo: Suponga que la media de una población muy grande es µ= 50 y que la desviación
estándar =12. La distribución de muestreo para las medias muestrales con tamaño de
muestra n=36, en términos del valor esperado y del error estándar de la distribución se
determina como sigue:
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
E(x)= µ= 50
12 12
x 2
n 36 6
Cuando se extraen muestras de una población finita y de tamaño limitado existe un factor de
corrección finita para la determinación correcta del error estándar. El efecto de este factor de
corrección siempre es reducir el valor que se calcularía de otra manera. Como regla general, la
corrección es mínima y puede omitirse cuando n<0.05N, es decir, cuando el tamaño de la
muestra sea menor que el 5 % del tamaño de la población. Ya que en general las poblaciones
de las cuales se extraen muestras son grandes. La fórmula para el error estándar de la media
con el factor finito de corrección es:
N n
x
n N 1
Ejemplo: Suponga que en el ejemplo anterior n= 36 valores se extrae de una de una población
de solamente 100 valores. Entonces la muestra constituye el 36% de la población. El valor
esperado y el error estándar de la distribución de muestreo para la media son:
E(x)= µ= 50
N n 12 100 36 12 64
x 1.6080
n N 1 36 100 1 6 99
Si no se conoce la desviación estándar de la población o del proceso, se puede estimar el error
estándar de la media usando la desviación estándar muestral como estimador de la desviación
estándar poblacional. Para diferenciar este error estándar estimado del error estándar exacto
basado en la sigma conocida, se le denota con el símbolo Sx
S
Sx
n
Ejemplo: Un auditor toma una muestra aleatoria de tamaño n=16 de un conjunto de N= 1 500
cuentas por cobrar. La desviación estándar de los montos en todas las cuentas por cobrar no
se conoce. Sin embargo, la desviación estándar muestral es S= $57. El valor del error estándar
de la distribución de muestreo para la media se determina como sigue:
S 57
Sx $14.25
n 16
Ejercicios:
1. Se sabe que la vida media de operación de los tubos de cinescopio de TV de una marca
específica es µ= 9 000 hrs. Y la desviación estándar es = 500 hrs. Determine el valor
esperado y el error estándar de la distribución de muestreo para la media dado un tamaño de
muestra de n=25.
Solución:
2. En una población grande de saldos de cuenta con distribución normal, el saldo medio es
µ=$150 y la desviación estándar es =$35, ¿cuál es la probabilidad de que la media de una
muestra aleatoria de n= 40 cuentas sea mayor que 160?
Solución:
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
3. Suponga una población que consiste solamente de los siguientes cuatro valores 3, 5, 7 y 8.
Calcule: a) La media poblacional y b) La desviación estándar
Solución:
5. De acuerdo a los dos últimos problemas calcule el error estándar de la media, considerando
que el valor de se conoce y las muestras se toman de una población finita.
Solución:
6. El valor medio en pesos de los montos de ventas de un producto durante el año pasado por
plaza de venta al menudeo tiene distribución normal con µ=$3 400 y desviación estándar de
=$200. Si hay un gran número de plazas que manejan el producto, determine el error
estándar de la media en una muestra de tamaño n= 25.
Solución:
7. De acuerdo con el problema anterior, ¿Cuál es la probabilidad de que el monto de las ventas
de una plaza de venta al menudeo tomada en forma aleatoria, a) sea mayor que $3 500, b)
esté entre $3 350 y $3 450?, considere que no se conoce la muestra. Respuesta 0.3085 y
0.1974
Solución:
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
Existen muchos problemas estadísticos en los que nos enfrentamos a decisiones sobre
el tamaño relativos de las medias de dos o más poblaciones. Por ejemplo, si dos métodos de
soldadura se consideran para su uso en rieles de ferrocarril, podemos tomar muestras y decidir
cuál es mejor comparando sus resistencias medias; así mismo, si se aplica un examen de
licenciatura a ingenieros graduados de dos universidades diferentes, puede interesarnos decidir
si cualquier diferencia observada entre las medias de los puntajes de los estudiantes de ambas
universidades es significativa o si puede atribuirse al azar, también se puede hacer un análisis
sobre la diferencia entre los niveles salariales de dos empresas.
El estimador no sesgado de (μ 1 – μ2) es ( ), de la misma manera, el error estándar de la
x1 x 2
distribución muestral que corresponde en este caso es el de la diferencia entre medias. El uso
de la distribución normal se basa en las mismas condiciones que para el caso de la distribución
muestral de la media, excepto que en este caso hay dos medias. La fórmula que se utiliza para
estimar la diferencia entre las medias de dos poblaciones es:
μ1 – μ2 = x1 - x2
2 2
2 2
x
x1 x2
x1 x2
1
2x n1 n2
Ejemplo: (de distribución muestral de la diferencia de medias). El salario diario promedio para
una muestra de 30 empleados de una empresa manufacturera grande es de $28,000, con una
desviación estándar de $ 1,400. En otra empresa grande, una muestra aleatoria de 40
empleados tiene un salario promedio diario de $27,000, con desviación estándar muestral de
$1,000. Estimar la diferencia entre los niveles diarios de salarios en las dos empresas.
Solución:
μ1 – μ2 = 28,000 – 27,000 = $1,000
2 2
1400 1000
2 2
x
x1 x2
$300.55
1
x2 n1 n2 30 40
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
En muchos casos de los negocios y la economía se usa la proporción muestral “p” para hacer
inferencias estadísticas sobre la proporción poblacional “P”. Este proceso se describe en la
figura 2.4. Podemos predecir que en cada repetición del proceso obtendremos un valor distinto
de la proporción de una muestra “p”. La distribución de probabilidad para todos los valores
posibles de la proporción muestral “p” se llama distribución muestral de la proporción “p”.
Figura 2.4 Proceso estadístico para usar una proporción muestral para hacer
inferencias acerca de una proporción poblacional.
p=?
Para determinar lo cercano que está la proporción muestral “p” de la proporción poblacional “P”,
es necesario comprender las propiedades de la distribución de “p”: su valor esperado, su
desviación estándar y la forma de su distribución.
El valor esperado de “p”, la media de todos los valores posibles de “p”, se puede expresar
como sigue:
E(p) = P
Donde:
E(p) = valor esperado de p
P = proporción poblacional
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
La desviación estándar de “p” se llama error estándar de la proporción. Igual que en el caso
de la media de la muestra x , la desviación estándar de p depende de si la población es finita
o infinita.
N n pq pq
n n
N 1 n n
Donde: q = 1 – p
Seguiremos la misma regla para la media de muestra, es decir, si la población es finita y n/N ≤
0.05, se utiliza la fórmula para población infinita. Sin embargo, si la población es finita y n/N
≥0.05, se debe usar el factor de corrección para la población finita.
La distribución muestral de”p” se puede aproximar con una distribución de probabilidad normal,
siempre que el tamaño de la muestra sea grande. En el caso de “p”, se puede considerar que el
tamaño de la muestra es grande cuando se cumplen las dos condiciones siguientes:
np ≥ 5
nq ≥ 5
Solución:
a) P = 1500/2500 = 0.60
E(p) = 0.60
q = 1 – 0.60 = 0.40
n/N = 30/2500 = 0.012 es menor a 0.05, por lo tanto
σp = √ (p q)/ n
σp = √ (0.60 * 0.40)/ 30
σp = 0.0894
c) np = 30 * 0.60 = 18
nq = 30 * 0.40 = 12
Por lo tanto la forma de distribución muestral de “p” se puede aproximar con una curva de
distribución de probabilidad normal como se muestra en la figura.
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
σp = 0.0894
0.60
E(p)
d)
e)
Para estimar la diferencia entre las proporciones, el estimador no sesgado de (P 1 – P2) es (p1 –
p2). La fórmula para estimar la diferencia de dos proporciones es:
P1 – P2 = p1 – p2
p1 q1 p2 q2
p1 p 2
p1
2
p2
2
n1
n2
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
comunidad grande y encuentra que una proporción muestral de 0.40 de ellos prefieren las
hojas de rasurar fabricada por la empresa cliente de los investigadores, y no las demás marcas.
En otra comunidad grande, 60 hombres de una muestra aleatoria de 200 prefirieron las hojas
de rasurar de la empresa cliente, muestre la distribución de muestreo de diferencia de
proporciones.
Solución:
Para calcular la diferencia de proporciones poblacionales es necesario primero calcular la
proporción poblacional de la segunda comunidad
P2 = 60 / 200 = 0.30
Todo el mundo hace estimaciones. Cuando está por cruzar una calle, hace una
estimación de la velocidad del automóvil que se acerca, de la distancia que hay entre usted y el
auto y de su propia velocidad. Habiendo hecho rápidamente todas estas estimaciones, usted
decide si espera, camina o corre.
Los administradores utilizan estimaciones porque, hasta en los asuntos más triviales, deben
tomar decisiones racionales sin contar con la información pertinente completa y con una gran
incertidumbre de lo que el futuro pueda deparar.
Una estimación puntual es solo un número que se utiliza para estimar un parámetro de
población desconocido. Por ejemplo si el jefe de departamento de una universidad estaría
haciendo una estimación puntual si afirmará “nuestros datos actuales indican que en esta
materia tendremos 350 estudiantes el siguiente semestre”
A menudo, una estimación puntual es insuficiente debido a que solo tienen dos opciones: es
correcta o está equivocada. Si le dicen solamente que la afirmación sobre la inscripción está
equivocada, no se sabe qué tanto está mal y no puede tener la certeza de que la estimación es
confiable.
Una estimación de intervalo es un rango de valores que se utiliza para estimar un parámetro
de la población. Una estimación de este tipo indica el error de dos maneras: por la extensión
del intervalo y por la probabilidad de que el verdadero parámetro poblacional se encuentre
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
dentro del intervalo. En este caso, el jefe de departamento diría algo como lo siguiente: “estimo
que la inscripción real de este curso para el próximo semestre estará entre 330 y 380, y es muy
probable que la inscripción exacta caiga dentro de este intervalo”.
Cuando hemos observado un valor numérico específico de nuestro estimador, nos referimos a
ese valor como una estimación. En otras palabras, una estimación es un valor específico
observado de un estadístico. Hacemos una estimación si tomamos una muestra y calculamos
el valor que toma nuestro estimador en esa muestra. Suponga que calculamos la lectura media
de un odómetro (kilometraje) a partir de una muestra de taxis en servicio y encontramos que es
156 000 kilómetros. Si utilizamos este valor específico para estimar el kilometraje de la flotilla
de taxis completa, el valor obtenido de 156 000 kilometraje sería una estimación.
Ejemplos:
n 1 35 1 34
La estimación puntual de la media de la población es de 102 jeringas por caja.
S 21.119
2
n 1 9 1
Miles de persona
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
minutos en la lista oficial. Se enumeran 12 registros aleatorios de la lista: 15.3, 29.5, 30, 10.1,
30, 19.6, 10.8, 12.2, 14.8, 30, 22.1, 18.3. Encuentre la media de la muestra
Solución:
x 242.7
x 20.225 min utos
n 12
Ejercicios:
1. Un meteorólogo que trabaja para la estación de televisión X, le gustaría informar sobre la
precipitación pluvial promedio para ese día en el noticiero de la tarde. Los datos siguientes
corresponden a las mediciones de precipitación pluvial (en centímetros) para 16 años en la
misma fecha, tomados al azar. Determine la precipitación pluvial media de la muestra: 0.47,
0.27, 0.13, 0.54, 0, 0.08, 0.75, 0.06, 0, 1.05, 0.34, 0.26, 0.17, 0.42, 0.50, 0.86
Solución:
2. Un Banco X quiere determinar el número de cajeros disponibles durante las horas pico de
los viernes. El banco ha recolectado datos del número de personas que entraron al banco los
viernes de los últimos 3 meses entre las 11:00 A.M. y la 1:00 P.M. utilice los siguientes datos
para encontrar las estimaciones puntuales de la media y la desviación estándar de la población
de donde se tomó la muestra: 242, 275, 289, 306, 342, 385, 279, 245, 269, 305, 294, 328.
Solución:
3. En una muestra de 400 trabajadores textiles, 184 de ellos expresaron gran insatisfacción con
el plan propuesto para modificar las condiciones de trabajo. Como el descuento de este grupo
fue lo suficientemente fuerte para hacer que la administración de la fábrica considerara la
reacción al plan como altamente negativa, tienen curiosidades de conocer la proporción del
total de trabajadores en contra. Dé una estimación puntual de esta proporción.
Solución:
Ejemplos:
1. Suponga que el director de estudios de mercado de una fábrica de refacciones automotrices
necesita hacer una estimación de la vida promedio de las baterías para automóvil que produce
su compañía. Seleccionamos una muestra aleatoria de 200 baterías, registramos el nombre y
dirección de los propietarios de los automóviles, como están en los registros de ventas,
entrevistamos a estas personas con respecto a la duración de la batería de su automóvil.
Nuestra muestra de 200 usuarios tiene una vida media de las baterías de 36 meses. Si la
desviación estándar de la población es de 10.
a) De una estimación de intervalo.
b) Estime un intervalo el cual tenga un 95.5% de probabilidad que esté dentro de dicho
intervalo.
Solución:
n= 200
= 10
10 10
x 0.707
n 200 14.142
x Z x
x x
2. Para una población 36muestra
con una varianza conocida de 185, una 2(0.707 ) individuos lleva a
de 64
36 0.707
217 como estimación de la media: 36 1.414
35.292,36.707
34.586,37.414
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
3. Eunice es una ahorradora estudiante de licenciatura del tecnológico de la ciudad que está
interesada en comprar un auto usado. Selecciona al azar 125 anuncios y ve que el precio
promedio de un auto en esta muestra es de $3 250. Eunice sabe que la desviación estándar de
los precios de los autos usados en esta ciudad es $615.
a) Establezca una estimación de intervalo para el precio promedio de un automóvil de manera
que Eunice tenga una seguridad del 68.3% de que la media de la población está dentro de este
intervalo.
b) Establezca una estimación de intervalo para el precio promedio de un auto de modo que la
señorita Eunice tenga el 95.5% de certeza de que la media de la población está dentro de este
intervalo.
Solución:
= 615. n= 125, x testada= 3 250, error estándar= 55.01
a) 3 194.99, 3 305.01
b) 3 139.98, 3 360.02
Uno de los principales problemas que se deben resolver al efectuar una encuesta por
muestreo es la determinación del tamaño de la muestra. Dado que el muestreo es costoso y
requiere de tiempo, el objetivo al seleccionar una muestra es obtener una cantidad especificada
de información a un costo mínimo. Esto se puede llevar a cabo estableciendo una cota para el
error de estimación y posteriormente aplicando la fórmula apropiada para la estimación del
tamaño de la muestra.
Para obtener una mayor exactitud y por lo tanto mayor información sobre la población, es
necesario seleccionar una muestra de mayor tamaño, a mayor variabilidad de la población,
mayor es el tamaño de la muestra que se requiere para mantener un determinado grado de
exactitud en la estimación.
N2 2
n D B
( N 1) D 2 4
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
n 2
4 2
B
Para encontrar (n) es necesario conocer la varianza poblacional, pero para estimarla es
necesario tener un conjunto de mediciones muestrales de la población. La varianza puede
estimarse con el valor de (S2) obtenido de una muestra previa o del conocimiento del recorrido
de las mediciones, usando el estimador:
1 2
2 Aproximación de la varianza.
( recorrido )
16 Ejemplo: El gerente de la división de
créditos de un banco desearía conocer la cantidad promedio de compras mensuales,
efectuadas con tarjeta de crédito por los clientes que tienen tarjetas emitidas por el banco.
Dado que existen 20 000 tarjetas de crédito vigentes emitidas por el banco, sería imposible
efectuar una revisión de cada una de las cuentas. El gerente propone la selección de una
muestra aleatoria simple de las cuentas correspondientes a las tarjetas de créditos vigentes
para estimar el saldo promedio mensual de las cuentas µ, con una cota para el error de B= $10.
A pesar de que no se tiene información previa para estimar la varianza 2, se sabe que la
mayoría de los saldos de las cuentas están entre $50 y $450. Encuentre el tamaño de la
muestra necesario para alcanzar la cota establecida.
Solución:
1 2 1 2
2 (recorrido ) (450 50) 10000
16 16
2 2
(10)
D B 25
4 4
N2 (20000)(10000) 200000000
n 392.176
( N 1) D 2
(20000 1)( 25) 10000 509975
Por lo tanto el gerente de crédito debe seleccionar en forma aleatoria aproximadamente 393
cuentas.
Con N grande:
n 2
4 2 4(10000)
2
400
B (10)
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
Proporciona una estimación rudimentaria de la varianza de las mediciones del estrato (i)
basada en el recorrido de las mediciones contenidas en el estrato (i).
N i
2
i
n i 1
1 L 2
Ni
ND 2
N i i , D B 2, n i n
N i 1 4N N
Donde i2 y Ni son respectivamente, la varianza y el tamaño
del i-ésimo estrato.
Ejemplo: El decano (Quien dirige una universidad) de una escuela de administración planea
entrevistar a los miembros de la asociación de exalumnos con el propósito de obtener
donativos para el fondo de desarrollo de la escuela. Actualmente la asociación tiene 3 500
miembros de los cuales 2 100 viven en el estado y los demás viven fuera del estado. El decano
ha decidido seleccionar una muestra estratificada de exalumnos para estimar el total de los
donativos, y con base en la evidencia muestral, decidirá si entrevista al resto de los alumnos.
Encuentre el número “n” de exalumnos que deben contactarse si el decano desea estimar el
total de las contribuciones con una cota para el error de estimación de $10 000, ¿cómo debe
distribuirse la muestra entre los exalumnos del estado y de fuera del estado? Con base en
campañas anteriores para la obtención de fondos, las desviaciones estándar para los donativos
de exalumnos del estado y de fuera del estado tienen un valor de $30 y $20, respectivamente.
Solución:
2 2
1 (30) 900
2 2
1 ( 20) 400
2 2
(10000)
D B 2 2.04
4N (4) (3500) 2
L
N
i 1
i
2
i (2100)(900) (1400)( 400) 2450000
N i
2
i
2450000
n i 1
312.5 313
1 L
1
ND
N i 1
2
N i i (3500)(2.04) ( 2450000)
3500
N1 2100
n1 n 313 187.8
N 3500
N2 1400
n 2 n 313 125.2
N 3500
ITESCO
Probabilidad y estadística descriptiva
Unidad IV “Muestreo”
ITESCO