Sei sulla pagina 1di 18

ESTADÍSTICA III

UNIDAD 2 – MUESTREO IRRESTRICTO ALEATORIO


PARTE 1 – EJEMPLOS DE CLASE

INTRODUCCIÓN

Definición:

Si de una población de tamaño “N” se selecciona una muestra de tamaño “n” de tal manera que cada muestra
posible de tamaño n tiene la misma probabilidad de ser seleccionada, a este procedimiento se le denomina
“Muestreo Irrestricto Aleatorio”. A la muestra así obtenida se la denomina “Muestra Irrestricta Aleatoria”

CÓMO SE SELECCIONA UNA MUESTRA IRRESTRICTA ALEATORIA

EJEMPLO 1: Utilización de la Tabla de Números Aleatorios

Supongamos que en cierto hospital existen N = 1 000 registros de pacientes, de los cuales un auditor quiere
seleccionar una muestra irrestricta aleatoria de tamaño n = 20.

Solución:

Los dígitos de cualquier tabla de números aleatorios han sido generados para satisfacer el requisito de que
cualquier muestra de tamaño “n” tenga la misma probabilidad de ser seleccionada (NOTA: Aunque las
calculadoras pueden “generar” números aleatorios [igual en una hoja Excel], su utilización puede crear conflictos
para la selección correcta de una muestra. Estos posibles conflictos serán estudiados más adelante. Para efectos
académicos, aquí en este curso sólo se utilizará la tabla de números aleatorios proporcionada en clase)

En la situación de este ejemplo, consideremos que las 1 000 cuentas del hospital están numeradas así: 001, 002,
003, ….. , 999, 000 (Recuerde la definición de “Marco” en la Unidad anterior)

Para efectos académicos, supongamos que se escoge, como punto de arranque, la fila 1 columna 1. A
continuación aparecen los 20 números aleatorios (de 3 dígitos) que allí aparecen (lectura en vertical hacia abajo)

104 779 289 510 (Aquí otras instrucciones de manejo de la tabla)


223 995 635 023
241 963 094 010
421 895 103 521
375 854 071 070

***********************************

ESTIMACIÓN DE UNA MEDIA (µ) Y UN TOTAL (Ƭ) DE LA POBLACIÓN

EJEMPLO 2: Estimación de la media µ

El auditor del ejemplo anterior decidió mejor tomar una muestra irrestricta aleatoria de tamaño n = 190
(Recordemos que N = 1 000). La sumatoria de las deudas de esas 190 cuentas fue de ∑𝑖 𝑦𝑖 = $ 17.902, y la

Página 1 de 18
varianza muestral fue de 𝑠 2 = 445,21 $2 . Estime µ, el promedio de la deuda para las 1 000 cuentas del hospital,
establezca un límite para el error de estimación, y presente el correspondiente intervalo de confianza.

Solución:

a) Estimador:

y i
17.902
ˆ  y  i 1
  $94,22105263 = $ 94,22 (estimador puntual redondeado a dos decimales)
n 190

b) Límite para el error de estimación:

s2  N  n   445,21 1000  190 


2 Vˆ ( y )  2   2     $2,755358798
n  N   190   1000 

c) Intervalo de confianza (aprox 95%) para µ:

$ 94,22105263 ± $ 2.755358798  [91.46569383 , 96.97641143]


 [91,47 , 96,98] (redondeado a dos decimales) {Pregunta: ¿cómo se lee este intervalo?}

*******************************

EJEMPLO 3: Estimación de la media µ (uso de algunas fórmulas)

Una muestra irrestricta aleatoria de n = 9 es seleccionada para estimar la Y1 33,50


cantidad promedio de la deuda sobre N = 484 cuentas abiertas. Los valores de Y2 32,00
la muestra para estos nueve registros se presentan a la derecha. Estime µ, el Y3 52,00
promedio de la deuda para las 484 cuentas del hospital, establezca un límite Y4 43,00
para el error de estimación, y presente el correspondiente intervalo de Y5 40,00
confianza (95%). Y6 41,00
Y7 45,00
Y8 42,50
Solución: Y9 39,00

Primero, se realizan los siguientes cálculos (con su calculadora científica es más directo, aquí se presentan por el manejo de
algunas fórmulas, y para comprender mejor los conceptos): (NOTA: agregar algo al formulario)

∑9𝑖=1 𝑦𝑖 = 368,0 ∑9𝑖=1 𝑦𝑖2 = 15332,5


2
𝑛 2 𝑖=1 (∑𝑛 𝑦𝑖 )
∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2 ∑𝑛𝑖=1 𝑦𝑖2 − 𝑛𝑦̅ 2 ∑𝑖=1 𝑦𝑖 − 𝑛
𝑠2 = = = =
(𝑛 − 1) (𝑛 − 1) (𝑛 − 1)

(368)2
15332,5 − 9
= = 35,67361111
8

Página 2 de 18
Entonces:

a) Estimador:

y i
368
ˆ  y  i 1
  40,88888888  40,89 (estimación puntual redondeada a dos decimales)
n 9

b) Límite para el error de estimación:

ˆ s2  N  n   35,6736111  484  9 
2 V ( y)  2  2    484   $3,944631166
n  N   9  

c) Intervalo de confianza (aprox 95%) para µ:

$ 40,88888888 ± $ 3,944631166  [36,94425772 , 44,83352006]


 [37 , 45] (redondeado al entero) {Pregunta: ¿cómo se lee este intervalo?}

*******************************

NOTA: a partir del siguiente ejemplo no nos preocuparemos por el punto o la coma decimal. El contexto dirá
cómo debe leerse.

*******************************

EJEMPLO 4: Estimación del total ()

Una empresa industrial está interesada en el tiempo por semana que los científicos emplean para ciertas tareas
triviales. Las hojas de control de tiempos utilizadas en una muestra irrestricta aleatoria de n = 50 empleados
muestran que la cantidad promedia de tiempo empleado en esas tareas es de 10.31 horas, con una varianza
muestral de 2.25 horas2. La compañía emplea N = 750 científicos. Establezca el intervalo de confianza de
aproximadamente el 95% para el número total de horas-hombre que se pierden por semana en las tareas
insignificantes.

Solución:

a) Estimador:

ˆ  Ny  75010.31  7732.5 horas. (estimador puntual)

Página 3 de 18
b) Límite para el error de estimación:

 N  n  s   750  50  2.25 
2
2 Vˆ (ˆ)  2 Vˆ ( Ny )  2 N 2     2 7502     307.408523  307.4
 N  n   750  50 

c) Intervalo de confianza (aprox 95%) para :

7732.5 ± 307.408523  [7425.09148 , 8039.90852]


 [7425 , 8040] {Pregunta: ¿cómo se lee este intervalo?}

*******************************

EJEMPLO 5: Cálculo del tamaño de la muestra (n) para estimar µ

La cantidad promedio de dinero µ para las Cuentas por Cobrar de un hospital debe ser estimada. Aunque no se
cuenta con datos anteriores para estimar la varianza poblacional σ2, se sabe que la mayoría de las cuentas caen
dentro de una amplitud de variación de $100. Existen N =1000 cuentas abiertas. Encuentre el tamaño de
muestra necesario para estimar µ con un límite para el error de estimación de B = $3.

Solución:

N 2 B2
n , con D 
( N  1) D   2 4

Observe estas fórmulas. El tamaño de la muestra “n” depende de 2 (varianza de la población) y de B (Máximo
error permisible).

En este ejemplo, B = 3. Siempre se debe conocer B.

Note que las dimensiones de B deben ser las de la variable de interés. Note también que el valor de B no es
asunto estadístico sino un asunto de otra decisión. En este ejemplo, alguien (el gerente o quien contrata el
estudio) decidió que acepta un error de $3 entre el verdadero valor de µ (parámetro desconocido) y el valor de
𝑦̅ (estimador calculado en la muestra)

Ojo a lo que sigue:

2 , la varianza de la población, generalmente es desconocida. Entonces, si no se conoce, hay tres


aproximaciones para estimarla:

1) Con estudios similares


2) Con una premuestra (muestra piloto)
3) La regla burda:
Desviación estándar = ¼ [Amplitud] = ¼ [Mayor observación – Menor observación]
{¿Es ud capaz de entender esta regla burda? Puede ser pregunta en examen}

En este ejemplo; Amplitud = $100 (ver enunciado).

Página 4 de 18
Entonces,  = ¼ (100) = 25, por tanto 2 = (25)2 = 625

Reemplazando:

B 2 (3)2
Primero: D  = 4 = 2,25
4

N 2 (1000)(625)
Después: n   (999)(2,25)+625 = 217,5615699 = 218
( N  1) D   2

¿Entiende ud porqué n = 218? Hay que tomar 218 observaciones (aleatorias)

******************************

EJEMPLO 6: Cálculo del tamaño de la muestra (n) para estimar 

Un investigador está interesado en estimar la ganancia en peso total en 0 a 4 semanas de N = 1000 pollitos
alimentados con una nueva ración. Obviamente, pesar a cada ave sería tedioso y demorado. Por lo tanto,
determine el número de pollitos que serán seleccionados en este estudio para estimar  con un límite para el
error de estimación igual a 1000 gramos. Muchos estudios similares sobre nutrición de pollitos se han llevado a
cabo en el pasado. Usando los datos de esos estudios, el investigador encontró que σ2, la varianza poblacional,
fue aproximadamente igual a 36 gramos2. Determine el tamaño de muestra requerido.

Solución:

Revise el formulario (página 2). Aquí, B = 1000, y σ2 = 36 (Datos del enunciado). Note que se está utilizando la
primera aproximación para la varianza de la población presentada en el ejemplo 5.

Debe encontrar que D = 0,25 y n = 125,98 por lo que ud necesita pesar 126 pollitos (aleatoriamente).

[Aquí yo le agrego la siguiente pregunta: Ubíquese en la situación de N = 1000 pollitos en un corral. ¿Cómo haría ud para seleccionar,
aleatoriamente, 126 pollitos?]

***********

EJEMPLO 7: Estimación de la proporción (p) de una población

Una muestra aleatoria de n = 100 estudiantes de último año de un Estudiante Y X


colegio fue seleccionada para estimar: (1) la fracción de N = 300 1 1 0
estudiantes del último año que asistirán a una universidad, y (2) la 2 0 1
fracción de estudiantes que han tenido trabajos de tiempo parcial 3 0 1
durante su estancia en el colegio. Sean yi y xi (i = 1, 2, … , 100) las 4 1 1
respuestas del i-ésimo estudiante seleccionado. Estableceremos que yi . . .
= 0 si el i-ésimo estudiante no planea asistir a una institución de . . .
educación superior y yi = 1 si lo planea. Así mismo, sea xi = 0 si no ha . . .
tenido alguna vez un trabajo de tiempo parcial durante su estancia en 98 0 1
el colegio, y xi = 1 xi lo ha tenido. Usando los datos de la muestra 99 0 1

Página 5 de 18
presentados en la tabla de la derecha, estime p1, la proporción de 100 1 1
estudiantes del último año que planea asistir a una universidad y p2,
la proporción de estudiantes del último año que ha tenido un trabajo
de tiempo parcial.
y i  15 x i  65

Solución:

[¿Tiene ud claro que una proporción es otra variable de interés en un problema de muestreo?
¿Tiene ud claro que es posible que se tengan dos (o más) variables de interés en un problema de muestreo?
¿Tiene ud claro que una proporción es similar a un porcentaje de respuestas “SI” a una variable de interés?]

Antes dijimos en clase que para los parámetros se utilizaban letras griegas y para los estimadores se utilizaban
letras latinas. Pero eso no es regla universal. Para el caso de la “proporción”, el autor del texto guía utiliza letras
latinas para los parámetros y para los estimadores (eso hacen también otros autores, pero otros no). [Lo
importante es entender el contexto de las fórmulas].

Observe las fórmulas para la proporción (página 2 del formulario). Allí aparece “p” que es la proporción de “SI”
en la población. La letra “q” corresponde entonces al complemento (proporción de “NO” en la población)

Los estimadores para “p” y “q” serán 𝑝̂ 𝑦 𝑞̂

Entonces:

a) Estimador:

¿Planea educación superior? (variable de interés “y”)

y
i 1
i
15
pˆ 1  y    0,15  15%
n 100

¿Trabajo parcial? (variable de interés “x”):

x
i 1
i
65
pˆ 2  x    0,65  65%
n 100

b) Límite para el error de estimación:

pˆ qˆ  N  n 
2 Vˆ ( pˆ 1 )  2 1 1    0,058603271  0,059  5,9% (Verifique los cálculos)
n 1 N 

pˆ qˆ  N  n 
2 Vˆ ( pˆ 2 )  2 2 2    0,078281199  0,078  7,8% (Verifique los cálculos)
n 1  N 

Página 6 de 18
c) Intervalo de confianza (aprox 95%) para p:

¿Planea educación superior?  0,15 ± 0,058603271 = [9,1% , 20,9%] (con una cifra decimal)

¿Trabajo parcial?  0,65 ± 0,078281199 = [57,2% ,72,8%] (con una cifra decimal)

{¿Recuerda cómo se leen, probabilísticamente, los anteriores intervalos?}

***********

EJEMPLO 8: Cálculo del tamaño de la muestra (n) para estimar p

Los dirigentes del consejo estudiantil en un colegio desean realizar una encuesta para determinar la proporción
de estudiantes que está a favor de una propuesta de código de honor. Ya que entrevistar a N = 2000
estudiantes en un lapso razonable es casi imposible, determine el tamaño de muestra (número de estudiantes a
entrevistarse) necesario para estimar p con un límite para el error de estimación de magnitud B = 0.05. Suponga
que no hay información previa disponible para estimar p.

Solución:

La fórmula es (formulario, página 2)

Npq B2
n , con D  .
( N  1) D  pq 4

Aquí “p” es el verdadero valor de la proporción poblacional (desconocido generalmente, como cualquier
parámetro).

Para el caso de proporciones, también hay tres aproximaciones cuando no se conoce el parámetro “p”:

1) Con estudios similares


2) Con una premuestra (muestra piloto)
3) La regla burda:
Para proporciones (a diferencia del ejemplo 5) se recomienda “suponer” p = q = 0,5 (Note que es suponer que
el 50% de los elementos de la población son “SI”. Esto dará un valor de “n” mayor que lo que se obtendría con
otros valores de “p” y “q”.

Según el enunciado, B = 0,05 (implica que el error máximo permisible es 5%. [Como hemos dicho anteriormente,
pareciera que es la decisión del consejo estudiantil]. Note que en proporción las unidades son %). Además, como no hay
información previa disponible para estimar p, se tomará la regla burda.

Utilice su calculadora para encontrar n = 333,47. Por tanto, se deberán entrevistar 334 estudiantes para estimar
la proporción de ellos que están a favor de la propuesta de código de honor.

***********

Página 7 de 18
EJEMPLO 9: Cálculo del tamaño de la muestra (n) para estimar p

Con referencia al Ejemplo anterior, supóngase que además de estimar la proporción de estudiantes que apoya la
propuesta de código de honor, los dirigentes del consejo estudiantil también desean estimar el número de
estudiantes que considera que la organización del consejo estudiantil funciona de acuerdo a sus necesidades.
Determine el tamaño de muestra combinado que se requiere en una encuesta para estimar p1, la proporción de
quienes están a favor de la propuesta de código de honor, y p2, la proporción de los que opinan que el consejo
estudiantil funciona de acuerdo con sus necesidades, con límites para los errores de estimación de magnitud B1
= 0.05 y B2 = 0.07. Aunque no se dispone información anterior para estimar p2, aproximadamente el 60% de los
estudiantes opinó que el consejo satisfizo adecuadamente sus necesidades en una encuesta similar llevada a
cabo el año anterior.

Solución:

Observe que se ha subrayado la expresión “tamaño de muestra combinado”. Esto quiere decir que se deben
realizar dos cálculos para “n”, uno para cada interés expreso en el enunciado. Al final, ojo, usted seleccionará el
mayor valor de “n”.

Entonces:

1) Propuesta del código de honor:

Corresponde al ejercicio anterior. Allá, n = 334. Decimos, entonces, n1 = 334

2) Opinión del funcionamiento del consejo estudiantil:

Aquí, B = 0,07 y p = 0,6 (primera aproximación: estudios similares. Ojo, es 𝑝̂ )

Utilice su calculadora para encontrar n = 178,52. Por tanto, se deberán entrevistar 179 estudiantes para estimar
la proporción de ellos que están a favor del funcionamiento del consejo estudiantil.

Decimos, entonces, que n2 = 179

Como ahora es “tamaño de muestra combinado”, seleccionamos el mayor valor entre n1 y n2.

Por tanto, n = 334 (tamaño de muestra para lograr ambos objetivos)

*******************

Ejemplos 10 y 11: Muestreo ppt (Probabilidad Proporcional al Tamaño)

Contexto:

Supongamos que deseamos hacer un estudio referente a los empleos vacantes en las empresas manufactureras
de Pereira. Para ello, se decide tomar una muestra de n = 10 empresas manufactureras entre las N = 500 en la
ciudad (datos ficticios).

Página 8 de 18
La definición de una muestra irrestricta aleatoria (¿la recuerda?) dice que cualquier muestra debe tener la
misma probabilidad de ser seleccionada. Pero, en esta situación particular, quizá eso no sea lo apropiado, ya que
las N = 500 empresas no son similares (unas empresas serán muy grandes, con más empleos vacantes que las
empresas pequeñas). Una posible muestra podría mostrar sólo empresas pequeñas, lo que daría un estimador
de empleos vacantes muy bajo. El caso contrario sería que una muestra podría incluir muchas empresas
grandes, lo que también podría distorsionar la estimación de los empleos vacantes.

La teoría hasta ahora estudiada supone que los elementos de la población son relativamente similares. Es como
si en una urna tuviéramos muchas bolas de ping pong, que son similares. Pero la situación de los empleos
vacantes (variable de interés “y”), debido a que las empresas tienen tamaño diferente (variable auxiliar “x”) es
similar a tener dentro de la urna bolas de ping pong de diversos tamaños. En una muestra irrestricta aleatoria
(como los ejemplos anteriores) el tamaño de la empresa no es tenido en cuenta.

Debido al interés de la situación presentada (variable “y”) es mejor tener un procedimiento que considere a las
empresas grandes con mayor probabilidad de quedar en la muestra que las empresas pequeñas. Este
procedimiento se conoce con el nombre de MUESTREO ppt (Probabilidad Proporcional al Tamaño). Las fórmulas
correspondientes aparecen en la página 3 del formulario. Por favor revisarlas. Note el término i.

Aquí i = Probabilidad de que yi aparezca en la muestra. (¿Puede ud decir qué es yi?)

Note: Es necesario que las variables “y” (variable de interés) y “x” (variable auxiliar) estén altamente
correlacionadas. En la situación presentada como introducción, es de esperar que los empleos vacantes estén
altamente correlacionados con el tamaño de la empresa (¿Puede ud definir qué es correlación de dos variables?)

El procedimiento del muestreo ppt (probabilidad proporcional al tamaño) se presenta a continuación en dos
pasos (ejemplos 10 y 11)

Primer paso: Ejemplo 10

Un investigador desea estimar el número promedio de defectos por tablero que contienen los componentes
electrónicos, fabricados para la instalación en computadoras. Los tableros contienen un número diferente de
componentes, y el investigador considera que el número de defectos debe estar positivamente correlacionado
con el número de componentes en un tablero. Por lo tanto, se utilizará un muestreo ppt, siendo la probabilidad
de seleccionar cualquier tablero para la muestra, proporcional al número de componentes en el tablero. Una
muestra de n = 4 tableros será seleccionada de N = 10 tableros de la producción de un día. El número de
componentes en los 10 tableros son, respectivamente, 10, 12, 22, 8, 16, 24, 9, 10, 8, 31. Muestre cómo
seleccionar n = 4 tableros con probabilidades proporcionales al tamaño.

Solución:

Se elabora la siguiente tabla (los títulos de las columnas son suficientemente explicativos):

Tablero Número de Intervalo


componentes acumulado i
1 10 1 – 10 10/150
2 12 11 – 22 12/150
3 22 23 – 44 22/150

Página 9 de 18
4 8 45 – 52 8/150
5 16 53 – 68 16/150
6 24 69 – 92 24/150
7 9 93 – 101 9/150
8 10 102 – 111 10/150
9 8 112 – 119 8/150
10 31 120 – 150 31/150

Aquí la variable de interés es y = # de defectos por tablero


La variable auxiliar es x = # de componentes por tablero

(Note que la sumatoria de las i debe ser igual a 1.00)

Analogía: Podemos considerar que las 150 componentes están colocadas en una fila. El tablero # 1 tiene los
primeros 10 componentes (numerados del 1 al 10), el tablero # 2 tiene los siguientes 12 componentes
(numerados del 11 al 22), etc. La columna de los i garantiza que los tableros con más componentes tienen
mayor probabilidad de selección, pero las probabilidades son proporcionales al número de componentes
(muestreo ppt).

Ahora, la pregunta de este ejercicio es cómo se seleccionan 4 tableros. Entonces, acudimos a la tabla de
números aleatorios, de donde seleccionamos 4 números aleatorios entre 1 y 150. Supongamos que los números
aleatorios seleccionados fueron 14, 56, 94, 25.

Estos 4 números aleatorios se localizarán en la columna de Intervalo acumulado, resultando en la siguiente


muestra: Tableros 2, 5, 7 y 3 respectivamente. Pero a la hora de muestrear se seleccionan los tableros 2, 3, 5 y 7
(en ese orden). Estos tableros han sido seleccionados con probabilidades proporcionales al número de
componentes (muestreo ppt).

Nota: Este procedimiento ppt puede resultar en la repetición de un elemento (por ejemplo, es posible que dos
números aleatorios caigan en el mismo intervalo acumulado). En este caso, la medición en ese elemento se debe
considerar en dos veces.

Segundo paso: Ejemplo 11:

Después de que el muestreo del Ejemplo anterior fue completado, el número de defectos encontrados en los
tableros 2, 3, 5 y 7 fueron, respectivamente, 1, 3, 2 y 1. Estime el número promedio de defectos por tablero, y
establezca un límite para el error de estimación.

Solución:

Note que los valores de nuestra variable de interés en la muestra son así:

yi = 1, 3, 2, 1

(A partir de este momento nos olvidamos de la variable auxiliar “x” la cual sólo sirvió para los intervalos
acumulados)

Página 10 de 18
a) Estimador:

1 1 n  yi   1  1 3 2 1 
ˆ ppt  ˆ ppt  
Nn i 1   i
          1,7092803
N   (10)( 4)  12 / 150 22 / 150 16 / 150 9 / 150 

b) Límite para el error de estimación:

Observe que la fórmula implica el término Tao ppt circunflejo. Primero lo calculamos, recordando que µ = Ƭ/N,
1
de donde ˆ ppt  ˆ ppt , por tanto, ˆ ppt  Nˆ ppt  (10)(1,7092803)  17,092803
N

Entonces,

2
1 n
 yi 
2 Vˆ ( ˆ ppt )  2    ˆ ppt  =
N n(n  1) i 1   i
2

1 
 1
2
  3 
2


2   17, 092803    17, 092803   ....  0,34313771
(10) (4)(3) 
2
 12 / 150   22 / 150  

c) Intervalo de confianza (aprox 95%) para µppt:

1,7092803 ± 0,34313771 = [1,361426 , 2,05241801] = [1,36 , 2,05] (redondeado a dos decimales)

{¿Recuerda cómo se lee probabilísticamente este intervalo?}

NOTA FINAL SOBRE MUESTREO ppt:

Técnicamente se dice que este procedimiento debe utilizarse cuando las mediciones en la población varían
considerablemente en su tamaño, pero alguna medida aproximada de ese tamaño debe estar disponible antes
del muestreo.

RESUMEN DE ESTA UNIDAD:

El objetivo de la estadística es hacer inferencias acerca de una población con base en la información contenida en una muestra. Dos
factores afectan la cantidad de información en una investigación dada: El primero es el tamaño de la muestra. Mientras más grande sea
el tamaño de la muestra, mayor será la información que esperamos obtener acerca de la población. El segundo factor que afecta la
cantidad de información es la magnitud de variación en los datos. La variación puede ser controlada mediante el método por medio del
cual se obtienen las observaciones.

Página 11 de 18
En esta unidad se trató el método más simple, llamado Muestreo Irrestricto Aleatorio (Muestreo Aleatorio Simple MAS). Este diseño no
intenta reducir el efecto de la variación sobre el error de estimación. Una muestra irrestricta aleatoria de tamaño n ocurre si cada
muestra de n elementos de la población tiene la misma probabilidad de ser seleccionada. Las tablas de números aleatorios son útiles para
determinar los elementos que serán incluidos en una muestra aleatoria simple.

En la estimación de una media µ y un total , poblacionales, usamos la media muestral y y el total N y , respectivamente. Ambos
estimadores son insesgados; esto es, E( y ) = µ y E(N y ) = .

En alguna etapa durante el proceso, el experimentador debe decidir cuánta información se desea. , esto es, en qué magnitud puede
tolerarse un límite para el error de estimación. Las necesidades de tamaño de muestra fueron presentadas para estimar µ y  con un
límite para el error de estimación específico.

El tercer parámetro estimado fue la proporción poblacional p. Las propiedades de p̂ fueron presentadas y relacionadas con las
propiedades de y . La selección del tamaño de muestra para estimar p siguió el mismo criterio que el utilizado para estimar µ y .

Si las mediciones de la población varían considerablemente en tamaño, y si alguna medida aproximada de este tamaño está disponible
antes del muestreo, entonces el muestreo con probabilidades proporcionales al tamaño (ppt) puede ser ventajoso.

********************************

TAREA UNIDAD 2 - MUESTREO ALEATORIO SIMPLE - EXPERIENCIA CON DATOS REALES

La tabla siguiente presenta algunas de las estadísticas finales para la temporada 1992-1993 de la Asociación Nacional de Basquetbol de
Estados Unidos. Use esos datos para completar los ejercicios siguientes:

Puntos
Partidos ganados Partidos perdidos anotados Puntos permitidos Rechazos
División del Atlántico
Philadelpia 65 17 9191 8562 3920
Boston 56 26 9191 8752 3805
New Jersey 49 33 8672 8445 3693
New York 44 38 8198 7979 3343
Washington 42 40 8134 8145 3529
División del Centro
Milwaukee 51 31 8740 8379 3572
Atlanta 43 39 8335 8413 3572
Detroit 37 45 9239 9272 3789
Chicago 28 54 9102 9403 3794
Cleveland 23 59 7964 8574 3587
Indiana 20 62 8911 9391 3593
División del Medio Oeste
San Antonio 53 29 9375 9075 3831
Denver 45 37 10105 10054 3738
Kansas City 45 37 9328 9209 3663
Dallas 38 44 9243 9277 3677
Utah 30 52 8938 9282 3643
Houston 14 68 8145 9096 3466
División del Pacífico
Los Ángeles 58 24 9433 8978 3668
Phoenix 53 29 8776 8361 3612
Seattle 48 34 9019 8756 3721
Portland 46 36 8808 8633 3560
Golden State 30 52 8902 9205 3565
San Diego 25 57 8903 9299 3502

Página 12 de 18
(a) Seleccione una muestra irrestricta aleatoria de n = 5 equipos de los N = 23 equipos listados. Use los puntos anotados por los 5
equipos muestreados para encontrar el intervalo de confianza de aproximadamente 95% para el número promedio de puntos
anotados por equipo y para el número total de puntos anotados en la temporada por todos los equipos. ¿Incluye su segunda
estimación por intervalo, (para el total de puntos anotados), al total verdadero?
(b) Seleccione una muestra de n = 4 equipos con probabilidades proporcionales al número de partidos ganados. Use el número de
rechazos de estos cuatro equipos para estimar el número promedio de rechazos por equipo en la Asociación. Establezca un límite
para el error de estimación.

NOTA: Especificar claramente los pasos seguidos para este taller. En la tabla de números aleatorios no escoger como punto de partida el
punto de la primera fila y primera columna. Usted debe indicar en qué fila y en qué columna comenzó.

Página 13 de 18
ESTADÍSTICA III
UNIDAD 2 – MUESTREO IRRESTRICTO ALEATORIO
PARTE 2 – EJERCICIOS PROPUESTOS

1- Liste todas las posibles muestras irrestrictas aleatorias de tamaño n = 2 que pueden seleccionarse
de la población {0, 1, 2, 3, 4}. Calcule la σ2 de la población y la V( y ) de la media muestral y .
N  n  2 
Luego, por cálculos directos, verifique que V ( y )    (Resp: σ2 = 2, V( y ) = 0.75)
N  1  n 
2- Para las muestras irrestrictas aleatorias generadas en el Ejercicio 1, calcule la s2 de cada muestra.
 
Verifique numéricamente que E s 2 
N
N 1
2
3- Las autoridades de un parque estatal están interesadas en la proporción de personas que
acampan y que consideran que el espacio del área disponible para acampar en un terreno en
particular es adecuado. Las autoridades decidieron tomar una muestra irrestricta aleatoria de n =
30 de los primeros N = 300 grupos acampados que visitan el campo. Sea yi= 0 si el jefe del i-ésimo
grupo muestreado considera que el espacio del área disponible para acampar no es adecuado, y
yi= 1 si considera que es adecuado (i = 1, 2, …, 30). Use los datos de la siguiente tabla para
estimar p, la proporción de personas que acampan y que consideran que el espacio del área
disponible para acampar es adecuado. Establezca un límite para el error de estimación.

Persona muestreada Respuesta, yi

1 1 Resp:
2 0 5
3 1 pˆ  , B  0.1313
6
. .
. .
29 1
30 1
y i  25

4- Use los datos del ejercicio 3 para determinar el tamaño de muestra requerido para estimar p con
un límite para el error de estimación de magnitud B = 0.05 (Resp: n = 128)
5- Una muestra irrestricta aleatoria de n = 100 medidores de agua es controlada dentro de una
comunidad para estimar el promedio de consumo de agua diario por casa durante un período de
verano. La media y la varianza muestrales fueron y = 12.5 y s2 = 1252. Si suponemos que hay N
= 10000 casas dentro de la comunidad, estime µ, el promedio de consumo diario verdadero, y
establezca un límite para el error de estimación (Resp: y = 12.5, B = 7.04)
6- Usando los datos del Ejercicio 5, estime el número total de galones de agua, , usado diariamente
durante un período seco. Establezca un límite para el error de estimación. (Resp:
ˆ  125000, B  70412.5)
7- Los encargados de administrar los recursos de los terrenos dedicados a la caza silvestre están
interesados en los tamaños de las poblaciones de venado y de conejo en los meses de invierno en
un bosque en particular. Como una estimación del tamaño de la población, los administradores
proponen usar el número promedio de grupos densos de conejos y de venados por parcelas de 10

Página 14 de 18
metros de lado. De acuerdo con una fotografía aérea, el bosque fue dividido en N = 10000 cuadros
de 10 metros de lado. Una muestra irrestricta aleatoria de n = 500 parcelas fue seleccionada, y se
observó el número de grupos densos de conejos y de venados. Los resultados de este estudio se
resumen en la siguiente tabla. Estime µ1 y µ2, el número promedio de grupos densos de venados y
conejos, respectivamente, por parcelas de 10 metros de lado. Establezca los límites para los
errores de estimación.
Venados Conejos Resp:

Media muestral 2.30 4.52 ˆ 1  2.30, ˆ 2  4.52


Varianza muestral 0.65 0.97 B  0.0703, B  0.0858
8- Una muestra irrestricta aleatoria de n = 40 estudiantes de una universidad pequeña fue
entrevistada para determinar la proporción de estudiantes que está a favor del cambio de sistema
semestral al trimestral. Veinticinco de los estudiantes respondieron afirmativamente. Estime la
proporción de estudiantes de esta universidad que está a favor del cambio (suponga que N =
2000). Establezca un límite para el error de estimación. (Resp: p̂ = 0.625, B = 0.1535)
9- Un odontólogo está interesado en la efectividad de una Niño Caries Niño Caries
nueva pasta dental. Un grupo de N = 1000 niños de
escuela participó en el estudio. Los registros de un estudio 1 0 6 0
anterior mostraron que había un promedio de 2.2 caries 2 4 7 3
cada seis meses para el grupo. Después de tres meses de 3 2 8 4
iniciado el estudio, el odontólogo muestreó n= 10 niños 4 3 9 1
para determinar cuánto habían progresado con la nueva 5 2 10 1
pasta dental. Usando los datos de la tabla de la derecha,
estime el número medio de caries para todo el grupo, y
establezca un límite para el error de estimación.
(Resp: ̂ = 2.0, B = 0.9381)
10- La Secretaría de Caza y Pesca de un departamento está interesado en la dirección de sus
programas futuros de caza. Para mantener un potencial mayor de caza futura, la Secretaría desea
determinar la proporción de cazadores que buscan cualquier tipo de ave de caza. Se obtuvo una
muestra irrestricta aleatoria de n = 1000 de los N = 99000 cazadores con permiso. Suponga que
430 indicaron que cazaron aves. Estime p, la proporción de cazadores con permiso que buscan
aves de caza. Establezca un límite para el error de estimación. (Resp: p̂ = 0.43, B = 0.0312)
11- Usando los datos del Ejercicio 10, determine el tamaño de muestra que la Secretaría debe obtener
para estimar la proporción de cazadores de aves de caza, dado un límite para el error de
estimación de magnitud B = 0.02. (Resp: n = 2392)
12- Una psicóloga desea estimar el tiempo de reacción promedio para un estímulo entre 200 pacientes
de un hospital especializado en trastornos nerviosos. Una muestra irrestricta aleatoria de 20
pacientes fue seleccionada, y fueron medidos sus tiempos de reacción, con los resultados
siguientes: y = 2.1 segundos, s = 0.4 segundos. Estime la media poblacional µ, y establezca un
límite para el error de estimación. (Resp: ̂ = 2.1, B = 0.170)
13- En el Ejercicio 12, ¿de qué tamaño deberá ser la muestra para estimar µ con un límite para el error
de estimación de 1 segundo? Use 1.0 segundos como una aproximación de la desviación
estándar poblacional. (Resp: n = 4)
14- En un estudio sociológico, realizado en una pequeña ciudad, se hicieron llamadas telefónicas para
estimar la proporción de hogares donde habita cuando menos una persona mayor de 65 años de
edad. La ciudad tiene 621 hogares, según el directorio telefónico más reciente. Una muestra
irrestricta aleatoria de n = 60 hogares fue seleccionada del directorio. Al terminar la investigación
de campo, de los 60 hogares muestreados, en 11 habita cuando menos una persona mayor de 65

Página 15 de 18
años de edad. Estime la proporción poblacional p, y establezca un límite para el error de
estimación. (Resp: p̂ = 11/60, B = 0.0958)
15- El gerente de un taller de maquinaria desea estimar el tiempo promedio que necesita un operador
para terminar una tarea sencilla. El taller tiene 98 operarios. Se seleccionaron aleatoriamente ocho
operarios y se les tomó el tiempo. Los resultados obtenidos fueron los siguientes (tiempos en
minutos): 4.2, 5.1, 7.9, 3.8, 5.3, 4.6, 5.1, 4.1. Estime el tiempo promedio de todos los operarios
para terminar la tarea, y establezca un límite para el error de estimación. (Resp: ̂ = 5.01, B =
0.8711)
16- En el Ejercicio 14, ¿de qué tamaño deberá ser la muestra para estimar p con un límite para el error
de estimación de 0.08? Suponga que la proporción verdadera p es aproximadamente 0.2. (Resp: n
= 87)
17- Un investigador está interesado en estimar el número total de “árboles marcados” (árboles más
grandes que cierto tamaño específico) en una plantación de N = 1500 hectáreas. Esta información
se utiliza para estimar el volumen total de madera aserrada para los árboles en la plantación. Una
muestra irrestricta aleatoria de n = 100 parcelas de una hectárea fue seleccionada, y cada parcela
fue examinada en relación con el número de árboles marcados. El promedio muestral para las 100
parcelas fue y = 25.2 con una varianza muestral de s2 = 136. Estime el número total de árboles
marcados en la plantación. Establezca un límite para el error de estimación. (Resp: ˆ = 37800, B =
3379.94)
18- Usando los resultados del Ejercicio 17, determine el tamaño de muestra requerido para estimar ,
el número total de árboles en la plantación, con un límite para el error de estimación de magnitud
B = 1500. (Resp: n = 400)
19- Una gran empresa constructora tiene 120 casas en diversas etapas de terminación. Para estimar la
cantidad total de $ que será registrada en el inventario de construcción en proceso, se seleccionó
una muestra irrestricta aleatoria de 12 de esas casas y se determinaron los costos acumulados en
cada una de ellas. Suponga que los costos obtenidos para las 12 casas de la muestra fueron los
siguientes (datos en miles de $): 35500, 36400, 32600, 38200, 30200, 29800, 26400, 32200,
28900, 34100, 38000, 27500. Estime los costos totales acumulados para las 120 casas, y
establezca un límite para el error de estimación. (Resp: ˆ = $3898000, B = $263918.17)
20- Un auditor detecta que cierta empresa regularmente exagera las cantidades de dinero de los
inventarios, a causa de los retrasos en el registro de los retiros. El auditor quiere estimar la
cantidad total exagerada sobre 1000 artículos listados, obteniendo las cantidades exactas
(revisadas) del inventario mediante una muestra irrestricta aleatoria de 15 artículos, y comparando
estas cifras exactas con las cantidades registradas. Los datos para los artículos seleccionados se
muestran en la siguiente tabla (todos los datos en miles de $). Estime la cantidad total exagerada
sobre los 1000 tipos de artículos, y establezca un límite para el error de estimación. (Resp: ˆ =
$17333.33, B = $4445.51)

Artículo Cantidad Cantidad Exageración


Número revisada registrada (diferencia)
1 175 210 35
2 295 305 10
3 68 91 23
4 74 82 8
5 128 140 12
6 241 250 9
7 362 384 22
8 72 80 8

Página 16 de 18
9 59 82 23
10 112 140 28
11 118 124 6
12 210 230 20
13 240 260 20
14 223 247 24
15 96 108 12

21- Un auditor muestrea aleatoriamente 20 Cuentas por Cobrar de las 500 cuentas de una empresa. El
auditor lista la cantidad de cada cuenta y verifica si los documentos respectivos cumplen con los
procedimientos establecidos. Los datos se presentan en la tabla siguiente (cantidades en miles de
$, S = Sí, N = No). Estime el total de Cuentas por Cobrar para las 500 cuentas de la empresa, y
establezca un límite para el error de estimación. ¿Considera usted que el promedio de las Cuentas
por Cobrar de la empresa excede de $250? ¿Por qué? (Resp: ˆ = $98550.00, B = $19905.83)

Cuenta Cantidad Concordanci Cuenta Cantidad Concordanci


a a
1 278 S 11 188 N
2 192 S 12 212 N
3 310 S 13 92 S
4 94 N 14 56 S
5 86 S 15 142 S
6 335 S 16 37 S
7 310 N 17 186 N
8 290 S 18 221 S
9 221 S 19 219 N
10 168 S 20 305 S

22- Remítase al Ejercicio 21. Con los datos referentes a la concordancia, estime la proporción de las
cuentas de la empresa que no cumplen con los procedimientos establecidos. Establezca un límite
para el error de estimación. ¿Considera usted que la proporción de cuentas que cumplen con los
procedimientos establecidos excede del 80%? ¿Por qué? (Resp: p̂ = 0.3, B = 0.2060)
23- Remítase a Ejercicio 21. Suponga ahora que las 20 cuentas dadas representan una población de
la cual n = 5 cuentas serán seleccionadas para una investigación más detallada (El cuentahabiente
será entrevistado para verificar las cantidades). Seleccione una muestra de 5 cuentas con
probabilidades proporcionales a las cantidades.
24- La siguiente tabla muestra gastos de consumo personal en Estados Unidos para una selección de
bienes y servicios (en miles de millones de dólares). Selecciones una muestra de tres categorías
con probabilidades proporcionales a los gastos de 1.981. Utilice para las categorías muestreadas
los datos de 1.982 para estimar el gasto total por las nueve categorías de 1.982. establezca un
límite para el error de estimación.

Categoría 1.981 1.982


Vehículos automotores 101.6 109.9
Muebles y enseres domésticos 93.3 93.5
Alimentos 375.9 396.9
Ropa 115.3 119.0

Página 17 de 18
Gasolina y aceite 94.6 91.5
Combustible y carbón 20.7 20.0
Vivienda 302.0 334.1
Funcionamiento de la vivienda 128.4 144.3
Transporte 65.5 68.4

25- Se está formulando un caso legal para un sindicato de secretarias, quienes alegan que sus
patrones les están pagando salarios injustamente bajos. Las 64 secretarias en la empresa tienen
un salario promedio anual de 18300 dólares, con una desviación estándar de 400 dólares. El
salario promedio para todas las secretarias en la ciudad en la que se localiza la empresa es de
20100 dólares. ¿Puede usted sustentar el alegato de las secretarias mediante argumentos
estadísticos? Si es así, planee cuidadosamente estos argumentos y las premisas que los
fundamentan.

Página 18 de 18