Sei sulla pagina 1di 24
CAPITULO Muestreo: estratificado, por conglomerados y otros métodos de muestreo ~ 17.1, Mugstreo estratificado 17.2. Otros métodos de muestreo ‘Analisis de los resultados de un muestreo Muestreo por conglomerados aleatorio estratificado Muestreo bietépico Atijacién del estuerzo muestral a los Métodos de muestreo no probabilisticos distintos estratos Determinacién del tamafio de la muestra para tun muestreo aleatorio estratificado con un grado de pracisién especiticado Introducci6n En algunas situaciones, es deseable dividir la poblacién en subgrupos llamados estratos, de manera que ca- da miembro de la poblacién pertenece a uno y solo a uno de los estratos. La base del estrato podria ser una caracteristica identificable de la poblacién que tenga especial interés para el investigador. Este tipo de mues- treo se llama muestreo estratiticado. En este capitulo, introducimos la estimacién de intervalos de confianza de una media poblacional, de una poblacién total y de una proporcion poblacional para el muestreo estratif- ccado y examinamos la afijacién del tamafio de la muestra en la atijacién proporcional y éptima. También pre- sentamos un breve andlisis del método de muestreo por conglomerados, del método de muestreo biet4pico y de los métodos de muestreo no probabilisticos, Muestreo estratificado Supongamos que decidimos investigar las opiniones de los estudiantes de nuestro campus universitario sobre algiin tema delicado, por lo que podria ser dificil formular las preguntas. Es probable que queramos hacer varias preguntas a cada miembro de la muestra y, dada la limitacién de recursos, solo es posible tomar una muestra bastante pequefia. Probablemente seleccionarfamos una muestra aleatoria simple, por ejemplo, de 100 estudiantes de una lista de todos los estudiantes del campus. Supongamos, sin embargo, {que tras examinar mas detenidamente los expedientes de los miembros de la muestra, observamos que solo dos estudian administracién de empresas, aunque la proporcién poblacional de estudiantes de admi- nistracién de empresas es mucho mayor. Nuestro problema en esta fase es doble. En primer lugar, pode- 772 Bstadistica para admintstracion y economia ‘mos muy bien tener interés en comparar las opiniones de los estudiantes de administracién de empresas con las del resto de la poblacién de estudiantes. Eso es dificilmente viable, dada su minima representa- ci6n en nuestra muestra. En segundo lugar, tal ve7 sospechemos que las opiniones de los estudiantes de administracién de empresas sobre esta cuestién son diferentes de las de sus compafieros. Si fuera asf, nos Preocupard la fiabilidad de la inferencia basada en una muestra en la que este grupo esté scriamente subrepresentad. Tal vez podrfamos consolamos pensando que como hemos tomado una muestra aleatoria, cualquier es- timador obtenido de la forma habitual sera insesgado, por lo que la inferencia resultante serd, en el sentido estadistico, estrictamente valida. Sin embargo, deberfa bastar una breve reflexién para convencernos de que ‘¢s0 no sirve de mucho consuelo. Lo tinico que significa que el estimador es insesgado es que si se repite el método de muestreo muchas veces y se calcula el estimador, su media serd igual al valor poblacional co- rrespondiente. Pero en realidad no vamos a repetir el método de muesireo muchas veces. Tenemos que basar nuestras conclusiones en una tinica muestra, por lo que el hecho de que los estudiantes le administra- cin de empresas pudieran haber estado sobrerrepresentados en otras muestras que hubiéramos podido to- mar, por lo que a largo plazo una e0sa compensaria la otra, no sirve de mucho. Existe una segunda y tentadora posibilidad que es preferible en muchos sentidos a la de utilizar la muestra original, Podrfamos descartar simplemente la muestra original y tomar otra. Si la constitucién de la muestra lograda en el segundo intento parece mds representativa de a poblaciGn en general, puede muy bien que sea mejor trabajar con ella, Ahora la dificultad estriba en que el método de muestreo que hemos adoptado —hacer un muestreo de la poblacién hasta lograr una muestra que nos guste— es muy dificil de formalizar, por lo que los resultados de la muestra son muy diffciles de analizar con alguna valider estadts- tica. Ya no es un muestreo aleatorio simple, por lo que los métodos de! Capitulo 7 no son estrictamente validos. Afortunadamente, existe un tercer sistema de muestreo para no tener este tipo de problema. Si se soxpe- cha al principio que determinadas caracterfsticas identificables de los miembros de la poblacién estén rela Cionadas con el tema de investigacién o si algunos subgrupos de Ia poblacisn tienen un interés especial para el investigador, no es necesario (y probablemente no sea deseable) conformarse con el muestreo aleatorio simple para scleccionar a los miembros de la muestra. En lugar de eso, se puede dividir la poblacién en subgrupos 0 estraios y tomar una muestra aleatoria simple de cada estrato. El dnico requisito es que sea posible identificar que cada miembro de la poblaciGn pertenece a uno de los estratos y solo a uno, Muestreo aleatorio estratificado ‘Supongamos que una poblacién de individuos puede subdividitse en K grupos mutuamente ex- uyyertes y colectvamente exhausivos o strates, Un muestre aleatorio estratficado os la solec- ‘muestras aleatorias simples independientes de cada uno de los estratos de la poblacién. Si los ‘Fourtce Go a potiacion conten Ne Ne Netninnaten: atone = Ny + Myton Nga No es necesario tomar el mismo numero de miembros de ta muestra de cada estrato. Sean los nime- 108 de la muestra n,. n,,.. 1x. En @8@ C480, 1 ntimero total de miembros de la muestra es atm tot en La poblacién de estudiantes cuyas ideas se quieren conocer podria dividirse en dos estratos: estudiantes de administraci6n de empresas y resto. También es posible hacer una estratificacién menos sencilla. Supon- ‘gamos que, en algin otro tema, creemos que ¢l sexo y el curso del estudiante (cuarto curso, tercer curso, segundo curso 0 primer curso) pueden ser relevantes. En ese caso, para satisfacer el requisito de que los Muestreo: estratificado, por conglomerados y otros métodos de muestreo 773, estratos sean mutuamente excluyentes y colectivamente exhaustivos, se necesitan ocho estratos: mujeres de cuarto curso, hombres de cuarto curso, etc Mis adelante en este apartado, nos preguntamos cémo se reparte el esfuerzo de muestreo entre los es- tratos. Una atractiva posibilidad, empleada a menudo en la préctica, es la afijacién proporcional: \a propor- ccidn de miembros de la muestra perteneciente a cualquier estrato es igual que la proporcién de miembros de la poblacién perteneciente a ese estrato, Analisis de los resultados de un muestreo aleatorio estratificado El andlisis de los resultados de una muestra aleatoria estratificada es relativamente sencillo. Sean Hy» Hay 0 ly las medias poblacionales de los K estratos y ¥),.F. .. Zx las medias muestrales correspondicn- tes. Consideremos un estrato, por ejemplo, el j-ésimo estrato. Dado que se ha tomado una muestra aleatoria simple en este estrato, la media muestral del estrato es un estimador insesgado de la media poblacional 14, Ademés, utilizando un método de estimacién insesgada de la varianza de la media muestral del estrato, Ia estimacién puntual es -2,%—0 an NAT donde 5} es la varianza muestral del -ésimo estrato. Es posible, pues, hacer una inferencia sobre los estratos individuales de la misma forma que en el Apartado 7.6 Generalmente, tienen interés las inferencias sobre la media y del conjunto de la poblacién, donde Minty + Natty +o + Notte 1 & nh Se obtiene una estimacién puntual l6gica de Ia siguiente manera: Un estimador insesgado de la varianza del estimador de 41 se deduce del hecho de que las muestras de cada estrato son independientes entre sf y la estimacién puntual es eee a= ya LNG, Las inferencias sobre la media del conjunto de la poblacién pueden basarse en estos resultados. Estimacién de la media poblacional utilizando muestras aleatorias estratificadas oe Rusa toman muestras aleatorias de n, individuos de estratos que contienen Ny, individuos i= 12h : j ‘ NENT, ‘Sean las medias y las varianzas muestrales de los estratos %, y.4f(j = 1,2, .. K)y la media del conjunto de la poblacién 1. Un método de estimacién insesgada de la media del conjunto de la poblacién j genera la sh guiente estimacién puntual i aoe 774 Estadistica para administracién y economia 2. Un método de estimacién insesgada de la varianza de nuestro estimador de la media del con- Junto de la poblacién genera la estimacién puntual the ee a ar Pa) 72) 3 W-m) a MD eae 73) 3. Siempre que el tamafio de la muestra sea grande, se obtiene una estimacién de un intervalo de confianza al 1001 ~ 2)*% de la media poblacional utilizande muestras aleato- ras estratificadas de la forma siguiente: tani a7) EREGREAN Cadena de restaurantes (estimacién) Una cadena de restaurantes tiene 60 en Illinois, 50 en Indiana y 45 en Ohio. La direccién esté consi- derando la posibilidad de afiadir un nuevo plato a su mend. Para averiguar cudl es la demanda proba- ble de este plato, se introduce en el ment de muestras aleatorias de 20 restaurantes de Illinois, diez de Indiana y nueve de Ohio. Utilizando los subindices 1, 2 y 3 para representar Ulinois, Indiana y Ohio, respectivamente, las medias y las desviaciones tipicas muestrales del ntimero de pedidos de este plato Por restaurante en los tres estados en una semana es FHUIQ< 57128 71330 14 H=BWl sy = 92 Estime el niimero medio de pedidos semanales por restaurante, 11, en todos los restaurantes de esta cadena. Solucién. Sabemos que N= 60 N,= 50 Ny=45 N= 155 m=12 m*10 my =9 1 Nuestra estimacién de la media poblacional es 1 & __ y(212) + (50)(13,3) + 45)(26.1) fey 155 ei Por tanto, el niimero medio estimado de pedidos semanales por restaurante es 20,1. EI paso siguiente es calcular las cantidades a2.8F 12 aay, 40 10 49 1D O27 , 36 9 4 xB ~ 11,108 us 7,695 Muestreo: estratificado, por conglomerados y otros métodos de muestreo 778 Estas cantidades, junto con las medias muestrales de cada estrato, pueden utilizarse para calcular intervalos de confianza de las medias poblacionales de los tres estratos Sin embargo, aquf centramos la atencién en a media del conjunto de la poblacién, Para obtener intervalos de confianza para esta cantidad, gz = $ 2g? 93 3 eo (60)°(11,108) + (50)°(10,609) + (45)°(7,695) oe (ss He Tomando la rafz cuadrada 4, = 1.85 Por tanto, el intervalo de confianza al 95 % del mimero medio de pedidos por restaurante realizados en una semana es 20,1 + (1,96)(1,85) El intervalo de confianza al 95 % va de 16,5 a 23,7 pedidos por restaurante. Dado que el total poblacional es el producto de la media poblacional y el nimero de miembros de la poblacién, estos métodos pueden modificarse facilmente para poder estimarlo, como se describe a conti- nuacién Estimacién del total poblacional utilizando muestras aleatorias estratificadas i? ‘Supongamos que se seleccionan muestras aleatorias de n, individuos de estratos que contienen A, indl- viduos (= 1,2, .. K)y que la cantidad que quiere estimarse es el total poblacional, Ny. 1. Un método de estimacién insesgade de Nj genera la siguiente estimacién puntual: Nig = YN a7) mm 2. Un método de estimacion insesgada de la varianza de nuestro estimador del total poblacional ‘genera a siguiente estimacion: k hua a6) 3. Siempre quo o! tamafio de la muestra sea grande, se obtiene una estimacién de un Intervalo de confianza al 100(1 — 2)% del total poblacional utilizando muestras aleatorias estratifi- ‘cadas de la forma siguiente: Nig & tea a7 Namero anual total de matriculados en estadistica para los negocios (estimacién) La editorial de un libro de texto de estadistica para los negocios quiere estimar el mimero total de estudiantes que estudian esta asignatura en todas las universidades de un pafs. Supongamos que de las 1.398 universidades que hay en ese pais, 364 son escuelas universitarias, en las que la duracién de los {ica para administracion y economia ‘estudios es de dos afios y 1,031 son facultades, en las que Ia duracién de los estudios es de cuatro afios. Se toma una muestra aleatoria de 40 escuelas universitarias y una muestra aleatoria simple in- dependiente de 60 facultades. La tabla adjunta muestra las medias muestrales y las desviaciones tipi cas muestrales del niimero de estudiantes matriculados el afio pasado en la asignatura de estadistica para los negocios. Estime el nimero total anual de matriculados en esa asignatura. Escuelas universitarias — Facultades Media 1543, 4118 Desviacién tipica 87,3 219.9 Solucion. Sabemos que N= 34 om N;= 1.031 om ‘Nuestra estimacién del total poblacional es 40H = 1543 5 87,3 219.9 60 H=48 sy x Ni + Y. Nyy = B64)(154,3) + (1.031)G411,8) = 480,731 ‘A continuacién, (87,3) 324 im eae a) 3 (rm) _ 2199" 971 RON te eae Io NT Por sitimo, x N?G2, = ¥ N}@2, = (364)*(170,06) + (1.031)(759,77) = 830.138,148,73 a ys tomando la raiz cuadrada, N62, = 28812 En el caso de un intervalo de confianza al 95 %, x2 = Zogas = 1,96 El imtervalo al 95 % que buscamos es, pues, 480.731 + (1,96)(28.812) Por tanto, nuestro intervalo de confianza al 95 % va de 424.259 a 537.203 estudiantes matriculados. Consideremos ahora el problema de estimar una proporcién poblacional basindonos en una muestra aleatoria estratificada. Sean P,, P>, ... Py las proporciones poblacionales de los K estratos y py. Py... Py las Proporciones muestrales correspondientes. Si P representa la proporcién de la poblacién total, su estima- cin se basa en el hecho de que Muesireo: estratificado, por conglomerados y otros métodos de muestreo 777. ‘A continuacién, se muestran los métodos para estimar la proporciGn poblacional a partir de una muestra aleatoria estratificada, Estimacién de la proporcién poblacional utilizando muestras aleatorias estratificadas ‘Supongamos que se toman muesiras aleatorias de n individuos de estratos que contienen \,individuos (= 1,2, .., K). Sea P, la proporcién poblacional y j, la proporcién muestral, en el j-ésimo estrato, de los que poseen una determinada caracteristica. Si P es la proporcién de la poblacién total, entonces 4. Un método de estimacién insesgada de P genera a 78) 2 Ln métode de estmaciéninsesgada de nuestro estimador de la proporcién de la poblacién total es. 5 a, a79) donde: a) Woe 98h Gee nso) ‘9s la estimaci6n de la varianza de la proporcién muestral del j-ésimo estrato. 3. Siempre que el tamafio de la muestra sea grande, se obtiene una estimacién de un intervalo de confianza al 100(1 ~ 2)% de la proporcién poblacional utilizando muestras aleatorias ‘estratificadas de la forma siguiente: Put %nh py (7ay, Estadistica Impartida en los departamentos de economia (estimacién) ‘Supongamos que en el estudio del Ejemplo 17.2 observamos que la asignatura de estadistica para los negocios es impartida por profesores del departamento de economia en siete escuelas universitarias y cen 13 facultades de la muestra, Estime la proporcién de todas las universidades en las que se imparte esta asignatura en el departamento de economta. Solucién. Sabemos que = 7 Ni=364 mj =40 f= Ze= OUTS N= 1.031 1m = 40 = 0,217 Nuestra estimacién de la proporcién poblacional es 1 x (364) (0.175) + (1.031) (0,217) Pay NB 7395 = 0,206 Por tanto, se estima que en el 20,6 % de todas las universidades el departamento de econom{a imparte Ja asignatura. 778 Estadistica para administracion y economia ‘A continuaci6n, (0,175)(0,825) | 324 a2 Al -Ad =m) =0,003304 amd Md 39 363 2 BO, Mm) GAIN OTS ., STE 0.002715 mma t Mt 39 1 Estos valores, junto con las proporciones muestrales de cada estrato, pueden utilizarse para calcular intervalos de confianza de las proporciones de 1a poblacién de los dos estratos. Si embargo, aqui ‘centramos Ia atencién en Ia estimaciGn por intervalos de la proporcién de la poblacién total, para aque : 2 oe - Eigen 0.002713) _ 4 691708 por lo que, tomando la rafz cuadrada, tenemos que Gs, = 0.0413 En el caso del intervalo de confianza al 90 %, x2 = fos = 1,645 y el intervalo de confianza al 90 % de la proporcién poblacional de una muestra aleatoria estrati- ficada es (0,206) + (1,645)(0,0413) Este intervalo va del 13,8 al 27,4 % de todas las universidades. Afijacion del esfuerzo muestral a los distintos estratos Queda por analizar la cuesti6n del reparto del esfuerzo muestral entre los estratos. Suponiendo que se sclec- ciona un total den miembros, ,cudntas de estas observaciones muestrales deben asignarse a cada estrato? En realidad, cl estudio en cuestién puede tener muchos objetivos, lo cual significa que no existe una clara respuesta. No obstante, es posible especificar unos criterios de eleccién que el investigador debe tener pre- sentes. Si se sabe poco 0 nada de antemang sobre la poblacién y si no hay estrictos requisitos para la pro- duccién de informacién sobre estratos poco poblados, es Kégico elegir una affjacidn proporcional, Afijacién proporcional: tamafio de la muestra La proporcién de miembros de la muestra que hay en un estrato es igual que la proporcién de miem- bros de la poblacién que hay en ese estrato. Por tanto, considerando el j-ésimo estrato, 4 eer tay 7.412) Por lo que el tamafio de la muestra del j-ésimo estrato utilizando la afljacién proporcional os Ny aun na 7.13) Muesireo: estratificado, por conglomeraclos y otros métodos de muestreo 779 Este mecanismo de afijacién intuitivamente razonable se emplea frecuentemente y permite, por lo ge- neral, realizar un andlisis satisfactorio, Obsérvese que en el Ejemplo 17.1 hemos utilizado ta afijacién pro- porcional. Hemos dividido un total de N= 155 restaurantes en tres estratos (Illinois, Indiana y Ohio). He- ‘mos scleccionado una muestra de n = 31, siendo 60 50 m= XB=120 mex: n= x3 is y= Fgg x 31= 10 31 A veces la utlizaci6n estricta de Ia afijacién proporcional produce relativamente pocas observaciones cn los estratos en los que el investigador esté especialmente interesado. En ese caso, la inferencia sobre los pardmetros poblacionales de estos estratos podrfa ser bastante imprecisa. En estas circunstancias, podrfa ser preferible afijar mas observaciones a esos estratos que las que dicta la afijacién proporcional. En los Ejem- plos 17.2 y 17.3, 364 de las 1.395 universidades son escuelas universitarias y se toma una muestra de 100 observaciones. Si se hubiera utilizado Ia afijaciOn proporcional, el ntimero de escuelas universitarias inclui- das en la muestra habria sido N Dado que el editor del Ejemplo 17.2 tenfa especial interés en obtene! pensé que no serfa adecuada una muestra de 26 observaciones solamente. Por esta raz6n, 40 de las 100 observaciones muestrales se afijaron a este estrato, Si el tinico objetivo de un estudio es estimar con la mayor precisiGn posible un parémetro relativo al conjunto de la poblacién, como la media, el total 6 la proporcién, y si se tiene bastante informacién sobre la poblacién, es posible establecer una afijacién dptima, Afijacién éptima: tamafio de la muestra del j-simo estrato, media o total dol conjunto de la poblacién ‘Silo que se necesita es estimar una media o un total del conjunto de una poblacién y si las varianzas poblacionales de los estratos individuales se representan por medio de a7, puede demostrarse que los ‘estimadores mas precisos se obtienen con la afijacion Sptima. El tamafio de la muestra del j-ésimo estrato para la media o el total del conjunto de la poblacién utilizando la afljacion éptima es ya pon 7.4) = Mo. Esta f6rmula es razonable intuitivamente, Comparada con la afijacién proporcional, asigna relat mente mas esfuerzo muestral a los estratos en los que la varianza poblacional es mayor. Es decir, se necesi- ta una muestra de mayor tamafio donde la variabilidad poblacional es mayor. Asf, en el Ejemplo 17.1, en el ‘que hemos utilizado 1a afijacién proporcional, si las diferencias observadas en las desviaciones tipicas muestrales reflejaran correctamente las diferencias que existen en las cantidades poblacionales, habrfa sido preferible tomar menos observaciones en el tercer estrato y més en el primero. El uso de la Ecuacién 17.14 plantea inmediatamente una objecién. Requiere conocer las des’ tipicas poblacionales, o), mientras que antes de que se tome la muestra, a menudo ni siquicra se dispone de estimaciones de estos valores que merezcan la pena, Esta cuestién se analiza en el ihimo apartado del capitulo. ‘A continuacién, se examina el tamafio de la muestra necesario en la afijacién Optima para una propor- cién pobla jones ional. 780. Estadistica para administracion y economia Afijacién optima: tamafio de la muestra del j-ésimo estrato, proporcién poblacional Para estimar la proporcién de la poblacién total, se obtienen estimadores con la menor varianza posible por medio de una afijacién éptima. El tamafio de la muestra del j-ésimo estrato para la proporcion poblacional utilizando Ia afijacion éptima es eS... 748) 5 MPTP La Ecuacién 17.15, en comparacién con la afijacién proporcional, asigna més observaciones muestrales alos estratos en Jos que las verdaderas proporciones poblacionales son mds cercanas a 0,50. La dificultad {que plantea el uso de la Ecuaci6n 17.15 esiriba en que implica las proporciones desconocidas P, para (= 1,2, .. K), que son las propias cantidades que el estudio pretende estimar, No obstante, a veces la informacién anterior sobre la poblacién puede dar al menos una idea aproxima- da de qué estratos tienen proporciones més cercanas a 0,5. En el Ejemplo 17.3, las proporciones muestrales sugieren que el mimero de escuelas universitarias que hay en la muestra deberfa haber sido menor que el niimero resultante de 1a afijacién proporcional. Se llega a la misma conclusién en este estudio cuando se comparan las desviaciones t{picas muestrales del Ejemplo 17.2 con la Ecuacién 17.14. A pesar de eso, se decidi6 incluir en la muestra mds escuclas universitarias en lugar de menos. La raz6n era que en este estu- dio el editor del Ejemplo 17.2 querfa tener informacién fiable tanto sobre el mercado de escuelas universi tarias como sobre el de facultades. Esta ilustracién sirve de ejemplo para hacer una importante observacisn, Aunque el reparto del esfuerzo ‘muestral que sugieren las Ecuaciones 17.14 y 17.15 a menudo se denomina afijacién dptima, solo es 6pti- ma con respecto al estricto criterio de la estimacién eficiente de los parimetros correspondientes al conjun- to de la poblacién, A menudo, los estudios tienen unos objetivos mas amplios que ese, en cuyo caso puede muy bien ser razonable no utilizar la afijacién éptima Determinacion del tamafio de la muestra para un muestreo aleatorio estratificado con un grado de precision especificado ‘También es posible obtencr f6rmulas para hallar el tamafio de la muestra necesario para lograr un grado de precisién especificado cuando se utiliza el muestreo aleatorio estratificado, Varianza del estimador de la media poblacional, muestreo estratificado ‘Sea la variable aleatoria X,, el estimador de la media poblacional obtenido mediante un muestreo estra- tifieado y X, (j= 1,2, .., K) las medias muestrales de los estratos individuales, Dado que (17.16) se deduce que la varlanza de ,, es Varta) = 08, = de Nf Vary = oh § np Lx MD a7a7) Nee yy Ned rs onde las a7 Son las varianzas poblacionales de los K estratos. Muestreo: estratifieado, por conglomerados y otros métodos de muestreo 781 Ahora puede utilizarse 1a Ecuaci6n 17.17, dada cualquier eleccién de ny... ng, para hallar la varian- 2a correspondiente del estimador de la media poblacional. Sin embargo, el tamafio total real de la muestra, nn, necesario para obtener un determinado valor de esta varianza, dependerd de la manera en que se repartan las observaciones muestrales entre los estratos. Ya hemos analizado dos métodos que se emplean frecuente- mente, la afijacién proporcional y la afijacién éptima. En cualquiera de los dos casos, sustituyendo los n, en la Ecuaci6n 17.17, podemos resolver la ecuacién resultante y hallar el tamafio de la muestra, n. Los resulta- dos se indican en las Ecuaciones 17.18 y 17.19. Tamajio total de la muestra para estimar la media global (varlanzas poblacionales. de los estratos especificadas), muestreo aleatorio estratificado ‘Supongamos que se subdivide una poblacién de WV miembros en K estratos que contienen N,, Nas.» Ne oe Ren meamar ame eee ee real ela . St se @ varlanza deseada, 3... del Sete OGD oe eee muestra necesaio, a Ce HE ae a= = (17.19) Cadena de restaurantes en tros estados (tamafio de la muestra) ‘Tomemos, al igual que en el Ejemplo 17.1, una muestra aleatoria estratificada para estimar el ndmero medio de pedidos por restaurante de un nuevo plato cuando el niimero de restaurantes que hay en los, tres estados es N= 60 N,=50 Ny= 45 Supongamos también que la experiencia de la cadena de restaurantes sugiere que las desviaciones {ipicas poblacionales de los tres estados es probable que sean aproximadamente e813 92-1 a=9 Si se necesita un intervalo de confianza al 95 % de la media poblacional cuya amplitud sea de tres pedidos por restaurante a cada lado de la estimacién puntual muestral, ;cuéintas observaciones mues- Irales se necesitan en total? Solucién. Obsérvese que 1,960¢,=3, porloque og, = 1,53 Nyo} = (60)(13)? + (50)(11)? + (45)(9)? = 19.835 TM Estadistica para administracion y economia 17.1. Una pequena ciudad contiene un total de 1.800 hogares. La ciudad esta dividida en tres distritos, que contienen 820, 540 y 440 hogares, respectivamente. Una muestra aleatoria estratficada de 300 hogares contiene 120, 90 y 90 hogares, respectivamente, de estos tres distros. Se Pide a los miembros de la muestra que estimen su factu ‘a total de electricidad de los meses de inviemo. Las res- pectivas medias muestrales son 290 $, 352 $ y 427 $ y las respectivas desviaciones tipicas muestrales son 47 $, 61S y 938, |& Utilice un método de estimacién insesgada para est mar la factura media de electricidad de los meses de invierno de todos los hogares de esta ciudad, . Utilice un método de estimacin insesgada para esti ‘mar la varianya del estimador del apartado (a. ‘e. Halle un imervalo de confianea al 95 % de la media poblacional de las facturas de electricidad de los me- ses de invierno de los hogares de esta ciudad. 17.2. Una universidad tiene 152 profesores ayudamtes, 127 ti- tulares y 208 catedraticos, Las autoridades universitarias 173. 782 y 2 is 5 vere (S0)(11) + GOP _ 19 494 Rt 155 En el caso de la afijacién proporcional, el tamafio de la muestra necesario es Ne? LNG 19.835 a ta 1,53)? + 19.835/155 No}, + E No? (155)(1,53) | Nini Por tanto, bastard una muestra de 41 observaciones para conseguir el nivel de precisién necesario. Si se utiliza la afijaciGn dptima, el tamaiio de la muestra necesario es 1 (ERM wi 2M ) 19.421 os oT 1 TsSy(.s3y + 198357155 Nok +S wer y /) Nis ‘por lo que se puede conseguir el mismo grado de fiabilidad con 40 observaciones si se utiliza este método de afijacién. En este caso concreto, como las desviaciones t{picas poblacionales son bastante ccercanas, la afijacién éptima solo representa un ahorro muy pequefio en comparacién con la afijacién roporcional. Ejercicios EJercicios aplicados stn investigando la cantidad de tiempo que dedican es- tos profesores a reuniones en un cuatrimestre. Se pide & muestra aleatorias de 40 profesores ayudantes, 40 ttu lares y 50 catedréticos que Heven la cuenta del tiempo ‘que dedican a reuniones en un cuatrimestre. Las medias muestrales son 27,6 horas en el caso de los profesores ayudantes, 39,2 en el de los ttalares y 43,3 en el de los ceatedréticos. Las desviaciones tipicas muestrales son 7.1 hhoras en e! caso de los profesores ayudantes, 9,9 en el de los ttalares y 12,3 en el de los catedrsticos. 1 Halle un intervalo de confianza al 90 % del tiempo medio dedicado a reuniones por los catedréticos de sta universidad en un cuatrimeste. todo de estimacién insesgada para esti mar el tiempo medio dedicado a reuniones por todos los profesores de esta universidad en un cuatrimestre. €. Halle intervalos de confianza del 90 y el 95 % del tiempo medio dedicado a reuniones por todos los profesores de esta universidad en un cuatrimestr. ‘Una empresa de autobuses est planificando una nueva ruta para dar servicio a cuatro barrios. Se toman mues- tras aleatorias de hogares de cada barrio y se pide a los 14 176. Muestreo: estratificado, por conglomerados y otros métodos de muestreo miembros de las muestras que valoren en una escala de 1 (totalmente en contra) a 5 (fotalmente a favor) su reac: Cin al servicio propuesto. La tabla adjunta muestra los resultados, Barrio! Bario? Barrio3 Barrio N, 240 190 350 nm 40 RS 508 ‘8, Halle un intervalo de confianza al 90 % de la reac~ ‘cién media de los hogares del barrio 1 . Utilice un método de estimacién insesgada para es- timar la reaccién media de todos los hogares a la nueva ruta, ‘¢. Halle intervalos de confianza al 90 y al 95 % de la reaccién media de todos los hogares a la nueva ruta. En una muestra aleatoria estratificada de estudiantes de ‘una pequefia universidad, se pide a los miembros de Ia imwestra que valoren en una eseala de I (pocas) a 5 (mu- chas) Ins oportunidades para realizar actividades extra- curriculares. La tabla adjunta muestra los resultados. Estudiantes de primer Estudiantes de tercer yy segundo ato yy cuarto aio Ny, 632 329 a 50 50 i 32 337 5 Los 0.86, a. Halle un intervalo de confianza al 95 % de la valora- cin media que harfan todos los estudiantes de primer ¥ segundo aio de este campus. b. Halle un intervalo de confianza al 95 % de a valora- cién media que harfan todos los estudiantes de tercer y cuarto aflo de este campus. ‘e. Halle un intervalo de confianza al 95 % de la valora- cin media que harfan todos los estudiantes de grado de este campus. 5. Wuelva al Ejercicio 17.2. fa. Halle un intervalo de confianza al 90 % de la canti- dad total de tiempo dedieada a reuniones por todos Jos profesores catedréticos de esta universidad en un ‘cuatrimestre . Halle un intervalo de confianza al 90 ‘ de la canti- dad total de tiempo dedicada a reuniones por todos. los profesores de esta universidad en un cuatri- rmestre, Una empresa tiene tres divisiones y los autores estén intentado estimar la camtidad otal de facturas pendicntes de cobro de la empresa. Se toman muestras aleatorias de 177. 178. 179. estas facturas en cada una de las tres divisiones y se ob- tienen Ios resultados que muestra la tabla, Division |___Divisién 2 __ Division 3 ™ 120 150 180 ™ 40 45 50 i 27S 198 $ 11s 5: 93s 4s 47s a. Unilice un método de estimacién insesgada para ha- ar una estimacién puntual del valor toial de todas las facturas pendientes de cobro de esta empresa. b. Halle un intervalo de confianza al 95 % del valor to- tal de todas las facturas pendientes de cobro de esta empresa. En una regi6n dividida en tres distritos, hay 227 puntos wiefl, Una nueva empresa TIC decide realizar una en- ccuesta en estos tres distritos para evalvar la instalacign de nuevos hotspots, Se aplicard un plan de muestreo para realizar la encuesta, La tabla adjunta muestra los puntos wi-fi, junto con la distancia al cuadrado (millas) y el coste del muestreo. Distancia al Puntos cuadrado Coste del Distrito wi (millas) muestreo 1 68 34 10 2 143 20 “4 3 16 59 18 Usilice ef método de muestreo estratificado para caleular el tamafio de la muestra que minimiza los costes. Una consultora ha desarrollado un curso breve sobre mé- todos modernos de prediccién para ejecutivos de empre- sa. Al primer curso han asistido 150 ejecutivos. Con la formacién suministrada por ellos, se ha legado a la cconclusin de que las cualificaciones técnicas de 100 asistentes al curso eran més que suficientes para seguir |a materia, mientras que las de los 50 restantes no lo ‘eran, Después de terminar el curso, se han enviado cues- tionarios a muestras aleatorias independientes de 25 per- sonas de cada uno de estos dos grupos para obtener in- formacién con el fin de mejorar la presentaciin de los ‘cursos posteriores, Seis del grupo mis cualificado y 14 . Afijacién Gptima, suponiendo que las desviaciones {lpicas poblacionales de los estratos son iguales que los valores muestrales correspondientes. Vuelva a los datos del Ejercicio 17.6. Si se toma una muestra total de 135 facturas pendientes de cobro, ave- 17.2. Otros métodos de muestreo r 14 i. Vuelva a los datos det rige cusntas deben ser de la divisién 1 utilizando cada uno de los sistemas siguientes: 1. Afijacisn proporcional . Afijacicn dptima, suponiendo que las desviaciones {ipicas poblacionales de los estratos son iguales que los valores muestrales correspondientes. mplo 17.2 Si se toma una ‘muestra total de 100 universidades, averighe cudntas eben ser facultades por medio de los siguientes si {& Afijacion proporcional 'b. Afijacién dptima, suponiendo que las desviaciones Lipicas poblacionales de los estratos son iguales que Jos valores muestrales correspondiente. Un auditor quiere estimar el valor medio de tas factu- ras pendientes de cobro de una empresa. La poblacién se divide en cuatro estratos, que contienen 500, 400, 300 y 200 Facturas, respectivamente, Basindose en la experiencia, se estima que las desviaciones tipicas de los valores de estos estratos serdn 150 S, 200 $, 300 § y 400 8, respectivamente. Si el intervalo de confianza al 90 % de la media del conjunto de la poblacién debe tener una amplitud de 25 § a cada lado de la estima- ccidn muestral, halle el tamafo total de In muestra necesario utilizando tanto la afijacién proporcional ‘como Ia Sptima Dobe estimarse la rent media de los hogares de una ciudad que puede dividirse en ues distrtos. La tabla ‘muestra la informacién relevante, Tamanho dela Desviacién tipica Distrito poblacién estimada ($) T 1150 4.000 2 2.120 6.000 3 930. 8.000 Si se necesita un intervalo de confianza al 95 % de Ia media poblacional que tenga una amplitud de 500 $ a ‘eada lado de Ia estimacién muestra, halle el mimero de ‘observaciones muestrales que se necesitan en total uti Tizando la afijacion proporcional y la éptima. Hemos analizado brevemente el muestrco alcatorio simple y el muestreo aleatorio estratificado, son los tinicos métodos que se utilizan para elegir una muestra, En este apartado, se analizan algunos otros. Muestreo por conglomerados Supongamos que un investigador quiere estudiar una poblacién que se encuentra repartida por una amplia zona geogrifica, como una gran ciudad o una regién. Si se utiliza una muestra aleatoria simple o una mues- Muestreo: estratificado, por conglomerados y otros métodos de muestreo 788 tra aleatoria estratificada, surgen inmediatamente dos problemas. En primer lugar, para extraer la mues- tra, el investigador necesita una lista razonablemente precisa de los miembros de la poblacién. Es posible que no se disponga de esa lista 0 que solo se pueda conseguir con un elevado coste. En segundo lugar, aunque el investigador posea una lista de la poblacién, los miembros de la muestra resultante estarén epartidos casi inevitablemente por una extensa zona, En ese caso, seria bastante caro que los entrevista- dores contactaran con cada uno de los miembros de Ia muestra. Naturalmente, este giltimo problema no se plantea si se envfa un cuestionario por correo. Sin embargo, puede ocurrir que con este medio de contacto Ja tasa de falta de respuesta sea inaceptablemente alta y que el investigador prefiera por ese motivo las centrevistas personales. Ante el dilema de no tener una lista fiable de 1a poblacién 0 querer hacer entrevistas personales con miembros de la muestra cuando los recursos presupuestarios son limitados, el investigador puede recurrir a ‘otro método de muestreo que se conoce con el nombre de muestreo por conglomerados. Este método es atractivo cuando es posible subdividir una poblacién en unidades relativamente pequefias y geogréfica- mente compactas Hamadas conglomerados. Por ejemplo, una ciudad podria subdividirse en distritos o en barrios. Eso generalmente es posible incluso cuando no se dispone de una lista completa de los residentes 0 de los hogares. En un muestreo por conglomerados, se selecciona una muestra aleatoria simple de conglomerados de la poblacién y se contacta con cada uno de los individuos de cada uno de los conglomerados de la muestra; es decir, se realiza un censo completo en cada uno de los conglomerados elegidos. En las siguientes ecuaci nes, mostramos cémo se pueden realizar inferencias vélidas sobre 1a media poblacional y la proporcién poblacional a partir de los resultados de una muestra de conglomerados. Estimadores en el muestreo por conglomerados ‘Se subdivide una poblacién en M conglomerados, se selecciona una muestra aleatoria ‘estos conglomerados y se obtiene informacién de cada uno de los miembros de los la muestra. Sean n,, my.» a €1 nmero de miembros de I eslansar ts hal rica cee oes de a muestra, Sean ts medias de estos congomeradoe 3, 5». Vl proporiones de mierbos {de los conglomerados que poseen un atributo de interés F, P, ~» Par El objetivo es estimar la media yy a proporcisn f del conjunto de la poblacién. 1. Utilizando métodos de estimacién insesgada, tenemos que o eS (17.20) = 6 » a7) ym t a 2, Las estimaciones de Ia varianza de estos estimadores, basadas en métodos de estimacién in- ssesgada, son a722) 786 Bstadistica para administracion y economia 1723) donde i= 5: m/m es el niimero medio de individuos que hay en los conglomerados de la muestra BasAndose en estos estimadores, se obtienen los intervalos de confianza utilizando el muestreo por conglo- merados Estimacién de 1a media poblacional utilizando el muestreo por conglomerados Siempre que el tamafio de la muestra sea grande, se obtione una estimacién de un intervalo de con- flanza al 100(1 ~ 2)% de la media poblacional utilizando el muestreo por congiomerados de la forma siguiente: Ret tnd, a729 También se hallan intervalos de confianza de la proporcisn poblacional utilizando el muestreo por con- glomerados, Estimacién de la proporcién poblacional, muestreo por conglomerados ‘Slempre que el tamafo de la muestra sea grande, se obtiene una estimacién de un intervalo de con- flanza al 100(1 ~ 2)% de la proporcién poblacional utilizando e] muestreo por conglomerades de la forma siguiente: Bet tendi (17.25) Obsérvese que pueden hacerse inferencias con una informacién previa relativamente pequefa sobre la poblacin. Lo tinico que se necesita es una division en conglomerados identificables. No es necesario saber cual es el miimero total de miembros de la poblacién. Basta con saber qué ntimero hay en cada uno de los conglomerados de la muestra y este puede averiguarse durante el estudio, ya que se toma un censo comple- to en cada conglomerado de la muestra. Ademés, dado que los miembros de la muestra estén geogritica- mente cerca unos de otros dentro de los conglomerados, es relativamente barato para los entrevistadores contactar con ellos. ‘Muestreo por conglomerados en el caso de las rentas familiares (estimacién) ‘Se toma una muestra aleatoria simple de 20 manzanas de una zona residencial que conticne un total de 1,000 manzanas. A continuaci6n, se entra en contacto con cada uno de los hogares de las man- zanas de la muestra y se obtiene informacién sobre la renta familiar. El fichero de datos Income Clusters contiene Ja renta anual media y Ja proporciGn de familias que tienen una renta de menos de 15,000 $ al aio y que viven en las manzanas de la muestra, Estime la renta familiar media y la pro- porcién de familias que tienen una renta de menos de 15.000 $ al afio en esta zona residencial. Muestreo: estratificado, por conglomerados y otros métodos de muestreo 787 Solucién. Se sabe que m=20 y M=1.000 El niimero total de hogares que hay en la muestra es DL m= 3 +31 + +41) = 607 is Para obtener estimaciones puntuales, Y mek = (23) (26,823) + (31)(19.197) + --- + (41)(16.493) = 15.848.158 a Y mb; = 23)(0,1304) + 31) 0.4516) + -»- + (41),3659) = 153 a ‘Nuestras estimaciones puntuales son, pues, 15.848.158 _ 607 26.109 Por tanto, basdndose en esta evidencia muestral, se estima que en esta zona residencial la renta anual media de los hogares es de 26,109 $ y que el 25,21 % de los hogares tiene una renta de menos de 15,000 $ al atio. Para obtener estimaciones por intervalos de la media poblacional, el tamaiio medio de los conglo- ‘merados debe ser 5m, FiO 5935 m 20 Ademés, 239° _ 326.288 - 26.1099 +--+ 42(16.493 ~ 26.109? SaaS eae STE Raa ae a OPES ARIE = 69.270.562.244 por lo que E nto" (980)(69.270,562.244) _ 5 os 14 (1,000) (20)(30,357" y tomando ta rafz cuadrada, és = 1.920 788 —_Estadistica para administracion y economia Un intervalo de confianza al 95 % de la media poblacional es 26.109 + (1,96)(1.920) Un intervalo de confianza al 95 % de la renta media de todas las familias de esta zona va, pues, de 22.346 a 29.872 5. 5 ara obtener estimaciones por intervalos de la proporcién poblacional, Z,M@~ Po” espo.r304 - 0.25208 + «+ 4D03659 ~ 0.2521)? m-t 9 De donde, = 38,1547 3 é ni6s~ | m1 (980) (38,1547) = Toooycaoya0.357 ~ 0070797 'y tomando la rafz cuadrada, §;, = 0.0451 El intervalo de confianza al 95 % de la proporcién poblacional es (0.2521) + (1.96)(0,0451) ‘Nuestro intervalo de confianza al 95 % del porcentaje de hogares cuya renta anual es de menos de 15.000 $ va de 16,4 a 34,0 %. EI muestreo por conglomerados se parece superficialmente al muestreo estratificado. En ambos casos, Ja poblacién se divide primero en subgrupos. Sin embargo, la similitud es bastante ilusoria. En el muestreo aleatorio estratificado, se toma una muestra de cada estrato de la poblacién en un intento de garantizar que se da el debido peso a importantes segmentos de la poblacién. En cambio. en el muestreo por conglomera- dos se toma una muestra aleatoria de conglomerados, por lo que algunos conglomerados no tienen ningiin miembro en la muestra. Dado que dentro de los conglomerados los miembros de la poblacién probable- mente serdn bastante homogéneos, se corre el riesgo de que importantes subgrupos de la poblacién no estén representados en absoluto o estén muy subrepresentados en la muestra final. En consecuencia, aunque la gran ventaja del muestreo por conglomerados se encuentra en su comodidad, esta comodidad puede muy bien conseguirse a costa de una imprecision mayor de las estimaciones muestrales. Otra distineién entre el muestreo por conglomerados y e1 muestreo estratificado es que en el primero se toma un censo completo de ‘miembros del conglomerado, mientras que en el segundo se toma una muestra aleatoria de miembros del estrato, Sin embargo, esta diferencia no es esencial. De hecho, a veces un investigador puede extraer una muestra aleatoria de miembros de un conglomerado en lugar de tomar un censo completo. Muestreo bietapico En muchas investigaciones, la poblaciGn no se estudia en una sola etapa sino que a menudo es eémodo realizar primero un estudio piloto en el que se contacta con una proporcién relativamente pequefia de los miembros de la muestra y se analizan los resultados obtenidos antes de realizar la mayor parte del estudio, Muesireo: estratificado, por conglomerados y otros métodos de muestreo 789 El principal inconveniente de ese método es que puede Hevar mucho tiempo. Sin embargo, tiene varias ventajas que lo compensan. Una de las ventajas importantes es que el investigador puede probar, con un pequefio coste, el cuestionario propuesto para asegurarse de que las distintas preguntas se entienden perfec- tamente. El estudio piloto también puede sugerir otras preguntas cuya importancia potencial se ha pasado por alto. Ademés, este estudio también debe dar una estimacién de la tasa probable de falta de respuesta. Si esta es inaceptablemente alta, tal vez sea deseable modificar algo el método utilizado para recabar las res- Puestas, La realizacién de un estudio bietépico, comenzando con un estudio piloto, se conoce con el nombre de muestreo bietpico. Este enfoque tiene otras dos ventajas. En primer lugar, si se emplea un muestreo alea- torio estratificado, el estudio piloto puede utilizarse para obtener estimaciones de las varianzas de los dis- tintos estratos. Estas pueden utilizarse, a su vez, para estimar la afijacién Gptima de la muestra a los dis tos estratos. En segundo lugar, los resultados del estudio piloto pueden utilizarse para estimar el niimero de observaciones necesarias para obtener estimadores de los parémetros poblacionales con un nivel especitica- do de precisién. Los ejemplos siguientes sirven para ilustrar estas cuestiones. Consideremos una sencilla situacién en la que se utiliza una muestra aleatoria simple para estimar una media poblacional. Al principio, 1a informacién sobre esta poblaciGn es relativamente escasa, por lo que se realiza un estudio piloto para hacerse una idea del tamafio que debe tener la muestra EE Valor medio de las facturas pendientes de cobro (tamafio de la muestra) Un auditor desea estimar el valor medio de las facturas pendientes de cobro en una poblacidn total de 1.120 facturas. Quiere hallar un intervalo de confianza al 95 % de la media poblacional que tenga una amplitud de aproximadamente 4 $ a cada lado de la media muestral, Para empezar, toma una muestra aleatoria simple de 100 facturas, encontrando una desviacién t{pica muestral de 30,27 $. {Cudntas facturas més debe tener la muestra? Ej Solucién. Aplicando la Ecuacién 7.23, el tamafio de la muestra necesario es No? "= WE Netto? 1.120 es el niimero de miembros de 1a poblacién en este caso, Para que el interval de confianza al 95 % tenga Ia amplitud exigida, 1,960; = 4 or lo que a la desviacién tipica de la media muestral, debe ser 4 0; = 9g 7 2004 La desviaci6n tipica poblacional, «, se desconoce. Sin embargo, basindose en el estudio inicial de 100 facturas pendientes de cobro, se estima que es 30,27, El niimero total de observaciones muestra- les necesario es, pues, No® 1.120)3027' p44 "* Wal to? C119@04" + BO27" Dado que ya se han tomado 100 observaciones, seriin suficientes 85 més para satisfacer el objetivo del auditor. 790 Estadistica para admintstracion y economia Renta (tamafio de la muestra) Un investigador quiere tomar una muestra aleatoria estratificada para estimar la renta familiar media en una ciudad en la que e! nimero de familias que hay en cada uno de Jos tres distritos es 2.120 Ny =930 Para empezar, el investigador hace un estudio piloto, tomando una muestra de 30 hogares de cada distrito y obteniendo desviaciones tipicas muestrales de 3.657 $, 6.481 $ y 8.403 §, respectivamente. ‘Suponga que el objetivo es obtener, con el tamafio mas pequefio posible, un intervalo de confianza al 95 % de la media poblacional que tenga una amplitud de 500 $ a cada lado de la estimacién muestra. Cusntas observaciones adicionales deben tomarse en cada distrito? Solucién. El requisito de que debe conseguirse un grado especificado de precisién con el menor nndimero posible de observaciones muestrales implica que debe utilizarse 1a afijacién dptima. Recuér- dese que en la EcuaciGn 17.14 hemos visto que los niimeros n,, n, yn, que deben muestrearse en los tres estratos son los siguientes: N,= 1.150 Ny N, qin G=1,2,3) one ra donde las o; son las desviaciones tipicas poblacionales de los estratos. Utilizando nuestras estimacio- hes muestrales en lugar de estas cantidades, (1.150)3.657) "* T1506) + 2.120) (6481) + @30)(HA40) *"~ O71" (2.120)(6.481) "2 T150)B6ST) + G.120)(6ABI) + OBO) BADR) ~"~ 935 (930)(8.403) yobs ‘ (C150)B.657) + @.120)(6.481) + 30/8403) ~” e Hemos especificado las propiedades de 1a muestra total que debe afijarse a cada estrato con el sistema dptimo. Queda por averiguar el niimero total n de observaciones muestrales. Métodos de muestreo no probabilisticos Hemos analizado algunos sistemas de muestreo en los que es posible especificar la probabilidad de que se extraiga una determinada muestra de la poblacidn, Esta caracterfstica de los métodos de muestreo permite hacer inferencias estadisticas validas basadas en los resultados muestrales. De lo contrario, no podrfan obte- nerse estimaciones puntuales insesgadas ¢ intervalos de confianza con un contenido probabilfstico especifi- cado que tuvieran una estricta validez.estadistica. No obstante, en muchas aplicaciones practicas se utilizan métodos no probabilisticos para seleccionar Jos miembros de la muestra, principalmente por comodidad. Supongamos, por ejemplo, que queremos eva- Iuar las reacciones de los estudiantes de nuestra universidad a algiin tema de interés. Una de las posibilida- des seria preguntar a nuestros amigos cual es su opiniGn. Este grupo no constituir‘a una muestra aleatoria de la poblacién de todos los estudiantes. Por tanto, si analizamos los datos como si procedieran de una muestra alcatoria, la inferencia resultante carecerfa de validez. estadistica. Muestreo: estratificado, por conglomerados y otros métodos de muestreo 781 Las organizaciones que realizan encuestas utilizan a menudo una versiGn més sofisticada del método que acabamos de describir, Hamada muestreo por cuotas. Se asignan encuestadores a un lugar y se les dice que contacten con un determinado nimero de personas de una determinada edad, raza y sexo. Est ‘cuotas asignadas representan las proporciones del conjunto de la poblacién que se consideran adecuadas. Sin embargo, una vez. decididas las cuotas, los entrevistadores tienen flexibilidad para elegir los miembros de la muestra. Su cleccién normalmente no es aleatoria. El muestreo por cuotas puede producir y, a menu- do produce, estimaciones bastante precisas de los parémetros poblacionales. Su inconveniente es que, como no se elige la muestra utilizando métodos probabilisticos, no existe una forma vélida de averiguar la fiabili- dad de las estimaciones resultantes. Ejercicios 11 Ejercicios aplicados Naneo de Pla media . Una empresa de estudios de mercado quiere estimar Ia administrativos __(d6lares) cantidad semanal media de tiempo que estén encendi- T 9 @ dos los televisores en los hogares de una ciudad que conticne 65 barrios. Se selecciona una muestra aleato- ‘| Va : tia simple de diez bartios y se pregunta a cada uno de os hogares de cada barrio de la muestra. La tabla ad- 4 36 108 junia muestra los resultados. 5 59 136 Hall 6 31 de Ia media poblaci . 7 ae 4, Halle una estimacién puntual de la media poblacio- ai ie nal de la cantidad de e estén encendidos de Ta cantidad de tiempo 4 , oH a Jos televisores en esta ciudad . Halle un intervalo de confianza al 90 % de la media poblacional. 4. Halle una estimacin puntual de la media poblacio- nal de las primes por administrative de exte mes. », Halle un interval de confianza al 99:% dela media ‘Nimero ‘Tiempo medio de wso laclona Barrios de hogares de televisor (horas) 17.19, En el estudio del Ejecicio 17.17, se pregunta alos ho- 7 i 29.6 zgares si tienen television por cable. La tabla adjunta 2 3s 184 Iuestra el nimero que tiene television por cable 3 18 327 ‘ 2 263 Baio 1234 5 6 78 9 10 5 4 D4 Nimeo 12 11 10 29 15 13 20 14 9 26 6 # 316 ; a Halle una estimacisn puntual de la proporcién de to- Z = . dos los hogares de la ciudad que tienen television is a0 238 por cable. 2 2B 254 'b. Halle un intervalo de confianza al 90 % de esta pro- 0 2 24.1 porcién poblacionl 17.20, En el estudio del Ejercicio 17.18, se pregunt6 a los ad- 17.18. Un dirigemte sindical quiere estimar ef valor medio de las primas pagadas a los administrativos de una empre- seen el primer mes de un nuevo plan, Esta empresa tie- ne 52 subdivisiones y se toma una muestra aleatoria simple de ocho. A continuacién, se obtiene informa- cin de las néminas de cada administrative de cada una de las subdivisiones de Ia muestra, La tabla adjunta muestra los resultados. 'ministrativos de las ocho subsiivisiones de la muestra si esstaban satisfechos con el funcionamiento del plan de primas. La tabla adjunta muestra los resultados. Subdivision 1 2 3 4 5 6 7 8 Nimero satisfecho 2425 11 2135 44 3034 792 17.21. 1722, 17.23, Estadistica para administracion y economia 4. Halle una estimacién puntual de la proporcién de to- dos los administrativos satisfechos con el plan de primas. 1b, Halle un intervalo de confianza al 95 % de esta pro- Porcién poblacional Una ciudad esté dividida en 50 subdivisiones geograti- ‘cas, Se necesita una estimacin de la proporcién de ho: gares de a ciudad interesados en un nuevo servicio de Jardinerfa, Una muestra aleatoria de tres subdivisiones contiene 611, $21 y 734 hogares, respectivamente. El inimero que expresa interés por el servicio es 128, 131 ¥y 172, respectivamente. Halle un intervalo de confianza 11 90 % de la proporcién de todos los hogares de la ciu- dad interesada en el servicio de jardinerfa, Un banco tiene 720 exéditos hipotecarios para la adqui- sici6n de viviendas en situacién de morosidad. Necesita tuna estimacién del valor catastral medio de estas vi- vviendas, Al principio, se considera una muestra alesto- ria de 20 y se halla una desviacién tipica muestral de 37.600 S. Si el banco requiere un intervalo de confianza al 90 % de la media poblacional que tenga una ampli- tud de 5.000 $ a cada lado de la media muestral, {cusn: tas viviendas més deben considerarse”? Una universidad tiene 3.200 estudiantes de grado y 800 estudiantes de postgrado. Los investigadores tienen 1724. interés en saber cudnto dinero gastan estos estudiantes ‘en un aio en libros de texto. Al principio se toman rmwestras aleatorias simples de 30 estudiantes de grado y 30 de postgrado. Las desviaciones tfpicas muestrales de las cantidades gastadas son 40 $ y 58 $, respectiva ‘mente. Se necesita un intervalo de confianza al 90 % de a media del conjunto de la poblacién que tenga una amplitud de $ $ a cada lado de la estimacim puntual rmuestral. Estime ef menor niimero total de observacio- nes muestrales adicionales necesario para lograr este objetivo. Una empresa tiene una flota de 480 automéviles: 100 pequeiios, 180 de tamaiio intermedio y 200 grandes. Para estimar los costes totales anuales medios de repa- de estos automOviles, se toma una muestra alea- toria preliminar de diez automdviles de cada tipo. Las desviaciones tipicas muestrales de los costes de repara- cin son 105 § en el caso de los automsviles pequeios, 162 $ en el de los automdviles de tamaito intermedio y 183 $ en el de Jos automéviles grandes. Se necesita un imtervalo de confianza al 95 % del coste total anual me- dio de reparacién por automévil que tenga una ampli tud de 20 § a cada lado de Ia estimacién puntual mues- tral. Estime el menor nimero total de observaciones imwuestrales adicionales que deben tomarse. Términos clave ‘* estimacién de la media poblacional utilizando el muestreo por conglomerados ‘muestreo aleatorio estrai mwestreo bietpico jeado ‘+ estimacién de la media poblacional utilizando muestras aleatorias estratficadas ‘* estimacién de la proporcién poblacional wtilizando el rmwestreo por conglomerados ‘ estimacién de la proporci6n poblacional utilizando rmwestras aleatorias estratificadas ‘ estimacién del total poblacional utilizando muestras aleatorias estratificadas ‘© métodos no probabilisticos rmwestreo por conglomerados mwestreo por cvotas tamafio de ta muestra del j-ésimo estrato para Is medi © el total del conjunto de la poblacién utilizando la afijaci6n 6ptima tamafio de ta muestra del j-ésimo estrato para la proporciéa, poblacional utilizando la afijaciin Sptima tamafio de la muestra del j-ésimo estrato uti afijacién proporcional Fichero de datos '= Income Clusters, 786 Ejercicios y aplicaciones del capitulo 1725, 17.6, Explique minuciosamente la distincin entre muestreo aleatorio estratficado y mucstrea por conglomerados Ponga ejemplos de problemas de muestreo en los que podria ser il cada una de estas téenicas, En el Senado de Estados Unidos hay 100 senadores. Se obtuvo informacién de los responsables de gestionar la ‘correspondencia de 61 despachos de senadores. De es- tos, 38 ingicaron que debfan recibir un némero minimo de cartas sobre una cuestidn antes de escribie un (en respuesta @ Suponga que estas observaci muestra aleatoria de la poblacidn y halle un 17207. Muestreo: estratificado, por conglomerados y otros métodos de muestreo lo de confianza al 90 % de la proporcién de todos chos de senadores que sigue esta politica b. En realidad, no se obtuvo informacién de una mves- tra aleatoria de despachos de senadores. Se enviaron narios a los 100 despachos, pero solo respon- dieron 61. ,Cémo influye esta informacion en su respuesta al apartado (a)? Una empresa tiene tres subdivisiones, en las que hay un total de 970 directivos. Se toman muestras aleatorias independientes de directivos de cada subdivision y se halla el ndmero de aflos que leva en la empresa cada, tuno de los miembros de las muestras, La tabla adjunta muestra los resultados. ‘Subdivision I Subdivision 2 Subdivision 3 N 352 287 331 n 30 20 30 i 9.2 123 BS 4 49 64 16 2 Halle un intervalo de confianza al 99 % del nimero ‘medio de afios que Hevan en la empresa los directi- vos de Ia subslivision 1 Db. Halle un intervalo de confianza al 99 % del némero medio de afios que Hevan en la empresa todos los directivos. De las 300 piiginas de un libro, 180 son principalmente poco téenicas, mientras que el resto es técnica. Se to- ‘man muestras aleatorias independientes de paginas téc- nias y no técnicas y se anota el nfimero de erratas por pagina. La tabla resume los resultados. Ténicas 120 No téenicas 180 a. Halle un intervalo de confianza al 95 % del nimero medio de erratas por pagina de este libro. . Halle un intervalo de confianza al 99 % del numero total de erratas del libro, 17.29. 1730. a3. 17.32. 17.33. 793 el anilisi del Ejercicio 17-28, se observa que nveve de las piginas téenicas de la muestra y 15 de las paigi- nas no téenicas de 1a muestra no contienen ninguna ‘errata, Halle un intervalo de confianza al 90 % de la Proporcién de todas tas pyinas de este libro que no contiene eratas. ‘Vuelva a los datos de! Ejercicio 17.27. Si se toma una muestra de 80 directivos, averigle cudntos miembros de la muestra pertenecerfan a la subdivisién | utilizan- do cada uno de los siguientes sistemas: a. La afijacién proporcional b. La alijacién éptima, suponiendo que las desviacio- nes tipicas poblacionales de los estratos son iguales que las cantidades muestrales correspondientes Vuelva a los datos del Ejercicio 17.28. Si se toma una muestra de 40 paginas, averigde cudntas piginas de ta muestra serfan téenicas utilizando cada uno de los si: guientes sistemas 1, La afijacién proporcional b. La afijacién éptima, suponiendo que las desviacio- res tipicas poblacionales de los estratos son iguales ‘que las cantidades muestrales correspondientes, Se pretende tomar una muestra de los estudiantes de su universidad para conocer su opiniGn sobre Ia canti- dad de espacio que hay en la biblioteca, Se decide uti- lizar una muestra estratificada por afl: estudiantes de primer affo, de segundo afo, etc. Analice los factores que se tendrfan en cuenta para decidir e! ndmero de observaciones muestrales que deben tomarse en cada strato, Suponga que la junta electoral le pide que le ayude a resolver un conilicto electoral entre dos candidatos 0 ue haga de experto estadistico en un juicio relacions do con el resultado de unas refiidas elecciones. Son mu- chas las euestiones que se plantean. ;Deben recontarse todos los votos de todas las circunscripciones? ;Deben recontarse solo los votos de determinadas circunserip- clones? Si solo se recuentan los de algunas, ;cusles? ‘Analice las ventajasy los inconvenientes de algunos di seftos muestrales que podrfan utilizarse para seleccio- nar los votos que van a recontarse.

Potrebbero piacerti anche