Sei sulla pagina 1di 42

Muestreoy distribuciones muestrales

CONTENIDO
I-e pRcrtcA : MEADWESTVACo CORPORATION 7.1 ELPROBLEMADE MUESTREO DE ELECTRONICS ASSOCIATES MUESTREOALEAIORIO SIMPLE Muestreode una poblacinfinita Muestreode una poblacin infinita

r.e BsrepsrrcA EN

Relacinentreel tamao de la muestray la distribucin muestralde i

7.6 DISTRIBUCIN
MUESTRAL DE P Valor esperado p de Desviacin estndar p de Forma de la distribucin muestralde I Valor prcticode la distribucin muestralde p 7.7 PROPIEDADESDE LOS ESTIMADORES PUNTUALES Insesgadez Eficiencia Consistencia DE MUESTREO Muestreoaleatorioestratificado Muestreopor conglomerados Muestreosistemtico Muestreode conveniencia Muestreo subjetivo

7.2

7.3 srrulcrNpUNTUAL 7.4 TNTRoDUCCTNRr-es


DISTRIBUCIONES MUESTRALES

7.s prsrruucrN
MUESTRALDE.r Valor esperado x de Desviacinestndar i de Forma de la distribucin muestralde Distribucin rnuestral de x en el problemaEAI Valor prctico de la distribucin muestralde

7.8 OTROS MTODOS

258

Z Copitulo

muestroles y Muestreo distribuciones

MEADWESTVACO CORPORATION*

CONNECTICW STAMFORD, Corporation,lder mundial en la producMeadWestvaco productos consude y especiales, cin de embalajes papeles emplea qumicasespeciales, mo y de oficina y de sustancias Operaa nivel mundial en29 paa msde 30 000 personas. ses y atiendea clienteslocalizadosen 100 pafses.MeadWestvaco tiene una posicin lder en la produccin de papel, con una capacidadde 1.8 millones de toneladas anuales.Entre los productos de la empresa se encuentran papel para libros de texto, papel para revistas, sistemasde embalajepara bebidasy productosde oficina. Los consultores internos de MeadWestvacousan el muestreopara obtener diversas informaciones que permiten a la empresa ganarproductividady seguirsiendocompetitiva. Por ejemplo, MeadWestvacoposeebosquesque le proporcionanlos rrboles,o la materiaprima, paramuchosde los productos de la empresa.Los directivos necesitaninforrnacin confiable y precisa acercade los bosquesmaderables para evaluar las posibilidades de satisfaccinde las futuras de necesidades materiaprima. Cules el volumen actualde los bosques? Curflha sido el crecimientode los bosques? Las reses el crecimiento proyectadode los bosques? Cul puestasa estaspreguntaspermiten a los directivos de la empresaelaborar los planespara el futuro, tales como planesa largo plazo y calendariospara la poda de fuboles. Cmo recolectaMeadWbstvacola informacin que necesitaacercade los amplios bosquesque requiere?Los en datosque obtienede puntosmuestrales los bosqusson la baseparacontarcon informacin acercade la poblacin propiedad de la empresa.Para localizar estos de rboles primero se dividen los bosquesen tres puntos muestrales, de secciones acuerdocon la localizaciny tipo de rboles. Mediante mapas y nrlmeros aleatorios los analistasde MeadWesfvacoidentifican puntos muestrales aleatorios Los ingeniedel cadaseccin bosque' de l/5 a ll7 acresen
'Los oulores ogrodecen ol doctor Edgord P Winkofsky por proporcionor lo inbrmocin poro lo estodsticoon h prdica.

El muestreo aleatorio de sus bosques permite a futuras de MeadWestvacosatisfacernecesidades prima. @ Walter Hodges/Corbis. materia

recogenlos datosde estos de ros forestales MeadWestvaco puntos muestrales para obtener informacin acerca de la poblacinforestal. Tambin participan en el procesode campo de la recoleccin de datos. Con periodicidad, en equipos de dos personas,recolectanla informacin de cada rbol en todos los se puntos muestrales. Los datosmuestrales ingresanen el sistema computacional de inventario forestal continuo (IFC) de la empresa.Los informes obtenidos del sistema IFC contienen informacin de distribuciones de frecuencia sobrelos tipos de rboles,volumen de los con estadsticos bosques,tasasde crecimiento anterioresy crecimiento y para el futuro. El mueseoy las covolumen proyectados de rrespondientesinformaciones estadstica's los datos proporcionanla informacin esencialpara la muestrales administracin de los bosquesde MeadWeswaco' adecuada En estecaptulo se estudiarel muestreoaleatorio simSe ple y el procesode seleccinde muestras. ver tambin la mediamuestraly la procomo cmo seusanestadsticos porcin muestralparaestimarla mediade la poblaciny la proporcinde la poblacin.

En el captulo I se definieron los trminospoblacin y muestra.Estasdefinicionesse retomanaqui. l. lJna poblacin es el conjunto de todos los elementosque interesanen un estudio. 2. LJnamuestra es un subconjunto de la poblacin. A las caractersticasnumricas de una poblacin, como la media y la desviacin estndar,se les llama parmetros. El principal propsito de la inferencia estadsticaes hacer estimacionesy pruebas de hiptesis acercade los parmetrospoblacionales usando la informacin que propor-

7.1 El problemo muestreo Electronics de de Associotes

259

ciona una muestra.Para empezar, presentan se dos situaciones las que a partir de muestrasse en obtienenestimaciones parmetros de poblacionales. l. Un fabricantede neumticos elaboraun nuevo modeloque tendrmayor duracinque los actuales neumticos la empresa. de Paraestimarla duracinmedia,en millas, el fabricante selecciona una muestrade 120neumticos nuevospara probarlos.De los resultados de estapruebaseobtieneunaduracinmediade 36 500 millas. Por tanto,unaestimacin la de duracinmedia,en millas, de la poblacinde nuevosneumticos 36 500 millas. es 2. Los miembros de un partido poltico deseaban apoyar a un determinadocandidato para senadoq y los dirigentes del partido deseabantener una estimacin de la proporcin de votantesregistradosque podan estara favor del candidato.El tiempo y el costo de preguntar a cadauno de los individuosde la poblacinde votantes registrados eranprohibitivos.por tanto, se seleccionuna muestrade 400 votantesregistrados;160 de los 400 votantes indicaron estar a favor del candidato. Una estimacin de la proporcin de la poblacin de votantesregistrados favor del candidatoes 160/400: 0.40. a Estos dos ejemplos ilustran algunasde las razonespor las que se usan muestras.Observeque en el ejemplo de los neumticos,obtener datos sobre su tiempo de duracin implica usarloshasta que se acaben.Es claro que no es posible probar toda la poblacin de neumticos;una muestraes la nica manera factible de obtener los datos de duracin deseados. el ejemplo del candidato, En preguntar a cada uno de los votantes registradoses, en teoa, posible, pero el tiempo y el costo para hacerlo son prohibitivos; de maneraque se prefiere una muestrade los votantesregistrados. Es importante darse cuenta de que los resultados muestralesslo proporcionan una estimacin de los valores de las caractersticasde la poblacin. No se esperaque la media muestral oe 36 500 millas sea exactamente igual al millaje medio de todos los neumticosde la poblacin, tampocoque 0.40, o 40Vode la poblacinde los votantesregistrados esta favor del candidato. La razn es simple, la muestraslo contieneuna parte de la poblacin.Con mtodosde muestreo adecuados,los resultadosmuestralesproporcionarn estimaciones"buenas" de los parmetros poblacionales. Pero cunbuenospuede esperarse por que seanlos resultadosmuestrales? fortuna, existen procedimientos estadsticospara responder esta pregunta. En este captulo se enseacmo emplear el muestreo aleatorio simple para seleccionaruna muestrade una poblacin. Despus,cmo usar una muestraaleatoria simple para calcular estimaciones de una media poblacional, de una desviacinestndarpoblacional y de una proporcin poblacional. Adems, tambin se presentael importante concepto de distribucin muestral. Como ver, el conocimiento de la distribucin muestral adecuada permite decir qu tan cerca se encuentran las estimacionesmuestralesde los correspondientes parmetrospoblacionales.En la ltima seccin se estudianalternativasal muestreoaleatorio simple, usadascon frecuenciaen la prctica.

Una media muestral suministftuna estimacin de la media poblacional y una proporcin muestral suministra una estimacin de la proporcin poblacional. Con dichas estimacionespuede esperarse un ciefto error de estimacin. Este captulo ensea las basespara eslimar cun grande puede ser ese erron

H problemade muestreode Electronics Associates


Al director de personalde ElectronicsAssociates, Inc. (EAI), se le ha encargado tareade elala borar un perfil de los 2500 administradoresde la empresa.Las caractersticasa determinar son el sueldo medio anual de los administradoresy la proporcin de administradoresque ha terminado el programa de capacitacin de la empresa. Con los 2500 administradores la empresacomo la poblacinpara esteestudio,es posible de hallar el sueldoanualy la situacinrespecto programade capacitacin cadapersonaal conal de sultar los archivosdel personal.El archivo con los datosque contieneestainformacin para cada uno de los 2500 administradoresque forman la poblacin se encuentraen el disco compacto que se distribuye con el libro. Con los datosde EAI y las frmulas presentdas el captulo 3, se calcula la media poblaen cional y la desviacinestndar poblacionalde los salariosanuales. Mediapoblacional: l: $51 800 Desviacinestndar poblacional: o : $4000

CD

260

Z Coptulo

muestroles y Muestreo distribuciones

Algunos de los costos de recopilar informacin de una muestra son sustanc i a Imente meno res que hacerlo de una poblacin; especialmenfe cuando se deben realizar entrevistaspe rsonales Para recop ilar Ia info rmac in.

Los datos sobre la situacin del programa de capacitacinmuestranque 1500 de los 2500 administradoreshan terminado el programa de capacitacin.Sip denota la proporcin de la poblacin : 1500/2500 : 0.60. La media poque ha terminado el programa de capacitacin,se tiene quep (p : $St 800), la desviacin estndarpoblacional de los suelblacional de los sueldos anuales dos anuales (o : g4000) y la proporcin poblacional de quien'eshan terminado el programa de capacitacin (p : 0.60) son palmetros de la poblacin de administradoresde EAI. Ahora suponga que la informacin necesariasobre todos los administradoresde EAI no est disponible en la base de datos de la empresa.La pregunta que se considera ahora es: cmo puede obtener el director de personal de la empresa,estimacionesde los pariimetros poblacionales usandouna muestra de los administradores,en lugar de usar a los 2500 administradoresde la poblacin. Asuma que se va a emplear una muestra de 30 administradores. Es obvio que el ii"-po y el costo de la elaboracin de un perfil ser mucho menor usando 30 administradores qu" LupUtu"in entera. Si el director de personal tuviera lacertezade que una muestrade 30 adinitt uot"s proporciona la informacin adecuadaacercade la poblacin de los 2500 administradores,preferir abajar con una muestra que hacerlo con toda la poblacin. Para explorar la posibilidad de usar una muestra para el estudio de EAI, primero se considerarcmo determinar una muestra de 30 administradores.

(t.z\ MuestreoaleatoriosimPle
para seleccionaruna muestra de una poblacin hay diversos mtodos; uno de los ms comunes es el muestreo aleatorio simple. La definicin de muestreoaleatorio simple y del procesode seleccionar una muestra aleatoria simple dependende si la poblacin esfinita o infinita- Como el problema de muestreo de EAI tiene una poblacin finita de 2500 administradores,primero se considera el muestreo de una poblacin finita'

Mueslreo de unq poblocin finito


Una muesa aleatoria simple de tamao n de una poblacin finita de tamao N se define como sigue. MUESTREO ALEATORIO SIMPLE (POBLACIN FINITA) Una muestraaleatoriasimple de tamao n de una poblacin finita de tamaoN es una muestra seleccionada de manera que cada posible muestra de tamao n fen9a la misma probabilidad de ser seleccionada. Un procedimiento para seleccionar una muestra aleatoria simple de una poblacin finita es elegir ls elementos para la muestra de uno en uno, de manera que, en cada paso, cada uno de los*elementor qu" qu"dun en la poblacin tenga la misma probabilidad de ser seleccionado.Al seleccionar/elementosde esta manera, ser satisfechala definicin de muesfa aleatoria simple seleccionadade una poblacin finita. para seleccionar una muestra aleatoria simple de la poblacin finita de administradoresde EAI, primero se le asigna a cada administrador un nmero. Por ejemplo, se les asignan los n*"ro, d"l I al 2500 en el orden en que aparecensus nombres en el archivo de personal de EAI. A continuacin se consulta la tabla de dgitos aleatorios que se muestran en la tabla 7.1. Al consultar el primer rengln de la tabla se da cuentaque cadadgito, 6,3,2,... es un dgito aleatorio con la misma oportunidad de aparecerque cualquier otro. Como el nmero mayor en la lista de la poblacin de administradores de EAI, 2500, tiene cuatro dgitos, se seleccionarnnmeros aleatorios de la tabla en conjuntos o grupos de cuatro dgitos. Aun cuando para la seleccin de nmeros aleatorios se puede empezaren cualquier lugar de la tabla y avanzursistemticamente en una de las cuatro direcciones, aqu se usar el primer rengln de la tabla 7.1 y se avanzarde izquierda a derecha.Los primeros 7 nmeros aleatorios de cuatro dgitos son 632'7 1599 86'7r 7445 1102 r5l4 1807 Los nmeros aleatorios en la tabla aprecenen grupos de cinco para facilitar su lectura'

Ins nmeros aleatorios generados por computadora tambin swen para realizar el proceso de seleccin de una muestra aleatoria. Excel p rop orc i ona una func in para generar nmeros aleatorios en sushoias de cdlculo. I-ns nmeros aleatorios en la tabla aparecen en gruPos de cinco parafacilitar su lectura.

7.2

Muesireo oleoicriosimple

26r

TABLAT.I NMEROSALEATORIOS

$nt 59986 88547 0989 55957 572A.3 46n6 87453 55363 449 69393 92785 13186 2943r 17726 28652 36520 64465 81628 36100 846r'9 48968 63291 ll18 70502 53225 0&26 2477r Mn 5509 4t9{/.J_ 70538 7U52 36618 37UZ m318 53766 52875 90585 58955 32AOr 96293 62ffi6 &3U 10078 28073 91561 4t45 13091 98tt2

71744 95436 83865 441W 34835 49902 88190 56336 05550 39254 75215 r26t3 03655 59935 29430 77191 76298 s10w 15987 53122 37203 46354 85389 24177 53959

51rc2 79115 09911 67t22 15290 58M7 04588 78351 3015? 56835 75498 75055 05915 49801 7015 25860 2ffi78 10528 46962 1ffi25 64516 72rs7 sA3zA 15294 79ffi7

15141 08303 19161 45573 76616 42M8 38733 47327 82?42 37636 49539 43915 37140 11082 454il6 55204 89334 09925 67342 84299 51530 67248 14500 10061 52?/4

8Wt4 01041 66535 84358 6719r 30378 81290 18518 295:20 0U2r 74240 2&88 5705r 66762 78484 134t7 33938 89773 77592 53310 37469 2013s 15562 98tz' 63303

58683 20030 40102 2t625 t2777 8718 89541 92222 69753 98063 03,166 4trr6 48393 9477 31639 83920 9s567 41335 s765t 67380 4026t 49804 &t65 75732 10413

93108 63754 zffi 16999 2181 26933 7O2n 55201 72ffi2 89641 4Y292 &53t 91322 02494 520[9 69468 29380 96244 95508 WZ49 6t374 W226 06125 00815 63839

t3554 08459 ffir47 13385 68689 4M ,m113 n3N 23156 &9s3 36401 568.n 25653 E8215 18873 74972 75906 29np/2 80033 25348 05815 Wt9 7t353 83452 74762

79945 2836/. 15702 2n82 03263 16281 082t+3 10493 54935 99.337 45525. 30825 06543 27191 %927 38712 91807 &53 69828 0/.332 M7l4 29457 77ffi9 W35s 50289

En ln prctica, la poblacin en estudio se considera infinita si se ene un proceso continuo en el que sea imposible contar o enumerar cada uno de los elementos de la poblacin.

Como los nmeros de la tabla son aleatorios,estosnmerosde cuatro dgitos son todos igualmente posibles. Ahora se pueden usar estos nmeros aleatorios de cuatro dgitos para darle a cada uno de los administradoresque constituyen la poblacin la misma oportunidad de ser incluido en la muestra aleatoria. El primer nmero, 6327, es mayor que 2500. No correspondea ninguno de los administradoresnumeradosque forman la poblacin y por tanto se descarta.El segundonmero, 1599, est entre I y 2500. Por tanto, el primer administrador seleccionadopara la muestra aleatoria es el administrador que tiene el nmero 1599 en la lista de los administradores de EAL Siguiendo este proceso, se ignoran los nmeros 867I y 7445 antesde identificar a los administradores con los nmeros 1102, l5l4 y 1807 e incluirlos en la muestra aleatoria. Este proceso sigue hasta que se tiene la muesta aleatoria de 30 administrativos de EAI. Al realizar este proceso para la seleccin de una muestra aleatoria simple, es posible que un nmero que ya haya sido usado se encuentre de nuevo en la tabla antes de completar la muestra de los 30 administradores de EAI. Como no se quiere seleccionar a un administrador ms de una vez, cualquier nmero aleatorio que ya ha sido usado se ignora, porque el administrador correspondiente ya se ha incluido en la muestra. A este tipo de seleccin se le conoce como muestreo sin reemplazo. Cuando se selecciona una muestra en la que se acepten nmeros aleatorios ya usaseanincluidos dos o ms veces,se est muestreando dos y los administradorescorrespondientes con reemplazo. Muestrear con reemplazo es una forma vlida de identificar una muesfta aleatoria simple. Sin embargo, el muesfieo sin reemplazo es el procedimiento de mueseo ms usado. Cuando se habla de muestreo aleatorio simple, se asumir que el muestreo es sin reemplazo.

Muestreo de uno poblocin infinito


se la En algunas situaciones poblacino bien es infinita o tan grandeque,parafines prcticos, que de obtenerel infinita. Por ejemplo,suponga un restaurante comidarpidadesea considera

262

Coptulo Z

Muestreo distribuciones y muestroles

perfil de su clientela seleccionandouna muestra aleatoria de los mismos y pidindole a cada cliente que llene un breve cuestionario. En tales situaciones,el proceso continuo de clientes que visitan el restaurantepuede verse como que los clientes provienen de una poblacin infinita. La definicin de muestra aleatoria simple tomada de una poblacin infinita es la siguiente

MUESTRA ALEATORIA SIMPLE (POBLACIN INFINNA) Una muestra aleatoria simple de una poblacin infinita es una muestra seleccionadade manera que se satisfaganlas condiciones siguientes. 1. Cada uno de los elementos seleccionadosproviene de la poblacin. 2. Cada elemento se seleccionaindependientemente. En poblaciones infinitas un procedimiento para la seleccin de una muestra debe ser concebido especialmentepara cada situacin, de manera que permita seleccionar los elementos de manera independientey evitar as un sesgoen la seleccin que d mayores probabilidades de seleccin a ciertos tipos de elementos.En el ejemplo de la seleccin de una muestra aleatoria simple entre los clientes de un restaurantede comida pida, el primer requerimiento es satisfecho por cualquier cliente que entra en el restaurante.El segundo requerimiento es satisfecho seleccionando a los clientes de manera independiente.El objetivo del segundo requerimiento es evitar sesgosde seleccin.Habra un sesgode seleccin,por ejemplo, si cinco clientes consecutivos que se seleccionaranfueran amigos. Es de esperarque estos clientes tengan perfiles semejantes. Dichos sesgos se evitan haciendo que la seleccin de un cliente no influya en la seleccin de cualquier otro cliente. En otras palabras,los clientes deben ser seleccionados maneraindepende diente. McDonald's, el restaurantelder en comida rpida,realiz un muestreo aleatorio simple precisamente en una situacin as. El procedimiento de muestreo se bas en el hecho de que algunos clientes presentabancupones de descuento.Cada vez que un cliente presentabaun cupn descuento,al siguiente cliente que se atendase le peda que llenara un cuestionario sobre el perfil del cliente. Como los clientes que llegaban al restaurantepresentabancupones de descuento aleatoria e independientemente, este plan de muestreo garantizabaque los clientes fueran seleccionados de manera independiente.Por tanto, los dos requerimientos para un muestreo aleatorio simple de una poblacin infinita fueron satisfechos. Las poblaciones infinitas suelen asociarsecon un proceso que opera continuamentea lo largo del tiempo. Por ejemplo, partes fabricadas en una lnea de produccin, transaccionesen un banco, llamadas que llegan a un centro de asesoratcnica y clientes que enhan en las tiendas son consideradoscomo provenientesde una poblacin infinita. En tales casosun procedimiento de muestreo creativo garantizaque no haya sesgosde seleccin y que los elementosde la muestra sean seleccionadosen forma independiente.

En poblaciones infinitas un procedimiento para la seleccin de una muestra debe ser concebido esp ec ialmente para cada situacin, de manera que permita seleccionar los elementos de manera independente y evitar as un sesgo en la seleccin que d mayores p robabilidade s de selecc n a certos tipos de elementos.

1. El nmero de muestrasaleatoriassimples distintas de tamaon que puedenseleccionarse de una poblacinfinita de tamaoN es

']'<*:if
En esta frmula N! y z! son factoriales,vistos en el captulo 4. Al usar estaexpresincon los

datosdel problemade EAI, en el queN : 2500 y n : 30, se ve que se pueden tomar 2.75 X l06emuestras aleatorias simplesdistintasde 30 administradores EAI. de 2. Para tomar una muestra aleatoriapuedenemplearsepaquetes software.En los apndices de del captulo se muestra cmo usar Minitab y Excel para seleccionaruna muestra aleatoria simple de una poblacinfinita

7.2

Muestreo oleotoriosimple

263

Mrodo

o"o@

l.

l0 aleaA, Dadauna poblacinfinita que tienecinco elementos B, C, D y E seleccione muestras torias simplesde tamao2. con empezando AB, AC y as en lo sucesivo. a. Enumerelas 10 muesEas b. Usandoel muestreoaleatoriosimple, cules la probabilidadque tiene cadamuestrade tarnaio 2 de ser seleccionada? a a c. Si el rsimero aleatorio 1 corresponde A, el nmero 2 corresponde B y as en lo sucesial vo. Enliste la muestraaleatoriade tamao2 que serseleccionada usarlos nmerosaleatorios8057532.

A que una poblacinfinita tiene 350 elementos. partir de los ltimos tres dgitos de ca2. Suponga dede nmerosaleatorios cinco dgitos (por ejemplo: 601,022,2148,...), da uno de los siguientes que se seleccionarnpara muestraaleatoriasimple. una terminelos primeroscuatroelementos

98601 73022 83448 02147 34229 27553 84147 93289 14209

Aplicociones

orto@

del activo, 3 Fortune public datossobreventas,valor grandes valor de mercadoy gananciaspor accin (Fortune 500, 2003). Sude EstadosUnidos industrialesms de las 500 corporaciones de pongaque usteddeseaseleccionar una muestraaleatoriasimple de 10 corporaciones la lista con 554. Fortune 500. Use los tres ltimos dgitos de la columna 9 de la tabla 7 .1, empezando que se Leyendo hacia abajo por esa columna,identifique los nmerosde las l0 corporaciones tomarn para la muestra. zo del 2006 (The Wall StreetJournal, 7 de marzo, 2006). AT&T Pftzer Lucent TexasInstruments Nortel Gen.Elect. Qwest iShrMSJpn Bell South LSI Logic

msactivasen la Bolsa de NuevaYork del 6 de marlas 4. A continuacinsepresentan l0 acciones

usandouna muestrade tresde decidieroninvestigarlas prcticasde negociacin Las autoridades estasacciones. en a. Empezando el primer dgito aleatoriode la columna seisde la tabla 7.l,lea los nmeros por una muestraaleatoriasimple de tres acciodescendiendo esacolumnapara seleccionar nes pralas autoridades. aleab. Con la informacin dadaen la primera nota y comentario,determinecuntasmuestras de simplesdiferentesde tamao3 puedenseleccionarse una lista de 10 acciones. torias que desean estimarla proporcinde estudiantes estna favor de de 5 . Una organizacin estudiantes Se una disposicinde la escuela. cuentacon una lista con los nombresy direccionesde los 645 inscritos el presentetrimestre.Tomandonmerosaleatoriosde tres dgitos del renestudiantes por determinelos 10 prigln l0 de la tabla 7.1 y avanzando eserenglnde izquierdaa derecha, que sernseleccionados usandoun muestreoaleatorio simple. Los nmeros meros estudiantes con 816, 283 y 61.O. aleatoriosde tres dgitos empiezan Bureaucuentacon informacinde los 3139 condados 6 . El Countyand.City Data Book del Census que paraun estudionacionalserecogerin datosde 30 condados sede Estados Unidos. Suponga de De leccionados aleatoriamente. la ltima columnade la tabla 7.1 extraiganmerosaleatorios para la muestra.Ignocuatro dgitos para determinar los primeros cinco condadosseleccionados re los primerosdlgitos y empiececon los nmerosaleatoriosde cuaEodgitos 9945,8364,5702 y as sucesivamente. 7 . Supongaque se va a tomar una muestraaleatoriasimple de 12 de los 372 mdicosde una determdicale proporcionalos nombresde los mdicos.De la tabla minadaciudad.Una organizacin

2U

Coptulo Z

y Muestreo distribuciones muesiroles

7.1 usela columnaocho de nmerosaleatorios cinco dgitos paradeterminarculessernlos de 12 mdicosparala muestra. Ignore los primerosdos dgitosde cadagrupode cinco dgitosde nmerosaleatorios. Esteprocesoempieza con el nmeroaleatorio108y continadescendiendo por la columnade nmerosaleatorios. 8. La lista siguienteproporcionalos 25 mejoresequiposde futbol de la NCAA en la temporada del20O2(NCAA News,4 de enerode 2003).De la tabla 7.1 usela novenacolumnaque empieza con 13 554,paraseleccionar muestraaleatoriasimplede seisequiposde futbol. Empiececon una el equipo 13 y use los primerosdos dgitos de cadarenglnde la novenacolumnaparael proceso de seleccin.Culesson los seis equiposde futbol seleccionados para la muestraaleatoria simple? L Ohio State 2. Miami 3. Georgia 4. SouthernCalifornia 5. Oklahoma 6. KansasState 7. Texas 8. Iowa 9. Michigan 10.WashingtonState I L North Carolina State 12.BoiseState 13.Maryland 14.Virginia Tech 15. PennState 16.Auburn 17.Notre Dame 18. Pittsburgh 19. Marshall 20. WstVirginia 21. Colorado 22.TCU 23. Florida State 24. Florida 25. Virginia

9 . The Wall StreetJoumal proporcionael valor de activo neto, el rendimientoporcentualen lo que va del ao y el rendimientoporcentualen tres aosde 555 fondos mutualistas(The Wall Street Journal,25 de abril de 2003). Supongaque se va a usar una muestraaleatoriasimple de 12 de estos555 fondos mutualistaspara un estudioacercade su tamaoy desempeo. Use la cuarta columna de nmerosaleatoriosen la tabla 7.1 empezando con el nmero 51102,para seleccionar la muestraaleatoriasimplede 12 fondosmutualistas. Empiececon el fondo tr02y uselos lltmos tresdlgitos de cadarenglnde la cuartacolumnaparael procesode seleccin. son Cules los nmerosde los 12 fondos mutualistasen estamuestraaleatoriasimple?

10. Indique si las poblacionessiguientes consideran se finitas o infinitas.


a. Todoslos votantesregistrados el estadode California. en b. Todoslos equiposde televisinque puedenser producidosen una determinada fbrica. c. Todaslas rdenesque puedenser procesadas Allentown, Pensilvania,planta de TV-M por Company. d. Todaslas llamadasde emergencia que puedenser recibidasen una estacinde polica. e. Todaslas piezasproducidaspor Fibercon,Inc., en el segundoturno el 17 de mayo.

puntual Estimacin
Unavez descrito cmo seleccionIr una muestra aleatoria simple, se vuelve al problema de EAL En la tabla 7.2 se presentauna muestra aleatoria simple de 30 administradorescon sus respectivos datos de sueldo anual y de panicipacin en el programa de capacitacin. La notacin xr, xr, etc., se usa para denotar el sueldo anual del primer administrador de la muesfta, del segundo,y as sucesivamente. participacin en el programa de capacitacin se indica por un S en la coLa lumna programa de entenamiento. poblacional, la caractersticacorrespondientese calcuPara estimar el valor de un parimetro la con los datos de la muestra, a lo que se le conoce como estadstico muestral Por ejemplo, para estimar la media poblacional p y la desviacin estindar poblacional o de los salarios anualesde los administradoresde EAI, se emplean los datos de la tabla 7.2 y se calculan los es-

puntuol 7.3 Esiimocin IA8IA7.2 AL SALARIOSANUALES Y SITUACINRESPECTO PROGRAMADE A LOS ADMINISTRADORES PERTENECIENTES UNA CAPACITACIN DE DE 30 ADMIMSTRADORES DE EAI MUESTRA ALEATORIA SIMPLE

265

Salario anual xr s 4909+.30 t * 53263.90 xt - 49 643.50 r = 49 894.90 xs= 476?l'60 = -16 55924.00 \ = 49w23A .fr E 51 &0/'-40. c : 50957'70 rlo = 55 l(D.?o rr= 45922'ffi xn= 51268.40 r = 55688.80 rr4* 5l J64.?0 *rs = 56188.20

Progmmr do cpedtscl6n

sf

sf
sf sf

No

sf
${ $f

sf
$f

sf
No $f No Ns

Salsrlo 8nul ($) ro = 51766'00 rz = 52541.30 .r8= 44980.00 * .rre 51932.@ xm* 52973.00 "r,= 45 120.90 E t22 5l753.00 B = 54391,80 xu: 5O164.24 r,zs*52n\,ffi rzo= S ?4.l'3o 4 xz1 52793'q) ,' : 50979.,10 rap= 55860'90 ro = 573(D.10

Progronn de capedtcin sf
No

sf sf sl sf sf
No No No No No

sf sf
No

tadsticos muestralescorrespondientes;media muestral x y desviacin estndarmuestral s. Con en las frmulas para la media muestral y la desviacin estndarmuestral presentadas el captulo 3 se obtiene que la media muestral es

, : j)x, =
y la desviacin estndarmuestral es

u+#: $51814

= $3348 que Paraestimarp, la proporcinde administradores han terminadoel programade capacip. de muestral correspondiente Sea el nmerode administradores tacin,seusala proporcin que de De con el la muestra han terminado programa capacitacin. acuerdo la tabla7.2,x : 19. muestral es es de Por tanto,comoel tamao la muestra /, : 30, la proporcin - x 1 9: 0'63 n: ;: 30 estadstico conocidocomo estise Al hacerlos clculosanteriores, lleva a caboel proceso i comoelestimadorpuntual de la mediapomacinpuntual. Ala mea muestral sele conoce puntual de la desviacin muestrals como el estimador estindar blacionalp, a la desviacin estndarpoblacionalo y a la proporcin muestralB como el estimadorpuntual de la proporp. cin poblacional Al valor numricoobtenidode i, s, o p se les conocecomoestimaciones puntuales.As, en la muestra de en simplede 30 administradores EAI que sepresenta aleatoria puntualde o y 0.63 puntualdep, $3 348 es la estimacin la tabla7.2, $51 814 es la estimacin y puntualdep. En la tabla7.3 seresumen resultados los muestrales secompaes la estimacin poblacionales. puntuales los valoresde los parmetros con ran las estimaciones

266

y 7 muestroles Coptulo Muestreodistribuciones PUNTUALESOBTEMDAS DE TINA TABTA 7.3 INFORMACINDE LAS ESTIMACIONES MUESTRAALEATORIASIMPLEDE 30 ADMINISTRADORES EAI DE \blor del parmetro $51800 $4000 0.60 Estimacin puntual $sl 814 $33.f8

Parmetro poblacional p = Media poblacionalde los salarios anuales o = Desviacinestndar poblacional los salarios de anuales p = Proporcinpoblacionalqueha terrrinado el programade capacitacin

Estimadorpuntual
i : Media muestralde los salariosanuales ^r= Desviacinestndar muestral de los salariosanuales p = Proporcinmueshalque ha terminadoel programade capacitacin

puntuales Como se observa la tabla7.3,las estimaciones en difierenun pocode los correspondientes parimetros poblacionales. ya Estasdiferencias de esperarse queparaelaborar son las y estimaciones muestrales usauna muestra, no un censode todala poblacin. el captulo se En paratenerinformacin siguiente vercmoelaborar intervalode estimacin se un acerca qu de poblacional. tan cercaestla estimacin muestral parmetro del

Mtodos

o"o@

provienende una muestraaleatoriasimple. 11. Los datossiguientes 5 8 1 0 7 1 0 1 4 a. b. Cuiles la estimacinpuntual de la media poblacional? poblacional? Cules la estimacinpuntual de la desviacinestindar

12. Como respuestas una preguntade una encuesta 150individuos de una muestrase obtuvieron a a 75 S, 55 No y 20 individuos no dieron su opinin. a. Cuiles la estimacinpuntual de la proporcinde la poblacinque respondeS? b. Cules la estimacinpuntualde la proporcinde la poblacinque responde No?

Aplicociones

Ort"@

13. La siguienteinformacin son datosobtenidosen una muesfa aleatoriade las ventasde 5 meses: Mes: Unidades vendidas: a. b. I 94

2 3 100 85

4 5 94 92

'4 Wto
MutualFund

Calculeuna estimacinpuntualde la mediapoblacionaldel nmeromedio de unidades vendidas por mes. Calculeuna estimacinpuntual de la desviacinestndar nmerode unidadesvendidas del por mes.

public informacin sobre283 fondos mutualistas(BusnessWeek de enerode BusinessWeek 26 2004). En el conjuntode datosMutualFundsseencuentra muestrade 40 de estosfondos.Use una esteconjuntode datosparahacerlo que se pide en los incisos siguientes. a. Calcule una estimacinpunfual de la proporcin de fondos de inversin de BusinessWeek que son fondos de cargo. b. Calcule una estimacinpuntual de la proporcin de fondos clasificadoscomo de alto riesgo. c. Calculeunaestimacinpuntual laproporcinde fondosconunapuntuacinabajodel prode medioparael riesgo.

1 5 . Muchosde los medicamentos empleados el tratamiento cincersoncostosos. en del BusinessWeek paratratarel cincerde inform de los costosde los tratamientos Herceptin,un medicamento con

7.4

Introduccinlosdistribuciones o muestroles

267

mama(BusinessWeek,30 enerode 2006). Los siguientesson los costosde tratamientos de con Herceptinen una muestraaleatoriade 10 pacientes.

4376 4798
a. b.

5578 6446

2717 4tt9

4920 4237

4495 3814

Calculeuna estimacinpuntual del costo medio de un tratamientocon Herceptin. Calcule una estimacinpuntual de la desviacinestndar los costosde los tratamientos en con Herceptin.

1 6 . En una muestrade 50 empresas Fortune 500, 5 se encontraban Nueva York, 6 en Califorde en nia,2 en Minesotay I en Wisconsin. a. D una estimacinde la proporcinde empresas Fortune 500 que se encuentran Nuede en va York. b. D una estimacin nmerode empresas Fortune 500 que seencuentran Minesota. del de en c. D una estimacinde la proporcin de empresas Fortune 500 que no se encuentran de en ninguno de estosestados.

r7.

La AmericanAssociationof Individuals Investors(AAII) hacesondeos semanales entresussuscriptores para determinarcuntosse muestranoptimistas,pesimistaso indiferentesrespectoal mercadode acciones corto plazo.Sushallazgosen la semana terminel 2demarzo de2006 a que son consistentes los resultados con (www.aaii.com). muestrales siguientes Optimistas 409 Indiferentes 299 Pesimistas 291

D una estimacinpuntualde los parmetros poblacionales siguientes. a. Proporcinde suscriptores AAII optimistasrespectoal mercadode acciones. de b. Proporcinde suscriptores AAII indiferentesrespectoal mercadode acciones. de c. Proporcinde suscriptores AAII pesimistas de respectoal mercadode acciones.

lntroduccina las distribuciones muestrales


En la seccin anterior se dijo que la media muestral es el estimador puntual de la media poblacional p y que la proporcin muestral p es el estimador puntual de la proporcin poblacional p. En la muestra aleatoria simple de los 30 administradoresde EAI que se presenta enla tabla7.2, l a e s t i m a c i n p u n t u a l d e p e s x : $ 5 1 S l 4 y l a e s t i m a c i n p u n t u a l d e p e sP : 0 . 6 3 . S u p o n g a que se seleccionaotra muestra aleatoria simple de 30 administradoresde EAI y se obtienen las estimacionespuntuales siguientes: Media muestral:f : $52 670 Proporcin muestral:B : 0.70

Poder entender el material de los captulos siguientes depende de entender y usar las distribuciones muestrales que se presentan en este captulo.

Observe que se obtuvieron valores diferentes de y de p. En efecto, otra muestra aleatoria simple de 30 administradoresde EAI no se puede esperarque d las mismas estimacionespuntuales que la primera muestra. Ahora suponga que el proceso de seleccionar una muestra aleatoria simple de 30 administradores se repite una y otra y otravez y que cada vez se calculan los valores de i y de p. En la tablaT.4 se muestra una parte de los resultados obtenidos en 500 muestras aleatorias simples y en la tabla 7.5 las distribucionesde frecuenciasy distribucionesde frecuenciasrelativas de los valores de las 500 t. En la figura 7.1 se muestrael histogramade las frecuenciasde los valores de i. En el captulo 5 se defini una variable aleatoria como una descripcin numrica del resultado de un experimento. Si el proceso de seleccionar una muestra aleatoria simple se considera como un experimento, la media muestral es el valor numrico del resultado de ese experimento. Por tanto, la media muestral es una variable aleatoria. Entonces, como oclure con otras variables aleatorias,x tiene una media o valor esperado,una desviacin estindar y una distribucin

268

muestroles y 7 Coptulo Muestreodistribuciones 7.4 VALORES DE t Y DE p OBTENIDOS EN 500 MUESTRASALEATORIAS TABrA DE SIMPLESDE 3OADMINISTRADORES EAI CADAUNA Muestra nmero I 2 3 4 Media muestral Pmponcin muestral

(r)

(p)

51814 52ffiA 51780 51588 : sr 752

0.63 0.70 0.67 0.53

aleamuestras de como los distintosvaloresquetoma sonresultado distintas de probabilidad. comodistribucin muestral de de a toriassimples, la distribucin probabilidad i sele conoce de permitir hacerdeclaraciones proConcerestadistribucinmuestraly suspropiedades de . p' i babilidadde qutan cercaestla mediamuestral de la mediapoblacional posibles 30 admide todaslas muestras enumeru a la figura 7.1, se necesitara De regreso para determinartotalmentela distribuy calcular cadauna de las mediasmuestrales nistradores a de el cin muestralde . Sin embargo, histograma 500 valoresi da una aproximacin esta de esta de la se En muestral. estaaproximacin observa apariencia curvadecampana distribucin de la Adems, mayoiconcentracin valoresde - y la mediade los 500 valoresde i distribucin. se siguiente describirn p cercade h mdiapoblacional : $51 800.En la seccin seencuentran de las detalladamente propiedades la distribucin muestralde t. ms de p en muestrales seresumen el histograma frecuenLos 500 valoresde las proporciones Si ciasrelativasde la figura 7.2. Comoocurrecon, B es unavariablealeatoria. setomaracada posiblede tamao30 y paracadamuestrasecalcularael valor p, la distribucinde promuestra de de muestral p' En la figura 7.2, el histograma seraladistribucin babilidaque seobtuviera de de da de relativas los 500valoresmuestrales unaideageneral la apariencia la disfrecuenciai de P. tribucinmuestral En simplede la poblacin. estasecaleatoria una En la prcticaslo se selecciona muestra muesparailustrarque esposibletomarmuchas se proceso muestreo repiti500veces de cin el

DE IABIA 2.5 DISTRTBUCINDE FRECUENCIAS t EN 500 MUESTRASALEAf,ORIAS DE SIMPLESDE 3OADMINISTRADORES EAI CADAUNA Slarlo anual medto ($) 999.99 49500.00-49 499.99 50000.00-50 999.99 s0 500.00-50 51000.00-51499.9 999.99 5l s00.00-51 499.9 52000.00*52 999.99 52500.00-52 499.99 53000.00-53 999.99 53500.00*53

Frecuencia
2 16 52 l0l t33 110 .54 26 6 Totales 500

Frccuend mlsv 0.004 0,032 0.104 0.2v 0.26 0.220 0.108 0.052 0.012 l.m0

q los mueskoles 7.4 Introduccin distribuciones 7.I FIGURA RELATIVASDE LOS VALORES HISTOGRAMADE LAS FRECUENCIAS MUESTRASALEATORIAS SIMPLES DE 30 EN 5OO DE ' OBTENIDOS ADMINISTRADORES CADA UNA

269

0.30 0.25
a
t! D

t o.m
6 t E

a .

{)

0.r5
0.10 0.05

RELATIVASDE LOS VALORES 7.2 HISTOGRAMADE LAS FRECUENCIAS FIGURA DE t OBTEMDOS EN 500 MUESTRASALEATORIAS SIMPLES DE 30 ADMINISTRADORESCADA UNA
0.40 0.35 0.30
I a

a.25

c
!

) 0.20 ,,
E

0.15 0.10 0.05

.48

0.56 0.64 Ylonsdef

o.72 0.80 0.88

270

CopituloZ

muesholes y Muestreo distribuciones

tras diferentes y que diferentes muestras darn valores distintos de los estadsticos muesEales i y p. A la distribucin muestral de cualquier estadstico determinado se le llama distribucin muestral del estadstico.En la seccin7.5 se presentanlas caractersticasde la distribucin muestral de . En la seccin 7.6 se muestran las caractelsticas de la distribucin muestral de p.

(z.s Distribucinmuestralde .r )
En la seccin anterior se dijo que la media muestral .! es una variable aleatoria y que a su distribucin de probabilidad se le llama distribucin muestral de i.

DISTRIBUCIN UUESTNT NT * La distribucin muestral de i es la distribucin de probabidad de todos los valores de la media muestral i.

En esta seccin se describen las propiedades de la distribucin muestral de . Como ocure con otras distribuciones de probabilidad estudiadas,la distribucin muestral de x tiene un valor esperado,una desviacin estndary una forma caracterstica.Para empezar se considetarla media de todos los valores de i , a la que se conoce como valor esperadode i.

Vqlor esperodo de
En el problema de muestreo de EAI se vio que en distintas muestrasaleatoriassimples se obtienen valores diferentes para la media muestral -t Como la variable aleatoria puede tener muchos valores diferentes, suele ser de inters conocer la media de todos los valores de que se obtienen con diferentes muestras aleatorias simples. La media de la variable aleatoria es el valor esperadode i. Sea EG) el valor esperadode i y t la media de la poblacin de la que se selecciona una muestra aleatoria simple. Se puede demostrar que cuando se emplea el muestreo aleatorio simple, E(x) y p son iguales.

i VALORESPERADODE
EI valor esperado de i es igual a la media de la poblacn de la que se tom la muestra.

E{) = p
donde

(7.t1

*):ffiJffi:f":r
Esto enseaque usando el muestreo aleatorio simple, el valor esperadoo media de la distribucin muestral de.i es igual a la media de la poblacin. En la seccin7.1 se vio que el sueldo anual medio de los administradoresde EAI es p : $51 800. Por tanto, de acuerdocon la ecuacin (7 .I), la media de todas las medias muestralesen el estudio de EAI es tambin $51 800. Cuando el valor esperadode un estimador puntual es igual al parmeto poblacional, se dice que el estimador puntual esinsesgado. Por tanto, la ecuacin (7.1) muestra que x es un estimador insesgadode la media poblacional p.

7.5

Distribucin muestrol t de

271

Desviqcin estndqr de t
Ahora se definir la desviacin estndarde la distribucin muestral de x. Se emplear la notacin siguiente. o, : desviacin estrndarde x o : desviacin estndarde la poblacin n : tamao de la muestra N : tamao de la poblacin Es posible demostrar que usando el muestreo aleatorio simple, la desviacin estndarde i depende de si la poblacin es finita o infinita. Las dos frmulas para la desviacin esndarson las siguientes.

DESVTACIN ESTNDARDE '' Poblacinfinita Poblacin infinita

N- nI o \ N- I hfi/

or= #

17,21

Al compararlas dosfrmulasseve queel factor V(N -D7(N- -T serequierecuandola poblacin es finita, perono cuandoes infinita.A estefactor se le conoce comofactor de correccin para una poblacinfinita. En muchas las situaciones de prcticas muestreo, encuentra de se que aunquela poblacinseafinita, es "grande",mientrasque el tamaode la muestraes "peque". En estos casos factorde correccin el paraunapoblacin frnita y'gf=fll1l - g escaii igual a l. Por tanto,la diferencia entreel valor de la desviacin estndar 'i en el casode pobhtiode nesfinita o infinitas sevuelvedespreciable. Entonces, : ofli es unabuenaaproximacin o, a la desviacin estnda i, auncuando poblacin finita. Estaobservacin de la sea lleva al siguiente lineamiento, reglageneral, o paracalcularla desviacin estrindar . de

USODE LA EXPRESIN SIGUIENTEPARACALCI.JLAR DESVIACTN LA ESTANDARDE.i o= siempreque 1. La poblacinseainfinita; o 2. La poblacin sea finita y el amao la muestrasea menor o igual a SVo del de tamaode la poblacin;es decir, r/ s 0.05.
Enelproblema2I se muestra que cuando n/N = 0.05, elfactor de correccin para una po blac in finin iene poc o efecto en el valor de or.
--F

t,

vn

17.9,

En los casosen que n/N > 0.05, para calcular s, deber usarsela versin para poblaciones finitas de la frmula (7.2).En este libro, a menos que se indique otra cosa, se supondrque el tamao de la poblacin es "grande", n/N = 0.05, y se usar la expresin (7.3) para calcular or.

272
El trmino error estndar se usa en la inferencia estadsticapara referirse a la desviacin estndar de un estimador puntual.

7 Coptulo

muestroles y Muestreo distribuciones

Para calcular cl, se necesitaconocer o, la desviacin estndarde la poblacin. Para subrayar, an ms, la diferencia entre o; y o, ala desviacin estindarde x, o, se le llamaerror estndar de la media. En general, el trmino error estdndar se refiere a la desviacin estndarde un estimador puntual. Ms adelante se ver que el valor del error estndarde la media ayuda a determinar qu tan lejos puede estar la media muestral de la media poblacional. Ahora, de nuevo con el ejemplo de EAI se calcula el error estndarde la media correspondientea las muestrasaleatorias simples de 30 administradoresde EAI. En la seccin 7.1 se hall que la desviacin estndarde los sueldos anuales en la poblacin : 2500. de los 2500 administradoresde EAI erao : 4000. En estecaso la poblacin es finita, N tamao de la muestra es 30, se tiene nlN : 3012500: O.Ol2. Como el taSin embargo, como el mao de la muestra es menor que 5Vodel tamao de la poblacin, se puede ignorar el factor de correccin para una poblacin finita y usar la ecuacin (7.3) para calcular el error estndar.
U -

o t/n

4000 V30

730.3

Formq de lo distribucinmuestrol de ;
Los resultadosanterioresrespecto al valor esperadoy a la desviacin estndaren la distribucin muestral de son aplicables a cualquier poblacin. El paso final en la identificacin de las caractesticas de la distribucin muestral de i es determinar la forma de la distribucin muestral. Se considerarndos casos: l. La poblacin tiene distribucin normal, y 2. La poblacin no tiene distribucin normal. En muchas situacioneses razonable suponerque [o poblocin tiene distribucin normol. que se seleccionla muestra aleatoria simple tenga distribucin normal o casi la poblacin de la normal. Cuando la poblacin tiene distribucin normal, la distribucin muestral de x est distribuida normalmente seacual seael tamao de la muestra. Lo poblccin no liene dicrribucin normol. Cuandola poblacinde la que setom la muestra aleatoria simple no tiene distribucin normal, elteorema del lfmite central ayuda a determinar la forma de la distribucin muestral de x. El enunciadodel teorema del lmite central aplicado a la distribucin muestral de i dice lo siguiente'

TEOREMA DEL LMITE CENTRAL Cuando se seleccionanmuestrasaleatorias simples de tamao n de una poblain, la distribucin muestral de la media muestral .t puede aproximarse mediante una distribucin normal a medida que el tamao de la muestra se hace grande' En la figura 7.3 se muestra cmo funciona el teorema del lmite central en tres poblaciones diferentest cada columna se refiere a una de las poblaciones.En el primer rengln de la figura se 'muestra que ninguna de las tres poblaciones est distribuida normalmente. La poblacin I tiene una distribucin uniforme. A la poblacin II se le conoce como distribucin en forma de orejas de conejo. Esta distribucin es simtrica, pero los valores ms probables se encuentranen las colas de la distribucin. La forma de la poblacin III se parece a una distribucin exponencial; es sesgadaa la derecha. En los tres renglones siguientesde la figura 7.3 se muestran las formas de las distribuciones muestralesparatamaosdemuestrasn:2,n:5yn:-30.Cuandoeltamaodelamuestraes 2, se observa que cada distribucin muestral tiene una forma diferente a la distribucin poblacional correspondiente.Con muestrasde tamao 5, se observa que las formas de las distribuciones muestralesen los casos de las poblaciones I y II empiezan a parecersea la forma de una distribucin normal. En el caso de la poblacin III, aun cuando la tbrma de la distribucin muestral empiezaa ser parecida a una distribucin normal, todava se observa cierto sesgo a la derecha.

7.5 Distribucin muesirol x de FIGURA ILUSTRACIN 7.3 NBITBOREMADELLMITE CENTRALCONTRES POBLACIONES


Poblacln I

273

Poblacirn II

Poblacin III

Dbtribucln poblcionnl

Valor de.x

M
Valor de Valor de.f

LW.--,Valor de Valor de

Illstribucidn mucetralde dei (n =2)

Di*tribucin muertral dei


(neS)

L@ LmLmM
Valor de

Dltrtbuci medtrst dei {r = 30}

Valor dei

Valor de

Valor de.f

Por ltimo, para muestrasde tamao 30, las formas de cada una de las tres distribuciones mues. trales es aproximadamentenormal. Desde el punto de vista de la prctica, ser conveniente saber qu tan grande necesita ser el tamao de la muestra para que aplique el teorema del lmite central y pueda suponer que la forma de la distribucin muestral es aproximadamentetnormal.En las investigaciones estadsticas se ha estudiado este problema en distribuciones muestralesde de muy diversas poblaciones y para muy diversos tamaos de muestras.Lo que se acostumbrahacer en la prctica es suponer que, en la mayor parte de las aplicaciones,la distribucin muestral de i se puede aproximar mediante una distribucin normal siempre que la muestra sea de tamao 30 o mayor. En los casos en que la poblacin es muy sesgadao existen observacionesatpicas, pueden necesitarsemuestras de tamao 50. Por ltimo, si la poblacin es discreta, el tamao de muestra necesariopara la aproximacin normal suele dependerde la proporcin poblacional. Ms acerca de este tema se dir cuando se estudie la distribucin muestral de D en la seccin 7.6.

274

Copitulo7

muestroles y Muesheo distribuciones

Distribucin muestrql de t en el problemo EAI


: $51 800 y or: 730.3, En el problema de EAI, para el que ya previamente se mostr que E(i) acercadela distribucin de la poblacin; puede estar o no no se cuenta con ninguna informacin distribuida normalmente. Si la poblacin tiene una distribucin normal, la distribucin muestral de i estardistribuida normalmente. Si la poblacin no tiene una distribucin normal, la muestra aleatoria simple de 30 administradores y el teorema del lmite central permiten concluir que la distribucin muestral de i puede aproximarse mediante una distribucin normal. En cualquiera de los casos,se concluye que la distribucin muestral de .i se describe medianteuna distribucin normal como la que se muestra enlafigtxa7.4.

Vqlor prctico de lq distribucin muestrql de


Siempre que se seleccione una muestra aleatoria simple y se use el valor de la media muestral para istimar el valor de la media poblacional p, no se podr esperar que la media muestral sea exactamente igual a la media poblacional. Larzrzn prctica por la que interesa la distribucin muestral de es que se puede usar para proporcionar informacin probabilstica acerca de la diferencia entre la media muestal y la media poblacional. Para demosfar este uso, se retomar el problema de EAL Suponga que el director de personal cree que la media muestral ser una estimacin aceptable de la media poblacional si la primera est a ms o menos de $500 de la media poblacional. Sin embargo, no es posible garunttzar que la media muestral est a ms o menos de $500 de la media pobiacional. En efecto, en la tabla 7.5 y en la figura 7.1 se observa que algunas de las 500 medias muestrales difieren en ms de $2000 de la media poblacional' Entonces hay que pensar en el requerimiento del director de personal en trminos de probabilidad. Es decir, al direc"Cul es la probabilidad de que la media tor de personal le interesa la interrogante siguiente: muestral obtenida usando una muestra aleatoria simple de 30 administradores de EAI, se encuentre a ms o menos de $500 de la media poblacional?" Como ya se han identificado las propiedadesde la distribucin muestral de i (vase figura 7.4), se usar esta distribucin para contestar esta interrogante probabilstica. Observe la distribucin muestral de que se muestra nuevamenteen la figura 7.5. Como la media poblacional es 300 $51 800, el director d personal deseasaber cul es la probabilidad de que i est entre $51 correspondal rreasombreadade la distribucin muestral que apay $52 300. Esta probabilidad 7.4 FIGURA DISTRIBUCIN MUESTRAL DE ' PARA EL SUELDO ANUAL BN UNA MUESTRA ALEATORIA SIMPLE DE 30 ADMINISTRADORES

,r s00 \r(l

7.5

Distribucin mueshol de

275

FIGURA 7.5 PROBABILIDAD DE QUE UNA MEDIA MUESTRAL DE I.'NA MUESTRA ALEATORIA SIMPLE DE 30 ADMINISTRADORES DE EAI SE ENCUENTRE ENTRELOS $5OO LAMEDIAPOBLACIONAL DE

o=730.30 P(51300<.f 300) <52 P(r< 51 300)

51 300

51 800

52300

rece en la figura 7.5. Como la distribucin muestral est distribuida normalmente y su media es $51 800 y el error estindarde la media es 730.3, se usa la tabla de probabilidad nonnal estindar para hallar el reao probabilidad. Primero se calcula el valor de z en el extremo superior de este intervalo (52 300) y se usa la tabla para hallar el rea bajo la curva a la izquierda de ese punto (rea hacia la cola izquierda). Despus se calcula el valor de z en el extremo inferior de este intervalo (51 300) y se usa la abla para hallar el ireabajo la curva a la izquierda de este punto (otra rea hacia la cola izquierda). Al restar la segundarea la primera, se obtiene la probabilidad buscada. de En : 52 300, se tiene

52300 - 51 800 : 0.68 730.30 En la tabla de probabilidad normalestndar probabilidad la acumulada (6rea a la izquierda de z : 0 . 6 8 ) e s0 . 7 5 1 7 . En i : 51 300.setiene

a -

sl 300- 51800= 0.68 730.30

La distribucin muestral de se usa para obtener i nfo rmac i n p ro bab i l st ic a acerca de qu tan cerca se encuentra la mdia muestral de la media poblacional p.

-0.68 es 0.2483.por tanto,p(51300<t< El reabajo la curya a la izquierdade z: : P(z= 0.68)- P(z< -0.68) : 0.7517 O.U.83: 0.5034. 523) Estosclculos indicanquehay unaprobabilidad 0.5034de quecon unamuesha de aleatoria simple de 30 administradores EAI se obtengauna media muestral. que esta ms o menos de de $500 de la media poblacional. Por tanto, la probabilidad de que la diferencia entre i y : a una r : $51,800seasuperior $500es 1 - 0.5034' 0.4966.En otraspalabras, muestra aleatoria simple de 30 administradores EAI tiene aproximadamente de 50/50 oportunidades tener de una mediamuestral no difiera de la mediapoblacional msde los aceptables que en $500.Quiz debapensarse una muestra tamaomayor.Se explorar en de estaposibilidadconsiderando y la relacinentreel tamaode la muestra la distibucin muestral .t. de

276

Copido 7

muestroles y Muesheo distribuciones

Relocinenlre el tomco de lo muestro y lo disrribucin muestrol de


simplede 100adde que Suponga en el problemade mueseo EAI setomauna muesta aleatoria msdatosproporindica queteniendo La -inirtlar"r en lugar de los 30 considerados. innicin una en : por cionados una muesfa mayor,la mediamuestralbasada n 100proporcionar mejor en muestralbasada n : 30. Paraver cuntoes de estimacin la mediapoblacionalque una media de y la mejor, seconsiderar relacinenfe el tamaode la muestra la disribucin muestral i. la : p independientemente tamaode la muestra.Entonces, del primero observeque E(i) media poblacionalp independientemente media de todos los valoresposiblesde .f es igual a la = con de del tmaon delamuestra.Pero,el error estndar la media,o, o f , estrelacionado el que el tamaode la muestraaumente, error del la raz cuadrada tamaode la muestra.Siempre de de estndar la mediao, disminuir.Con n : 30, el error estndar la media en el problemade de la muestran : 100,el error estndar la el aumentando tamaode EAI es730.3.Sin embargo, media disminuyea
U= -

o ln

4000 : 400 V100

an de muestrales i conespondienes : 30 y a las En la figura 7.6 se muestran distribuciones : 100 tiene un error estndar ms pequeo,han : 1)-.Como la distribucin muestral conn br menosvariacin entrelos valoresde i y stostenderna estarmscercade la mediapoblacionalquelos valoresde i con n: 30. paracalcularla probabiLa distribucinmuestralde i, en el cason : 100,puedeemplearse de lidad de que una muestraaleatoriasimplede 100 administradores EAI d una mediamuestral que no dihera de los $500 de la media poblacional.Como la distribucin muestrales normal y de su media es $51 800 y el error estndar la media es 400, se empleala tabla de probabilidad parahallar el6tea o la probabilidad. normal estndar (vase figura7.7) setiene Parai : 52 30O

52300- 51800 : 1 . 2 5 400


MUESTRALES 7. COMPARACINENTRELAS DISTRIBUCIONES FIGURA ALEATORIASSIMPLESDE TAMAO DE'' CON MTIESTRAS n = 30 ADMINISTRADORES DE EAI Y CON MUESTRAS DE TAMAO n = 10OADMINISTRADORES

Conn = 100,
d = {$$

gp = 30, ov=73O.3

51 800

7.5

Distribucin muesfolde t

277

FIGURA 7.7 PROBABILIDAD DE QUE LA MEDIA MUESTRAL NO DIFIERA EN MAS DE DE $5OO LA MEDIA POBLACIONAL USANDO UNA MUESTRA ALEATORIA SIMPLE DE IOO ADMINISTRADORES DE EAI

= 0.7888

En la tablade probabilidad normalestindar encuentra la probabilidad se que acumulada correspondiente z : 1.25es0.8944. a Para-t : 51 300.setiene 51 300 - 51 800 : -1,25 400

La probabilidad acumulada correspondiente a z : -1.25 es 0.1056. por tanto, p(51 300 < < 52 300) : P(z< 1.25) - Pk= -1.25):0.8944 - 0.1056: 0.7ggg.Entonces, aumentando el tamao de la muestra de 30 a 100 administradores de EAI, la probabilidad de obtener una muesta aleatoria simple que est entre los $500 de la media poblacional aumentade 0.5034 a 0.7888. Aqui el punto importante es que cuando aumenta el tamao de la muestra, el error estnda de la media disminuye' As, una muestra de mayor tamao proporciona mayor probabilidad de que la media muestral est denfto de una distancia determinada de la media poLlacional.

1. Al presentarla distribucin muestralde ,i para 2. La demostracin del teorema del lmite central el problemade EAI, se aprovechque se conorequiere observaciones independientes en la can la mediapoblacionalp: 51 800 y la desmuestra.Est condicin se satisfacecuandose viacin estndarpoblacional o : 40). Sin trata de poblaciones infinitas y cuando se trata embargo,lo usual es que los valoresde la mede poblacionesfinitas, si el muesfteose hace dia poblacionalp y de la desviacinestrndar con reemplazo. Aunque el teorema del lmite poblacionald, que se necesitan paradeterminar central no se refiere directamente a muestreos la distribucin muestral de .i, no se conozcan. . sin reemplazode poblaciones finitas, se aplican En el capftulo 8 se ver cmo se usanla media los hallazgos del teorema del lmite central muestral .f y la desviacin estndarmuestral ,s cuando la poblacin es de tamao grande. cuandono se conocenI y o.

278

Z Coptulo

muestroles Muesireo distribuciones y

Mtodos
es 18. La media de una poblacin es 200 y su desviacinestrndar 50. Se va a tomar una muestra aleatoriasimple de tamao 100 y se usarla media muestralparaestimarla mediapoblacional. de a. Cuil el valor esperado ? es de b. Cules la desviacinestrndar r? c. Muestre la distribucinmuestralde i d. Qumuestrala distribucin muestralde ?

O,rto@

es una 19. La mediade unapoblacines 200 y su desviacinestndar 50. Supongaque seselecciona variablealeatoriasimple de tamao100 y se usa paraestimarp a. Cules Ia probabilidadde que la diferenciaentre la media muestraly la media poblacional no seamayor que -5? b. Deque la diferenciaentrela mediamuestraly la mediapoblacionalno seamayor que t 10? que poblacionales o : 25. Calculeel enor estndar la media, de 20. Suponga la desviacinestndar de del de oi, con muestras tamao50, 100, 150 y 200. Qupuededecir acerca error estndar la media conformeel tamaode la muestraaumenta? 21. Supongaque de una poblacinen la que o : l0 se toma una muestraaleatoriasimple de tama(si de o 50. Halle el valor del error esLndar la mediaen cadauno de los casossiguientes es necesariouseel factor de correccinparauna poblacinfinita). a. El tamaode la poblacines infinito. b. El tamaode la poblacines N : 50 000. c. El tamaode la poblacines N : 5000. d. El tamaode la poblacines N : 500.

Aplicociones
de 22. Regreseal problemade los administradores EAL Supongaque se usa una muestraaleatoria simple de 60 administradores. a. Dibuje la distribucin muestralde i si se empleanmuestrasaleatoriassimplesde tamao 60. aleatorias simplesde tamab. Qupasacon la distribucinmuestralde i si se usanmuestras o 120? c. Qupuededecir acercade lo que le pasaa la distribucinmuestralde i conformeel tamaser Explique. o de la muestraaumenta? Parece lgica esta generalizacin? problemade EAI (vasefigura 7.5), se mostr que con n : 30,Ia probabilidadde que la 23. En el media muestralno difiriera ms de $500 de la mediapoblacionalera 0.5034. a. Cules la probabilidadde que la media muestralno difiera ms de $500 de la media poblacional si se usa una muestrade tamao60? b. Responda inciso a si el tamaode la muestraes 120. el 24. El costomedio de la colegiaturaen una universidadestatalde EstadosUnidos es $4260anuales. ' poblacionales Considereestevalor como mediapoblacionaly asumaque la desviacinestrndar una muestraaleatoriade 50 universidades. o : $900. Supongaque selecciona la a. Presente distribucinmuestralde como mediamuestralde la colegiaturaen las 50 universidades. b. Cules la probabilidadde que la muestraaleatoriasimple proporcioneuna mediamuestral que no difiera de la media poblacionalen mis de $250? simple proporcioneuna mediamuestral c. Cules la probabilidadde que la muestraaleatoria que no difiera de la media poblacionalen ms de $100? 25. El College BoardAmerican College Testinghogram informa que en el examende admisin a las universidades,a nivel nacional, la media poblacional de las puntuacionesque se obtienen es # = poblacional es o : l(X). lO2O(The WorldAlmanac 2003). Supongaque la desviacinestrndar

o"o@

7.5

muestrol t de Dishibucin a. b.

279

la Cuifles la probabilidadde que en una muestraaleatoriade 75 estudiantes media muespuntuaciones difiera ms de 10 puntosde la media poblacional? no tral de las la Curfles la probabilidadde que en una muestraaleatoriade 75 estudiantes media mueslas puntuaciones difiera ms de 20 puntosde la media poblacional? no tral de

26. El costo medio anual de un seguropara automvil es de $939 (CNBC, 23 de febrero de 20O6). que la desviacinestndar o : $245. es Suponga de a. Cules la probabilidadde que una muestraaleatoriasimple de plizasde seguros automvil la media muestralno difiera ms de $25 de la media poblacionalsi el tamaode la muestra 30, 50, 100y 400? es b. Quventajatiene una muestragrandecuandose quiere estimarla mediapoblacional? que terminabansus estudiosen los 30 enfre los estudiantes 27. BusinessWeek realiz una encuesta programasde una maestra(BusinessWeek,22 septiembre 2003). De acuerdocon estaende de de cuestael salariomedio anual de una mujer y de un hombre l0 aosdespus terminar susesSupongaque la desviacinestndarentre los tudios es $ll7 000 y $163 000, respectivamente. salariosde las mujereses $25 000 y entrelos salariosde los hombreses $40 000. a. Cul es la probabilidadde que en una muestraaleatoriasimple de 40 hombresla media muestralno difiera ms de $10 000 de la media poblacionalde $168 000? b. Cul es la probabilidad de que en una muestraaleatoriasimple de 40 mujeres la media muestralno difiera ms de $10 000 de la media poblacionalde $117 000? c. En curlde los dos casos,inciso a o inciso b, hay ms probabilidadde obteneruna media muestralque no difiera en ms de $10 000 de la media poblacional?Porqu? d. Cules la probabilidadde que en una muestraaleatoriasimple de 100 hombres,la media muestralno difiera en ms de $4000 de la media poblacional? 28. Un hombregolfista tiene una puntuacinpromediode 95 y una mujer de 106 (Golf Digest, abnl de de 2ffi6). Considereestosvalorescomo mediaspoblacionales los hombresy de las mujeresy poblacionales o : 14 golpesen amboscasos.Se tomaruna que la desviacinestndar suponga muestraaleatoriasimple de 40 golfistashombresy otra de 45 mujeresgolfistas a a. D la distribucin muestralde i correspondiente los hombresgolfistas. b. Cules la probabilidadde que, en el casode los hombresgolfistas,la media muestralno difiera en ms de 3 golpesde la media poblacional? c. Cules la probabilidadde que,.enel casode las mujeresgolfistas,la mediamuestralno difiera en ms de 3 golpesde la media poblacional? d. En cul de los casos,inciso a o inciso b, es mayor la probabilidadde que la media muestral no difiera en ms de 3 golpesde la media poblacional?Porqu? 29. En el norte de Kentucky (The CncnnatiEnquirer,2l de enerode 2006) el precio promediode que la desla gasolinasin plomo era$2.34.Use esteprecio como media poblacionaly suponga poblacionales $0.20. viacin estndar no a. Cules la probabilidadde que el precio medio en una muestrade 30 gasolineras difiera en ms de $0.30 de la media poblacional? b. Cules la probabilidadde que el precio medio en una muestrade 50 gasolineras difieno ra en ms de $0.30 de la media poblacional? c. Curles la probabilidadde que el precio medio en una muestrade 100 gasolineras difieno ra en ms de $0.30 de la media poblacional? de d. Recomendara usted alguno de los tamaosmuestrales los incisos a, b o c para que la probabilidadde que el precio muestralno difiriera en ms de $0.30 de la media muestral fuera $0.95? se 30. Paraestimarla edadmediade una poblacinde 4000 empleados toma una muestrade 40 empleados. una poblacinfinita en el cilculo del error estna. Ustedusarael factor de correccinpua dar de la media?Explique.

280

7 Coptulo

y muesholes Muesheo distribuciones poblacionales o = 8.2 aos,calcule el error estndar con y sin el Si la desviacinestndar factor de correccin para una poblacin finita. Cul es la basepara ignorar el factor de correccinpara la poblacinfinita, si ilN < 0.05? Cuifl es la probabilidad de que la media muestral de las edadesde los empleadosno difiera en ms de t2 aosde la mediapoblacionalde las edades?

b.

c.

muestraldeB Distribucin
p poblacional La frmulapara puntualde la proporcin p. muestral esel estimador La proporcin muestral es calcularla proporcin
'D : * n

donde

que la de de x : nmerode elementos la muestra poseen caracterstica inters n : tamaode la muestra p y muestral es unavariablealeatoria su disni7 Comoseindic en la seccin .4,la proporcin comodistribucin muestral B. de se bucinde probabilidad conoce

p uunsrnL DE DrsrRrBUcrN
La distribucin muestral de p es la distribucin de probabilidad de todos los posibles valoresde la proporcinmuestal p.

Para determinarqu tan cerca esl la proporcinmuestralp de la proporcinpoblacional muestral p: el valor esperado p,la p, senecesita las de de de entender propiedades la distribucin de desviacin es'nda p y la forma de la distribucinmuestralde p.

Volor esperqdo de p
povaloresde p, es igual a la proporcin de El valor esperado p,la mediade todoslos posibles p. blacional

VALOR ESPERADO p DE

E(F) = p
donde E(F) = valor esperado p de = proporcinpoblacional p

17.41

7.

muestrol P de Distribucin

281

que 7.1 insesgado p. Recuerde en la seccin seencontr de ComoE(p) : p, F es un estimador de queen la poblacin EAIp : 0.60,siendopla proporcin la poblacin administradores de de Por de que han participadoen el programade capacitacin la empresa. tanto, el valor esperado p en el problema muestreo EAI es 0.60. de de de

Desviocin estndsr de p
de a de estndar p obedece si la poestndar la desviacin Comoen el casode la desviacin estndar p sepresende esnita o infinita. Las dosfrmulasparacalcularla desviacin blacin tan a continuacin.

DESVIACINESTNDARDE P Poblacinfi.nita Poblacininfinita


oF=

p(r - p)
n

{7.5}

que es las Al comparar dos frmulas(7.5) seaprecia la nicadiferencia el usodel factorde cofinita {(N - n)/(N - l), rreccinparaunapoblacin para .t, entrelas expresiones unapoComoen el casode la mediapoblacional la diferencia si blacin finita y parauna infinita es despreciable el tamaode la poblacinfinita es grandeen para Se la de comparacin el tamao la muestra. seguir mismareglarecomendada la media con < 0.05 seusaro,- : tfp1l= -fi. Pero,si poblacional. decir,si la poblacin finita y n/N es Es paraunapoblausarel factorde correccin deber la poblacin finita y n/N > 0.05,entonces es que otra cin finita. Timbin, a menosque se especifique cosa,en estelibro se supondr el taal maode la poblacines grandeen comparacin tamaode la muestray por tanto,el factor de paraunapoblacinfinita no sernecesario. correccin de estndar 7.5 En la seccin seus el errorestindar la mediaparareferirsea la desviacin se estndar un esde el de i. Sedijo queen general trminoerrorestndar refierea la desviacin se de timadorpuntual.As, en el casode proporciones usael error estndar la proporcinpara de referirsea la desviacinestndar p. Ahora se vuelve al ejemplode EAI para calcularel error de estndar la proporcinen la muestraaleatoriasimple de los 30 administradores EAI. de En el estudiode EAI se sabeque la proporcinpoblacionalde administadoresque han pares de ticipadoen el programa capacitacin p : 0.60. Comon/N : 3Ol2500 : 0.012sepuede de ignorar el factor de correccinpara una poblacinfinita al calcular el error estndar la proou porcin.En la muesftaaleatoria simplede 30 administradores, es
op:

/0.60(l 0.60): : 1r d.0894 Y 3 0

Formq de lo distribucin muesrrol de pmuestral p, el ltiestndar la distribucin de de la Ahora que seconoce mediay la desviacin La muestral. proporcin muestral p : xln. es la mo pasoes determinar forma de la distribucin En una muestraaleatoriasimple de una poblacingrande,el valor de es una variablealeatoria de binomial que indica el nmerode los elementos la muestraque tienenla caractefsticade inla de de ters.Como es una constante, probabilidad x/n es la mismaque la probabilidad , lo muestral p tambinesunadistibucin de probabilidad de discual significaquela distribucin cretay que la probabilidadde cadaxln es la misma que la probabilidadde .

282

Copitulo7

y muestroles Muestreo distribuciones

En el captulo 6 se mostr que una distribucin binomial se aproxima mediante una distribucin normal siempre que el tamao de la muestra sea lo suficientemente grande para satisfacer las dos condiciones siguientes. np>5 y n(l-p)>-5

Suponiendo que se satisfaganestas dos condiciones, la distribucin de probabilidad de r en la proporcin muestral, P : xln, puede aproximarsepor medio de una distribucin normal. Y como n es una constante,la distribucin muestral de p tambin se aproxima mediante una distribucin normal. Esta aproximacin se formula como sigue:

La distribucin muestral de p se aproxima mediante una distribucin normal siemprequenp>5yn(l-p)=5.

En las aplicaciones prcticas, cuando se requiere una estimacin de la proporcin poblacional, casi siempre se encuentra que el tamao de la muestra es suficientemente grande para poder usar la aproximacin normal para la distribucin muestral de p. Recuerde que en el problema de muestreo de EAI la proporcin poblacional de administradores que han participado en el progmma de capacitacin es p : 0.60. Con una muestra aleatoria simple de tamao 30, se tiene np : 30(0.60) : 18 y n(l - p) : 30(0.40) : lz.Por tanto, la distribucin muestral de p se calcula mediante la distribucin normal que se muestra en la figura 7.8.

Volor prctico de lo distribucin muesrrol de p


probabilsinformacin de muestral p esquepermiteobtener El valor prcticode la distribucin poblacional.Por ejemtica acercade la diferenciaentrela proporcinmuestraly la proporcin saber culesla probabilidad obtener de desea plo, en el problema EAI, el directorde personal de poblacional los adminishadores de un valor de p queno difieraen msde 0.05de la proporcin de Es es en de EAI quehanparticipado el programa capacitacin. decir,curl la probabilidad de de en teneruna muestra la quep estentre0.55y 0.65?El reasombreada la figura 7.9 corresDE 7.8 DISTRIBUCIN MUESTRAL DE P, PROPORCIN ADMINTSTRADORES FIGURA DE HAN PARTICIPADOEN EL PROGRAMA DE CAPACTTACIN EAI QI.JE

0.60 -"",

7. 7.9 FTGURA

Distribucin muestrol B de PROBABILIDAD DE QUE t

283
ESTEENTRE 0.55Y 0.65

Distribucin mueshal

dt = o'0894

ep
= P(0.55 F < 0.65)= 0.4V46 0.7123 0.2877 <

P(t <0.55)=0.2877

0.5s0.60 0.65

ponde a esta probabilidad. A partir de que la distribucin muestral de p se aproxima mediante una distribucin normal con media 0.60 y error estndar de la proporcin o- :0.0894, se encuentra que la variable aleatoria normal estindar correspondiente a F : 0.65 tiene el valor z: (0.65 - 0.60)i0.0894 : 0.56. En la tabla de probabilidad normal estindar aparece que la probabilidad acumuladaque correspondea z: 0.56 es 0.7I23. De manera similar para p : 0.55, se encuentrague z : (0.55 - 0.60)/0.0894 : -0.56. En la misma tabla y correspondientea z: -0.56 es 0.2877. De esta manera, la probabilidad de seleccionaruna muestra en la cual el valor de p no difiera ms de 0.05 de la proporcin poblacional p est dada por 0.7123 - 0.2877 : 0.4246. Si se aumenta el tamao de la muestra a n : 100, el error estindar de la proporcin se convierte en

:0.049
Con una muestra de 100 administradores de EAI, se calcula ahora la probabilidad de que la proporcin muestral tenga un valor que no difiera en ms de 0.05 de la proporcin poblacional. Como la distribucin muestral es aproximadamente nonnal, con media 0.60 y desviacin estndar0.049, se puede usar la tabla de probabilidad normal estndarpara hallar el irea o probabilidad. Para B : 0.65, se tiene : (0.65 - 0.60y0.049 : 1.02. La tabla de probabilidad normal estindar arroja que la probabilidad acumulada correspondiente a z: l.O2 es 0.8461. De manera similar, pa p : 0.55, se tiene que z : (0.55 - 0.60y0.049 : -L.02. Se encuentraque la probabilidad acumulada correspondientea z: -1.02 es 0.1539. Por tanto, si el tamao de la muestra aumentade 30 a 100, la probabilidad de que la proporcin muestral p no difiera en ms de 0.05 de la proporcin poblacional aumenta a 0.8461 - 0.1539 : 0.6922.

Mtodos
31. De una muestraaleatoriade tamao 100 de una poblacinen la que p = 0.40. de a. Cules el valor esperado p? de b. Cules el error estndar p?

284

Coptulo7 c. d.

y muestroles Muesheo distribuciones Expresela distribucinmuestralde p. Quindica la distribucinmuestralde p?

orto@

32Una proporcin poblacional es 0.40. Se toma una muestra aleatoria de tamao 200 y la propor-

cin muestral p se usa para estimar la proporcin poblacional. a. Cul es la probabilidad de que la proporcin muestral est entre +0.03 de la proporcin poblacional? b. De que la proporcinmuestralestentre -10.05de la proporcinpoblacional?

33. Supongaque la proporcinpoblacionales 0.55. Calcule el error estndarde la proporcin,or,


para los tamaosde muestra 100, 200, 500 y 1000. Qupuededecir acercadel tamao del error estndara medida que el tamao de la muestraaumenta?

34. La proporcinpoblacionales 0.30. Cules la probabilidadde que las proporcionesmuestraly


poblacionalestentret 0.04 con los tamaosde muestrasiguientes? a. : 100 b. n:2N c. :500 d. n: lX) e. Quventajatiene un tamaograndede muesha?

Aplicociones

orto@

3sEl director de una empresapiensa que 3OVode los pedidos provienen de nuevos compradores.
Para ver la proporcin de nuevos compradoresse usar una muestra aleatoria simple de 100 pedidos. a. Supongaque el director esi en lo cierto y quep : 0.30. Cules la distribucin muestral de p en esteestudio? b. Cules la probabilidadde que la proporcinmuestralde p estentre 0.20 y 0.40? c. Cules la probabilidadque la proporcinmuestralde p estentre 0.25 y 0.35? 36. The Cincinnati Enquirer irrtorma que en EstadosUnidos 66Vode los adultosy 87Vode los jvenes entore y 17 aosusanIntemet (The Cincimati Enquirer, T de febrero de 2007). Considereestos 12 datos como proporcionespoblacionalesy supongaque se usaruna muestrade 300 adultos y 300 jvenes para obtenerinformacin respectode su opinin acercade la seguridaden Internet. a. Muestre la distribucin muestral de p, siendo p la proporcin muestral de adultos que usan Internet. b. Cul es la probabilidad de que la diferencia entre la proporcin muestral y la proporcin poblacionalde adultosque usanInternetno seamayor que + 0.(X? c. Cul es la probabilidad de que la diferencia entre la proporcin muestral y la proporcin poblacionaldejvenes que usanInternetno seamayor que + 0.04? del d. Sondiferenteslas probabilidades inciso b y del inciso c? Si es as, porqu? al e. Responda inciso b en el casode que el tamaode la muestrasea600. Esmenor la probabilidad?Porqu?
3t.

Los sondeosde TizezCNN entre los votantes siguieron la opinin del pblico respecto de los presidenciales las votaciones 2000. En uno de estossondeos YankelovichParten del candidatos que la votantes(Time,26 dejunio de 2000). Suponga nersempleuna muestrade 589 probables hayasidop : 9.59. proporcinpoblacionala favor de un determinado candidatoa la presidencia Sea p la proporcin muestral en los posibles votantes que est a favor de esecandidato a la presidencia. a. Muestrela distribucin muestralde p. b. Cuil es la probabilidad de que los sondeosde 7irezCNN indiquen que la diferencia entre no muestraly poblacionalen uno de estossondeos seamayor que +0.04? las proporciones c. Cul es la probabilidad de que los sondeosde TineuCNN indiquen que la diferencia entre no muestraly poblacionalen uno de estossondeos seamayor que +0.03? las proporciones d. Cul es la probabilidad de que los sondeos de Tirze[NN indiquen que la diferencia entre las proporciones muestral y poblacional en uno de estos sondeos no sea mayor que +0.02?

7.7

puntuoles Propiedodes losestimodores de

285

38. Roper ASW realiz una encuestapara obtener informacin acercade la opinin de los estadounidensesrespectoal dinero y la felicidad (Money, octubre de 2003). Cincuenta y seis por ciento por dijo de los entrevistados revisarel estadode su bloc de cheques lo menosuna vez al mes. adultos.Indique la distribucin a. Supongaque se toma una muestrade 400 estadounidenses por muestralde la proporcinde adultosque revisanel estadode su bloc de cheques lo menos una vez al mes. b. Cules la probabilidadde que la diferenciaentre la proporcinmuestraly la proporcin poblacionalno seamayor que +0.02? muestraly poblacional c. Cuifles la probabilidadde que la diferenciaentre las proporciones no seamayor que +0.04? 25Vode los vuelos que llegaron al aeropuerto San de 39. El Democrat and Chronicle informa qu,e Diego en los primeroscinco mesesde 2001, arribaroncon retraso(Democratand Chronicle,23 que la proporcinpoblacionalseap : 0.25. dejulio de 2001). Suponga a. Muestre la distribucin muesfral de B, la proporcin de vuelos retrasadosen una muestrade 1 000 vuelos. muestraly poblacional b. Cules la probabilidadde que la diferenciaentre las proporciones no seamayor que +0.03, si el tamaode la muestraes 1000? el c. Responda inciso b con una muestrade 500 vuelos. ofAmerica informaqtteT67ode los consumidores leenlos ingredien40. The GroceryManufacturers en tes que se enumeran la etiquetade un producto.Supongaque la proporcinpoblacionalesp : 0.76 y que de la poblacinde consumidores selecciona se una muestrade 400 consumidores. a. Expresela distribucinmuesffalde la proporcinmuestralF , si F es la proporcinde consumidores de la muestra que lee los ingredientes que se enumeranen la etiqueta. muestraly poblacional b. Cules la probabilidadde que la diferenciaentre las proporciones no seamayorque +0.03? c. Contesteel inciso b si el tamaode la muestraes 750 consumidores. gastanmsde $l) en productosde 41. El Food Marketing Instituteinforma que ITVodelos hogares que la proporcinpoblacionalesp : 9.17 y que de la poblacinse toma una Suponga abarrotes. muestraaleatoriasimple de 800 hogares. a. Expresela distribucinmuestralde p,la proporcinmuestralde hogaresque gastanmsde en $100 semanales abarrotes. b. Cules la probabilidadde que la proporcin poblacionalno difiera en ms de 0.02 de la proporcin poblacional? c. Contesteel inciso b en el casode que el tamaode la muestrasea 1600hogares.

6i
\_-/

puntuales de Propiedades los estimadores


r

En este capltulo se ha mostrado que los estadsticosmuestrales,como la media muestral .i, la desviacin estndarmuestral s y la proporcin muestral p sirven como estimadorespuntualesde sus correspondientesparimetros poblacionales,p, o y p. Resulta interesanteque cada uno de estos estadsticosmuestrales sean los estimadorespuntuales de sus correspondientesparmetros poblacionales. Sin embargo, antes de usar un estadsticomuestral como estimador puntual, se veri'fica si el estimador puntual tiene ciertas propiedades que corresponden a un buen estimador puntual. En esta seccin se estudianlas propiedadesque debentener los buenosestimadorespuntuales: insesgadez,eficiencia y consistencia. muestralesque se usan como estimadorespuntualesde suscoComo hay distintos estadsticos rrespondientes parimeEos poblacionales, en esta seccin se usar la notacin general siguiente. 0 : el parmetro poblacional de inters 6 : elestadstico muestral o estimador puntual de g "theta sombrero". En general, I En esta notacin g es la letra griega theta y la notacin se lee representacualquier parmetro poblacional como, por ejemplo, la media poblacional, la desvia-

286

Coptulo7

muestroles y Muestreo distribuciones

cin estndarpoblacional, la proporcin poblacional, et".;6 representael correspondienteestamuestral y la proporcin dstico muestral, por ejemplo, la media muestral, la desviacin estrndar muestral.

lnsesgodez
Si el valor esperadodel estadsticomuestral es igual al parmetro poblacional que se estudia,se dice que el estadsticomuestral es an estimador insesgadodel parmetro poblacional.

INSESGADEZ poblacional0 si del El estadlsticomuestral es rm estimadoinsesgado parmetro

E(0): 0
donde 816 = valor esperado del estadstico muestral

por tanto, el valor esperado,o media, de todos los posibles valores de un estadsticomuestral insesgadoes igual al parimetropoblacional que se estudia. En la figura 7.10 se muestranlos casosde los estimadorespuntuales sesgadoe insesgado.En la figura en que se muestra el estimador insesgado,la media de la distribucin muestral es igual al valor del parmetro poblacional. En este caso los errores de estimacin se equilibran, ya que algunas vecs el valor iel estimador puntual puede ser menor que I y otras veces sea mayor que g. En el caso del estimador sesgado,la media de la distribucin muestral es menor o mayo, qo" el valor del parmetro poblacional. En la grrcaB de la figura 7.10, () es mayor que 0; as,laprobabilidad de que los estadsticosmuestralessobreestimenel valor del parmetro poblacional es grande. En la gura se muestra la amplitud de este sesgo'

7.IO FIGURA

EJEMPLOS DE ESTIMADORES PUNTUALES SESGADO E INSESGADO muestral Distribucin de0 muestal Distribucin de0

e
El parmeto d se localiza en la media de la distribucin muestral;

E@\

El parmero Ono se localiza en la media de la distribucin muestal

E(0\= e

E@\* e sesgado B Grca Estimador

Grlic Al Estimadorinsesgado

7.7

Propiedodes losestimodores de puntuoles

287

Al estudiar las distribuciones muestralesde la media muestral y de la proporcin muestral, se vio que E(x) : p y que E(p) : p. Por tanto, y p son estimadoresinsesgadosde sus correspondientesparmetrospoblacionalesp y p. En el caso de la desviacin estndarmuestral s y de la varianza muestral s2, se puede mostrar que E(s2 : o2.Por tanto, se concluye que la varianza muestral s2es un estimador insesgado de la vananzapoblacional 02.En efecto, en el captulo 3, cuando se presentaronlas frmulas para la varranzamuestral y la desviacin estndarmuestral en el denominador se us n - I en lugar de n para que la vananza muestral fuera un estimado insesgadode la varianza poblacional.

Eficienciq
Suponga que se usa una muestra aleatoria simple de n elementos para obtener dos estimadores puntuales insesgadosde un mismo parmetro poblacional. En estascicunstanciaspreferir usar el estimador puntual que tenga el menor error estndar,ya que dicho estimador tender a dar estimaciones ms cercanasal parmetro poblacional. Se dice que el estimador puntual con menor error estndatiene mayor eficiencia relativa que los otros. En la figura 7.11 se presentanlas distribuciones muestralesde dos estimadorespuntuales insesgados, 0, y 0r. Observe que el error estndarde , es menor que el error estndarde Ar; por tanto, los valores de 0t tienen ms posibilidades de estar cerca del parimetro d que los valores de r. Como el error estndardel estimado puntual 6, e, -enor que el error estndardel estimado puntual 0r, 0, "" relativamente ms eficiente qu" iry se prefiere como estimador puntual.

Cuando se muestrean poblac ione s no rmale s, eI error estndar de la media muestral es ntenor que el error estndnr de la mediatn muestral. Por tanto, la media muestral es trus eficiente que la mediana muestral.

Consistencio
La tercerapropiedad relacionadacon un buen estimador puntual es la consistencia. Dicho de manera sencilla, un estimador puntual es consistentesi el valor del estimador puntual tiende a estar ms cerca del parmetropoblacional a medida que el tamao de la muestraaumenta.En otras palabras, una muestra grande tiende a proporcionar mejor estimacin puntual que una pequea.Observe que en el caso de la media muestral , el error estndar de ,- esL dado por or: of{. Puesto que or est vinculado con el tamao de la muestra,de manera que muestrasmayores dan

FIGURA I 7.I

DISTRIBUCIONES MUESTRALESDE DOS ESTIMADORESPUNTUALES INSESGADOS

288

7 Coptulo

muestroles y Muestreo distribuciones

proporcionar estimadores valores menores de o' entoncesmuestrasde tamao grande tienden a un razonamiento similar' concluya puntuales ms cercanosa la media poblacional p. Mediante p' que la proporcin muestral p es un estimador consistentede la proporcin poblacional

problemade EAI con : 30, el En el captulo 3 se dijo que la media y la mediana cuerdeque en el fue o" : 730.3.El error de de sondosmedidas localizacincentral.En esteca- error estndar la media X de ptulo slo se estudi la media. La razn es que estndar la medianaen esteproblema ser1.25 .J30j\: es 913.Por tanto,la mediamuestral ms de una poblacinnormal,en la iuando semuestrea dentro son cual la mediay la medianapoblacionales idn- eficiente y tendr ms probabilidad de estar distanciade la mediapoblaciode de una determinada ticas, el error estndarde la medianaes cerca de 257o mayorque el error estndar la media' Re- nal.

lz.s Otros mtodosde muestreo )


las propiedadesde Se describi el procedimiento de muestreo aleatorio simple y se estudiaron simple' Sin embarlas distribuciones muestralesde y de p cuando se usa el muestreo aleatorio simple no es el nico mtodo de muestreo que existe' Hay otros mtogo, el muestreo aleatorio y el muestreo dos como el muestro aleatorio estratificado, el muestreo por conglomerados situaciones,tienen ventajassobre el muestreoaleatorio simple. En esta sistemticoque, en ciertas 22 que se encuenseccin se introducen brevementeestos mtodos de muestreo. En el captulo que se distribuye con el texto se estudian estos mtodos de muestreo con ms detetra en el CD nimiento.

Esta seccin ProPorciona una breve introduccin a otros mtodos de muestreo distintos al muesfteo aleatorio simple.

Muestreo oleqtorio estrqtificodo


primero se dividen en gruEn el muestreo aleatorio estratificado los elementosde la poblacin uno y slo un esde pos, a los que se les llama estrato,s, manera que cada elemento pefenezca a formacin de los estratos, que puede ser departamento, edad, tipo de irato. La bur" puru la se obtienen industria, etc., est a discrecin de la persona que disea la muestra. Sin embargo, los elementosque forman un estrato son lo ms parecido posible' La mejores resultadoscuando figura 7 .12 es un diagrama de una poblacin dividida en 11estratos. Existen IJnavezformados los estratos,se toma una muestra aleatoria simple de cada estrato. los resultados de las muestrasde los varios estratosen una estimacin frmulas para combinar

El muestreo aleatorio estrartcadofunciona mejor cuando Ia varianza enlre los elementosde cada estrato es relativamente pequea.

7.T2 DIAGRAMA DE UN MUESTREOALEATORIOESTRATIFICADO FIGURA

7.8

Otrosmtodos muestreo de DIAGRAMA DEL MUESTREO POR CONGLOMERADOS

289

FIGURA 7.I3

del parmetropoblacional de inters.El valor del muestreoaleatorio estratificado dependede qu tan homogneosseanlos elementosdentro de cada estrato.Si los elementosde un estrato son homogneos,el estrato tendr una varianza pequea.Por tanto, con muestrasrelativamente pequeas de los estratos se obtienen buenas estimacionesde las caractersticasde los estratos. Si los estratosson homogneos,el muestreo aleatorio estratificado, proporciona resultadostan precisos como los de un muestreo aleatorio simple, pero con una muestra de tamao total menor.

Mueslreo por conglomerqdos


El muestreopor conglomerados funciona mejor cuando cada con g lome rado p rop orc iona una representacin a menor escala de Ia poblacin.

En el muestreo por conglomerados los elementos de la muestra primero se dividen en grupos separados,llamados conglomerados. Cada elemento de la poblacin pertenece a uno y slo un conglomerado(vasefigura 7.13). Se toma una muestraaleatoriasimple de los conglomerados. La muestra est formada por todos los elementosdentro de cada uno de los conglomeradosque forman la muestra. El muestreo por conglomerados tiende a proporcionar mejores resultados cuando los elementos dentro de los conglomeradosno son semejantes.Lo ideal es que cada conglomerado sea una representacin,a pequeaescala,de la poblacin. Si todos los conglomerados son semejantes esteaspecto,tomando en la muestraun nmero pequeode conglomeraen dos se obtendr una buena estimacin de los parmetrospoblacionales. Una de las principales aplicaciones del muestro por conglomeradoses el muestreo de reas, en el que los conglomerados son las manzanasde una ciudad u otras reas bien definidas. El muestreo por conglomerados requiere, por lo general, tamaos de muestra mayores que los requeridos en el muestreo aleatorio simple o en el muestreo aleatorio estratificado. Sin embargo, es posible reducir costos debido a que cuando se enva a un entrevistador a unq de los conglomerados de la muestra (por ejemplo, a una manzanade una ciudad), es posible obtener muchas observacionesen poco tiempo. Por tanto, se obtiene una muestra de tamao grande a un costo signifi cantementemenor.

Muestreo sistemtico
Para ciertos muestreos,en especialen aquellos con poblacionesgrandes,se necesitamucho tiempo para tomar una muestra aleatoria simple (hallando primero los nmeros aleatorios y despus contando y recorriendo toda una lista de la poblacin hasta encontrar los elementos correspondientes). Una alternativa al muestreo aleatorio simple es el muestreo sistemtico. Por ejemplo, si se quiere una muestra de tamao 50 de una poblacin que tiene 5000 elementos, se muestrea uno de cada 5 000/50 : 100 elementos de la poblacin. En este caso, un muestreo sistemtico consiste en seleccionaren forma aleatoria uno de los primeros elementosde la lista de la poblacin. Los otros elementos se identifican contando a partir del primer elemento 100 elementos puatomar el elemento que tenga la posicin 100 en la lista de la poblacin, a partir de este elemento se cuentan otros 100 y as se contina. Por lo general, de estamanera es ms fcil de identificar la muestra de 50 que si se usara el muestreo aleatorio simple. Como el primer elemento que se seleccionaes elegido en forma aleatoria, se supone que una muestra sistemticatiene las

290

Z Coptulo

muestroles y Muestreo distribuciones

propiedadesde una muestra aleatoria simple. Esta suposicin es aplicable, en especial,cuando la lista de los elementosde la poblacin es un orden aleatorio de los elementos.

Muestreo de conveniencio
Los mtodos de muestreo hasta ahora vistos se conocen como tcnicasprobabilsticas de muestreo.Loselementos seleccionadosde una poblacin tienen una probabilidad conocida de ser incluidos en la muestra.La ventaja del muestreoprobabilstico es que, por lo general,se identifica la distribucin muestral del estadsticomuestral correspondiente.Para determinar las propiedaen des de la distribucin muestral se usan las frmulas presentadas estecaptulo para el muestreo muestral permite hacer afirmaciones probabilsticas acercadel aleatorio simple. La distribucin error al usar los resultadosmuestralespara hacer inferencias acercade la poblacin. El muestreo de conveniencia es una tcnica de muestreo no probabilstica. Como el nombre lo indica, la muestra se determina por conveniencia. Los elementos se incluyen en la muestra sin que haya una probabilidad previamente especificadao conocida de que sean incluidos en la muestra.Por ejemplo, un profesor que realiza una investigacin en una universidad puede usar estudiantesvoluntarios para que constituyan una muestra; laraz6n para elegirlos? simple, los tiene al alcance y participarn como sujetos a un costo bajo o sin costo. De manera similar, un inspector puede muestrearun cargamentode naranjasseleccionado al azarnaranjasde varias de las cajas. Marcar cada naranja y usar un mtodo probabilstico de muestreo puede no resultar prctico. Muestras como los paneles de voluntarios en investigaciones sobre los consumidores son tambin muestrasde conveniencia. Dichas muestrastienen la ventaja de que es relativamente fcil seleccionarla muestra y re"bondad" de la muestra en trminos de su coger los datos; sin embargo, es imposible evaluar la representatividadde la poblacin. Una muestra de conveniencia puede o no dar buenos resultados. Algunas veces los investigadoresaplican los mtodos estadsticospropios de muestrasprobabilsticas a las muestrasde conveniencia, con el argumento de que la muestra de conveniencia se trata como si fuera una muestra probabilstica. Sin embargo, estos trgumentosno tienen fundamento y se debe tener cuidado al interpretar los resultadosde muestreosde conveniencia que han sido usadospara hacer inferencias acercade la poblacin.

Muestreo subietivo
Otra tcnica de muestreo no probabilstica es el muestreo subjetivo. En este mtodo la persona que ms sabe sobre un asunto selecciona elementos de la poblacin que considera los ms repiesentativos de la poblacin. Este mtodo suele ser una manera relativamente fcil de seleccionar una muestra. Por ejemplo, un reportero puede seleccionar dos o tres senadoresconsiderando que estos senadoresreflejan la opinin general de todos los senadores.Sin embargo, la calidad de los resultadosmuestralesdependede la personaque seleccionala muestra.Aqu tambin hay que tener mucho cuidado al hacer inferencias acercade las poblacionesa partir de muestreos subjetivos.

probabiusarmtodosde muestreo Se recomienda muestreoaleatolstico: muestroaleatoriosimple, ' rio estratificado,muestreopor conglomeradoso muestreo sistemtico.Si se usan estos mtodos "bondad" de los existen frmulas para evaluar la de en muestrales trminosde la cercana resultados

que poblacionales los resultadosa los parmetros de se estiman.Con los muestreos convenienciao con los muestreossubjetivosno se puedeestimar la bondad de los resultados.Por tanto, debe tenerse mucho cuidado al interpretar resultadosbasados en mtodos de muestreo no probabilstico.

Glosorio

291

En este captulo se presentaron los conceptos de muestreo aleatorio simple y de distribucin muestral. Se mostr cmo seleccionaruna muestra aleatoria simple y la forma de usar los datos recolectadosde la muestra para obtener estimadorespuntuales de los panmetrospoblacionales. Ya que distintas muestrasaleatoriassimples dan valores diferentes de los estimadorespuntuales, los estimadorespuntuales como i y p son variables aleatorias.A la distribucin de probabilidad de una variable aleatoria de este tipo se le conoce como distribucin muestral. En paficular, se describieron la distribucin muestral de la media muestral i y la distribucin muestral de la proporcin muestral p. Al estudiarlas caractersticas las distribucionesmuestralesde i y de p, se vio queE(i) : p de y que E( P ) : p.Despus de dar las frmulas para la desviacin estndaro error estndarde dichos estimadores,se describieron las condiciones necesarias para que las distribuciones muestrales de i y de P sigan una distribucin normal. Otros mtodos de muestreo fueron el muestreo aleatorio estratificado, el muestreopor conglomerados,el muestreo sistemtico, el muestreopor conveniencia y el muestreo subjetivo.

Parmetro Caractersticanumrica de una poblacin, por ejemplo, la media poblacional p, la desviacin estndarpoblacional o, la proporcin poblacional p, etctera. Muestreo aleatorio simple Poblaciones finitas: muestra seleccionadade manera que cada una de las muestrasde tamao n tenga la misma probabilidad de ser seleccionada.Poblacionesinfinitas: muestra seleccionadade maneraque todos los elementosprovengan de la misma poblacin y los elementos se seleccionende manera independiente. Muestreo sin reemplazo Una vez que un elemento ha sido incluido en la muestra, se retira de la poblacin y ya no se seleccionauna vez ms. Muestreo con reemplazo Una vez que un elemento se ha incluido en la muestra, se regresaa la poblacin. Un elemento ya seleccionadopara la muestra puede ser seleccionadonuevamentey puede aparecerms de una yez en la muestra. Estadstico muestral Caractesticamuestral,por ejemplo, la media muestral x, la desviacin estndar muestral s, la proporcin muestral p, etc.El valor del estadsticomuestral se usa para estimar el valor del correspondienteparmetro poblacional. Estimador puntual Un estadsticomuestral como t s, o p que proporciona una estimacin puntual del pariimetro poblacional correspondiente. Estimacin puntual Valor de un estimador que se usa en una situacin particular como estimacin del parmetro poblacional. Distribucin muestral Distribucin de probabilidad que consta de todos los posibles valores de un estadsticomuestral. . Insesgado Propiedad de un estimador que consiste en que el valor esperadodel estimador puntual es igual al parmetro poblacional que estima. Factor de correccin para una poblacin finita Es el factor l@=- Df@=T que se usa en las frmulas de ory ou siempre que se muestreade una poblacin finita y no de una poblacin infinita. Sin embargo, hay una regla generalmenteaceptada,ignorar el factor de correccin en una poblacin finita siempre qure nlN < 0.05. Error estndar La desviacin estiindar de un estimador puntual. Teorema det tmite central Permite usar la distiibucin de probabilidad normal para aproximar la distribucin muestral de i siempre que la muestra sea grande. Eficiencia relativa Dados dos estimadorespuntuales insesgadosde un mismo parmetro poblacional, el estimador puntual que tenga menor error estndarser ms eficiente.

292

Z Coptulo

muestroles y Muestreo distribuciones

que muestras ms Consistencia Propiedad de un estimador puntual que est presente siempre grandes dan estimaciones puntuales ms cercanas al parmetro poblacional. la poblatluestreo aleatorio estraiificado Mtodo probabilfstico en el que primero se divide estrato' cada cin en estratosy despusse toma una muestra aleatoria simple de la poblacin Muestreo por cbngtmerados Mtodo probabilstico en el que primero se divide los conglomerados. en conglomerados y despus se toma una muestra aleatoria de los primeMuestreo sistemtico Ivttodo probabillstico en el que primero se selecciona uno de elemento de la poblacin' ros /celementosde una poblacin y despusse seleccionacada /c-simo paMuestreo de convenie-nciaMtodo no-probabilstico en el que la seleccin de los elementos ra la muestra es de acuerdo con la conveniencia' para la Muestreo subjetivo Mtodo no-probabilstico en el que la seleccin de los elementos muestra es de acuerdo con la opinin de la personaque hace el estudio'

Valor esperado de E() : tt Desviacin estndar de J (error estndar) Poblacin finita o " ' : l N - -l "\ (G /\ Poblacin infinita
O^ : a

(7.1)

---

o
n

17.21

def Valor esperado E(P) : P Desviacinestndardef (error estndar)


Poblacin finita Poblacin infinita op=

17.41

(7.5)

Corporate Scoreboardproporciona datos trimestrales sobre distintos aspectos 42. BusinessWeeks

de

son 14 (BusinessWeek' de agostode 2000)' Las empfesas numefade las acciones 899 empresas en la lista del Corporate Scoreboard'Remtasea la das del 1 al 899 en el orden en que aparecen columna de dgitos aleatoriosde la tabla 7.1, ignore los dos primeparte inferior de la segunda con el 112,lea ios dgitos de cada conjunto de nmeros,use nmerosde tres dgitos, empiece para determinar las ocho primeras empresasa incluir en una muestra hacia aniba de la columna aleatoriasimPle. por estncadavez mspreocupados el aumentoen los costosde Medicare' 43. Los estadounidenses en el 2003 de En 1990 el promedio de gastosanualesde un derechohabiente Medicare erc$3267; Medicare era $6883 (Money, otoo {e el promedio de gastosales de un derechohabientede

complementorios Eiercicios

293

paratomar una muestrade 50 de los que consultora 2003).Suponga ustedcontrataa una empresa Asuma que la desviade derechohabientes Medicareen 2003 con objeto de investigarlos gastos. en cin estrndar los gastosde Medicare en2003 haya sido de $2000. de a. Muestrela distribucinmuestralde la media,en muestras tamaocincuenta,de los gasde tos de derechohabientes Medicareen 2003. -t-$300de la mediapob. Cules la probabilidadde que la mediamuestralno se alejemsde blacional? que c. Cules la probabilidadde que la media muestralseamayor que $7500?Si la empresa que contrat le dice que la media muestral en los derechohabientes entrevistes $7500, que la empresa hubierahechoun muestreoadecuado? contratada Porqu s o por dudara qu no? de sus a encuesta ex alumnosde administracin10 aosdespus terminados estu44. BusinessWeek de de dios (BusinessWeek,22 septiembre 2003). Uno de los hallazgosfue que gastanen promeA en dio $115.50 semanales comidas sociales. usted se le pide que realice un estudiocon una muestrade 40 de estosex alumnos. a. Muestre la distribucin muestralde I,la media muestralde los gastosde 40 ex alumnos. b. Cules la probabilidadde que la media muestralno se aleje en ms o menosde $10 de la media poblacional? una media muestralde $100. Cules la probabilidadde hallar una c. Supongaque encuentra que mediamuestralde $100 o menos?Considerara los ex alumnosde estamuestrason un qu s o por qu no? grupo inusual respectoa estosgastos? Por noviemve 45. El tiempopromedioqueun estadounidense televisines 15 horaspor semana(Money, para bre de 2003). Supongaque se toma una muestrade 60 estadounidenses investigarcon ms poblacionalen las horasde Asuma que la desviacinestndar detallesushbitosa esterespecto. es televisinsemanales o : 4 horas. a. Cules la probabilidadde que la media muestralno se aleje ms o menosde I hora de la media poblacional? b. Cules la probabilidadde que la media muestralno se aleje ms o menosde 45 minutos de la media poblacional? del 46. En Indianael salarioanualpromediode un empleado gobiernofederales $41 979 (The World que poestndar Almanac,2001).Useestacifra como mediapoblacionaly suponga la desviacin que se selecciona muestrade 50 de estosempleados godel una blacionales o : $5000.Suponga bierno federal. a. Cul es el valor del error estndarde la media? b. Cules la probabilidadde que la media muestralseamayor que $41 979? c. Cules la probabilidadde que la media muestralno se aleje ms o menosde $1000 de la media poblacional? a d. Qutanto variara la probabilidaddel inciso c si el tamaode la muestrase aumentara 100? A llevan inventariosde distintos tamaos.El inventario de la empresa contiene 47. Tres empresas B C 2000 artculos,el inventariode la empresa tiene 50) artculosy el inventariode la empresa poblacionalde los costosde los artculosen los inventariosde es10 000. La desviacinestndar recomiendaque cadaempresatome una es tas empresas o : lM. Un consultorde estadstica vlida del costo muestrade 50 artculosde su inventariopara obteneruna estimacinestadstica promedio por artculo. Los administradoresde la empresams pequeaopinan que como su pode blacin es menor sepodrhacerla estimacincon una muestramucho mspequea la que se para la empresams grande.Sin embargo,el consultoropina que para tener el mismo requiere todaslas empresas y, error estndar por tanto, la misma precisinen los resultadosmuestrales, debernemplear el mismo tamao de muestra, sin importar el tamao de la poblacin. de a. Con el factor de correccinpara una poblacinfinita, calcule el error estindar cadauna paraun tamaode muestrade 50. de las tres empresas de b. Curles la probabilidaden cadaempresa que la media muestrali esta no ms de +25 de la media poblacionalp?

294

7 Coptulo

mueskoles y Muesheo distribuciones

48. Un investigador informa sobresusresultadosdiciendo que el error estindarde la media es 20. La


poblacionales 500. desviacinestndar a. De qu tamao fue la muestra usadaen esta investigacin? b. Cul es la probabilidad de que la estimacin puntual est a no ms de +25 de la media poblacional? un 49. Un inspectorde control de calidadvigila peridicamente procesode produccin.El inspector seleccionamuestrasaleatoriassimples de artculos ya terminadosy calcula la media muestraldel que pesodel productoi. Si en un periodolargo se encuentra 5Vodelos valoresde i son mayores de son que 1.9libras. Cules la mediay la desviacinestindar que2.1 libras y 5Vosonmenores en la poblacinde los productoselaborados esteproceso? tienencomo propietarioa una mujer (The Cincinruti Enquirer,26 50. Cercade 28Vodelas empresas con baseen una muesEade24Oempresas. estaspreguntas de enerode 2006). Responda p,laproporcin muestral de las empresaspropiedad de a. Muestre la distribucin muestral de una mujer. b. Cuifl es la probabilidadde que la proporcin muesfralesta no ms de +0.04 de la proporcin poblacional? c. Cul es la probabilidadde que la proporcin muestralesta no ms de +0.02 de la proporcin poblacional? telefnicascon una tasade respuesde 5 1 . Una empresa investigacinde mercadorealizaencuestas tade 4|Vo,de acuerdocon la experiencia. Curfles la probabilidadde que en una muestrade 400 En las coopereny respondan preguntas? otraspalabras, 150 personas nmerostelefnicos cul : probabilidadde que la proporcinmuestralseaal menos 150/'100 0.375? es la

52. Los publicistas conffatan proveedoresde servicios de Internet y motores de bsquedapara poner
su publicidad en los sitios Web. Paganuna cuota de acuerdocon el nmero de clientes potenciales que hacenclic en su publicidad. Por desgracia,el fraude por clic -la prctica de hacer clic en una publicidad con el solo objeto de aumentarlas ganancias- se ha convertidoen un problema. Cuaentapor ciento de los publicistas se quejan de haber sido vctima de fraude por clic (Bzside nessWeek,13 marzo de 2006). Supongaque se toma una muestraaleatoriade 380 publicistas con objeto de tener ms informacin acercade cmo son afectadospor este fraude por clic. -l-0.04 de la prot. Cul es la probabilidad de que la proporcin muestral est a no ms de porcin poblacional? b. Cules la probabilidadde que la proporcinmuestralseamayor que 0.45? con 53. La proporcin de personasaseguradas una compaade segurospara automviles que tienen una multa de trfico en el periodo de un ao es 0.15 a. Indique la distribucin muestral de p si se emplea una muestra aleatoria de 150 asegurados para determinar la proporcin de quienes han tenido por lo menos una multa en un ao. b. Cul es la probabilidadde que la proporcin muestralesta no ms de +0.03 de la proporcin poblacional?

54. Lori Jeffrey es un exitoso representantede ventas de libros universitarios, tiene xito en sus rede comendaciones libros en257o de sus llamadas.Consideresus llamadasde ventasde un mes como muestrade todas susposibles llamadas, supongaque en el anlisis estadsticode los datos que el error estndar la proporcines 0.0625. de se encuentra llamadashizo a. De qu tamaofue la muestraque se us en el anlisis?Es decir, cuntas Lori Jeffrey en ese mes? de b. Seap la proporcin muestral de xitos en susrecomendaciones libros en esemes.Mues$e la distribucin muestral de P. c. Mediante la distribucin muestral de p, calcule la probabilidad de que el vendedor tenga o xito en 3OVo ms de las llamadas de ventas en el lapso de un mes.

Apendice 7.1

y Voloresperodo desviocin estndor i de

295

apndice Valor esperado y desviacin estndar de f 7.r


En este apndice se presentan las bases matemticas de las expresiones E(i), valor esperado de .-, ecuacin (7.1), y o' desviacin estrndarde i, ecuacin (7.2).

Vqlor esperqdo de
Se tiene una poblacin que tiene mediap y vatianzao2. Se seleccionauna muestraaleatoria de tamaon cuyasobservaciones denotanx1, ...,.ro.La mediamuestral secalculacomo se x2, - sigue. ). n
Si se repiten los muestreos aleatorios de tamao n, i, ser una variable aleatoria que tomar diferentes valores dependiendo de los n elementos que formen la muestra. El valor esperado de la variable aleatoria .?es la media de todos los posibles valores i.

Mediade E(i) - t(+) : : : |[t@r - r x, *. . . a r ,) J

.. l[afr) + E(xr)*' * E(x,)]

Paracadax, se tiene E(x) : r; por tanto, E():Qt+p+..'+p) : I @t't): tt Esteresultado indicaque la mediade todoslos posibles valoresde es igual a la mediapoblacionalp. Es decir E() : p.
I

Desviqcin estndqr de
Se tiene, de nuevo,una poblacincon mediap y varianzaoz y unamediamuestraldadapor )r, .- r : Se sabeque i es una variable aleatoriaque toma distintos valoresen distintasmuestas aleatorias de tamaoz, dependiendo los elementosque constituyenla muestra.Lo que sigue es de unadeduccin la frmulaparala desviaciir de esindar los valoresde , d' en el casoen de el que la poblacinseainfinita. La deduccinde la frmula parao, cuandola poblacines finita y el muestreosehacesin reemplazoes mscomplicaday quedafuera de los alcances este de texto.

296

muesholes y 7 Copitulo Muestreodistribuciones q": r11i muestraaleatoriasimple de De regresoaI casode una poblacininfinita' recuerde unapoblacininfinita,constadeobservacionesrl'x2""'xquesonindependientes'Lasdosexpresionessiguientessonfrmulasgeneralesparalan*iun,"deunavariablealeatoria. Var(a) : azVar(x) y y dondea esunaconstante 'x esunavariablealeatoria' Var(x * Y) : Var(x) + Var(Y) se anteriores' puede usandolas ecuaciones independiente,r. aleatorias donde y ) sonvariables sigue' como deducirla frmutaparala vaianzadela variable

: var() t-("#) : u*(*>')


Entonces,como 1/n es una constante,se uene

var(.): (;) var()x,)


\ : ( /;tJ2 u * t ' , * x , * " ' + x n )

/t\2

lo x1t aleatorias x2' "'tx, sonindependientes' infinita, las variables En el casode unapoblacin que nos Permiteescribir

Var(t): (*flu*t'r)

I t\2

+ + var(r2) "' + var('r')l

= 02; pot tanto se tiene Para toda x,, se tiene Var(x) / r\2 "' Var(t) : (;) 7o2 + o2 + tiene Como en esta expresin hay n valores o2' se + 02)

Var(i):

n. (no') : n l;J

/l\2

la frmula de la desviacin estindarde i. Sacando ahora la raz cuadrada,se obtiene

: or: ,nr(x)#
Apndice7.2

Muestreoaleatoriocon Minitab
usarMinide elementos unapoblacin'sepuede una Si en un archivoseencuentra lista con los Por ejemplo,en la columna 1 del conjuntode una tab para seleccionar muestraaleatoriasimple. de Estados sepfoporcionauna lista de las 100principalesr91s^letronolitanas datosMetAreas Mieiium nd6on 2000)'La columna2 contiene (Places RatedAlmanac-The Unidosy Canad

Apndice 7.3 Muestreo oleobrio Excel con TABIA 7. PIJNTUACINGENERALPARALAS PRIMERAS10REAS METROPOLITANASEN EL CONJUNTODE DATOSMETAREAS

297

Areametrupolltana NY Albany,
Albuquerque,NM Aprpleton, WI Atlanta, GA Austin,TX Baltimore, MD Birmingham,AL BoiseCity,ID Boson, IVA Buffslo, NY

Puntuaci6n
64.18 66.16 60.5 69.97

llotArag

7r.48 69.75
69.59 68.36 68.99 66.10

general En la puntuacin dadaa cadarea. la tabla7.6 sepresentan primeras10 reas las metropolifanas con suspuntuaciones correspondientes. que Suponga pretende seleccionar muestra una aleatoria simplede 30 reas metropolitanas con objetode hacerun estudiosobreel costode la vida en Estados Unidosy Canad. Paraselecque seindicaa continuacin. aleatoria siguenlos pasos se cionarla muestra Paso1. Paso 2. Paso3. Paso4. Seleccionar mendesplegable el Calc Elegir Random Data Elegir SampleFrom Columns Cuandoapurezca cuadrode dilogo Sample From Columns: el Ingresar en el cuadroSample 30 lngresar C2 en el cuadroque seencuentadebajo Cl IngresarC3 C4 en el cuadroStore samplesin Paso5. Hacerclic en OK La muestra aleatoria las 30 reas con metropolitanas aparece las columnas y C4. en C3

Apndice Muestreo aleatorio con Excel 7.3


Si en un archivo se encuentrauna lista con los elementosde una poblacin, Excel se podr usar para seleccionaruna muestra aleatoria simple. Por ejemplo, en la columna A del conjunto de datos MetAreas se proporciona una lista de las 100 principales reas metropolitanas de Estados ' Unidos y Canad (Places Rated Almanac-The Millenium Edition 2000). La columna B contiene la puntuacin general dada a cadarea. En la tabla 7.6 se presentan las primeras 10 reasmetropolitanas con sus puntuacionescorrespondientes. Supongaque quiere seleccionaruna muestra aleatoria simple de 30 reasmetropolitanascon objeto de hacer un estudio sobre el costo de la vida en Estados Unidos y Canad. Los renglones de cualquier conjunto de datos en Excel se pueden colocar en orden aleatorio agregando una columna al conjunto de datos y llenando la columna con nrlmeros aleatorios mediante la funcin : ALEATORIO0; despuscon la herramienta de Excel Orden ascendente aplicada a la columna de nmeros aleatorios, los renglones del conjunto de datos quedarn reordenados aleatoriamente. La muestra aleatoria de tamao n apareceren los n primeros renglones del conjunto de datos reordenado.

298

y mueskoles Z Coptulo Muesheodistribuciones aparecen el rengln 1 y las 100 reas en En el conjuntode datosMetAreas,los encabezados una en los renglones2 a 101. Paraseleccionar muesta aleatoriade se metropotanas encuenfian los pasos siguientes. siga mefopolitanas 30 reas Paso1. Paso2. Paso3. Paso4. Ingresar: AI EAIORIO0 en la celdaC2. C3:C101 Copiarla celdaC2 a las celdas cualquierceldade la columnaC Seleccionar de Clic en el botn Orden ascendente la barrade henamientas.

aparecer los renglones2 a3l del conjunto en La muestraaleatoriacon 30 reasmetropolitanas y Los nrlmerosaleatoriosde la columnaC ya no se necesitan puedenbode datosreordenado. rrarsesi sedesea.

Potrebbero piacerti anche