Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
E/TflDIJTl~fl
.
.
.
.
ESTAbsTiCA EN LOS NEGOctqs
t. -~15 ~
r~.
(CUARTAEDICN EN INGLS)
Ken Black
~
:i!'
~i
er:
~i:
11
.il
. :t
"\
PRIME~~ EDICIN
ME~CO, 2005
(
.
...
.l
f
Introduccin a la Estadstica
Tablas y grficas
Estadstica descriptiva
Probabilidad
Distribuciones discretas
18
46
96
140
Distribuciones continuas
182
340
288
RESUMEN DE CONTENIDO v
11
454
480
. 522
396
656
704
552
598
CONTENIDO
Prefacio
xxii
Acerca del autor
xxviii
Introduccin a la estadstica
Dilema de decisin: La estadsticadescribeel estado de los negociosen las zonas rurales de la India 3
1.1
1.2
1.3
Nivel nominal 8
Nivel ordinal 9
Nivel de intervalo 9
Nivel de razn l O
Comparacin de los cuatro niveles de datos 10
Anlisis estadstico usando la computadora: Excel y MINITAB
11
Resumen 13
Trminosclave 14
Problemascomplementarios 14
Anlisis de la base de datos 15
Caso: DiGiornoPizzas:Introduccinde una pizzacongeladapara competir con laspizzaspara llevar 17
Tablas y grficas
18
19
2.1
20
DISTRIBUCIONES DE FRECUENCIA
Marca de clase 20
Frecuencia relativa 21
Frecuencia acumulada 21
2.2
REPRESENTACINGRFICA DE DATOS 24
Histogramas
24
26
CONTENIDO
Ojivas 26
Grficas de pastel 27
Grficas de tallo y hoja 30
Grficas de Pareto 31
2.3
Resumen 38
Trminos clave 39
Problemas complementarios 39
Anlisis de la base de datos 42
Caso: Las jaboneras presentan batallas
Uso de la computadora 44
Estadstica descriptiva
42
46
3.1
47
3.2
3.3
70
Media 70
Moda 7l
Medidas de variabilidad
3.4
7l
MEDIDAS DE FORMA
76
Sesgo 76
78
ss
48
vii
3.5
MEDIDASDE ASOCIACIN
Correlacin
3.6
ESTADISTICADESCRIPTIVAEN LA COMPUTADORA
Resumen 86
Trminos clave 87
Frmulas 88
Problemas complementarios 89
Anlisis de la base de datos 93
Caso: Coca-Cola se hace pequea en Rusia
Uso de la computadora 94
80
80
Probabilidad
93
96
4.1
4.2
97
INTRODUCCINA LA PROBABILIDAD 98
MTODOS PARAASIGNARPROBABILIDADES
Mtodo clsico de asignar probabilidades
Frecuencia relativa 99
Probabilidad subjetiva 100
4.3
84
ESTRUCTURADE LA PROBABILIDAD
Experimento 100
Evento 101
Eventos simples 101
Espacio muestral 101
Uniones e intersecciones
99
99
100
102
102
103
4.4
4.5
PROBABILIDADESMARGINALES,DE UNIN,CONJUNTAS
Y CONDICIONALES 106
LEYESDELAADICIN 106
Matrices de probabilidad
4.6
108
111
112
LEYESDE LA MULTIPLICACIN
Ley general de la multiplicacin
Ley especial de la multiplicacin
4.7
PROBABILIDADCONDICIONAL
Eventos independientes
4.8
115
115
ll8
121
124
Resumen 134
Trminos clave
134
128
CONTENIDO
Frmulas 134
Problemas complementarios 135
Anlisis de la base de datos 138
Caso: Colgate-Plmolive hace un esfuerzo "totsl"
138
140
Distribuciones discretas
5.1
5.2
141
143
5.3
DISTRIBUCIN BINOMIAL
147
5.4
DISTRIBUCIN DE POISSON
158
Resolucin de problemas de Poisson por frmula 159
Uso de las tablas de Poisson 161
Media y desviacin estndar de una distribucin de Poisson
Grficas de distribuciones de Poisson 162
162
5.5
Resumen
173
Trminos clave
Frmulas
173
173
Problemas complementarios
174
179
179
180
Distribuciones continuas
182
6.1
DISTRIBUCIN UNIFORME
6.2
DISTRIBUCIN NORMAL
183
184
Determinacin de probabilidades en una distribucin uniforme 185
Uso de la computadora para resolver probabilidades de distribucin uniforme
188
Historia de la distribucin normal 189
Funcin de densidad de probabilidad de la distribucin normal
Distribucin normal estndar 190
190
187
170
ix
199
6.3
6.4
DISTRIBUCIN EXPONENCIAL
203
207
Probabilidades de la distribucin exponencial 207
Uso de la computadora para determinar probabilidades de distribucin exponencial
Resumen 212
Trminos clave 213
Frmulas 213
Problemas complementarios 213
Anlisis de la base de datos 217
Caso: Mercedes va tras compradores jvenes 217
Uso de la computadora 218
220
7.1
7.2
MUESTREO
222
Razones para muestreo 222
Razones para tomar un censo 223
Marco 223
Muestreo aleatorio contra no aleatorio
Tcnicas de muestreo aleatorio 224
Muestreo aleatorio simple 224
Muestreo aleatorio estratificado 225
Muestreo sistemtico 227
Muestreo de grupo (o rea) 227
Muestro no aleatorio 228
Muestreo de conveniencia 229
Muestreo de juicio 229
Muestreo de cuota 230
Muestreo de bola de nieve 230
Error de muestreo 231
Errores no muestrales 231
7.3
223
239
DISTRIBUCIN MUESTRAL DE
Resumen 246
Trminos clave 247
Frmulas 247
Problemas complementarios 247
Anlisis de la base de datos 250
Caso: Shell trata de regresar al primer lugar 250
Uso de la computadora 251
241
232
221
209
CONTENlDO xi
252
,.
8.2
259
8.3
8.4
8.5
268
Uso de la computadora para construir intervalos de confianza para la proporcin
poblacional 271
273
276
278
290
9.2
288
253
9.3
9.4
9.5
9.6
328
340
10.1
317
318
341
10.2
CONTENIDO
10.5
Uso de la computadora para probar la hiptesis sobre dos varianzas poblacionales 379
Resumen 385
Trminos clave 386
Frmulas 386
Problemas complementarios 387
Anlisis de la base de datos 392
Caso: Seitz Corporation: Fabricacin de productos que se mueven mediante engranajes
y de manera lineal 392
Uso de la computadora 394
,.
11
396
Dilema de decisin: Analizar las diferencias en rentabilidad de compafas en tres pases 397
11.1 INTRODUCCIN AL DISEO DE EXPERIMENTOS
11.2
398
405
411
Prueba de diferencia honestamente significativa (HSD) de Tukey: caso con tamao
de muestra iguales 412
Uso de la computadora para hacer comparaciones mltiples 414
Procedimiento de Tukey-Kramer: caso de tamaos muestrales desiguales 416
419
Uso de la computadora para analizar diseos de bloque aleatorios 423
429
xiii
xiv
454
455
456
Prueba de una proporcin poblacional con el uso de una.prueba de ji cuadrada de bondad
de ajuste como tcnica alternativa a la prueba de z 462
13 Anlisis
de regresin simple
478
480
481
13.l
13.2
482
490
Uso de residuales para probar las suposiciones del modelo de regresin
Uso de la computadora para anlisis de residuales 492
496
499
501
13.7
ESTIMACIN
506
Intervalos de confianza para estimar la media condicional de y:J'lx
Intervalos de prediccin para estimar un solo valor de y 507
519
510
507
491
483
CONTENIDO
522
523
524
Modelo de regresin mltiple con dos variables independientes (primer orden)
Determinacin de la ecuacin de regresin mltiple 526
Modelo de regresin mltiple 527
525
533
536
538
541
552
15.1
553
15.4 MULTICOLINEALIDAD
Resumen 589
Trminos clave 590
583
554
XV
Frmulas 590
Problemas complementarios 590
Anlisis de la base de datos 594
Caso: VirginiaSemiconductor 594
Uso de la computadora 597
16.1
INTRODUCCIN AL PRONSTICO
598
599
600
604
616
Anlisisde tendencia de regresin lineal 616
Anlisis de tendencia de regresin usando modelos cuadrticos 618
Mtodo de suavizamiento exponencialde dos parmetrosde Holt 621
16.4 EFECTOS ESTACIONALES 623
Descomposicin 623
Bsqueda de efectos estacionalescon la computadora 626
Mtodo de suavizamiento exponencialde tres parmetros de \V"LDt<n 626
636
Uso de la computadora
652
654
17 Estadsticas no paramtricas
656
17.1 PRUEBADECORRIDAS
657
659
17.2 PRUEBAUDEMANN-WHITNEY
663
l8
703
704
705
709
709
712
715
706
GRFICAS DE CONTROL
718
Variacin 718
Tipos de grficas de control 718
Grfica x 719
Grficas R 722
Grficas p 724
Grficas e 726
Interpretacin de grficas de control 728
733
Apndice A: Tablas
751
815
En el CD adjunto
19 Anlisis de decisin
CI9-2
CI9-14
CI9-6
793
COITTENIDO
xix
Cl9-25
Sl-1
S3-1
PREFACIO
La cuarta edicin de Estadstica en los negocios para la toma de decisiones, si bien sigue reteniendo la pedagoga clara y directa de ediciones anteriores, agrega nuevos artculos y un inters todavia ms intenso a la estadstica aplicada, prctica, que mejora la posicin del texto como lder en la presentacin de
estadsticas de negocios en una situacin de toma de decisiones.
Esta edicin est escrita y diseada para un curso de introduccin de dos semestres para estudiantes de estadsticas de negocios o un curso de introduccin al nivel de Master en administracin de empresas. Adems, con 18 captulos, se adapta muy bien a un curso de un semestre de estadsticas de
negocios. El texto est escrito con la suposicin de que el estudiante ya ha cursado lgebra universitaria. No se emplea clculo en la presentacin de material en el texto.
El enfoque filosfico bsico de este texto es que toda herramienta estadfstica presentada tiene alguna aplicacin en negocios. Mientras que el texto contiene rigor estadfstico, est escrito de modo que
el estudiante pueda fcilmente entender que la correcta aplicacin de la estadstica en el mundo de los
negocios va de la mano con la buena toma de decisiones. En esta edicin se presenta la estadstica como medio para convertir datos en informacin til para que Jos directores tomen las decisiones mejor pensadas y con base en informacin. Por tanto, el texto contiene estadsticas de negocios como
herramientas de "valor agregado" en el proceso de convertir datos en informacin til.
PREFAOO
Di
Kreme ha realizado un experimento para comparar los tamaos de donas, en donas producidas por
cuatro mquinas diferentes. Las donas producidas por cada mquina se seleccionan al azar y se prueban para determinar si hay una diferencia de importancia en el tamao de las donas hecbas a mquina. Desafortunadamente,
las suposiciones subyacentes al uso de una ANOVA unidireccional no se
pueden satisfacer. El dilema es cmo analizar los datos en estas condiciones. El captulo 17 trata de estadsticas no pararntricas. El articulo En respuesta, al final del captulo, muestra al estudiante la forma
en que el dilema se puede resolver mediante el uso de una prueba de Kruskal-Wallis. Los otros dos dilemas se presentan en este Dilema de decisin y se responden en el articulo En respuesta con el uso de la prueba t de rango con signo pareado de Wilcoxon y la correlacin de rango de Spearman. Una de estas pruebas
se ocupa de analizar datos de ventas antes y despus de una campaa de ventas y la otra trata de determinar la fuerza de relacin entre las ventas de una rienda y su tamao con el uso de datos de rango.
Casos
Prcticamente todos los casos se han actualizado para esta edicin y se han escrito tres nuevos casos para la cuarta edicin, usando para ello compaas contemporneas: 1) Foot Locker en la fabricacin de
calzado, captulo 12 (Anlisis de datos categricos); 2) Starbucks introduce la tarjeta de dbito, captulo
14 {Introduccin a la regresin mltiple); y 3) Schwinn, capitulo 17 (Estadsticas no paramtricas). El
caso de Starbucks presenta uno de los relatos de xito contemporneo de un negocio ya que la compaia ha crecido de una cafeterfa en 1971 a ms de 5 000 en la actualidad. En noviembre de 2001, Starbucks
trat de poner en prctica un nuevo concepto al lanzar su tarjeta Starbuck prepagada (de dbito). La tarjeta fue tan bien aceptada cuando fue anunciada que a muchas tiendas se les agot la existencia. Para mediados del ao 2002, Starbucks haba activado ms de 5 millones de estas tarjetas. Se piensa que la
tarjeta constituye una gran parte del aumento de 7% en ventas en la misma tienda a principios de 2002
y que es la razn por la que se atrajeron numerosos nuevos dientes a la tienda. En este caso, unos estudiantes exploran formas de pronosticar la cantidad gastada en las tarjetas de dbito mediante el uso de
metodologa de regresin y variables demogrficas. Adems, se utiliza regresin mltiple para crear
nuevos modelos para pronosticar los ingresos de ventas de una tienda. En el segundo nuevo caso participa Foot Locker, el distribuidor nmero uno del mundo de calzado y ropa deportivos, con aproximadamente 3600 tiendas de ventas al menudeo ubicadas en 14 diferentes compaas en Estados
Unidos, Europa y Australia. En este caso, presentado en el nuevo capitulo de anlisis categrico (ji cuadrada), las distribuciones de ventas en varios niveles de precios se comparan de un ao al siguiente en
un esfuerzo por determinar si cambian los modelos de compras. Los anlisis de tabulacin cruzada se
llevan a cabo para estudiar la relacin entre el sexo de compradores y la geografia y para examinar su
parte del mercado por localidad. En el tercer nuevo caso participa Schwinn, compaia de venta de bicicletas de estilo antiguo que con una larga historia de innovacin. En la actualidad, la compaia tiene
un gran xito en el mercado de bicicletas para montaa como primer productor de bicicletas. En este
caso, contenido en el capitulo no paramtrico, se pide a estudiantes aplicar tcnicas estadsticas no paramtricas para analizar preguntas de control de calidad acerca de la diferencia en proveedores y la aleatoriedad de fallas de pintura. Adems, el caso incluye un estudio entre las diferencias de edad de las
compradoras en dos ciudades.
XX
ESTADISTICA
EN LOS NEGOCIOS
$44 000. Casi todos trabajan en impuestos (IT), bienes races o administracin de empresas. Por lo general, estos teletrabajadores viajan en auto unos 30 km para trabajar y se ahorran casi 53 minutos
de tiempo de viaje diarios,estn relativamentesatisfechos con su trabajo. Setenta y cinco por ciento de
quienes trabajan en casa reportaron un aumento cuantificable en productividad y calidad de trabajo
cuando cambiaron de trabajos tradicionales a ser teletrabajadores.Dos tercios de teletrabajadores expresaron mayor satisfaccin en su trabajo y dicen que trabajan ms horas que los no teletrabajadores
pero que su trabajosinterfieren menos con sus vidas personales.
Cambiosde temas
Para dar mayor claridad y destacar temas ms importantes, la cuarta edicin contiene dos nuevos captulos: 1) el capitulo 15, Construccin de modelos de regresin mltiple, un segundo captulo sobre
regresin mltiple y 2) el captulo 12, Anlisis de datos categricos,capitulo sobre pruebas de ji cuadrada de datos categricos. Separar la presentacin de regresin mltiple en dos captulos permite al
instructor la opcin de limitar la exposicin del estudiante a regresin mltiple,al usar slo una introduccin (captulo 14) o explorar ms a fondo y con mayor detalle el anlisis de regresin mltiple mediante el uso de tcnicas de modelacin como es la regresin por pasos y modelos curvilneos (capitulo
15). Las pruebas de ji cuadrada se han extraido del captulo de estadsticasno paramtricas (17), y se
les considera independientesdesde el principio de la cuarta edicin (capitulo 12) por su uso ms amplio en campos como el mercadeo. Adems, para dar ms tiempo para temas clave,un captulo de la
tercera edicin, Nmeros ndice, se ha reducido a una seccin en la cuarta edicin (captulo 16, Pronstico de series de tiempo y nmeros indice). Otras modificaciones en esta edicin incluyen cambiar
las grficas de Pareto y grficas de dispersin al capitulo 2 (Tablas y grficas),cambiar las medidas de
asociacin (coeficiente de correlacin) al Captulo 3 (Estadstica descriptiva),e introducir el sistema
HTABen el captulo 9 (Prueba de hiptesis).
Problemasnuevos
Todos los problemas de la tercera edicin se examinaron respecto a si son oportunos, apropiados, claros y lgicos antes de incluirlosen la cuarta edicin. Los que no cumplieron estos requisitos fueron sustituidos o presentadosde otra forma. Se elaboraron diferentes problemas nuevos en un esfuerzo por
maximizarel aprendizajede los estudiantes. Se actualiz la mayor parte de problemas que tienen valores con base en el tiempo; mientrasque el nmero total de problemas del texto es todavfa alrededor
de 950, se ha hecho un esfuerzo concertado para incluir slo problemas que hacen una aportacin importante al proceso de enseanza.
Todos los problemas de demostracin,as como los problemas de ejemplo,se revisaron en su totalidad y se editaron para mayor eficiencia. Un problema de demostracines un ejemplo extra que contiene
algn problema y su solucin y se utiliza como herramientapedaggica adicional para complementar
explicaciones y ejemplos de los captulos. Prcticamente todos los problemas de ejemplo y demostracin de la cuarta edicin estn orientados a los negocios y contienen la informacin disponiblems actualizada de que se dispone.
Al igual que con la edicin anterior, aparecen problemas al final de casi todas las secciones de los
captulos. Se incluyen numerosos problemas adicionales en la seccin de Problemascomplementarios.
PREFAOO
xxili
Los Problemas complementarios son ejercicios "revueltos" que utilizan las diversas tcnicas descritas en
el captulo, de modo que el estudiante pueda probarse a st mismo su capacidad para discriminar y distinguir ideas y conceptos.
CARACTERSTICAS Y BENEFICIOS
Cada captulo de la cuarta edicin contiene: Objetivos de aprendizaje, un Dilema de decisin, Problemas de demostracin, problemas de seccin, Estadsticas en los negocios de hoy, una seccin En respuesta, y un Resumen del captulo, Trminos clave, Frmulas, Consideraciones ticas, Problemas
complementarios, Anlisis de bases de datos, un caso, Uso de la computadora y Salida de computadora
de Excel 2000 y MlNITAB versin 13.
Objetivos de aprendizaje. Cada captulo inicia con un enunciado de los principales objetivos
de aprendizaje del mismo. ste enunciado provee al lector de una lista de temas clave que se estudiarn y las metas establecidas por el estudio del captulo.
Dilema de decisin. Al inicio de cada captulo, un caso breve describe una situacin real de
alguna compaa o negocio en la que surgen preguntas gerenciales y estadsticas, En la mayor
parte de Dilemas de decisin, se proporcionan datos reales y se pide al estudiante que considere
la forma en que los datos pueden analizarse para contestar las preguntas.
Estadsticas en los negocios de hoy. Cada captulo de la cuarta edicin contiene un articulo de
Estadsticas en los negocios de hoy. stos se concentran en cajas que contienen una interesante
aplicacin con respecto a la manera en que las tcnicas de ese captulo en particular se emplean
en el mundo de los negocios de hoy. Suelen estar basadas en compaas reales, estudios o investigacin publicada.
En respuesta. Situado al final del captulo, el artculo En respuesta dirige las preguntas gerenciales y estadsticas que aparecen en el Dilema de decisin. Los datos dados en el Dilema de decisin son analizados por computadora con el uso de tcnicas presentadas en el captulo. Se
llega a las respuestas de las preguntas gerenciales y estadsticas del Dilema de decisin al aplicar
conceptos del captulo, con lo cual se cierra.
Resumen del captulo. Cada capitulo concluye con un resumen de los conceptos, ideas y tcnicas importantes del mismo. Este artculo puede servir como vista previa del captulo as como
de repaso.
Trminos clave. Los trminos importantes se escriben en negritas y sus definiciones en cursivas en todo el texto, cuando se citan. Al final de cada captulo se presenta una lista de los trminos clave. Adems, stos aparecen con sus definiciones en un glosario incluido al final del libro.
Frmulas. Las frmulas importantes del texto se resaltan para facilitar su lectura, y al final de
cada captulo la mayor parte de ellas se ponen en lista como prctica consulta.
Consideracionesticas. Cada capitulo contiene un articulo de Consideraciones ticas que es
oportuno dada la gran brecha existente entre tica y falta de liderazgo moral de algunos ejecutivos de negocios en meses recientes. Con la abundancia de datos estadsticos y anlisis, existe
considerable potencial para el mal uso de estadsticas en tratos de negocios. Este articulo recalca
el potencial mal uso al analizar temas como mentir con estadsticas, no satisfacer suposiciones
estadsticas, no incluir informacin pertinente para quienes toman decisiones, y otros temas de
principios. Mediante este artculo, los maestros pueden iniciar por integrar el tema de tica con
aplicacionesde estadsticas en negocios. He aqu algunos cuantos extractos de artculos de Consideraciones ticas:"No es profesional ni tico sacar conclusiones de causa y efecto slo porque
dos variables estn correlacionadas"."El investigadorde negocios necesita dirigir el experimento
en un entorno tal que muchas variables concomitantes sean controladas cuanto sea posible. En
la medida que esto se realice, el investigador tiene una responsabilidad tica de reportar ese
hecho en sus hallazgos.""Se advierte al lector que el valor de lambda se supone constanteen un
experimento de distribucin de Poisson. Los investigadoresde negocios pueden producir resultados falsossi el valor de lambda se usa en todo un estudio; pero como el estudio es dirigido durante diferentes periodos, el valor de lambda est cambiando en realidad." "Al describir un
cuerpo de datos a una audiencia, es mejor usar cualesquiera medidas estadsticasque sean necesarias para presentar una imagen 'completa' de los datos. Al limitar las medidas descriptivas
empleadas, el investigador de negocios puede dar a la audiencia slo parte de la imagen y sesgar la forma en que el receptor comprenda los datos."
Problemascomplementarios.Al final de cada captulo est un extenso conjunto de problemas
adicionales, los cuales estn divididos en tres grupos: Clculo de estadsticas,problemas estrictamente de computacin;Pruebe su comprensin, problemas para aplicacin y comprensin; e
Interpretacin de la salida, que son problemas que requieren la interpretacin y anlisis de las
respuestas del software de computadora.
Anlisisde la base de datos. Hay siete bases de datos principales en el CD-ROM que acompaa a la cuarta edicin. Esta seccin, que aparece al final de captulo, contiene varias preguntas/
problemas que requieren la aplicacin de tcnicasdel capitulo a datos en las variablesde las bases
de datos. Se supone que Ja mayor parte de estas preguntas/problemas se resuelven con el uso de
una computadora.
Caso. Cada caso de fin de captulo est basado en una compaia real. Estos casos dan al estudiante una oportunidadde usar conceptos y tcnicas estadsticos presentados en el captulo para resolver un dilema de negocios. En algunos casos aparecen compaas muy grandes, por
ejemplo: la Shell Oil, Coca-Cola o Colgate-Palmolive.Otros se refieren a pequeos negocios,como Thermatrix,Robotron o DeBourgh, las cuales han superado obstculos para continuar en
operacin y desarrollo. La mayor parte de casos incluyen datos brutos (que tambin se encuentran en el CD-ROM) para anlisis y preguntas que estimulan al estudiante a usar diversas tcnicas presentadas en el capitulo. En muchos casos, el estudiante debe analizar las respuestas y
software de computadora para llegar a conclusiones o tomar decisiones.
Uso de la computadora.La seccin Uso de la computadoracontiene instrucciones para producir la salida de software de Excel2000 y MlNITABversin 13, que se presenta en el captulo. Se
da por hecho que los estudiantes tienen una comprensin general de un entorno Microsoft
Windows. Las instrucciones incluyen notas especificasacerca de las barras de men, mens descendentesy cajas de dilogo. No se estudian todos los detalles de cada caja de dilogo; la intencin es dar suficiente informacin para que el estudiante produzca la misma salida estadstica
analizada y estudiada en el captulo.
Presentacinde la salida del programa Microsoft"Excel y MJNITAB.La cuarta edicin tiene
un fuerte enfoque en los paquetes de software Excely M!NITAB.Se presentan ms de 250 salidas de Excel 2000 y M1NITABversin 13, generadas por computadora. Excel,debido a que es
parte de Microsoft Office,se ha instalado en millones de computadorasen todo el mundo. Casi todos Jos estudiantestienen acceso a Excel en su casa, escuela o trabajo. Por la gran capacidad
de la herramienta de Anlisisde datos y la funcin Paste (pegar), Exceltiene considerable capacidad estadfstica. MINITAB tambin es importante porque ha realizado un excelente trabajo
para mantener el paso con los continuos cambios y demandas de la estadstica en negocios.
PREFAOO
MINlTAB
versin
en este texto,
cuenta
con
tcnicas
para analizar
XD'
proporcio-
nes, mayores
capacidades
de administracin
de datos
Bases de datos. Esta edicin contiene siete bases de datos, las cuales estn en formato Excel y
MlNlTAB listas para usarse. Una base de datos de manufactura, una base de datos financiera,
una base de datos de mercado accionario, una base de datos de empleo internacional, una base
de datos de energa, una base de datos de salud pblica y una base de datos de negocios agrcolas dan ms de 8350 observaciones y 56 variables. Todos los datos son reales y de fuentes confiables que los usuarios reconocern; la U.S. Bureau of Labor Statistics, la Casa de Bolsa de
Nueva York, el U.S. Department of Agriculrure, Moody's Handbook of Common Stocks, la
American Hospital Association, y la U.S. Bureau of the Census. Cuatro de las siete bases de datos
incluyen datos de series de tiempo; una contiene 168 meses de datos de series de tiempo para demostracin y anlisis de tcnicas de pronstico de descomposicin.
Banco de pruebas: preparado por Aarn Brown de la Arkansas State University, el Banco de
Pruebas incluye preguntas de opcin mltiple para cada captulo. El Banco de pruebas se presenta en formato Microsoft" Word.
RECONOCIMIENTOS
/ohn Wiley & Sons, Leyh Publishing, y yo agradecemos a los revisores y asesores que se ocuparon en
darnos su excelente consejo e ideas, que empleamos para dar forma y moldear el texto en la cuarta edicin. Estos colegas incluyen a;
Thomas McCullough, University of California-Berkeley
Tade O. Okediji, University of Oklahoma
Michael Panik, Univesity of Hartford
CAPTULO
Introduccin
a la estadstica
~ ~~ --~
.
'~
OBJETIVOS DE APRENDIZAJE
El objetivo fundamenta] del captulo 1 es introducir al lector al mundo de la estadstica, con lo cual podr:
l. Definir la estadstica.
2. Estar consciente de Ja amplia gama de aplicaciones que tiene la estadstica en los
negocios.
3. Distinguir entre estadstica descriptiva e inferencial.
4. Clasificar nmeros por nivel de datos y comprender por qu es importante hacerlo
as.
):
- ~:
.... ~
~:ili':2._~-~"
- ----~~-
La India es el segundo pas ms grande del mundo, con ms de mil millones de habitantes. Tres cuartas partes de la poblacin vive en zonas rurales, pero aun asi el mercado rural representa slo alrededor de un tercio de las ventas totales de productos nacionales. No obstante lo anterior, debido a las
reformas de mercado libre que ocurrieron en la dcada de 1990 y a Ja fuerte produccin agrcola, el
mercado rural de la India ha estado ms abierto al comercio en artculos de consumo. Aun cuando
el mercado urbano de la lndia parece estar saturado, los mercados en las zonas urbanas estn relativamente sin explotar, con lo cual ofrecen enorme potencial. Debido a estos factores, numerosas empresas
estadounidenses, por ejemplo Microsoft, General Electric, Kellogg's, y otras, han entrado al mercado de
la India.
En la actualidad, la India rural se puede describir como pobre y con alto ndice de analfabetismo.
Ms de 65% de la poblacin de las zonas rurales gana menos de $574 dlares al ao, y 23% gana entre
$574 y $1 146. Sesenta y seis por ciento de las mujeres son analfabetas, al igual que 38% de los hombres.
Estos porcentajes son casi el doble de los de zonas urbanas. Setenta y siete por ciento de hogares de
zonas rurales usan madera como combustible para cocinar, 39% tienen electricidad, 18% tienen agua
potable y 7% tienen retretes con agua de descarga.
Con todo, las condiciones estn cambiando y estn entrando empresas en este mercado en apariencia no explotado. Por ejemplo, a finales de la dcada de 1990, Colgate-Palmolive plane aumentar
su presupuesto de mercadeo rural a cinco veces ms que en 1991. La meta de esta compaia es que ms
de la mitad de sus ingresos para el ao 2003 provenga de la zona rural de la India, que en la actualidad
constituye slo 30% del negocio.
Las ventas en la India rural son un desafio y se requiere de mtodos no tradicionales porque los
porcentajes de analfabetismo son altos y slo alrededor de un tercio de los hogares tiene televisin. Uno
de estos mtodos es el uso de camionetas tipo Combi, con-sistemas de video en los cuales se presentan
anuncios que en zonas rurales duran media hora. Una de estas camionetas entra en un pequeo poblado con altavoces que reproducen una popular meloda de cine. Cuando los pobladores se acercan al
vehculo, un vendedor abre la puerta y presenta en una pantalla, un video con escenas que describen
la necesidad de un determinado producto. Despus de terminar el video, se distribuyen muestras gratis. Hindustan Lever Ltd., la principal empresa de la India de productos de consumo, estima que el costo
por contacto de este mercadeo es alrededor de cuatro veces ms que el costo a quienes viven en ciudades, pero el mercado rural para productos de cuidado personal est creciendo tres veces ms rpido
que en mercados urbanos, lo cual hace ms viable estos esfuerzos de mercadeo. Otras empresas utilizan campaas de venta de puerta en puerta para promover productos en zonas rurales de la India.
Adems, el advenimiento de televisin por satlite a casas y poblaciones rurales en la India abre algunos medios nuevos para hacer publicidad y mercadeo a este segmento de la poblacin.
Las estadsticas de que se dispone de la primera mitad de la dcada de 1990 arrojaron alguna luz
sobre el mercado potencial de la India rural. El consumo de pasta dentfrica en la India rural se duplic de 8 825 toneladas mtricas en 1990 a 17 023 en 1994. El consumo anual per cpita en pasta dentfrica es todava de 30 gramos por persona en la India rural, en comparacin con los 160 gramos en
zonas urbanas de la India y 400 gramos en Estados Unidos. Por tanto, el potencial para un crecimiento mucho mayor ya est ah. Las ventas para otros productos se han incrementado rpidamente en este
mercado en desarrollo. Las ventas de detergente para lavanderia aumentaron de 272 540 toneladas
mtricas en 1990 a 422 741 toneladas mtricas en 1994. El jabn de tocador aument de 158 919 toneladas mtricas en 1990 a 231 084 toneladas mtricas en 1994. Las ventas de champ aumentaron a casi
cuatro veces, de 497 mil litros a dos millones 116 mil litros en 1994.
La India rural es un enorme mercado que los negocios no han explotado. Algunas evidencias indican que los consumidores de estas regiones de la India estn comprando productos en nmeros crecientes, pero las estadsticas de ingresos muestran una limitada capacidad de compra. El dilema al que
se enfrentan las empresas es entrar a este mercado y, si es as, en qu medida y en qu forma.
3
ESTADISTICA
EN LOS NEGOCIOS
En todo momento en das hbiles, se toman decisiones en empresas en todo el mundo que determinan
si las empresas sern rentables y en crecimiento o si estarn estticas y desaparecern.La mayor parte
de estas decisionesse toman con la asistencia de informacin reunida acerca del mercado, el entorno
econmicoy financiero,la fuerza laboral, la competencia y otros factores.Esta informacinsuele llegar
en forma de datos o est acompaada de ellos. Las estadsticasde negociosson la herramienta mediante la cual estos datos se recolectan,analizan, resumen y presentan para facilitar el proceso de toma de
decisiones.Por tanto, en el siglo XXI, las estadsticas de negociosdesempean un importante papel en
el presenteconjunto de hechos de toma de decisin dentro del dinmico mundo de los negocios.
Estrs en el trabajo
Si quienes toman decisiones buscan maneras de reducir gastos de servicio mdico entre sus trabajadores, entonces haran bien en enterarse de un estudio hecho a unos 46 mil empleadosy dirigido por
la Health Enhancement Research Organization.En ste, los investigadores descubrieron que la depresin y el estrs parecen tener mayor impacto en gastos mdicos ms altos que el alto contenido de azcar en la sangre, obesidad o hbito de fumar. El estudio demostr que los trabajadoresdeprimidos
tenan gastos mdicos 70% ms altos que los no deprimidos,y quienes los que decan estar bajo constante estrs tenan gastos 46% ms altos que sus semejantes libres de l. Por otra parte, los gastos
mdicos para personas que sufren de alta presin sangunea eran slo 11 % mayores que los que no
tenian esta enfermedad. Dicha informacin, junto con otras estadsticas reportadas en este estudio,
puede ayudar a quienes toman decisiones para disear una estrategia y reducir gastos mdicos entre
trabajadores.
Decisiones financieras
En un estudio reportado por RHI Management Resources, a los principales oficiales financieros se les
pregunt cul de las siguientes iniciativas pondran en espera en una economa incierta: 1) expansin,
2) fusin o adquisicin, 3) lanzamiento de un nuevo producto o servicio, 4) mejora de tecnologa,
5) ninguno de estos factores, y 6) otro. Treinta y dos por ciento de los encuestados indicaron que pondran en espera sus planes de expansin en una economa incierta, seguida por una fusin o adquisicin
(23%), mejora de tecnologa (18%), lanzamiento de un nuevo producto o servicio (10%), ninguno
(9%) y otro (8%).
ce de precios
msurnidor
1todoslos
nes urbanos
i0-2000)
:s
ae
140
120
100
o
V
-;
80
60
...,.,.,
40
.s
20
~c.
:;
1960
1965
1970
1975
1980
Ao
1985
1990
1995
2000
ESTADISTICA
EN LOS NEGOCIOS
2.
3.
4.
5.
6.
7.
El estudio de la estadstica se puede organizar en diversas formas. Una de las principales es subdividirla en dos ramas: estadstica descriptiva y estadstica inferencia!. Para comprender la diferencia
entre estadstica descriptiva e inferencia!, son tiles las definiciones de poblacin y de muestra. El
Webster's Third New Intemational Dicrionary define poblacin como 1111 conjunto de personas; objetos o
artculos de inters. La poblacin puede ser una categora ampliamente definida,por ejemplo "todos los
automviles" o puede ser estrechamente definida, como "todos los autos Ford Mustang producidos de
1998 a 2002". Una poblacin puede ser un grupo de personas, por ejemplo "todos los trabajadores
actualmente empleados por Microsoft",o puede ser un conjunto de objetos, como "todas las lavadoras
producidas el 3 de febrero de 2003, por la General Electrc Company en la planta de Louisville". El
investigador define a la poblacin como cualquier cosa que estudie. Cuando los investigadoresre11en
datos de toda la poblaci11 para una medida de inters determinada, la Uaman censo. Casi todos estamos
familiarizados con el censo de Estados Unidos. Cada 10 aos, el gobierno trata de medir toda la poblacin que vive en este pas. Si un investigador est interesado en averiguar las calificaciones de la
Scholastic AptitudeTest (SAT) de todos los estudiantes de la Universityof Arizona, una forma de hacerlo es llevar a cabo un censo de todos los estudiantesque en la actualidad se encuentren inscritos en esa
universidad.
Una muestra es una parce del conjunto y, si se toma adecuadamente,es representativa del conjunto. Por varias razones (que se explican en el captulo 7), los investigadoresa veces prefieren trabajar con
una muestra de la poblacin en lugar de toda la poblacin. Por ejemplo, al realizar experimentos de
control de calidad para determinar el promedio de vida til de bombillas elctricas, un fabricante
de bombillas podra muestrearal azar slo 75 bombillas durante un lote de produccin.Debido a limitaciones de tiempo y dinero, un gerente de recursos humanos podra tomar una muestra al azar de 40
empicados en lugar de usar un censo para medir el estado de nimo de la compaa.
Si un analista de negocios 11tiliw los datos que ret11e 1m grnpo para describir o llegar a condusiones
acerca de ese mismo grupo, la estadstica se llama estadstica descriptiva. Por ejemplo, si un maestro
produce estadsticas para resumir el esfuerzo de examen de un grupo y las emplea para llegar a conclusiones acerca de slo ese grupo, las estadsticas son descriptivas. El maestro puede usar estas estadsticas para analizar el promedio del grupo, hablar acerca de los mrgenes de calificaciones del grupo,
o presentar cualesquiera otras medidas de datos para el grupo con base en la prueba.
La mayor parte de estadsticas deportivas, por ejemplo promedio de bateo, rebotes y primer down
son estadsticas descriptivas porque se usan para describir el esfuerzo de un individuo o de un equipo.
Muchos de los datos estadsticos generados por negocios son descriptivos. Podran incluir el nmero
de empleados en vacaciones durante el mes de junio, el promedio de salario en la oficina de Denver,
ventas corporativas para 2002, promedio de calificacin de satisfaccin gerencial sobre un censo de las
actitudes de los empleados en la compaa y el promedio de rendimientos sobre inversin para la
Lofton Company entre 1988 y 2002.
Otro tipo de estadlstica se denomina estadstica inferencial. Si un investigador rene datos de 11na
muestra y utiliza la estadstica generada para llegar a conclusiones acerca de la poblacin de la cual se toma
la muestra, la estadstica es inferencial. Los datos reunidos se emplean para inferir algo acerca de un
grupo ms grande. Las estadsticas inferenciales se conocen a veces como estadsticas inductivas. El uso
e importancia de la estadstica inferencia! contina en crecimiento.
Una aplicacin de estadstica inferencia! es en investigacin farmacutica. La produccin de algunos medicamentos nuevos es costosa para producirlos, por tanto las pruebas deben estar limitadas a
muestras pequeas de pacientes. Con el uso de La estadstica inferencial,los investigadores pueden disear experimentos con pequeas muestras de pacientes seleccionadas al azar y tratar de llegar a conclusiones y hacer inferencias acerca de la poblacin.
Los investigadoresde mercados utilizan estadistica inferencia! para estudiar el impacto de la publicidad en diferentes segmentos del mercado. Supongamos que una empresa fabricante de bebidas gaseosas crea un anuncio publicitario que representa una mquina despachadora que habla al comprador y
los investigadores de mercado desean medir el impacto del nuevo anuncio en varios grupos de edades.
El investigador podra estratificar la poblacin en categoras de edades que van de jvenes a viejos,
muestrear al azar cada estrato y usar estadstica inferencial, para determinar la efectividad del anuncio
para los diversos grupos de edades de la poblacin. La ventaja de usar estadstica inferencia! es que
hace posible que el investigador estudie efectivamente una amplia gama de fenmenos sin tener que llevar a cabo un censo. La mayor parte de los temas estudiados en este texto pertenecen a estadstica inferencial,
Una medida descriptiva de la poblacin se denomina parmetro. Por lo general los parmetros se
denotan con letras griegas. Ejemplos de parmetros son media poblacional (.), varianza poblacional
(cr2), y desviacin estndar de poblacin (o), Una medida descriptiva de una muestra se llama estadstico y suelen denotarse con letras romanas, como la media muestra! (X), varianza muestra! (s2), y desviacin estndar muestra! (s).
La diferenciacin entre los trminos parmetro y estadstico es importante slo con el uso de la
estadstica inferencial. Un investigador de negocios a veces desea estimar el valor de un parmetro o
realizar pruebas acerca del parmetro. Sin embargo, el clculo de parmetros por lo general es imposible o no factible debido al tiempo y dinero necesarios para llevar a cabo un censo. En tales casos, el
investigador de negocios puede tomar una muestra al azar de la poblacin, calcular un estadistico en la
muestra, e inferir por estimacin el valor del parmetro. La base para la estadstica inferencial, entonces, es la capacidad para tomar decisiones acerca de parmetros sin tener un censo completo de la
~K~
ifilfli
Proceso de
estadstica
inferencia! para
estimar la media
poblacional()
Poblacin
Muestra
(parmetro)
(estadstica)
Seleccionar
una muestra
al azar
Nivel nominal
El nivel ms bajo de medicin de datos es el nivel nominal.Los nmeros que representan datos de nivel
nominal (la palabra nivel se omite a veces) se puede usar slo para clasificar o asignar categoras. Los
nmeros de identificacin de empleados son un ejemplo de datos nominales. Los nmeros se emplean
slo para diferenciar empleados y no para hacer una exposicin del valor de ellos. Numerosas preguntas demogrficasde estudios resultan en datos que son nominales debido a que las preguntasse emplean
slo para clasificacin. El siguiente es un ejemplo de esta pregunta que resultara en datos nominales:
Cul de las siguientes clasificacionesde empleo describe mejor su campo de trabajo?
a) Educador
b)
e)
d)
e)
f)
Trabajador de la construccin
Trabajador de manufacturas
Abogado
Doctor
Otro
Supongamos que, para fines de cmputo, a un educador se asigna un 1, a un trabajador de la construccin un 2, a un trabajador de manufacturas un 3, y as sucesivamente. Estos nmeros deberan
CAPITULO
INTRODUCCIN
A LA ESTADISTICA
usarse slo para clasificar personas que respondieron la encuesta. El nmero J no denota la clasificacin ms alta. Se usa slo para diferenciar un educador (1) de un abogado (4).
Algunos otros tipos de variables que con frecuencia producen datos de nivel nominal son el sexo,
religin, grupo tnico, ubicacin geogrfica y lugar de nacimiento. Los nmeros de seguro social,
nmeros telefnicos,nmeros de identificacin de empleados y nmeros de cdigo postal son ejemplos adicionales de datos nominales. Las tcnicas estadsticas que son apropiadaspara analizar datos
nominales son limitadas, no obstante algunas de las estadsticas ms empleadas,por ejemplo la estadstica ji cuadrada, se puede aplicar a datos nominalesque producen informacintil.
Nivel ordinal
Una medicin de datos de nivel ordinal es ms alta que el nivel nominal. Adems de las posibilidades
del nivel nominal, la medicin de nivel ordinal se puede usar para clasificar u ordenar objetos. Por
ejemplo, con el uso de datos ordinales,la supervisora puede evaluar tres empleadosal clasificar su productividad con los nmeros del J al 3. Con datos ordinales,la supervisora podria identificar al empleado ms productivo, al menos productivo y a quien est entre los anteriores. No obstante, el
supervisorpodra no usar datos ordinales para establecer que son igualeslos intervalosentre los empleados clasificados1 y 2 y entre los empleados clasificados2 y 3; esto es, ella podra no decir que las diferenciasen la cantidad de productividad entre los trabajadores clasificados 1, 2 y3 son necesariamente
las mismas. Con datos ordinales, las distancias o separacin representadas por nmeros consecutivos
no siempre son iguales.
Algunas escalasdel cuestionario tipo Likert son consideradas por muchos investigadorescomo de
nivel ordinal. El siguiente es un ejemplo de una de estas escalas:
poco
til
2
moderadamente
til
3
muy
til
4
extremadamente
til
5
Cuando esta pregunta de estudio se codifica para la computadora,slo permanecern los rimeros del 1 al 5, no los adjetivos. Prcticamentetodos estarn de acuerdo con que 5 es ms alto que 4 en
esta escala y que es posible clasificar las respuestas,pero la mayoria de quienes responden a la encuesta no considerarlan como iguales las diferencias entre no til, un poco til, moderadamente til, muy
til y extremadamente til.
Los fondos mutuos como inversionesse clasificana veces en trminos de riesgo al usar medidas de
riesgo por incumplimiento,monetario y de tasas de inters. Estas medidasde riesgo se aplican a inversionescuando se clasificancomo de alto, medio y bajo riesgo.
Ahora bien, si al alto riesgo se le asigna un 3 de calificacin,al riesgo medio 2 y al bajo l; por otra
parte, si a un fondo se le asigna 3 en lugar de 2, lleva ms riesgo,y asl sucesivamente.No obstante,las
diferencias en riesgo entre las categorias 1, 2 y 3 no son necesariamenteiguales,por lo que estas medidas de riesgo son slo medidas de nivel ordinal. Otro ejemplo del uso de nmerosordinales en negocios es la clasificacin de las 50 compaas ms admiradas en la revista Fort11ne. Los nmeros que
clasifican a estas empresas son slo ordinales en su medicin.Ciertas tcnicas estadsticasson especialmente apropiadas para datos ordinales pero otras muchas no son apropiadas para usarse en este tipo
de datos.
Debido a que los datos nominales y ordinalesse deducen a vecesa partir de mediciones imprecisas, como las preguntasdemogrficas,la categorizacinde personas u objetos,o la clasificacinde artculos, los datos nominale.s y ordinales son datos no mtricos y a veces se conocen como datos
cualitativos.
Nivel de intervalo
La medicin de datos de nivel de intervaloes el siguiente al nivel ms alto de datos en el qut las distancias entre nmeros consecutivos tienen significado y los datos son siempre n11mricos. Las distancias representadas por las diferencias entre nmeros consecutivos son iguales; esto es, los datos de intervalo
tienen intervalos iguales. Un ejemplo de medicin de intervalo es la temperatura Fahrenheit. Coa
nmeros de temperatura Fahrenheit, las temperaturas se puedan clasificar y las cantidades de calor
entre lecturas consecutivas, por ejemplo 20, 21 y 22, son las mismas.
~~~~~~~----"======================!!!!!!!!!'!!!!!!!!!!'!!!!!!!!!!'!!!!!!!!!!'!!!!!!!!m--------------~
10 ESTADISTICA EN WS NEGOCIOS
meno. Por ejemplo, cero grados Fahrenheit no es la temperatura ms baja posible. Algunos otros ejemplos de datos de nivel de intervalo son el porcentaje de cambio en empleo, el porcentaje de rendimiento
de una accin financiera, y el cambio en dlares en el precio de acciones.
Con datos de nivel de intervalo, convertir las unidades de una medicin a otra implica multiplicar
por algn factor, a, y sumar otro factor, b, tal que y = b + ax. Como ejemplo, convertir de temperatura en centgrados a temperatura Fahrenheit hace necesaria la relacin:
Fahrenheit
32 +
centgrados
Nivel de razn
La medicin de datosde nivelde razn es el nivel ms alto de medicin de datos. Los datos de razn tienen las mismas propiedades que los datos de intervalo pero los datos de razn tienen un cero absoluto y
la razn entre los dos nmeros es significativa. La nocin de cero absoluto significa que cero es fijo, y el
valor cero en los datos representa la ausencia de la caracterlstica en estudio. El valor de cero no se puede
asignar en forma arbitraria porque representa un punto fijo. Esta definicin hace posible que el experto
en estadstica pueda crear razones con los datos.
Ejemplos de datos de razn son la altura, peso, tiempo. volumen y la temperatura Kelvin. Con
datos de razn, un investigador puede expresar que 180 libras de peso es el doble que 90 libras, o bien,
en otras palabras hacen una razn de 180:90. Muchos de los datos capturados por mquinas en la
industria son datos de razones.
Otros ejemplos en el mundo de los negocios, que son nivel de razn en mediciones, son el tiempo
de ciclo de produccin, tiempo de medicin de un trabajo, millas pasajero, nmero de camiones vendidos, quejas por 1 O mil volantes, y nmero de empleados. Con datos de nivel de razn, no se requiere
del factor b para convertir unidades de una medicin a otra, esto es, y = ax. Como un ejemplo, al convertir altura de yardas a pies: 1 pie = 3 yardas.
Debido a que los datos de nivel de intervalo y de razn suelen ser capturados por instrumentos
precisos que con frecuencia se emplean en procesos de produccin e ingeniera,en pruebas de estndares nacionales, o en procedimientos estandarizados de contabilidad, se denominan datos mtricos y
a veces se conocen como datos cuantitativos.
ifiilii
Uso del potencial
de varios niveles de
datos
La figura 1.3 muestra las relaciones del potencial de uso entre los cuatro niveles de medicin de datos.
Los cuadros concntricos denotan que cada nivel ms alto de datos puede ser analizado por cualquiera de las tcnicas empleadas en niveles inferiores de datos pero, adems, puede ser utilizado en otras
tcnicas estadsticas. Por tanto, los datos de razn pueden ser analizados por cualquier tcnica estadstica aplicable a los otros tres nivelesde datos ms algunas otras.
Los datos nominales son los ms limitados en trminos de anlisis estadsticos que se utilicen con
ellos. Los datos ordinales permiten al investigador realizar cualquier anlisis que se pueda elaborar
con datos nominales y algunos anlisis adicionales. Con datos de razn, es posible para un experto en
estadstica hacer comparaciones de razn y apropiadamente realizar
cualquier anlisis posible en datos nominales, ordinales o de intervalo. Algunas tcnicas estadsticas requieren de datos de razn y no
se pueden usar para analizarotros niveles de datos.
De intervalo
Las tcnicas estadsticas pueden separarse en dos categoras:
estadisticas paramtricas y estadsticas no paramtricas. Las estadsticas paramtricasrequieren que los datos sean de intervalo o de
razn. Si los datos son nominales u ordinales,deben usarse estadsticas no paramtricas.Las estadisticas no paramtricas tambin se
pueden usar para analizar datos de intervalo o de razn. Este texto
se concentra principalmente en estadsticas paramtricas, con
excepcin los capitulo 12 y 17, que contienen tcnicas no paramtricas. Por tanto, buena parte del material de este texto requiere que
los datos sean datos de intervalo o de razn.
E]
CAPITULO 1
INTRODUCCIN A U\ ESTAD!SnCA
11
Continan presentndose muchos cambios en la industria de la salud. Debido a que hay mayor
competencia por atender pacientes entre proveedores y la necesidad de determinar la forma en
que stos pueden servir mejor a sus clientes, administradores de hospitales a veces envan por
correo una encuesta de satisfaccin de calidad a sus pacientes despus que stos son dados
de alta. Los siguientes tipos de preguntas se formulan a veces en las encuestas. En qu nivel de
medicin de datos resultarn estas preguntas?
1. Hace cunto tiempo que se dio de alta del hospital?
Poco
importante
No muy
importante
Nada
importante
_buena
_muy buena
_regular
_mala
Excelente
Soluci6n
La pregunta 1 es una medicin de tiempo con cero absoluto y por tanto es una medicin de nivel
de razn. Una persona que ha estado fuera del hospital durante dos semanas lo ha estado el
doble de tiempo que alguien que ha estado fuera slo una semana.
La pregunta 2 rinde datos nominales porque al paciente se le pide slo categorizar el tipo de
unidad en que l o ella estuvieron. Esta pregunta no requiere jerarqua o clasificacin del tipo
de la unidad. Es probable que las preguntas 3, 4 y 5 resulten en datos de nivel ordinal. Supongamos que se asigna un nmero a los descriptores en cada una de estas tres preguntas. Para la
pregunta 3, a "muy importante" podra asignarse un 4, a "poco importante" un 3, a "no muy
importante" un 2, y a "nada importante" un 1. Ciertamente, cuanto ms alto el nmero, ms importante es la ubicacin del hospital. Por tanto, estas respuestas se pueden clasificar por seleccin. No obstante, los aumentos en importancia de 1 a 2 a 3 a 4 no son necesariamente iguales.
Esta misma lgica se aplica a los valores numricos asignados en las preguntas 4 y 5.
La pregunta 6 muestra siete opciones numricas con iguales distancias entre los nmeros
mostrados en la escala, y no se asignan adjetivos descriptivos a los nmeros. Muchos investigadores diran que esto es una medicin de nivel de intervalo debido a la distancia igual entre
nmeros y la ausencia de un cero verdadero en esta escala. Otros investigadores podran argir
que por la imprecisin de la escala y lo vago de los valores de seleccin entre "malo" y "excelente", la medicin es slo ordinal en su nivel.
12
Los expertos en estadstica de negocios emplean muchos de los populares paquetes de software de
estadstica, incluyendo el M!NJTAB, SAS y SPSS. Muchos paquetes de software de hojas de clculo
de computadora tambin tienen capacidad de analizar datos estadlsticamente. En este texto, la salida
estadstica de computadora presentada es del MIN!TABy del software Microsoft Excel.
;m.1mw1HflllHiil}l.11.1 ._
_,
CAPITULO 1
INTROOUCCIN A LA ESTADISTICA
13
CONSIDERACIONES TICAS
Con la abundancia y proliferacin de datos estadsticos, el mal uso de la estadstica en el manero
de negocios es un problema. Es, en efecto, un comportamiento no tico en negocios, emplear
estadlsticas fuera de contexto. Las personas no ticas en negocios podran usar slo datos selectivos de estudios para subrayar su punto de inters, omitiendo estadsticas de los mismos estudios que discuten contra su caso. Los resultados de estudios estadsticos se pueden expresar mal
o exagerar para ganar un favor.
En este capitulo se hizo notar que si los datos son nominales u ordinales, entonces slo estadsticas no paramtricas son apropiadas para su anlisis. El uso de estadsticas pararntricas para
analizar datos nominales y/u ordinales es errneo y podra ser considerado bajo algunas circunstancias como no tico.
En este texto, cada captulo contiene una seccin sobre tica que analiza la forma en que los
negocios pueden dar mal uso a las tcnicas presentadas en el captulo en una forma no tica.
Como usuarios y productores, los estudiantes de administracion de negocios necesitan estar
conscientes de potenciales problemas ticos que pueden ocurrir con la estadstica.
semejantes, con lo cual se produce un nivel ordinal de mediciones. Por razones de privacidad, algunos
temas de preguntas como la edad o ingreso se expresan en rangos de clase que tambin resultan en un
nivel ordinal de medicin. Adems, a los habitantes de zonas rurales de la India se les puede pedir que
clasifiquen diversos productos en trminos de cules serla ms probable que compraran, lo que darla
datos ordinales. Otras variables como son la ubicacin geogrfica, afiliacin a un partido poltico, ocupacin y religin resultaran en datos nominales.
La decisin para entrar al mercado de la India rural no es slo una decisin de mercadeo. Comprende la capacidad de produccin y problemas de fechas de entrega, dificultades en transportes,
compromisos financieros, crecimiento gerencial o reasignacin, problemas de contabilidad (la contabilidad para la lndia rural puede diferir de las tcnicas empleadas en mercados tradicionales), sistemas
de informacin y otros campos relacionados. Con tanto en la lnea, quienes toman decisiones en la
compaia necesitan tanta informacin relevante disponible como sea posible. En este Dilema de decisin, es obvio para quien tome decisiones que la lndia rural es todava muy pobre y analfabeta. Su capacidad como mercado es grande. Las estadlsticas en las crecientes ventas de algunos productos de
cuidado personal parecen promisorias. Cules son los pronsticos futuros para el poder adquisitivo
del pueblo en la India rural? Problemas culturales importantes bloquearn la adopcin de los tipos de
productos que las compaas desean vender al? Las respuestas a stas y muchas otras interesantes y
tiles preguntas se pueden obtener con el correcto uso de la estadlstica. Los 750 millones de personas
que viven en la India rural representan el segundo grupo ms grande de personas en el mundo.
Ciertamente, es un segmento de mercado digno de ms estudio.
RESUMEN
La estadstica es una importante herramienta para Ja toma de
decisiones en negocios y se utiliza en prcticamente todos los
campos de negocios. La palabra estadlstica tiene muchas connotaciones. Entre los significados ms comunes de la palabra
estn: 1) la ciencia que rene, analiza, interpreta y presenta
datos, 2) una rama de las matemticas, 3) un curso de estudio,
4) datos y cifras, 5) una muerte, 6) medicin de muestra y
7) tipo de distribucin empleada para analizar datos. Las estadisticas se utilizan ampliamente en negocios e incluye las
disciplinas de contadura, ciencias de toma de decisiones, economa, finanzas, administracin, sistemas de administracin de
informacin, mercadeo y produccin.
El estudio de estadsticas puede subdividirse en dos categoras principales: estadstica descriptiva y estadlstica i11ferencial. La estadstica descriptiva resulta de recolectar datos de un
cuerpo, grupo o poblacin y llegar a conclusiones slo acerca
de ese grupo. La estadstica inferencia! se genera a partir del
proceso de recolectar datos muestrales de un grupo, cuerpo o
poblacin y llegar a conclusiones acerca del grupo ms grande del cual se tom la muestra.
El tipo apropiado de anlisis estadlstico depende del nivel
de medicin de datos, que puede ser 1) nominal, 2) ordinal,
3) i11tervalo o 4) de razn. El nominal es el nivel ms bajo, que
representa la clasificacin de slo datos tales como la ubica-
14
ESTADISTICA
cin
geogrfica,
nivel es ordinal,
EN LOS NEGOCIOS
sexo o nmero
que produce
de seguro
mediciones
social.
El siguiente
de ordenamiento
de
mtricos o cualitativos.
TRMINOSCLAVE
censo
estadstica descriptiva
datos mtricos
estadstica inferencia!
muestra
datos no mtricos
estadsticos
parmetro
estadstico
estadstica no paramtrica
poblacin
estadlstica paramtrica
PROBLEMAS COMPLEMENTARIOS
1.1 D un ejemplo especifico de los datos que podran ser
reunidos de cada una de las siguientes disciplinas de
negocios: contadura, finanzas, recursos humanos. rnercadotecna, sistemas de informacin, produccin y admi-
1 ia consume en un mes.
pus que se les ha designado como excelente, buena,
satisfactoria y mala.
d. La clave de larga distancia automtica
Estados Unidos.
de clientes en
de un empleado.
500.
en un cuestionario.
Calificacin/tipo
AAA
Calidad ms alta
Calidad alta
AA
A
BBB
BB
B
Calidad intermedia
Poco especulativa
Calidad baja, especulativa
Calificacin baja, posible
incumplimiento
Calificacin baja, posible
recuperacin parcial
Incumplimiento,
improbable
recuperacin
ccc
ce
e
1.7 La Rathburn Manufacturing Companyproduce conductores elctricos, que vende a contratistas en la industria de
2 =Noreste
Esta base de datos de series de tiempo contiene los porcentajes de desempleo civil en siete paises presentados anualmente
entre 1959 y 1998. Los datos son publicados por la Bureau of
Labor Statistics del U.S. Department of Labor. Los paises son
Estados Unidos, Canad, Australia, Japn, Francia, Alemania e
Italia.
3 = Medio Oeste
4 =Suroeste
5 = Montaas Rocallosas
6 = California
7 =Noroeste
El control es un tipo de propiedad. Cuatro categorlas de
control estn incluidas en la base de datos:
1 = gobierno, no federal
2 = no gobierno, no con fines de lucro
3 = con fines de lucro
4 = gobierno federal
El servicio es el tipo de hospital. Los dos tipos de hospitales empleados en esta base de datos son:
1 = medicina general
2 = psiquiatra
Las variables del total de gastos y nmina estn en unidades de $1 000.
Base de datos de series de tiempo de agroindustria
La base de datos de series de tiempo de agroindustria contiene el peso mensual (en mil libras) de propiedades de almacenamiento en fro para seis legumbres diferentes y para
legumbres totalmente congeladas en un periodo de 14 aos.
Cada una de las siete variables representa 168 meses de datos
desde 1984 a 1997. Las seis legumbres son judas verdes, brcoli, zanahorias, maiz, cebollas y chcharos. Los datos estn
publicados por la National Agricultural Statistics Service del
U.S. Department of Agriculture.
Utilice la base de datos para contestar las siguientes preguntas.
l. En la base de datos de manufactura, cul es el nivel de
datos para cada una de las siguientes variables?
a. Nmero de trabajadores de produccin
b. Costo de materiales
c. Valor de embarques de la industria
d. Grupo de industria
2. En la base de datos de hospital, cul es el nivel de datos
para cada una de las siguientes variables?
a. Regin
b. Control
c. Nmero de camas
d. Personal
3. En la base de datos financiera, cul es el nivel de datos para
cada una de las siguientes variables?
a. Tipo de industria
b. Total de activos
c. Razn P/E
mano de 1999,
a Name? Brand
E.xtension Pctential" y "'OiGiorno Rising Crust Delivers $200 Million ..,
antes en http://www.foodexplon:r.com/BUSINESS/ProduCU/MarketAnalysi>/
PF02896b. btm, ltimo acceso en 1999.
CAPTULO 2
Tablas y grficas
OBJETIVOS DE APRENDIZAJE
El objetivo general del captulo 2 es que el estudiante domine varias tcnicas para
resumir y representar datos, con le que podr:
l. Reconocer la diferencia entre datos agrupados y no agrupados.
2. Construir una distribucin de frecuencia.
3. Construir un histograma, un polgono de frecuencia, una ojiva, una grfica de
pastel, una grfica de tallo y hoja, una grfica de Pareto y una grfica de dispersin.
18
Segn los datos publicados por el Automotive News Data Center, General Motors Corporation es la
nmero uno en el mundo en ventas totales de autos y camiones ligeros. Ford Motor Company es la nmero dos seguida por Toyota Motor Corporation y Volkswagen, respectivamente. Entre 1999 y 2000,
General Motors mantuvo su posicin nmero uno, vendiendo casi 200 000 autos menos en todo el
mundo. Durante este mismo periodo, Ford Motor aument ventas en ms de 200 000. El crecimiento
de mayor porcentaje de 1999 a 2000 fue para PSA Peugeot-Citroen, que aument ventas en 14.2%. A
continuacin veamos las cifras mundiales de ventas para los JO principales fabricantes de autos y
camiones ligeros para 1999 y 2000.
Compaa
General Motor
Ford Motor
Toyota Motor
Volkswagen
DaimlerChrysler
PSA Peugeot-Citroen
Fiat
1999
2000
%de cambio
8 786 000
8 591 327
-2.2
7 148 000
7 350 495
2.8
5 359 000
5 703 446
6.4
4 860203
5 161188
6.2
4 864 500
4 749000
-2.4
2 519 600
2 877 900
14.2
2 521 000
2 646 500
5.0
Hyundai Motor
Nissan Motor
2 600 862
2 634 530
1.3
2 567 878
2 629 044
2.4
Honda Motor
2 395 000
2 540000
6.1
19
20
TABLA 2.1
Porcentajes de desempleo en
Francia en 40 aos (datos no
agrupados)
1.6
1.5
1.2
1.4
1.6
1.2
1.6
1.6
2.1
2.1
2.7
2.3
2.5
2.8
2.9
2.8
.2.9
4.2
4.6
5.2
5.4
6.1
6.5
7.6
8.3
8.6
JO.O
10.S
10.6
10.8
I0.3
9.6
9.1
9.6
10.4
11.8
12.3
11.8
12.5
12.4
11.8
En los captulos 2 y 3 se presentan diversas tcnicas para reformar o reducir datos y que
stos sean ms manejables y se puedan usar para ayudar de manera ms eficiente a quienes
toman decisiones. Dos tcnicas para agrupar datos son la distribucin de frecuencia y la
grfica de tallo y hoja que en este captulo se presentan. Adems, en el captulo 2 se estudian y exhiben varias herramientas grficas para resumir y representar datos, incluyendo
histogramas, polgono de frecuencia, ojiva, grfica de pastel y grfica de Pareto para datos
de una variable, y la grfica de dispersin para datos numricos de dos variables. Con el uso
de stas y otras tcnicas, quienes toman decisiones pueden empezar a "echar mano" de la
informacin contenida en los datos y usar stos para mejorar el proceso de toma de decisiones.
Los datos sin procesar, o datos que 110 han sido resumidos en ninguna forma, se conocen
a veces como datos no agrupados. La tabla 2.1 contiene datos sin procesar de los porcentajes de desempleo en Francia en ms de 40 aos. Los datos que se han organizado en una
distribucin de frecuencia se denominan datos agrupados. La tabla 2.2 presenta una distribucin de frecuencia para los datos mostrados en la tabla 2.1. La distincin entre datos no
agrupados y agrupados es importante porque los clculos de estadstica difieren entre los
dos tipos de datos. Este capitulo se concentra en organizar datos no agrupados y mostrarlos grficamente.
DISTRIBUCIONES DE FRECUENCIA
Una herramienta particularmente til para agrupar datos es la distribucin de frecuencia, que es un
resumen de datos presentados en la forma de intervalos y frecuencias de clase. Cmo se construye una
distribucin de frecuencia a partir de datos sin procesar? Esto es, cmo se construyen distribuciones
de frecuencia -<0mo la que se ilustra en la tabla 2.2- a partir de datos sin procesar como los de la
tabla 2.1? Las distribuciones de frecuencia son relativamente fciles de construir. Aun cuando algunas
directrices y reglas prcticas ayudan en su construccin, las distribuciones de frecuencia varlan en su
forma final y diseo, aun cuando los datos sin procesar originales sean idnticos. En cierto sentido, las
distribuciones de frecuencia se construyen segn el gusto individual de los investigadores de negocios.
Cuando se construya una distribucin de frecuencia, el investigador de negocios debe determinar
primero el rango de los datos sin procesar. El rango se define a veces como la diferencia entre los nmeros ms grande y ms pequeo. El rango de los datos de la tabla 2.1 es 11.3 (12.5-1.2).
El segundo paso en construir una distribucin de frecuencia es determinar cuntas clases contendr. Una regla prctica es seleccionar entre S y 15 clases. Si la distribucin de frecuencia contiene muy
pocas clases, el resumen de datos puede ser demasiado general para ser til. Muchas clases pueden
resultar en una distribucin de frecuencias que no agrega los datos suficientes para ser til. El nmero
final de clases es arbitrario. El investigador de negocios llega a un nmero si examina el rango y determina el nmero de clases que abarcar el rango en forma adecuada y tambin que sea significativo para
el usuario. Los datos de la tabla 2.1 se agruparon en seis clases para la tabla 2.2.
Despus de seleccionar el nmero de clases, el investigador de negocios debe determinar el ancho del intervalo de clase. Una aproximacin del ancho de clase se puede calcular
al dividir el rango entre el nmero de clases. Para los datos de la tabla 2.1, esta aproximaTABLA2.2
cin serla 11.3/6, o sea 1.9. Normalmente, el nmero se redondea al siguiente nmero entero, que en este caso es 2. La distribucin de frecuencia debe empezar en un valor igual a o
Distribucin de frecuencia de
menor al nmero ms bajo de los datos no agrupados y terminar en un valor igual o mayor
los porcentajes de desempleo
que el nmero ms alto. El porcentaje ms bajo de desempleo es 1.2 y el ms alto es 12.5,
en Francia (datos agrupados)
de modo que el investigador de negocios inicia la distribucin de frecuencias en 1 y la terlotttValo
mina en 13. La tabla 2.2 contiene la distribucin de frecuencia completada para los datos
de clase
Frecuencia
de la tabla 2.1. Los puntos finales de la clase se seleccionan de modo que ningn valor de
l-rnenor de 3
16
los datos pueda caber en ms de una clase. La expresin de intervalo de clase, "menor de';
3-menorde 5
2
en la distribucin del la tabla 2.2 evita este problema.
5-menordc 7
Marca de clase
7-menordc9
9-menor de 11
l l-menor de 13
El punto medio de cada intervalo de clase se llama marca de clase y a veces se conoce como
punto medio clase. Es el valor a la mitad entre ti intervalo de clase y se puede calcular
como el promedio de los dos puntos finales de clase. Por ejemplo, en la distribucin de la tabla 2.2, el
punto medio del intervalo de clase 3-menor de 5 es 4 o (3 + 5)/2. Una segunda forma de obtener la
marca de clase es calcular la mitad de la distancia en el intervalo de clase (la mitad del ancho de clase)
y sumarla al punto inicial de clase, como para la distribucin de porcentajes de desempleo:
Punto inicial de clase = 3
Ancho de clase = 2
Marca de clase = 3
+ .!.(2)
2
=4
La marca de clase es importante, porque se convierte en el valor representativo para cada clase en
la mayor parte de clculos de estadlstica de grupo. La tercera columna de la tabla 2.3 contiene las marcas de clase para los datos de la tabla 2.2.
Frecuencia relativa
La frecuencia relativa es la proporcin de la frecuencia total que estd en cualquier intervalo de clase dado
en una distribucin de frecuencia. La frecuencia relativa es la frecuencia de clase individual dividida
entre la frecuencia total. Por ejemplo, de la tabla 2.3, la frecuencia relativa para el intervalo de clase
5-menor de 7 es 4/40 o .10. La consideracin de la frecuencia relativa es preparatoria al estudio de probabilidad del capitulo 4. De hecho, si se seleccionaran valores al azar de los datos de la tabla 2.l , la
probabilidad de sacar un nmero que sea "5-menor de 7" serla .10, la frecuencia relativa para esa clase
de intervalo. La cuarta columna de la tabla 2.3 es una lista de las frecuencias relativas para la distribucin de frecuencia de la tabla 2.2.
Frecuencia acumulada
La frecuencia acumulada es u11 total corriente de frecuencia por las clases de una distribucin de frecue11cia. La frecuencia acumulada para cada intervalo de clase es la frecuencia para ese intervalo de frecuencia sumado al total acumulado precedente. En la tabla 2.3, la frecuencia acumulada para la primera
clase es la misma que para la frecuencia de clase: 16. La frecuencia acumulada para el segundo intervalo de clase es la frecuencia de ese intervalo (2) ms la frecuencia del primer intervalo ( 16), lo cual da
una nueva frecuencia acumulada de 18. Este proceso contina hasta el ltimo intervalo, en cuyo punto
el total acumulado es igual a la suma de las frecuencias ( 40). El concepto de frecuencia acumulada se
emplea en muchos campos de accin, incluyendo ventas acumuladas en un ao fiscal, marcador final
de deportes durante un concurso (puntos acumulados), aos de servicio, puntos ganados en un curso
y costos por hacer negocio en un periodo. La tabla 2.3 indica frecuencias acumuladas para los datos de
la tabla 2.2.
TABLA 2.3
"'untos medios de clase,
~enca relativas,
y frecuencia acumuladas para
datos de desempleo
1..-lo
l-menorde3
3-mmorde5
5-menorde7
7-menorde9
9-menor de 11
11-nwnordel3
1bliia
fNcumda
16
2
4
3
9
..i
40
~-iio
dedme
2
4
6
8
10
12
F...--la
nlidha
111-ia
_....
.oso
.400
16
18
.100
22
.075
.225
34
~
1.000
25
40
22
PROBLEMA DE
DEMOSTRACIN
2.1
Los siguientes datos son el promedio de tasas semanales de inters de hipoteca para un periodo de 60 semanas.
7.29
6.69
6.98
7.39
7.11
7.30
7.16
6.87
7.08
6.96
7.02
6.99
7.03
7.02
7.56
7-.28
6.95
7.17
6.78
6.80
7.24
6.70
7.40
6.94
7.14
7.40
6.75
6.97
7.23
6.96
6.79
7.10
7.34
6.57
7.12
7.29
6.77
7.16
6.78
6.90
7.31
6.78
7.07
7.13
7.47
6.88
7.16
7.05
6.35
6.96
7.11
6.57
7.00
7.30
7.03
6.95
7.31
6.84
7.16
6.84
Construya una distribucin de frecuencia para estos datos. Calcule y muestre los puntos
medios de clase, frecuencias relativas y frecuencias acumuladas para esta distribucin de frecuencia.
Soluci6n
Cuntas clases debera contener esta distribucin de frecuencia? El rango de los datos es 1.21
(7.56-6.35). Si se utilizan 13 clases, cada ancho de clase es aproximadamente:
Ancho de clase
Rango
Nmero de clases
=~
13
= 0.093
6.30-menor de 6.40
6.40-menor de 6.50
6.50-menor de 6.60
6.60-menor de 6.70
6.70-menor de 6.80
6.80-menor de 6.90
6.90-menor de 7 .00
7.00-menor de 7.10
7.10-menor de 7.20
7 .20-menor de 7.30
7.30-menor de 7.40
7.40-menor de 7.50
7.SO-menor de 7.60
Totales
Marcas de
Frecuencia
clase
Frecuencia
relativa
6.35
6.45
6.55
6.65
6.75
6.85
6.95
7.05
7.15
7.25
7.35
7.45
7.55
.0167
.0000
.0333
.0167
.1000
.1000
.1667
.1333
.1833
.0833
.1000
.0500
.0167
1.0000
o
6
6
10
8
11
5
6
3
_L
60
Frecuencia
acumulada
3
4
10
16
26
34
45
50
56
59
60
Las frecuencias acumuladas y frecuencias relativas de estos datos dejan ver las clases de tasas
de inters de hipotecas que es probable se presenten durante el periodo. Casi todas las tasas de
inters de hipotecas (52 de las 60) estn en las clases que empiezan con (6.70-menor de 6.80) y
pasaa a (7.30-menor de 7.40). Las tasas con la mayor frecuencia, 11, estn en la misma clase
(7.10-menor de 7.20).
l.1 PROBLEMAS
2.1 Los siguientes datos representan las temperaturas altas vespertinas para 50 das de construccin
durante un ao en St. Louis.
42
55
16
38
31
69
31
17
64
12
70
85
40
79
38
73
62
40
75
61
64
to
81
35
52
38
47
36
53
43
47
24
15
36
16
48
63
44
31
30
66
45
35
23
81
25
84
17
60
33
a. Construya una distribucin de frecuencias para los datos usando cinco intervalos de clase.
b. Construya una distribucin de frecuencias para los datos usando JO intervalos de clase.
c. Examine los resultados de (a) y (b) y comente sobre la utilidad de la distribucin de frecuencias
en trminos de capacidad de resumir temperaturas.
2.2 Se supone que un proceso de empaque debe llenar pequeas cajas de pasas con aproximadamente 50 pasas, de modo que cada caja pese lo mismo. No obstante, va a variar el nmero de pasas de
cada caja. Supngase que se muestren al azar 100 cajas de pasas, se cuentan stas y se obtienen los
siguientes datos.
57
44
49
49
51
54
55
46
59
47
51
53
49
52
48
46
53
59
53
52
53
45
44
49
55
51
50
57
45
48
52
57
54
54
53
48
47
47
45
50
50
39
46
57
55
53
57
61
56
45
60
53
52
52
47
56
49
60
40
56
51
58
55
52
53
48
43
49
46
47
51
47
54
53
43
47
58
53
49
47
52
51
47
49
52
48
53
47
48
46
49
52
41
50
48
57
44
48
57
46
Construya una distribucin de frecuencias para estos datos. Qu deja ver la distribucin
cuencias acerca de los llenados de cajas?
de fre-
2.3 El propietario de un restaurante de comida rpida averigua las edades de una muestra de clientes.
A partir de estos datos, el propietario construye la distribucin de frecuencias que se muestra a
continuacin. Para cada intervalo de clase de la distribucin de frecuencias, determine la marca de
clase, la frecuencia relativa y la frecuencia acumulada.
Intervalo de clase
O-menorde5
5-menor de 10
10-menor de 15
15-menor de 20
20-menor de 25
25-menor de 30
30-menor de 35
Frecuencia
17
23
18
10
4
Qu indica la frecuencia relativa al propietario del restaurante de comida rpida acerca de las edades de clientes?
los registros de empleados de 500 compaas para observar el ausentismo durante el ao pasado.
8 investigador de negocios que lleva a cabo el estudio organiza los datos en una distribucin de
frecuencias para ayudar al gerente de recursos humanos en el anlisis de los datos. A continuacin
se muestra la distribucin de frecuencias. Para cada clase de la distribucin de frecuencias, determine la marca de clase, la frecuencia relativa y la frecuencia acumulada.
Intervalo de clase
Frecuencia
O-menor de 2
218
2-menor de 4
207
4-menor de 6
6-menor de 8
56
11
8-menor de 10
Histogramas
Un histograma es un tipo de grfica de barras verticales que se utiliza para representar una distribucin
de frecuencias. La construccin de un histograma comprende marcar el eje x (abscisa) con los puntos
finales de clase y el eje y (ordenada) con las frecuencias, trazando un segmento de recta horizontal del
punto final de clase al punto final de clase en cada valor de frecuencia y conectando cada segmento de
recta verticalmente desde el valor de frecuencia al eje x para formar una serie de rectngulos. La figura
2.1 es un histograma de la distribucin de frecuencias de la tabla 2.2, producido con el uso del software
MINITAB.
Un histograma es una herramienta til para diferenciar las frecuencias de intervalos de clase. Una
mirada rpida a un histograma deja ver qu intervalos de clase producen los totales de frecuencia ms
altos. La figura 2.1 muestra claramente que el intervalo de clase l-menor de 3 proporciona con mucho
el conteo de frecuencia ms alto (16). Un examen del histograma revela en dnde se presentan grandes
aumentos o reducciones entre clases, por ejemplo de la clase -rnenor de 3 a la clase 3-menor de 5, una
reduccin de 14, y de la clase 7-menor de 9 a la clase 9-menor de 11, un aumento de 6.
Ntese que las escalas empleadas a lo largo de los ejes X e y para el histograma de la figura 2.1 son
casi idnticas, pero, debido a que los rangos de nmeros significativos para las dos variables que se
grafican a veces difieren considerablemente, la grfica puede tener diferentes escalasen los dos ejes. La
figura 2.2 muestra cmo se verla el histograma de los porcentajes de desempleo si la escala del eje y
fuera menor que la del eje x. Ntese que la menor diferencia en la longitud de los rectngulos parece
representar las frecuencias en la figura 2.2. Es importante que el usuario de la grfica comprenda da-
Histograma
MINITAB de datos
15
oe desempleo en
=rancia
11
13
ramente las escalas que se emplean para los ejes de un histograma. De otra forma, el creador de una
grfica puede "mentir con la estadstica" al alargar o comprimir una grfica para formar un punto:
Histograma
MINITAB de datos
de desempleo
en Francia (eje y
comprimido)
15
"
~ 10
u.
11
13
Debe sealarse que el paquete Excel utiliza el trmino histograma para referirse a una distribucin de frecuencia, pero
al hacer die en Chart output de la caja de dilogo de histograma Excel, tambin se crea un histograma graco.
que quien tome decisiones financieras desea usar estos datos para llegar a algunas conclusiones acerca
del mercado de acciones. La figura 2.3 muestra un histograma de estos datos producido por el MINITAB.
Qu se puede saber a partir de este histograma? Prcticamente todos los volmenes del mercado de
acciones caen entre cero y mil millones de acciones. La distribucin toma una forma que es alta en el
extremo izquierdo y se hace aguda hacia la derecha. En el captulo 3 veremos que la forma de esta distribucin est sesgada hacia el extremo derecho. En estadstica, a veces es til determinar si los datos
estn normalmente distribuidos en forma aproximada (curva en forma de campana), como se muestra en la figura 2.4. Podemos ver, al examinar el histograma de la figura 2.3, que los datos del volumen
del mercado de acciones no estn normalmente distribuidos. Aun cuando el centro del histograma est
ubicado cerca de 500 millones de acciones, una gran parte de las observaciones del volumen de acciones cae en el extremo inferior de los datos en algn punto entre 100 millones y 400 millones de acciones.
Adems, el histograma muestra algunos resultados aislados en el extremo superior de la distribucin.
Los resultados aislados son puntos de datos que aparecen fuera del cuerpo principal de observaciones
y pueden representar fenmenos que difieren de los representados por otros puntos de datos. Al observar el histograma, se notan algunos datos que se acercan a los mil millones. Se podra concluir que en
pocos dJas del mercado de acciones, se vende un gran volumen de acciones. Se pueden captar stas y
otras nociones al examinar el histograma y mostrar que los histogramas desempean un papel importante en el anlisis inicial de datos.
Polgonosde frecuencia
Un polgono de frecuencias es una grfica en la que segmentos de recta "que enlazan puntos" representa
una distribucin de frecuencias. La construccin de un polgono de frecuencias empieza, al igual con un
histograma, al asignar escala a puntos finales de clase a lo largo del eje x y a los valores de frecuencia a
lo largo del eje y. Se determina un punto para el valor de frecuencia en el punto medio de cada intervalo de clase (marca de clase). El enlace de estos puntos medios completa la grfica. La figura 2.5 muestra un polgono de frecuencias de los datos de distribucin de la tabla 2.2, obtenido con el uso del
programa Excel. La informacin captada a partir del polgono de frecuencias e histogramas es semejante. Al igual que con el histograma, el cambio de escalas de los ejes puede comprimir o alargar el polgono de frecuencias, lo cual afecta la impresin del usuario de lo que representa la grfica.
Ojivas
Una ojiva es un polgono defrecuencias acumuladas. AquI tambin se inicia la construccin al marcar el
eje x con los puntos finales de clase y el eje y con las frecuencias. No obstante, el uso de valores de frecuencia acumulada requiere que la escala a lo largo del eje y sea suficientemente grande para incluir el
total de frecuencia. Un punto de frecuencia cero se grafica al principio de la primera clase y la construccin contina al marcarse un punto en el extremo de cada intervalo de clase para el valor acumulado. Al enlazar los puntos se completa entonces Ja ojiva. La figura 2.6 presenta una ojiva obtenida con
el Excel para los datos de la tabla 2.2.
0011111._
Histograma
de volmenes de
acciones,
1990-1998
50
40
30
20
10
500 millones
1000 millones
CAPtruLO
2 TABLAS Y GRFICAS
27
Las ojivas son ms tiles cuando quien tome decisiones desea ver totales corrientes. Por
ejemplo, si un controlador est interesado en controlar costos, una ojiva podrfa representar costos acumulados de un ao fiscal.
Las pendientes pronunciadas de una ojiva se pueden usar para identificar aumentos agudos en frecuencia. En la figura 2.6 pueden presentarse pendientes agudas en la clase l-menor
de 3 y la clase 9-menor de 11, lo cual significa grandes totales de frecuencia de clase.
RGUllA 2.4
:>..s:.ribucin normal
Grficas de pastel
Una grfica de pastel es una representacin circular de datos donde el rea de todo el pastel
representa 100% de los datos en estudio y las rebanadas representan una descomposicinen
porcentaje de los subniveles. Las grficas de pastel muestran las magnitudes relativas entre
partes y un todo. Se utilizan ampliamente en negocios, en particular para representar factores como por
ejemplo categoras de presupuesto, porcentaje de participacin en el mercado y asignaciones de tiempo y recursos. No obstante, el uso de grficas de pastel es mnimo en ciencias y tecnologa debido a que
1,:-1,111-
18
-gono de
29c:uencia,
~en
:.a::el de los datos
::.esempleo
16
14
..
12
e
;:)
10
~
"-
6
4
o
3
45
40
.,,.
-3
e
35
30
25
20
o"
;:)
~
"-
15
JO
11
13
11
13
HA1fii!i.1111.111Mi[.fi.J+M .._
Tiendas de alimentos
~dos/gasolineras
16%
Pon:mtaje
Supermercado
Fuente de soda.
Tienda de alimentos
envasados/gasolineras
M'quinas expendedoras
Comerciantes
Farmacias
24
16
11
so------------------~ 30
Tiendas
M~.
de .!im. vendecnvasadosl doras
guolintras
Comer Panmoames
ciu
Lugardcvcnw
pueden llevar a juicios menos precisos de lo que es posible con otros tipos de grficas." En general, para
un observador es ms dificil interpretar el tamao relativo de ngulos en una grfica de pastel que juzgar la longitud de rectngulos en un histograma o la distancia relativa de un punto de polgono de frecuencias desde el eje x. En el artculo Statistics in Business Today, "Where Are Soft Drinks Sold?" las
representaciones del porcentaje de ventas por lugar fueron mostradas tanto por una grfica de pastel
como por una grfica de barras verticales.
En la construccin de la grfica de pastel primero se determina la proporcin entre la subunidad
y el entero. La tabla 2.4 contiene cifras de ventas generadas por Information Resources, !ne., para las
principales 10 marcas de pastas dentales. Primeramente, las cifras de ventas de nmero entero son proporciones convertidas al dividir cada cantidad de ventas entre la cantidad total de ventas. Esta proporcin es anloga a la frecuencia relativa calculada para distribuciones de frecuencia. Debido a que el
crculo contiene 360 grados, cada proporcin se multiplica por 360 para obtener el nmero correcto de
grados y representar cada artculo. Por ejemplo, las ventas de Aquafresh de $177 989 000 representan
una proporcin de .1319 del total de ventas {177 989 000/1349 326 000 = .1319). Multiplicar este valor
por 360 resulta en 47.48. Las ventas de Aquafresh constituyen 47.48 del pastel. La grfica de pastel se
completa entonces con el uso de un comps para trazar las rebanadas. La grfica de pastel de la figura
2.7, construida con el uso de MINITAB, describe los datos de la tabla 2.4.
"william S. Cleveland, The El<ments of Graphmg Data {Monterey, CA: Wadsworth Advanced Books and Software, 1985).
tul.A 2.4
:mas de pasta
="lea
de 10
:ic oales marcas
Marca
Crest
Colgate
Aquafresh
Mentadent
Arm &Hammer
Rembrandt
Sensodyn
Vmtu
Proporcin
Grados
.2745
98.82
321084000
.2380
85.68
177 989000
.1319
47.48
170630000
.1265
45.55
.0812
29.23
52 067 000
.0386
13.90
50 133 000
.0372
13.39
Listerine
40 107 000
.0297
10.69
Closeup
Ultrabrite
Totales
32 009 ()()()
.0237
8.53
25 358 000
.0187
____n_
oro
1.0000
360.00
1;:1 .,.
s1
349 326
29
Closeup
2.4%
:O-T"ica de pastel
~AB de ventas
.::e oasta dentfrica
pe-. -narca
Sensodyn
3.7%
Listerine
3%
PROBLEMA DE
DEMOSTRACIN
2.2
Segn la National Retail Federation y el Center fer Retailing Education de la University of Florida,
las cuatro principales fuentes de disminucin de inventario son robos de empleados, robos de
clientes en tiendas, errores administrativos y fraude de vendedores. la disminucin estimada en
cantidad anual en dlares (millones de dlares), asociada con cada una de estas fuentes, es:
Robos de empleados
Robos de clientes
Erroradministrat
ivo
Fraude de vendedor
Total
$17 918.6
15191.9
7 617.6
2 553.6
$43 281.7
Robos de clientes
Error administrativo
Fraude de vendedor
Total
.414. 360 =
.351 . 360 =
.176. 360 =
.059 . 360 =
Robos de empleados
Robos de clientes
Error administrativo
Fraude de vendedor
Total
149.0'
126.4
63.4
21.2'
360.0
Fraude de vendedor
6%
Robos de clientes
35%
TABLA 2.6
TABLA 2.5
Calificaciones de examen de
seguridad para estudiantes
de planta
86
76
23
77
81
79
68
77
92
59
68
75
83
49
91
47
72
82
74
70
56
60
88
75
97
39
78
94
55
67
83
89
67
91
81
Hoja
3
9
7
5
o
o
1
9
6
7
2
9
7
4
2
2
8
5
3
4
8
5
3
7
6
6
7
8
7
9
31
los datos originales sin procesar se retienen (en tanto que casi todas las distribuciones de frecuencia y
representaciones grficas usan el punto medio de clase para representar los valores en una clase).
PROBLEMA DE
DEMOSTRACIN
2.3
Los siguientes datos representan los costos (en dlares) de una muestra de 30 remesas postales hechas por una compaa.
3.67
1.83
3.34
3.64
9.15
2.75
10.94
7.80
4.95
3.45
5.47
1.93
3.20
5.42
5.11
4.65
3.89
3.21
8.64
1.97
3.32
7.20
3.55
4.84
2.84
2.09
2.78
3.53
4.10
4.15
Con el uso de dlares como tallo y centavos como hoja, construya una grfica de tallo y hoja
de los datos.
Solucin
Tallo
Hoja
1
2
3
4
5
6
83
09
20
10
11
93
75
21
15
42
20
64
15
94
80
8
9
10
97
78
32
65
47
84
34
84
45
95
53
64
67
89
Grficas de Pareto
Un concepto y movimiento importantes en negocios es la Administracin de Calidad Total (vase el
capitulo 18}. Uno de los importantes aspectos de la administracin de calidad total es la constante bsqueda de causas de problemas en productos y procesos. Una tcnica grfica para mostrar causas de problemas es el anlisis de Pareto, que es un registro cuantitativo del nmero y tipos de defectos que se
presentan en un producto o servicio. Los analistas emplean este registro para obtener una grfica de
bamu verticales que exhiba los tipos de defectos ms comunes, clasificados en el orden en que se presentan
de izquierda a derecha. La grfica de barras se llama grfica o diagrama de Pareto,
Las grficas de Pareto se denominan as! en honor al economista italiano Vilfredo Pareto, quien
observ hace ms de 100 aos que casi toda la riqueza de Italia estaba controlada por unas cuantas
familias que eran los principales motores detrs de la economa italiana. El experto en calidad J.M.
Juran aplic esta nocin al campo de la calidad al observar que la mala calidad puede a veces resolverse
al atacar algunas causas principales que resultan en casi todos los problemas. Una grfica de Pareto hace
posible que quienes tomen decisiones en control de calidad separen los defectos ms importantes de los
defectos triviales, para establecer prioridades en el trabajo de mejora de calidad segn sea necesario.
Supongamos que el nmero de motores elctricos que son rechazados por inspectores de una compaa se increment. Los directores de la compaa examinan los registros de varios cientos de motores en los que se encontr por lo menos un defecto y encuentran que 40% de los defectos son por
alambres defectuosos, 30% por cortocircuito en las bobinas, 25% por clavijas defectuosas y 5% por cojinetes pegados. La figura 2.8 muestra una grfica de Pareto construida a partir de esta informacin, en
la que los principales tres problemas con motores defectuosos; es decir, alambres defectuosos, cortocircuito en las bobinas y clavijas defectuosas, justifica 95% de los problemas. De la grfica de Pareto,
con lo cual los directores pueden formular un plan lgico para reducir el nmero de defectos.
Es probable que directores y trabajadores de la compaa comiencen a mejorar la calidad al examinar los segmentos del proceso de produccin que se relacionen con el alambrado para posteriormente estudiar la construccin de las bobinas y luego las clavijas y el proceso del proveedor de stas.
32
ESV.DISTICA
EN LOS NEGOCIOS
ma11i!I!: ..
Grfica de Pareto
para problemas de
motores elctricos
40
..
30
-;
-e
25
35
;:*-
20
o
o.
10
15
U@i1tt..
Cojinetes
pegados
r---l---;::==================::;---------------100
Grfica MINITAB
de Pareto para problemas de motores
elctricos
80
..
~ so
.,
60
.u
40
.:
;:
20
Defecto
Cuenta
Porcentaje
%acum.
Alambre
defectuoso
40
40.0
40.0
Cortocircuito
en bobina
30
30.0
70.0
Clavija
defectuosa
25
25.0
95.0
Otros
5
5.0
100.0
La figura 2.9 es una presentacin MINITAB de la grfica de Pareto. Adems del anlisis de la grfica de barras, el anlisis de MINITAB de Pareto contiene una grfica de linea de porcentaje acumulado.
Observe las pendientes en la grfica de linea en la que las pendientes mayores representan los problemas que se presentan con ms frecuencia. Cuando las pendientes bajan, los problemas se presentan con
menor frecuencia. La grfica de lnea proporciona a quien tome decisiones otra herramienta para
determinar cules problemas resolver primero.
2.2 PROBLEMAS
2.6
Frecuencia
7
15
21
34
24
17
8
CAPITULO
2.7
2.8
33
Frecuencia
!O-menor de 20
20-menor de 30
30-menor de 40
40-menor de SO
SO-menorde 60
60-menor de 70
70-menor de 80
9
7
10
6
13
18
IS
2.9
2 TABLAS Y GRFICAS
Frecuencia
2
s
10
11
17
Construya una grfica de tallo y hoja usando dos dgitos para el tallo.
212
2S7
243
218
2S3
273
2SS
239
271
261
238
227
220
226
240
266
249
2S4
270
226
218
234
230
249
2S7
239
222
239
246
2SO
261
2S8
249
219
263
263
238
2S9
26S
2SS
23S
229
240
230
224
260
229
221
239
262
2.10 A continuacin aparece una lista de las compaas de contabilidad ms grandes de Estados
Unidos, junto con sus datos de ingresos netos para 1997 (millones de dlares), segn el Public
Accounting Report.
Firma
Andersen Worldwide
Emst&Young
Deloitte & Touche
I<PMG Peat Marwick
Coopers & Lybrand
PriceWaterhouse
Grant Tbornton
McGladrey & Pullen
BDO Seidrnan
Ingresos
$S44S
4416
3 600
2 698
2S04
2 344
289
270
240
Construya una grfica de pastel para representar estos datos. Aplique leyendas a las rebanadas con
los porcentajes apropiados. Comente sobre la efectividad de usar una grfica de pastel para exhibir los ingresos de estas empresas de contabilidad ms importantes.
2.11 Segn la Air Transport Association of Amrica, Delta Airlines encabez todas las lneas en cuanto al nmero de pasajeros transportados en un ao reciente. Las cinco principales aerolneas fueron Delta, United, American, U.S. Airways y Southwest. A continuacin aparece el nmero de
pasajeros transportados (en miles) por cada una de estas aerolneas:
TABLA 2.7
Valor de construcciones
nuevas en un periodo
de 35 aos
Residmcial
No residencial
169635
96497
155113
115372
149410
96407
175822
129275
162706
140569
134605
145054
195028
131289
231396
155261
234955
178925
266481
163740
267063
160363
263385
164191
252745
169173
228943
167896
197526
135389
232134
120921
249757
122222
274956
127593
251937
139711
281229
153866
280748
166754
297886
177639
315757
175048
de dlares estables).
Pasajeros
Delta
103133
United
84 203
American
81 083
US Airways
58 659
Southwest
55 946
2.12 Information Resources, Inc. reporta que, en un ao reciente, Huggies fue la marca de
paales de mayor venta en Estados Unidos con 41.3% de la participacin en el mercado. Otras marcas que destacan son Pampers, con 25.6%, Luvs con 12.1 %, Drypers
con 3.3%, Fitti con 0.9%, y marcas libres con 15.8%. Utilice esta informacin para
construir una grfica de pastel de la participacin en el mercado de paales.
2.13 Los siguientes datos representan el nmero de pasajeros por vuelo en una muestra de
50 vuelos procedentes de Wichita, Kansas, a Kansas City, Missouri.
23
46
66
67
13
58
19
17
65
17
25
20
47
28
16
38
44
29
48
29
69
34
35
60
37
52
59
51
33
46
23
38
52
so
80
48
17
57
41
77
45
47
49
19
32
64
27
61
70
19
Construya una grfica de tallo y hoja para estos datos. Qu nos dice la grfica de tallo
y hoja acerca del nmero de pasajeros por vuelo?
2.14 Una aerolnea utiliza un banco central telefnico y un proceso semiautomtico telefnico para tomar reservaciones. Ha estado recibiendo un nmero anormalmente
alto de quejas de clientes acerca de este sistema de reservaciones. La compaia llev
a cabo un estudio de clientes, en el cual preguntaron si haban tenido cualesquiera de
los siguientes problemas al hacer reservaciones: tono de ocupado, desconexin, mala
conexin, demasiado tiempo en espera para hablar con alguien, no comunicarse con
un agente, conectado a extensin equivocada. Supongamos que el estudio de 744
dientes quejosos result en el siguiente total de frecuencia.
Nmero de quejas
184
Queja
Demasiado tiempo en espera
10
85
No comunicarse
37
Desconexin
420
8
con un agente
Tono de ocupado
Mala conexin
Construya un diagrama de Pareto, a partir de esta informacin, para mostrar los diferentes problemas encontrados al hacer reservaciones.
Como ejemplo de dos variables numricas, considere los datos del la tabla 2. 7 donde aparecen los
valores de construcciones residenciales nuevas y no residenciales nuevas en Estados Unidos para varios
CAPITULO
h~11i' 111
Grfica MINITAB
oe dispersin de
construccin
-esidencial y
-o residenciet
ueva
2 TABLAS Y GRFICAS
35
180000
160000
5
~
zo
140000
-e
120000
100000
80000
120000
220000
320000
Residencial
aos en un periodo de ms de 35 aos. Tienen alguna relacin estas dos variables numricas? Podra
parecer lgico, cuando hay auge de construcciones que al mismo tiempo hubiera auge en construcciones residenciales y no residenciales; sin embargo, la grfica de dispersin MINITAB de estos datos que
se ve en la figura 2.10 muestra resultados mixtos. La aparente tendencia es que hay ms construccin
de edificios residenciales nuevos cuando tiene lugar ms construccin de no residenciales y menos
construccin de residenciales nuevos cuando est a menores niveles la construccin de no residenciales. La grfica de dispersin tambin muestra que en algunos aos hubo ms construccin de residenciales nuevos y menos construccin de no residenciales al mismo tiempo y viceversa.
2.3 PROBLEMAS
2.15 La U.S. National Oceanic and Atmospheric Administration, National Marine Fisheries Service,
publica datos sobre la cantidad y valor de pesca nacional en Estados Unidos. A continuacin aparece la cantidad (en millones de libras) de peces capturados y empleados para consumo humano
y productos industriales (aceite, carnada, alimento para animales, etc.) en ms de una dcada. Es
una relacin evidente entre la cantidad empleada para consumo humano y la usada para productos industriales para un ao dado? Construya una grfica de dispersin de los datos. Examine
la grfica y discuta la intensidad de Ja relacin de las dos variables.
Alimento humano
Productos industriales
3 654
2 828
3 547
2 430
3 285
3 082
3 238
3 201
3 320
3 118
3 294
2 964
3 393
2 638
3 946
2 950
4 588
2 604
6 204
2 259
2.16 Existe relacin entre el dinero invertido en publicidad por una compaia y los ingresos totales
por ventas? Los siguientes datos representan el dinero invertido en publicidad y los ingresos por
ventas para varias compaas en una industria dada durante un ao reciente. Construya una grfica de dispersin de los datos a partir de las dos variables y comente la relacin entre las dos
variables.
Publicidad
(en millones de dlares)
Vontas
(en millones do dlares)
4.2
1.6
6.3
155.7
87.3
135.6
99.0
168.2
136.9
101.4
158.2
2.7
10.4
7.1
5.5
8.3
30-menor de 35
35-menor de 40
40-menor de 45
45-menor de 50
50-menor de 55
55-menor de 60
60-menor de 65
65-menor de 70
6
2
6
6
7
CONSIDERACIONES TICAS
Las consideraciones ticas para las tcnicas aprendidas en el capitulo 2 empiezan con los datos
escogidos para la representacin.Con la abundancia de datos disponibles en negocios, la persona que construya el resumen de datos debe ser selectiva al escoger las variables reportadas. El
potencial es grande para el analista que seleccionar las variables o incluso datos dentro de las
variables que sean favorables para su propia situacin o que se perciba sean bien recibidos por el
oyente.
La seccin 2.1 hizo notar que el nmero de clases y el tamao de los intervalos en distribuciones de frecuencia por lo general son seleccionados por el investigador,quien debe ser cuidadoso para seleccionar valores y tamaos que sean un reflejo honesto y exacto de la situacin y no
un caso sesgado, exagerado o subestimado.
En las secciones 2.2 y 2.3 estudiamos cmo construir cuadros y grficas sealando que en
muchos casos tiene sentido usar escalas desiguales en los ejes. No obstante, hacer esto ltimo abre
la posibilidad de "engallar con la estadstica"al alargar o comprimir los ejes para recalcar el punto
de vista del analista o investigador. Es imperativo que las distribuciones de frecuencia, asi como
tablas y grficas, se construyan de modo que reflejen datos reales y no simplemente la propia
observacin del investigador.
5
6
Hoja
013444
0344444557799
12777889
o 112345567789
Es posible emplear una grfica de dispersin para examinar la relacin entre los datos de 1999 y 2000.
En la figura 2.13 aparece una grfica Excel de estas dos variables numricas.
-----11.
~~oastel
_:::;a.z.....:. a
HyundaiMotor
(6.0%)
(ll.2%)
Toyota motor
(12.3%)
10000000
9000000
cz::s oe ventas
2
:ompaa
8000000
7000000
-;:
'Q
e
!!
e
6000000
5000000
4000000
-!t 3000000
2000000
1000000
o--'-'~-+-~1---+~+---+~+-__,f---+-~+---i
38
ESTADISTICA
EN LOS NEGOCIOS
ma11!111
Grfica de
dispersin de
una compaa
de ventas. Los
datos son de 1999
y 2000
10000000
9000000
8000000
7000000
o 6000000
o
o 5000000
"' 4000000
3000000
2000000
1000000
,,
RESUMEN
Los dos tipos de datos son agrupados y no agrupados. Casi
todo el anlisis de estadstica se realiza con datos no agrupados, es decir, sin procesar. Los datos agrupados son datos organizados en una distribucin de frecuencia. Es importante
distinguir entre datos agrupados y no agrupados, porque las
operaciones estadsticas en los dos tipos se calculan de modos
diferentes.
La construccin de una distribucin de frecuencia exige
varios pasos, el primero de los cuales es determinar el rango
de los datos, que es la diferencia entre el valor ms grande y el
valor ms pequeo y, a continuacin, se determina el nmero
de clases, que es una seleccin arbitraria del investigador. No
obstante, pocas clases agregan en exceso los datos en categoras
sin sentido y muchas clases no resumen los datos lo suficiente
para que sean tiles. El tercer paso en la construccin de una
distribucin de frecuencia es determinar el ancho del intervalo de clase. La divisin del rango de valores entre el nmero de
clases da el ancho aproximado del intervalo de clase.
La marca de clase es el punto medio de un intervalo de
clase. Es el promedio de los puntos finales de clase y representa el punto a la mitad del intervalo de clase. La frecuencia relativa es un valor calculado al dividir una frecuencia individual
entre la suma de las frecuencias. La frecuencia relativa representa la proporcin de valores totales que est en un intervalo
de clase dado. Es anloga a la probabilidad de sacar al azar, de
todos los valores, un valor de un intervalo de clase dado. La
frecuencia acumulada es una cuenta corriente de frecuencia
total que se inicia con el primer valor de frecuencia y suma
cada frecuencia resultante al total.
Los tipos de representaciones grficas presentadas en este
capitulo son histogramas, polgonos de frecuencia, ojivas, grficas de pastel, grficas de tallo y hoja, grficas de Pareto y
grficas de dispersin, La representacin grfica de datos es-'
especialmente til para ayudar a expertos en estadstica a
determinar la forma de distribuciones. Un histograma es una
grfica de barras verticales en donde un segmento de recta
enlaza puntos finales de clase en el valor de la frecuencia. Dos
CAPITULO 2 TABLAS Y
GRFICAS
39
[ TIHINOS CLAVE
frecuencia
grfica de
grfica de
grfica de
z;rupados
no agrupados
=i..."'Jn de frecuencias
'=IXDa acumulada
relativa
dispersin
Pareto
pastel
polgono de frecuencias
punto medio de clase
rango
PltOBLEMAS COMPLEMENTARIOS
de estadsticas
23
51
43
41
42
46
50
31
28
35
47
29
19
52
33
18
29
23
36
29
28
2.22 Un examen de rechazos muestra por lo menos 1 O problemas. A continuacin veamos un total de frecuencia
de los problemas. Construya una grfica de Pareto para
estos datos.
21
21
39
28
18
20
Frecuencia
1
2
673
29
108
379
73
564
12
402
54
202
4
5
6
7
8
9
10
Para cada intervalo de clase de la distribucin de frecuencia dada, determine la marca de clase, la frecuencia
relativa y la frecuencia acumulada.
Intervalo de clase
Frecuencia
20-menor de 25
25-menor de 30
30-menor de 35
35-menor de 40
40-menor de 45
45-menor de 50
17
20
16
15
8
6
s.:.
12
17
Intervalo de clase
Frecuencia
SO-menor de 60
60-menor de 70
70- menor de 80
80-menor de 90
90-menor de 100
13
27
43
31
9
Valor
A
B
55
121
83
46
e
D
312
314
290
306
324
309
311
286
289 335
294 "s26
317 301
308 284
10
14
8
56
42
52
41
50
57
56
52
63
46
50
52
44
46
50
69
42
36
62
43
47
55
57
53
46
51
54
47
47 52
53
58
51
38 49
39
44
55 43
42
57
49
Construya una distribucin de frecuencias p:tra estos
datos usando ocho clases. Qu puede usted observar
acerca de los datos a partir de la distribucin de frecuencias?
44
57
298
317
316
324
51
53
41
10
15
8
~O
Problema
40
ESTADISTICA
EN LOS NEGOCIOS
de 25
de 30
de 35
de 40
de 45
de 50
Frecuencia
8
6
5
12
15
7
70 000-menor
80 000-menor
90 000-menor
100 000-menor
110 000-menor
de 80000
de 90000
de 100 000
de 110000
de 120000
21
27
18
11
6
3
O-menor
100-menor
200-menor
300-menor
400-menor
500-menor
Frecuencia de
madres primerizas
de $100
de 200
de 300
de 400
de 500
de 600
3
6
12
19
JI
6
Frecuencia
$1.75-menor de $1.90
1.90-menor de 2.05
2.05-menor de 2.20
2.20-menor de 2.35
2.35-menor de 2.50
2.50-menor de 2.65
2.65 menor de 2.80
9
14
17
16
18
8
2.31 Los diez principales gneros musicales, segn SoundSean para un ao reciente, son R&B, alternativa (rock),
rap y msica country. A continuacin aparecen stos y
otros gneros musicales, junto con el nmero de lbumes vendidos de cada uno (en millones).
Gnero
R&B
Alternativa
Rap
Country
Pista
Metal
Clsica
Latina
lbumes vendidos
146.4
102.6
73.7
64.5
56.4
26.6
14.8
14.5
..,..._
lfODClas
27.3
54.0
133.0
257.5
388.8
629.7
[l.A
19.5
~.3
?9.3
~
Articulas manufacturados
:..!
93
2.36
2656
2742
2200
2976
2344
2996
i;Zs
~e
de descarga de productos qumicos
199 , segn la U.S. Environmental Protection
fl!CI..--.;. Construya
7
F.is:Xm y caucho
~
& transporte
~&bcados
~dtrico
::3J
=rafila manufacturera produce botellas de plspzn b industria lechera. Algunas de las botellas son
=r'iazadas por su mala calidad. Las causas de botellas de
a!idad incluyen plstico defectuoso, etiquetas
=atas.
decoloracin, grosor incorrecto, agarradera
erres, Los siguientes datos para 500 botellas de
~que
fueron rechazadas incluyen los problemas y
,;a. ~cia
de los problemas. Utilice estos datos para
una grfica de Pareto. Analice las implicacio'XI de la grfica.
Problema
Nmuo
2301
2830
2764
2375
2760
2437
2975
2405
2337
2602
2555
2268
3002
2677
2961
2670
2524
2448
2468
2990
3010
2922
2814
2460
Construya una grfica de tallo y hoja para estos 30 valores, donde el tallo contenga dos dgitos .
tOS:&
i!'!cdla:msquunicos
~primarios
A continuacin aparece una lista de 30 diferentes promedios de acciones del Dow Jones industrial.
Oe
""
~
u.
20
10
= .-
50 000
100 000
Ingresos de la familia en dlares
Dtco&oran
Gn>:.or
A?rradera rota
lla en plstico
Etiqueta
32
117
86
221
44
504~
.f.653
4730
-4;58
4866
-4116
525
53o6
-4199
5221
5556
5338
4963
5366
5858
4328
5048
4212
5263
4299
4361
4512
5090
5431
4346
4459
4232
5669
4339
5831
5737
4388
4822
5291
4734
5832
4878
4224
4834
150 000
5750
4654
5923
4304
5254
5919
5873
5166
4440
5478
Anestesiologa
Medicina
familiar
Pediatrla
Ciruga general
2.39 Supongamos que se hace un estudio a 100 empresas de
contadores pblicos titulados, para determinar cuntas
auditorias realizan en un cierto tiempo. Los datos estn
resumidos con el uso de la grfica MINITAB de tallo y hoja
100
~e
~E
e
100
!!
"
',,
60
"'3"
=-
40
20
'!t
80
F<b.
Mar.
Abril
May.
Nov.
Sep.
Jul.
Jun.
Agos,
Oct.
Dic.
M<S
pa ~
_,
....
D.:w
[h!
~~
->pring
Los:
e.res.
Ctrv
Spw"d
..::.:zs:
Fabricante
Unilever
Dial
Unilever
Colgate-Palmol.ive
Procter & Gamble
Procter & Gamble
Unilever
Procter & Gamble
Procter & Gamble
Dial
Ventas
($en millones)
271
193
138
121
115
94
93
69
48
44
~os
19.6
15.4
17.4
IS.O
18.5
20.6
18.4
20.0
20.9
19.3
18.2
14.7
17.1
12.2
19.9
18.7
20.4
20.3
15.5
16.8
19.1
20.4
15.4
20.3
17.5
17.0
18.3
13.6
39.8
20.7
21.3
22.5
21.4
23.4
23.1
22.8
21.4
24.0
25.2
26.3
23.9
30.6
25.2
26.2
26.9
32.8
26.3
26.6
24.3
26.2
23.8
Frecuencia
89
17
2
32
8
47
5
3
USO DE LA COMPUTADORA
EXCEL
Con el Chart wizard, Excel ofrece la capacidad de producir
muchas de las tablas y grficas presentadas en este capitulo.
Adems, Excel puede generar distribuciones de frecuencia e
histogramas con el uso de D.ata analysis.
Muchas de las tcnicas de este curso se puede realizar en
Excel con el uso de una herramienta llamada .[!ata analysis.
Para tener acceso a Ja funcin D.ata analysis, seleccione Iools
en la barra de mens. D.ata analysis est ubicado en el fondo
del men de despliegue descendente. Si .[!ata analysis no aparece en este men, debe agregarse. Este agregado o mdulo
slo se hace una vez. Para agregar .[!ata analysis, seleccione
Add-jns en el men Iools. En la caja de dilogo Add-jns que
aparece, haga clic en Analysis ToolPak (no Analysis Too!PakVBAJ. Haga clic en OK (aceptar) y Analysis Too!Pak quedar
agregado a la capacidad de Iools.
Excel se refiere a las distribuciones de frecuencia como
histogramas. En Excel las clases se llaman bins (directorios). Si
el usuario no especifica bins, Excel automticamente determina el nmero de bins. Si el usuario desea especificar los bins,
cargue los puntos finales de clase en una columna. Para calcular la distribucin de frecuencia, seleccione Iools en la barra
de mens de Excel. Seleccione Uata analysis del men descendente Iools y seleccione Histogram de la caja de dilogo
.[!ata Analysis. Ponga la ubicacin de los valores sin procesar
de datos en Input Range. Si desea especificar los puntos finales de clase, ponga la ubicacin de los puntos finales en .Rin
Range. Si desea que Excel automticamente determine los
bins, deje esto en blanco. Si tiene etiquetas, entonces haga clic
en Labels. Si desea una grfica de histograma, haga clic en
.Chart Output en la parte baja de la caja de dilogo. Si desea
una ojiva, seleccione Curnulative Percentage junto con .Chart
Output, y Excel producir una grfica de histograma con una
ojiva sobrepuesta en la misma. Seleccione una de las opciones
de salida. Despus de hacer clic en OK se obtiene una distribucin de frecuencia como salida con bins y frecuencia junto
con una grfica de histograma.
Despus de construir una distribucin de frecuencia, el
usuario puede construir histogramas, polgonos de frecuencia
y ojivas con la funcin Chart Wizard. Para tener acceso a
Chart Wizard seleccione Insert en la barra de men. Del
men descendente seleccione .Chart Aqu se dispone de varias
tablas y grficas. La primera se llama Column, con la que es
posible construir una del tipo histograma. Estas tablas de
columna son en realidad grficas de barras verticales con
espacios entre las clases. Seleccione Column, y luego avance
por las cuatro cajas de dilogo que siguen, llenando la informacin apropiada. En la caja de rango de datos ponga la ubicacin de los bins y las frecuencias de la distribucin de
frecuencia. En el Chart Wizard es posible modificar los ttulos, ejes, leyendas y ubicacin de la salida segn se desee. Para
convertir una grfica de barras verticales en un histograma al
eliminar la brecha entre barras, haga clic con el botn derecho
del ratn sobre una de las barras de la grfica. Del men que
aparece, seleccione FQrmat Data Series. De la caja de dilogo
MINITAB
MINITAB tiene la capacidad de construir histogramas, polgonos de frecuencia, ojivas, grficas de pastel, grficas de tallo y
hoja, grficas de Pareto y grficas de dispersin junto con lo
necesario para construir una distribucin de frecuencias. Con
excepcin de las grficas de Pareto, a las que se tiene acceso
mediante el S.tat, a todas estas tablas y grficas se tiene acceso al
seleccionar !iraph en la barra de mens.
Histogramas, polgonos de frecuencia y ojivas se construyen en el MINITAB con el uso de la opcin Histogram del
men descendente !lraph. Para empezar, inserte la ubicacin
de columna de los datos sin procesar en el primer rengln bajo
!lraph variables de la caja de dilogo Histogram. Es posible
hacer mltiples grficas al insertar ubicaciones en diversos
renglones bajo !lraph variables. En .[!ata display, seleccione
el tipo de grfica deseada. Utilice Bar para un histograma y
Connect para un polgono de frecuencias o una ojiva. Existen
diferentes opciones en esta caja de dilogo para establecer el
nmero de clases, dando a la grfica un titulo, modificar los
ejes, etc. La caja de dilogo {}!tions es especialmente importante para modificar el nmero de clases, determinar el tipo
de intervalos empleados y construir una ojiva. Para construir
una ojiva, seleccione Cumulative Frequency de la caja de dilogo {}!tions. Para construir un pollgono de frecuencias, un
histograma o para determinar frecuencia para una distribucin de frecuencia, seleccione frequency. Casi todo lo esencial
de una distribucin de frecuencia se puede obtener al construir un histograma, al seleccionar Annotation de la caja de
dilogo Histograrn y luego seleccionar Qata labeJs. En la caja
de dilogo Qata labels, haga clic en Show data labels. Esta
opcin agregar frecuencia a la grfica. A partir de estas frecuencia y los puntos finales de clases mostrados en la grfica,
se puede construir una distribucin de frecuencias.
Las grficas de pastel se construyen al seleccionar Pi~
Chart del men descendente Y.raph. En la caja de dilogo
Pi~ Chart, las dos principales opciones son !;hart data in y
Cbart table. Utilice la opcin !;hart data in si los valores a
usar al construir la grfica de pastel estn en una sola columna. Utilice la opcin Chart table si las categorlas estn en una
columna y los valores de frecuencia estn en otra columna.
Existen otras opciones, por ejemplo para ordenar las rebanadas de pastel, explorar rebanadas, colores o leyendas.
Las grficas de tallo y boja se construyen al seleccionar
Stem-and-leaf ... del men descendente !l_raph. En la caja de
dilogo Stem-and-leaf ... escriba la ubicacin de los datos y
haga clic en OK. La salida contiene tallos y hojas pero adems
CAPTULO
Estadstica descriptiva
OBJETIVOS DE APRENDIZAJE
El captulo 3 se centra en el uso de tcnicas estadsticas para describir datos, con lo
cual el estudiante puede:
l. Distinguir entre medidas de tendencia central, medidas de variabilidad, medidas
de forma y medidas de asociacin.
2. Comprender los significados de media, mediana, moda, cuartil, percentil y rango.
3. Calcular media, mediana, moda, percentil, cuartil, rango, varianza, desviacin
estndar y desviacin media absoluta en datos no agrupados.
4. Diferenciar entre muestra y varianza de poblacin y desviacin estndar.
S. Comprender el significado de desviacin estndar como es aplicado al usar la regla
emprica y el teorema de Chebyshev.
6. Calcular la media, moda, desviacin estndar y varianza en datos agrupados.
7. Entender el sesgo, curtosis y grficas de caja y bigote.
8. Calcular el coeficiente de correlacin e interpretarlo.
46
Estadsticas de lavanderas
Segn Procter & Gamble, 35 mil millones de cargas de lavandera se ejecutan en Estados Unidos cada
aiio. Cada segundo se inician 1100 cargas. Las estadsticas demuestran que una persona en Estados
Unidos genera un cuarto de tonelada de ropa sucia cada ao. Los estadounidenses parecen estar pasando
ms tiempo lavando de lo que pasaban hace 40 aos. Hoy da, el promedio de mujeres estadounidenses pasa de siete a nueve horas a la semana en una lavandera, pero una investigacin de esa industria
muestra que el resultado es que hay ropa ms sucia que en otros pases desarrollados. Diversas compaas venden versiones nuevas y mejoradas de lavadoras y detergentes y, con todo, los estadounidenses
parecen resistirse a innovaciones de fabricantes de este equipo. En Estados Unidos, el promedio de
mquina lavadora emplea unos 16.galones de agua; en Europa esta cifra es de slo 4 galones. El promedio de ciclo de lavado de una mquina hecha en Estados Unidos es de unos 35 minutos, comparado con 90 en Europa. Los estadounidenses prefieren mquinas que se cargan desde arriba porque no
tienen que inclinarse, y estas ltimas mquinas son ms grandes. Los europeos emplean mquinas ms
pequeas que se cargan por el frente porque tienen espacios de vivienda ms reducidos.
Preguntasgerenciales y estadsticas
Prcticamente todas las estadsticas citadas aqu se obtienen de estudios o encuestas.
l. Supongamos que se lleva a cabo un estudio de uso de lavanderas en 50 casas en Estados Unidos
equipadas con lavadoras y secadoras. Se toman mediciones de agua en cuanto al nmero de
galones usados por cada lavadora en un ciclo. Los siguientes datos son el nmero de galones
empleados por cada lavadora durante el ciclo de lavado. Resuma los datos para que sea posible
reportar resultados de este e~tudio.
15 17 16 15 16 17 18 15 14 15
16 16 17 16 15 15 17 14 15 16
16 17 14 15 12 15 16 14 14 16
15 13 16 17 17 15 16 16 16 14
17 16 17 14 16 13 16 15 16 15
2. El promedio de ciclo de lavado para una mquina hecha en Estados Unidos es de 35 minutos.
Supongamos que la desviacin estndar de un ciclo de lavado para una mquina de este tipo es
de 5 minutos. Dentro de qu rango de tiempo caen la mayor parte de ciclos de lavado de una de
estas mquinas?
3. La cantidad de lavandera hecha al ao en una casa, est relacionada de alguna manera con el
ingreso familiar? Supongamos que ocho familias de dos adultos y dos niiios se eligen al azar
para un estudio. En un periodo de un ao, se lleva registro del peso de la ropa lavada por cada
familia, y se averigua su ingreso anual. De los siguientes datos de estudio, determine si existe
relacin entre el ingreso de esa familia y la cantidad de lavanderfa hecha (en peso).
Cantidad de lavandera
(peso en libras)
1210
875
l 890
1450
Ingreso familiar
(en miles de dlares)
42
31
2 040
110
1 330
660
1490
1950
60
68
45
56
72
93
Fuente: adaptado de Emily Nelson, "In Doing l.aundry,Americans Cling to Outmoded Ways",Wall Srreet fournal, 16 de mayo de
2002, pp. Al & AIO.
47
Cz
48
ESTADISTICA
EN LOS NEGOCIOS
El captuloZ describe tcnicas grficaspara organizar y presentar datos. Por ejemplo, tratamos de resumir 40 aos de porcentajes de desempleo para Francia con una distribucin de frecuencias, un histograma, un polgono de frecuenciasy una ojiva.Aun cuando estas grficaspermiten que el investigador
haga algunas observacionesgenerales acerca de la forma y dispersin de los datos, es posible obtener
una comprensin ms completa de ellos si se resumen mediante el uso de estadsticas. Este captulo
presenta medidas estadsticas, que incluyen medidas de tendencia central, de variabilidady de forma.
El clculo de estas medidas es diferente para datos no agrupados y agrupados. En consecuencia, presentamos algunas medidas para datos no agrupados y agrupados. Adems, se puede usar una de las
estadsticas presentadas para calcular la correlacin y relacin entre dos variables numricas.
3.1
Moda
La moda es el valor que se presenta con ms frecuencia en un conjunto de datos. Para los datos de la tabla
3.1, la moda es $19.00 porque el precio ofrecido que se present ms veces (4) fue $19.00. La organizacin de los datos en un conjunto ordenado (ordenacin de los nmeros de menor a mayor) ayuda a
localizar la moda. El siguientees un conjunto ordenado de valores de la tabla 3.1.
7.00
21.00
11.00
22.00
14.25
23.00
15.00
24.00
15.00
25.00
15.50
27.00
19.00
27.00
19.00
28.00
19.00
34.22
19.00
43.25
Esta agrupacin hace ms fcil ver que 19.00 es el nmero que se presenta con ms frecuencia.
En el caso de empate para el valor que se presenta con ms frecuencia, se hace una lista de dos
modas. Luego entoncesse dice que los datos son bimodales.Si un conjunto de datos no es exactamente birnodal pero contiene dos valores que son ms dominantes que otros, algunos investigadores se
toman Ja libertad de denominar al conjunto de datos como birnodal incluso sin un empate exacto para
la moda. Los conjuntos de datos con ms de dos modas se conocen como multimodales.
En el mundo de los negocios, el concepto de moda se usa con frecuencia al determinar medidas.
Por ejemplo, fabricantes de zapatos podran producir zapatos de bajo costo en slo tres anchos: pequeo, mediano y grande. Cada medida de ancho representa un ancho modal de pies. Al reducir el nme. ro de medidas a unas cuantas medidas modales, las compaas pueden reducir costos totales del
producto al limitar costos de preparacin de mquinas. Del mismo modo, la industria
del vestido produce camisas, vestidos, trajes y muchos otros productos de vestido en tallas
modales.Por ejemplo, todas las camisas talla M en un lote dado se producen en Ja misma
TABLA 3.1
talla",Esta talla es alguna medida modal para hombres de tamao medio.
La moda es una medida apropiada de tendencia central para datos de nivel nominal.
Precios de oferta para las 20
La moda se puede usar para determinar qu categora se presenta con ms frecuencia.
ms grandes ofertas pblicas
iniciales eri un ao reciente
$14.25
$19.00
$11.00
$28.00
24.00
23.00
43.25
19.00
27.00
25.00
15.00
7.00
34.22
15.50
15.00
22.00
19.00
19.00
27.00
21.00
Mediana
La mediana es el valor medio de un conjunto ordenado de nmeros. Para un conjunto con
CAPITUW 3 ESTADISTICADESCRIPTIVA 49
PASO l. Acomodar las observaciones en un conjunto ordenado de datos.
PASO 2. Para un nmero impar de trminos, hallar el trmino de en medio del conjunto ordenado. ste
es la mediana.
PASO 3. Para un nmero par de trminos, hallar el promedio de los dos trminos de en medio. Este promedio es la mediana.
Supongamos que un investigador desea determinar la mediana para los siguientes nmeros.
15
11
14
21
17
22
16
19
16
19
20
11
14
15
16
16
17
19
19
20
21
22
11
14
15
16
16
17
19
19
20
21
Ahora, para un nmero par de trminos, el experto en estadstica determina la mediana al promediar los dos valores de en.medio, 14 y 15. El valor resultante de mediana es 14.5.
Otra forma de localizar la mediana es hallar el trmino (n + 1 )/2 en un conjunto ordenado. Por
ejemplo, si un conjunto de datos contiene 77 trminos, la mediana es el trmino 39. Esto es:
n + 1 77 + 1 78
-- = -- = - =
2
terrruno 39
$105 000
116 000
122 000
$148 000
167 000
189 000
$5 250 000
La mediana es el promedio de los dos trminos medios, $116 000 y $122 000, o sea $119 000. Este
precio es una representacin razonable de los precios de las 10 casas. Ntese que la que tiene un precio
de $5 250 000 no entr en el anlisis como no sea para contar como una de las 10 casas. Si el precio de
la dcima casa fuera $200 000, los resultados seran los mismos. No obstante, si los precios de todas
se promediaran, el precio promedio resultante de las 1 O casas originales serla de $635 000, ms alto que
nueve de los 10 precios originales.
Una desventaja de la mediana es que no usa toda la informacin de los nmeros. Por ejemplo, la
informacin acerca del precio especifico que se pide de la casa ms costosa no entra realmente en el
clculo de la mediana. El nivel de medida de datos debe ser por lo menos ordinal para que una mediana tenga sentido.
Media
La media aritmtica es el promedio de
dividirlos entre el total de ellos. Debido
tos en estadstica la Uaman simplemente
La media poblacional se representa
x. Las frmulas para calcular la media
siguen:
media.
con Ja letra griega mu(.). La media muestra! se representa con
poblacional y Ja media muestra! se dan en los recuadros que
MEDIA
POBLACIONAL
1
MEDIA
. MUESTRAL
1
11
11
La letra sigma mayscula griega (I,) se utiliza por lo comn en matemticas para representar una
suma de todos los nmeros de una agrupacin." De igual modo, N es el nmero de trminos de la
poblacin 11 es el nmero de trminos de la muestra. El algoritmo para calcular una media es sumar
todos los nmeros de la poblacin o muestra y dividir entre el nmero de trminos.
Una definicin ms formal de la media es:
N
x;
,=--r=J
N
Sin embargo, para los fines de este texto:
N
Ex denota l:x;
i=I
Es incorrecto usar la media para analizar datos que no sean por lo menos del nivel de intervalo en una
medicin.
Supongamos que una compaa tiene cinco departamentos con 24, 13, 19, 26 y 11 trabajadores
cada una. El nmero de trabajadores de la media poblacional en cada departamento es 18.6trabajadores. A continuacin veamos el clculo.
24
13
19
Ex=
y
26
ll
93
Ex 93
=-=-=18.6
11
5
El clculo de una media muestra! utiliza el mismo algoritmo que para una media poblacional y
producir la misma respuesta si se calcula con los mismos datos. No obstante, es incorrecto calcular una
media muestra! para una poblacin o una media poblacional para una muestra. Debido a que poblaciones y muestras son importantes en estadstica, es necesario el uso de un slmbolo por separado para
la media poblacional y para la media muestra!.
PROBLEMA DE
DEMOSTRACIN
3.1
Enterprise
Hertz
ANC Rental Group
Avis
Budget
Dollar
Thrifty
U-Save
Toyota
Rent-a-Wreck
Advantage
Payless
ACE
La matemtica de las sumas no se estudia aqui. En el CD~ROM se incluye una explicacin ms detallada.
ff
51
Moda:
Mediana:
Media:
12 000
Con 13 diferentes compaas en este grupo, n = 13. la mediana est situada en la
posicin (13 + 1)/2 = 7a. Como los datos ya estn ordenados, el sptimo trmino es
51 000, que es la mediana.
El nmero total de autos en servicio es 1 694 000 = Ix
,=Ex=
1694000=130 307.7
13
La media es afectada por todos y cada uno de los valores, que es una ventaja. La media utiliza todos
los datos y cada rengln de ellos influye en la media. Tambin es una desventaja, porque valores extremadamente grandes o pequeos pueden dirigir la media hacia el valor extremo. Recuerde el anlisis
precedente de los precios de 1 O casas. Si la media se calcula para las 1 O casas, el precio medio es ms
alto que nueve de las casas porque la de $5 250 000 est incluido en el clculo. El precio total de las 10
casas es $6 350 000 y el precio medio es $635 000.
La media es la medida de ubicacin ms comnmente empleada porque utiliza cada rengln de
datos en su clculo, es una medida conocida y tiene propiedades matemticas que la hacen atractiva
para usarla en anlisis estadstico inferencial.
Percentiles
Los percentiles son medidas de tendencia central que dividen tm grupo de datos en 100 partes. Hay
99 percentiles, porque se requiere de 99 divisores para separar un grupo de datos en 100 partes. El n-simo
percentil es el valor tal que al menos 11 por ciento de los datos estn bajo ese valor y a lo sumo (100 - n)
por ciento estn arriba de ese valor. Especficamente, el percentil 87 es un valor tal que al menos 87%
de los datos estn abajo del valor y no ms de 13% estn arriba del valor. Los percentiles son valores en
escaln, como se ve en la figura 3.1, porque el percentil 87 y el percentil 88 no tienen percentil entre
ellos. Si el operador de una planta toma un examen de seguridad y 87.6% de las calificaciones del examen de seguridad estn abajo de la calificacin de esa persona, l o ella todava califican con slo el percentil 87, aun cuando ms de 87% de las calificaciones son menores.
Los percentiles se utilizan ampliamente para reportar resultados de pruebas. Casi todos los estudiantes de facultades o universidad han tomado el examen SAT, ACT, GRE o GMAT. En la mayor parte
de los casos, los resultados de estos exmenes se reportan en forma de percentil y tambin como calificaciones sin procesar. A continuacin se muestra un resumen de los pasos empleados para determinar
la ubicacin de un percentil.
i=....!:_(n)
100
donde:
P = el percentil de inters
i = ubicacin de percentil
n = nmero del conjunto de datos
lj@'l;!Jl ..
Percentiles en
escalera
1-----------------------l;ijiiiiiiii~-;pe:r:c.:n:t~ils8;1
1
percentil 86
percentil 87
= ~(1240) = 992
100
Como i = 992 es un nmero entero, siga las instrucciones del paso 3(a). El percentil 80 es el promedio del nmero 992 y el nmero 993.
p
_ (992 nmero
80 -
PROBLEMA DE
DEMOSTRACIN
3.2
+ 993
2
nmero)
Determine el percentil 30 de los siguientes ocho nmeros: 14, 12, 19, 23, 5, 13, 28, 17:
Soluci6n
Para estos ocho nmeros, deseamos hallar el valor del percentil 30, de modo que n
Primero, organizamos los datos en orden ascendente:
5
12
13
14
17
A continuacin, calculamos el valor de i.
19
23
= 8 y P = 30.
28
i=~(8)=2.4
100
Como i no es un nmero entero, debe usarse el paso 3(b). El valor de i + 1 es 2.4 + 1, o sea
3.4. La parte del nmero entero de 3.4 es 3. El percentil 30 est ubicado en el tercer valor. El tercer valor es 13, de modo que 13 es el percentil 30. Ntese que un percentil puede o no puede ser
uno de los valores de datos.
Cuartiles
Los cuartiles son medidas de tendencia central que dividen un grupo de datos en cuatro subgrupos o partes. Los tres cuartiles estn denotados como 01, 02 y 03 El primer cuartil, 01, separa el primer, o ms
bajo, cuarto de los datos de los tres cuartos ms altos y es igual al percentil 25. El segundo cuartil, 02,
separa el segundo cuarto de los datos del tercer cuarto. 02 est ubicado en el percentil 50 y es igual a la
mediana de los datos. El tercer cuartil, 03, divide los primeros tres cuartos de los datos del ltimo cuarto y es igual al valor del percentil 75. Estos tres cuartiles se muestran en la figura 3.2.
Suponga que desearnos determinar los valores de 01, 02 y Q3 para los siguientes nmeros.
106
109
114
116
121
122
O@i1tt1..
Cuartiles
primer un cuarto
primeros dos cuartos
primeros tres cuartos
125
129
53
2
El valor de Q1 es Pis= 111.5. Ntese que un cuarto, o dos, de los valores (106 y 109) son menores a 1115.
El valor de Q2 es igual a la mediana. Como el conjunto contiene un nmero par de trminos, la
mediana es el promedio de los dos trminos de en medio.
Q2 =mediana= (1 l6+121)
118.5
Ntese que exactamente la mitad de los trminos son menores a Q2 y la mitad son mayores a Q2
El valor de Q3 se determina con P75 como sigue:
i=~(8)=6
100
Como i es nmero entero, P75 es el promedio de los nmeros sexto y sptimo.
F5 = (122+125)
123.5
El valor de Q3 es P75 = 123.5. Ntese que tres cuartos, o seis, de los valores son menores a 123.5 y dos
de los valores son mayores a 123.5.
PROBLEMA DE
DEMOSTRACIN
3.3
Lo siguiente muestra ingresos de las principales organizaciones de publicidad del mundo, segn
Advertising Age. Determine el primero, segundo y tercer cuartiles para estos datos.
Organizecin publicitllri
Oficln matriz
WPP Group
lnterpublic Group of Cos.
Omnicom Group
Publicis Communication
Dentsu
Havas Adversiting
Grey Adversiting
Cordination Communications Group
Hakuhodo
Asatsu
TMP Worldwide
Carlson Marketing Group
lncepta Group
OigitasA
Tokyu Agency
Daiko Adversiting
Londres
Nueva York
Nueva York
Pars
Tokio
Pars
Nueva York
Londres
Tokio
Tokio
Nueva York
Minnepolis
Londres
Boston
Tokio
Tokio
8 165
7 981
7 404
4 770
2796
2733
1 864
1 175
874
396
359
356
248
236
204
203
Solucin
Para 16 organizaciones publicitarias, n = 16. 01 = P25 se encuentra con:
i=~(16)=
100
01
302
024.5
~se
o3-- 2 796+4
2
3.1
770
3 783
PROBLEMAS
3.1
Determine
2
3.2
3.3
3.4
345
3.8
243
444
524
199
682
44.5
31.6
40.0
52.8
38.8
30.1
78.5
-2
-3
-6
-7
-4
-5
-8
3.7
167
3.6
073
3.5
609
28
29
13
17
20
11
34
32
27
25
30
19
18
33
138
97
118
172
144
138
107
94
119
139
145
162
127
112
150
143
80
105
116
142
128
116
171
Los siguientes datos muestran el nmero de autos y camiones ligeros en un ao reciente entre los
principales fabricantes de autos en el mundo, reportados por AutoFacts, unidad de Coopers &
Lybrand Consulting. Calcular la media y mediana. Cul de estas medidas es la ms apropiada
para resumir los datos y por qu? Cul es el valor de Q2? Determine el percentil 63 para los datos.
Determine el percentil 29 para los datos.
CAPITUlo3
Pabricante
55
General Motors
Ford Motors
Toyota
Volkswagen
Chrysler
Nissan
Honda
Fiat
Peugeot
Renault
Mitsubishi
Hyundai
BMW
Daimler-Benz
Daewoo
3_9
ESTADISTICA DESCRIPTIVA
7 880
6 359
4 580
4161
2 968
2646
2 436
2 264
1 767
1 567
1 535
1 434
1 341
1 227
898
La siguiente es una lista de los principales bancos del mundo clasificados por activos segn
Banco
Citigroup (Nueva York)
Deutsche Bank (Frankfort)
Bank of Tokio-Mitsubishi
J. P. Morgan Chase (Nueva York)
UBS (Zurich)
HSBC Holdings (Londres)
BHV AG (Munich)
BNP-SG-Paribas(Pars)
BankAmerica (Charlorte)
ING NV (Amsterdam)
902
873
721
715
674
673
654
652
642
613
3.10 La siguiente es una lista del nmero de accidentes mortales por aerolnea comercial de vuelos
regulares en un periodo de 17 aos, segn la Air Transportation Association of America. Con
estos datos, calcular la media, la mediana y la moda. Cul es el valor del tercer cuartil? Determine
56 ESTADISTICA EN WS NEGOCIOS
La figura 3.3 muestra estas tres distribuciones en las que la media de cada distribucin es la misma
(. = SO) pero las variabilidadesdifieren. La observacin de estas distribuciones muestra que una medida de variabilidad es necesaria para complementar el valor medio al describir los datos. Los mtodos
de las medidas de variabilidad de clculo difieren para datos no agrupados y agrupados. Esta seccin se
concentra en siete medidas de variabilidad para datos no agrupados: rango, rango intercuartil, desviacin media absoluta, varianza, desviacin estndar, valor de Z y coeficiente de variacin.
Rango
El rango es la diferencia entre el valor ms grande de un conjunto de datos y el valor ms pequeo. Aun
cuando por lo general es un solo valor numrico, algunos investigadoresde negocios definen el rango
como el par ordenado de nmeros ms grande y ms pequeo (ms pequeo, ms grande). Es una
medida burda de variabilidad que describe la distancia a los lmites exteriores del conjunto de datos.
Reflejaesos valores extremos porque se construye a partir de ellos. Una ventaja del rango es su facilidad de clculo. Un uso importante del rango es en aseguramiento de la calidad, donde el rango se
emplea para construir grficas de control. Una desventaja del rango es que, como se calcula con los
valores que estn en los extremos de los datos, stos son afectados por los valores extremos. Por tanto,
su aplicacin como medida de variabilidad es limitada.
Los datos del la tabla 3.1 representan los precios ofrecidos para las 20 principales ofertas pblicas
inicialesde Estados Unidos en un ao reciente. El precio ms bajo de oferta es de $7.00 y el ms alto de
$43.25. El rango de los precios ofrecidos se puede calcular como la diferencia de los valores ms alto y
ms bajo:
Rango = Ms alto - Ms bajo = $43.25 - $7.00 = $36.25
Rango intercuartil
Otra medida de variabilidad es el rango intercuartil.El rango intercuartil es el rango de valores entre el
primero y tercer cuartiles. En esencia, es el rango de 50% central de los datos y se determina al calcular
el valor de <2J - Q1 El rango intercuartil es especialmente til en situaciones donde los usuarios de
datos estn ms interesados en valores hacia el medio y menos interesados en los extremos. Al describir un mercado de viviendas, los corredores de bienes races podran usar el rango intercuartil como
medida de precios de viviendas cuando describan la mitad media del mercado a compradores interesados en casas con valoresde rango medios. Adems, el rango intercuartil se utiliza en la construccin
de grficas de caja y bigote.
RANGO INTERCUARTII.
Los siguientes datos indican los 15 principales socios de Estados Unidos por exportaciones de ese
pas a otros pases en un ao reciente, segn la U.S. Census Bureau.
Exportaciones
Pas
Canad
Mxico
Japn
Reino Unido
Corea del Sur
Alemania
Taiwn
Pases Bajos
Singapur
Francia
Brasil
Hong Kong
Blgica
China
Australia
($miles de millones)
$151.8
71.4
65.S
36.4
25.0
24.S
20.4
19.8
17.7
16.0
15.9
15.1
13.4
12.9
12.1
Tres distribuciones
con la misma
media pero
diferentes
dispersiones.
, = 50
Cul es el rango intercuartil para estos datos? El proceso empieza al calcular los cuartiles primero y tercero como sigue:
Despejando Q1 = P25 cuando n = 15:
25
.
i=-(15)=3.75
100
Como i no es un nmero entero, entonces P25 es el cuarto trmino desde abajo.
Q = P2s = 15.1
Al despejar Q3 = P75:
i=~(l5)=11.25
100
Como i no es un nmero entero, se encuentra que P75 es el trmino 12 desde abajo.
..
Jid.!(ii[!.ijll"fjliJ+Ii!.illi!!.t..
Estaclfsticasde telecomunicaciones
Un estudio realizado ,por Telework America patrocinado
por AT&T en 2001 revel que 28 millones de estadounidenses trabajan por computadora a distancia (teletrabajo).
De stos, 24.1% trabajan de viaje, 21.7% trabajan fuera de
sus casas, 7.5% trabaja en centros de trabajo a distancia y
4.2% trabajan en oficinas por satlite. Ms de 40% de estas
personas trabajan en ms de un lugar. Se estima que 30
millones de teletrabajadores estarn laborando en Estados
Unidos para finales de 2004.
El teletrabajador tpico vive en el Oeste o el Noreste, es
hombre, tiene educacin universitaria, tiene entre 35 y 44
aos de edad, es casado y gana por lo menos $40 mil al ao.
El ingreso medio para teletrabajadores es de S44 mil. La
mayora de ellos trabajan en impuestos {IT), bienes ralees o
administracin de empresas. Los teletrabajadores, por lo
general, viajan en automvil unas 18 millas al trabajo y
ahorran casi 53 minutos de tiempo de viaje cada da de trabajo hbil en que laboran a distancia. En promedio, trabajan uno o dos dlas por semana fuera de casa.
Los teletrabajadores estn relativamente satisfechos
con su trabajo. Setenta y cinco por ciento de quienes traba-
jan en casa reportaron un ingreso cuantificable, en productividad y calidad de trabajo, cuando cambiaron de trabajos
tradicionales en oficinas a trabajar a distancia. Dos tercios
de teletrabajadores expresaron ms satisfaccin en su trabajo y dicen que lo hacen ms horas que quienes no trabajan a distancia, pero que sus trabajos interfieren menos con
sus vidas personales.
Trabajar a distancia puede ahorrar costos para las
empresas debido a que no hay ausentismo, disminucin de
costos en bienes ralees y que el trabajo se con sen-a por mS
tiempo. Se estima que empicados que trabajan a dstaDcia
pueden ahorrar a sus empleadores un promedio de SIO
cada uno al disminuir el ausentismo y cansen-ar ms txm
po el trabajo. Los costos de bienes races se pueden reduru
de 25 a 90%. AT&T ahorra $3 mil anualmente por trXa3bajador y $25 millones al ao en costos de bienes r2icrS por
empleados que son de tiempo completo.
,,...,.te;
adaptado de YouCanWorkfromAn)~
a>m
......,.
ycwfa.comnfoccntcrrfacts.htm; Ioni Kislntt "A=w! Sar....... ~
Dcbunk Telework Mvths~ Na. l\\rrm :!9 do< oad!re do< _ 1 m
http://www.nwfusion.c~m/nct.worhr rolummsul!OC ~h!ml.
5
9
16
17
18
Ex=65
Ex
65
tt=-=5=13
Cul es la variabilidad en estas cinco semanas de datos? Una forma en la que el propietario
comience a ver la dispersin de los datos es restando la media de cada uno de los datos. Restar la media
a cada valor de datos da la desviacin respecto a la media (x - ,). La tabla 3.2 muestra estas desviaciones para la produccin de computadoras. Ntese que algunas desviaciones respecto a la media son
positivas y algunas son negativas. La figura 3.4 muestra que geomtricamente estas desviaciones negativas representan valores que estn abajo (a la izquierda) de la media y las desviaciones positivas representan valores que estn arriba (a la derecha) de la media.
Un examen de desviaciones respecto a la media puede revelar informacin sobre la variabilidad de
datos. No obstante, las desviaciones se utilizan casi siempre como herramienta para calcular otras medidas de variabilidad. Ntese que en la tabla 3.2 y en la figura 3.4, el total de estas desviaciones es cero.
Este fenmeno se aplica a todos los casos. Para un conjunto de datos dado, la suma de todas las desviaciones respecto a la media aritmtica es siempre cero.
T~BLA 3.2
Nthncro(x)
Desviaciones de
la media para
produccin de
computadoras
l:x =
5-13 = -8
9-13 = -4
16
16-13+3
17
17-13 = +4
18-13=+5
1!
I.(x- )=O
65
-8
Distancias
geomtricas desde
la media (de la
tabla 3.2)
-4
13
16 17 18
LA SUMA DE DESVIACIONES
RESPECTO A LA MEDIA
ARITMETICA ES SIEMPRE CERO
I(x-
59
)=o
Esta propiedad exige considerar los modos alternativos para obtener medidas de variabilidad.
Una forma obvia para forzar la suma de desviaciones para que tenga un total diferente de cero es
tomar el valor absoluto de cada desviacin alrededor de la media, con lo cual es posible despejar la desviacin media absoluta.
La desviacin media absoluta (MAD) es el promedio de los valores absol11tos de las desviaciones alrededor de la media para un conjunto de nmeros.
DESVIACIN MEDIA
ABSOLUTA
MAD
= Elx - I
N
Con el uso de los datos de la tabla 3.2, el propietario de la compaia de computadoras puede calcular una desviacin media absoluta al tomar los valores absolutos de las desviaciones y prornediarlos,
como se muestra en la tabla 3.3. La desviacin media absoluta para los datos de produccin de computadoras es 4.8.
Debido a que se calcula con el uso de valores absolutos, la desviacin media absoluta es menos til
en estadstica que otras medidas de dispersin. No obstante, en el campo de pronsticos, se usa ocasionalmente como medida de error.
Varianza
Como los valores absolutos no conducen a una manipulacin fcil, expertos en matemticas crearon
un mecanismo alternativo para superar la propiedad de sumacero de desviaciones desde la media. Este
mtodo utiliza el cuadrado de las desviaciones a partir de la media. El resultado es la varianza. una
importante medida de variabilidad.
La varianza es el promedio del cuadrado de desviaciones alrededor de la media aritmtica para un
conjunto de nmeros. La varianza de poblacin est denotada por u2.
1 VARIANZA POBLACIONAL
E(x-1)2
u=----
La tabla 3.4 muestra los nmeros de produccin original para la compaa de computadoras, las
desviaciones desde la media y el cuadrado de desviaciones desde la media.
La sama del cuadradode las desviaciones alrededor de la media de un conjunto de valores -Ilamada
suma de cuadrados de x y a veces abreviada como SS,,- tiene amplio uso en estadfstica. Para la compaa de computadoras, este valor es 130. Al dividirlo entre el nmero de valores de datos (5 semanas)
se obtiene la varianza para la produccin de computadoras.
u2
TABLA 3.3
Desviacin de
media absoluta
(MAD) para datos
de produccin de
computadoras
j%-I'!
%-p.
+8
-8
-4
16
+3
+3
17
+4
+4
+S
+5
l:x - 65
I(x -
) = o
MAD = ~=
+4
Ijx24
j = 24
= 4.8
=~=
5
26.0
a que la varianza
de unidades
se calcula
desde el cuadrado
de medida
cuadradas.
de desviaciones,
el resultado
final se expre
das en unidades cuadradas; considere, por ejemplo, a Mattel Toys tratando de interpretar costos de
produccin en trminos de dlares al cuadrado o medir la variacin de produccin de Troy-Bilt en trminos del cuadrado de podadoras de pasto. Por tanto, cuando se usa como medida descriptiva, l.
varianza puede ser considerada como un clculo intermedio en el proceso de obtener la desviacin
estndar muestral.
Desviacin estndar
La desviacin estndar es la una medida de variabilidad preferida. Se utiliza como entidad separada v
como parte de otros anlisis, por ejemplo para calcular intervalos de confianza y en pruebas de hiptesis (vanse los captulos 8, 9 y 10).
DESVIACIN
ESTNDAR
POBLACIONAL
a=~E(x~)z
TABLA 3.4
Clculo de
la varianza y la
desviacin
estndar de los
datos de
produccin de
computadoras
s
9
16
17
!!
I.x = 65
" --8"
lx- "'
64
-4
+3
+4
+5
!(x- )=O
16
9
16
~
!(x - )2 = 130
SSx-= !(x- )2
130
-=ieg1a emprica
:iara una y dos
iJeSViaciones
estndar de precios
oe gasolina
61
68%
-la
+la
$1.26
$1.42
.=$1.42
u =S0.08
B
Regla emprica
La regla emprica es una importante regla prctica que se usa para expresar el porcentaje aproximado
que est dentro de un nmero dado de desviaciones estndar desde la media de un conjunto de datos, si los
datos estn distribuidos normalmente.
La regla emp[rica se usa slo para tres veces la desviacin estndar: lo, 20' y 30'. En el captulo 6 se
presenta un anlisis detallado de otros nmeros de valores cr, tambin en el capitulo 6 se estudia con
mayor detalle la distribucin normal, distribucin simtrica unimodal que tiene forma de campana (o
montlculo). El requisito de que los datos estn normalmente distribuidos tiene alguna tolerancia y la
regla emprica por lo general aplica mientras los datos tengan forma aproximada de montculo.
REGIA
EMPlR.JCA
.. Con base en la suposicin de que los datos estn aproximadamente distribuidos de manera aproximada.
Si un conjunto de datos est normalmente distribuido, o tiene forma de campana, cerca de 68'!1. de
los valores de datos estn dentro de una desviacin estndar de la media, 95% estn dentro de dos de5'713ciones estndar, y casi 100% estn dentro de tres desviaciones estndar.
Supongamos que un informe reciente expresa que, para California, el precio promedio a nivel $atal de un galn de gasolina de tipo regular es de $1.42. Supongamos tambin que los precios de gasolina regular variaron en el estado con una desviacin estndar de $0.08 y estuvieron norrnalmente
distribuidos. Segn la regla emprica, alrededor de 68% de los precios deber[an caer dentro de
1:,
o $1.42 :!: 1($0.08). Ms o menos 68% de los precios estaran entre $1.34 y $1.50, como se ve en b ~
3.SA. Alrededor de 95% debera caer dentro de. :!: 20' o $1.42 :!: 2($0.08) = $1.42 S0.16, o sea=
$1.26 y $1.58, como observa en la figura 3.58. Casi todos los precios de gasolina regular (99.# )dmeran caer entre $1.16 y $1.66 (. :!: 3u).
Ntese que 68% de los precios de gasolina caen dentro de una desviacin estndar~
de la
media, alrededor de 32% estn fuera de este rango. Como la distribucin normal es smEtria, ~::'.
puede dividirse a la mitad de la moda que 16% se encuentre en cada cola de la <furribocin. Ezr..onco,
alrededor de 16% de los precios de gasolina deben ser menores a $1.34 y ms o menos 169& de los precios deben ser mayores a $1.50.
Normalmente, numerosos fenmenos estn distribuidos en forma de campana. ~
la mayorfa de las caractersticas humanas como son la estatura y el peso; por tanto, la regla emprica se aplica
en muchas situaciones y se usa ampliamente.
PROBLEMA DE
DEMOSTRACIN
3.4
Una compaa produce una vlvula ligera que est especificada para pesar 1365 gramos. Por
desgracia, debido a imperfecciones en el proceso de manufactura, no todas las vlvulas producidas tienen un peso exacto de 1365 gramos. De hecho, los pesos de las vlvulas producidas
estn normalmente distribuidos con un peso medio de 1365 gramos y una desviacin estndar
de 294 gramos. Dentro de qu rango caeran alrededor de 95% de los pesos de vlvulas?
Aproximadamente
16% de los pesos seran mayores que cul valor? Aproximadamente 0.15%
de los pesos seran menores a qu valor?
Soluci6n
Debido a que los pesos de las vlvulas estn normalmente distribuidos, aplica la regla emprica.
Segn sta, casi 95% de los pesos caeran dentro de. 2u = 1365 2(294)= 1365 588. As,
casi 95% deberan caer entre 777 y 1953. Aproximadamente 68% de los pesos deberan caer dentro de. 1uy 32% debera caerfuera de este intervalo. Debido a que la distribucin normal es
simtrica, cerca de 16% debera estar arriba de. 1u =1365 + 294 = 1659. Casi 99.7% de los
pesos deberan caer dentro de. 3u y 0.3% deberan caer fuera de este intervalo. La mitad de
esto ltimo; es decir, 0.15%, debera estar abajo de. - 3u = 1365 - 3(294)= 1365 - 882 = 483.
Teorema de Chebyshev
La regla emprica aplica slo cuando se sabe que los datos estn normalmente distribuidos de manera
aproximada. Qu utilizan los investigadores cuando los datos no estn normalmente distribuidos o
la forma de la distribucin es desconocida? El teorema de Chebyshev aplica a todas las distribuciones cualquiera que sea su forma y por tanto se puede usar siempre que la forma de la distribucin de
datos sea desconocida o sea anormal. Aun cuando el teorema de Chebyshev puede en teora aplicarse
a datos que estn normalmente distribuidos, la regla emprica es ms conocida y se prefiere siempre que sea apropiado. El teorema de Chebyshev no es una regla prctica, como es la regla emprica,
sino que ms bien se presenta en formato de frmula y, por tanto, se puede aplicar con ms amplitud.
El teorema de Chebyshcv expresa que por menos 1 - lfk2 valores caern dentro de ::!:k desviaciones
CHEBYSHEV
proporcin de valores.
Suposicin: k > 1
Especficamente, el teorema de Chebyshev dice que al menos 75% de todos los valores estn dentro de ::!:2a de la media, cualquiera que sea la forma de una distribucin, porque si k = 2 entonces 1 lfk2 = 1 - 1/22 = 3/4 = .75. La figura 3.6 da una ilustracin grfica. En contraste, la regla emprica
expresa que si los datos estn normalmente distribuidos 95% de todos los valores estn dentro de, ::!:
2a. De acuerdo con el teorema de Chebyshev, el porcentaje de valores dentro de tres desviaciones estndar de la media es por lo menos 89%, en contraste con 99.7% para la regla emprica. Como se usa una
frmula para calcular proporciones con el teorema de Chebyshev, se puede usar cualquier valor de k
mayor a 1 (k > 1). Por ejemplo, si k = 2.5, al menos 0.84 de todos los valores estn dentro de,::!: 2.5a,
porque 1 - l/k2 = J - 1/(2.5)2 = 0.84.
Aplicacin del
teorema de
Chebyshev 'para
dos desviaciones
estndar
.
PROBLEMA DE
IOEMQSTRACIN
3.5
63
.15
= k2
.85
Al despejar k se obtiene:
1
k2 = 6.667
k
2.58
El teorema de Chebyshev dice que al menos 0.85 de los valores estn dentro de 2.58ude
la media. Para = 28 y u = 5, al menos 0.85 o sea 85% de los valores estn dentro de 28
2.58(5) = 28 12.9 aos de edad o entre 15.1 y 40.9 aos.
E(x-x)2
=----
MUESTRAL
s2
DESVIACIN
ESTNDAR
MUESTRAL
s= ~E(x-~)2
n-1
n-1
A continuacin aparece una muestra de seis de los principales despachos de contadores en Es:aOas
Unidos y el nmero de socios relacionados con cada empresa, segn reporta el Pubtu: .'\ll==~
Repon.
Empresa
PriccWaterhouse
McGladrey & Pullcn
Dcloitte & Touche
Andcrscn Worlwide
Coopers & Lybrand
800 Seidrnan
Nmero de socios
1062
381
1 719
1673
1 277
217
1062
381
1719
1673
1277
217
Ex= 6329
(x-x)2
51.41
454 046.87
441 121.79
382 134.15
49 359.51
701959.11
E(x-x)2 = 2 028 672.84
x = 6 329 = 1 054.83
6
405 734.57
Al sustituir de estas expresiones equivalentes, en las frmulas originales para varianza y desviacin
estndar, obtenemos las siguientes frmulas de clculo breve.
FORMULA
Ex2- (Ex)2
COMPUTACIONAL
PARA VARIANZA Y
DESV1ACI0N
ESTANDAR
<12=
<1=
FORMULA
COMPlITACIONAL
PARA VARIANZA
52
MUESTRALY
DESV1ACI0N ESTANDAR
,;;
Ex2 - (Ex)2
n
n-1
s=f1
Estas frmulas de clculo breve utilizan la suma de los valores x y la suma de los valores x2 en lugar
de la diferencia entre la media y cada valor y desviaciones calculadas. Antes de que se usaran las calculadoras, este mtodo por lo general era ms rpido y fcil que usar las frmulas originales.
Para situaciones en las que la media ya est calculada o se da, las formas alternativas de estas
frmulas son:
(12
Ex2-N2
s2
Ex2 -n(x)2
n-1
TABLA 3.5
Calculos de frmula
de clculo breve de
varianza y
desviacin
estndar para
datos de
produccin de
computadoras
25
81
16
256
17
289
324
!!
"Ix= 65
.. 975
975 (65)l
5 "" 975-845
5
5
u=v'6 .. 5.1
"2
= !!!. = 26
5
Con el uso del mtodo de clculo breve, el propietario de la compaia que inicia la produccin de
computadoras puede calcular una varianza poblacional y desviacin estndar para los d tos de produccin, como se ve en la tabla 3.5. (Compare estos resultados con los de la tabla 3.4.)
PROBLEMA DE
DEMOSTRACIN
3.6
Es posible medir la efectividad del fiscal de un distrito judicial por medio de varias vari bles, incluyendo el nmero sentencias por mes, el nmero de casos manejados por mes y el mero total
de aos de sentencias por mes. Una investigadora utiliza una muestra de cinco fisc es de distrito
en una ciudad y determina el nmero total de aos de sentencia que cada fiscal g contra acusados durante el mes pasado, como se reporta en la primera columna de las siguientes tablas.
Calcule la desviacin media absoluta, la varianza y la desviacin estndar para estas cifras.
Solud6n
La investigadora calcula la desviacin media absoluta, la varianza y la desviacin estndar para
estos datos en la forma siguiente:
lx-Xj
55
100
125
140
___Q.
I:x=480
x=
41
4
29
44
I:lx-Xj = 154
I:x =
48
(x-x)2
1 681
16
841
1 936
1 296
I:(x-x )2 = 5 770
=96
154
= 30.8
5
5
s2 = :10 = 1 442.5 y s = ~
MAD =
= 37.98
A continuacin, utiliza frmulasde clculo breve para despejar 52 y s para comparar los resul!Mb..
x'-
55
100
125
140
60
Ex=480
. s=
3 025
10 000
15 625
19 600
3 600
Ex2 = 51 850
(480)2
51 05o--4
66
ESTADISTICA
EN LOS NEGOCIOS
Los resultados son los mismos. La desviacin estndar muestra! obtenida por ambos mtodos
es 37.98 o sea 38 aos.
Valores z
Representan el nmero de desviaciones estndar que un valor (x) est arriba o abajo de la media de un
conjunto de nmeros cuando los datos estn normalmente distribuidos. Al utilizar el valor z es posible
transformar la distancia bruta de un valor de la media en unidades de desviacin estndar.
z=x-
a
1 VAWRESz
Para muestras:
x-x
Z=--
Si un valor z es negativo, el valor sin procesar (x) est abajo de la media. Si el valor z es positivo, el
valor sin procesar (x) est arriba de la media.
Por ejemplo, para un conjunto de datos que est normalmente distribuido con una media de 50 y
una desviacin estndar de 10, supongamos que un experto en estadstica desea determinar el valor z
para uno de 70, el cual seria (x = 70) que est 20 unidades arriba de la media, de modo que el valor
zes:
z= 70-50 =+2.00
10
Este valor z significa que 70 est dos desviaciones estndar arriba de la media. Cmo se interpreta el valor z? La regla emprica expresa que 95% de todos los valores estn dentro de dos desviaciones
estndar desde la media si los datos son aproximados y distribuidos en forma normal. La figura 3.7
muestra cmo el valor de 70 est dos desviaciones estndar arriba de la media (z = +2.00) 95% de
los valores estn entre 70 y el valor (x = 30), que est dos desviaciones estndar abajo de la media o
= = (30-50)/10 = -2.00. Como 5% de los valores estn fuera del rango de dos desviaciones estndar
desde la media y la distribucin normal es simtrica, 21/2% {1/2 del 5%) estn abajo del valor de 30.
Entonces 9"'1/1% de los valores estn abajo del valor de 70. Como el valor z indica el nmero de desviaciones estndar que tiene un valor individual de datos respecto a la media, la regla emprica se puede
expresar tambin en trminos del valor z.
Entre z = -1.00 y z = + 1.00 son aproximadamente
Entre z = -2.00 y z = +2.00 son aproximadamente
Entre z = - 3.00 y z = + 3.00 son aproximadamente
Coeficiente de variacin
El coeficiente de variacin es un estadstico dado por la razn entre la desviacin estndar y la media
CV=~(lOO)
!1@1!1-ii ..
Porcentaje de
descomposicin de
estadsticas. Dos
desviaciones
estndar desde la
media
. =50
z =O
=30
z =-2.00
=70
z = +2.00
us (100) =
P.B
3 3
13
3.2 PROBLEMAS
3.11 Un conjunto de datos contiene los siguientes siete valores:
6
a. Encuentre el rango.
b. Encuentre la desviacin media absoluta.
c. Encuentre la varianza poblacional.
d. Encuentre la desviacin estndar poblacional.
68
e.
a. Encuentre el rango.
b. Encuentre la desviacin media absoluta.
c. Encuentre la varianza muestra].
d. Encuentre la desviacin estndar muestral.
e. Encuentre el rango intercuartil.
3.13 Un conjunto de datos contiene los siguientes seis valores:
12
23
19
26
24
23
a. Encuentre la desviacin estndar poblacional con el uso de la frmula que contenga la media
(la frmula original).
b. Encuentre la desviacin estndar poblacional con el uso de la frmula de clculo breve.
c. Compare los resultados. Qu frmula fue ms rpida de usar? Qu frmula prefiere usted?
Por qu piensa usted que la frmula de clculo breve se conoce a veces como la frmula de
"mtodo breve"?
3.14 Utilice su calculadora o computadora para encontrar la varianza muestral y desviacin estndar
muestra! de los siguientes datos:
57
88
68
43
93
63
51
37
77
83
66
60
38
52
28
34
52
60
57
29
92
37
38
17
67
3.15 Utilice su calculadora o computadora para hallar la varianza poblacional y desviacin estndar
poblacional para los siguientes datos:
123
090
546
378
392
280
179
601
572
953
749
075
303
468
531
646
18
39
40
59
46
59
37
15
73
23
19
90
58
35
82
14
38
27
24
71
25
39
84
70
3.17 Segn el teorema de Chebyshev, al menos qu proporcin de los datos estarn dentro de.:!: ka
para cada valor de k?
a. k = 2
b. k = 2.5
c. k = 1.6
d. k = 3.2
3.18 Compare la variabilidad de los siguientes dos conjuntos de datos al usar tanto la desviacin
estndar como el coeficiente de variacin:
Conjunto 1 de datos
Conjunto 2 de datos
49
159
82
121
77
138
54
152
3.19 Una muestra de 12 pequeos despachos de contadores deja ver los siguientes nmeros de profesionales por oficina:
7
10
14
ti
12
13
306
286
262
215
172
162
148
145
a. Encuentre el rango.
b. Encuentre la desviacin media absoluta.
c. Encuentre la varianza poblacional.
d. Encuentre la desviacin estndar poblacional.
e. Encuentre el rango intercuartil.
f. Encuentre el valor z para Nestl.
g. Encuentre el coeficiente de variacin.
3.21
3.22 Algunos nmeros no estn normalmente distribuidos. Si la media de los nmeros es 38 y la desviacin estndar es 6, qu proporcin de valores caera entre 26 y 50? Qu proporcin devalores caera entre 14 y 62? Entre cules dos valores caera 89% de los valores?
3.23 Segn el teorema de Chebyshev, cuntas desviaciones estndar desde la media incluiran pw lo
menos 80% de los valores
3.24 El tiempo necesario para ensamblar una pieza particular de mueble con experiencia
DIXmalmente distribuida con un tiempo medio de 43 minutos. Si 68% de los tiempos de~
estn entre 40 y 46 minutos, cul es el valor de la desviacin estndar? Suponga que 99.IS de b
tiempos de ensamble estn entre 35 y 51 minutos y la media es todava de 43 =~~sena
ahora el valor de la desviacin estndar? Suponga que el tiempo necesario para ~
o=-a
pieza de mueble no est normalmente distribuida y que el tiempo medio de ~
es :.S
minutos. Cul es la desviacin estndar si al menos 77% de los tiempos de ~
csn
24 y 32 minutos?
3.25 Los ambientalistas estn preocupados por las emisiones de dixido de azufre a la atmsfera. El
nmero promedio de dlas por ao en el que los niveles de dixido de azufre excede de 150 miligramos por metro cbico en Miln, Italia, es 29. El nmero de dias por ao en que se exceden los
limites de emisin est normalmente distribuido con una desviacin estndar de 4.0 ellas. Qu
porcentaje de los aos promediara entre 21 y 37 dias de exceso de emisiones de dixido de azufre? Qu porcentaje de los aos excederla de 37 dias? Qu porcentaje de los aos excederla de 41
dias? En qu porcentaje de los aos habra menos de 25 das con exceso de emisiones de dixido
de azufre
3.26 La Runzheimer Cuide publica una lista de las ciudades menos costosas en el mundo para agentes
viajeros. A continuacin aparece una lista de las 10 ciudades menos costosas con sus respectivos
costos de gastos de viaje. Utilice esta lista para calcular el valor z para Bordeaux, Montreal,
Edmonton y Hamilton. Trate esta lista como una muestra.
Ciudad
Hamilton, Ontario
97
London, Ontario
109
Emonton, Alberta
111
Jakarta, Indonesia
118
Ouawa
120
Montreal
130
132
Winnipeg. Manitoba
133
Bordeaux, Francia
137
Bangkok, Thailand
137
Media
Para datos no agrupados, la media se calcula al sumar los valores de datos y dividir entre el nmero de
valores. Con datos agrupados, los valores especificas son desconocidos. Qu se puede usar para representar los valores de datos? El punto medio de cada intervalo de marca de clase se utiliza para representar todos los valores en un intervalo de clase. Este punto medio es valorado por la frecuencia de
valores en ese intervalo de clase. La media para datos agrupados se calcula entonces al sumar los productos del punto medio de clase y la frecuencia para cada clase y dividir esa suma entre el nmero total
de frecuencias. A continuacin aparece la frmula para la media de datos agrupados.
MEDIA DE DATOS
AGRUPADOS
donde:
i = el nmero de clases
f=
frecuencia de clase
N = total de frecuencias
TABLA 3.6
Distribucin de frecuencias de
os porcentajes de desempleo
en Francia
Intervalo
de clase
Frecuencia
I-rncnor de 3
16
3-menor de 5
s-menor de 7
--menor de9
9-menor de 11
Ll-menor de 13
il
La tabla 3.6 proporciona la distribucin de frecuencias de los porcentajes de desempleo de Francia de la tabla 2.2. Para hallar la media de estos datos, necesitamos !._(y !.~f.
El valor de 'if se puede determinar al sumar los valores de la columna de frecuencia.. Para
calcular 'ifM, debemos determinar primero los valores de M, o la marca de clase. A continuacin multiplicamos cada una de estas marcas de clase por la frecuencia en ese intervalo de clase, f, resultando en JM. Sumar estos valores de fM da el valor de 'ifM.
La tabla 3.7 contiene los clculos necesarios para determinar la media de grupo. La
media de grupo para los datos de desempleo es 6.25. Recuerde que como cada intervalo de
clase fue representado por la marca de clase en lugar de los valores reales, la media de grupo
es slo aproximada .
Moda
La moda para datos agrupados es la marca de clase de la clase modal. La clase modal es el
intervalo de clase con la frecuencia ms grande. Con el uso de los datos del cuadro 3.7,
el intervalo de clase 1-menor de 3 contiene la frecuencia ms grande, 16. Entonces, la clase modal
es 1-menor de 3. La marca de clase de esta clase modal es 2. Por tanto, la moda para la distribucin de
frecuencias mostrada en la tabla 3.7 es 2. El porcentaje de desempleo modal es 2 por ciento.
Medidas de variabilidad
Aqu se presentan dos medidas de variabilidad para datos agrupados: la varianza y la desviacin estn. dar. De nueva cuenta, la desviacin estndar es la raz cuadrada de la varianza. Ambas medidas tienen
frmulas originales y de clculo breve.
FORMULAS PARA
Frmula original
VARIANZA
POBLACIONALY
DESVIACIN
ESTNDARDE
DATOS
AGRUPADOS
L,f(M-)2
a-----N
a=,W
donde:
f = frecuencia
M = punto medio de clase
N = 'if o frecuencias totales de la poblacin
. = media agrupada para la poblacin
TABLA 3.7
Clculo de media
agrupada
Intervalo de clase
1- menor de 3
Frecuencia
(!)
3- menor de 5
5- menor de 7
11- menor de 13
24
24
10
90
..i
12
7- menor de 9
9- menor de 11
fM
32
16
~f= N= 40
'2:.JM 250
=--=-=6.25
'2:.
40
..11.
!./M = 250
TABLA 3.8
Clculo de varianza
agrupada y
desviacin
estndar con la
frmula original
/M M-p
/(11-1'>1
l-menorde3
16
32
-4.25
18.063
3-menorrkS
-2.25
S.063
10.126
S-menorde7
24
-0.lS
0.063
0.252
7-meoordc9
24
1.75
3.063
9.189
9- menor de 11
10
90
3.75
14.063
126.567
..!
12
5.75
33J>63
Intern1o de da.e
11-menor de 13
.n
IJM= 250
If-N= 40
=
,, =
(M-p)'A
289.00S
.!2!:m..
I/(M - )l = 633.520
250
=-=6.25
'i.f
4Q
=~
40
= 15.838
. f
TABLA 3.9
Clculo de varianza
agrupada y
desviacin
estndar con la
frmula de clculo
breve
32
5-menorde7
24
7- meoorde9
24
192
9-mmorde 11
10
90
900
12
f=N=
64
32
. 144
72
fM= 250
40
u= \
FRMULAS PARA
3-menordrS
11- menor de 13
VARIANZA
MUESTRALY
DESVIACIN
ESTNDAR DE
DATOS
AGRUPADOS
fMZ
fJl
l-menorde316
864
fW
= 2196
40
40
15.838 = 3.980
Frmula original
s2
2
= E/(M-x)
n-1
s=N
donde:
f=
frecuencia
Por ejemplo, calculemos la varianza y desviacin estndar de los datos agrupados de desempleo en
Francia como una distribucin de frecuencias en la tabla 3.6. Si los datos se tratan como poblacin, los
clculos son como sigue:
Para la frmula original, los ckulos se muestran en la tabla 3.8. El mtodo para determinar a2 y
u al usar la frmula de clculo breve se muestra en la tabla 3.9. En cualquier caso, la varianza de los
datos de desempleo es de 15.838 (cuadrado de porcentaje) y la desviacin estndar es de 3.98%. Al igual
'3
que con el clculo de la media agrupada, la marca de clase se utiliza para representar todos los valores
en un intervalo de clase. Este mtodo puede o no ser aproximado, dependiendo de si el valor promedio en una clase est en el punto medio. Si esta situacin no ocurre, entonces la varianza y desviacin
estndar son slo aproximaciones. Debido a que la estadstica agrupada se calcula por lo general sin
conocer los datos reales, este clculo es slo aproximado.
PROBLEMA DE
DEMOSTRACIN
3.7
Calcule la media, moda, varianza y desviacin estndar en los siguientes datos muestrales:
Intervalo de clase
Frecuencia
10- menor de 15
15- menor de 20
20- menor de 25
25- menor de 30
30- menor de 35
35- menor de 40
40- menor de 45
45- menor de 50
6
22
35
29
16
8
4
2
Soluci6n
La media se calcula como sigue:
Clase
10- menor de
15- menor de
20- menor de
25- menor de
30- menor de
35- menor de
40- menor de
45- menor de
15
20
25
30
35
40
45
50
H=n=
6
22
35
29
16
8
4
2
122
12.5
17.5
22.5
27.5
32.5
37.5
42.5
47.5
fM
75.0
385.0
787.5
797.5
520.0
300.0
170.0
95.0
HM=3130.0
M
6
22
35
29
16
8
4
2
U= n= 122
12.5
17.5
22.5
27.5
32.5
37.5
42.5
47.5
Ef(M-x)2
52 =
n-1
s = .Js1.11=7.56
M-x
(M-X)2
-13.16
-8.16
-3.16
1.84
6.84
11.84
16.84
21.84
173.19
66.59
9.99
3.39
46.79
140.19
283.59
476.99
f(M-Xl2
1 039.14
1 464.98
349.65
98.3.
7~
1121..:::
1 13.!3':
=-=- =::
:H(M-W=
6910.58 =57.11
121
::
:L:iii!
usamos
la frmula
de clculo
breve.
Clase
101520253035-
menor de 15
menor de 20
menor de 25
menor de 30
menor de 35
menor de 40
40- menor de 45
45- menor de 50
6
22
35
29
16
8
4
2
U= n = 122
; fM2 _ (E fM)2
n
=
n-1
5 = ,/57 .11 = 7 .56
s2
12.5
17.5
22.5
27.5
32.5
37.5
42.5
47.5
fM
75.0
385.0
787.5
797.5
520.0
300.0
170.0
95.0
IfM= 3130.0
87 212.5-
fM2
937.50
6 737.50
17 718.75
21 931.25
16 900.00
11 250.00
7 225.00
4 512.50
IfM2 = 87 212.50
(3 130l2
122
121
6 910.04
121
= 57.11
3.3 PROBLEMAS
3.27 Calcule la media y la moda para los siguientes datos:
Clase
O- menor de 2
2- menor de 4
4- menor de 6
6- menor de 8
8- menor de JO
JO- menor de 12
12- menor de 14
39
27
16
IS
10
8
6
Clase
1.2- menor de 1.6
1.6- menor de 2.0
2.0- menor de 2.4
2.4- menor de 2.8
2.8- menor de 3.2
220
ISO
90
110
280
3.29 Determine la varianza poblacional y desviacin estndar para los siguientes datos con el uso de
la frmula original:
Clase
20- menor de 30
30- menor de 40
40- menor de SO
SO- menor de 60
60- menor de 70
70- menor de 80
7
11
18
13
6
rs
3.30 Determine la varianza muestra! y desviacin estndar para los siguientes datos coa el uso de b
frmula de clculo breve.
Clase
5-menor de 9
9-menor de 13
13-menor de 17
17-menor de 21
21-menor de 25
f
20
18
8
6
3.31 Una muestra aleatoria de votantes ea Nashville, Tennessee, est clasificada por grupo de edad,
como se ve en los siguientes datos:
Gru~deedad
18-menor de 24
24--menor de 30
30-menor de 36
36-menor de 42
42-menor de 48
48-mcnor de 54
54--menor de 60
60-menor de 66
66-menor de 72
Frecuencia
17
22
26
35
33
30
32
21
15
3.32 Los siguientes datos representan el nmero de citas de negocios hechos por intervalo de 15 minutos, por solicitud telefnica, para una compaia de jardinera:
Nmero
de citas
frecuencia
con que ocurren
O-menor de 1
!-menor de 2
2-menor de 3
3-menor de 4
4--menor de 5
5-menor de 6
31
57
26
14
6
c. Calcule Ja varianza.
d. Calcule la desviacin estndar.
3.33 La Air Transport Association of Arnerica publica datos sobre los aeropuertos de mayor movimiento en Estados Unidos. La siguiente distribucin de frecuencias se elabor a partir de estos
datos para un ao reciente:
Nmero de pasajeros
que llegan y salen
(millones)
Nmero de
aeropuertos
20-menor de 30
30-menor de 40
40-menor de 50
50-meoor de 60
60-menor de 70
70-menor de 80
8
7
1
O
3
O-menor de 20 000
20 000-menor de 40 000
40 000-menor de 60 000
60 000-menor de 80 000
80 000-menor de 100 000
100 000-menor de 120 000
16
II
10
6
5
Sesgo
Una distribucin de datos en los que la mitad derecha es una imagen reflejada de la mitad izquierda es
~bucin simtrica
1 i @!fil
~elacin de media,
"lediana y moda
~=
Mediana
Moda
(a)
Distribucin simtrica
(no hay sesgo)
Mediana
Mediana
(e)
Positivamente
sesgada
(b)
Negativamente
sesgada
Coeficiente de sesgo
Al experto en estadstica Karl Pearson se le da el crdito de idear por lo menos dos coeficientes de sesgo
que se pueden usar para determinar el grado de sesgo en una clistribucin. Aqu presentamos uno de
estos coeficientes, conocido como coeficiente de sesgo o de Pearson, el cual compara la media y mediana en vista de la magnitud de la desviacin estndar. Ntese que si la distribucin es simtrica, la media
y la mediana son del mismo valor y por tanto el coeficiente de sesgo es igual a cero.
COEFICIENTE
DE SESGO O DE
PEARSON
donde:
Sk = coeficiente de sesgo
Md =mediana
Supongamos, por ejemplo, que una distribucin tiene una media de 29, una mediana de 2" rm;.a
desviacin estndar de 12.3. El coeficiente de sesgo se calcula como:
sk =
3(29- 26)
12.3
= +o.73
Curtosis
FIGURA 3.12
Tipos de curtosis
Distribucin platicrtica
Otra forma de describir una distribucin de datos es mediante el uso de una grfica de caja
y bigote. Una grfica de caja y bigote, a veces llamada grfica de caja, es un diagrama que
utiliza los cuartiles superior e inferior junto con la mediana y los dos valores ms extremos para
describir grficamente una distribucin. La grfica se construye con el uso de una caja para
encerrar la mediana. Esta caja se extiende hacia fuera desde la mediana a lo largo de un
continuo hasta los cuartiles inferior y superior, encerrando asl no slo la mediana sino
tambin 50% de los datos. Desde los cuartiles inferior y superior, unas rectas conocidas
como bigotes se prolongan desde la caja hacia los valores de datos extremos. La grfica de
caja y bigote se determina a partir de cinco nmeros especficos.
l.
La mediana (Q2).
2.
3.
4.
5.
La caja de la grfica se determina al localizar la mediana y los cuartiles inferior y supeDistribucin mesocurtica
rior en un continuo. La caja se traza alrededor de la mediana con los cuartiles inferior y
superior ( Q1 y Q3) como los puntos extremos de la caja. Estos puntos extremos de caja ( Q1
y Q3) se conocen como las bisagras de la caja.
A continuacin, el valor del rango intercuartil (IQR) se calcula con Q3 - Q1 El rango
intercuartil incluye 50% de los datos y debe ser igual a la longitud de la caja. No obstante, aqu, el rango
intercuartil se utiliza tambin fuera de la caja. A una distancia de l.5 IQR hacia afuera desde los cuartiles inferior y superior estn lo que se conoce como cercas interiores. Un bigote, o segmento de recta,
se traza desde la bisagra inferior de la caja hacia afuera del valor de los datos ms pequeo. Un segundo bigote se traza desde la bisagra superior de la caja hacia afuera del valor de datos ms grande. Las
cercas interiores se establecen como sigue:
Q1
Q3
1.5 IQR
1.5 IQR
Si los datos caen ms all de las cercas interiores, entonces pueden construirse cercas exteriores:
Q1
- 3.0 IQR
Q3 +
3.0 IQR
UM'1t+HF
ll1sagra
Bisagra
i.:
Grfica de caja y
bigote
l.SIQR\
3.0IQR
Q1
Mediana
Q3
3.0JQR
;11
tro de las cercas exteriores se conocen como resultadosaislados leves. Los valores que estn fuera ~ bs
cercas exteriores se conocen como resultados aisladosextremos.As], uno de los principales usos de ar.a
grfica de caja y bigote es identificar resultados aislados. En algunas grficas de caja y bigote generadas
por computadora, los bigotes se trazan a los valores de datos ms grandes y ms pequeos dentro de
las cercas interiores. Un asterisco se imprime entonces para cada valor de datos ubicado entre las cercas interior y exterior para indicar un resultado aislado leve. Los valores fuera de las cercas exteriores
se indican con un cero en la gr:lfica. Estos valores son resultados aislados extremos.
Otro uso de las grficas de caja y bigote es determinar si una distribucin es sesgada. La ubicacin
de la mediana en la caja puede relacionar informacin acerca del sesgo de 50% de los datos. Si la mediana est ubicada en el lado derecho de la caja, entonces el 50% medio est sesgado a la izquierda. Si la
mediana est ubicada en el lado izquierdo de la caja, entonces el 50% medio est sesgado a la derecha.
Al examinar la longitud de los bigotes a cada lado de la caja, un investigador de negocios puede hacer
un juicio acerca del sesgo de los valores exteriores. Si el bigote ms largo est a la derecha de la caja,
entonces los datos exteriores estn sesgados a la derecha y viceversa. Vamos a utilizar los datos la tabla
del cuadro 3.10 para construir una grfica de caja y bigote.
Una vez organizados los datos en un conjunto ordenado, como se muestra en la tabla 3.11, es relativamente fcil determinar los valores del cuartil inferior (Q1), la mediana y el cuartil superior (Q3). A
partir de stos, el valor del rango intercuartil se puede calcular.
Las bisagras de la caja estn situadas en los cuartiles inferior y superior, 69 y 80.5. La mediana est
situada dentro de la caja a distancias de 4 desde el cuartil inferior y 6.5 desde el cuartil superior. La distribucin de 50% de los datos est sesgado a la derecha, porque la mediana est ms cerca de la bisagra
inferior o izquierda. La cerca inferior se construye con:
Q1
1.5 IQR
= 69 -
y
Q3 + 1.5 IQR = 80.5 + 1.5(11.5) = 80.5
17.25 = 97.75
Los bigotes se construyen al trazar un segmento de recta desde la bisagra inferior hacia afuera del
valor de datos ms pequeo y un segmento de recta desde la bisagra superior hacia afuera del valor de
datos ms grande. Un examen de los datos muestra que ninguno de los valores de datos de este conjunto de nmeros est afuera de la cerca interior. Los bigotes se construyen hacia afuera del valor ms
bajo, que es 62 y del valor ms alto, que es 87.
Para construir una cerca exterior, calculamos Q1 - 3 IQR y Q3 + 3 IQR, como sigue:
Q1 - 3 IQR = 69 - 3(11.5) = 69 - 34.5 = 34.5
Q3 + 3 lQR = 80.5 + 3(11.5) = 80.5 + 34.5 = 115.0
TABLA 3.IO
87
79
79
74
62
82
64
72
65
63
74
68
80
75
73
81
85
62
73
81
84
71
73
84
64
68
73
72
82
81
69
65
71
69
FIGURA 3.14
Grfica MINITAB de caja y bigote
TABLA 3.11
Datos en conjunto ordenado con cuartiles y mediana
8i
80
73
69
85
79
73
68
84
84
79
73
77
72
82
76
72
65
82
75
71
65
64
Q, =69
Qz = mediana = 73
68
OJ = 80.5
82
74
71
81
74
71
64
63
81
74
70
62
81
73
69
62
60
ro
50
Datos de tibia
90
3.4
PROBLEMAS
3.35 En cierto dJa el promedio de precios al cierre de un grupo de acciones en la bolsa de Nueva York
es $35 (al dlar ms cercano). Si el valor de mediana es $33 y la moda es $21, est sesgada la distribucin de estos precios de acciones? Si es as, cmo?
3.36 Un hotel local ofrece bailes de saln los viernes por la noche. Un investigador observa a los clien-
tes y estima sus edades. Analice el sesgo de la distribucin de edades si la edad media es 51, la edad
mediana es 54 y la edad modal es 59.
3.37 Los volmenes de ventas de las principales empresas de corretaje de bienes rafees en Estados
Unidos, para un afio reciente, se analizaron con el uso de estadstica descriptiva. El volumen
medio anual en dlares para estas empresas es de 5 millones 510 mil dlares, la mediana es de 3
millones 190 mil dlares y la desviacin estndar es de 9 millones 590 dlares. Calcule el valor del
coeficiente de Pearson y estudie su significado. Est sesgada la distribucin? Si es as, en qu
medida?
41
15
31
25
23
21
22
22
24
18
30
20
19
19
16
23
27
38
34
24
19
20
29
17
23
3.39 Construya una grfica de caja y bigote con los siguientes datos y conteste si, estos datos contie-
690
503
558
490
609
379
601
559
495
562
580
510
623
477
574
588
497
527
570
495
590
602
541
3.40 Suponga que le pide a un grupo de 18 consumidores que conserven una bitcora de sus prcticas
de compra y que los siguientes datos representan el nmero de cupones empleados por cada uno
en el periodo anual. Use los datos para construir una grfica de caja y bigote. Haga una lista de la
mediana, Q1, Q3, los puntos extremos para las cercas interiores y los puntos finales para las cercas
exteriores. Analice el sesgo de la distribucin de estos datos y seale cualquier resultado aislado.
81
68
70
100
94
47
66
70
82
110
105
60
21
70
66
90
78
85
Correlacin
La correlacin es una medida del grado de relacin de variables. Puede ayudar a que un investigador de
negocios determine, por ejemplo, si las acciones de dos lineas areas suben y bajan de una manera relacionada. Lgicamente, los precios de dos acciones de la misma industria deben estar relacionados. Para
una muestra de pares de datos, el anlisis de correlacin puede proporcionar un valor numrico que
represente el grado de relacin de los dos precios de acciones en el tiempo. En la industria del transporte, hay una correlacin evidente entre el precio del transporte y el peso del objeto que se enva?; el
precio y la distancia muestran alguna relacin?; qu tan fuertes son las correlaciones.' U:s
decisiones de precios pueden estar basadas, en parte, en los costos de embarque que esA
'.latos para el ejemplo de
correlacionados con otras variables. En economa y finanzas, qu tan fuerte es la correlaEconomics
cin entre el ndice de precios al productor y el porcentaje de desempleo? En ventas al
menudeo, qu variables estn relacionadas a las ventas de una tienda en particular?; estn
las ventas relacionadas a la densidad de poblacin, nmero de competidores, tamao de la
tienda, cantidad de publicidad, u otras variables?
7.43
221
Existen diferentes medidas de correlacin, la seleccin de las cuales depende principal7.48
222
mente del nivel de datos que se analice. En el ideal, a los investigadores les gusta despejar p,
8.00
226
el coeficiente poblacional de correlacin, pero como prcticamente siempre manejan datos
7.75
225
4
muestrales, esta seccin introduce un coeficiente de correlacin muestra! r, de amplio uso.
224
5
7.flJ
Esta medida es aplicable slo si ambas variables analizadas tienen al menos un nivel de
intervalo de datos. El captulo 17 presenta una medida de correlacin que se puede usar
223
7.63
6
cuando los datos son ordinales.
223
7.68
El estadstico r es el coeficiente de correlacin de Pearson, nombre que recibe 'en
226
7.67
8
honor a Karl Pearson (1857-1936), estadstico ingls que ide varios coeficientes de corre7.59
226
9
lacin junto con otros importantes conceptos de estadstica. El trmino res una medida
235
8.07
10
de la correlacin lineal entre dos variables. Es un nmero que varia de -1 a + 1, que repre233
11
8.03
senta la fuera de la relacin entre las variables. Un valor r de + l denota una perfecta rela241
12
8.00
cin positiva entre dos conjuntos de nmeros. Un valor r de - 1 denota una perfecta
correlacin negativa, lo cual indica una relacin inversa entre dos variables: cuando una se
hace ms grande, la otra se hace ms pequea. Un valor r de O significa que no existe relacin lineal
entre dos variables.
TABLA 3.12
COEFICIENTE
DE CORRELACIN
DEPEARSON
L:(x - x)(y- y)
La figura 3.15 representa cinco diferentes grados de correlacin: a) representa fuerte correlacin
negativa, b) representa moderada correlacin negativa, e) representa moderada correlacin positiva,
d) representa fuerte correlacin positiva (e) no contiene correlacin.
TABLA 3.13
Clculo de r para el
ejemplo de
Economics
.......
,...._
lndlice
Dla
s
T
----------------------------7.43
221
7.48
222
2
8.00
226
3
7.75
225
4
7.60
224
5
7.63
223
6
7.68
223
7
7.67
226
8
7.59
226
9
235
10
8.07
8.03
233
11
241
12
a.oo
Ix 92.93 I12ns
(21 115.07)r=
1112
55.205
55.590
64.000
60.063
57.760
58.217
58.982
58.829
57.608
65.125
64.481
64.000
~-720.220
"T
48841
1642.03
1660.56
49284
1808.00
51076
50625
1 743.75
50176
1 702.40
49n9
1 701.49
49729
1 712.64
51076
1 733.42
1 715.34
51076
1896.45
55225
54289
1870.99
58081
1928.00
I,.Z= 619207 Ixy =21 115.07
(92.93)(2n5)
l
= .815
82
U@lfii@.
Cinco correlaciones
'.,.
. ; .
s:
..... . . . ..
.. .... . .
. . . . .... '
.-.. ...
,,. ",.. .
. ... . .
...
. ... . . . -... .
. ..: .. ...
.
:
..
.
.
.. ,~. .... .
, - ...
i: :. _, ..
... .. '. ...
. ..
.
.
:.
.
.
.. .... :.. .
. ....
.
... . ..
.
.
.
,
..... . .:.. . :... .
.. .: ., ..
. ~:
..
..
..
,,. 'f
;.,
..
..
..~-:. , ..
. ' .
Salida Excel
A
1
2
lnterest Rata
3 Futuras lndex
lntarast Rata
Futuras lndex
. ..
1
0.815
Salida MINITAB
Correlaciones:TASA DE INTE~, INDICEFUTUROS
Pearson correlation of INTEREST RATE and FUTURES INDEX
0.815
Cul es la medida de correlacin entre la tasa de inters de fondos federales y el ndice de futuros
de mercancas o productos? Con datos como los que se muestran en la tabla 3.12 y que representan b
valores de tasas de inters de fondos federales e ndices de futuros de mercancas o productos para una
muestra de 12 das, es posible calcular un coeficiente r.
El examen de la frmula para calcular un coeficiente de correlacin de Pearson deja ver que los
siguientes valores deben obtenerse para calcular r: Ix, lx2, ly,Iy2, Ixy y n. En anlisis de correlacin,
no importa cul variable se designe x y cul se designe y. Para este ejemplo, el coeficiente de correlacin se calcula como se ve en la tabla 3.13. El valor r obtenido (r = 0.815) representa una relacin positiva relativamente fuerte entre tasas de inters e ndice de futuros de mercancias o productos en un
periodo de 12 dias.
La figura 3.16 muestra salidas de Excel y MINITAB para este problema.
3.5 PROBLEMAS
3.41 Determine el valor del coeficiente de correlacin, r, para los siguientes datos:
X
y
11
14
17
18
12
13
21
158
296
87
110
436
349
510
301
322
550
3.43 En un esfuerzo por determinar si existe alguna correlacin entre el precio de acciones de aerolneas, un analista muestre seis dias de actividad del mercado accionario. Con el uso de los
siguientes precios de la accin Delta y la accin Southwest, calcule el coeficiente de correlacin.
Para mayor comodidad, los precios de acciones se han redondeado al dcimo ms cercano:
Delta
Southwest
47.6
15.l
46.3
15.4
50.6
15.9
52.6
15.6
52.4
16.4
52.7
18.1
3.44 Los siguientes datos son las reclamaciones (en millones de dlares) por prestaciones de BlueCross
BlueShield para nueve estados, junto con el sobrante (en millones de dlares) que la compaa
tenla en activos en esos estados:
Estado
Alabama
Colorado
Florida
!llinois
Maine
Montana
Dakota del Norte
Oklahoma
Texas
Reclamacin
$1425
Sobrante
$277
273
100
915
120
l 687
259
234
40
142
25
259
57
258
31
894
141
Utilice los datos para calcular un coeficiente de correlacin r, para determinar la cornbcin entre
reclamaciones y sobrantes.
3.45 El National Safety Council public los siguientes datos sobre porcentaies de inci<lmc:a. por lesiones mortales o que hacen perder tiempo de trabajo, por 100 empleados de varias industrias en
tres aos recientes.
Cul es la medida de correlacin entre la tasa de inters de fondos federales y el ndice de futuros
de mercancas o productos? Con datos como los que se muestran en la tabla 3.12 y que representan b
valores de tasas de inters de fondos federales e ndices de futuros de mercancas o productos para una
muestra de 12 das, es posible calcular un coeficiente r.
El examen de la frmula para calcular un coeficiente de correlacin de Pearson deja ver que los
siguientes valores deben obtenerse para calcular r: Ix, lx2, ly,Iy2, Ixy y n. En anlisis de correlacin,
no importa cul variable se designe x y cul se designe y. Para este ejemplo, el coeficiente de correlacin se calcula como se ve en la tabla 3.13. El valor r obtenido (r = 0.815) representa una relacin positiva relativamente fuerte entre tasas de inters e ndice de futuros de mercancias o productos en un
periodo de 12 dias.
La figura 3.16 muestra salidas de Excel y MINITAB para este problema.
3.5 PROBLEMAS
3.41 Determine el valor del coeficiente de correlacin, r, para los siguientes datos:
X
y
11
14
17
18
12
13
21
158
296
87
110
436
349
510
301
322
550
3.43 En un esfuerzo por determinar si existe alguna correlacin entre el precio de acciones de aerolneas, un analista muestre seis dias de actividad del mercado accionario. Con el uso de los
siguientes precios de la accin Delta y la accin Southwest, calcule el coeficiente de correlacin.
Para mayor comodidad, los precios de acciones se han redondeado al dcimo ms cercano:
Delta
Southwest
47.6
15.l
46.3
15.4
50.6
15.9
52.6
15.6
52.4
16.4
52.7
18.1
3.44 Los siguientes datos son las reclamaciones (en millones de dlares) por prestaciones de BlueCross
BlueShield para nueve estados, junto con el sobrante (en millones de dlares) que la compaa
tenla en activos en esos estados:
Estado
Alabama
Colorado
Florida
!llinois
Maine
Montana
Dakota del Norte
Oklahoma
Texas
Reclamacin
$1425
Sobrante
$277
273
100
915
120
l 687
259
234
40
142
25
259
57
258
31
894
141
Utilice los datos para calcular un coeficiente de correlacin r, para determinar la cornbcin entre
reclamaciones y sobrantes.
3.45 El National Safety Council public los siguientes datos sobre porcentaies de inci<lmc:a. por lesiones mortales o que hacen perder tiempo de trabajo, por 100 empleados de varias industrias en
tres aos recientes.
Ao!
Ao2
Textil
.46
.48
Ao3
.69
Qumica
.52
.62
.63
.90
.72
.81
Maquinaria
1.50
1.74
2.10
Servicios
2.89
2.03
2.46
Metales no ferrosos
1.80
1.92
2.00
Alimentos
3.29
3.18
3.17
Gobierno
5.73
4.43
4.00
Comunicaciones
Calcule r por cada par de aos y determine cules aos tienen mayor correlacin.
rna11i!llE
Salida MINITAB
para el problema
de produccin de
computadoras
ifll;f fM
Salida Excel para
el problema de
produccin
de computadoras
ESTADISTICAS DESCRIPTIVAS
Variable
N
Mean
Computer
13.00
5
Variable
Computer
Mini.mum.
5.00
Ma.ximum
18.00
Median
16.00
TrMean
13.00
Q,
7.00
17.50
z
3
4
e
7
e
.9
10
11
112
J;j
A
Mean
Standard error
Median
Mode
Standard devianon
Sample variance
Kurtos1s
Skewness
Ranga
Msn1mum
Max1mum
Sum
Count
B
13
2.5495
16
N/A
5.7009
32.5
-1.7112
-0.8096
13
5
18
65
5
stoev
SE Mean
5.70
2.55
Estadsticas de lavandera
Las estadisticas descriptivas presentadas en este captulo son excelentes para resumir y presentar conjuntos de datos en formatos ms concisos. Por ejemplo, la pregunta 1 de las preguntas gerenciales y
estadJsticas del Dilema de decisin reportamedidas de agua para SO casas en Estados Unidos. Con el
uso de Excel y/o MINITAB, muchas de las estadJsticas descriptivas presentadas en este captulo se pueden aplicar a estos datos. Los resultados se ilustran en las figuras 3.19 y 3.20.
Estas salidas de computadora muestran que el promedio de uso de agua es 15.48 galones con una
desviacin estndar de 1.233 galones. La media es 16 galones con un rango de 6 galones (12 a 18). El
primer cuartil es 15 galones y el tercer cuartil es 16 galones. La moda es tambin 16 galones. La grfica
MINITAB y las medidas de sesgo muestran que los datos estn ligeramente sesgados a la izquierda. La
aplicacin del teorema de Chebyshev a la media y desviacin estndar muestra que por lo menos
88.9% de las mediciones deben caer entre 11.78 galones y 19.18 galones. Un examen de
los datos y el mnimo y mximo revelan que 100% de los datos en realidad caen dentro
FIGURA 3.19
de estos lmites.
Estadstica descriptiva
Segn el Dilema de decisin, el tiempo medio de ciclo de lavado es 3S minutos con una
de Excel
desviacin estndar de cinco minutos. Si de manera aproximada los tiempos de ciclo de
lavado estn normalmente distribuidos, podemos aplicar la regla emprica. Segn la regla
USO DE AGUA
emprica, 68% de los tiempos caeran dentro de 30 y 40 minutos, 9S% de los tiempos caeA
B
ran dentro de 25 y 45 minutos y 99.7% de los tiempos de lavado caeran dentro de 20 Y. SO
1 Mean
15.48
minutos. Si los datos no estn normalmente distribuidos, el teorema de Chebyshev deja ver
0.174
2 Standard error
que al menos 75% de los tiempos deberan caer entre 2S y 4S minutos y 88.9% debera caer
16
3 Median
16
4 Moda
entre 20 y 50 minutos.
1.233
5 Standard deviation
Est la cantidad (peso) de lavandera correlacionada con el ingreso familiar? Si se
1.52
6 Sample variance
calcula un coeficiente de correlacin sobre los datos del Dilema de decisin, se encuentra r de
0.264
7 Kurtosis
0.723. Este resultado indica que es probable alguna correlacin entre los dos conjuntos
'._Q,531
8 Skewness
de datos. No obstante, no es una correlacin perfecta ni es una correlacin muy fuerte. La
6
9 Ranga
tendencia parece ser que las casas con ms altos ingresos hacen cantidades de lavandera
10 M1nimum
12
ms grandes; sin embargo, en algunos casos, los hogares con menores ingresos todava hacen
11 Max1mum
18
12 Sum
774
cantidades relativamente grandes de lavandera y los de ingresos ms altos a veces hacen menos
13 Count
50
lavandera.
hflltiij1.
Estadstica
descriptiva
MINITAB
12
1
13
14
15
1
16
1
18
17
1
J
IS.O
15.5
15.4800
1.2329
1.52
-5.3E--01
0.263785
50
Mnimo
Primer cuartil
mediana
Tercer cuartil
mxima
12.0000
15.0000
16.0000
. 16.0000
18.0000
Media
Desviacin estndar
Varianza
Sesgo
Curtosis
Variable N
15.1296
1
16.0
15.0000
1.5363
CONSIDERACIONES
~TICAS
UD cuerpo ele datos a una audiencia, es mejor uaar cua&esquiera medidas que sean
necearias para presentar una imagen "completa" de los datos. Al limitar las medidas descriptivas
~
el iimstigador de negocios puede dar a la audiencia slo parte de la imagen y puede
8C9f la forma en que el receptor entienda los datos. Por ejemplo, si un investigador presenta
slo la media. la audiencia no tendr nociones de la variabilidad de los datos; adems, la media
pocii:4 desordenadamente grande o pequea debido a valores extremos. Del mismo modo,
la~
ele la media impide una imagen que incluya estos valores. El uso de la moda puede causar qpe el receptor de la informacin se concentre slo en valores que ocurren con frecuencia.
A,l menos una medida de variabilidad suele ser necesaria cuando menos con una medida de
~
central para que la audiencia comience a entender q~ aspecto tienen los datos.
~ores no ticos podrian tratar de presentar slo la medida descriptiva que lleve la imalJl!D ele los datos que desean que la audiencia vea; en cambio, los investigadores 4!ticos usarAn cualquiera y todos los mtodos que presentan la imagen ms informativa y ms completa posible de
los datos.
Una fuerte correlacin no necesariamente indica causa y efecto. No es profaiooal ni ~
sacar conclusiones de causa y efecto slo porque dos variables estn n:lacionadas. Por ejemplo,
suponga que el nmero de furgonetas rentadas aumenta con la temperatura. Algunos ejecuUpodrian pensar que entre ms caliente sea el da ms personas las rentarn, La realidad es que lo
hacen cuando los estudiantes salen de vacaciones para evitar que dejen de asistir a la escuela, ya
que tienen vacaciones por lo general en verano en casi todos los paises cuando las temperaturas
son m lidas. Por tanto, puede ser que el calendario escolar sea el que provoque que las furgonetas se renten, no la temperatura. Una rae.ha de calor en enero no necesariamente genera ms
rentas.
El ex gobernador de Colorado, Richard Lamm, se menciona como autor de la frase de "los
demgrafos son acadmicos que pueden demostrar estadsticamente que el promedio de personas en Miami nace cubano y muere judo ... " Es ms probable que las personas lleguen a este tipo
de conclusin si los investigadores dan estadsticas descriptivas incompletas o confusas.
Ala L Ollm. "l'llople l'atleml/Odds and !!neis.The Wall Street Journal, 29 de )UDIO de 19'12, p. B 1 Rcimprno con permlle 4e 1" .. SlrM """"'1l O 1992. Dow Iones & Company,lnc. Todoslos derechos reservados en el mundo.
RESUMEN
Las medidas estadsticas descriptivas incluyen medidas de tendencia central, de variabilidad y medidas de forma. las medidas de tendencia central y medidas de variabilidad se calculan de
manera diferente para datos no agrupados y agrupados. las
medidas de tendencia central son tiles para describir datos
porque comunican informacin acerca de las partes ms centrales de los datos. las medidas ms comunes de tendencia
central son las tres m: moda, mediana y media. Adems, los
percentiles y cuartiles son medidas de tendencia central.
la moda es el valor que se presenta con rns frecuencia en
un conjunto de datos. Si dos valores empatan para la moda,
los datos son bimodales. Los conjuntos de datos pueden ser
multimodales. Entre otras cosas, la moda se emplea en negocios para determinar tamaos.
La mediana es el trmino medio de un conjunto ordenado de nmeros que contienen un nmero impar de trminos.
Para un conjunto con nmero par de trminos,la mediana es
el promedio de los dos trminos medios. La frmula (n + 1)/2
especifica la ubicacin de la mediana. Una mediana no resulta
afectada por la magnitud de valores extremos. Esta caracterstica hace de la mediana una medida ms til y apropiada de
ubicacin al reportar elementos como son el ingreso, edad y
precios de casas.
La media aritmtica se utiliza mucho y por lo general es
lo que los investigadores citan cuando usan la palabra media.
La media aritmtica es el promedio. La media poblacional y la
media muestra] se calculan de la misma manera pero se denotan con simbolos diferentes. A la media aritmtica la afecta
cada valor y es influenciada por valores extremos.
Los percentiles dividen un conjunto de datos en 100 grupos, lo cual significa que se requiere de 99 percentiles. Los
cuartiles dividen datos en cuatro grupos. Los tres cuartiles son
Q1, que es el cuartil ms bajo; Q2, que es el cuartil de en medio
e igual a la media; y Q3, que es el cuartil superior.
Las medidas de variabilidad son herramientas estadsticas
empleadas en conjuncin con medidas de tendencia central
para describir datos. las medidas de variabilidad dan una descripcin de datos que las medidas de tendencia central no
TRMINOSCLAVE
birnodal
desviacin estndar
coeficiente de correlacin ( r)
medidas de variabilidad
regla emprica
coeficiente de sesgo
rango intercuartil
mesocrtica
sesgo
moda
suma de cuadrados de x
correlacin
leptocrtica
multimodal
teorema de Chevyshev
cuartiles
media aritmtica
percentiles
valor z
curtosis
mediana
platicrtica
varianza
medidas de forma
rango
FRMULAS
Media poblacional (no agrupada)
Ex
11=-:
-x=- Ex
11
Ex2- (Ex)2
E(x-)2
Ex2-11(x)2
11-I
Teorema de Chebyshev
Ex2_ (Ex)2
l--
u2
11-I
5=
11
5=
k2
Valoresz
Ex2 -N2
N
Desviacin estndar poblacional (no agrupada)
x-
z=-u
a=J;;l
Coeficiente de variacin
a=~
CV=~(IOO)
Lx2 - (Ex)2
N
N
Rango intercuartil
!QR
u=~
Media agrupada
Ef(M-x)2
E/M
n-1
11agrupada= N
n-1
= Q3-Q1
Ef(M-)2
EJM2 - (EJM)2
N
5=
Ef(M-x)2 =
n-1
EJM2 - (E/M)2
11
n-1
Coeficiente de Pearson
E/M2 - (E/M)2
N
N
Varianza muestra!
52
n-l
r=
Lx2 - (Ex)2
52
= E(x-x)2
=
11
n-1
-11(x)2
= Ex211-I
L:(x-x)(y-y)
JE(x-xh:.(y-y)2
(L:xL:y)
L:xy---11
89
ROBLEMAS COMPLEMENTARIOS
aleulo de estadsticas
-16 En el censo de Estados Unidos en 2000 se pidi a cada
familia informar respecto a las personas que vivan en
cada hogar. Suponga que para una muestra de 30 hogares seleccionados, el nmero de personas en cada una se
report como sigue:
2
5
2
3 2
8 3
3
2
2
3
Calcule la media, mediana, moda, rango, cuartiles inferior y superior y rango intercuartil para estos datos.
.47 En el censo de Estados Unidos en 2000 se pidi la edad
de cada persona. Supongamos que una muestra de 40
familias mostr la edad de la primera persona registrada en la siguiente forma:
42
29
3( 38 55
27
28
33
49
70
25
21
38
47
63
22
38
52
50
41
19
22
29
81
52
26
35
38
29
31
48
26
33
42
58
40
32
24
34
25
PepsiCo
Intel
Motorola
Tricon Global Restaurants
Merk &Co.
11 388
11 019
AFLAC
6 796
6 552
6 498
6101
5 563
5 414
5 390
5 033
4 541
Diebold
McDonald's
Coca-Cola
Lucent Technologies
Home Depot
Clayton Homes
RPM
Cisco Systerns
Promedio de circulacin
Peridico
Compaa
9 863
9 168
8 687
diaria
1 762 751
1692666
1 097 180
1 033 399
762 009
704 463
661 699
576 345
546 799
495 597
3.50 Mostramos las compaas con mayor capacidad de refinacin de petrleo en el mundo, segn el Petroleum
Intelligence Weekly. Utilice estos datos poblacionales y
conteste las preguntas.
Compaa
ExxonMobil
Royal Dutch/Shell
China Petrochemical
Petroleos de Venezuela
SaudiArabian Oil
BP Amoco
Chevron
Petrobas
Texaco
Petroleos Mexicanos(Pemex)
National lranian Oil
Capacidad
(miles de barriles
pordia)
6 300
3 791
2 867
2 437
1 970
1 965
1661
1 540
1 532
1 520
1 091
90 ESTADISTICA
EN LOS NEGOCIOS
e. Calcule
el coeficiente
de Pearson
y comente
sobre el
El U.S. Department
produccin
10 principales
bustible
of the Interior
de minerales.
estados
en Estados
Estado
publica
A continuacin
de produccin
~menorde20
2~ menor de 40
4~ menor de 60
6~ menor de 80
8~ menor de 100
cifras sobre
aparecen
mineral
los
no com-
Unidos.
Valor (millones
de dlares)
California
3 350
Nevada
2 800
Ar izo na
Texas
Florida
Michigan
Georgia
Minnesota
Utha
Missouri
2 550
2 050
1 920
1 670
1 660
1 570
1 420
1 320
Nmero de
compaias
32
16
13
10
19
10
9 6
457
2
9
Frecuencia
9
16
27
44
42
23
7
2
3.53 Una agencia de investigacin realiza un estudio demogrfico a 90 compaas de ventas por televisin para
determinar el tamao de sus operaciones. Cuando se
pidi informar cuntos empleados trabajan ahora en su
operacin de ventas por televisin, las compaas dieron
respuestas que variaban de 1 a 100. El analista de la agencia organiza las cifras en una distribucin de frecuencias.
de 20
de 25
de 30
de 35
de 40
de 45
de 50
de 55
Bosnia y Herzegovina
3.05%
3.93
4.68
6.57
8.27
12.01
10.27
8.45
Total de toneladas
214.2
158.8
133.7
87.5
78.0
69.4
63.7
62.5
60.9
53.4
52.9
51.5
50.7
49.5
45.4
42.3
42.3
40.8
39.3
37.3
Interpretacinde salida
3.63 American Banker compil una lista de las principales
100 compaas banqueras del mundo segn el total de
sus activos. Encabeza la lista el Bank of Toho-Mi15Ubishi, seguido por el Deutsche Bank. El resul~do de la
estadstica descriptiva de Excel es una lista dd total de
activos variables (millones de dlares] para estos 100
bancos, analcelos y describa con sus propias palabras lo
que puede deducir de los activos.
).65 En ti mundo I<' encuentran numerosas y grandes compar.las. El nmero de empleados rara .f6 di.' los mis
grandes empleadores, con oficinas matrices fucra de
Estados Unido, K' anJliz con la funcin de otadl$lica
descriptiva de Excel, A comlnuacin apam:m estos
datos, Con d estudie de los resultados realice un anili
s con lo que ha aprendido aceres del numero de
empleados p.ira estas compalas .
A
1
1
TopWootdBenb
2134oon
Mean
12972 00
Standard error
1&CS73
Med:an
NIA
Mode
129720
Standafd dovia:'"
~VIN!IC:e
16827278273
KurtOS13
105
118
Skewness
Ranoe
615029
76891
Mnrnum
E!l1920
Maxmum
21349677
Sum
Count
100
..
5
7
10
11
12
13
,..
..
3 Standard enor
Mecloan
5 Mode
Standard devlat>on
7 Slmllle vanance
Ku:IOS<S
8 Skewness
10 Rango
11 Mn:mum
12 Maiamum
13 Sum
14 Counl
7 S60
5.8S60
:U.64SS
).6214
17.1851
50
.t2S
4.50
S.75
8.625
40.00
Scsp>
Cunas.is
N
Mlnimo
PrimaawtiJ
median.a
Tn= .:u.anil
mimo
9~ ck intcn'IJo ck confimu pan IA
6.1!132
15
tadlttica detcriptiva
9.5288
Top 2SA
400000
1
7
1
8
1
1
9
1
25 712i02 6IJ82J
~tinimo
.w59S8
723681
~timo
22269)4
{[]-
35
25
;mzg
84331Ml
41
l.66 La Compctith"' Media Reporting and Publishm lnformation Bureau compil una fta de 10) principales 25
anunciante.. en Estado> Unid' p.ira un a.ilo reciente. El
total de guto. de publicidad para cada compaAb (en
miles de dlares) ~analiz con la funcin de estadisueas dncriptivu numricas de Mf:-:ITAB }"$U funcin de
grfica de caja; amba> K muestran a continuacin.
E&tudie esta d resultado y resuma los gutos de los 25
principales anuncimto, con su. propW. p)abr:
Vul>k
Top2H
9480.HH:>C
15767(
13!>Wt
64302 COO!
413481027!
0.825C
1.2996
2561()j
12589.l
l.64 Hispanic Business; lnc.; compil una lista de los principalc:s anunciantes que cuhivan d mercado hispmo.
Estos datos (mllonn di.' dbm) K' introdujm>n en una
hoja de alkulo Ml~ITAB y K' analiuron mediante b
funcin de t'Swlistica dcsaipm-a grifica. Estudie los resultados y describa Jos pstos di.' t'StOS ~
anun\"ariahk:~
Media
Dnviacin~
\'uunz.1
~
E"'lllOYen Oublde of the Unlted s-l.
1833271304
2 Mean
10
1
-136067
QI
484600
87213
Q2
;mS6
1400000
Princi~2S~
2 ~DODOD
CAPmJlO
J ~TA.DbTICA
DESCIUl'JlH
se ve,
tenga exactameme 200 mi de liquido. Algunas botella) pueden contener mb liquido )'otras menos. Como los llena
dos de la. botella son poco comunes, un ingeniero de
produccin desea probar alguna> de la\ botellas de lo> primeros lotes de produccin para determinar qu tan cerca
e>t.in de la especificacin de 200 mililitro>. Suponga que
los siguientes datos son las mediciones de llenado de una
muestra al var de SO botellas. Utilice las tnica> presenta
da,~ en este capitulo para describir la muestra. Considere
medidas de tendencia central, variabilidad y sesgo. Con
base en este analisis, cmo cst.i trabajando el proceso de
embotellado?
200.I
200.1
199.7
200.I
200.4
199.6
200.1
200.3
200.2
200.2
199.9
200.9
200.4
199.4
199.8
200 . .f
200.8
200.5
200.5
199.5
200.2
200.1
200.3
199.6
199.9
200.4
199.9
199.9
200.2
200.6
200.2
200.3
199.8
199.2
200.2
200.6
200.0
201.I
199.7
200.3
200.0
200.S
199.3
200.2
199.6
200.6
199.9
199.7
200.9
199.8
Media
20.003
Variable
Botella F
::-\
150
Variable
Bottlla F
Mtnimo
19.920
Mediana
20.005
~tximo
20.090
TrMtdia
20.003
Q.
19.985
Desvadn cstncW
0.02;
199!
1
IY9S
1
IY.98
1
20.01
1
200028
0.0268
7.09E-O
-8.6E-02
1.01598
150
Minlmo
Primer cuertil
medi1n1
Tercer cuartil
m6ximo
20.C>l
1
199200
19.9851
20.008
20.0208
200898
19 9985
00239
1
!0.000
1
20.010
'
20.005
19.9977
-.~de lntm-.Jo& <.:un,.nz.a ~
1
Bottle lls
.5
Mean
3 SW>dlrd error
Med'8ll
Mode
6 StandarO devia:ion
7
8
9
10
11
12
13
14
:>ama&
vanance
Kuttosos
Sl:ewroess
Ranos
M.nornum
MalOITIUITl
Sum
Coon:
20.0071
0.0300
200091
~lcdWia
S.Wda de Eiicd
1
per1 Mu
....
20003
0002
20005
20 004
0027
0001
1.015
-0085
o 170
1992
20090
3000416
150
Fuente; adaptado dr "Cokr. Avis Adjun 111 Ruui.", Adwrr111n1 Aft, S de julio de 1999. p. !S; s11o \\<b CocaCola
a1 bnpJ/www. eo<a<Ola.romlhom<.hunl El inform< anual 2001 dt Tbe <:oaCola Company w ....,...,,,. a1
hUrJi-..-2.coa-<Ola.<oml
imaton/onnualttpottl!OOlfmda.html.
USO DE LA COMPUTADORA
EXCEL
Excel puede analiur dato> al usar varia. de la. ttcnia> presentadav en este capuulo. Tiene un comando particularmente
poderoso que genera muchas C">tad.>tiou descriptivas.
Estdisticu dncriptivas
Excd puede tener acceso a '"ria. de la. cstad1sti~ descripti''OI> presentadas en este capuulo mediante el uso del comando
IR.ango y pereentil
.:d tiene un comando Uamado Rank and Percennle que
ordena los dato,, lei, asigna rangos y da salida a lo. percenules.
Para tener acceso a este comando, seleccione Iools de la barra
de men de Excel, En el men descendente que aparece, )CICC
cione Data Analysis. Aparece la caja de dilogo de an.fui> de
dato.>. Seleccione Rank and Pereenrle. Aparece una caja de dilogo de rango y percennl. lnrroduzca el rango de dato.. Haga
die ~i los datos estn en columna. o fil.u y para lcycn~ en la
primera fila.
MINITAB
Ml~ITAB \\'indo-., es capaz de ejecutar mucha. de la. tarra
presentadas en este capitulo, incluyendo e.tad1stica. descriprin., y grfica. de caja.
E.stadfsticas descriptivas
Mtdiantc el U\O del comando Descripnve Statistics, ~11:-=tTAB
da un numero considerable de las tcnicas cstadistica.s men
''"nadas en este capitulo. El proceso se inicia con la seleccin
Je .Stat en la barra de mens.
Dd men descendente, seleccione Basic Stati5tics Del
men descendente de estadsticas bsicas. seleccione Display
Descriptive Statistics y aparece una caja de dilogo. lntroduzca el nmero de columnas que de-ea anali7ar. Si usted hace
die en QK, entonces el resultado incluir el tamano muestral,
media, mediana, desviacin estndar, mnimo, maxmo, el
primer y el tercer cuartil, Sin embargo. si usted selecciona la
opcin Graph ... , tendr varias opciones ms de salida que
relativamente se explican por si solas. Las opciones incluyen
Histogram of data, Histogram of data with .oormal curve,
Dotplot of data, Boxplot of data y Graphical swnmary. Si
CAPTULO
Probabilidad
OBJETIVOS DE APRENDIZAJE
El principal objetivo del captulo 4 es ayudar al estudiante a entender los principios
bsicos de probabilidad, con lo cual podr:
1. Comprender las diferentes formas de asignar probabilidades.
2. Comprender y aplicar probabilidades marginales, de unin, conjuntas y condicio-
nales,
96
Tipo de posicin
G<rcnaal
Proc.ional
ncnco
Oficini>u
Total
Masculino Fmimino
Total
11
31
13
4-4
S2
17
69
22
31
100
SS
ISS
concede al azar, c:WJ es la probabilidad de que \'il)'il a una mujer dado que ese traba~r es dd
rea tknica? Es esta discriminacin contra trabajadores tcnico hombre>' Qu~ ctorcs
podran entrar en la concesin del bono que no sea la seleccin al aur?
3. Suponga que en una fiesta anual feriada el nombre de un empleado de la compa!tia dit'lltt se
sacara al azar para ganar un viaie a Hawai, Cul es la probabilidad de que una pcnom profesional sea la ganadora?
4. Cual es la probabilidad de que el ganador <ea un hombre o una oficmista' (Cuil es b probabi
ldad de que el ganador sea una mujer y en administracin? Supon? que d ?Dador es hom
bre. Cu.l es la probabilidad de que sea del grupo tcnico]
l'Ucntt:: mlorlN(i6n de la UOC aohuda de Riclunl O. A~ y Roben 11. Foky.Farnns.., Sdb: ~
dcln. ( Rtaclin. MA. Adcbso11 \\<dty l'llblishing Company,1992).
oqundo cd...
97
En el caso de un edificio alto, cu.il es la probabilidad de que un sistema contra incendios funcione cuando sea necesario, si tiene instalado equipo superfluo? Quienes se ocupan de negocio) deben
manejar a diario ~tas)' milo de preguntas semejantes. Como gran parte de olas pregunta) no timen
respuestas definidas, la toma de deciscnes se basa en la incertidumbre. En muchas de estas suuaciones,
se puede asignar una probabilidad a la posibilidad de un resultado . .Este capitulo trata de aprender
cmo determinar o asignar probabilidades.
l@il,1,18 ..
Probabilidad en el
proceso de
estadstica
inferencial
Par!m<tro ..unud<
(Oll <1tadiitM
rrobabdidaJ de confianza
~1unmul1"'1
CAPITULO 4 PROl!ABIUIW)
42
99
l.())
MtTOOO
CUSICODE
A~IG~
PROBABILIDADES
P(E)=
11,
donde
N nmero total posibte de resultado. de un experimento
11, el nmero de re ultados en los que el evento ocurre de .V re uhado
Por ejemplo. en una planta en particular, tres maquinas fabrican un determinado producto. La
m.iquina A siempre produce 40% del numero total de este producto. Diez por ciento de los aruculos
producidos por la maquina A son defectuoses. Si los productos terminado> se mezclan bien respecto a
cul mquina los produjo y <i uno de esto producto> se selecciona al azar, el mtodo clasico de asignar
probabilidades nos dice que la probabilidad de que la pieza ha1-a sido producida por la maquina A y
este defectuosa es 0.04. Esta probabilidad se puede determinar incluso antes que la pieza ~ muestreada porque, con el metodo clsico, las probabilidades se pueden determinar a priori. esto es.se putdtn
determinar ante dtl experimento.
Como 11, nunca puede ser mayor que 1' (no m.t> de N resultado> de la poblacin podnan po-iblemente tener atributo t), el valor m.h alto de cualquier probabilidad es l. Si la probabilidad de que ocurra
un resultado es 1. e. seguro que el evento ocurra. La probabilidad m.t> pequea posible es O. Si ninguno
de lo. resultados de las.\" posibilidades tiene la caracterstica deseada, e, la probabilidad" a \ O. y es
-eguro que el evento no ocurra.
RA.'iGOOE
PROBABWDADES
o ::5 P\El
::5 1
Entonces, la~ probabilidades son fraccione. propias no negativas o valores decimales no nrptm>5
menores o iguale> a 1.
Lo. valores de probabilidad se pueden convenir en porcentajes <i se multiplican por 1
l.m
meteorlogos reportan a \'CCe~ probabilidades del clima en forma de porcentaje. Por ermplo. a:a=xlo
pronostican 60% de probabilidad de Uu\ia para matlana, estn diciendo que la probabilidad de
para maana e' .60.
Frecuencia relativa
El mtodo de frecuencia rclaLi~-. para asignar probabilidade. se ba,,;i en datos hmricos acure:cbdos.
Con este mtodo, la probabi/.,1,ufde qut ooum 1111 event o ig1111/ al 11mco dr -rus que- n't!:t:l oaun6
tn ti pasado di1idido entre el 11mm1 rora/ de oportunidades para qut ocu"
100
ESTADISTICA
EN LO) l'EGOCIOS
PROBABWDAD
POR FR.ECUEl\ClA
IWATIVAOE
OCUJl.REl\CIA
La frecuencia relativa no c.t basada en reglas o leyes sino en qu ha ocurrido en el pasado. Por
ejemplo. una compaa desea determinar la probabilidad de que m inspectores \'ayaD a rechazar el
siguiente lote de materias primas de un proveedor. Les datos reunido. en lo libro. de registros de la
compata mue tran que en el pasado el proveedor emi a 13 compal'lla 90 lores y lo. inspectores rechazaron 1 O de ellos. Por el mtodo de la frecuencia relativa de ocurrencia, la probabilidad de que los inspeetores rechacen el siguiente lote c. 10190 o Sta .11 Si el siguiente c. rcchaz.ido. la probabilidad por
frecuencia relativa para el embarque posterior cambiarla a 11/91 .12.
Probabilidad subjetiva
El ., rodo s11bjtllll() dt asignar probabilidad ar basado en la imprtsi6n o inruiciJn de la person que
drtmnma la probabilidad. La probabilidad subjetiva proviene de la intuicin o razonamiento de la persona. Aun cuando no c. un mtodo cientfico aplcado a la probabilidad. el mtodo subjetivo e>t basado
en oca,,ione. en la acumulacin de conocimiento. comprensin y experiencia almacenada y procesada en
b mente humana. A veces es ~lo una suposicin, pero en otras la probabilidad <ubjeti\-a puede potencialmcnte dar probabilidades pre<:1>as. La probabilidad subjetiva se puede us.1r para capitalizar con base
en los antecedente de rrabajadore, y gerente. experimentados en la toma de decisiones.
Supongamos que a un director de transporte de una companta petrolera se le pide la probabilidad
de obtener un embarque de petrleo de Arabia Saudita a Estados Unidos en ~lo tres semanas, Un
director que ha programado muchos de estos embarque. tiene conocimiento de la poltica rabe. y adem> c.t consciente de que las condiciones climatolgicas y econmicas actuales pueden dar una pro
babilid.td precisa de que el embarque se pueda hacer a tiempo.
La probabilidad subjetiva tambin puede ser una forma potencialmente til de aprovechar la experienda. conocimiento e intuicin de una persona y usar todo esto para pronosticar la ocurrencia de
algn evento, Un mecnico experimentado de una aerolnea puede, por lo general, asignar una proba
bildad lgica de que un avin en panicular tendr cieno tipo de dificultad mecnica. A vece. los mdicos a.ignan probabilidades subjetivas a la esperanza de vida de personas que padecen cncer,
Experimento
Como ya ~ diio antes. un ~rimcnto es 11n proctse q11t produo: m11/1ados. Ejemplos de experimentos orientados a negocios, con resultado. que pueden ser analizado. estadsticameme, podran incluir
lo siguiente:
Entrevistar a 20 consumidores seleccionados al azar y preguntarlo qu marca de aparato electrodomsnco prefieren.
Muestrear una de cada 200 botellas de salsa de 1omate de cierta linea de produccin )'pe.ar el
contenido.
Probar nuevos medicamento> en muestras de paciente. con cncer y medir su mejora.
Auditar una de cada 10 cuenta. para detectar cualquier error
Registrar el promedio industrial Dow lenes el primer tune. de cad.t mes durante 10 anos.
CAPft'UUH
PROllAllILID...0
101
Evento
Debido a que un evento es un rc.sultaJo de un expenmento, el experimento define I~ posibilidades del
evento, Si d experimento e muestrear cinco boteilas que salgan de una linea de produccin, un evento podria ser obtener una botella defectuosa )' cuatro buenas. En un experimento de tirar dado>. un
evento podria ser tirar un nmero par y otro evento podria ser tirar un nmero mayor de dos. lo> evento> se denotan con letras maysculas; las letras imy>CUias cursivas (por ejemplo, A )' E1, E2, ) represenran el caso general o absrracto y las ma)'~uW tipo Romanredondas (por ejemplo, H y T para
cabezas y colas [cara o cruz J) denotan C0$3) y personas especficas.
Eventos simples
Los cn:111os qr..: ne St' puedan separar o drscompo11cr en otro eventos se Uaman eventos simples Lo>
eventos simples se denotan con letra.\ minsculas [p. ej. c1, c2, e), ... 1. Supongamos que el ezpenmento e> tirar un dado. lo> eventos <imples para este experimento son tirar un 1 o tirar un 2 o tirar un J,
etctera. Tirar un numero par o un evento, pero no e> un evento elemental porque el nmero par
puede descomponerse en los eventos 2, 4 y 6.
En el experimento de: tirar un dado. hay~ eventos imples ( l, 2, J, .f, 5, 6}. Tirar un par de dados
resulta en 36 posibles eventos simples ( resultados), Por cada uno de los seis evento> <imple> posibles al
tirar un dado, hay seis posibles C:\"Cnt0> simples en el tiro del segundo dado, como se describe en el da
grama de rbol de la figura -1.2. La tabla 4.1 contiene: una lista de esto' 36 re ultados,
En el experimento de: tirar un par de: dado-, otros eventos podran incluir resultados talo como
do> nmeros pares, una suma de: 10, una suma mayor de cinco, y otro>. l'o obstante, ninguno de estos
eventos es un evento elemental porque cada uno se puede descomponer en vario> de los eventos simples mostrados en la tabla .f. l.
TABLA 4.1
Todos los posibles eventos
s:mplos en el tiro de un par de
.3tos !espacio muestrall
1.1
4,1
5;1
(6Jl
(1.2)
(4.2)
(5,1)
(6.2)
(4.J)
15.J)
(6.))
(l.J)
(2,3)
(1,4)
(2.4)
(3.4)
(4,4)
(5,4)
(6.4)
(l.S)
(2.S)
(3.S)
(4.S)
(S.S)
(6.5)
(1,6)
(2,6)
(),6)
(4,6)
(S,6)
(6.6)
Posibles resultados
de tirar un par de
dados
102
bTADhTICH.-.;
LO> :-;EGOCIO)
Espacio muestra!
l:n t'pcio muestral es una lina complet dt to;loJ los evento mnplt; para un expenmmto. La t.ibla 4.1
o un espacio muestra! para tirar un par de dados, El espacie maestral para el tiro de: un wlo dado es
11. 2. 3, 4 ,5, 6).
El espacio mue:.tral puede avudar a encontrar probabilidades, Suponga que un experimento o
tirar un par de dado>. Cu.il es la probabilidad de que el dado sume 71 Un examen del espacio muestral que se ilu$tra en la tabla .f. l deja ver que son seis resultndos en lo> que la suma del dado ea
7-1(1,6), (2,5),(3,4),(-1,3), (5,2).16.1))-cn el total posible de J6cvcnto,s1mplc.en el espacio muestral. Al usar t>ta informacin, podemo concluir que la probabilidad de tirar un par de dados sumen 7
o 6136, o $ta .1667. Sin embargo, el uso del esp.1C10 muesrral para determinar probabilidades es engorroso y dificil de manejar cuando el espacio rnuestral e grande. Por tanto, lo> experto> en t>tad1tica
utilizan otro' mtodos m.1< dicientes para determinar probablidade .
Uniones e intersecciones
La notcin de conjunto , e decir, el u.'IO de llaves para agrupar numeras, se utilu como hertamienta rnnb6lica pura 11mants t inttr~11t5 en e-te capitulo. la unin de X. r se forma al romb111i1r tltmentas dt ambo.1 ron1111tos y$(' denota X u r. IJn elemento se d.i.ifrca en la unin de x. r si C>t~ ra
sea en X o en Yo tanto en X como en r. la expresin de unin X U r se puede traducir en X o r. Por
ejemplo. $i:
X= (1,-1,7,91 y }' m /2.3.-1.5.6)
xu r-11.2.3.4.5.6.7,91
Kte.e que todo. lo. valores de X y todo. lo. valoro de re.un en la unin: sin embargo, ningu
no de lo> \<l10rQ aparece mh de una vez en la unin. En la figura -1.3, la regin sombreada del diagra
ma de \'enn denota la unin.
Una interseccin se denota X n r. Para da.;ficarsc en la interseccin. un demento debe e tar tanto
en X como en r. La interseccin conucn /oj elementos co1111mc.1 dt ambo; conjuntos. Por tanto, el -imbolo de interseccin. n, se lec a veces como y, La interseccin de X. Y se lec como X y Y. Por ejemplo, vi:
X= ft,-1,;,91 y l' /2,J..1.5,61
xn Y!-11
:-:tesc que slo el valor de -1 es comn a lo> do. conjunto X y Y. La interseccin e> m.> cxdu'i"a
que la unin r por tanto es igual O (por lo general) ms pequea que la unin. los elementos deben ser
carscten tico' tanto de X como de r para da)ificar. En I~ figura 4.-1, la regin sombreada denota la
iotcncin.
FIGURA 4.3
Una unin
FIGURA 4.4
Una interseccin
CAPITUL04
PROBABIUD.\D 103
mutuamente excluyente con el evento de que el comprador B compre el edificio. Al tirar una moncd.J.,
el que caiga can o cruz es un evento mutuamente excluyente. La persona que lance al aire una moneda ver o cara o cruz. pero nunca ambas. En el uro de un par de dados. el evento (6, 6), mulas, es
mutuamente exclusivo con el evenro ( 1, 1) ojo de vbora, Obtener mula. y ojos de \1bora en el mismo
tiro de dados es imposible.
La probabilidad de que se presenten dos eventos mutuamente excluyc:ntQ al mismo tiempo es cero,
~L''TO XyY
:TUAME.''TE
Dll.l1YfXTES
P(X'I Y) O
Eventosindependientes
Dos o mh eventos son eventos independientes ~laocurrencia o no ocurrtnda dt 11no dt los evento no
afra la ocurrtnda o no ocurrtnda dtl otro ntnto(s). Cienos experimentos, por ejemplo tirar dados,
dan eventos independientes: cada dado es independiente del otro. Que )a!ga un 6 en el primer dado no
inOu)e en el segundo dado. Los~
al aire de moneda. siempre son independientes entre si. El evento de que salga cara en el primer tiro al aire de una moneda es independiente de que salga cruz en el
segundo tiro. En general se piell.\a que ciena. caractersricas humana. son independientes de otros
C\CntO. Por ejemplo, es probable que ser zurdo sea independiente de la posesin de una tarjeta de er
dito. E. probable que i una pe~na u.a lentes o no. esto es independiente de la marca de leche que
prefiera.
)lfuchos experimemos que utiliun seleccin aleatoria pueden producir evento. independientes o
no independientes. En e.to experimento>. lo resuhados son independientes si el muestreo se hace con
reemplazo; es decir. despub que cada elemento se seleccione y se determine el resultado, el elemento se
reintegra a la poblacin y la poblacin " revuelve, En t'Sta forma, cada tiro se hace independiente del
tiro prevro. Suponga que un inspector selecciona al azar tomillo. de un depsito que contiene 5% de
pi~ defectuosas. Si el inspector muestrea un tomillo defectuoso y lo Tegm.1 al depsito, en el segun
do saque todava habr 5% de piezas defectuosas en el dcp)ito sin considerar el hecho de que el primer resultado fueran sido pieza defectuosa. S el inspector no regresa la pieza en el primer saque, la
segunda pina no es independiente de la primera; en este caso. quedan menos de 5% de piezas defectuo~ en la poblacin. Por tanto. la probabilidad del segundo resultado o dependiente del primero.
Si X e Y son independientes, se utiliza la siguiente notacin.
Eventoscolectivamente exhaustivos
Una li ta de "en tos colectivamente exhaustivos contiene todos los posibltS tltrnmtos sunpla
experimento, En consecuencia, todos los espacios muestrales son listas colectivamente ~La
ti.ta de posibles resultados por tirar un par de dados, contenida en la tabla 4.1, es una bu cXJl~:q..
mente exhaustiva, El espacio muestra! para un experimento se puede describir como um
to> que son mutuamente excluyente. y colectivamente exhaustivos, Los eventos de espKJO
se traslapan o intersecan, y la lista est completa.
Eventos complementario
s
El complemento de un "coto .A se denota como A', que se Ice no A. Todos los non:::s
experimento no m A comprtndtn su complemento. Por qemplo, si al tirar un dado d ~A
doe2
P(A')
DEA
=1
- (A)
Suponga que 32% de lo$ empleados de una compaMa tienen grado universitario, Si un empleado se
selecciona al azar de la c:ompailla, la probabilidad de que la persona no tenga grado universitario es
1 - .J:? .68. Suponga que 42% de todas las piezas producidas en una planta se moldean en la maquina A r J 1 % en la mquina B. Si al azar se selecciona una pieza, la probabilidad de que fuera moldeada.
no por b mquina A ni por la mquina Bes de 1 - .73 .27. (Suponga que una pieza se moldea ~lo
en una mquina.)
Conteo de posibilidades
En ~llc:a,
es posible usar un conjunto de tcnicas y reglas para contar el nmero de resultados que
pueden ocurrir para un experimento en partic:ular. Algunas de estas reglas y tcnicas pueden delinear
d tamaAo del espacio muestral. AquJ se presentan tt de estos mtodos de conteo.
La regla de conteo mn
Suponga que un cliente decide comprar un auto nuevo de cierta marca.Las opcioaes para el auto induym dos motora difercnto,cinco colores diferentes de pintura y tres paquetes del interior Si existe cada
una de esus opciones con cada una de I~ otras, de cuntos autos diferentes podra escoger el cliente!
Para determinar C\tc nmero. podemos usar la regla de conteo
m".
lAR.EGlADE
CO~"TtO..,,
Para um opaacin que se puc:da hacer en m formu )' una squncb o><racin que se pueda hacer en n
!onms. w dM operaciones pueden ocurrir, en orden, en mn form.u. bta ~la se pu~ atcnckr a ~
con ucs o ms operaciones.
Con el 11$() de la regla de conteo mn podemos determinar que el comprador del auto tiene disponibk$ (2) (5)(3) ., JO diferentes combinaciones de motor, color de pintura e interiores del auto.
St:p0r.p que un investigador desea iniciar un diseo de invotigacin para estudiar le efectos del
sfncro (M, F), estado civil (soltero, divorciado, casado) y clase econmica (baja, media y alta) en la frecuencia de compras de boleto) de avin por ao, El inve tigador iniciarla un diseo en el que se toman
1 S muestras diferentes para representar todo) los grupo) posible generados por estas caracteruticas del
cliente,
.
Nmero de grupos (Gnero) (estado civil) (clase econmica)
(2) (J) (J) 18 grupo)
plazo darla:
(N) po$ibildad~
FIGURA 4.5
Donde:
El complemento
del evento A
N = tamallo poblacional
A'
" = tamao
mucstral
Por ejemplo, cada vez que se tire un dado que tenga seis lados
los multados son independientes (con reemplazo) del tiro ante
rior, Si un dado se tira tm vece. en sucesin, cuntOi resultados
CAPITIJLO 4 PROBIJ!ll.JD.U>
IOS
diferentes puede ocurrir? Esto es, cuil es el tanullo del espacio muestrsl para este experimento? El
tamatlo de la poblacin, N, c. 6. lo. sris lados dd dado, ~1.1mo muestreando tres tiros de dados. n .. 3.
El opado muestra! es:
(]\.')~ - (6)3 - 216
Suponga que en una lotera se ucan seis nmeros de lo. dgitru del O al 9, con reemplazo (10) dgitos $C pueden usar otra \'C7). Cuntas agrupaciones diferente de sch nmeros se pueden ucar? N es
la poblacin de 10 nmeros (0 al 9) y ne el tamao rnuestral, sri$ nmeros,
(N) (10)6 1000000
Esto o. existe un milln de nmeros de seis dig11os!
po.bilidades.
Por ejemplo, suponga" que una pequee empresa de abogado. tiene 16 empleados y tres de ellos
han de ser seleccionados al v.ar para representar la compaJ\ia en la reunin anual de la American Bar
A,.(~iation. Cunta. diferentes combinaciones de abogad()) podran set enviadas a la reunin? Esta
situacin no permite muestrear con reemplazo porque tres diferente. abogado. .crn seleccionados
para asistir. Este problema se resuelve con el uso de combinadones: N 16 y n 3, as que:
16!
111C. = 16C3 =--=560
3!13!
Un total de 560 combinaciones de tres abogados podrian seleccionarse para representar la firma.
(.1
PROBLEMAS
4.1 Un proveedor remiti un lote de ~is piezas a una compea, tres de la. cuales estaban defectuosas,
Suponga que el cliente dccid seleccionar al azar do. pa.a) r probarla. para ver si tenan defeetos. Qut tan grande es un c:.pado muestra! con el que esti trabajando potencialmente el cliente?
Haga una li>ta del espacio. Con el uso de la lista del espacio maestral, determine la probabilidad de
que el diente seleccione una muestra con exactamente un defecto.
4.2 Dado X 11. 3, 5, 7, 8, 9). r 12. 4, 7, 91 y Z.,. { r, 2, 3, 4, 71, resuelva lo siguiente.
xuz-_
b. xnr-_
c. xnz_
d. xu ruz-_
e.
n Y nz=_
(X u Y) n
g. (Y n Z) u ex n Y) _
h. x o r - _
i. YyX_
4.3 S una poblacin consta de lo nmeros pares positivos hasta 30 y si A (:Z. 6, 12, 24 (~es A!
4.4 El 5i~tema telefnico 800 del scrvicio a clientes de una compallla est~ instalado de modo que quien
llama tiene sei.\ opciones. Cada una de estas seis opciones lleva a un men con cuatro opaotlCl-o
Para cada una de estas cuatro opciones existen tres opciones ms. Para cada una de esas un
opciones estn presentes otras tres opciones. Si una persona llama al nmero 800 pidiendo IJUda,
cuntas opcione en total son posibles?
4.5 Un recipiente contiene seis piCU5. de la~ cuales dos estn defectuosas v cuatro son acqiubles. 51
tres de ta. seis pieza. se seleccionan del recipiente. qut' tan grande es el csp300 muntraP. (CWI
regla de conteo utili76 usted y por qu~? Para este espacio maestral, cuil es la probabilid.ld de que
exactamente una de Lu tres pi~'US muestreadas sea defectuosa!
c.
z _
<t.6 Una compaflla coloca un nmero de serie con siete dlgito en cada pieza que fabrica. Cada digito
del numero de serie puede ser cualquier nmero de O a 9. U dgit~ se pueden repetir en el nmero de serie. Cuntos numeres de serie diferentes son posibles!
<t.7 Una pequer\a compatl.ia nene 20 empleados, seis de los cuales sern seleccionados al azar para ser
entrevstados como parte de un programa de ~tisfaccin de empleado . Cuit' grupos diferentes de se se pueden seleccionar!
Conjuui
conjuntas y
::::r.i:!Qonales
P(,\1
P\XvY)
P(Xn Y)
P\Xh1
La
La
probabilidad
QIXXyl"
ocurran
La
probabilidad
QIXXyt'
ocurran
La
probabilidad
QIXX
probabllidad
QIXX
ocurra
ocurro
dado qlk'
r ha ocurrido
Utiliza multados
posibles
loulntnd
dtnomi-iot
V1ibu rnuludos
posibln
IOblamd
daiomimdor
U1ilw rnulwloa
poliblcs
1ocalaen d
daiomllwlor
U1iliu d aub1ow
d~lotpoubla
rnuludo>md
dmominador
Ul' GE.'."tRAl.
DE LA ADICJON
Yankelovich Partners llev a abo un estudio para la American Society of Interior De igners en el
que se pregunt a trabajadores cu.iles eran los cambios en disd\o de oficinu que aumentarian la pro
ducuvidad. A quienes respondieren se les permiti contestar m~ de un tipo de cambio de diseo. El
cambio nmero uno que 70% de lo trabajadorts diieron aumentara la productividad era reducir el
ruido. En segundo lugar~ espacio de almacenamiento o de archive.seleccionado por 6i% de los rrabaiadores, Si al aur 5C selecciona uno de quienes respondieron y se le pregunta qu cambio) de diseo
de oficina aumentarla la productividad del trabajador, cul es la probabilidad de que esta persona
seleccionaria la reduccin de ruido o m copado de almacenamiento o de archivo?
Hagam06 que N represente el evento "reducir ruido y que S represente el evento ms espacio de
almacenamiento o de archi-o': La probabilidad de que una persona responda con N o S se puede simbolizar estadsticamente como una probabilidad de unin con el uso de la ley de la adicin.
P(:SUS)
Para satisfacer con xito la bsqueda de una persona que responda con reducir el ruido o m.is ~cio de almacenamiento o de archivo, slo necesuamos encontrar una persona que drsce 11/ menos aDO
de estos eventos. Como 70% de los entrevistados respondieron que reducir el ruido crearla mis preductividad, P(!') ... 70. Adcm.t\, como 67% respondieron que aumentar el espacio de almacmar:llt!lto mejorara la productividad. P1 S
.67. Cualquiera de bto. s.atisfaria el requisito de la unin. Por
tanto, la solucin del problema parece ser
P(N U SI P(N)
+ PIS)
.i'O
+ .67
1.37
,flGURA 4.7
.. ~
Despeje de la unin
en el problema
de productividad
en oficinas
!'o obstante, )'a establecimos que las probabilidades no pueden ser mis de 1.00. l es el problema aqul1 NttM! que todas
las personas que respondieron que tanto, reducir el ruido como
aumenur el espacio de almacenamiento mejorara la productividad se incluyen en cada una de 1.. probabildades marginales P(N)
y Pl,S1. Ciertameme una persona que responda y recomiende estas
dos me;oru debe incluirse como que favorece al menos una. Sin
embargo. como an incluidas en el P\N) y el P(S), las personas
que recomendaron ambas mejora se cuentan doblement. Por esa
rvn, la ley general de la adicin resta la probabilidad de interseecin, PIN n S).
F.n la figura 4.7, diagram.i. de Venn ilustran este anlisis. Ntese
que el rea de interseccn de N y S esU doblemente sombreada en
el diagrama A, lo que indica que se ha contado do. veces. En el da
grama 8, el sombreado es consistente en todo N y S porque el rea
de interseccin se ha resudo. Por Unto el diagrama 8 ilusua la apli
caci6n correcta de la ley general de la adicin.
Entonces cual es la respuesta a la pregunta de probabilidad de unin de Yankelovich Partners!
Suponga que 56% de todos los que respondieron a la encuesta habian dicho que tanto la reduccin de ruido
romo aumentar el espacio de almaanamiento o de archh~ mejorara la productividad; P(N n S) 56.
Entonces podramos usar la ley general de la adicin para resolver la probabilidad de que una persona
responda que ya sea la reduccin de ruido o aumentar espacio de almacenamiento mejoraran la productividad.
PlN U S)"' P(N)-+ PI.Si - P\N l SI
Por tanto. 81 'MI de los trabajadores encuestados respondieron que ya sea la rtd11cri6n dt mido o
aumentar t$pacio de almactnamicnto mejoraran la productividad.
Matrices de probabilidad
Ademis de las frmul~ otra berramiema til al resolver problemas de probabilidad es una matriz de
probabilidad. Una matriz de probabilidad; mueura las probabldadcs malfnalts y las probabilidadts
dt m1mccci6n dt un problema dado. Las probabilidades de unin y probabilidades condicionales deben
ser calculadas desde la matriz, En general, una matriz de probabilidad se construye como un cuadro
de dos dimensiones con una variable en cada lado del cuadro. Por ejemplo, en el problema del diseo de
una oficina, la reduccin de ruido estarla en un lado del cuadro y aumentar el espacio de almacenamiento en el otro. En este problema, una fila S y una fila No se aeartan para una variable y una columna Si y una columna ~o se crcarian para la otra variable, como se ve en la tabla 4.2.
Una vci creada la matriz. podemos escribir las probabilidades marginales. P(N) .70 es la proba
bilidad margiiul de que una persona responda si a la reduccin de ruido. Este valor se coloca en el margen de la fila de SI a reduccin de ruido, como se ve en la tabla 4.3. Si Pt ~) .70, entonces 30% de las
personas entrcviiudas no pensaron que la reduccin de ruido aumentar1.1 la productividad, Por tanto,
P\no :-;") 1 - .iO = .30. E:.te valor, tambin una probabilidad marginal, va en la fila indicada por No
bajo reduccin de ruido. En la columna bajo, S para aumentar espacio de almacenamiento. se registra
la probabilidad marginal P(S - .67. Finalmente, la probabilidad marginal de No para aumentar espacio de almacenamiento. pt no S
1 -0.67 se coloca en la columna No.
TABLA 4.2
Matriz de probabilidad para
el problema de disello de
oficinas
"IUl.A4.3
SI
~~-ma
OfHldo de 41lmtiamrmiento
de diseo de
No
Sl~.70
~.as
Noa.3
.67 .33 l.00
llllA
4.4
-e
~
.67
En esta matriz de probabilidad se dan las cuatro probabilidades marginales o se pueden calcular
con slo usar la probabilidad de una regla complemento, P(no S) = 1 - P(S). La interseccin de reduccin de ruido y aumentar espacio de almacenamiento se da como P(N n S) = 0.56. Este valor se escribe en la matriz de probabilidad en la celda bajo S S, como se ve en la tabla 4.3. El resto de la matriz se
puede determinar al restar, de las probabilidades marginales, los valores de la celda. Por ejemplo, restar
0.56 de 0.70 y obtener 0.14 da el valor para Ja celda bajo S por reduccin de ruido y No por aumentar
espacio de almacenamiento. En otras palabras, 14% de todos los que respondieron la encuesta dijeron
que la reduccin de ruido mejorara la productividad pero el aumento de espacio de almacenamiento
no la mejorara. Llenar el resto de la matriz resulta en las probabilidades que se ven en la tabla 4.3.
Ahora podemos resolver la probabilidad de unin, P(N U S), en al menos dos formas diferentes
con el uso de la matriz de probabilidad. El enfoque est en la fila S por reduccin de ruido y la columna S por aumentar espacio de almacenamiento, como se ve en la tabla 4.4. La probabilidad de que una
persona sugiera reduccin de ruido o aumentar espacio de almacenamiento como solucin para mejorar la productividad, P(N U S), se puede determinar a partir de la matriz de probabilidad al sumar las
probabilidades marginales de Sf para reduccin de ruido y S para aumentar espacio de almacenamiento y luego restar la celda S S, siguiendo el modelo de la ley general de probabilidades.
P(N U S) = 0.70 (dela fila S)+ 0.67 (de la columna SO
- 0.56 (de la celda S S) = 0.81
Otra forma de despejar la probabilidad de unin de la informacin mostrada en Ja matriz de probabilidad es sumar todas las celdas en cualquiera de las filas o columnas S. Observe lo siguiente de la
tabla 4.4.
P(N U S) = 0.56 (de la celda S S)
+ 0.14 (de S en reduccin de ruido y No en aumentar espacio de almacenamiento)
+ 0.11 (de No en reduccin de ruido y S en aumentar espacio de almacenamiento)
= 0.81
PROBLEMA DE
DEMOSTRACIN
4.1
Los datos de la compaa cliente del Dilema de decisin dejan ver que 155 empleados trabajaron uno de cuatro tipos de posiciones. Aqu se muestra de nuevo la matriz de valores sin procesar (tambin llamada cuadro de contingencia), con las cuentas de frecuencia para cada
categoray para subtotales y totales que contengan un desglose de estos empleados por tipo de
posicin y por gnero. Si un empleado de la compaa se selecciona al azar, cul es la probabilidad de que el empleado sea mujer o un trabajador profesional?
l l 0 ESTADISTICA zx
LO)
SEGOC"JO!>
DATOS OE RECURSOSHUMANOS OE COMPAMA
Hombr
Mu1er
Gerencial
11
1lpo
Profesional
31
13
"
po9k10n
Tknlco
52
17
69
Of'ICinita
22
31
100
55
155
Sol11<in
Denotemos por F el evento de mujer y P denota el evento de trabajador profesional. La pregunta
es
PIF U PI
u PI
Para resolver esta probabilidad con el uso de una matriz. se puede ya sea usar la matriz de
valores sin procesar que vimos previamente, o bien, convertir la matriz de valores sin procesar
a una matriz de probabilidad al dividir todos y cada uno de los valores de la matriz entre el valor
de N. 155. La matriz de valor sin procesar se utiliza de un modo semejante al de la matriz de probabilidad. Para calcular la probabilidad de unin de seleccionar una persona que es ya sea mujer
o trabajador profesional de la matriz de valor sin procesar, se suma el nmero de personas de la
columna Mujer !551 al nmero de personas del rengln Profesional 1441, luego se resta el nrnero de personas en la celda de interseccin de Mujer y Profesional 1131. Este paso da el valor de
55 + 44 - 13., 86. Dividir este valor (86) entre el valor de N(155) produce la probabilidad de unin.
P(F U PI 86'155 .555
Una segunda forma de obtener la respuesta a partir de la matriz de valor sin procesar
sumar 1odas las celdas una vez que estn ya sea en la columna Mujer o en la fila Profesional
es
3 + 13 + 17 + 22 + 31 - 86
y luego dividir entre el nmero total de empleados. N 155 se obtiene:
P(F U PI
PROBLEMA DE
DEMOSTRACIN
4.2
861155 .555
A con1nuacin se muestran la matriz de valores sin procesar y la correspondiente matriz de probabilidad. para los resultados de un estudio nacional de 200 ejecutivos a quienes se pidi idan
tificar la ubicacin geogrfica de sus compaflas y el tipo de industria de las mismas. A los
ejecutivos slo se les permiti seleccionar una ubicacin y un tipo de industria.
Noreste
Sureste
Regln
central
Oeste
Finanzas A
24
10
14
56
Manufacturas 8
30
22
12
70
28
18
12
16
82
34
71po
de
lnduUrla
Comunicacion11C
200
MATRIZ DE l'ROBABIUDAD
Noreste
Sureste
71po
de
lndwtrlll
Medio
oeste-Regin
central
Oeste
.12
.05
.04
.07
.28
M11nuf11C1urasB
.15
.03
.11
.06
.35
Comunicaconu C
.14
.09
.06
.08
.37
.41
.17
.21
.21
Fin11n1111A
1.00
Suponga que de estos datos se selecciona al azar uno de los que respondieron al estudio.
a. Cul es la probabilidad de que quien respondi sea del Medio Oeste-Regin central (Fl7
b. Cul es la probabilidad de que quien respondi sea de la industrie de comunicaciones
(CI o del noreste IDl7
c. Cul es la probabilidad de que quien respondi sea del sureste (El o de la industria de
finanzas (A17
Solucl6n
a. P(Reginl
b. PIC U DI
c. P(E U Al
P(F)
.21
Al calcular la unin con el uso de la ley general de adicin, la probabilidad de interseccin se resta
porque ya est incluida en ambas probabilidades marginales .. Esta probabilidad ajustada deja una probabilidad de unin que apropiadamente incluye "atores marginales> el valor de interseccin. Si Ja proba
bilidad de interseccin -e rt>ta una segunda vez, la Interseccin se elimina, dejando la probabilidad de
X o Y pero no ambas.
P(X o Y) pttO no ambu P\Xl + PO') - P(X n Y) - P!X n Y) P(X u Y) - Pi.\' n Y\
En la figura 4.8 es el diagrama de Venn para esta probab~
E:cnodeXo Y
~no ambos
flGUIA 4.9
El componente de
una unin: la
regin nVni
P(ni X ni Y)
= P(no X n no Y)
1 - P(X
u Y)
P(S) - P(N
n S)
70
+ .67 -
.56 .81
n no S)
Entonces, 19% de los trabajadores no seleccionaron reduccin de ruido ni mayor espacio de alma
cenamlemo como soluciono para aumentar la productividad. En la tabla 4.J, esta probabilidad ni/ni
se encuentra en la celda No No de la matriz, 0.19.
+ P( Y)
Denotemos por M d evento "demasiado trabajo" y por 1 el evento "proceso intficiente': La preguna a:
P(M U 1) ?
Como el 18% de quienes contestaron dijeren demuiado trabajo':
P(M} .18
Como el 8% de quienes contestaron dijeron "proceso ineficiente",
P(I) .08
Dado que no es po ible seleccionar m.b de una re puesta,
P(M n 1) ... 0000
La implementacin de la ley especial de adicin da
PIOBLEMA DE
BEMOSTRACIN
4.3
u Ol
Pm + P(Ol = ~
+ .1.!..
155 155
100
155
645
PROBLEMA DE
DEMOSTRACIN
4.4
= P(Pl +
P(Ol ~
155
.1.!..
'"' ~
155 155
484
Utilice los datos de les matrices del problema de demostracin .2. Cu61 es la probabilidad de
que uno de quienes contestaron, escogido al azar. sea del Sureste o del Oeste?
PIE U Gl 7
Soludn
Debido a que la ubicacin geogr6fica es mutuamente excluyente (la ubicacin del trab91() Yll
sea en el Sureste o en el Oeste pero no en ambos),
PIE U Gl
.17
+ .21
.38
4.2 PROBLEMAS
4.8 Dado P(A) .10, P(B) .12, P(C} .21, P(A n C) .05 y P(B
siguiente.
n C}
.03, resuelva lo
c. S1 A y B son mutuamente excluyentes. P(A U 8) =V I< valores de la matriz para resolver lu ecuaciones dadas.
D
12
10
a. P(AU D) _
b. P(EUB) _
c. PIDU E)_
d. ptCUF)_
4.10
a.
b.
c.
d.
.10
.O)
.04
,12
.27
.06
.)1
.07
P(AUF) _
P(EUB)=_
PtBUC)
P(EU F) _
4.11
Suponga que 47% de todos los estadounidenses han volado en avin por lo menos una vez y que
2 % de todo. los estadounidense han viajado en un tren por lo meno> una \U. Cul es la probabilidad de que un estadounidense seleccionado al aur haya viajado en tren o volado en avin?
Plttde resolverse este problema? Bajo qu condiciones puede resolverse? Si el problema no se
puede resolver, qu informacin es necesaria para que pueda resolverse!
4.12
~
b U.S. Bureau of labor Statistic, 75% de mujeres de 25 a 49 al'I~ de edad participan en la
fueru de trabajo. Suponga que 78<\0 de las mujeres de ese grupo de edades o casada. Suponga
tambitn que 61% de todas las mujeres de 25 a 49 ailos son casadas y participan en la fueru de
trabajo.
a. Cuil es la probabilidad de que una mujer de ese grupo de edades seleccionada al aur set
casada o participe en la fuerza de trabajo?
b, W e. la probabilidad de que una mujer de ese grupo de edades seleccionada al azar sea
casada o participe en la fueru de trabajo pero no en ambas?
c. Cul es la probabilidad de que una mujer de ese grupo de edades seleccionada al az.ar no sea
casada ni participe en la fueru de trabajo?
4.13 Segn ~iel-cn .\tedia Research, aproximadamente 67% de hogaru en Estado> Unido con televisin tienen televisin por cable. Setenta y cuatro por ciento de todos los hogares de Estados
Unido .. con televisin tienen dos o ms televisores. Suponga que 55% de todos los hogares
de Estado~ Unidos con televisin tienen televisin por cable y dos o ms televisores, Un hogar de
Estad~ Unido> se selecciona al azar.
a. Cul es la probabilidad de que el hogar teng.1 televisin por cable o dos o m.U televisores?
es la probabilidad de que tenga televisin por cable o dos o mi televisores pero no
ambos?
b, Cul
c. Cu.il es la probabilidad de que no tenga televisin por cable ni do. o m.is tde-."Ores?
d. Por qu la ley especial de la adicin no se aplica a este problema?
4.14 Un estudio realizado por la :-:orthwc.tern University Lindquist-Endicon Repon pidi a 3~
cornpaas informaran sobre los procedimiento. que usan p.ira contratar personal, Slo S4% de las
que contestaron revisan la copia de la universidad del solicuante como parte del procese de contratacin, y slo 44% considera referencias de una facultad. Suponga que e.to porcentajes son
verdaderos para la poblacin de compaas en Estado. Unidos y que 35% de t~ ~ comp.u'lla.
usan la copia de la universidad del solicitante y su referencias de facultad.
L Cul es la probabilidad de que una compatlla seleccionada al azar utilice ya sea referencias de
facultad o copia de la universidad como parte del proceso de contratacin?
b. Cul es la probabilidad de que una compallia seleccionada aJ azar utilice ya ~ referencias de
facultad o copia de la universidad, pero no ambas, como parte del pl'OCC)() de contratacin?
c. Cu.il es la probabilidad de que una compall.la seleccionada aJ azar no utilice referencias de
facultad ni copia de la universidad como partedel proceso de contratacin?
d. Construya una matriz de probabilidad para este problema e indique las ubicadones de sus
respuestas para las panes (a), (b) y (e) en la matriz.
li
LEYES DE LA MULTIPLICACIN
ley general de la muhiplicacin
Como se expres en la -cin 4.4, la probabilidad de la interseccin de do. eventos (X n Y) recibe el
nombre de probabilidad conjunta. La ley general de la multiplicacin se usa para encontrar la probabilidad conjunta:
u:r GE.'-'EVJ.
MU.
P(X
Mt.'U1PUCACJ0N
La notacin X n Y significa que X y\' dtbni ocurrir.La ley general de la multiplicacin da la probabilidad de que tanto ti evento X como ti C\en10 Y ocurran al mismo tiempo.
Segn la U.S. Bureau of Labor Stati<tic~. 46% de la fuerza de trabajo en Estados t.:nidos son muieres. Adems, 25% de las muieres de la fuerza laboral trabajan tiempo parcial. Cu.1.1 es la probabilidad
de que un miembro seleccionado al azar de la fuerza laboral en 81ado. Unido. sea mujer y trabaje
tiempo parcial! Esta pregunta es de probabilidad conjunta, y la ley general de la multiplicacin <e puede
aplicar para responderla.
Denotemos por W el evemo de que el miembro de la fuerza laboral su mujer. Denotemos por T
el evento de que el miembro es trabajador tiempo parcial. La pregunta C):
ptWnT)?
Segn la ley general de muluplicacin, este problema se puede resober con:
P(W
n T) - Pl W) PCTIW)
, AGUR,A 4.10
Probabilidad
con1unta da qua
una mujer est' en
141 fuerza laboral y
tea trabajadora de
tiempo parcial
P(W
P(Wl"'IT).115
n T)
--
TABLA 4.5
....
......
Matriz de probabilidad de
datos de recursos humanos de
campal'Ha
.6&5
...,
.071
,ua
M5
.214
f; . .MI
.21111
..
1.000
~tmninar probabilidades conjuntas a partir de valores sin procesar o de matrices de probabilidad es fcil porque cada celda de estas matrices es una probabilidad conjunta.De hecho, algunos expertos en estadistica llaman cuadro dt probabilidadconjunta a una matriz de probabilidad.
Por ejemplo, supongamos que la matriz de valor sin procesar de datos de la compataJa diente, en
el problema de demostracin 4.1 y el Dilema de decisin, se conviene a matriz de probabilidad al dividir entre el nmero total de empleados (N = 155), con lo cual resulta la ubla 4.5. Cada valor de celdas
de la ubla 4.5 es una interseccin, y la ubla contiene todas las posibles interseccicnes (probabilidades
conjuntas) para lo) eventos de gnero y tipo de posicin. Por ejemplo, la probabilidad de que un trabajador seleccionado al azar sea hombre y trabajador tcnico, P(M n T}, es .335. La probabilidad de
que un trabalador seleccionado al aur sea mujer y trabajador profesional, f'\F n P), es .084. Una''
construida una matriz de probabilidad para un problema, por lo general la forma m.h fcil para despejar la probabilidad conjunta es encontrar la celda apropiada de la mauit y seleccionar la respuesu,
~o ob)unte, debido a lo que se da en un problema, a veces el uso de la frmula es ms fcil que construir la matriz,
PROBLEMA DE
DEMOSTRACIN
4.5
Una compal'la tiene 140 empleados. de los cuales 30 son supervisores. Ochenta de los empleados son casados, y 20% de los empleados casados son supervisores. Si se selecciona al azar un empleado de la compal'lla, cu" es la probabilidad de que el empleado sea casado y sea supervisor1
Soluci6n
Denotemos por M a un casado y por S a un supervisor. La pregunta es:
P(M
n S)
~ 5714
140
Luego entonces, ntese que 20% de los empleados casados son supervisores, es la probabilidad
condicional, P(S M) = .20. Finalmente, al aplicar la ley general de la multiplicacin tendremos
P(M
n S)
= .1143
Por tanto, 11.43% de los 140 empleados son casados y son supervisores.
PROBLEMA DE
DEMOSTRACIN
4.6
a.
P(B ()El
b. P(G ()Al
c. P(B n C)
'2.
Oeste
Surest
24
10
14
56
30
22
12
70
28
18
12
16
74
34
42
42
200
Finanzas A
Comunicacion ..
Regin
Noreste
central
82
MA11bZ DE l"ftOeAM.JDAD
Noreste
Sureste
1'1o
tM
lndwrria
Regln
central
Oeste
.12
.05
.04
.07
.28
Manufacturas 8
.15
.03
.11
.06
.35
.14
.09
.06
.08
.37
.21
.21
1.00
FinanznA
Comunicaciona
17
.41
De la celda de la matriz de probabilidad, PIB n E) 61200 .03. Para resolver por le frmula PIB n El PIBI
La probabilidad PIEIBI de que E ocurra, dado que B ha ocurrido, se puede determinar con
la matriz de probabilidad como PIEIB) .031.35. Por tanto,
PB
n El
PB PEIB
35
(353)
.03
nE
PE
PBIE
.17c~)-
.03
b. Pare obtener PIG n Al, encuentre la celda donde se cruzan G v A en la metnz de probeb1lided, 0.07. o use una de las siguientes frmulas:
PG
nA
PG PAG .21(~~)-
.07
PG
nA
.07
o bien,
TABLA 4.6
Table de contingenciade datos
de eventos independientes
D
E
:~:
Cm
n CI
.O
IS
)4
51
85
Si lo.\ eventos X y Y 50n independientes,e> posible usar una ley especialde multiplicacinpara encontrar
la intcrscin de X y r. futa ley especial utiliza d hecho de que cuando do. eventos, X. y son independientes, P(X!Y)- P(.>ol y P( YIX) - PI. Y). Por tanto,la ley general de la multiplicacinP(X n Y) - P(X)
P(.\1}') \C luce P(X n Y) P(.>ol P( Y) cuando X y Y son independiente>.
LEY ESPEClAL
DEU.
Si X. Y son independientesPIX
MUlllPUCACION
n Y)
PtX) P( Y)
Un estudio realizado por Bruskin-Goldring Research para SEIKO encontr que 28'141 de adulto.
estadounidensepimsa que el cajero automticoha tenido el impacto ITW imponanteen la vida diaria.
Otro estudio de ~id M1cluelson & Associates para Dale Camegie & Associate. eumin lo> puntos
de vistade Cll'.f'kad0$. sobre el espritu de equipo en el lugar de trabajo. y descubrique 72'141 de todos
los empicados pimsa que trabajarcomo parte de un equipo reduce el estrs, Los puntosde vina de personas sobre CIJCTOS automticos, "<>n independientesde su> puntos de vista cobre el espritu de equlpo en d h:.-pr de trab3jo? Si son independientes,entonce> la probabilidad de que una persona ~a
sdeccionada al aur, que piense que el cajero automtico ha tenido un impacto importanteen la vida
diaria y que uabar como parte de un equipo reduce el estrs, se encuentra como sigue. Denotemos
por A un ajm> automticoy por S que el trabajo en equipo reduceel estr,.
P(A - .28
P(A) .28
P(A
Por Wlto. ~.16'9 de la poblacinpiensa que el cajero autom.tticoha tenido un impacto importanteen
la ida diaria y que trabaiar como parte de un equipo reduce d c~trb.
PROBLEMA DE
DEMOSTRACIN
4.7
Una empresa manufacturera produce cuadernos de papel, de los cuales 3% estn mal encuadernadas. Al azar, un inspectorescoge dos y una a la vez. Debido al gran nmero de cuadernos
que SI producen durante la inspeccin, el muestreo que SI realiza es. en esencia, con restitucin.
Cul es la probabilidad de que dos cuadernos seleccionados estn mal encuadernadas?
Solucin
Denotemospor 1 un encuadernado incorrecto. El problemaes determinar
Pll1n1211
Le probabilidadde 1 -O .03, o 3% es que son incorrectamenteencuadernadas.Como el muestreo
se realiza con reemplazo. los dos eventos son independientes.Por tanto:
PU1n121
Casi todas las matrices de probabilidad contienen variables que no son independientes.Sl
una matriz de probabilidad contiene eventos independientes.la ley especial de la multiplicacin
CAPITULO 4 PROBABILIDAD
119
se puede aplicar. Si no, la ley especial no se puede usar. En la seccin 4.7 exploramos una tcnica para determinar si son eventos independientes. La tabla 4.6 contiene datos de eventos independientes.
Utilice los datos de la tabla 4.6 y la ley especial de la multiplicacin para encontrar P(B n D).
Solucin
P(B
D)
= P(B)
P(D)
5o
= 85
34
85
= . 2353
Este mtodo funciona slo para cuadros de contingencia y matrices de probabilidad en las
que la variable de un lado de la matriz es independiente de la variable del otro lado de la matriz.
Ntese que la respuesta obtenida con el uso de la frmula es la misma que la respuesta obtenida con el uso de la informacin de la celda de la tabla 4.6.
P B n D) = ~~ = .2353
U PROBLEMAS
4.15 Use los valores del cuadro de contingencia para resolver las ecuaciones dadas.
C
A
11
16
a. P(An E)=_
b. P(DnB) =_
c. P(Dn E)=d. P(AnB) =4.16 Use los valores de la matriz de probabilidad para resolver las ecuaciones dadas.
.12
.13
.08
B .18
.09 .04
.06 .24
.06
a. P(En B) =_
b. P(CnF)=_
c. P(En D) =4.17
a. Un lote de SO piezas contiene seis defectos. Si al azar se sacan dos piezas, una a l.1 vez y sin
reemplazo, cul es la probabilidad de que ambas piezas sean defectuosas?
b. Si se repite este experimento, con sustitucin, cul es la probabilidad de que ambas piezas
sean defectuosas?
4.18 Segn el grupo sin fines de lucro llamado Zero Population Growth (Crecimiento Cero de
Poblacin), 78% de la poblacin de Estados Unidos vive ahora en zonas urbanas. Cientficos de la
Princeton University y la University of Wisconsin reportan que alrededor de 15% de todos los
adultos en Estados Unidos cuidan de familiares enfermos. Suponga que 11 % de adultos que viven
en zonas urbanas cuidan de familiares enfermos.
120
ESTADISTICA
CAPITULO 4 PROBABILIDAD
121
c. Cul es la probabilidad de que la familia no tenga ventilador de techo y tenga parrilla para
asar?
d. Cul es la probabilidad de que la familia tenga ventilador de techo y no tenga parrilla para
asar?
- PROBABILIDADCONDICIONAL
Las probabilidades condicionales se calculan con base en el conocimiento que un experto en estadstica tenga sobre uno de los dos eventos que estudie. Si X, Y son dos eventos, la probabilidad condicional
de que X ocurra dado que Y se conoce o ha ocurrido se expresa como P(XIY) y se da en la ley de probabilidad condicional:
u:"" DE
~ABlllDAD
CD !ffi!CIONAL
P(XIY)= P(XnY)
P(Y)
= P(X)P(YiX)
P(Y)
P(SIN)=
P(SnN)
P(N)
P(N)=.70
P(SIN)=
e::;,''tHI
~bilidad
-::::-<l1Cional de
'1:'2''01 espacio de
mt"'acenamiento
:a:a una
~sJCCin de ruido
y P(SnN)=.56
122
ESTADISTICA
EN
WS NEGOCIOS
de ruido y como las personas saben que favorece la reduccin de ruido, es la nica rea de inters que
incrementa el espacio de almacenamiento.
Examine la matriz de probabilidad de la tabla 4. 7 para el problema del diseo de oficina. Ninguna
de las probabilidades dadas en la matriz son probabilidades condicionales. Para reiterar lo que ya se
mencion, una matriz de probabilidad contiene slo dos tipos de probabilidad, marginal y conjunta.
Los valores de celda son probabilidades conjuntas y los subtotales de los mrgenes son probabilidades
marginales. Cmo se determinan las probabilidades condicionales desde una matriz de probabilidad?
La ley de probabilidades condicionales muestra que una probabilidad condicional se calcula al dividir
la probabilidad conjunta entre la probabilidad marginal Entonces, la matriz de probabilidad tiene la
informacin necesaria para resolver una probabilidad condicional.
Cul es la probabilidad para que un trabajador seleccionado al azar piense que la reduccin de
ruido mejorara la productividad dado que el trabajador cree que aumentar espacio de almacenamiento mejorara la productividad? Esto es:
P(noNjS) =?
La ley de probabilidad condicional expresa que:
P(noNnS)
P(no NIS)
P(S)
Ntese que como S est dada, estamos interesados slo en la columna sombreada en la tabla 4.7, que es
la columna marcada con S para espacio aumentado de almacenamiento. La probabilidad marginal,
P(S) es el total de esta columna y se encuentra en el margen al fondo de la tabla como 0.67. P(no N n S)
se encuentra como la interseccin de No para ruido y Si para almacenamiento. Este valor es 0.11. Por
tanto, P(no N n S) es O.! l. En consecuencia:
P(no NIS)
P(no NnS)
P(S)
~=.164
.67
TABLA 4.7
Aumenforapodode almaunmnimto
Sf
IWuccl6n de n4a
No
Sf~.70
No
.30
.67
.33
1.00
azar sea mujer si se sabe que es trabajador de tiempo parcial? Denotemos por W el evento de seleccionar una mujer y por T el evento de seleccionar un trabajador de tiempo parcial. En smbolos, la pregunta es:
P(WIT) =?
La probabilidad de que un trabajador sea mujer, dado que la persona trabaja de tiempo parcial, se
puede calcular ahora:
P(WIT)= P(W)P(TjW)
P(T)
(.46)(.25)
(.174)
= .661
PROBLEMA DE
DEMOSTRACIN
4.9
Los datos de las entrevistas a ejecutivos dados en el problema de demostracin 4.2 se repiten
aqu. Utilice estos datos para encontrar:
a. P(BIFl
b. P(GICl
c. P((DIFl)
Tipo
de
Industria
Noreste
D
Sureste
E
Regin
central
F
Oeste
G
Finanzas A
24
10
14
Manufacturas 8
30
22
12
Comunicaciones C
28
18
12
16
74
82
34
42
42
200
56
70
124
Regin
Noreste
Sureste
.12
.05
Manuf:rura1B
.15
.03
Comunaciofl# C
.1'
tHi
/ndulfrl
central
Oeste
'
.07
.28
.11
.06
.35
.09
.06
.08
.37
.17
.21
.21
1.00
Solucin
lJI determinacin de probabilidades condicionales desde una matriz de probabilidad, con el uso
de la formula, es un proceso relativamente fcil. En este caso, la probabilidad conjunta, PIB n FJ,
aparece en una celda de la matriz 1.111; la probabilidad marginal, PIF), aparece en un margen
(.211. Unir estas dos probabilidades por medio de la frmula produce la respuesta, .111.21 .52
Esta respuesta significa que 52.% de los ejecutivos del Regin Central (los valores fl estn en
manufactures (los valores B).
PIGIC) PIG n CI .08 .216
PICI
.37
b.
Este resultado significa que 21.6% de los ejecutivos de la industria de comunicaciones que respondieron, ICI son del Oeste (G).
PIDIF) PID n F) .00 00
PIDI
.21 '
c.
Eventos independientes
EVE.,lOS
l~OE.PEi,'DIENTES
X,Y
Para determinar i X y
PROBLEMA DE
DEMOSTRACIN
4.10
Pruebe con la matriz para las 200 respuestas de ejecutivos pare determinar s el tipo de industria es independiente de la ubicacin geogrfica.
CAPITULO
PROIW!!LIDAD 125
H1H10111.s111+Ii!.f'11:1.t...
.161
Noreste
O
Tipo
de
industria
Sureste
E
Regin
central
F
Oeste
G
Fi':}anzas A
24
10
14
Manufacturas B
30
22
12
ComunicacionesC
28
18
12
16
74
82
34
42
42
200
56
1
70
Solucin
Seleccione una industria y una ubicacin
P(AjG) = P(A)?
P(A!Gl =
geogrfica
..!
42
y P(AJ =
200
PROBLEMADE
DEMOSTRACIN
Determine si la tabla de contingencia que se muestra como tabla 4.6 y repetida aqu conuene
eventos independientes.
4.11
A~1220
8
20 30 50
15
34
51
85
Solud6n
Pruebe la primera celda de la matriz para encontrar si P!AJDI PIAI.
PIAIDI
. 38
4 .2353
PIAI
!~
.2353
El proceso de prueba debe continuar hasta que se determine que todos los eventos son inde
pendientes. En esta matriz, todas las posibilidades se comprueban. Por tanto, la tabla 4.6 contiene eventos independientes.
4.4 PROBLEMAS
4.lJ L'tilice los valores de la tabla de contingencia para resolver las ecuaciones dadas.
a.
15
12
11
17
19
21
32
2;
18
13
12
PlGIA> _
b, P(BJF) =-
=-
c. P(qE)
d. P(EJG) _
:m
4.24 Ulilcelos valores de la tabla de contingencia para resolver las ecuaciones dadas.
C
. P(CjA) - -
b. PBIDJ _
c. P(AJB) =-
4.25 A continuacin aparecen los resultados de un estudio que pregunta: "Tiene usted calculadora
y/o computadora en su casa?"
Calculadora
S
Computadora
5{~6
No
No
3
49
11
15
26
57
18
75
c. Dado que el propietario no selecciona la economa como desafo para el crecimiento, cual es
la probabilidad de que el propietario piense que encontrar trabajadores capacitadas es un
desafo para el crecimiento?
d. Cul es la probabilidad de que el propietario piense que ni la economa es un desafiopara el
crecimiento fil encontrar trabajadores capacitados es un desafo para el crecimienm?
4.28 A fines de 1998, un estudio de usuarios en lnea fue realizado por Iupiter Communications para
determinar por cul tipo de compra es que un consumidor prefiere un servicio a dientes en vivo,
Cuarenta y siete por ciento de los usuarios respondieron que cuando compran boletos de avin,
prefieren servicio a clientes en vivo. Suponga que de quienes prefieren servicio a dientesen V\'O para
comprar boletos de avin, 81 % prefieren servicio a clientes en vivo para transacciones de prstamos. Si se selecciona al azar a un usuario en lnea, determine las siguientes probabilidades:
128
a. El usuario en linea prefiere servido a clientes en vlvo pua comprar boletos de in;n y pua
transaccin de prbtamos.
b. El usuario en linea prefiere servicio a clientes en vivo para transaccin de prstamos pero no
prefiere servido a dientes en \+.'O pua comprar boletos de a\in.
c. El usuario en linea no prefiere servicio a dlentes en vi\'O para transaccin de prstamos pero
si para comprar boletos de avin.
4.29 Arco11111i11g To"'Y report que 37% de contadores compran su hardware de computadora por
pedido directo por correo y que 54% compran su software de la misma manera. Suponga que
97% de los contadores que compran su hardware por pedido directo por correo compran su
software por pedido directo por correo. Si se selecciona al azar un contador, determine las
siguientes probabilidades:
a. El contador no compra su software por pedido directo por correo dado que no compra su
hardware de la misma manera.
b. El contador compra su software por pedido directo por correo dado que no compra su hardware por pedido directo por correo.
c. El contador no compra su hardware por pedido directo por correo si se sabe que compra su
software por pedido directo por correo.
d. El contador no compra su hardware por pedido directo por correo si se sabe que no compra
su software por pedido directo por correo.
informad6n.
REGU DE BAV'tS
P(x
'
In-
P(
P(X1)P(r!Xi)+P(X2)PO'IX2)+
.. +P(Xn)P(YIX,,)
PO')
Compare la regla de Bayes con esta regla de probabilidad condicional. Los numeradores de la regla
de Bares)' la ley de rrobabili<UJ condicional son los mismos, con la interseccn de X, y Y m0$lrada en
forma de regla general de la multiplicadn. La nueva airactmstka que usa la regla de Bayesse encuentraen el denomlnador de la regla:
El denominador de la regla de &)n nduye una n:pmin del producto (intersccdn) pua cada
particin del espacro maestral, Y, incluyendo el evento (X,) mismo. El denominador es entonces una lista
cxhausth-a y colectiva Je resultados mutuamente excluyentes de Y. Este dmominador se conoce a veces
como la frmula dt probabilidadtotal.Representa un promedio ponderado de las probabilidades condidonales, con los valores de las probabilidades previas del evento correspondiente.
CAPITULO 4 PROBABIUDAI> 1 ?9
Al expresar la ley de probabilidades condicionales en esta nueva forma. la regla de Ba}~ hace posible que d experto en estadstica haga nuevas y diferentes aplicaciones con el uso de probabilidades con
dicionales. En particular. lo~ estadsticos usan la regla de Bayb para revistarprobabilidades en vista de
que hay nueva informacin.
Un tipo panicular de cinta de mpre-ora es producida por slo dos compaas, Alamo Ribbon
Compan) y South Jeney Products. Suponga que Alamo produce 65% de w cintas y que South Jersey
produce 35"<>. Ocho por ciento de las cintas producidas por Alamo son defectuow y 12% de ~ cintas
de Soutb Jeney son defectuosas. Un cliente compra una cinta nueva. Cul es la probabilidad de que
Alamo produjo la cinta? Cul es la probabilidad de que South Jcrey produjo la cinta? La cinta se prueba y multa defectuosa. Ahora, cul b la probabilidad de que Alamo produjo la cinta? y de que South
Jerwy produjo la cinta?
La probabilidad era .65 de que la cinta provino de Alamo y .35 de South Jersey.~tas K llaman pro
babilidades previas porque estn basadas en la informacin original,
La nueva informacin de que la cinta e) defectuosa cambia las probabilidades porque una compsl\fa produce un porcentaie mh aho de cintas defectuosa> que la otra compala. Cmo puede usarse
esta informacin para actualizar o revisar las probabilidades originales? La rtgla de Bayes permite esta
actualiudn. t:na forma de trazar una revisin del problema de probabilidades es usar una tabla. La
tabla 4.8 muestra el anli>i) del problema de la cinta.
El proceso se inicia con las probablidades previas: .65 Afamo y .35 South Jerwy. En.u probabilidades previas aparecen en la "!!Unda columna de la tabla 4.8. Debido a que el producto K encontr
defectuoso deben usarse las probabilidades condicionales P(defcctuoso!Alamo) y P(deftctuosolSouth
JefKY). Ocho por ciento de las cintas de Alamo son defectuosas: P(defe.:tuoso!Alamo) .08. Doce por
ciento de las cintas de South Jerser son defectuosas: P(defcctuosolSouth Jersey) .12. ~tas dos pro
babilidades condicionales aparecen en la tercera columna. Ocho por ciento de 65% de las cinta.) de
Alamo son defectuosas: (.08)(.65) = .52 o 'lea 5.2% del total. Esta cantidad aparece en la cuarta columna de la tabla 4.8; es la probabilidad conjunta de obtener una cinta que fue hecha por Alamo y es defectuosa, Como la cinta comprada e> defectuosa. stas son las nicas cint.li de inters de Alamo. Doce por
ciento de 35% de las cint.u de South Jersey son defectuosas. la multiplicacin de estos dos porcentajes
da la probabilidad conjunta de obtener una cinta de South Jef'.Cy que es defectuosa. ~ta cantidad tambito aparece en la cuarta columna de la tabla 4.8: (.12)(.35) .042 o sea '4.2% de todas las dnt.u son
hechas por South Jersey y son defectuosas. 8te porcentaje incluye las nicas cintas de inters de South
Jer>ey porque la cinta comprada es defectuosa,
La columna 4 se totaliza para obtener .094, que indica que 9.4% de todas las dotas son defectuosu (Alamo r defectuosas == .52 + South Jer-cy y defectuosas .042). El otro 90.6% de las cintas, que
$00 aceptable>. no son de inters porque la cinta comprada e> defectuosa. Para calcular esta quinta
columna, las probabilidades poneroreso revisadas,implica dividir cada valor de la columna 4 entre el
total de la columna 4. Para Alamo, .052 del total de cintas son Alamo y defectuosasdel total de .094 que
son defectuosas.Dividir .052 entre .094 da .553 como probabilidad revisada de que la cinta comprada
fue hecha por Alamo. Esta probabilidad e> menor que la probabilidad previa u original de .65 porque
menos de las cintas de Alamo (como porcentaje) son defectuosas que las producidas por South Jenq.
La cinta defectuosa es ahora menos probable que provenga de Alamo que antes de saber de b anta
defectuosa. la probabilidad de South )er>ey se revisaal dividir la probabilidad conjunta de .042, de que
la cinta t' hecha por South Jer\t)' y es defectuo"1, entre la probabilidad total de que la cinta o defeetuosa (.094 ).
TABLA 4.8
Tabla de Bayes para revisin de
.....
......
.. 1=;
IW
"'
.3S
,.,
......
1
Pfli!!)
ProbebWdecl
caajuDta
.08
.OS2
.12
~
l'{~).094
m
.,.....
.~
Pu'
~2 - ..55.3
.094
P42
094
'"' 44~
C:h1tHF
.052]-
Diagrama de rbol
para probabilidades
del problema de
cintas
.094
.598
.042
.308
El resultado C$ .042/.094 .447. La probabilidad de que la cinta defectuosa o de Soulh Jmey aumeru
porque un porcentaje ms alto de cintas de South Jeney son defectuosas,
Los diagramas de rbol son otra forma comun de resolver problemas de la regla de Bares. La figura 4.12 muestra la solucin para el problema de la cinta. Ntese que el diattrama de rbol contiene
todas I~ posibilidades, incluyendo cintas defectuosas y aceptables. Cuando se da nueva informacin,
slo las ramas pertinentes se seleccionan y utilizan. Los valores de probabilidad conjunta al final de las
rama. apropiad.u se emplean para revisar y calcular las posibilidades pcsterores. Usar el nmero total
de cintas defectuosas, .052 + .042 '"' .094, el clculo es como sigue.
PROBLEMA DE
DEMOSTRACIN
4.12
Las mquinas A, B y C producen todas las mismas dos piezas. X y Y. De todas las piezas producidn, la mquina A produce 60%, la mquina B produce 30% y la mquina C produce 10%.
Adem,
40% de las pieza hechas por la mquina A son pieza X.
50% de las pieza hechas por la mquina B son pieza X.
70% de las pieza hechas por la mquina C son pieza X.
Una pieza producida por esta compal'lla es muestreada al azar y se determina que es una pieza
X. Con el conocimiento de que es una pieza X. revise las probabilidades de que la pieza pro
venga de la mquina A, B o C.
SokK'6tl
La probabilidad previa de que la pieza provenga de la mquina A es .60, porque la mquina A
produce 60% de todas las piezas .. La probabilidad previa es .30 de que la pieza provenga de B y
.10 de que provenga de C. Estas probabilidades previas son ms pertinentes si no se sabe nada
acerca de la pieza, pero se sabe que es una pieza X. Las probabilidades condicionales muestran
que las diferentes mquinas producen proporciones distintas de piezas X. Por ejemplo, .40 de
las piezas hechas por la mquina A son piezas X. pero .50 de las piezas hechas por la mquina
By .70 de las piezas hechas por la mquina C con piezas X. Es lgico que la probabilidad de que
la pieza provenga de la mquina C aumentara y que la probabilidad de que la pieza fue hecha
en la mquina A aumentara porque la pieza es una pieza X.
La tabla siguiente muestra cmo es que las probabilidades previas. las probabilidades condicionales, las probabilidades conjuntas y la probabilidad marginal, P()(), se pueden usar para
revisar las probabilidades previas para obtener probabilidades posteriores.
C\PIT\Jl.04
Previa
PIE'
Condldonal
Pl~E'
.60
.40
.30
.50
.10
.70
Evento
Conjunta
P(Xn E'
(.601(.40)
PROBABlllDAD 131
Posterior
.24
~.46 . 52
.15
.:.J!.
.46 -
.07
~.46 15
P!)() - .46
. 33
Une vez revisadas las probabilidades, es evidente que la probabilidad de que la pieza sea hecha
en la mquina A disminuyeron y que las probabilidades de que le pieza fue hecha en las mquinas B y C aumentaron. Un diagrame de rbol presenta otra viste de este problema.
Probabilidades revisadas: Mquina A:
Mquina B:
:!:
:!:
Mquina C .07
.46
.52
.33
.15
.24
.36
.15
.15
.07
.03
"5 PROBLEMAS
En una planta manufactuma, la m.lquina A produce 10% de cieno producto. la m.lqwna 8 produce 40% de este producto. y la m.lquina e produce 50% de este producto. Cinco por ciento de !O> produetos de la m.lquina A son dcfcctuo.o..., 12% de loo. productos de la mquina B son defectuosos y
8% de loo. productos de la mquina C son defectuosos. fJ inspector de la compaflia ha muestreado
un producto de esta planta y ha encontrado que es defectuoso. Determine las probabilidJdcs misadas de que el producto muestreado fue producido por la m.lquina A, mquina B o mquina C.
4..31 Alex, Alicia y Juan despachan pedidos en un restaurante de comida rpida. Alcx despacha meorreetamente 20% de los pedidos que toma. Alicia de.pacha incorrectamente 1:!% de los pedidos
que toma. Juan despacha incorrectamente 5% de los pedidos que toma. Alcx despacha 30% de
todo) lo) pedido), Alicia despacha 45% de todos los pedidos y Juan 25% de todos los pedidos.
Acaba de despacharse una orden.
a. Cul es la probabilidad de que Alicia despach el pedido?
b, Si el pedido fue despachado por Juan, Cu.il es la probabilidad de que se haya despachado
correctamente?
c. Se desconoce quin despach el pedido, pero ste se despach incorrectamente. Cilcs son
las probabilidades revisadas de que Alex, Alicia o Juan despacharan el pedido?
d. Se desconoce quin despach el pedido, pero 6te se despach correctamente. Cu.lle. son ~
probabilidades revisadas de que Alo., Alicia o Juan despacharan el pedido?
4.30
4.32 En un pequeo poblado. dos companas de jardiner fertilizan prado> durante c:I verano, TriState Lawn Service tiene 72% del mercado. Trtinta por dmto de lo. prado. fcniliudo. por Tri-State
podrian clasicarse como muy sanos un mes despus del servicio, Greenchem time el otro 28%
del mercado. Veinte por ciento de lo> prados ferulizados por Greenchem podrian clasificarse
como muy sanos un mes despus del servicio. Al azar se selecciona un prado que ha sido trata
do con fertilizantes por una de estas compaas dentro del ltimo mes. Si el prado se clasifica
como muy sano. cules son las probabilidades de que Tn-State o Greenchem trataron el prado?
4.33 Las comparuas dan capacitacin a empleado. por muchas razones diferentes, entre las que se:
cuentan la lealtad del empleado. retencin de ste )' calidad del trabajo. Suponga que 65% de
toda. las compaas dan alguna capacitacin a sus empleados pero que esta cantidad varia segn
el tarnatlo de la compaa. Suponga adems que 18% de todas las compaas que dan capacita
cin son pequeas r que 75% de todas las compatlla. que no dan capacitacin son pequeas, Se
muestrea al azar una compatlia sin consi~erar su tamatlo. Cul es la probabilidad de que la com
pania d capacitacin? Suponga que se determina que la compatl[a seleccionada no es pequea.
Cul es la probabilidad de que la compatlia d capacitacin? Qu proporcin de todas las compaflias no o pequea]
n C)
100
-
155
31
122
.787
n M)
31155 .019
Har meno> de 2% de probabilidad que una mujer gerente sea seleccionada al azar como ~
del viaje.
Cul e. la probabilidad de que d ganador sea del grupo tcnico si se sabe que el empleado es hombre~ Esta probabilidad condicional es como sigue:
CONSIDERACIONESrnos
RESUMEN
El estudio de probabilidad aborda modos de asignar probabilidades, tipos de probabilidade, y leye) de probabilidades. Las
probabilidades apoyan la nocin de estadsticas internas. El
uso de datos muesrrales para estimar y probar hiptesis acerca de parmetros poblaconales se hace con incertidumbre, Si
se toman muestras al 11.ar, o posible asignar probabilidades a
resultados dd proceso inferencial.
Tres mttodos de asignar probabilidades son 1) el mtodo
disico, 2) d mtodo de frecuencia relativa y 3) probabilidades
sub~tivu. El mtodo clsico puede asignar probabilidades a
priori, o antes que tenga lugar el experimento, Se apoya en la~
leyn y~
de probabilidad. El mtodo de frecuencia relati'~ asigna probabilidades con base en datos hi>trico~ o datos
deducidos nr.pfricammte. La. probabilidades >ubjcti\'U est.\n
basadas en los sentimientos. conocimiento )' experiencia de la
persona que determine la probabilidad.
Omos bpos cspcciales de eventos necesitan correcciones
a algunas de
leyes de probabilidad: eventos mutuamente
OOU)'mtr5 y C"'ml0$ independientes. Los primeros IOn evcntos que no pueden ocurrir al mismo tiempo. de modo que la
probabt'lidad dc su inttnein es cero. En la determinacin
de b unin dc dos C'\'m!OS mutuamente excluyentes. la ley de
adicin SC
al suprimir fa interseccin. Con eventos
indcpcndimtcs, b prcsmtacin de uno no tiene impacto o
influcnc:U en b presentacin del otro. Ciertos experimentos,
por ejemplo los de monccbs o dados. de manera natural pro
comse
TRMINOS CLAVE
a priori
combinaciones
complemento
complemento de una unin
espado muestra!
eventos independientes
eventos mutuamente
cxdu}Tntc.
eventos simple,
evento
frecuencia relativa de
presentacin
ezperimento
eventos colectivamente
exhaustivos
interseccin
matriz de probabilidad
mtodo clsico de asignar
probabilidades
notacin de conjuntos
probabilidad condicional
probabilidad conjunu
FRMULAS
Regla de conteo
Lq general de adicin
PC.X U
mn
Y)
= P(X) + P( Y)
PIX n Y)
+ P(Y)
Lq general de multiplicadn
P(X
Frmula de combinacin
N)
N!
::Cn (n n!(N-
n Y).,.
P(X) P(YJX)
= P(Y) P(XJY)
P{X
n Y)'"'
P(X) P(Y)
CAPfTUlO 4 PROIW!IUDAD
de protYb1hdad condicional
Rtglade &vn
PO')
P(Y)
'PROBLEMAS
P(XAY>
P(X,) PO'IX,)
COMPLEMENTARIOS
~ttDICOS DE E.U. E.'I; ~ A.'1;0 REO.EKTE
Ciiculo de estadfsticq
Etbl (ailos)
A
\Wiabk2
10
20
15
30
15
1
1
L
b,
L
P(E) -
c.
b. P(BUD)_
c. P(An E) .. _
d.
d. P(BJEl e. P(AUB)_
. P(B\C) =g. .P(DJC) =-
e.
f.
w variables
1 y U Por qu si o
12
30
.11
.20
.19
.12
.16
...
.os
.()4
.02
.01
.22
.28
.23
.14
.17
1.00
.07
.18
PIFlA)_
b .P(A\8) _
c. P(B) _
L
d. P(En F) _
e. P(DJB) _
t 35
f. P(BJD) _
g. PIDUC)_
h. P(F)_
136
ESTADlmCA
E.-.:~ NEGOCIOS
4.39 ~
Link Resources, 16'!9 de b poblacin en Estado.
Unido. est. orientada a b tecnologa, pero estas cantidades \'Uan por rq;onn. Por qemplo, en el oeste la
cifra es W% m d noreste es de 1 i'lll. Veintin por
ciento de b pobbn en EsudOl Unido. en general est.t
en el oeste y ~ m d eoresre. Suponga que al azar se
sd"ciona un csudounidrnst.
a. Cu.ti es b probabilidad de que la pcnona vi'-a en el
ante y sea una pcnona orientada a la tecnologla?
b. Cm! es b probabilidad de que la persona viva en el
oorme y sea una pcnona orientada a la tecnologa!
c. Suponp que se~ que b persona seleccionada est.t
orimuda a b trcno1ogia. Ctl es la probabilidad de
qix b pcnona m-.a ea d oeste?
d. Suponp que se sabe que la persona seleccionada est.t
orimuda a b tccnologb. Cm! es la probabilidad de
que b persona ,fu en d nomtc?
e. Suponp que se sabe que b penona seleccionada estJ
orientada a la ucno1ogfa. Cu.ti es b probabilidad de
que la persona no
en d oeste ni el noreste?
4.43 La Slttlcase Workplacc Inda estudi IOl tipos de actividades rebcionadas con el trabajo que hkieron estadounideeSb que estaban de vacaciones en el \-erano. Entre otras
COllS. 40% Icen maltrial rd.acionado con d trabajo. Treinu
y cuatro por ciento se registraron con d jefe. A quienes
rcspondicron al estudio se les permiti seleccionar ~
de una actividad. Suponga que de quienes leen maten..
relacionado con el trabajo, 78"il se registraron con el.
jefe. Uno de quienes rbpondieron se seleccion al azar.
a. Cu.il es la probabilidad de que al estar de vacaciones
esta penona que respondi al es1udio se registrara
con el jefe y lea el material relacionado con el trab.tjo?
b. Cu.ti es la probabilidad de que al estar de vacaciones
esta persona que respondi al estudio no se registre con
el jefe ni lea el mattrial relacionado con el trabajo?
c. Ctl es la probabilidad de que al estar de vacaciones
esta penona que respondi al estudio I~ el mate
ria! relacionado con el trabajo dado que se registr
con el jefe?
m-a
CAPITULO~
PROBABfUDAO
137
d. Cul es la probabilidad de que la compal\ia d capacitacin para retener empleados o para mejorar sus
procesos!
e. Cul es la probabilidad de que b compal'a no d
capacit.tcin para retener empleados ni para mejorar sus procesos?
f. Suponga que se sabe que la comp.il\la no da capacitacin para mejorar procesos. Cul es b probabilidad de que la compallla d capacitacin para retener
empleados?
4.44 Health Righ1s Hotline public los tt)Uhado) de un estu- 4.46 Pimey Bowe) entrevist a 302 directores y vicepresdenlQ de mercadeo de empresas estadounidenses grandes y
dio de 2 400 personas en el norte de California, en el que
medianas. para determinar qu era lo que pensaban es
se pidi a consumidores compartir sus quejas acerca de
el mejor vehtculo para educar a quienes loman decisioatmcin dirigida. La queja nllmero uno fue la denegacin
nes sobre complejos problemas para vender productos )'
de atencin, con 17%de 10) consumidoresparticipantes
<ervicios. El porcentaje m~ alto de compal'lias escogieque Ja seleccionaron. Varias otras quejas se observaron,
ron la venia directa por correo o ca1log0), seguida por
incluyendo atencin inapropiada ( 14%), servicio a clienventa directa o venta por representantes, La venia directes ( 14%), reclamaciones con pagos ( 11%), atencin de
especialidad ( 10%), demoras para obtener atencin (8%)
la por correo o por ca1logo fue seleccionada por
38% de las compal'la-<, ninguna de
cuales seleccion
y medicamentos de recela (?'lb). Esw ca1cgor1as de quejas
venia directa por correo )' catlogos o ventas directas
son mutuamenteexduyentes.Suponga que lo) resultados
o venta por representantes. Suponga tambin que 41%
de este e tudio pueden llevar-e a iodos los consumidono seleccion venia directa por correo o cat.tlogo) ni
res de atencin dirigida. Si un consumidor de atencin
venia directa o por representantes. Si una de las compadirigida se selecciona al aur, determine las siguiemes
l'llas se selecciona al aur y se en1UV1sta a su mejor venprobabilidades:
dedor acerca de este asumo, determine la siguien1es
L El consumidor se queja por reclamadcnes de pago o
probabilidades:
atencin de especialidad,
a. El vendedor seleccion venta directa por correo o
b.. El consumidor se queja de medicamentos de recela y
por catlogo) y no seleccion venta directa o por
servicio a clientes.
representantes de ventas.
c. El consumidor se queja de atencin inapropiada
b. El vendedor seleccion venta directa o venta por
dado que el consumidor se queja de la atencin de
representantes.
especialidad,
c. El vendedor seleccion venta directa o venta por
d. El consumidor no se queja por demoras en obtener
representantes, dado que la persona ~leccion \'tnta
atencin ni se queja por reclamaciones de pago.
directa por correo o por catalogos.
c.~ ~umerosas compmias dan capacitacin a empleados
d. El vendedor no seleccion venta ditteta por correo o
por dferemesrazones, entre las que se incluyen la lealtad
por catlogos. dado que el vendedor no seleccion
del empleado, cenificacin, calidad y mejora de proceventa directa o por representantes,
sos. En un estudio nacional de compaas, 81 Learning
.:r\lems reportaron que 56% de las compaAias que respondieron citaron la retencin del empleado como
razn pncipal para la capacitacin. Suponga que 36%
de las compatas respondieron que otorgan capacitacin
pua mejorar sus procesos y para retener el empleado.
Adems, suponga que de las compaasque dan capacitacin para mejorar sus procesos, 90% lo hacen para
retener empleados. Se seleccion al azar una compaJ\a
que da capacitacin.
L Cul es la probabilidad de que la compaa d capacitacin para retener empleados y oo para mejorar
sus procesos?
b.. Si se ~be que la compallia 01orga eapacuacin para
retener empleados, cul C) la probabilidad de que d
capaci1acin para mejorar sus procesos?
c. Cul es la probabilidad de que la compallla d capacitacin para mejorar sus procesos?
En la base <le <lato~ manufactura). cul o la probabilidad de que una industria de Cdigo SIC seleccionada al
azar este en el grupo industrial 13> Cul es la probabili
dad de que una industria de Cd1~0 SIC seleccionada al
.uar tenga un valor de embarque- 1ndu..tnalo de 4? cul
es la probabilidad de que una industria de Cdigo SIC
seleccionada al azar est en el grupo industrial 13 y tenga
un valor de embarque. de industria de :?? Cul es la pro
babilidad de que una industria de Cdigo SIC selecdonada al azar est en el grupo industrial 13 o tenga un
valor de embarques de industria de 2? Cul es la probabilidad de que una industria de Cdigo SIC seleccionada
al azar no cst~ en el grupo industrial 13 ni tenga un valor
de embarques de industria de 2?
''
CAPITULO 4 PROBABILIDAD
139
CAPTULO
Distribucionesdiscretas
OBJETIVOS DE APRENDIZAJE
El objetivo general de aprendizaje del capitulo 5 es ayudar al estudiante a que entienda una categora de distribuciones de probabilidad que produce slo resultados discretos, con lo cual podr:
l. Distinguir entre variables aleatorias discretas y variables aleatorias continuas.
2. Saber cmo determinar la media y varianza de una distribucin discreta.
3. Identificar el tipo de experimentos estadsticos que pueden ser descritos por la distribucin binomial y saber cmo resolver esos problemas.
4. Decidir cundo usar la distribucin de Poisson al analizar experimentos estadsucos y saber cmo resolver esos problemas.
S. Decidir cundo es posible calcular problemas de distribucin binomial por medio
de la distribucin de Poisson y saber cmo resolver esos problemas.
6. Decidir cuando usar la distribucin hpergeometrica y saber cmo resolver esos
problemas.
140
de la industria bancaria
En experimentos estadtsticos que abarcan probabilidad, los resultados ocurren de manera aleatoria. Suponga, como ejemplo de este tipo de xpcrimen10. que un fabricante de bateras selecciona a!
azar tres bateras de un lote grande de para probar su calidad. Cada batera seleccionada ha de dasifi.
carsc como buena o defectuosa. las bateras estn numeradas de 1 a 3, una batera defccruosa se designa
con una D. y una bateria buena se designa con una G. Todos los posibles resultados se muestran en b
tabla 5.1. La expresin, Dt G2 03, denota un resultado panicular en el que la primera y tercera bateri
as son defectuosas y la segunda barera es buena. En este capitulo examinamo las probabilidades de
distintos resultados que pueden ocurrir con tipos paniculares de experimentos.
Una ,-uiabJe aleatoria es una variable aleatoria discreta s1 ti conjunto dt todos los poHblts ~alom
a a lo sumo un finito o un mimtro contablememe mfimto ele posibles valora. En l:a$ todas las 'itu~
nes csudistkas, las variables aleatorias discretas producen valores que son nmeros enteros no negau'"OS Por ejemplo. si $5 personas se seleccionan al aur de una poblacin y se ha de determinar cu~nw
de las seb son zurdas, la variable aleatoria producida es discreta. W$ nico. nmeros posibles de zurdo. de la muestra de seb son 0, 1, 2, 3, 4, S y 6. No puede haber 2.75 zurdo) en un grupo de se~ personas; obtener valores de nmeros no enteros e) imposible. Otros ejemplos de experimentos que dan
'-ariable$ aleato~ discretas incluyen los siguientes:
TABLA 5.1
Todos los posibles resultados
para el experimiento de la
bate ria
Gi Gz G,
D, Gz G,
G, o, G,
Gi Gz
'
o,
o,
G,
o, Gz o,
G, o, o,
o, o,
l.
2.
143
Podrla decirse que las variables aleatorili conunuas se generan en experimentos en lo> que I~ c~ se
"miden'; no se "cuentan" Por ejemplo. si una persona ot ensamblando un componente en un producto, el tiempo que tarda en lograr este objetivo podra ser cualquier valor dentro de un lapso razonable,
como podra ser tres minutos 36.4218 segundos o 5 minuto> 17.5169 segundos. Una lista de medidas
para las cuales se podran generar variables aleatorias continuas incluirla el tiempo, altura, peso y volumen. Otros ejemplos de expermentcs que dan va!Ubles altatorias continuas incluyen lo siguiente:
l. Muestrear el volumen de nitrgeno lquido en un tanque.
2. Medir el tiempo entre llegadas de clientes a una tienda de venta al menudeo.
3. Medir las longitudes de automviles recin diseados,
4. Medir el peso de granos en un elevador en diferentes puntos de tiempo.
Una va medidos y registrados los datos conunuos se convienen en datos discretos porque se
redondean a un numero discreto. Por tanto. en b pr4ctica casi todos los datos son discretos; sin embargo. el anlisis de datos se facilita mucho si se usan distribuciones continuas en datos que originalrnente eran continuos.
Los resultados de variables altato~ y sus probabilidades asociadas se pueden organizar en distribuciones. Los dos tipos de distribuciones son distribuciones discretas, construidas d variablts a/tato
rias diserttns y distribuciones continuas. basadas en vanablts altaronas co111i1mas. Las distribuciones
discretas incluyen la distribucin binomial, distribucin de Poi son y distribucin hipergeomtrica, Las
distribuciones continuas incluym la distribucin normal, distribucin uniforme, distribucin exponencial, distribucin r, distribucin ji cuadrada y distribucin F. En este captulo vamos a explorar dstribuciones discretas. El capitulo 6 aborda distribuciones continuas.
Ull.l 5.2
Cmo podemos describir una distribucin discreta~ Una forma es construir una grtfica de la distribucin y estudiar la grfica. En el capitulo 2 se realiz el anlisis de algunos tipos de grtficas que podran
ser suficiente para este trabajo. incluyendo el histograma y polgono de frecuencia. El histograma, o gr4
fica de barras verticales es probablemente la forma de grtfica ms comn para describir una distnbucin discreta. No obstante, algunas distnbuciones contienen resultados slo para cienos puntos de dato$
y dejan un vaco entre valoro. Por tanto. el histograma que se emplea a veces contiene lmeas delgadas
en lugar de barras o rectngulos.
Observe la distribucin discreta de la tabla 5.2. Una ejecutiva es considersda en un viaje de negocios fuera de la ciudad para un viernes dado y reconoce que podra ocurrir al menos una crisis el dia que
salga y est preocupada por esta posibilidad. En la tabla 5.2 se muestra una distribucin discreta que con
tiene el nmero de crisis que podran ocurrir durante el da que salga y la probabilidad de que ocurra
cada nmero. Por ejemplo, existe 0.37 de probabilidad que no ocurra crisis, 0.31 de probabilidad que
haya una, y asl sucesivamente. El hi.tograma de la figura 5.1 describe la distribucin dada en la tabla 5.2.
Ntese que el eje x del histograma contiene los posibles resultados del experimento (numero de cnsis
que podrlan ocurrir) y que el eje y contiene las probabilidades de que stas ocurran.
Resulta evidente en el estudio de la grfica de la figura 5.1, que el numero mis proba
ble de crisis es de O o 1. Adems. podemos ver que la distribucin es discreta y qix no se
muestran probabilidades para valores entre bs cruis de valoro enteros.
ee crisis diarias
. , ,.. ,
.37
.ll
.ll
.t/t
,04
.Ol
0.4
Histograma
MINITAB de
distribucin
discreta de datos de
crisis
TABLA 5.3
0.37
0.31
0.3
0.18
0.2
0.04
o.o
1
2
IW
.J1
JIO
.JI
11
.JI
o
0.09
0.1
..
2
0.01
1
'
Nmero de crisis
M
..J6
.rt
16
.M
.Ol
.IS
Ilir
fj
JI(&)) - 115
115.W.
descnpuvaspara datos agrupados, se U'.Qn los resultados (x) del experimento discreto. Al calcular e5W
medidas descriptivas en datos agrupados, la frecuencia de cada inten-alo de clase se wa para valorar d
punto medio de clase. Con analsis de distribucin discreta, la probabilidad de cada ocurrencia se wa
como el valor.
ESPERADO DE USA
DISTRlBUCJON
DISCRETA
donde
E(x)
x
P(x)
= probabilidad
de ese resultado
Como ejemplo, calculemos el valor medio o esperado de la distribucin dada en la tabla 5.2. Vase
en la tabla 5.3 los valores resultantes. A largo plazo, el nmero medio o esperado de crisis en un viernes dado para esta ejecutiva es 1.15 crisis. Por supuesto, la ejecuti\-a nunca tendr 1.15 crisis.
q2
:Wx
-)2. P(x)]
donde
x
= un resultado
P(x) = probabilidad de un resultado dado
= media
tulA
5.4
de varianza V
~nestndar en datos
cnsis
o
.JI
2
.01
La wriama de
(l.J2)(.J7) ..
(UZX.JI) Al
(G.72X lt)
(MJ)(MJ .JI
Cl.12)(.IM)- .J2
04.12X.OU 15
E[~ - 1'>2 P(.)J IAI
= El~p)l ~)J IAI
v-JLiil.19aW1
La...,_adacllra
EST.o\.,'DA.RDE UNA
u= J~<x-1)2 P(x)I
DISTllBUClON
Dt~
La varianzay desviacin es1.tndar de los datos de crisis de la tabla 5.2 se calculan y muestran en la
tabla 5.4. La meda de los datos de crisis es 1.15 crisis. La desviacin estandar es 1.19 crisis, y la varianza es 1.41.
PROBLEMA DE
DEMOSTRACIN
5.1
Durante una temporada de vacaciones, la loterfa de Texas llev a cabo un juego llamado
Stocking Stuffer. Con este juego, habla premios totales de $34.8 millones al instante en 70 millones de billetes de $1, con precios de billetes de $1 a $1 000. A continuacin observe los diversos
premios v la probabilidad de ganar cada uno de ellos. Utilice estos datos para calcular el valor
esperado del juego, la varianza la desviacin estndar del juego.
Premio l.wl
Probebllidad P(.wl
$1000
100
20
10
.00002
.00063
.00400
2
1
.00601
.02403
.08877
.10479
.77176
Solud6n
La media se calcula como sigue.
Premio l.wl
1tPl.wl
$1000
100
20
10
.00002
.00063
.00400
4
2
1
.02403
.08877
.10479
.77176
o
. -
.00601
Ex Ux P\xJ)
.02000
.06300
.08000
.06010
.09612
.17754
.10479
.00000
Ux P(x)] 60155
60155
La recompensa esperada por un billete de $1 en este 1uego es 60 2 centavos. Si una persona juega durante largo tiempo, puede esperar un promedio de alrededor de 60 centavos en
ganancias.
A largo plazo, el panicipante perder ms o menos Sl.00 - .602 .398, o sea unos 40 centavos
por juego. Desde luego, un individuo nunca ganar 60 centavos en ningn juego.
Con el uso de esta media, . - .60155, la varianza y desviacin estndar se puede calcular
como sigue.
,.,..,
lt
$1000
100
20
10
.00002
.00063
(1t-
12
99879126190
9680.05186
376.29986
88.33086
11.54946
1.95566
0.15876
0.36186
1997595
-22443
.00400
-1.50520
.00601
--0.53067
.02403
--0.2n53
.06877
--0.17360
.10'79
--0.01664
.77t76
--0 27927
Dlx- 1112 PIMll 2898349
~ Dlx )2 PIMll 28.98349
2
1
o
J28.98349
= 5 38363
5.1 PROBLEMAS
S.l Determine la media, varianza y desviacin estndar de la siguiente distribucin discreta.
X
P(x)
3
4
.. 238
290
.1;;
.ISS
.u;
"o
.IOJ
.11
.246
.229
.13.
.<194
.Oil
.001
2
3
4
5
6
i
S.3 Los siguientes datos son el resultado de un estudio histrico del nmero de defectos encontradCll
en una tau de porcelana producida por una empresa fabricante. Utilice estos datos y las pro
lidades asociadas para calcular el nmero esperado de defectos y la desviacin estndar
defectos.
Dd'tctos
ProbebWdad
.461
.285
.129
3
4
.087
.038
147
S.4 Suponga que 20% de la poblacin de una ciudad prefiere Pepsi-Cola como su refresco favorito. Si
al azar se escoge una muestra de seis personas, el nmero de quienes toman Pepsi podra variar
de cero a seis. A connuacin se ven los posibles nmeros de quienes toman Pepsi en una muestra de seis personas y la probabilidad de que ese nmero de quienes toman Pepsi se presente en la
muestra. Utilice los datos para determinar el nmero medio de quienes toman Pepsi en una muo
tra de seis personas de la ciudad y calcule la desviacin estndar.
Nmtt0 de quienes toman Pq)si
Probabilicbd
262
.393
2
3
4
.246
.082
.OIS
.002
.000
DfSTRIBUCIN BINOMIAL
Qu1 la ms ampliamente conocida de todas las distribuciones discretas es la distribucin binomial,
que se ha empleado durante siglo). Vari.15 suposiciones etn detrs del uso de la distribucin binomial:
Como indica la palabra binomial, cualquier prueba individual de un experimento binomial contiene slo dos po ibles resultados, que se marcan como bcito o fracaso. Por lo general, el resultado de
in ters al investigador se marca como txito. Por ejemplo, si un analista de control de calidad busca produetos defectuosos, pod.ria considerar que un producto defectuoso tuviera wto aun cuando la compada no considerarla como wto un producto defectuoso. Si los investigadores estn estudiando personas
zurdas, el multado de encontrar una en una prueba de un experimento es un mto. El otro po'ible
resultado de una prueba en un experimento binomial se llama fracaso. La palabrafriicaso se 11$3 ~en
oposmn a txito. En los experimentos precedentes, un fracaso pod.ria ser obtener una pieza aceptable
(opuesto a una pieza defectuosa) u obtener una persona derecha (opuesto a una persona zurda). En un
experimento de distribucin binomial, cualquier intento puede tener slo dos resultado) posibles,
mutuamente excluyentes (derecho/zurdo. defectuoso/bueno, hombre/mujer, etcttera ).
La distribucin binomial es una distribucin d.screta. En n pruebas, slo x bito) son po,ibJes, doode
x es un nmero entero entre O y n. Por ejemplo, si al azar se seleccionan cinco piezas de un lote. slo son
po)ibles o. l, 2, 3, .o 5 piezas defectuosas en b.l muestra. En una muestra de cinco pieus. obtma
2.714 piezas defectuosas no es posible, ni lo es obtener ocho piezas defectuosas.
En un experimento binomial, las pruebas deben ser independientes. Esta restriccn signifia qix
el experimento por naturaleza produce pruebas independiente> (por ejemplo lanzar al aire monedas o
tirar dados) o el experimento se realiza con restitucin. El efecto del requisito de prueba indepmdlentc
es que p. la probabilidad de obtener un bllo en una prueba, permanece constante de una prueba a oua.
Por ejemplo. suponga que 5% de todas las piezas de un recipiente estan defectuosas,La p:obabilidad
de sacar una pieza defectuosa en el primer intento es p .OS. Si la primera pieza saada no se resntuye, la ~unda pieza que ~ saque no es independiente de la primera. r el \-alor p a.mbW para el
siguiente saque. La distribucin binomial no toma en cuenta p para cambiar de prueba en prueba dentro de un experimento. Sin embargo, si la poblacin o grande en comp.vacin ron d wna1lo muestra!, el efecto de muestrear sin sustitucin es mlnimo y la suposicin de independencia se satisface en
esencia, o decir, p permanece relativamente constante.
En general, si el tamal'lo muestral, " e menor a 5% de la poblacin, la suposicin de independencia no e. para inquietarse. Por tanto, el tamao muestra! aceptable para u-ar la distribucin binomial con muestras tomadas sin restitucin es
ti< 5%.'\'
Donde:
t1 tamailo muestra!
N tamallo poblacional
Por ejemplo, suponga que 10% de la poblacin del mundo es zurda y que al azar se selecciona una
muestra de 20 personas de la poblacin del mundo. Si la primera persona selec.cionada es zurda, y el muestreo se realiza sin restitucin, el valor de p = .10 prcticamente no multa afectado porque la poblacin
del mundo es tan grande. Adems, con muchos experimentos la poblacin se reabastece continuamente
incluso cuando se realiza el muestreo. Esta condicin es a veces el caso con muestreos de control de calidad de producto) de lotes grandes de produccin. A continuacin veamo algunos ejemplos de problemas de distribucin binomial.
l. Suponga que una mquina que produce chi~ de computadora produce 6% de piezas defectuosas, Si una compaa compra 30 de estos chip~ cul es la probabilidad de que ninguno ~
defectuoso!
2. Un estudio de hica sugiere que 84% de las compailas en E>tad06 Unido tienen cdigo de tica.
De una muestra tomada al azar de IS companas, cu.\l e> la probabilidad de que al meno. 10
tengan un cdigo de tica?
3. Suponga que la marca X de bateras para automviles tiene una participacin de 35% del mercado. Si al azar se seleccionan 70 automviles, cu.\l es la probabilidad de que al menos 30
automviles tengan una batera de la marca X?
4. Un estudio encontr que casi 67% de agentes de compras de una compailla dijeron que su
compaia tena programas para compradores preferidos. Si al azar se toma una muestra de
SO comparuas, cu'1 es la probabilidad de que 40 o ms tengan compailias con programas para
compradores preferidos?
''
T. Rz, R,, ~. R~
la probabilidad para obtener esta secuencia de trabajadores se calcula con la regla especial de la
multiplicacin para eventos independientes ($i se supone que los trabajadores se seleccionan independientemente de una gran poblacin de trabajadores). Si 4% de 105 trabajadores que rechazan ofertas <k
reubicacin lo hacen porque reciben muy poca ayuda, entonces la probabilidad de que una persona
seleccionada al azar y que rechace ofertas de reubicacin por ba razn es O.o.&, que es el valor de p. El
otro 96% de lo trabajadores que rechacen ofertas de reubicacin lo hacen por otras razones, Por tanto,
la probabilidad de seleccionar al azar un trabajador que rechace ofenas de reubicacin por otras razones quedara entre 1 -O.o.& ... 96, que es el valor de q. la probabilidad de obtener e$la secuencia de
cinco trabajadores que han rechazado ofertas de rtubicacin ~ria:
P(T1
n R2 n RJ n ~ n R5>
(.o.&)(.96)(.96)(.96)(.96> = .03397
149
Ob\iammte, en la sckccin al aur de trabajadores que rechazaron ofertas de reubicacin, debido a que
recibieron muy poca ayu~ para su reubicacin podra ser el segundo trabajador o el tercero o el cuarto
o el quinto. A continuacin \UJnOStodas las ~iblcs secuencias para obtener un trabajador que rtdwa
ra la reubicacin por la poca ayu~ que recibi y cuatro trabajadores que la rechazaron por otras razone>
- .03397
- .03397
... 03397
- .03397
- .03397
Ntese que en cada caso la probabilidad final es la misma. Ca~ una de las cinco secuencias tienen
el producto .04 y cuatro veces .96. La propiedad conmutativa de la muluplicacin toma en cuenta el
reordenamiento de las cinco probabilidades individuales en cualquier secuencia. Las probabdades
en eada una de las cinco secuencias pueden reordenarse y resumirse como (.04)1(.96). Cada secuencia
contiene las mismas cinco probabilidades, lo cual hace innecesario \'OIVl!r a calcular la probabilidad de
cada secuencia. Lo que sf es imponante es determinar CI!ltaS deferencias de secuencias se pueden formar y multiplicar con esa cantidad por la probabilidad de que se presente una secuencia. Para las cinco
secuencias de este problema, la probabilidad total de obtener exactamente un trabajador que rechace la
reubicacin por la poca ayu~ recibida para su reubicacin, en una muestra aleatoria de cinco trabajadores que rechazaron ofertas de ubicacin es:
5(.04)1(.96)4 - .16985
Una forma ms fcil de determinar el nmero de secuencias es realizar una lista con todas las posibilidades y usar combinaciono para calcularlas. (El concepto de combinaciones se introdujo en el capltulo 4.) Cinco trabajadores se muestrean, entonces n 5 y el problema es obtener un trabajador que
rechaz una oferta de reubicacin debido a la poca ayu~ recibida para su reubicacin, x 1. Por tanto,
,.Cx dar el nmero de formas posibles para obtener x itos en n intentos. Para este problema, 5C1 es
el nmero de secuencias de posibilidades.
5!
sC1 = l!(5 _ !)! = 5
Al ponerle un valor a la probabilidad de una secuencia con la combinacin se obtendr.
5C1(.04J(.96)
= .16985
Cuando se usan combinaciones se simplifica la determinacin de las secuencias que son posibles
para cieno valor de x en una distribucin binomial.
Ahora suponga que 70% de los estadounidenses piensan que limpiar el medio ambiente es un problema importante. Cu.ti es la probabilidad de muestrear al aur cuatro estadounidense) r tener aactameme dos que digan que limpiar el medio ambiente es un problema importante? Representereos por
E el bito de obtener una persona que piense que limpiar el medio ambiente es un problenu in:por
tante. Para este ejemplo. p .70. Representemos por N el fracaso de no obtener una persona q\lt piense
que limpiar es un problema importante (N denota no importante). La probabilidad de obtener um &
estas personas es q .30.
Ahora veamos las diversas secuencias para obtener dos E en una muestra de cuatro.
E,, E2. N,, N4
4C2(.70J2(.30)2 .2646
Si generalizarnos a panir de estos do) ejemplos obtenemos la frmula binomial, que se puede usar
para resolver problemas binomiales.
FRMVl.A
BlNOMIAL
P(xl ftCx
donde
11
nmero de
n'
r q"-"- -- r 'l"-"
xl(n - xi!
PROBLEMA DE
DEMOSTRACIN
- ...,
)
El estudio de Gallup analizado en el Dilema de decisin encontr que 65% de los consumidora
financieros estaban muy satisfechos con su institucin financiera principal. Si esta cifra todevi.
se cumple, suponge que al azar se muestrean O consumidores financieros. Cul es la probabilided de que exectamente 23 de los O estn muy satisfechos con su insutucin finenciera principal?
Solud6n
El valor de pes .65 (muy satisfechos). el valor de q 1 - p 1
.65
.35 (no muy satisfechos!,
n O y x 23. Con la frmula binomial se obtiene la respuesta final:
.oC23(.65)23(.35)11 - 188732378800)(.0000'9775)(.000000018)
.078
Si 65% de los consumidores financieros estn muy satisfechos, alrededor de 7.8% del
tiempo el investigador obtendrla exactamente 23 de los o consumidores finencieros que estan
muy satisfechos con su institucin financiera. Las probabilidades estn contra obtener 23 de los
consumidores financieros que al azar estn muy satisfechos con su institucin financiera
Cuntos consumidores muy satisfechos serla posible obtener en O consumidores financieros
seleccionados al azar? Si 65% de los consumidores financieros estn muy satisfechos con su ins
litucin financiera principal, uno esperara obtener alrededor de 65% de O o sea (.65HO> O 2!
consumidores financieros muy satisfechos. En cualquier muestra individual de O consumidores
financieros, el nmero de los que estn muy satisfechos es probable que difiera de 26. En promedio. el nmero esperado es 26. Un investigador que de
obtenga 23 consumidores fina!\o
cieros muy satisfechos puede ver este nmero en vista de los 26 que esperarla.
'
'
PROBLEMA DE
DEMOSTRACIN
5.3
CAPITULOS OlSTlUBUOO'-"ESOl~AS151
Soluc:l6n
Este problema debe resolverse como la unin de tres problemas:
1) cero desempleados, x O
21 un desempleado, x .. 1
31 dos desempleados, x 2.
En cada problema, p .06, q .94 y n 20.
De la frmula binomial se obtiene el siguiente resultado:
xO
20Co!.06)0(.94)20
.2901
XM1
+
+
20C1(.061(.94) 11
.3703
x2
20C21.06)2(.94)18
2246
- .8850
P!OILEMA DE
JIEMOSTRACIN
5.4
Solucl6n
Para usar la tabla A.2. primero hallamos el valor de n. Como n 20 para este problema se puede
usar la parte de los cuadros binomiales que contienen valores para n 20 represen-.-d en la
tabla 5.5. Una vez localizado el valor de n, busque el valor apropiado de p horilona!memeen
la parte superior dla tabla. En este problema, p M .40. La columna bajo O contiene las proba
bilidades para la distribucin binomial den - 20 y p 40 Para obtener la probablidad de x 10,
encuentre el valor de x en la columna de la extrema izquierda y localice la probabilidad en el euadro la interseccin de p .40 y x 10. La respuesta seria 0.117. Si se resuelve este problema
con la frmula binomial se obtiene el mismo resultado.
'
PROBLEMA DE
DEMOSTRACIN
5.5
Segn lnformation Resources, la cual publica datos sobre participacindel mercado para varios
productos, Oreos controla alrededor de 10C!I. del mercado de marcas de galletas. Suponga que
de la poblacin se seleccionan al azar 20 compradores de galletas. Cu61 es la probabilidad de
que menos de cuatro compradoresescojan Oreos?
Soludn
Para este problema. n 20, p .10 y x < 4. Como n 20, la parte de los cuadros binomiales
representadaen la tabla 5.5 se puede usar para resolver este problema. Busque a lo largo de la
fila de p valores para 0.10. Determinar la probabilidad al obtener x < 4 comprende sumar las
probabilidades para x O, 1, 2 y 3 Los valores aparecen en la columna x en la interseccin de
cada valor 1<Y p
10.
Velo."
1
2
3
.122
.270
.285
.190
lx< 4) .857
lO
o
1
2
3
4
5
6
7
8
9
10
11
12
14
15
16
17
18
19
20
.1
.122
.270
.215
190
090
.032
.009
.l
.ou
.851
.137
.205
.218
.175
.002
.000
.109
.055
.022
.000
.O<fl
.000
.002
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.J
.GOi
JlllO
Jl2I
.oos
m
.uo
.179
.192
.4
.5
JlllO
.012
.000
.001
.QJ5
.G05
.u.
.015
.llS7
..,,
.G65
.oJl
.160
.U7
.UD
.160
176
.001
.015
1114
.ou
.000
.000
.000
..,.
....
.7
.000
.G01
M!f1
.115
...,,
"11
.117
.IDO
AllO
.111 '.'W
...
.-.:...-
.,,
.124
.cm
.012
JlllO
.IDO
.IDO
JlllO
Jll5
M6
.114
" .w JIOO..
1
.179
.1'9
612
.,
JD2
.21'
.,
.Z7t
.012
.m
CAPtrul.O
S 015TIUBUOO!'-'I~ DISCRETAS
153
Por ejemplo, el estudio de dientes bancarios presentado en el Dilema de decisin indic que 64%
de todos los consumidores financiero piensan que los bancos son ms competitivo hoy de lo que fue.
ron hace cinco aflos. Suponga que al azar se seleccionan 23 consumidores financien y deseamos dererminar las probablidades de que ocurran varios valores x. La tabla A.2 del Apndice A no podra ~
porque esn incluidos slo nueve valores p diferentes y p .64 es uno de esos valores, Adem, n
23 no se incluye en la tabla. Sin la computadora, quedamos con la frmula binomial como la nica
opcin para resolver problemas binomiales para n 23 y p .64. Particularmente si se formulan las
preguntas de probabilidad acumulativa (por ejemplo. x s 10), la frmula binomial puede ser una
forma tediosa de para resolver el problema.
En la tabla 5.6 se muestra la salida de MINJTAB para la distribucin binomial den 23 y p .64.
Con esta salida de computadora, un investigador podra obtener o calcular la pro!nbilidad de cualquier
ocurrencia dentro de la distribucin binomial den 23 y p .64. La tabla 5.7 contiene salida MJNITAB
parad problema binomial en particular, P(x s 10) cuando n 23 y p .64, resueltos con el uso de la
funcin de probabilidad acumulativa de MINITAB.
En la tabla 5.8 se muestra la salida Excel para todos los valores de x que timen probabilidade
mayores de .000001 para la distribucin binomial analizada en el problema de dem~cin 5.3 (n 20,
p .06) y la solucin a la pregunta formulada en el mismo problema.
MINITAB para la
bucin binomial de
- 23. p
6'
P(S :a)
......
0.0000
o .....
....
O.tOOO
0.0000
0.0000
. oo
1.00
.oo
.oo
.oo
oo
.00
.oo
.00
.oo
o.om
o.otn
O.OMO
O.UM
0.1 ..
0.1712
0.1512
0.1114
"
o.UOt
.....
.oo
O.tNO
.oo
TABLA S.7
Salida MITAB para el problema binomial,
P{x! ,. 10 n 23 y p
.64
maannrn
t..Cel
D 23 f p 0.6'0000
e<
11.00
a)
0.0357
o ...
0.0031
0.0090
00
.00
.oo
Una distribucin binomial tiene un valor esperado o un promedio de largo plazo que se
denota con. El valor de se determina con t1 p. Por ejemplo, sin 10 y p .4. entonces t1 p ( 10)(.4) 4. El promedio a largo plazo o valor esperado ~ignifica que, si se
muestrean n arnculos una y otra vez durante largo tiempo y si pes la probabilidad de obtencr un xito en un intento, el nmero promedio de xites por muestra ~ espera que ~
n p. Si 40% de todos los estudiantes graduados de administracin se seleccionan muchas
veces, la expectativa es que, en promedio, cuatro de los 10 estudianres sean muieres.
0.0110
TABLA 5.8
Salida Excel para el problema de demostracin 5.3 y la
distribucin binomial de n 20, p .06
ProblJd
02901
03703
02248
e.ozaa
l "9
IS
ta
l'r
"o
1
n.'\IUD
ta
nnnn<>
0.0001
l4A
"""""
'"12
nn<UU\
e;
CI
"""""x s
Th nrobabilirv
1
1
2 when
20 and
1
1
MEDIAY
DESVlAOOS
ESTANDAR DE UNA
DISTJUBUOOS
811'\0\11A1
Al examinar la media de una distribucin binomial multa una opinin intuitiva acerca de la probabilidad de un resultado dado. Por ejemplo, supongamos que lo invesugadore generalmente estil:
de acuerdo con que 10% de todu IOb pe~n~ son 1urd~. t\o obstante, supongamo. que una invesugadora piensa que, como ya otros lo han expresado, esta cifra es mh alta para nm< que nacen de mujem de m.U de 35 allo.. En un intento por reunir cvidenciu, ella $Clccona al uar 100 nitlo que
nacieron de mujeres de m de 35 at\os y 20 de eUos multaron $Cr zurdos. Es probable que eUa ebtuviera 20 zurdos en una muestra de 100? Cu.intos debiera haber esperado obtener en una muestra clt
100? El valor medio o esperado paran 100 y p .10 es ( 100)(.10) 10 zurdo . ~ 20 niflo. zurdo&
de la muestra de 100, ocurrieron al aur o la investigadora es sacando dat< de una poblacin diferente que la poblacin general que produce 10% de zurdos? Ella puede invntigar m.b este multado
examina ~ probabilidades binomiales para este problema. No obstante, la media de la distribucin k
da un valor esperado del cual trabajar.
SegUn un estudio, 64% de todo, los consumidores financieres piensan que los bancos son m
compcuti~ hoy de lo que fueron hace cinco atlo>. S1 al aur se seleccionan 23 coruwnidom finannos.
cu.ti es el numero esperado que piensan que I< bancos son mh competitivo hoy de lo que fuerce
hace cinco afio,? te problema se puede describir por medio de una distribucin binomial de n ~
y p .64 dada en la tabla S.6. La media de esta distribucin binomial da el valor esperado para este
problema.
n p
23(.64) 14.72
A l;argo plazo, '' al uar se seleccionan 23 consumidores financi~ una y otra va y ,i en \'tfdad
64% de todos 105 consumidores finandero' piensan que lo' banc< son m competiti~ hoy, entonces d experimento dcbtt promediar 14.72 consumldores de 23 que piensen que IOl bancos 10n m
compctitiVQj hoy. El lector debe darse cuenta que como la distribucin binomial es una distribuci!l
ducrct1, nunca obtendr en realidad 14.72 personas de 23 que piensan que lo banco' son m.b compet1th'O, hoy. La media de la distribucin dea ver la relativa probabilidad de cualquier ocurrencia indl
\idual. E.x&mUle la tabla S.6. Nte$C que las mh altas probabilidades son aquellas cerca de x 14 7?.
P(x 15) .1712, P(x 14) .1605 y Ptx 16) .1522. Todas las otras probabilidades p.ira csu
distribucin son menos que estas probabilidades.
La desviacin estndar de una distribucin binominal se denota a y es igual a '-'" p q. Para e!
ejemplo de zurdos. a ~ \/100(.10)(.90) 3. La desviacin est.indar para el problema de consumidores financien descrito por la distribucin binomial de la tabla 5.6 es
TABLA 5.9
...
..
.
...
n8
, , a:. ,..
,
t. ,.....
l
2
J
.....-..
1671
."'5
.JtJI
.5
..-
.-
...
12
........
..2.... ,,.,....
.2117
.2nl
.lle'
11
.cmn
.JtJI
~-
\.
23)(.64)(.36) 2.30
El captulo 6 muestra que algunas dutribuciones binomiales son casi en forma de campana y puede calcularse con el u~ de la curva normal. La media y desviacin esndar de
una distribucin binomial son las herramientas usadas para convertir estos problemas
binomiales en problemas de curva normal.
1.:-11.t ..
O.JS
O.J
0.2S
ct
O.IS
0.2
0.1
o.os
o
4
Valornx
~-
0.2
O.IS
0.1
o.os
4
Valornx
O.JS
O.J
-o
0.2S
"
0.2
O.IS
0.1
o.os
4
Valornx
PROBLEMA DE
DEMOSTRACIN
5.6
Una compal\la fabricante produce 10 mil tarros de plstco por semana. Esta compallla sun.nistra tarros a otra compallla, que los empaca como pane de juegos para dia de campo.
segunda compallla al azar muestrea 10 tarros enviados del proveedor. Si dos o menos de
tarros muestreados son defectuosos, la segunda compal\a acepta el lote. Cu61 es la proba
dad de que el lote sea aceptado si la compaia fabricante de tarros en realidad est producie
tarros que son 10% defectuosos? y 20% defectuosos? y 30% defectuosos? y 40% defectu
Solucin
En esta serie de problemas binomiales, n = 10, x:s 2, y pvaria de .10 a .40. De la tabla A.2 y acu
lando los valores tenemos la siguiente probabilidad de x s 2 para cada valor p y el valor
rado ( n pi.
p
Lote ec.pt.clo
P(x"' 2)
.10
.20
.30
.40
.930
.677
.382
.167
Nmo npllf8do
de defectos ()
1.0
2.0
3.0
4.0
Estos valores indican que si la compaia fabricante est produciendo 10% de tarros d
tuosos, la probabilidad es relativamente alta (.930) de que el lote sea aceptado por probabir
Para valores ms altos de o. la probabilidad de aceptacin del lote por probabilidad se red
Adems, cuando p aumenta, el valor esperado se aleja de los valores aceptables, x s 2.
movimiento reduce las probabilidades de aceptacin del lote.
52 PROBLEMAS
5.5 Resuelva los siguientes problemas con el U$O de la frmula binomial.
a. Si" 4 y p"' .10, encuentre P(x 3).
b. Sin 7 y p
.80, encuentre P(x 4).
c. Sin -= 10 y p .60, encuentre P(x 2 7).
d. Si n ., 12 y p "" .45, encuentre P(5 :S x :S 7).
=
=
5.6 Resuelva lo) siguiente) problemas con el U$O de los cuadros binomiales (vtase la tabla A.2).
a. Sin .. 20 y p .SO, encuentre P(x"" 12).
b, Si n = 20 y p ... 30, encuentre P(x > 8).
c. Sin "' 20 y p = .70, encuentre P(x < 12).
d. Sin = 20 y p = .90, encuentre P(x :S 16).
c. Sin= 15 y p = .40, encuentre P(4 :S x :S 9).
f. Si"
10 y p = .60, encuentre P(x 2 7).
S.8
Utilice 10$ cuadros de probabilidad de la tabla A.2 y trace la grfica de cada wu de bs sigmmtes
distribuciones binomiales. Ano1e en la gr6ca el lugar donde cae la di.nn'bucin.
n 6yp= .70
b. n20yp.50
c. n8yp.80
5.9 La revista Purchasing(Compras) report los resuliado. de un estudio en el que a compradores se
les hace una serie de pregun1as respecto al uso de Internet. Una pregunta era de cmo uQ.ffan b
Internet si pudieran resolverse la seguridad y otros problemas. Setenta y ocho por ciento dijeren
que la usarfan para conocer informacin de precios, 75% dijo que la usaran para enviar rdenes
de compra, y 70% dijeron que la usarfa para reconocimientos de rdenes de compra. Suponga
que estos porcentajes se cumplen para iodos I~ compradores. Un investigador muestrea al aur
20 compradores y les pregun1a cmo usaran la Internet ~i pudieran resolverse la seguridad r
otros problemas.
S.12 Grafique la distribucin del problema 5.11. Para qu valores de x son m.ts alus las~des? Determine el valor esperado de esta distribucin. Cmo o que el valor cspendo K compara con los valores de x que tienen las probabilidades m.h alta>? Calcule la desviacin cs::ldz:..
Determine el intervalo :!: 2'7 para esta distribucin. Entre cules dos valores de x es eu
oten-alo? Cul es el porcentaje de valores dentro de este intervalo? Cmo se ~
esta respuesta con lo que darfa el teorema de Chebyshev o la regla emprica presentada en d
l?
S.13 En los pasados aftO$ recientes, realizar operaciones por comrato en el cxtran.icro se hi bccbo ~
frecuente que nunca an1e. en compaas estadounidenses, No obstante. rnbzu ~DO
ot.i libre de problemas. Un estudio reciente de la revista Purdiasing {Compras m&a que 20'!&
de las compailas que realizan operaciones por contrato en el extranjero ~
cc:=!:o:l'C$.
Suponga que al azar se seleccionan IS compailla. que realizan operaciones por cc:::ua:c.
L (Cu.ti es la probabilidad de que exactamente cinco compatlias que raliu.:1 opaaooocs por
contrato en el extranjero usen un consultor?
b. Cual o la probabilidad de que nueve compai'l(a) que ittlun operaciones por contrato en d
extranjero usen un consultor?
c. Cual o la probabilidad de que ninguna de las compallia) que realizan operadono
trato en el extranjero use un consultor?
por con
d. Cual a la probabilidad de que entre cuatro y siete (inclusive) compmas que ruliun opera
clones por contrato en el extranjero usen un consultor?
e. Construya una grfica para esta distribucin binomial. En vista de la grfica y el valor espera
do, aplique por qu la probabilidad resulta de haber obtenido las panes (a) a la ( d t.
S.14 Segn Cerulli Associates of Boston, 30% de todos lo) asesores financieros (contadores pblicos
titulados, CPT) tienen un promedio de tama.l\o de cliente entre S500 mil y un milln. Tienen
34911 un promedio de wnlilo de cliente entre uno y SS millones. Suponga que existe una li>u
completa de todos los asesores 6nancieros (CPT) y que de la lista al azar 18 se seleccionan.
L Cu.ti o el numero esperado de asesores financiero. (CPT) que tienen un promedio de tama
!lo de diento entre S500 mil y un milln? Cual es el nmero esperado con un promedio dt
tamao de clientes entre uno y $5 millones?
b. Cual es la probabilidad de que al menos ocho uaores financiero. ( CPT) tengan un promedio de wnano de diente entre $500 mil y un milln?
c. Cujl es la probabilidad de que dos, tres o cuatro asesores financiero) (CPT) tengan un promedio de wnano de cliente entre uno y SS millones?
d. Cul es la probabilidad de que ninguno de lo) a~res financiero) tiene un promedio dt
tamano de cliente entre $500 000 y SI milln? Cu.ti es la probabilidad de que ninguno tenga
un promedio de wnatlo de cliente entre SI milln y SS millones? Cual probabilidad o mis
alta y por qu!
Cada uno de esto) ejemplosrepresenta un suceso raro de eventospara algn intervalo. 'te-.eque,
aun cuando el tiempo es un intervalo ms comn para la distribucinde Poissen, lo) intervalo pueden variar de un condado de Estado Unidos a un par de jeans, Algunosde lo) intervalosde estos ejemplos podrian tener cero sucesos. Adems, el promedio de sucesos por intervalo para muchos de esto)
ejemplosest probablementeen un digito ( 1-9).
Si se estudia un fenmeno de distribucinde Poisson sobre un largo periodo. es posible determinar un promtdio a largo plazo. Este promedio se denota como lambda(>.). Cada problema de Poi(son
contiene un valor lambda del cual se determinan las probabilidadesde sucesos paniculares.Aun cuando n y p se requieren para describir una distribucin binomial, una distribucin de Poisson puede ser
descrita por>. sola. La frmulade Peisson se utiliza para calcular la probabilidadde sucesosen un intervalo para un valor dado de lambda.
FORMULA O.E
POISSON
P(x) =-
donde
X=
>."t
>.
x!
0, I, 2,3, ...
el promedio
Si un banco promedia 3.2 clientes cada 4 minutos, la probabilidad de que cinco clientes llegucc
durante cualquier intervalo de 4 minutos es 0.1141.
PROBLEMA DE
DEMOSTRACIN
5.7
Al azar llegan clientes a un banco en tardes de da hbil a un promedio de 3.2 clientes cada '
minutos. Cu61 es la probabilidad de tener ms de siete clientes en un intervalo de ' minutos en
una tarde de da hbil?
>.
En teora. la solucin requiere obtener los valores de x 8, 9, 10, 11, 12, 13,14, . "En realidad. cada valor x se determina hasta que los valores estn tan lejos de >. 3.2 que las probabtlidades se aproximan a cero. Las probabilidades exactas se suman entonces para encontrar x > 7
3.21 .0111
3 21 .0040
81
91
Pix
3 21
10jA 3.2) 132'He
101
.0013
3.2) (3.2''ll"32I
111
.0004
- .0001
Pix .. 111A
121
Pix 13IA
P(x > 7)
1321311'"3 21
.0000
131
81 .0169
3.2l
P(x
Si el banco ha estado promediando 3.2 clientes cada' minutos en las tardes de dfas hbiles, es
poco probable que mis de siete personas lleguen al azar en cualquier periodo de 4 minutos. Esta
respuesta indica que ms de siete personas llegaran al azar en un periodo de ' minutos slo
1.69% del tiempo. los oficiales de banco usan estos resultados para ayudarse a tomar decisiones de contratacin de personal.
PROBLEMA DE
DEMOSTRACIN
Un banco tiene un porcentaje promedio de llegadas aleatorias de 3.2 clientes cada ' minut05.
Cu61 es la probabilidad de obtener exactamente 10 clientes durante un intervalo de 8 minutos?
5.8
>.
x-
Este e1emplo es diferente de los primeros dos ejemplos de Poisson en que los mtervalos para
lambda la muestra son diferentes. los intervalos deben ser iguales para usar>.
xjuntas en
10 clientes,18 minutos
(6.4l'e
101
' - 0528
PROBLEMA DE
DEMOSTRACIN
5.9
Si una oficina de bienes rafees vende 1.6 casas en un dla h6bil promedio y las ventas de casas
en dias h6biles son distribuciones de Poisson, cu61 es la probabilidad de vender exactamente
cuatro casas en un dla? Cul es la probabilidad de no vender casas en un dfa? Cu61 es la probabilidad de vender ms de cinco casas en un dfa? Cul es ta probabilidad de vender 10 o ms
casas en un dla? Cu61 es ta probabilidad de vender exactamente cuatro casas en dos dias?
Soludn
>. - 1.6 casas/dfa
Plx
41 >. - 1.61w1
x, Et
Prol>M>lllded
.0047
.0011
8
9
.0002
x>5
.0000
.0060
.........
.2019
.32'0
2
3
.2514
'5
.0551
.0047
.0011
.0002
.0000
1378
.0176
9 7
6 6
10
10
El clculo del nmero medio de sucesos de este grupo de 20 intervalos da 6.6. En teora, para muestreo infinito el promedio a largo plazo es 6.5. De las muestras, ntese que cuando>. es 6.5, se presenur
varios 5 y 6. Raras veces se presentan sucesos de 1, 2, 3, 4, 11, 12,13, . cuando>. 6.5. Comprender
la media de una distribucin de Poisson da sentido para los sucesos reales que es probable que ocurraa,
la varianza de una distribucin de Poisson tambin es >.. la desviacin estndar es \/X. la combinacin de la desviacin estndar con el teorema de Chebyshev indica la dispersin de una distribucin de Poisson. Por ejemplo, si >. = 6.5, la varianza tambin es 6.5 y la desviacin estndar es 2.55. 8
teorema de Chebyshev expresa que al menos 1 - l//c2 valores estn dentro de le desviaciones estnda:
de la media. El intervalo :t 20' contiene al menos 1 - (12/2) .75 de los valores. Para = >. = 6.5
y O' = 2.55, 75% de los valores deberan estar dentro del rango de 6.5 :t 2(2.55) = 6.5 :t 5.1. Esto es.
el rango de 1.4 a 11.6 deberla incluir al menos 75% de todos los valores. Un examen de los 20 valores
generados al aza.r para una distribucin de Poisson con >. = 6.5 muestra que en realidad 100% de
valores estn dentro de este rango.
Hf'.!f''ii'!111.111HIi1.1.11:i.~----------------MIObneu
Quejas ..........
..-n
(1.08'3~ -
MIN"ITAB producir una <fulribudn de Poisson para prkticarnmte cualquier valor de lambda.
Por ejemplo, un estudio realizado por el 'ational Center for Health Stati.ti~ indica que, en promedio,
un estadounidense time 1.9 enfermedades o ksiones agu<bi por afto. Si esto casos son distribuciones
de Poisson, lambda es 1.9 por ano. Qu aspecto tiene la distribucin de probabilidad de Poisson para
esta lambda? La tabla 5.11 contiene la wida MINITAB para esta distribucin,
Exul puede tambin generar probabilidades de dif~tcs valores de X para cualquier di>tribucin
de Po>50n. La tabla 5.12 muesua la. probabilidado produd~ por Exul para ti problema de bienes
ralees del problema de demostracin 5.9 usando una lambda de 1.6.
.. -,
FIGURA
5.4
.
Grfica MINITAB de la distribucin de Poisson para>. - 1.6
O.IS
0.)
!
J o.os
~o:
0.10
0.1
o.o
'
10
TABLA 5.11
TABLA 5.12
...__,e;~
. . . ,. ...
'prf
1'K'Y1di
l'(Z .,
t.1411
O.Jtq
0.111
Si se satisfacen estas condiciones y el problema binomial es un candidato para este proceso, el procedimiento se inicia con el calculo de la media de la distribucin binomial, n p. Debido a que n
es el valor esperado de la binomial, se traduce al valor esperado, A, de la distribucin de Poisson. U=
como el valor A y usar el valor x del problema binomial permite el calculo de la probabilidad a par
tir de un cuadro de Poisson o por la frmula de Poisson.
Grandes valores den y pequeos valores de p suelen no incluirse en cuadros de distribucin binomial, por lo cual imposibilitan el uso de tcnicas de clculo binomial. El uso de la distribucin de
Poisson como aproximacin a tal problema binomial en tales casos es una alternativa atractiva; de hecho,
cuando no se dispone de una computadora, puede ser la nica alternativa.
Como ejemplo, el siguiente problema de distribucin binomial se puede resolver con el uso de la dis
tribucin de Poisson: n = 50 y p .03. Cul es la probabilidad de que x = 4? Esto es, P(x = 4ln = ~
y p = .03) =?
Para resolver esta ecuacin, primero determine lambda:
A==
n p= (50)(.03) = l.S
Cuando n > 20 y n p :S 7, este problema es un candidato para la aproximacin de Poisson. Parx 4, la tabla A.3 da una probabilidad de .0471 para la aproximacin de Poisson. En comparacin cor
esto, resolver el problema con la frmula binomial da los siguientes resultados:
soC4(.03)4(.97)46 .0456
La aproximacin de Poisson tiene una diferencia de 0.0012 respecto al resultado obtenido al usar
la frmula binomial para resolver el problema.
A continuacin veamos una grfica MINITAB para esta distribucin binomial.
0.3
-e
".a
0.2
::;
e 0.3
a.
o.o
3456789
Valon:sX
Con~ 1.5, puede generarse la distribucin de Poisson. Veamos en ~ui<U una gr.ifia Ml~ITAB
para esia dis1ribucin de Posson.
0.3
0.2
0.)
o.o
11
Valora X
Al comparar las dos gr.lficas, es dificil distinguir entre la distribucin binomial y la distribucin de
Poisson debido a que es cercana la aproximacin de la distribucin binomial por la distribucin
de Poisson.
PIOBLEMA DE
BEMOSTRACIN
5.10
Suponga que la probabilidad de que un banco cometa un error al procesar un dep11to es .0003.
Si se auditan 10 mil depsitos In), cu61 es la probabilidad de que se cometan mb de seis erro
res al procesar depsitos?
Solucln
~
Debido a que n ..> 20 y n p"" 7, la aproximacin de Poisson est6 cercana lo suficiente para
analizar x 6. La tabla A.3 da las siguientes probabilidades.
). - 30
X
Probeblllded
.0218
7
8
.0081
.0027
.0008
.0002
9
10
11
12
x>8
.0001
033!>
Para resolver este problema con el uso de la frmula binomial es necesario empezar con"
7.
10 ooo~l.0003)7(.9997)9913
Este proceso continuarla para valores x de 8, 9, 10, 11, .. , hasta que las probabilidades se
aproximen a cero. Obviamente, este proceso no es pr6ctico y hace de la aproximacin de
Poisson una alternativa atractiva.
5..3 PROBLEMAS
*'
(. P(4
<X< SI>- -
4.4)
166
5.16
Encuentre los siguientes valores con el uso de las tablas de Poisson del Apndice A.
> 7IA
s Xs
d. P(x
= OIA =
b. P(x
e.
9IA = 4.2)
1.9)
f. P(S
5.17
= 2.9)
<X s
8IA = 5.7)
Trace las grficas de las siguientes distribuciones de Poisson. Calcule la media y desviacin esta=
dar para cada distribucin. Localice la media en la grfica. Observe la forma en que las probab
lidades se grafican alrededor de la media.
a. A= 6.3
b. A=
1.3
c. A= 8.9
d. A= 0.6
5.18 Los lunes por la maana, el First National Bank tiene abierta slo una ventanilla de cajera parad
tos y retiros. La experiencia ha demostrado que el nmero promedio de clientes que llegan en un inR:I'
valo de 4 minutos los lunes por la maana es 2.8, y cada cajera puede atender con eficiencia ms de
nmero. Estas llegadas aleatorias a este banco los lunes por la maana estn distribuidas por Po
a. Cul es la probabilidad de que una maana de lunes lleguen exactamente seis clientes en
intervalo de 4 minutos?
b. Cul es la probabilidad de que no llegue ningn cliente a hacer depsito o retiro durante
intervalo de 4 minutos?
c. Suponga que una cajera puede atender a no ms de cuatro clientes en cualquier intervalo
4 minutos en esta ventanilla en un lunes por la maana. Cul es la probabilidad de q:
durante cualquier intervalo dado de 4 minutos, la cajera no pueda satisfacer Ja deman
Cul es la probabilidad de que la cajera pueda satisfacer la demanda? Cuando la demanda
pueda ser satisfecha durante cualquier intervalo dado, se abre una segunda ventanilla. Q
porcentaje del tiempo tendr que estar abierta una segunda ventanilla?
La gerente de un restaurante est interesada en tomar un mtodo ms estad1stico para pron car la carga de clientes. Ella inicia el proceso con una recopilacin de datos. Uno de los empl
de recepcin del hotel se asigna a contar clientes cada 5 minutos de 7 p.m. a 8 p.m. todos los
dos por la noche durante tres semanas. A continuacin aparecen los datos. Una vez reunida
informacin, la gerente calcula lambda con los datos de las tres semanas como un conjunte
datos como base para el anlisis de probabilidad. Qu valor de lambda encontr ella? Su
que estos clientes llegan al azar y que las llegadas son distribuciones de Poisson. Use el valer
lambda calculada por la gerente y aydela a calcular las probabilidades de las partes (a) a la
para cualquier intervalo dado de 5 minutos entre las 7 p.m. y las 8 p.m. de un sbado por la n
Nmero de llegadas
Semana 1
3
6
4
6
2
3
1
5
l
o
3
3
Semanal
Semana3
2
4
3
5
3
5
4
7
3
4
8
1
3
2
6
4
2
5
3
4
a. Cul es la probabilidad
minutos?
b. Cul es la probabilidad de que seis o ms clientes lleguen durante cualquier intervalo dado
de 5 minutos?
c. Cul es la probabilidad de que durante un intervalo de JO minutos lleguen menos de cuatro
dientes?
d. Cul es la probabilidad de que entre tres y seis (inclusive) clientes lleguen en cualquier intervalo de 10 minutos?
e. Cul es la probabilidad de que exactamente ocho clientes lleguen en cualquier intervalo de 15
minutos?
5.20
5.21
El nmero promedio de viajes anuales por familia a parques de diversin en Estados Unidos es
una distribucin de Poisson, con una media de 0.6 viajes por ao. Cul es la probabilidad de
seleccionar al azar una familia estadounidense y encontrar lo siguiente:
a. La familia no hizo un viaje a un parque de diversiones el ao pasado?
b. La familia hizo exactamente un viaje a un parque de diversiones el ao pasado?
c. La familia hizo dos o ms viajes a parques de diversiones el ao pasado?
d. La familia hizo tres o menos viajes a parques de diversiones en un periodo de tres aos?
e. La familia hizo exactamente cuatro viajes a parques de diversiones durante un periodo de seis
aos?
5.22
Las colisiones en el canal de navegacin de Houston son raras. Suponga que el nmero de colisiones son distribuciones de Poisson, con una media de 1 .2 colisiones cada cuatro meses.
a. Cul es la probabilidad de que no ocurran colisiones en un periodo de cuatro meses?
b. Cul es la probabilidad de que ocurran exactamente dos colisiones en un periodo de dos meses?
c. Cul es la probabilidad de que ocurra una o menos colisiones en un periodo de seis meses?
Si ocurre este resultado, qu podra concluirse acerca de las condiciones del canal de navegacin durante este periodo? Qu podra concluirse acerca del conocimiento de seguridad del
canal durante este periodo? Qu podria concluirse acerca de las condiciones del clima durante
este periodo? Qu podra concluir el estudiante acerca de lambda?
5.23 Una compaa fabricante de plumas para escritura promedia 1.2 plumas defectuosas por caia
producida (200 plumas). El nmero de defectos por caja es una distribucin de Poiss- n.
a. Cul es la probabilidad de seleccionar una caja y no encontrar plumas defectuosa>?
b. Cul es la probabilidad de encontrar ocho o ms plumas defectuosas en una e.ja)
c. Suponga que un comprador de estas plumas deja de comprarle a esta compaa si una caja
contiene ms de tres plumas defectuosas. Cul es la probabilidad de que una caja contenga
ms de tres plumas defectuosas?
5.24
Un investigador mdico estima que .00004 de la poblacin padece de una rara enfermedad de b
sangre. Si el investigador selecciona al azar 100 mil personas de la poblacin, ;cul es la probabilidad
de que siete o ms personas tengan esa rara enfermedad de la sangre? Cul es la probabilidad de
que ms de 10 personas tengan esa enfermedad? Suponga que el investigador obtiene ms de 10
personas que tengan esa rara enfermedad en la muestra de 100 mil pero que la muestra fue tornada
de una regin geogrfica particular. Qu podra concluir el investigador de los resultados?
5.25 Una empresa de regstro contiene gran cantidad de datos, Histricamente 9% de las pa:
de datos rcgimadoa por la compar\1a contienen errores, Si al azar se seleccionan 200 paginas
datos,
a. cul o la probabilidad de que seis o mas paginu contengan errores!
b, ;cul es la probabilidad de que m.i> de 1 O p.iginh contengan errores!
c. cu.il o la probabilidad de que ninguna p.lgina contenga errorc ?
d. cu!I o la probabilidad de que menos de 5 pginu contengan errores!
5.26 Un aho porcentaje de personas que se fracturan o dislocan un hueso consultan un m
Suponga que el porcentaje es 99%. Considere una muestra en la que 300 personas ~ selecci
al aur y que se han fracturado o dislocado un hueso,
a. l n la probabilidad de que exactamente cinco no consulte al mdico?
b. Cul es la probabilidad de que menos de cuatro no con ulte al mdico!
c. Cu.i.l es el nmero esperado de personas que no venan al mdico!
FORMUU.
HlPfRGEOMtTIUCA
donde
.\' tamao de la poblacin
n tamao muesrral
J\ numero de xito. en la poblacin
x = nmero de xito en la muestra: el muestreo
'>C' hace
sin restitucin
169
en algunas situaciones cuando el muestreo SC' hace >in restuucin. Debido a lo~ cuadros existentes es
preferible el uso de la dstnbucin binomial en lugar de la distribucin hipcr:comctrka -iempre que
~ posible. Como regla pnktica, si el tamai\o muestral e> menor a 5% de la poblacin, el uso de la distribucin binomial en lugar de la dstribucin hipergeorntrica C'S aceptable cuando el muestreo se hace
sin mutucin. La distribucin blpergeomtrica da la prob.abilidad ex.lela, y la distribucin binomial
da una buena aproximacin de la probabilidad en esta suuacones.
En resumen, la distribucin hipcrgcomtrica debera usarse: en Jugar de la dstribucin binomial
cuando cst~n presentes l.u ,jguientC'S condiciones:
l. El muestreo se hace sin restitucin,
2. n ~ 5%N.
-= _1581
42 5(M
24Cs
PROBLEMA DE
DEMOSTRACIN
5.11
N 18, n 3, A 12 y x 2:: 1
Este problema es en realidad tres problemas en uno:
X
X
X
1
2
3
X2
~+~+
1aC3
.2206
1aC3
+ .4853
12C1 tCo
1aC3
2696
9755
Un mtodo alternativo de solucin que usa la ley de complementos sera 1 (uno) menos
probabilidad de que ninguna de las compafllas Htuviera situada en Silicon Valley, o sea
1 - P{x OIN 18, n 3, A 121
Por tanto,
1-
nCo ,e,
1- .0245 .9755
18~
5.4 PROBLEMAS
5.27 Calcule las siguientes probabilidades con el uso de la frmula hipergeomtrica,
a. La probabilidad de x 3 si N = 11, A 8 y n = 4
b. La probabilidad de x < 2 si N = 15, A = 5 y n = 6
c. La probabilidad de x - O si N = 9, A = 2 y n = 3
d. La probabilidad de x > 4 si N 20, A 5 y n = 7
Privada
Privada
Privada
Privada
dd Estado
Privacb
del Estado
del Estado
cid tado
dd E..tado
del Estado
Prh'llcb
Pnvacb
Privacb
cid Estado
Privada
Privacb
Privada
del Estado
CAPm11.0S
DISTlUBUOO~~DISCRETAS
171
La publicacin Oira/og Agt contiene una lista de las principales 17 empresas de tados Unidos
por ventas anuales por calogo. DeU Competer es la nmero uno. seguida por Gatew.ay y J.C.
Penney. De las 17 empresas de la lisu,ocho est~n en algn upo de negocio rdacionado con eomputadoras. Suponga que al azar se seleccionan cuatro empresas,
L Cll es la probabilidad de que ninguna de las empresas est en algn tipo de negocio rela
cionado con computadoras?
b. Cll es la probabilidad de que las cuatro empresas estn en algun tipo de negocio rdacionado
con computadoras?
c. Cll es la probabilidad de que exactamente dos estn en negocio no relacionado con computadoras?
S.30 W. Edwards Deming, en su experimento de cuentas rojas, tena una caja de cuatro mil cuentas,
de las cuales 800 eran rojas y 3 200 blancas. Suponga que una investigadora va 1realizar una versin modificada del experimento de la cuenta roja. En su experimento, ella tiene una boba de 10
cuentas, de las cuales cuatro eran rojas y 16 blancas. Este experimento requiere que un partid
pante tome la bolsa y al azar seleccione cinco cuentas sin restitucin.
L Cll es la probabilidad de que el panicipante seleccione exactamente cuatro cuentas blancas?
b, Cll es la probabilidad de que el participante seleccione exactamente cuatro cuentas rojas?
c. Cll es la probabilidad de que el participante seleccione todas las cuentas rojas?
S.31 A continuacin aparecen las principales 10 ciudades de Estad~ Unidos clasificadas por nmero
de cuartos de hotel (informacin compilada por Smilh Travel Researeh).
NdnMro
Ciuclacl
NdnMro de CUU10S
ta. \'egu. NV
106100
2
Orlando, Fl
92 200
3
LM ngdesLong Bach,CA
80000
4
Atlanta,GA
73 100
S.29
Chicago. lL
6
7
Washington, OC
ll:ueva York. !\'Y
Da!W, TX
San Diego. CA
8
9
10
Anaheim-Sanu Ana, CA
71 000
68 700
66600
48 500
47 200
44 600
TABLA S.13
TABLA S.14
1 1
Ri~ico
con N 24,
X 8, y n 5
X
o.oo
P(X
X)
0.106
RESUMEN
Los expenmentos de probabilidad producen resultados aleade un experimento aleatorio \C denomina variable aleatoria. Las variables
a:eatoria) tal~ que el conjunto de todos (0$ posibles valores es
a lo sumo un numero finito o contablemente infinito Je valores posbtes se llaman variables aleatorias discretas, La> varia
bles aleatoria.' toman valores en todo> los puntos sobre un
i::::tm-alo dado y se denominan variables aleatorias discretas.
Las distribuciones continua. se construyen de variables alea
lOria.s continuas, Tres distribuciones discreta. son la dstribucin binomial, la distribucin de Poisson y la distribucin
:pergromtrica.
La distribucin binomial se adapta a experimentoscuando
posible> slo do> resultados mutuamente exclusivos, En
rrorla, cada intento en un experimento binomial debe ser in
dependiente de 10$ otros intentos, No obstante, id tam:iilo pobbcion:al e suficientemente grande en relacin con tamallo
cuestral (n < 5%S), la distribucin binomial se puede usar
donde sea aplicable en caso> donde (0$ intentos no son independientes. La probabilidad de obtener un resultado deseado
en cualquier intento se denota como p. que es J;a probabilidad
dt obtener un suceso. La distribucin binomial se puede usar
~ analizar estudio, discretos que comprendan cosas como
;;;ua;'cruz. defectuoso/bueno y hombre/mujer. La frmula
bmomial se U$.1 para determinar la probabilidad de obtener x
=ltados en n intento' Lo problemas de di\tnbucin binose pueden resolver mas rpido con el uso de cuadros
bom1tles que por frmula. Una cuadro binomial se puede
;orios. tina variable que contiene los resultados
TRMINOS CLAVE
distribucin hipcrgeomrica
distribucin de Poisson
lambcla(X)
t.::stribucin binomial
=nbuciones continuas
.::suibucionesdisaetas
variable aleatoria
variables aleatorias continua>
\-ariablo aleatorias discretas
FRMULAS
\'alor medio (esperado) de una distribucin diKrcta
Frmula de Poisson
,,,
.
P" q"-"
.x!(n-xl!
Frmula hipcrgcomttrica
CONSIDERACIONES TICAS
de cliltribucianel dilama
.......
11_.latlilb
lllltituci6n. ll t1m11oy.. ~"
doadetl........,
UIO
..imm
La
eD
.._
,...,...w...ae.
.. ..._,..,....,....._ ,
..-w,..--.
e1e..mr...- ......
.. rst
..._an
dradwclf,..._dl......,,._ .....
proMllen
apertolell~
PROBLEMAS COMPLEMENTARIOS
C.lculo de ntad1sticas
5.37
11 y p
.23, cuil
a.
b.
es b prob3bilid3d de que
'2
S.35
de
a. P(ic 14ln
b. l'tx< Slri
c. P(x <:: 12ln
d. P(x > 20ln
lOyp .60)
IOyp .30)
IS ;y p .60)
25 y p .40)
P(x <
51>- 3.3)
2.1)
sp, "" 4.2)
.?
b. 51
Use la tabla A.3, Apfodice A. p.ira encontrar los siguimtes valores de: distribucin de Poisson.
S.38
quex .. 3~
b. Si N 1 O. n 3 y A 5, cul es la probabilicd de
qu~ s H
c. Si ~ 13, n 5 y A 3, cul es b pr<>Nbilidad de
que x <:: 2?
Pruebe aua conocimiento
S.39 En un estudio
peno~ jubiladas? Cunw personas jubiladas esperana u red encontrar en una muestra aleatoria de 25 inver6ionisw en acciones? Suponga que se toma una muestra
al var de 20 aduhOi de a,tado. Unidos, Cul es la pro
babildad de que exactamente ocho adultos in\ icrtan en
fondos mutuos! Cuil es la probabilidad Je que menos
de seis adultos inviertan en fondo mutuos? Cu.il es la
probabilidad Je que ninguno de los aduhos inviertan en
fondos mutuos! QUI es la probabilidad de que 12 o m.li
adulto.' inviertan en fondos mutuos? Para que! nmero
exacto de adulto~ o la probahilidad ms alta? Cmo se
compara ~ta cifra cnn el nmero esperado!
5.40 Una gasolinera tiene una bomba que dimibuyc com-
bustible dibcl a automviles. El propietario estima que
slo unos 3.2 autos usan la bomba de disel cada 2 horas.
Suponga que las llegad.u de usuarios de la bomba de
disel son una djstribucin de Poisson,
QUI es la probabilidad de que tro auto. lleguen a
11$.lr la bomba de Jikt-1 durante un periodo de 1
hora?
b. Suponga que el propietario necesita cerrar la bomba
de disel durante media hora para hacer reparaciones, aun cuando le disgusta perder un negocio, Cul
es la probabilidad de que no lleguen autos a uar la
bomba de disel durante el periodo de mtdia hora?
c. Suponga que cinco autos U~ durante un periodo de
una hora para usar la bomba de: disel, Cuil e~ la pro
babi.lid.1d de que cinco o ms autos lleguen durante un
periodo de 1 hora a usar la bomba de di6d? Si en realid.id OCWTC este resultado. que! podra conduincl
5.0
S.~1 En una planta manufacturera en particular, dos maquinas (A y B) producen una pina especial. Una mquina
(B) es mis nueva y mis rpid.i. En un periodo de 5 minutos se produce un lote formado por 32 piezas, 22 de l.u
cuales son producidas por la mquina By el resto por la
nquina A. Suponga que un inspector selecciona al azar
doce peus de este lote.
L
116
1.
3
4
6
7
8
9
10
11
12
13
14
IS
16
17
18
19
20
21
22
23
24
2S
Pttidko
Una oficina de Albuqumuc tiene 24 trabajadores incluyen 5.55 Suponga que en la operacin de contabilidad de una gran
do b gercnda. Ocho de~ trabajadores \'iaian de un suburcorporacin, la probabilidad de un error de registro en
bio a su trabaio dock d bdo oeste del rio Grande (Bra'O).
cu.11quicr facturacin es .005. Suponga que b proNbilidad
Suponga que Iris de b olicinbw al azar se sdeccionan.
de un error de reg~tro de una fa.:turadn a b siguiente
es constante y un audtor muestrea al azar mil facturas..
a. Cul es la probabilidad de que lo> ~b trabajadores
a. Cuil es la probabilidad de que menos de cuatro fac
viaien de un suburbio a su trabajo desde el lado oeste
ruraciones contengan un error de registro?
dd no Grande?
b. Cuil o la probabilidad de que ninguno de lo. trab, Cu!I es la probabilidad de que m$ de JO actura
cienes contengan un error de facturacin!
baiadores viaje de un suburbio desde el lado oeste del
rio Grande?
c. Cul es la probabilidad de que la. mil facturaciones
c. Cil probabilidad. (a) o (b) es mejor? Por qu pim>a
no contengan errores de reg~tro?
eso.
5.56 De acuerdo con la American Medcal Association, aire
d. Cuil es la probabilidad de que la mitad de lo. traba
dedor de 36% de todos 10> m~CO> estadounidenses de
jadores no viajen de un suburbio desde el lado oeste
meno. de 35 ai'i0> de edad son mujeres. Su companla
del ro Grande?
acaba de contratar ocho mdicos de menos de 35 ai'io> y
ninguno es muier. Si un grupo de doctoras mujeres desea
.!.5.? ~
d U.S. Census Bureau, 20% de ~ traba~ra de
demandar a su compaa por prctiau discriminatorias
.\ll:uua usan transporte publico. Si se seleccionan al azar 25
de contratacin, tendra usted un caso dificil con base
trabajadores de Atbnta, cu.tl es d numero esperado que
en estos nmero? Utilice la distribucin binomial para
use transporte pblico? Gra6que b distnbucin binomial
determinar la probabilidad de que el resultado de la con
para e.ta muestra. Cu.iles son b medja y la desviacin
tratacin de la compaa ocum al azar y comente sobre
esndar para esta di)tnbucin? Cul es b probabilidad de
la potencial justificacin para una demanda.
que ms de 12 de los trabajadores seleccionados usen
transporte pblico? Explique conceptualmente y a par 5.57 El siguiente cuadro es una lista de las 32 m.is grandes
ur de la grfica por qu obtendra usted esta probabiliuniversidades de futado. Unido~ de acuerdo con cifras
dad. Supongamos que el lector muestrea al azar 25
de inscripciones de \\orld Almanac.
trabajadores de Atlanta y en realidad obtiene 14 que
Ull.Ya'Sidad
hucritos
us.in transpone pblico. Es probable este resultado?
Univtrsiy of Phoenix (AZl
66SJ4
<Cmo podria explicar usted este resultado?
~
no tienen
televisor a color. Un analilta de mercadeo de televisin
selecciona al azar 160 familias estadounidenses.
a. Cuntas familias esperana ti que no tengan televisor
a color?
b. Cuil es la probabilidad de que ocho o ms familias
no tengan televisor a color?
c. Cul es la probabilidad de que entre do> y sei> famila> [inclusive) no tengan televisor a color?
(l~'l
49996
47952
45481
45 11~
44126
44 026
4) J6
41 219
405il
3;965
3;8il
37 59S
3; 150
3; (r.6
'6
'6134
'6015
JS2J7
JH60
JJ951
33 713
"I
315.S4
31123
31945
31609
31 ).47
31 2SS
30916
30861
30405
Si de la lista se seleccionan al azar cinco universidades difcttnt~. cul es la probabilidad de que tres de
ellas tengan 40 mil o m alumno, inscritos?
b. Si de la lista se seleccionan al azar ocho universidades
diferentes, cu.il es la probabilidad de que dos o
menos san universidades de Michigan o Arizonal
c. Suponga que las universidadesse seleccionan al azar
de la lista y con restitucin. Si se muestrean cinco
universidades, cu.il es la probabilidad de que la
muestra contenga exactamente dos universidades de
Texas?
5.58 En una ciudad de la Regin Central, el gobierno tiene 14
cuas recuperadas, que al evaluarlas resulta que valen
casi lo mismo. Diez de la:. casas estn del lado norte de
la ciudad y el resto estn en el lado oeste. Un contratista
de la localidad remite una cotizacin para comprar cuatro de las casas.
a. Cu.iles de las casu que obtendr el contratista est
sujeta a retiro aleatorio?
b. Cul es la probabilidad de que las cuatro casas seleecionadas por el contratista estn en la lado norte de
la ciudad?
c. Cu.il es la probabilidad de que las cuatro casas selecdonadas por el contratista estn en el lado oeste de la
ciudad?
5.59 El Public Citizen's Health Research Group estudi las
-cvcr.u acciones disciplinaria, que se tomaron durante
un ao reciente a doctores no federales en Estados
Unidos El promedio nacional fue 3.84 acciones severas
por mil doctores, El estado con el nmero mas bajo fue
Mmncsota, con 1.6 acciones severas por mil doctores.
Suponga que los nmeros de acciones severas por mil
doctoro en Estados Unidos y en ~linnt.)Ota son distribuciones de Poi-wn.
a. Cul e> la probabilidad de seleccionar al azar mil
doctores de E:.tad~ Unid~ y no encontrar acciones
severas tomadas?
b, Cul es la probabilidad de seleccionar al azar 2 mil
doctores de Estados Unidos y encontrar seis acciones
severas tomadas?
c. Cul es la probabilidad de seleccionar al azar 3 mil
dcetores en Minnesota y encontrar menos de siete
acciones serias tomadas?
Interpretacin de le Nllde
5.60 Estudie la salida Mll'ITAB. Analice el tipo de distribucin, la media, desviacin estndar y la razn por la que
las probabilidades caen como se ve aqui.
Probablity
Binomial
X
0.00
1.00
2.00
3.00
4.00
5.00
6.00
7.00
8.oo
9.00
10.00
11.00
12.00
13.00
14.00
15.00
Oenaity
Function
n 15 and p 0.36000
with
P(X X)
0.0012
0.0104
0.0411
0.1002
0.1692
0.2093
0.1963
0.1419
0.0798
0.0349
0.0118
0.0030
0.0006
0.0001
0.0000
0.0000
5.61 Estudie la salida Excel. Explique la distribucin en trminos de forma y media. Son estas probabilidades bs
que se esperaran! Por qu si o por qu no?
1
2
3
'5
e
7
8
9
10
11
o.
17
0.0005
0.0001
5.62 Estudie la salida grfica de Excel. Describa la distribucin y explique por qu la grfica toma la forma que K
ve aqu,
cormo s nisTRIBUOO:-b
Ol>lnbun binomlol: " - 22 'p - .64
o.i ......~~~~~~~~~~~'--~~---,
0.11
0.11>
0.14
~
DISCRETAS 179
O.)
0.12
0.1
0.08
0.2
0.1
;a
0.06
0.04
G.02
04-..~ ........~-.a.~~41.1,L.l,l.IJu,lol:i.u.u.i,i;~~
O 1234
S 6 719101112Ul41Sl6171119l02122
\'llom.r
10
3. Utilice la base de datos financiero) de compal\as fabricantes de productos qumicos, Si cinco de estas compaas se seleccionan al azar. cul es la probabilidad de
que exactamente tres tengan un rendimiento sobre
capital contable de 15% o m.u1 Su~~ncia: use la dstribucin hlpergeomtrica y una subdivisin de esta
poblacin de 19 compaas para calcular esta probabilidad. Cul es la probabilidad de seleccionar al azar ocho
compaas de seguros y obtener exactamente cuatro de
ellas con rendimientos promedio de menos de 1 %?
suficiente evidencia para convencer a la administracin de que el porcentaje promedio de quejas aument
o se puede escribir como un suceso aleatorio que ocurre."
con bastante frecuencia? Elabore la distribucin de
Poisson para ola pregunta y analice su implicacin
para este problema.
3. Un estudio de 52 lanzamientos de productos encontr
que los emprendidos con crecimiento de ingresos
como principal objetivo, tienen ms probabilidad de
fracasar que Jo, que pretenden aumentar la satisfaccin de clientes o crear nuevos mercados, como el sis
tema APS. Suponga que de los 52 productos lanzados,
34 fueron lanzados con crecimiento de ingresos como
su principal objetivo y el roto se lanz para aumentar
la satisfaccin del cliente o crear nuevos mercados,
Ahora suponga que slo 10 de estos productos tuvieron xito (los dems fracasaron) y siete fueron productos lanzados para aumentar la satisfaccin del
cliente o crear un nuevo mercado. Cul es la probabilidad de que este resultado ocurra al azar? Que nOI
dice esta probabilidad sobre la premisa bsica con respecto a la importancia del objetivo principal?
USO DE LA COMPUTADORA
EXCEL
Excet se puede usar para calcular probabilidades exactas o acumulativas para problemas con el uso de distribuciones bino
rniales, hipergeomtricas o de Poisson. Para cada uno de estos
clculos. el proceso se inicia al seleccionar la tecla Paste
Function.f,.. en la barra de herramientas, con lo cual aparece la
caja de di~
Paste Function (Pegar Funcin).
puesta. La primera lnea pide el nmero de xitos, x; la segunda es para el valor de ). )' la tercera es un valor lgico que
determina si la respuesta se da como probabilidad exacta
probabilidad acumulativa. Si el usuario responde con FALS!
en la linea, la respuesta ser~ dada como probabilidad exacta;
se pone TRUE en la lnea, la respuesta se dar como la probabilidad acumulativa de valore> entre cero y x.
Distribucin binomial
Distribucin hipergeomtrica
Distribucin de Poisson
Los problemas de distribucin de Poisson se pueden resolver
con el uso de la opcin POISSON seleccionada de la caja de
dilogo Paste Function. En la caa de dilogo POISSON que
aparece, deben completarse tres lineas para obtener una res-
MINITAB
MINITAB Window) permite producir una distribucin bi!'l>rnial, una distribucin de Poi son. o una distribucin hrpergeomtrica. El proceso empieza por seleccionar la opcin Qt)c
la barra de men, con lo cual aparece el men descendente
Seleccione la opcin frobability ~i5tributions. Aparece
otro men descendente.
Distribucin
binomial
CAPTULO
Distribuciones continuas
OBJETIVOS DE APRENDIZAJE
182
La industria de~
en&m1 muchos desaos en la dcada de 1990. Los mercados tradicionales
se desgastaron y surgieron nuevas oportunidades. En dcadas puadas, la. f~
tradicionales que
contaban con un solo ingreso se apoyaron en la cobertura de seguros de ,;da contra la muerte prematura del sostn de la familia. En esta dcada, lu parejas se c<Wn a mayor edad, tienen meno> hijos y a
veces son dos quienes sostienen la familia. ~w y otras tenden~ muJ1an menos dependientes de un
seguro de vida. De hecho. una encuesta realizada por Life lnsurance Marketing and Research
Associa1ion mostr que slo 59% de los estadounidenses creen que un seguro de vida es la mejor
manera de proteger financieramente una familia contra la muerte prematura del sostn de la famiha.
E!>ta cifra es menor a 72% de principios de la dcada de 1980. Financieramente, lOi anaf1as de esta
indu 1ria dicen que e 1a cada cue ta a las compar\iu de ~uros unos 700 mil millonl!li de dlares en
coberturas y 4 700 millones en ingreso por primas. Ahora. para realur nuevas \'tnla., lo> vendedores
de seguro observan de cerca otros mercados que antes eran poco utiliudos; por ejemplo, 10) tradicionalmente considerado, como re goso incluyendo familias con padres solteros o de bajO) ingr('S()> .
lo> seguro> de servicio medico, propietario de vivienda y de automvil, a.a como otros tipo de
aseguradores enfrentan situaciones difkilcs similare, excepto en lugares donde la cobertura de seguros
e obligatoria. El promedio de familia estadounidense ~ta S2 100 en todo tipo de seguros, de acuerdo
con la Bureau of Labor Staristics' Consumer Expendhure Survey, Es1a cantidad no incluye seguro
de servicio medico y de vida pagado en su totalidad o en parte por empleadores. Un desglose por tipo de
seguro es 39% por cobertura de servicio mdico, 33% por vehculos. 19% por seguro de vida y otro> se
guros perscnales y 9% para duei\os de viviendas y seguros relacionados.
La ubicacin geoglifica inOure mucho en las tarifas de seguro pagadas por consumidores. En pro
medio. un consumidor estadounidense gasta S69 l al al'IO en asegurar su automvil. Las tarifas ms alw
estn en r.;ueva Iersey (SI 100 al afio), Nueva York (S960 al aflO) y Hawai ($959 al ao). Las tarifas ma.'
baj~ eslin en Oakota del Norte, donde el promedio de tuifa por allo es $402. La cantidad promedio
en E!>tado. Unido> para asegurar una vivienda era de SHO, sin incluir a AJa.,ka y Hawai, Texas registr
el costo anual ms alto por asegurar una vivienda en $592. Maswchustll) en segundo lugar con SS48.
El promedio anual mh bajo se encontr en Wiscon,in. donde a de "6lo S27'1.
Los costos de seguro> tambin varan segn el valor del vehtculo y el tamano y ubicacin de una
casa. Es mh probable que familias con aduhos de mediana edad e hiios gasten m.ts en seguro El gasto
en seguros de servicio mdico tambin aumenta con la edad.
183
3. El estudio reportado por la Life lnsurance Marketing and Research Associaucn mctr que 2
de los consumidores de seguro. prefieren comprar seguros por teltfono o por correo, Supo
que se realiza un estudio de 80 estadounidenses seleccionados al azar. Cul es la probabilida:!:
de que 21 o ms de lo seleccionados piense que un seguro de vida es la mejor forma de proteger financieramente una familia contra muerte prematura del sostn de la familia?
4. Suponga que los cuadros con la anualidad de seguros muestran que, en promedio, 1.8 ~
hora son destruidas por incendio en Estados Unidos. Cul es la probabilidad de que t~
rra una hora y media sin que una casa sea destruida por incendio?
Fwnu:: adapudo dt n Lanon."lnwran<t 11 Rislr.': ~" ~""
oetubr< 1995,pp. SJS7; S.tloml ~
w..r.....,Comrnlssonm.71111\1111~ Jovnw/Alnwrw 1999. RocWcl J.Abop.cd.1ScwYork:a.llan1111e lloab.1999),p.
DE PROBABILIDAD DE
UNA DlSTRlBUCIOS
l.'NlfORME
f(x)
1
-b-a
O
f{xl
Distribucin
uniforme
~o
-----------...-
rn
'-----0,__
_1_
I
..,,
CAl'fTUl..06
DIST1UBtl00!1.'!SC0).1Th1:.\S
185
=1
Pero
(b - a)
Longitud
Por tanto,
(b - a){Altura) .. 1
y
Altura-1(b-a)
~tos clculos muestran por qu, entre los valores x de a y b. la cllitrbucin tiene una altura constante
de l/(b - al.
La media y desviacin estndar de una distribucin uniforme estn dadas como sigue,
1=--
a+b
2
b-a
u=7i'
Surgen muchas situaciones posibles en las que los datos podran estar uniformemente distribuido). Como eiemplo, ~uponga que se prepara una lnea de produccin para manufacturar broches de
mquina en lotes de cinco por minuto durante un turno. Cuando lo) lotes se pesan, la variacin entre
106 pesos se detecta con pesos de lote que van de 41 a 47 gramos en una cllitribucin uniforme. La altura
de la distribucin es:
1
1
1
f(x)= Altura=--=---=(b-11) (47-41) 6
La media y desviacin est.indar de esta distribucin son:
Media=
a+b = 41+47
2
2
=~-
2
.
b-a
47-41
6
Deviaan estndar = ~
= ~:: -._112
._112
3.464
= 1.732
La figura 6.2 proporciona la distribucin uniforme para este ejemplo, con su media, desviacin estn
dar y altura de la distribucin.
:i:s:nbucin de
:esos de lote
----------!
___
----.-,-----..---. . .
u 1.732
___..;..
lPnos>
_/,A
186
l,'.~flf f$ ..
f{x)
Probabilidad
rHuelta en una
distribucin
uniforme
.5000
41
PROBABWDADES
EN\JNA
OISTRJBUCION
UNlFORME
------x
42
45
Pno. (gramos)
47
P(x)
donde:
a Sx1 Sx2
-xi
b-a
xi
Recuerde que el irca entre a y b o igual 1 l. La probabilidad para cualquier intervalo que in
a y b o l. La probabilidad de x 2! bode x sao cero porque no hay 'rea arriba debo abaio de a.
Suponga que en el problema de los broches de mquina deseamos determinar la probabilidad
que un lote pese entre 42 y 45 gramos. Esta probabilidad se calcula como sigue:
P(x)= x2 -x1 45-42 =!=.SOOO
b-a
47-41
6
La figura 6.3 muestra ~ta solucin.
La probabilidad de que un lote pese ms de 48 gramos es cero, porque x 48 es mayor que el
superior, x 47, de la distribucin uniforme. Un argumento similar proporciona la probabilidad
que un lote pese menos de 40 gramos. Como 40 o menor que el valor ms bajo del rango de dis
cin uniforme (41 ), la probabilidad o cero.
PROBLEMA DE
DEMOSTRACIN
6.1
Suponga que la cantidad de tiempo necesario pare ensamblar un mdulo de pl6stico vara di
a 39 segundos y que el tiempo de ensamble est uniformemente distribuido. Describa la di
bucin. Cu61 es la probabilidad de que un conjunto dedo tome entre 30 y 35 segundos? M
de 30 segundos?
Solucin
""'
((xi./)
27
><33
v3.~
Tiempo (aegundotl
---x
39
PIJO<
-
X<
-
35-30
39-27
35)-
.1. 4167
12
2..
. 2500
12
Hey un .2500 de probabilidad de que tome menos de 30 segundos enHmblar el mdulo. Como
no hay rea menor a 27 segundos, P{x < 30) se determina con usar slo el intervalo 27 s x < 30
En una distribucin continua, no hay rea en ningn punto (slo sobre un intervalo). Entonces
la probabilidad x < 30 es la misma que la probabilidad de x s 30.
PROBLEMA DE
DEMOSTRACIN
6.2
b
-;:-
(T
1_
1 182
200
Pj410 S X S 825)
1182
~2 .001. x1 410 y
x2
825
4226
La probabilidad de que una persona seleccionada al azar pague entre $410 y $825 anualmente
para asegurar su automvil en Estados Unidos es .4226. Esto es, alrededor de 42.26% de todos
los estadounidenses pagan en ese rango.
fM
__
..._
200
'10
_.......__"
1 182
TABLA 6.1
Salida MINITAB
para distribucin
uniforme
c:o.tiD_.
aauon oe zoo.ooo
125.0000
410.0000
PI 1
to
1112.00
C .,
O.&HS
0.2UI
MI!'.1TAB calcula la probabilidad de x s 825 y la probabilidad de x s 410, y estos resultados se maatran en la tabla 6.1. La respuesta final a la pregunta de probabilidad del problema de demostracin
se obtiene al restar estas dos probabilidades:
P(410 S
S 825)
= .6365 -
.2138 = .4227
Excel no tiene la capacidad para calcular probabilidades directamente cuando se usa la distribu
uniforme.
6.1 PROBLEMAS
6.1
62 DISTRIBUCIN NORMAL
Probablemente la ms conocida y empleada de todas las distribuciones es la distribucin normal
ajusta a numerosas caractertsticas humanas como la estatura, peso. altura, velocidad, coeficiente
lectual ( IQ), logros acadmicos y ailos de esperanza de vida, entre otras. Por otra parte, todos los
vi\"O~en la naturaleza como arboles, animales e insectos, entre otros, tienen diversas ca.racterislC3$
e:.ln normalmente distribuidas.
IR~IIRA 6.4
la curva normal
JI
"ji;
t-(112ll{i-p)lo)t
donde:
=media de x
a dc~'-Ucin otndar de x
-:: - J.14159 .. y
t - 2.71828 ....
Debido a que la frmula tiene esta complejidad ~la para determinar ttaS bajo la curva es un tra
engorroso y lento. Prcticamente todo. le investigadores usan valores de tabla para analizar problnm:
de distribucin normal en lugar de usar esta frmula.
1 FORMUU:
z=x-,
a
"""
z.
UM'PUm&
Curvas normales
para tres diferentes
combinaciones de
medias y
desviaciones
est~ndar
IT
o to
20
\'alorax
normal es cero desviaciones estndar desde la media. Cualquier valor de x que e<t a una desviacin
estndar arriba de la media tiene un valor z de l. La regla emprica que vimos en el capitulo 3 se basa
en la distribucin normal la cual dice que alrededor de 68% de los valores estn dentro de una desviacin estndar de la meda, cualesquiera que sean los valores de y <T. En una distribucin :, aproximadamente 68% de los valores z estan entre z -1 y z = +l.
Los valores de probabilidad de distribucin z se muestran en el apndice A, A.5; sin embargo, como
es tan frecuente su uso, la distribucin z tambin est impresa al final de este libro. En la tabla 6.:? -e
presenta una lista de valores de distribucin z para a)'Udar a su anlisis.
La tabla A.5 proporciona el rea total bajo la curva z entre O y cualquier punto del eje z povirivo,
Como la curva es simtrica, el rea bajo la curva entre z y O es igual si z es positiva o n~tiva (el ~ipio
del valor z designa si la estad.tica z est. arriba o abajo de la media). Las reas o probabilidades que se
muestran en la tabla 6.2 son siempre positivas.
s xs
de
100
100
El valor z de 1.06 deja ver que la calificacin GMAT de 600 es 1.06 desviaciones estndar ms que la media. Los valores de distribucin z de la tabla 6.2 dan la probabilidad de
que un \-alor est entre este valor de x y la media. La parte de numero entero y de dcimos
de la estadistica z aparecen en la primera columna de la tabla 6.2 (la parte 1.0 de esta esta
494 x 600
dstica z). En la parte superior de la tabla t tn los valores de la parte de centsimos de b
q 100
estadstica z, Para esta estadstica z, ti valor de centsimos es 6. El valor de probabilidad de
la tabla 6.2 para z "' 1.06 es .3554. La porcin sombreada de la curva de la parte supcrior
de la tabla indica que ti valor de probabilidad dado siempr es la probabilidad o rea entre
un valor de x y la media. En este ejemplo particular, (a es ti rea deseada. Por tanto, la respuesta
es que .3554 de las calificaciones del examen de aptitud de administracin para graduados (GMAT)
1RGURA'6.7
'
S:tuciones grificas
;::rot>lern del
:::MAT
,.94
a 100
<>
x 600
(b)
TABLA 6.2
Distribucin z
....
o.o
0.1
0.2
0.3
0.4
o.s
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
U)
2.1
2.2
2.3
t.00
UI
G.02
UJ
0.84
o.os
.0000
.0398
.0793
.1179
.1554
.0040
.0431
.0832
.1217
.0080
.0478
.0871
.0120
.0517
.0160
.0557
.0910
.1293
.1331
.1915
.2257
.2580
.2881
.3159
.J413
.3645
.3849
.40J2
.4192
.4332
.4452
A5S4
.4641
.4713
.cm
.4121
.4161
.1591
.1950
.2291
.2'11
.2910
.3186
.3438
.3665
.3869
.4049
.4207
.4345
.4463
.4564
.4649
.4719
.4778
.4126
.41164
.1255
.1628
.1985
.2324
.2642
.l939
.3212
.3461
.l686
.3188
.4066
.4222
.4357
.4474
.4573
.4656
.4726
.4783
.4830
.41611
.4193 .4896
.4191
2.4
2.S
.4911
.4931
.4920
.4940
.4922
.4941
2.6
2.7
2.8
.4953
.4965
.4974
.4955
.4966
.4956
.4967
.4976
2.9
3.0
3.1
3.2
.4981
.4987
.4990
.4993
3.3
3.4
3.S
.4995
.4997
.4998
4.0
4.S
5.0
6.0
.49997
.499997
.4975
.4982
.4995
.4912
.4987
.4991
.4994
.4995
.4997
.4997
.4987
.4991
.4993
.4999997
.499999999
.1664
.1700
.0199
.0596
.0987
.1368
.1736
.2019
.23S7
.2054
.2389
.2088
.2422
.0948
.0239
.0636
0#1
.0279 .OJl9
.0714
.0359
.07S3
.1064
.1443
.1808
.1103
.1480
.1144
.1141
.1517
.1179
2157
.2486
.2794
.3078
.3)40
.2190
.2517
.2224
.2673
.2704
2734
.2967
.3238
.3485
.)708
.2995
.J02J
.3264
.3508
.3729
.3925
.3289
.3531
.3749
.3315
.3554
.3770
.'944
.4099
.4115
.4251
.4312
.4495
.4591
.4671
.4731
.4793
.4265
.4394
.4505
.4599
.'962
.4131
.4279
.3980
.4147
.4292
.4406
.4515
.4418
.4525
.4616
.3907
.4484
.4582
.4664
.4732
.4781
.4134
.4871
.4901
.4925
.4943
.4957
.4961
.4977
.49113
.4981
.4991
.4994
.4996
.4997
.4831
.4875
.4904
.4927
.494S
.4959
.4969
.4977
.4984
4981
.4992
.4994
.4996
.49'11
.4608
.3577
.3790
.2549
.2823 .2852
.3106 .313)
.3399
.3621
.3830
.3997 .4015
.4162 .41n
.4306 .4319
.4429 .4441
.4535 .4S4S
3365
.3599
.3810
.4625
.4671
.4744
.4791
.4803
.4842
.4878
.4906
.4929
.4946
.4960
.4970
.....
......
.4978
.4992
.4994
.4996
.wn
.4750
.4146
.4811
.4909
.4931
.4941
.4961
...,
.0675
.1026
.1406
.1n2
.2123
.2454
.2764
.3051
.4082
.4236
.4370
...
.4633
.4106
.47'7
.4756 .4761
.4808 .4112 .4117
.4850 .4154 .4157
.4814 .4U7 .480
.4911 .4913 .4916
.4932 .4934 .4936
.4949 .4951 .4952
.4962 .49153 .4964
...
.4971
M79
.4989
.4992
.4994
.4996
.4997
.4979
.4990
.4990
i,
estan entre una calificacin de 600 y la media de 494. u figura 6.7(a) describe grficamente la solu
en trminos de valores x. u figura 6.(7b) muestra la solucin en trminos de valores z.
CAPm:l.06 Dl~TRIBUCIOS~CO'lm:O."UAS
193
PROBLEMA DE
DEMOSTRACIN
6.3
Cu61 es la probabilidad de obtener una calificacin mayor a 700 en un examen GMAT que tiene
una media de 494 y una desviacin estndar de 1007 Suponga que tas calificaciones GMAT estn
normalmente distribuidas.
494 y
"
'9'
100
cr
1001
Soludn
Examine el siguiente diagrama.
Este problema pide determinar el rea de la cola superior de la distribucin. La estadstica z para
este problema es:
Z
X-
(T
700 494
100
206
100
2.06
En la tibia 6.2 se proporciona una probabilidad de 4803 pare la estadstica t. que es el valor
necesario para saber la probabilidad de sacar al atar un GMAT con una calificacin entre ta media
y 700. Encontrar la probabilidad de obtener una calificacin mayor de 700, que es la cola de la
distribucin. requiere restar a .5000 el valor de probabilidad de .4803 porque cada mitad de
ta distribucin contiene .5000 del rea. Et resultado es .0197 Ntese que un intento pare deter
minar el rea de x '1' 700 en lugar de x > 700 no seria diferente porque en distribuciones eontinuas, el rea ba10 un nmero exacto como es x 700 es cero. Un segmento de recta no tiene
ancho y por tanto no tiene rea .
. 5000 (probabilidad de
x mayor
que la medial
.0197 (probabilidad de
x mayor
que 7001
x y en (bl
para valores
zO
6.4
lb)
lI
PROBLEMA DE
DEMOSTRACIN
z.
Para el mismo examen GMAT, cul es la probabilidad pera sacar al azar una calrfic.cin que su
5500 menos?
P(x
194
Solucin
Veamos un bosquejo de este problema y determine el rea bajo la curva para todos los valOfm
menores que o iguales a 550.
. '94
tT
100
La frmula
z proporciona
550
0.56
El rea bajo la curva para z - 0.56 es .2123 es la probabilidad de obtener una califi~
entre 550 y la media. No obstante, obtener la probabilidad para todos los valores menores q.e
o iguales a 550 requiere incluir los valores menores a la media. Debido a que la mitad o .5000
los valores son menores a la media, la probabilidad de x s 550 se encuentra como sigue:
.5000 (probabilidad de valores menores que la medial
(probabilidad de valores entre 550 y la media)
.7123 (probabilidad de valores s 550)
:t.....1ill
.
tT
494
100
550
z O
()
PROBLEMA DE
DEMOSTRACIN
.5
z 0.56
(b)
Cul es la probabilidad para obtener una calificacin menor a 400 en el mismo examen GMA!?
P(x
< 400!.
- 494 y u .. 100) - ?
Solud6n
En la siguiente curva se comprueba que el problema es determinar el rea de la cola inferior
la distribucin:
400
. '94
v 100
La estadstica z para este problema es:
!!._.E.
(T
400-494--94--0.94
100
100
Ntese que el valor z es negetivo, el cual indice que el valor x est 1b1jo de 11 med11 y el
valor z est sobre el ledo izquierdo de le distribucin. Ninguno de los valores z de 11 t1bl1 6 2 es
negativo, pero, como 11 distribucin normal es simtrica, las prob1bilid1des pera valores zen el
ledo izquierdo de 11 distribucin son les mismas que los valores sobre el lado derecho de 11 dis
tribucin. El signo negetivo del valor z simplemente indica que el ree est en el ledo izquierdo
de 11 distribucin. Le probabilidad es siempre positiva. En 11 tibia 6.2 proporcione une probebi
lidad de .3264 pare un valor z de .94. El problema es encontrar el ree de 11 cole inferior de 11
distribucin, de modo que 11 probabilidad, .3264, debe restarse de .500 para obtener 11 respueste.
~
x~
. '9
tr 100
x y en b) pare valores z.
-0.9
(el
PROBLEMA DE
DEMOSTRACIN
lb)
Cu61 es 11 prob1bilid1d de obtener 11 azar une calificacin entre 300y 600 en el examen GMATI
6.6
V 100) 7
Las curvas describen grficamente el problema; es decir, determinar el rea entre x 300y x
600, que abarca el valor medio. Debido 1 que les reas de la distribucin z se obtienen con rala
cin 1 la media, este problema debe trabajarse como dos problemas separados y los resultados
combinados.
x-
z---(T
300-494
100
-194
-----1.94
100
x300
. 494
s100
600
1.94
(al
PROBLEMA DE
DEMOSTRACIN
(bl
Cules la probabilidad de obtener una calificacin entre 350 y 450 en el mismo examen G~,:.-r
P(350 <X< 4501 - 494 y U - 1001 ?
6.7
Solud6n
La siguiente curva muestra que la solucin del problema determina el rea de la porcin s.
breada en la mitad inferior de la curva.
&
X -
350
450
494
tT
100
En este problema, los dos valores x estn sobre el mismo lado de la media. Las reas o proti.
bilidades de cada valor x deben determinarse y encontrar la probabilidad final al determinar
diferencia entre las dos reas.
z---x-
450 494
100
(T
-44
-=-0.44
100
-1.44 es .4251.
-0.44 es .1700.
x y en
-1.U
z --0.U
zO
lb)
lI
PROBLEMA DE
DEMOSTRACIN
6.8
bl para valores t.
Runzheimer lnternational publica costos de viajes de negocios para varias ciudades del mundo.
En particular, publican totales de gastos de viaje diarios, que representan los costos promedios
para el viajero tpico de negocios incluyendo tres comidas al da en restaurantes clase de nego
cios y alojamiento con terifa por persona en hoteles y moteles de clase de negocios. Si 86.65%
de los costos de gastos de viaje diarios en Buenos Aires, Argentina, son menores a $449 y si
la desviacin estndar de costos de gastos de viaje diarios es $36, cul es el promedio de costo de
gastos de viaje diarios en Buenos Aires? Suponga que los costos de gastos de viaje diarios estn
normalmente distribuidos.
Solud6n
En este problema, se dan la desviacin estndar y un valor x; el objeto es determinar el valor de
la media. El examen de la frmula de la estadstica z revela cuatro variables; x, p., u y t. En este
problema. se dan slo dos de las cuatro variables. Debido a que es imposible resolver una ecuacin con dos incgnitas, debe determinarse una de ellas. El valor de t puede determinarse con
la tabla de distribucin normal (vase la tabla 6.21.
Debido a que 86.65% de los valores son menores a x $449, 36 65% de los costos de gas
tos de viaje diarios son entre $449 y la media. El otro 50% de los costos de gastos de viaje d1a
ros estn en la mitad inferior de la distribucin. La conversin del porcentaje a una proporcin
proporciona .3665 de los valores entre el valor x y la media. Qu valor z est asociado con esta
rea? Esta rea o probabilidad de .3665 que se muestra en la tabla 6.2 est asociada con el valor
z de 1.11. Este valor t es positivo, porque est en la mitad superior de la distribucin. El U$O del
valor zde 1.11, del valor xde $449 y el valor ude S36 permite resolver algebraicamante la media.
l
!:._t!
(T
1.11- 5449-
$36
y
$449-
($361(1.111 $449-
$3996 $409.04
El costo medio de gastos de viaje diarios para un viaje de negocios en Buenos aires es de
$409.04.
TABLA td
Salida Excel y
MINrTAB para
distribucin
normal
.......
1
xValue
2
3
450
350
B
PYOl>lb<Ltv < X Value
03300
0.0749
0.2551
Sllilal8Nl'IU
CDIJLHlVB DD!llllllHll
llmml
undud
. ... ......,,,...
vt.u ..,~
.,
l'nlt
PROBLEMA DE
DEMOSTRACIN
6.9
uo.1111
e no
e.
tucncm
M.Off ud
100.000
?C ....
e ...
J 2$11
Solvcln
Se proporcionan la media y desviacin ostjndar pero x y z son incgnitas. El problema es
pear un valor x cuando .6772 de los valores x sean mayores que ese valor.
Si .6772 de los valores son mayores que x, entonces .1772 estj entre x y la media (.6
5000). La tabla 6.2 muestra que la probabilidad de .1772 estj asociada con un valor z de
Como x es menor que la media. el valor z en realidad es 0.46. Siempre que un valor Jr
menor que la media, su valor z asociado es negativo y debe reportarse esl:
z .. !!...:J!.
(T
-046-~
1.04
y
X .. 3.58 .,. (-0.46)(1.04)
3.10
Por tanto, 67.72% da la cantidad promedio diaria de desechos slidos por persona P8A
de 3.10 libras.
Hlfii!fijlH.111Mi[.fi!+M-------------------sis1ema de elmCftU!miato
TomplN AS1ociata ttaliz una mcuau nacional desistemas de alnw:awnimto en E.siados Unidos cuyo multado
m~l mucho. dato& interesantes. El listam de almacmamiento es una industria de trabajo intauo que rtpmmta
una gran oportunidad para mejorar la productividad. ~Qui
aspecto presenta d a1macl bodega promedio? u construccin de nua'OI almacala est restringida por COSIOS
prohibitivos. Quiz por esa razn, la edad promedio de una
bodega es 19 a6o6. Los a1maanes vartan en tamaAo pm> d
tamalto promedio es de llll06 50 mil pies cUldndos (4 600 m2
aproximadmimte). Para visualiur esta bodega promedio':
i.2 PROBLEMAS
6.6
Segn la CcUular Tdecommunications Jndu,1rr As<\Odation, el promedio local de la cuenu mensual de un telfono celular" S42.i8. Suponga que las cuenta locale. mensuales de telefono celular estan normalmente distribuidas. con una desviacin estndar de SI 1.35.
Ctl o la probabilidad de que una cuenta "Seleccionada al aur de telfono celular sea nm de
S67.75?
b. l o la probabilidad de que una cuenta seleccionada al azar de telfono celular sea mur
S30 y sso:
c. Cu.U o la probabilidad de que una cuenta seleccionada al azar de telfono celular no $C'3 ma
de S25?
d. Ctl o la probabilidad de que una cuenta seleccionada al azar de telfono celular sean:::
S45 y S55?
6.10 Segtln el lnternal Revenue Service, el rendimiento de impuesto. de un allo promediaron SI
en devoluciones para contribuyente. Una explicacin para esta cantidad es que los contribuy
tes preferiran que ti gobierno lo retenga mucho dinero durante el olio que deberle dinero 1
de ao. Suponga que la cantidad promedio de impuesto para fmales del ao es una dC''Olucin
SI 332, con una desviacin estndar de $725. Suponga que lu cantidades adeudad.u o que
deben en devoluciones de impuesto. cst.in normalmente distribuidas,
a. Qu proporcin de rendimientos de impuestos muestra una devolucin mayor a S2 mil'
b. Que proporcin de rendimientos de impuestos muestra que el contribuyente adeudad'
al goblemo!
c. Qu proporcin de rendimiento. de impuestos muestra una devolucin entre S 100 y S
L
6.11 ~ trab.ijadoro que laboran con herramientM mio propensos a lesiones rdadonadas con
oficio. Una enfermedad, causada por rcalilar esfuerzo con las manos y mul'la se conoce
sndrome de tnel carpiano y afC(ta hasta a 2J mil trabajadores al afio. El U.S. Labor Depart
estima que el coste promedio de esta afeccin a empleados y aseguradores es alrededor de S30
por trabaiador lesionado, Suponga que estos cestos estn normalmente distribuidos, con
desviacin cstindar de S9 mil.
a. Qut proporcin de lo. costos etn entre S 15 y 45 miU
b. Qut proporcin de los costos es mayor a SSO mm
6.13
6.14
6.1 S
6.16
201
Distribucin
binomial para
n 10y p 50
...
.3
.2
.1
c.
~URA 6.9
10
VaJon:.X
.3
Distribucin
binomial para
n 10 y p .20
.2
.1
OL-..l--L..--L--1~'---'--'--'-__JL-..._~--
FIGURA 6.10
:>istribucin
t. nomial para
100y p .20
10
\'alorn x
.10
~
-
.09
.08
.07
i::
.04
.03
.02
.01
O'-'l.'"'--'-'--'L......L--'--'-_._.._.__. ........_.__.__._-'-'--'--12 13 14 IS 16 17 18 19 20 21 22 23 24 25 26 27 28 29
\'alorcsx
hM'M'Mi
Gr6fica del
0.10
problema binomial:
n 60y p .30
1:.o
o.os
o.oo~. uu,ll
3S
\'alorax
FIGURA 6.12
Gr6fica de solucin aparente
de problema binomial
trabajado por la curva normal
npyaV7M
Ahora deber realiza~ una prueba para determinar s1 la distribucin normal es
aprox.i.madn suficientemente buena de la distribucin binomial:
18
a 3.55
x2:25
TABLA 6.4
Reglas pr6cticas para la
correccin de continuidad
v.llllaa
,
....
x>
rll!:
r<
rs
:SrS
<r<
.e
+.50
-.50
-.50
+.50
-.501 +.50
+.50y-.50
-.50r +.so
n p (60) (.30) 18 y a=
V"7H 3.55
::!: 30'
cornac 6
: Fi(fp
6.13
Grifica de una
porcin del
problema binomial:
n 60 y p .30
.a
.12
.ti
.10
.09
.08
.06
OlmtBUOOS'E.SCO~'TL'IUAS 203
.B .07
.os
.04
.03
.02
.01
1 1 1
13 14 IS 16 17 18 19 20 21 22 23 24 25 26
Valorux
...
.-
'
3)
.. z: 25
...-
.AB61
z= x-
<1
= 24.5-18
3.55
=l.83
La probabilidad (vase la tabla 6.2) de este valor z es .4664. la respuesta a este problema est en
cola de la distribucin de modo que la respuesta final se obtiene al restar:
.5000
.0336
Si este problema se hubiera trabajado con la frmula binomial, la soluein hubiera sido como
ve en la tabla 6.5. la diferencia entre la aproximacin de la distribucin normal y los valores binoim.
les reales es de slo .0025 (.0361 - .0336).
PROBLEMA DE
DEMOSTRACIN
6.10
Plx
12ln 25 y p
'' 1
Solud6n
Encuentre p. y
u.
p. n p (25)(.40)
u .Jnp q
= 10.0
Jl25)(.40)(.60)
2.45
; - 10
v 2.45
12.5
"
n.s
Entonces
z---x-
(T
y
Z IS
!!::J!.. = ~
(T
2.45
0.61
PROBLEMA DE
DEMOSTRACIN
6.11
< 27ln
100 y p
371
CAPtnno
6 DISTIUBU00'-1:' CO'-'TISI;\S
205
Solud6n
Como n1 el tamaflo muestra! ni el valor p estn contenidos en la tabla del Apndice A2. entonces resolver este problema con las t6cnicas de distribucin binomial no es prctico. Es un buen
candidato para la curva normal. Del ~lculo de . y u se obtiene:
. n p (100)(.37) 37.0
u Jnp q
.J(lOOl(.37)(.631 4.83
x:.28.5
37
u 83
Entonces,
Z= X-=
(T
26.5-37 =-2,1?
4.83
La tabla 6.2 muestra una probabilidad de .4850 y al resolver la cola de distribucin se obtiene:
.500 - .4850 - .0150
que es la respuesta.
Si este problema se hubiera resuelto con el uso de la frmula binomial, las probabilidades
serian las siguientes:
Velor "
26
25
2
23
22
21
20
x<
27
l'fobebillded
.0059
.0035
.0019
.0010
.0005
0002
..2!!!U
.0131
6.3 PROBLEMAS
6.17 Convierta los siguientes problemas de distribucin binomial en problmw de dutribua6n normal. Use la correccien para continuidad,
a. P(x s 16ln 30 y p .70)
b. P(IO<xS20ln25yp.SO)
c. P(x 22jn .. 40 y p .60)
d. P(x>14lrrl6yp.~5)
206
6.18 Use la prueba :!: Ja para determinar si las siguientes distribuciones binomiales se pueden aproximar con el uso de la distribucin normal.
a. n = 8 r p = .os
b. n = 18 y p = .80
c. n 12 y p .30
d. n 30 y p .75
e. n = 14 y p .50
6.19 Donde sea apropiado, trabaje los siguiente; problemas de distribucin binomial con el U$O de b
curva normal. Tambin, use la ubla del Apndice A.2 para encontrar las respuestas con el 11)() de
la distribucin binomial y compare las respuestas obtenidas por los dos mtodos.
a. Plx - 8lt1 - 25 y p - .40) - ?
b. Pix :?! 13ln = 20 y p .60) ?
c. P(x 7ln 15 y p .50) ?
d. P!x < 3ft1 = 10 y p .70) ?
6.20 La Zimmerman Agency realiz una encuesta para Residence Ion by Marrion de agente:> viajeros
que realizan ,iaje> de cinco noches o ms. Segn esta encuesta, 37% de esto; viajeros di>fru~
ser turistas ms que ninguna otra actividad que realizan en casa, Suponga que son entrt\istadol
120 "iajero> seleccionados al azar que realizan viajes de cinco noches o mas. Cu.ti e. la proNbtlidad de que meno; de 40 disfruten ser turistas ms que ninguna otra actividad que no hacen et:
as.t?
6.21 Un estudio respecto a satisfaccin de gerente.. con herramientas de administracin revela que 5
usan equipo> de trabajo autodirigidos como herramienta de administracin. Suponga que
entrevistados 70 gerentes seleccionados al azar en Estado. Unidos. Cul e. la probabilidad de qr
meno; de 35 utilicen equipo; de trabajo autodirigidos como herramienta de administradn?
6.22 Segun The Yanktt Group. 53% de las casas que tienen televisin por cable y clasifican a e:>t<l> co~
pall1a> como buenas o excelentes respecto a la calidad de transmisin. Se~nla por ciento de
casa> que tienen tele\'>in por cable clasifican a e>ta~ compallfas como buenas o excelentes
tener personal profe ional. Suponga que al azar son entrevistadas 300 familias de tienen telt\1~in por cable.
a. Cual es la probabilidad de que ms de 175 familias que tienen televisin por cable clasifiq=
a esta> compamas como buenas o excelente. respecto a la calidad de transmisin!
b. Cul e> la probabilidad de que entre 165 y 170 incluyendo a las familias que tienen telt\is::::
por cable clasifiquen a estas compaas como buenas o excelente> respecto a la calid:td
transmisin!
c. Cu.1.1 es la probabilidad de que entre 155 y 170 incluyendo a las familias que tienen televi
por cable clavifiquen a estas compalllas como buena. o excelentes respecto a la calidad
transmisin!
d. Cu~ e> la probabilidad de que menos de 200 familia. incluyendo a l<l> familias que titnc::
televisin por cable clasifiquen a olas compaas como buenas o excelente. como buenas
excelentes al tener personel profesional!
6.23 La lntcrnational Data Corporation reporta que Compaq e nmero uno en participacin en
mercado de computadoras personales (PC) en Estados Unido), con 16% del mercado. Su
que un investigador selecciona al azar 130 compradores recientes de: PC.
a. ;Cu.ti e> la probabilidad de que ms de 25 compradores de PC compren una Compaq?
b. ;Cul es la probabilidad de que entre 15 y 23 incluyendo a compradores de PC compren
Compaq?
c. Cul e> la probabilidad de que meno> de 12 compradores de PC compren una Compaql
d. Cul o la probabilidad de que exactamente 22 compradores de PC compren una Compacf
6.24 Una encuesta acerca de estrategias para competir en el mercado mundial expresa que 52%
entrevistado; concuerdan en que la; compalllas nece$ita.n hacer inversiones directas en otros paiseL
Tambin expresa que alrededor de 70% de entrevistados e.t.n de acuerdo con que es atractivo ~
una inversin conjunta para aumentar competitividad mundial Suponga que lo> directores de
compalliai. manufactureras se seleccionan al azar acerca de estrategias mundiale,
b.
c.
d.
f(JC) - .A.t-M
yt - 2.71828 ...
Una distribucin exponencial se puede caracterizar por el parmetro A. Cada valor nico de .l
determina una distribucin exponencial diferente, resultando en una familia de distribuciones exponenciales. u figura 6.15 muestra grficas de distribuciones exponenciales para cuatro valores de .l. Los
puntos en la grfica se determinan al U)ar .l )' dverw. valores de JC en la frmula de densidad de pro
babilidad. u media de una distribucin exponencial es lfA. y la desviacin estndar de una distribucin exponencial es o 11.A..
P(x~.a;.) ,....,
donde;
JCo
e:: o
Para usar esa frmula se requiere encontrar valores de e-. Esto valoresse pueden akular en casi
todas las calculadoras o de la tabla del Aptndice A.4, que contiene los valores de e- para ,-aJores seleccionados de x. JCo es la fraccin del intervalo o el numero de intervalos entre llegadas en b pregunu de
probabilidad y >. es el pcrcenuje promedio de llegadas.
Por ejemplo, las Uegadas de Poisson a un banco estn distribuidas con una ;. de l.~ dientes cada
minuto. Cul e. el tiempo promedio entre Uegadas y cul es la probabilidad de que al meno> ~ nunutos transcurran entre una y otra llegada? Puesto que el intervalo para lambda e. 1 minuto y deseamos
flGURA 6.15
J{x)
Grficas de
algunas
distribuciones
exponenciales
2.0
Distribucin
exponencial para
). 1.2 y solucin
para x ~ 2
1.2
11
Jxl
1.0
9
8
.6
.s
.4
.3
.2
.1
llBLA 6.6
Salida Excel y
MINITAB para
distribucin
exponencial
,i:=::::=---"
WW.bml
A
1 xValue
2
3
0.75
Salida MINrJ'All
Cl.mllatift DlstrillaUcn hnoticn
"
conocer la probabilidad de que al menos 2 minutos transcurran entre llegadas (doble el interv
lambda),XQ es 2.
lo> tiempo> entre llegadas y llegadas aleatorias estn exponencialmente distribuidos. La m
esta distribucin exponencial es
1/
1/1.2 a .833 minuto> (50 segundos). En promedio.
minutos, o sea 50 segundos, transcurrirn entre llegadas al banco. La probabilidad de un interv
2 minutos o ms entre llegadas se puede calcular con:
P(x;?:
21>- =
1.2) = rum
'"' .0907.
Alrededor de 9.07% del tiempo cuando en el ritmo de llegadas aleatorias es 1.2 por min
minutos o ms transcurrirn entre llegadas, como se ve en la figura 6.16.
Este problema recalca el potencial de usar la dstrbucin exponencial en coordinacin con la <fu.
tribucin de Posson para resolver problemas, En la nw,tigacin de operaciones r ciencias administrath-as estas do. distribuciones se utiliun juntas para resotver problemasde colas (teora de linfa' de
espera). La distribucin de Poi..on se puede usar para analizar la'\ llegadas a b cola, y la distribucin
exponencial se puede usar para analizar el tiempo entre llegadas.
P!OSLEMA DE
BEMOSTRACIN
6.12
= ..!..X = 1- =.7246
1.38
En promedio, es .7246 del intervalo, o sea (.7246)(20 minutos) U.49 minutos, entre defec
tos. El valor de Xo representa el numero deseado de intervalos entre llegadas o sucesos para la
pregunta de probabilidad. En este problema, la pregunta de probabilidad comprende 15 minutos y el intervalo es 20 minutos. Por tanto, Xo es 15120 .75 de un intervalo. La pregunta aqul
es determinar la probabilidad de que haya menos de 15 minutos entre defectos. La frmula de
probabilidad siempre da la cola derecha de la distribucin -en este caso, la probabilidad de que
haya 15 minutos o ms entre llegadas. Con el uso del valor de Xo y el valor de A, se puede determinar la probabilidad de que haya 15 minutos o ms entre defectos.
1.1 PROBLEMAS
6.25 Utilice la frmula de densidad de probabilidad para trazar las grficas de Lu sipicntcs distribuciones exponenciales:
. }. =
i. = 0.1
0.3
c. i. 0.8
d. i. - 3.0
b.
110 ESUDISTICA
e- tos SEGOCIOS
6.26 Determine la media y desviacin estndar de las siguientes distribuciones exponenciales:
. )., = 3.25
b. )., = 0.7
c..i..=1.1
d. J..= 6.0
6.27 Determine las siguientes probabilidades exponenciales:
a.
b.
c.
d.
6.28 El tiempo promedio entre llegadas a una caseta de pago en una autopista es de 23 segundl1
Suponga que el tiempo entre llegadas a la'caseta est distribuido exponencialmente.
a. Cul es la probabilidad de que un minuto o ms transcurra entre llegadas?
b, Si un auto acaba de pasar por la caseta de pago, cul es la probabilidad de que no apara.::a
un alto por lo menos en tres minutos?
6.29 Un concurrido restaurante determin que entre las 6:30 p.m. y 9:00 p.m. y durante las noches
viernes, las llegadas de clientes segn la distribucin de Poisson tienen un ritmo promedio de
gada de 2.44 por minuto.
a.
b.
c.
d.
Cul
Cul
Cul
Cul
es la probabilidad de que al
es la probabilidad de que al
es la probabilidad de que al
es el tiempo esperado entre
6.31 La distribucin exponencial se puede usar para resolver problemas de Poisson en el que los in~
valos no sean tiempo. El Air Travel Consumer Repon publicado por el U.S. Department
Transportation report que, en un ao reciente, Amrica West era el primer lugar nacional par
tener menos quejas por el mal manejo de equipaje y un ritmo medio de 3.39 por cada mil ~
jeros. Suponga que las quejas por el mal manejo de equipaje son distribuciones de Poisson. Aho:a
bien, con el uso de distribucin exponencial para analizar este problema, determine el nmctt
promedio de pasajeros entre sucesos. Suponga acaban de manejar mal un equipaje. Cul es
la probabilidad de que el equipaje de al menos 500 pasajeros se maneje correctamente antes
se presente la siguiente queja por el mal manejo de equipaje? Cul es la probabilidad de que
nmero sea menos de 200 pasajeros?
6.32 La Foundation Corporation se especializa en construir cimentaciones de concreto para casas nuevas en el sur. La compaa sabe que debido a los diversos tipos de suelos, condiciones de humedad, construccin variable, entre otros factores, eventualmente la mayor parte de cimentaciones
necesitarn reparacin mayor. Con base en sus registros, la directora de la compaa piensa quc.
en promedio, la cimentacin de una casa nueva no necesitar reparaciones mayores durante
anos. Si la compaila desea garantizar el trabajo contra reparaciones mayores y satisfacer rbmaciones a no ms de 10% de sus garantas, por cuntos aos debe garantizar su trabai
Suponga que los casos de reparaciones mayores son distribuciones de Poisson.
6.33 Durante el mes seco de agosto, una ciudad en Estados Unidos tiene lluvia mensurable en promedio slo dos dlas por mes. Si la llegada de das lluviosos es una distribucin de Poisson en esu
ciudad durante el mes de agosto, cul es el numero promedio de das que pasarn entre llu,;.
mensurables? Cul es la desviacin estndar? Cul es la probabilidad durante este mes que~
un periodo de menos de 2 das entre lluvia?
211
La encuesta reporta el promedio de gastos para adquirir seguros para automvil, de propietario de
vivienda y todo tipo de seguros. Otros valore) medios se obtienen para algunos de lo) estados ms
extremos. Las preguntas de probabilidad se pueden contestar respecto a estos datos si se sabe la manera
en que estn distribuidos los datos poblacionales. Las tcnicas para probar el ajuste de varias distribudones a los datos se presentan en un capitulo ms adelante, pero, si los datos estn uniformemente drstribuidos y se conocen los valores mnimo y mximo (a y b), las preguntas de probabilidad respecto a
intervalos particulares se pueden contestar. Por ejemplo, suponga que las tarifas de seguro anual de
automvil en Estados Unido) van de $274 a SI 108 (a= 274, b = 1 108). Entre cuales dos valores esta
ria 50% de en medio de los datos? La diferencia entre a y b es 834. Para que la probabilidad de distribucin uniforme sea igual a .50, x2 - x1 tendra que ser 417. La media, $691, est a la mitad entre a y
by tambin est a la mitad entre x2 - x1 para encontrar el 50% de en medio. El 50% de en medio est
entre $691:!:1/2($417)= $691 :!: $208.50 = $482.50 y $899.50. Suponga que el rango de pagos anuale) por seguro de propietario de vivienda en Estados Unidos es de $100 a $740 con una media de $420.
La probabilidad de que una persona seleccionada al azar pague menos de $400 se puede calcular con
las tcnicas de la seccin 6.1 con
CONSIDERACIONES TICAS
RESUMEN
mquina, muchas mediciones de entornos biolgicos y
rales, numerosas caractersticas humanas como son eslat
peso, IQ y calificaciones en exmenes. La curva normal
Distribucin uniforme.
continua, simtrica, unimodal y asinttica al eje; en re
Distribucin normal.
es una familia de curvas,
Distribucin exponencial.
Los parmetros necesarios para describir una dit
Con distribuciones continuas, el valor de la funcin de cin normal son la media y la desviacin estndar. Por c
densidad de probabilidad no proporciona la probabilidad didad, los datos que son analizados por la curva normal
pero si la altura de la curva en cualquier punto dado. De estandarizarse al usar la meda )' desviacin estndar
hecho, con distribuciones continuas, la probabilidad en cua calcular estadsticas z. t:na estadstica z es la distancia a la
lesquier punto discreto es .0000. Las probabilidades se deter- un valor x est desde la media,, en unidades de desviac
minan para un periodo y en cada caso, la probabilidad es el estndar. Con la estadstica z de un valor x, la prob3bil..UC
rea bajo la curva para el intervalo en consideracin. En cada que ese valor <e presente al azar desde una distribucin
mal dada se puede determinar con el uso de un cuadro
distribucin, la probabilidad o rea total bajo la curva es 1.
Probablemente la ms sencilla de estas distribuciones es estadsticas z y sus probabilidades asociadas.
La distribucin normal se puede usar para trabajar
la distribucin uniforme, a veces conocida como distribucin
rectangular. La distribucin uniforme est.i determinada por tos tipos de problemas de distribucin binomial. Hacerlo
una funcin de densidad de probabilidad que contiene valores requiere convertir los valores n y p de la distribucin bin
iguales a lo largo de algn intervalo entre los puntos a y b. a y u de la distribucin normal. Cuando sea resuelta
B'icamente, Ja altura de la curva es la misma en todas panes uso de la distribucin normal. la solucin de una distrib
entre estos dos puntos. Las probabilidades se determinan al binomial es slo una aproximacin. Si los valores de
calcular la porcin del rectngulo entre los dos puntos a y b estn dentro de un rango de O a n, la aproximacin es r
blemente precisa. Hacer ajuste. para el hecho de que un
que <e considere.
La ms empleada de todas es la distribucin normal. blema de distribucin discreta se trabaja con el uso de
Mxhos fenmeno' estn normalmente distribuidos. inclu- distribucin conunua requiere una correccin para con
-.'Cldo caractensucas de cavi todas las piezas producidas a dad. La correccin para continuidad implicar sumar o mw
de tiempos entre suceso aleatorios. La cfu1ribucin exponencial es una familia de distribuciones descritas por un parmetro, u. La distribucin oU sesgada a la derecha y siempre tiene
su valor m.i.s alto en x O.
TRMINOS CLAVE
Cistribucin exponencial
Cistribucin normal
distribucin uniforme
distribucin z
estadstica z
FRMULAS
fCDan de densidad de probabilidad de una distribucin
=forme
1
f(x)= b-a
1O
paraa:Sx:Sb
para otres valore
Frmula r.
x-1
z=--
"
11=11p
r a:J11pq
J=--
f{x) =
).rU
"Ji:
r-lll2l(b-)/ol~
PROBLEMAS COMPLEMENTARIOS
iculo de est1dlstlcas
=
=
1.P(x:a:31'-= 1.3)
6.38 La U.S. Bureau of Labor Stafbtl(S reporta que las personas que por lo general trabaiau tiempo compkto, d
nmero promedio de horas uabajadas por semana es
43.4 Suponga que el numero de horas trabajadas por
semana. por quienes suden traba1ar uempo completo.
est normalmente distribuido, Suponga que 1::!% de
6.39
6.40
6.41
6.42
6.43
6.44
<>ea:
6.46
6.47
6.48
6.49
a. SI 000 o mas?
b. entre S900 y SI 100?
c. entre S825 )' S925?
d. Meno> de S700?
Segn The \\'irthlin Rtport, 24% de lo. trabai
dicen que su trabajo es muy estresante, Si al azr
seleccionan 60 trabajadore, cual e> la probabi.;.idad
que 17 o m.is digan que su trabajo es muy estr
Cual es la probabilidad de que mis de 22 digan qut
trabajo es muy est~nte? Cual es la probabilidad
que entre 8 y 12 (inclusive) digan que su trabajo es
estresante!
La U.S. Bureau of Labor Statistio reporta que el
promedio anual en la zona metropolitana de Bostcm
$45 121. Suponga que los salarios anuales de la
metropolitana de Boston estn normalmente dst
dos, con una desviacin estndar de S4 246. Al azr
selecciona un trabajador de la zona de Boston.
L Cu.il c. la probabilidad de que el salario anua!
trabajador ~ mis de SSO mil?
b. Cu! es la probabilidad de que el wrio anual
trabajador sea menos de S40 mil?
c. Cu.il es la probabilidad de que ti salario anual
trabajador sea mas de S35 mil?
d. Cual es la probabilidad de que el salario anual
trabajador sea entre S39 mil y $47 mil?
Suponga que los intervalos de una sala de emergmcu
un hospital durante un dia hbil estn di~1n"b
exponencialmente, con un tiempo promedio entre
gadas de 9 minutos. Si la. llegadas son dbtribudono
Poisson. cual 5Cria el nmero promedio de llegadas
hora? Cual es la probabilidad de que menos de 5
tos transcurran entre cualesquiera do> llqadas?
Suponga que la. velocidades promedio de trenes
pasajeros que viajan de Sewark, Sew Jersq,
Philadelphia, Pcnnsylvania, estn normalmente
6.50
6.51
.5?
li.SJ
LS4
6 .SS
6.56
6.S7
6.S8
216
ESTADISTICA
28.0000
34.0000
16.0000
21.0000
P(X
<
X)
0.8095
1.0000
0.2381
0.4762
<
P(X
2.6000
2.4500
2.3000
2.0000
X)
0.9885
0.8183
0.3247
0.0007
11
Distrlbution: A ' 51
2 )( Values Probabi'.:tv" s
3
0.1
02
0.5
1o
4
1
0.5942
0.8951
o~
1 oooc:
o~
0.1000
0.2000
0.5000
l.0000
2.4000
P(X
<
0.3630
0.5942
0.8951
0.9890
1.0000
X)
...
CAPfTULO 6 DISTRIBUCIO:SES
CO!'lll.'1,'tJA!>
217
218
J.
Suponga que en una distribuidora se vende un promedio de 1.37 CLK cada 3 horas (durante un db de 12
hora. de expo>icin) y que esas ventas son distribuciono de Poisson. !.a) siguientes probabilidades produci~ por Excel indican la presentacin de diferentes
l.lempoi entre venias con base en esta informacin.
E.midie la glida e imerpr1da para los vendedores. Por
ejemplo, cuil es la probabilidad de que transcurra
n>m()) de una hora entre \"Cntas? Ctdl es la probabilidad de que traJJSCUm nW de un db ( 12 horas por dla)
amo de la siguiente venta una \U que se baya vendido
un auto? Qu pueden hacer los gerentes de la distribuidora con esta informacin? Cmo puede esto ayudar en la contratacin de personal? Cmo puede
usarse esta informacin como medio de seguimiento
dt tiempo de 3 horas
Prob8billdadts txponenci<s
ICIUDuiativas dtsdt
la liqula'da
0.167
0.)33
0.2045
0.3663
0.667
1
0.5990
0.7459
0.9354
0.9836
0.9958
0.991!9
Partt de un marco
3
4
5
USO DE LA COMPUTADORA
EXCEL
Distribucin normal
Distribucin uniforme
Para usar MINITAB Window) para calcular probab
desde una distribucin uniforme, seleccione Uniform
men descendente Probability Distributions. Esta
resuhara en una caja de di!logo. Esco1a cmo se calcu1z:;
probabilidades al seleccionar Probability IXnsity,
Iatlve Probability o Inverse Probability. Probabilty
proporciona el valor de la densidad de probabilidad para
combinacin panicular de a, b y x, Cumulatrvt Pn
produce las probabilidades acumulati~-as para valores
o iguales a x: Con lnverse Probability da la inversa de !al
babilidades acumulativas. Aqul estarnos interesado$ p
mente en probabilidad acumulativa. En la otra lnea.
tndpoint, escriba el valor de a. En la linca, Upper en
escriba el valor de b. Si el usuario d~ tener probab~
calculadas para varios valores de x, pngalas en una
seleccione la opcin de columna de entrada, y ponga ci:
lista la ubicacin de columna de los valore. x. Si slo
calcular la probabilidad para un valor particular de x. ba;z
en constan le de entrada y escriba x.
Distribucin normal
Distribucin exponencial
"'
CAPTULO
Muestreo y distribuciones
muestrales
OBJETIVOS DE APRENDIZAJE
Los dos objetivos principales del captulo 7 van a proporcionar al lector una aprecia
cin para la correcta aplicacin de tcnicas muestrales y la comprensin de las distribuciones muestrales de dos estadsticas, con lo cual podr:
l. Determinar cundo usar muestreo en lugar de un censo.
2. Distinguir entre muestreo aleatorio
r muestreo no aleatorio.
220
p.
do Ch<tyl
An
Scvt!n.n: ~
S-
2000;
221
222
Este capuulo explora el proceso de muestreo r las distribuciones muestrales de algunas enadsti~.Cmo obtenemos los datos empleados en anlisis estadstico? Por qu a veces los investigadores
toman una muestra en lugar de realizar un censo? Cu~les son las diferencias entre muestreo aleatorio
y no aleatorio? Este captulo aborda 6tas y otras preguntas acerca del muestreo.
Tambin se presentan las distribuciones de dos estadsticas:
La media muestral.
1..1 proporcin muestral.
Se ha determinado que estas estadi>tcas estn casi normalmente distribuidas bajo ciertas cond:
cienes. El conocimiento ruso de la meda muestra] y proporcin muestral es importante en el estu
de estadlstica res bisico para gran pule del anlisis estadstico.
7.1 MUESTREO
El muestreo se utiliza ampliamente en negocios como medio para reunir informacin til acerca
una poblacin. Se renen datos de muestras y se sacan conclusiones acerca de la poblacin como panr
del proceso de estadsticas inferenciales, En el Dilema de deciliin sobre trabajadores de maquilador&
podra tomarse una muestra aleatoria de trabajadores de una amplia seleccin de compafllas en '-UUS
industrias de las ciudades fronterizas ms importantes. Un cuestionario cuidadosamente formu
que sea culturalmente sensible para ~ mexicanos podra aplicaN a trabajadores seieccionados p:t
determinar actitudes de trabajo, expectativas )' diferencias culturales entre trabajadores y compl!
Los im-ngadore podran compilar y analizar 10> datos recogidcs de las respuestas, Asi como hacmr
resmenes y observaciones acerca de la perspecnva y cultura en el programa de maquiladoras. 1..1 a~
rilitracin y quienes toman decisiones podrlan entonces tratar de usar lo. multado. del estudio
mejorar el rendimiento y motivacin de trabajadores. A veces, una muestra proporciona medios ra
nables p.ira reunir esta til informacin para toma de decisiones que, de otra manera, podra 'ICr
canzable y no asequible.
Ml!EST1W..ES
223
macin de1allada <obre el procese en estudio, Al usar el dinero para una muestra, los inve tigadores podrtan pasar mucho ms tiempo con cada persona entrevistada y por tanto aumentra el potencial para
reunir informacin til.
Algunos procesos de invcs1igacin destruyen IO$ productos o articules en estudio. Por ejemplo. si
se prueban bombillas eletrieas para determinar cuanto tiempo encienden o si se prueba el sabor de
barras de dulce para determinar si el gusto es aceptable, el producto se destruye, S1 se realiza un censo
para este tipo de investigacin, no quedara ningn producto para venderse. Por 1an10. lomar una
muestra es la nica opcin realista para probar estos productos.
A veces es pracncamente imposible tener seceso a una poblacin para su investigacin. Por ejem
plo, algunas personas se niegan a contestar preguntas sensibles y algunos nmeros telefnicos no aparecen en las gulas. Algunos arttculos de inler6 (como un Chevrolet 1957) estn tan dispersos que
localizarlos seria sumamente diAcil. Cuando la poblacin es inaccesible por k1as u otras razones. el
muestreo es la nica opcin.
Marco
Todo estudio de investigacin tiene una poblacin objetive que es1.i formada de individuos, insutuciones o entidades que son el objeto de investigacin. La mueslra se inicia con una lista, mapa, direaorio
u otra futntt tmplt,1dn para reprtstntar la poblaci6n que recibe el nombre de marco, el cual pueden ser
lisias escolares, de asociaciones de comercio o incluso lisias vendidas por corredores de lisias. En el
ideal, existe una correspondencia exacta entre las unidades del marco y las de la poblacin, por lo que
el marco y la poblacin objetivo suelen ser diferentes. Por ejemplo, suponga que la poblacin objetivo
son las familias que viven en Detroit. Un marco factible serian las pginas residenciales de las guas de
telfonos de Detrou, Cmo es que el marco podria ser diferente de la poblacin obje1i,o? Algunas fa.
milas no uenen 1el~fono. 01m familias 1ienen nmeros que no aparecen en las gulas. Incluso podrla
haber 01ras familias que desde que se imprimi el directorio se mudaron y/o cambiaron los nmeros
telefnicos, otras has1a tienen lisias mhiplcs bajo diferemes nombres.
Lo. marcos tienen rtgutro> tn exceso en las unidades de poblacin objetivo, mas algunas otras un
dades, Los marcos a los que le falta11 registros contienen menos unidades que la poblacin objetivo, El
muestreo se realiza desde el marco y no desde la poblacin objeuvo. En teorfa, la poblacin objetivo y
el marco son los mismos. En realidad, la mela de un investigador es minimizar las diferencias entre el
marco y la poblacin cbjetivo,
91567 mt5
1-.
,... .,,.
.., .,,.
27951
11145
ano
57f91 l67m
l9I05
7059
2'167
2m2
"900
97336
07119
""'
30134
8611
ll27e
f9J2J
1402
*29
71CMI
04024
02JM
""'
)M76
l'10J2
45021
J~
"'7S5
08171
51038
:mu
45799
25f99
rn.n
2'llO
Z0655
17'8
12544
22716
1"31
13916
997]0
'Stl127
aJ6
41CIS5
19792
35006
4756t
~.-.
Ocicirlm..a ......
Cllfllalip
llM
.....
DllllA/6Llllll
s._.
1.-
a..-
a..
Dlme7
UBLA 7.J
~in
=eradade
JO compaas
.......
AlllbAldinm
Akm
MbllDd
a..lr.olAamica
WSoadi
Dar.a
lllmaMaWI
o-.ao,-a
....
e;...!
w.
OI Allllm~
OI Akm
a.clric
lac8ll
Mad
JCf'eMq
.,...
s.n
,..
....
Cimllllt
11 Dafll.12 .........
21S22 .......
CISlllSOllll
IJ~o,.-lm
14 Gmall l!leclrk
IS<iamll ...
:HMlclola6
25 Ocdllealli.........
O..
., DlllaA/6U..
11 DimlJ
'' HAurtoll
17 llM
11 leloil
19 lmut
2IO 1-'t
'~
CM ...
ol.w.ka
06a..m ClliFlllP
-~
zs .....
27 PIOCllr. a..11
:za R,.icr
29 San
30 Time
w.rner
Alaska Airlines
Alcoa
Bank of America
Occidental Petroleum
Procter & Gamble
Sears
El muestreo alea1orio simple es ms fcil de ejecutar en pobl.iciones pequea que en grandes. El
procese para numerar a lo. miembros de la poblacin y seleccionar artculos se difkulta mucha para
poblaciones grandes.
cuando. al azar, la muestra no representa la poblacin. Con muestreo aleatorio C$tratificado. el potmaa:
para comparar la muestra cerca de la poblacin es mayor de lo que es con muestreo aleatorio simple por
que se toman partes del muestreo total de lo) diferentes subgru~ poblacionales. No obstante, el rmntreo aleatorio estratificado es por lo general ms CO$tOSO que d aleatorio simple porque a cada u
de la poblacin se le debe asignar un estrato antC$ que se inicie d proceso de seleccin alcatoa.
La seleccin de estratos suele basarse en la informacin dispenibe que pudo recogerse en en
o censos previo). Los beneficies de la e)tratificacin aumentan entre ms difieran. lntemamentt.
estrato debe ser relativamente homogeneo y externamente, deben contrastar entre si. La estratifi
se hace a veces usando variables demogrficas. por ejemplo sexo, clase soeioeconmica, regin
fica, religin y grupo tnico. Por ejemplo, si una eleccin para presidente de Estados Unidos timt
realiz.arla una firma de investigacin de mercado. qu importantes variables deben ser estra
El sexo de la persona que conteste podria ser la diferencia porque en las pasadas elecciones observ
diferencia en la preferencia de los votantes ~
su gnero: es decir, los hombres y mujeres \'Otarc:
modo diferente en las elecciones nacionales. u regin geogrfica tambin proporciona una im
variable en elecciones nacionales porque los votantes son influenciados por valores culturales
que difieren de una regin a otra. Los votantes en el sur votaron ca.si exclusivamente por los
tas en el pasado, pero en fechas reciente) lo hicieron por candidatos republicano) en elecciones
nales, Los votantes de los estados de las Montallas Rocosas apoyaron a candidatos presid
republicanos: en el noreste industrial, se inclinaron mi) hacia candidatos democrticos.
En mercados de radio F.\.1, la edad de los oyentes C$ determinante pua el tipo de progr
empicada por una estacin. La figura 7.1 contiene una estratificacin por edad con tres estrato&.
base en la suposicin de que la edad hace la diferencia entre la preferencia de programacin. E.su
tificacin implica que lo~ radioescuchas entre 20 y 30 al'los prefieren el mismo tipo de progr
que es diferente de la que prefieren los radioescuchas entre 30 y 40 y entre 40 y SO allos de edad.
de cada subgrupo (estrato), la homogt11tidado semeja~ ts preseme: entre cada par des
existe una diferencia, o htttrogtntidad.
El muestree aleatorio estratificado puede ser proporcionado o desproporcionado. El
aleatorio estratificado proporcional se presenta n1ando ti porwrrajtdt la muestratomada tk
trato ts proporcionalal porcentajeq11t cada estratoest dtnrrodt toda la poblaci6n. Por ejemplo.
ga que se realiza una encuesta de votantes en Boston y la muestra es estratificada por religia
catlica, protestame, y juda, entre otras. Si la poblacin de Boston es 90% catlica y si se
muestra de mil ~'Otantes. la muestra requerirla la inclusin de 900 catlico) para alca.nz.ar estra
proporcional. Cualesquier otro nmero de catlico) $erla una estratificacin desproporci
proporcin muestral de otras religiones tambin tendra que seguir porcentajes poblacionales..
ben.sl consideramos a El Paso, Texas, donde la poblacin es aproximadamente 77% de origee
no y un in~tigador rnliu. una clccci6n en \a que \a estra\icacin es por grupo ttnico, una
aleatoria estratificada proporcional deberla contener 77% de personas de origen hispano. Par
una muestra estratificada proporcional tnicamente de 160 residentes de los 600 mil rC$iden:o
FIGUIA 7.1
Muestreo aleatorio
estratificado de
radioescuchas
deFM
Hctcrogbleo
(difemne)
entre
Hnerogmeo
[diferente}
entre
Paso debera contener 123 personas de origen hispano. Sitmprtqut las proporciona 1it los estnuos de la
muestra sean diferentesa las proporcionesdt los estratos dt la poblaci6n,se presenta un muestreo alta
torio estratificado desproporcionado.
Muestreo sistemtico
El muestreo sistemtico es una tercer tcnica muestra! aleatoria. A diferencia del muestreo aleatorio o
tratificado, el muestreo sistemtico no se realiz.a para reducir el error muestral, Ms bien, el muestreo
sistemtico se emplea por su comodidad y relativa facilidad de administracin. Con el muestreo sistem'tico, cada k-nmo elementose seltionapara producir11na muestra dt tamao n de una poblaci6n dt
tamao N. El valor de k, a veces llamado ciclo muestra! se puede determinar con la siguiente frmula.
Si k no es un valor entero, debe usarse el valor de nmero entero.
DETERMJNAOON
DEL VALOR DE le
donde:
n tamailo muestra!
N tamailo poblacional
k .. lama.do de intervalo para seleccin
Como ejemplo de muestreo sistemtico, un Investigador de sistemas de informacin de administracin deseaba muestrear fabricantes en Texas y tenla suficiente apoyo financiero para muestrear mil
compaas (n). El Direaoriode Fabricantts de Texastenla en sus llitas aproximadamente 17 mil fabricanto en totJ en Texas (N) en orden alfabttico. El valor de k era 17( 17 000/1 000) y el investigador seleccion una de cada 17 compai\las del directorio para su muestra.
Empez el investigador con la primera compai\fa de la lista, o con la nmero 17. o alguna otra intermedia? Al seleccionar cada valor k~imo,debe usarse una tabla con nmero. aleatorios simples para
seleccionar un valor entre 1 y k incluso como punto inicial. El segundo elemento para la muestra es el
punto inicial ms k. En el ejemplo, k 17, de modo que el investigador recurriria a una tabla de nmeros aleatorios para determinar un punto inicial entre 1 y 17. Suponga que seleccion el nmero 5,
entonces tendra que empezar con la compaflla nmero 5, luego seleccion la nmero 22: es decir, (5
+ 17) y luego la nmero 39, y asi sucesivamente.
El muestro sistemtico tiene otras ventajas ya que est distribuido de manera uniforme en el marco. una persona informada puede fcilmente determinar si en un estudio se sigue un plan de muestreo.
l'o obstante, puede presentarse un problema con muestreo sistemtico si los datos estn sujetos a cual
quier periodicidad y el intervalo est en sincopa (que se pueden suprimir dos o mh elementos) con el
muestreo. En e-e caso, el muestreo seria no aleatorio. Por ejemplo, si una lista de ISO estudiantes universitarios o en realidad una lista fusionada de cinco grupos. con 30 estudiantes cada uno y i cada una
de las listas de los cinco grupos se orden con los nombres de los mejores estudiantes primero y los de
menor nivel al final, entonces el muestreo sistemtico de cada 30 estudiantes podra provocar la seleccin de los mejora estudiantes, los estudiantes de menor nivel o los estudiantes mediocres; esto es. la
lista original es $Ujeta a una organiz.acin cclica o peridica. La metodologa del muestreo sisttmtko
C$t.i basada en la suposicin de que la fuente de elementos de poblacin C$ aleatoria.
228
Muestreo no aleatorio
Las tttni.:as de muestreo empicadas para seleccionar elementos de la pobladn por cualquier m
mo que no comprende un proceso de seleccin aleatorUi se denominan tttniau de muestreo no
torio Como no se u~ la probabilidad para seleccionar elementos de las muestras, C'St.1> th"llicas
thTiicas de no probabilidad y no son dC>Cable para u,,;irlo. a fin de reunir datos a ser analiudos por
mtodos de c~tadisti"I inferencia) presentada en este tato. El error de muestreo no puede ser
HM'l;tQ..
Algunas ciudades
de ventas de
prueba
229
prueba de mm:ado. Existe entradl cuando dos o mis meraidos mm tan cercanos entre si que las pmonas de otros
lugares "tntnn a comprar. Existe "u.lida cuando una
prueba de mercado a influenciada por medios de comum
cadn de otro1 lupres. Ambo6 son problema que 5C.' toman
en considmicin al ldec:aonar una ciudad pera prueba de
mercado. Por ejemplo. aun cuando Baltimott CI b ciudad
nmero uno psicogrificammte, CI afectada por "entradas"
de Washington.
de moc1o que d mm:ac1o dt Baltimott
CI dificil de aislar y estudiar Sin tomar en cuenta a Wasbing
ton. Por ata razn y otras. Morlrning 1'kws clasific a Boue,
ldaho, como uno dt los mtjom lugares pera vmder productos de consumo en E.atados Unidos. Es un mic:roc:ounos
de la nacin pero ts repleto con publicidad aislada quc
pttmitt el control dd diltllo de invatipciona.
o.e..
AllEASMETROPOLITANASMS ENCUESfAIMS
Lupr Ana a.tropolltana
1
'
4
6
7
8
9
JO
Odeua Mu:lland, TX
Porthnd,Mll
Bouldn Longmont, CO
Gr-~nd Forb, ND MN
Phonux-Mn.a, 112.
Dmwr,CO
Fargo-Moorhad, ND-MN
Bo~.ID
T~.112.
Pimfield. MA
nado objetivamente para otas tcnicas de muestreo. Aqu se presentan cuatro tkruca. de muestreo no
aleatorio: muestreo de conwnicncia, muestreo de juicio, muestreo de cuota y muestreo de bola de nieve,
Muestreo de conveniencia
En el muestreo de conveniencla, los tltmttllospam In mu"" st stlcionan para comodidaddtl inwsrigador. Por lo general el inve tigador selecciona elemento de lo~ que se dispone con facili~d. cercanos o dispuestos a participar. La muestra tiende a -er menos variable que la poblacin porque en
mucho, entornos los elementos extremos de la poblacin no se encuentran fcilim.'Ilte. El invc.tigador
seleccionar mh elementos de la parte media de la poblacin. Por ejemplo, un muestreo de conveniencia en hogares para entrevistas de puerta en puerta podra incluir casa. donde I~ personas oteo en casa, ~s donde no haya perros, casas cerca de la calle. departamento) en primer piso, y cas.u con
personas amables, En contraste, una muestra aleatoria requerirla que d invatigador reuniera datos slo
de casas > departamento) que hayan sido seleccionado) al azar, sn importar qu incmodo o poco
amable $C3 la ubicacin. Si una firma de investigacin c.t. locali1.ada en una zona comercial peatonal.
una muestra de comenicncia podra ser seleccionada al entrevistar slo compradores que pasan por la
tienda y se ven amables.
Muestreo de juicio
Un muestreo de juicio se presenta cuando los tkmtntos stltcdonndos para la muesrm son mogidos por
ti 11licio del invt$tigador.A veces los imestigadorei. piensan que pueden obtener una muestra represen-
tativa al usar un juicio razonable, que resultar en ahorro de tiempo y dinero .. A veces ticos, los inves-