Sei sulla pagina 1di 255

,

E/TflDIJTl~fl
.

.
.

ert 101 fl.E'GOCIOJ

.
ESTAbsTiCA EN LOS NEGOctqs

t. -~15 ~
r~.

(CUARTAEDICN EN INGLS)

Ken Black

PARA LA TOMA DE DECISIONES

(PRIMERA EDICIN EN ESPOL)

~
:i!'
~i
er:

~i:

11
.il

. :t

Universidad del lago claro Houston

"\
PRIME~~ EDICIN
ME~CO, 2005
(
.

...

-COMPAA EDITORIAL CONTINENTAL

.l
f

RESUMEN DEL CONTENIDO

Introduccin a la Estadstica

Tablas y grficas

Estadstica descriptiva

Probabilidad

Distribuciones discretas

18
46

96
140

Distribuciones continuas

Muestreo y distribuciones muestrales 220

Inferencia estadstica: estimacin para poblaciones individuales 252

Inferencia estadstica: prueba de hiptesis para una poblacin

182

1 O Inferencia estadstica acerca de dos poblaciones

340

288

RESUMEN DE CONTENIDO v

11

Anlisis de varianza y diseo de experimentos

12 Anlisis de datos categricos


r

454

13 Anlisis de regresin simple

480

14 Anlisis de regresin mltiple

. 522

15 Construccin de modelos de regresin mltiple


16 Pronstico de series de tiempo y nmeros ndice
17 Estadsticas no paramtricas
18 Control estadstico de calidad

396

656

704

552

598

CONTENIDO

Prefacio
xxii
Acerca del autor

xxviii

Introduccin a la estadstica

Dilema de decisin: La estadsticadescribeel estado de los negociosen las zonas rurales de la India 3

1.1

LA ESTADISTICAEN LOS NEGOCIOS


El mejor camino al mercado 4
Estrs en el trabajo 4
Decisiones financieras 5
Cmo est la economa? 5
El impacto de la tecnologa en el trabajo

1.2
1.3

CONCEPTOS ESTADlSTICOS BSICOS


MEDICIN DE DATOS s

Nivel nominal 8
Nivel ordinal 9
Nivel de intervalo 9
Nivel de razn l O
Comparacin de los cuatro niveles de datos 10
Anlisis estadstico usando la computadora: Excel y MINITAB

11

Resumen 13
Trminosclave 14
Problemascomplementarios 14
Anlisis de la base de datos 15
Caso: DiGiornoPizzas:Introduccinde una pizzacongeladapara competir con laspizzaspara llevar 17

Tablas y grficas

18

Dilema de decisin: Estado de la manufactura de autos

19

2.1

20

DISTRIBUCIONES DE FRECUENCIA
Marca de clase 20
Frecuencia relativa 21
Frecuencia acumulada 21

2.2

REPRESENTACINGRFICA DE DATOS 24
Histogramas

24

Uso de histogramaspara obtener una visin general de los datos 25


Polgonos de frecuencia

26

CONTENIDO

Ojivas 26
Grficas de pastel 27
Grficas de tallo y hoja 30
Grficas de Pareto 31

2.3

DESCRIPCIN GRFICA DE DATOS NUMRICOS DE DOS VARIABLES:


GRFICAS DE DISPERSIN 34

Resumen 38
Trminos clave 39
Problemas complementarios 39
Anlisis de la base de datos 42
Caso: Las jaboneras presentan batallas
Uso de la computadora 44

Estadstica descriptiva

42

46

Dilema de decisin: Estadsticas de lavanderfas

3.1

47

MEDIDAS DE TENDENCIA CENTRAL: DATOS NO AGRUPADOS


Moda 48
Mediana 48
Media 49
Percentiles S l

Pasos para determinar la ubicacin de un percentil SI


Cuartiles S2

3.2

MEDIDAS DE VARIABILIDAD: DATOS NO AGRUPADOS


Rango S6
Rango intercuartil S6
Desviacin media absoluta, varianza y desviacin estndar S8
Desviacin media absoluta S9
Varianza S9
Desviacin estndar 60
Significado de desviacin estndar 60
Regla emprica 61
Teorema de Chebyshev 62
Poblacin contra varianza muestra/ y desviacin estndar 63
Frmulas de clculo breve para varianza y desviacin estndar 64
Valores z 66
Coeficiente de variacin 66

3.3

MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD:


DATOS AGRUPADOS 70
Medidas de tendencia central

70

Media 70
Moda 7l
Medidas de variabilidad

3.4

7l

MEDIDAS DE FORMA

76

Sesgo 76

Sesgo y relacin de la media, mediana y moda 77


Coeficientede sesgo 77
Curtosis 78
Grficas de caja y bigote

78

ss

48

vii

vili ESTADISTICA EN LOS NEGOCIOS

3.5

MEDIDASDE ASOCIACIN
Correlacin

3.6

ESTADISTICADESCRIPTIVAEN LA COMPUTADORA

Resumen 86
Trminos clave 87
Frmulas 88
Problemas complementarios 89
Anlisis de la base de datos 93
Caso: Coca-Cola se hace pequea en Rusia
Uso de la computadora 94

80

80

Probabilidad

93

96

Dilema de decisin: Igualdad de gnero en el lugar de trabajo

4.1
4.2

97

INTRODUCCINA LA PROBABILIDAD 98
MTODOS PARAASIGNARPROBABILIDADES
Mtodo clsico de asignar probabilidades
Frecuencia relativa 99
Probabilidad subjetiva 100

4.3

84

ESTRUCTURADE LA PROBABILIDAD
Experimento 100
Evento 101
Eventos simples 101
Espacio muestral 101
Uniones e intersecciones

99

99

100

102

Eventos mutuamente excluyentes


Eventos independientes 103

102

Eventos colectivamente exhaustivos


Eventos complementarios
103
Conteo de posibilidades l 04
La regla de conteo mn
104

103

Muestreo de una poblacin con reemplazo 104


Combinaciones: muestreo de una poblacin sin reemplazo 105

4.4
4.5

PROBABILIDADESMARGINALES,DE UNIN,CONJUNTAS
Y CONDICIONALES 106
LEYESDELAADICIN 106
Matrices de probabilidad

Complemento de una unin


Ley especial de la adicin

4.6

108
111
112

LEYESDE LA MULTIPLICACIN
Ley general de la multiplicacin
Ley especial de la multiplicacin

4.7

PROBABILIDADCONDICIONAL
Eventos independientes

4.8

115

115
ll8
121

124

REVISIN DE PROBABILIDADES:REGLADE BAYES

Resumen 134
Trminos clave

134

128

CONTENIDO

Frmulas 134
Problemas complementarios 135
Anlisis de la base de datos 138
Caso: Colgate-Plmolive hace un esfuerzo "totsl"

138

140

Distribuciones discretas

Dilema de decisin: El bueno y el malo de la imagen pblica de la industria bancaria

5.1
5.2

141

DISTRIBUCIONES DISCRETAS CqNTRA CONTINUAS 142


DESCRIPCIN DE UNA DISTRIBUCIN DISCRETA 143
Media, varianza y desviacin estndar de distribuciones discretas

143

Valor medio o esperado 144


Varianza y desviacin estndar de una distribucin discreta 144

5.3

DISTRIBUCIN BINOMIAL

147

Resolucin de un problema binomial 148


Uso de la tabla binomial 151
Uso de computadora para producir una distribucin binomial 152
Media y desviacin estndar de una distribucin binomial 153
Grficacin de distribuciones binomiales 154

5.4

DISTRIBUCIN DE POISSON

158
Resolucin de problemas de Poisson por frmula 159
Uso de las tablas de Poisson 161
Media y desviacin estndar de una distribucin de Poisson
Grficas de distribuciones de Poisson 162

162

Uso de computadora para generar distribuciones de Poisson 162


Clculo de problemas binomiales por la distribucin de Poisson 163

5.5

DISTRIBUCIN HIPERGEOMTRICA 168


Uso de la computadora para resolver probabilidades de distribucin hipergeomtrica

Resumen

173

Trminos clave
Frmulas

173

173

Problemas complementarios

174

Anlisis de la base de datos

179

Caso: Fuji Film introduce el APS


Uso de la computadora

179

180

Distribuciones continuas

182

Dilema de decisin: Los rostros cambiantes de la industria de seguros

6.1

DISTRIBUCIN UNIFORME

6.2

DISTRIBUCIN NORMAL

183

184
Determinacin de probabilidades en una distribucin uniforme 185
Uso de la computadora para resolver probabilidades de distribucin uniforme

188
Historia de la distribucin normal 189
Funcin de densidad de probabilidad de la distribucin normal
Distribucin normal estndar 190

190

187

170

ix

x ESTADISTICA EN LOS NEGOCIOS

Resolucin de problemas de curva normal 191


Uso de la computadora para resolver probabilidades de distribucin normal

199

6.3

USO DE LA CURVA NORMAL PARA CALCULAR APROXIMADAMENTE


PROBLEMAS DE DISTRIBUCIN BINOMIAL 201

6.4

DISTRIBUCIN EXPONENCIAL

Correccin para continuidad

203

207
Probabilidades de la distribucin exponencial 207
Uso de la computadora para determinar probabilidades de distribucin exponencial
Resumen 212
Trminos clave 213
Frmulas 213
Problemas complementarios 213
Anlisis de la base de datos 217
Caso: Mercedes va tras compradores jvenes 217
Uso de la computadora 218

Muestreo y distribuciones muestrales

220

Dilema de decisin: Cul es la actitud de los trabajadores de maqui/adoras?

7.1

7.2

MUESTREO

222
Razones para muestreo 222
Razones para tomar un censo 223
Marco 223
Muestreo aleatorio contra no aleatorio
Tcnicas de muestreo aleatorio 224
Muestreo aleatorio simple 224
Muestreo aleatorio estratificado 225
Muestreo sistemtico 227
Muestreo de grupo (o rea) 227
Muestro no aleatorio 228
Muestreo de conveniencia 229
Muestreo de juicio 229
Muestreo de cuota 230
Muestreo de bola de nieve 230
Error de muestreo 231
Errores no muestrales 231

DISTRIBUCIN DE MUESTREO DE LA MEDIA i


Muestreo con una poblacin finita

7.3

223

239

DISTRIBUCIN MUESTRAL DE

Resumen 246
Trminos clave 247
Frmulas 247
Problemas complementarios 247
Anlisis de la base de datos 250
Caso: Shell trata de regresar al primer lugar 250
Uso de la computadora 251

241

232

221

209

CONTENlDO xi

Inferencia estadstica: estimacin para poblaciones individuales

252

Dilema de decisin: Un reporte de encuestas sobre productividad, compensacin y prestaciones


8.1

ESTIMACIN DE LA MEDIA POBLACIONAL CON EL USO


DEL ESTADSTICO z/DISTRIBUCIN z 254
Factor de correccin finita 257
Intervalo de confianza para calcular u cuando a se desconoce 258
Uso de la computadora para construir intervalos de confianza z para la media

,.
8.2

259

ESTIMACIN DE LA MEDIA POBLACIONAL CON EL USO


DEL ESTADSTICO t/DISTRIBUCIN t 262
La distribucin t 263
Solidez 263
Caracterlsticas de la distribucin t 263
Lectura de la tabla de distribucin t 264
Intervalos de confianza para estimar la media poblacional usando el estadlstico ti
distribucin t 265
Uso de la computadora para construir intervalos de confianza t para la media 266

8.3

ESTIMACIN DE LA PROPORCIN POBLACIONAL

8.4

ESTIMACIN DE VARIANZA POBLACIONAL

8.5

ESTIMACIN DEL TAMAO DE LA MUESTRA

268
Uso de la computadora para construir intervalos de confianza para la proporcin
poblacional 271

Tamao de la muestra al estimar u 277


Determinacin de tamao de la muestra al estimar p
Resumen 281
Trminos eleve 282
Frmulas 282
Problemas complementarios 283
Anlisis de la bese de datos 286
Caso: Thermatrix 286
Uso de la computadora 287

273
276

278

Inferencia estadstica: prueba de hiptesis para una poblacin


Dilema de decisin: Referencias de negocios 289
9.1
INTRODUCCIN A LA PRUEBA DE HIPTESIS

290

Tipos de hiptesis 291


Hiptesis de investigacin 291
Hiptesis estadlsticas 291
Hiptesis sustantivas 293
Uso del sistema HTAB para probar hiptesis 294
Regiones de rechazo y de aceptacin 296
Errores tipo 1 y tipo 11 297

9.2

PRUEBA DE HIPTESIS PARA UNA MEDIA POBLACIONAL


CON EL USO DEL ESTADSTICO z/DISTRIBUCIN z 298
Uso de una desviacin estndar muestral 300
Prueba de la media con una poblacin finita 301

288

253

xii ESTADISTICA EN LOS NEGOCIOS

Uso del mtodo del valor p para probar hiptesis 301


Uso del mtodo del valor critico para probar hiptesis 302
Uso de la computadora para probar hiptesis sobre una media poblacional que usa
el estadstico z 305

9.3

PRUEBA DE HIPTESIS PARA LA MEDIA POBLACIONAL


CON EL USO DEL ESTADSTICO t/DISTRIBUCIN t 307
Uso de la computadora para probar hiptesis sobre una media poblacional
con el uso de la prueba de t 310

9.4

PRUEBA DE HIPTESIS PARA UNA PROPORCIN


313
Uso de la computadora para probar hiptesis sobre una proporcin poblacional

9.5
9.6

PRUEBA DE HIPTESIS PARA LA VARIANZA


SOLUCIN DE ERRORES TIPO 11 322

Algunas observaciones sobre errores tipo I1 326


Curvas caractersticas de operacin y potencia 326
Efecto de aumentar el tamao de la muestra en los limites de rechazo
Resumen 332
Trminos clave 332
Frmulas 333
Problemas complementarios 333
Anlisis de la base de datos 336
Caso: Frito-Lay apunta al mercado hispano 336
Uso de Ja computadora 339

1 O Inferencias estadsticas acerca de dos poblaciones

328

340

Dilema de decisin: Comparacin de estadsticas internacionales de trabajo

10.1

317

318

341

PRUEBA DE HIPTESIS E INTERVALOS DE CONFIANZA ACERCA


DE LA DIFERENCIA ENTRE DOS MEDIAS CON USO DEL
ESTADSTICO DE z 342
Hiptesis 344
Intervalos de confianza 347
Uso de la computadora para probar hiptesis acerca de la diferencia entre dos medias
poblacionales usando la prueba de z 349

10.2

PRUEBA DE HIPTESIS E INTERVALOS DE CONFIANZA ACERCA


DE LA DIFERENCIA ENTRE DOS MEDIAS: MUESTRAS PEQUEAS
INDEPENDIENTES Y VARIANZAS POBLACIONALES
DESCONOCIDAS
352
Hiptesis 352
Uso de la computadora para probar hiptesis y construir intervalos de confianza acerca
de la diferencia entre dos medias poblacionales con el uso de la prueba de t 354
lntervalos de confianza 357

10.3 INFERENCIAS ESTADlSTICAS PARA DOS POBLACIONES


RELACIONADAS 361
Hiptesis 361
Uso de la computadora para hacer inferencias estadsticas en dos poblaciones
relacionadas 363
Intervalos de confianza 366

CONTENIDO

10.4 INFERENCIAS ESTADSTICAS PARA DOS PROPORCIONES


POBLACIONALES,pt - P2 370
Hiptesis 371
Intervalos de confianza 374
Uso de la computadora para analizar la diferencia entre dos proporciones 375

10.5

PRUEBA DE HIPTESIS SOBRE DOS VARIANZAS


POBLACIONALES 377

Uso de la computadora para probar la hiptesis sobre dos varianzas poblacionales 379
Resumen 385
Trminos clave 386
Frmulas 386
Problemas complementarios 387
Anlisis de la base de datos 392
Caso: Seitz Corporation: Fabricacin de productos que se mueven mediante engranajes
y de manera lineal 392
Uso de la computadora 394

,.

11

Anlisis de varianza y diseo de experimentos

396

Dilema de decisin: Analizar las diferencias en rentabilidad de compafas en tres pases 397
11.1 INTRODUCCIN AL DISEO DE EXPERIMENTOS
11.2

398

EL DISEO COMPLETAMENTE ALEATORIO (ANOVA DE


UN SENTIDO) 400
Anlisis de varianza de un sentido 401
Lectura de la tabla de distribucin de F 404
Uso de la computadora para una ANOVAde un sentido
Comparacin de los valores de F y de t 406

405

11.3 PRUEBAS DE COMPARACIN MLTIPLE

411
Prueba de diferencia honestamente significativa (HSD) de Tukey: caso con tamao
de muestra iguales 412
Uso de la computadora para hacer comparaciones mltiples 414
Procedimiento de Tukey-Kramer: caso de tamaos muestrales desiguales 416

11.4 DISEO DE BLOQUE ALEATORIO

419
Uso de la computadora para analizar diseos de bloque aleatorios 423

11.5 DISEO FACTORIAL (ANOVA DE DOS DIRECCIONES)


Ventajas del diseo factorial 429
Diseos factoriales con dos tratamientos 429
Aplicaciones 430
Prueba estadstica de un diseo factorial 430
Interaccin 432
Uso de la computadora para hacer una ANOVA de dos sentidos 437
Resumen 446
Trminos clave 446
Frmulas 447
Problemas complementarios 448
Anlisis de la base de datos 451
Ceso: J. R. Clarkson Company 451
Uso de la computadora 453

429

xiii

xiv

ESTADISTICA EN LOS NEGOCIOS

12 Anlisis de datos categricos

454

Dilema de decisin: Seleccin de proveedores: comparacin de pequeas y grandes empresas


en Ja industria electrnica

455

12.1 PRUEBA DE JI CUADRADA DE BONDAD DE AJUSTE

456
Prueba de una proporcin poblacional con el uso de una.prueba de ji cuadrada de bondad
de ajuste como tcnica alternativa a la prueba de z 462

12.2 ANLISIS DE CONTINGENCIA: PRUEBA DE JI CUADRADA


DE INDEPENDENCIA
466
Resumen 475
Trminos clave 475
Frmulas 476
Problemas complementarios 476
Anlisis de la base de datos 478
Caso: Foot Locker en Ja mezcla de calzado
Uso de la computadora 479

13 Anlisis

de regresin simple

478

480

Dilema de decisin: Prediccin del volumen anual de ventas de empresas de corretaje o


representacin de bienes races por medio del precio promedio de venta

481

13.l

INTRODUCCIN AL ANLISIS DE REGRESIN SIMPLE

13.2

DETERMINACIN DE LA ECUACIN DE LA RECTA DE REGRESIN

482

13.3 ANLISIS RESIDUAL

490
Uso de residuales para probar las suposiciones del modelo de regresin
Uso de la computadora para anlisis de residuales 492

13.4 ERROR ESTNDAR DE LA ESTIMACIN


13.5 COEFICIENTEDEDETERMINACIN
Relacin entre el valor de r y de r2

496

499

501

13.6 HIPTESIS PARA LA PENDIENTE DEL MODELO


DE REGRESIN Y DEL MODELO GENERAL 502
Prueba de la pendiente 502
Prueba del modelo general 505

13.7

ESTIMACIN

506
Intervalos de confianza para estimar la media condicional de y:J'lx
Intervalos de prediccin para estimar un solo valor de y 507

13.8 INTERPRETACIN DE LA SALIDA


Resumen 514
Trminos clave 514
Frmulas 514
Problemas complementarios 515
Anlisis de Ja base de datos 518
Caso: Delta Wire usa capacitacin como arma
Uso de la computadora 521

519

510

507

491

483

CONTENIDO

14 Anlisis de regresin mltiple

522

Dilema de decisin: Va usted a odiar su nuevo trabajo?

523

14.1 EL MODELO DE REGRESIN MLTIPLE

524
Modelo de regresin mltiple con dos variables independientes (primer orden)
Determinacin de la ecuacin de regresin mltiple 526
Modelo de regresin mltiple 527

525

14.2 PRUEBAS DE SIGNIFICANCIA DEL MODELO DE REGRESIN


Y SUS COEFICIENTES 532
Prueba del modelo general 532
Pruebas de significancia de los coeficientes de regresin

533

143 RESIDUALES, ERROR ESTNDAR DE LA ESTIMACIN Y R2


Residuales 536
SSE y error estndar de la estimacin 537
Coeficiente de determinacin mltiple (R2)
R2 ajustada 539

536

538

14.4 INTERPRETACIN DE UNA SALIDA COMPUTARIZADA


DE REGRESIN MLTIPLE 541
Un nuevo examen de la salida de regresin mltiple
Resumen 546
Trminos clave 546
Frmulas 546
Problemas complementarios 547
Anlisis de la base de datos 549
Caso: Starbucks introduce tarjeta de dbito 550
Uso de la computadora 551

15 Construccin de modelos de regresin mltiple

541

552

Dilema de decisin: Determinacin de compensacin para directores generales

15.1

553

MODELOS NO LINEALES: TRANSFORMACIN MATEMTICA


Regresin polinomial 555
Escalera de transformaciones de Tukey 557
Modelos de regresin con interaccin 559
Transformacin de un modelo 561

15.2 VARIABLES INDICADORAS (FALSAS) 567


15.3 CONSTRUCCIN DE MODELOS: PROCEDIMIENTOS
DE BSQUEDA 573
Procedimientos de bsqueda 575
Todas las regresiones posibles 575
Regresin por pasos 576
Seleccin de avance 579
Eliminacin inversa 580

15.4 MULTICOLINEALIDAD
Resumen 589
Trminos clave 590

583

554

XV

xvi ESTADISTICAEN LOS NEGOCIOS

Frmulas 590
Problemas complementarios 590
Anlisis de la base de datos 594
Caso: VirginiaSemiconductor 594
Uso de la computadora 597

16 Pronstico de series de tiempo y nmeros ndice


Dilema de decisin: Pronstico de la contaminacin del aire

16.1

INTRODUCCIN AL PRONSTICO

598
599

600

Componentes de series de tiempo .600


La medida de error de pronstico 601
Error 602
Desviacin media absoluta (MAD) 602
Error medio cuadrtico (MSE) 602

16.2 T:eCNICAS DE SUAVIZAMIENTO

604

Modelos ingenuos de pronstico 604


Modelos de promedio 605
Promedios simples 605
Promedios mviles 607
Promedios mviles ponderados 608
Suavizamientoexponencial 610

16.3 ANLISIS DE TENDENCIAS

616
Anlisisde tendencia de regresin lineal 616
Anlisis de tendencia de regresin usando modelos cuadrticos 618
Mtodo de suavizamiento exponencialde dos parmetrosde Holt 621
16.4 EFECTOS ESTACIONALES 623
Descomposicin 623
Bsqueda de efectos estacionalescon la computadora 626
Mtodo de suavizamiento exponencialde tres parmetros de \V"LDt<n 626

16.5 AUTOCORRELACIN Y AUTORREGRESIN 629


Autocorrelacin 629
Formas de superar el problema de autocorrelacin 632
Adicin de variables independientes 632
Transformacin de variables 632
Autorregresin 632

16.6 NMEROS DE NDICE

636

Nmeros Indice sencillos e Indices de precio agregados no ponderados 636


Nmeros Indice de precios agregados y no ponderados 637
Nmeros ndice de preciosagregados ponderados 638
Indice de precios Laspeyres 638
Indice de precios Paasche 639
Resumen 645
Trminosclave 646
Frmulas 646
Problemascomplementarios 647
Anlisis de la base de datos 652

Caso: Debourgh Manufacturing Company

Uso de la computadora

652

654

17 Estadsticas no paramtricas

656

Dilema de decisin: Cmo est el negocio de las donas?

17.1 PRUEBADECORRIDAS

657

659

Prueba de corridas de muestra pequea 660


Prueba de corridas de muestra grande 661

17.2 PRUEBAUDEMANN-WHITNEY

663

Caso de muestra pequea 664


Caso de muestra grande 666

17.3 PRUEBADE RANGO CON SIGNO DE PARESRELACIONADOS


DE WILCOXON 671
Caso de muestra pequea (n $ 15) 672
Caso de muestra grande (n > 15) 673

17.4 PRUEBADEKRUSKAL-WALLIS 679


17.5 PRUEBADEFRIEDMAN 685
17.6 CORRELACINDE RANGO DE SPEARMAN/COEFICIENTE
DE SPEARMAN 690
Resumen 695
Trminos clave 696
Frmulas 696
Problemas complementarios 697
Anlisis de bases de datos 701
Caso: Schwinn 702
Uso de la computadora

l8

703

Control estadstico de calidad

704

Dilema de decisin: Control de calidad en Xerox

705

18.1 INTRODUCCIN AL CONTROL DE CALIDAD


Qu es el control de calidad? 707
Administracin de calidad total 708
Algunos conceptos importantes sobre la calidad
Estndar de referencia 709
Sistemas de inventario justo a tiempo
Reingenierfa 710
Six Sigma 711
Formacin de equipos 712

18.2 ANLISISDE PROCESOS

709

709

712

Diagramas de flujo 713


Anlisis de Pareto 715
Diagramas de causa y efecto (espinazo de pescado)
Grficas de control 716

715

706

xviii ESTADISTICAEN LOS NEGOCIOS


18.3

GRFICAS DE CONTROL
718
Variacin 718
Tipos de grficas de control 718
Grfica x 719
Grficas R 722
Grficas p 724
Grficas e 726
Interpretacin de grficas de control 728

18.4 MUESTREO DE ACEPTACIN

733

Plan de una sola muestra 733


Plan de dos muestras 734
Plan de muestras mltiples 734
Determinacin de curvas de error y caractersticas de operacin 735
Resumen 740
Trminos clave 741
Frmulas 742
Problemas complementarios 743
Anlisisde fa base de datos 746
Caso: Robotron 747
Uso de la computadora 749

Apndice A: Tablas

751

Apndice B: Respuestas a problemas cuantitativos nones seleccionados


Glosario
803
ndice

815

En el CD adjunto

19 Anlisis de decisin

CI9-2

Dilema de decisin: Toma de decisiones a nivel del director Ci9-3

19.1 LA MESA DE DECISIN Y LA TOMA DE DECISIONES BAJO


INCERTIDUMBRE CI9-4
Mesa de decisin CI9-S
Toma de decisiones bajo incertidumbre Cl9-6

19.2 TOMA DE DECISIONES BAJO INCERTIDUMBRE


Criterio max.imax Ci9-6
Criterio max.irnin Ci9-7
Criterio de Hurwicz CI9-7
Prdida minimax CI9-9

19.3 TOMA DE DECISIONES BAJO RIESGO


Arboles de decisin Cl9-14
Valor monetario esperado (EMV) CI9-14
Valor esperado de informacin perfecta Ci9-18
Utilidad CI9-19

CI9-14

CI9-6

793

COITTENIDO

xix

19.4 REVISIN DE PROBABILIDADESEN VISTA DE LA INFORMACIN


MUESTRAL Cl9-22
Valor esperado de informacin muestral
Resumen Cl9-33
Trminos clave CI9-33
Frmula CI 9-34
Problemas complementarios Cl9-34
Anlisis de las bases de datos Cl9-36
Caso: Fletcher-Terry: en riesgo Cl9-36

Suplemento1: notacin de suma

Cl9-25

Sl-1

Suplemento 2: Deduccin de frmulas de regresin simple para pendiente


y punto de cruce con el eje y S2-1
Suplemento3: Suavizamientoexponencial avanzado

S3-1

SUAVIZAMIENTO EXPONENCIAL CON EFECTOS DE TENDENCIA: MTODO


DEHOLT 53-1
SUAVIZAMIENTOEXPONENCIAL CON TENDENCIAY ESTACIONALIDAD:
MTODO DE WINTER 53-2
Algunos problemas de prctica 53-5

PREFACIO

La cuarta edicin de Estadstica en los negocios para la toma de decisiones, si bien sigue reteniendo la pedagoga clara y directa de ediciones anteriores, agrega nuevos artculos y un inters todavia ms intenso a la estadstica aplicada, prctica, que mejora la posicin del texto como lder en la presentacin de
estadsticas de negocios en una situacin de toma de decisiones.
Esta edicin est escrita y diseada para un curso de introduccin de dos semestres para estudiantes de estadsticas de negocios o un curso de introduccin al nivel de Master en administracin de empresas. Adems, con 18 captulos, se adapta muy bien a un curso de un semestre de estadsticas de
negocios. El texto est escrito con la suposicin de que el estudiante ya ha cursado lgebra universitaria. No se emplea clculo en la presentacin de material en el texto.
El enfoque filosfico bsico de este texto es que toda herramienta estadfstica presentada tiene alguna aplicacin en negocios. Mientras que el texto contiene rigor estadfstico, est escrito de modo que
el estudiante pueda fcilmente entender que la correcta aplicacin de la estadstica en el mundo de los
negocios va de la mano con la buena toma de decisiones. En esta edicin se presenta la estadstica como medio para convertir datos en informacin til para que Jos directores tomen las decisiones mejor pensadas y con base en informacin. Por tanto, el texto contiene estadsticas de negocios como
herramientas de "valor agregado" en el proceso de convertir datos en informacin til.

CAMBIOSPARA LA CUARTA EDICIN


Dilema de decisin y en respuesta
Los artculos de Dilema de decisin y En respuesta que gozaron de tanta preferencia en la segunda edicin pero que se pasaron al CD-ROM en la tercera edicin, aparecen de nuevo en el texto de la cuarta
edicin. El dilema de decisin es una vieta real de negocios con que se inicia cada uno de los captulos. Establece el tono para el capitulo al presentar un dilema de negocios o industria y formular varias
preguntas gerenciales o estadsticas, la solucin de las cuales requiere el uso de tcnicas presentadas en
el capitulo. Crea una situacin para que las estadsticas de negocios se presenten en el captulo. AJ finalizar cada capitulo se encuentra el artculo En respuesta, el cual analiza y contesta preguntas gerenciales
y estadsticas puestas en el Dilema de decisin con el uso de tcnicas del captulo, Uevando as al cierre
del mismo. En la cuarta edicin, se agregaron siete nuevos Dilemas de decisin y En respuesta desde
que el artculo apareci por ltima vez en la segunda edicin, y prcticamente todos los otros artculos
se actualizaron. Los nuevos Dilemas de decisin incluyen: 1) Estadsticas de lavanderas; 2)Pronstico
de Contaminacin del Aire; 3) Cmo est el negocio de las donas? (participa Krispy Kreme); 4) Estado de manufactura de autos; 5) Comparacin de estadsticas internacionales de trabajo; 6) Prediccin
del volumen anual de ventas de empresas de corretaje de bienes rafees por el precio promedio de las
ventas; y 7} Va a cambiar de trabajo?
Como ejemplo, el Dilema de decisin del captulo 17, Cmo est el negocio de las donas? Presenta a Krispy Kreme como una compaia especializada en donas en rpido crecimiento. La compaia, establecida en 1937 por Vernon Rudolph, empez como un pequeo fabricante y proveedor de donas a
tiendas de abarrotes de la localidad en Winston-Salem, Carolina del Norte, y se expandi rpidamente
a localidades fuera del sureste en la dcada de 1990, y est creciendo internacionalmente en el siglo xxr,
Con esta rpida expansin, un problema podra ser la consistencia en el tamao de las donas. El Dilema de decisin presenta una situacin en la que el personal de administracin de calidad en Krispy

PREFAOO

Di

Kreme ha realizado un experimento para comparar los tamaos de donas, en donas producidas por
cuatro mquinas diferentes. Las donas producidas por cada mquina se seleccionan al azar y se prueban para determinar si hay una diferencia de importancia en el tamao de las donas hecbas a mquina. Desafortunadamente,
las suposiciones subyacentes al uso de una ANOVA unidireccional no se
pueden satisfacer. El dilema es cmo analizar los datos en estas condiciones. El captulo 17 trata de estadsticas no pararntricas. El articulo En respuesta, al final del captulo, muestra al estudiante la forma
en que el dilema se puede resolver mediante el uso de una prueba de Kruskal-Wallis. Los otros dos dilemas se presentan en este Dilema de decisin y se responden en el articulo En respuesta con el uso de la prueba t de rango con signo pareado de Wilcoxon y la correlacin de rango de Spearman. Una de estas pruebas
se ocupa de analizar datos de ventas antes y despus de una campaa de ventas y la otra trata de determinar la fuerza de relacin entre las ventas de una rienda y su tamao con el uso de datos de rango.

Casos
Prcticamente todos los casos se han actualizado para esta edicin y se han escrito tres nuevos casos para la cuarta edicin, usando para ello compaas contemporneas: 1) Foot Locker en la fabricacin de
calzado, captulo 12 (Anlisis de datos categricos); 2) Starbucks introduce la tarjeta de dbito, captulo
14 {Introduccin a la regresin mltiple); y 3) Schwinn, capitulo 17 (Estadsticas no paramtricas). El
caso de Starbucks presenta uno de los relatos de xito contemporneo de un negocio ya que la compaia ha crecido de una cafeterfa en 1971 a ms de 5 000 en la actualidad. En noviembre de 2001, Starbucks
trat de poner en prctica un nuevo concepto al lanzar su tarjeta Starbuck prepagada (de dbito). La tarjeta fue tan bien aceptada cuando fue anunciada que a muchas tiendas se les agot la existencia. Para mediados del ao 2002, Starbucks haba activado ms de 5 millones de estas tarjetas. Se piensa que la
tarjeta constituye una gran parte del aumento de 7% en ventas en la misma tienda a principios de 2002
y que es la razn por la que se atrajeron numerosos nuevos dientes a la tienda. En este caso, unos estudiantes exploran formas de pronosticar la cantidad gastada en las tarjetas de dbito mediante el uso de
metodologa de regresin y variables demogrficas. Adems, se utiliza regresin mltiple para crear
nuevos modelos para pronosticar los ingresos de ventas de una tienda. En el segundo nuevo caso participa Foot Locker, el distribuidor nmero uno del mundo de calzado y ropa deportivos, con aproximadamente 3600 tiendas de ventas al menudeo ubicadas en 14 diferentes compaas en Estados
Unidos, Europa y Australia. En este caso, presentado en el nuevo capitulo de anlisis categrico (ji cuadrada), las distribuciones de ventas en varios niveles de precios se comparan de un ao al siguiente en
un esfuerzo por determinar si cambian los modelos de compras. Los anlisis de tabulacin cruzada se
llevan a cabo para estudiar la relacin entre el sexo de compradores y la geografia y para examinar su
parte del mercado por localidad. En el tercer nuevo caso participa Schwinn, compaia de venta de bicicletas de estilo antiguo que con una larga historia de innovacin. En la actualidad, la compaia tiene
un gran xito en el mercado de bicicletas para montaa como primer productor de bicicletas. En este
caso, contenido en el capitulo no paramtrico, se pide a estudiantes aplicar tcnicas estadsticas no paramtricas para analizar preguntas de control de calidad acerca de la diferencia en proveedores y la aleatoriedad de fallas de pintura. Adems, el caso incluye un estudio entre las diferencias de edad de las
compradoras en dos ciudades.

Estadstica en los negocios de hoy


Al igual que en ediciones anteriores, la cuarta edicin incluye un articulo acerca de la estadstica en
cada capitulo. Este articulo presenta un ejemplo real de la manera en que las estadsticas presentadas
en ese captulo se aplican en el mundo actual de los negocios. Cinco capitulos de la cuarta edicin tienen nuevos artculos a cerca de estadsticas en negocios: l) Crece el uso del U.S. Wireless, capitulo l ,
Introduccin a la estadstica; 2) Estadsticas de trabajo por computadora, capitulo 3, Estadistica descriptiva; 3) Pronstico del precio de un SUV, captulo 13, Anlisis de regresin simple; 4) Pronstico de
intensidad de exportacin de empresas manufactureras chinas con el uso de anlisis de regresin mltiple, capitulo 15, Construccin de modelos de regresin mltiple; y 5) Perfilar usuarios en linea, captulo 17, Estadisticas no paramtricas.
Como ejemplo, de Estadsticas de trabajo por computadora, un estudio realizado por Telework
America mostr que 28 millones de estadounidenses trabajan por computadora. Se estima que para finales de 2004 habr casi 30 millones de teletrabajadores regulares en Estados Unidos. El teletrabajador
tpico vive en el oeste o el noroeste, es hombre, tiene educacin universitaria, tiene entre 35 y 44 aos
de edad, casado, y gana por lo menos $40 000 por ao. El ingreso medio de teletrabajadores es de

XX

ESTADISTICA

EN LOS NEGOCIOS

$44 000. Casi todos trabajan en impuestos (IT), bienes races o administracin de empresas. Por lo general, estos teletrabajadores viajan en auto unos 30 km para trabajar y se ahorran casi 53 minutos
de tiempo de viaje diarios,estn relativamentesatisfechos con su trabajo. Setenta y cinco por ciento de
quienes trabajan en casa reportaron un aumento cuantificable en productividad y calidad de trabajo
cuando cambiaron de trabajos tradicionales a ser teletrabajadores.Dos tercios de teletrabajadores expresaron mayor satisfaccin en su trabajo y dicen que trabajan ms horas que los no teletrabajadores
pero que su trabajosinterfieren menos con sus vidas personales.

Cambiosde temas
Para dar mayor claridad y destacar temas ms importantes, la cuarta edicin contiene dos nuevos captulos: 1) el capitulo 15, Construccin de modelos de regresin mltiple, un segundo captulo sobre
regresin mltiple y 2) el captulo 12, Anlisis de datos categricos,capitulo sobre pruebas de ji cuadrada de datos categricos. Separar la presentacin de regresin mltiple en dos captulos permite al
instructor la opcin de limitar la exposicin del estudiante a regresin mltiple,al usar slo una introduccin (captulo 14) o explorar ms a fondo y con mayor detalle el anlisis de regresin mltiple mediante el uso de tcnicas de modelacin como es la regresin por pasos y modelos curvilneos (capitulo
15). Las pruebas de ji cuadrada se han extraido del captulo de estadsticasno paramtricas (17), y se
les considera independientesdesde el principio de la cuarta edicin (capitulo 12) por su uso ms amplio en campos como el mercadeo. Adems, para dar ms tiempo para temas clave,un captulo de la
tercera edicin, Nmeros ndice, se ha reducido a una seccin en la cuarta edicin (captulo 16, Pronstico de series de tiempo y nmeros indice). Otras modificaciones en esta edicin incluyen cambiar
las grficas de Pareto y grficas de dispersin al capitulo 2 (Tablas y grficas),cambiar las medidas de
asociacin (coeficiente de correlacin) al Captulo 3 (Estadstica descriptiva),e introducir el sistema
HTABen el captulo 9 (Prueba de hiptesis).

Sistema HTAB y prueba de hiptesis


Para adelantar la nocin de estadsticade negocios en un escenario de toma de decisiones,la cuarta edicin introduce, por primera vez, el sistema HTAB.Mientras que la mayor parte de textos se limitan a
presentar el importante proceso de prueba de hiptesis como un mtodo de ocho pasos, el sistema
HTABreorganiza el procedimiento de prueba de hiptesis en cuatro trabajos principales,dando especial inters en la toma de decisiones en negocios. Las Implicaciones en negocios por accin de prueba
de hiptesis (HTAB, por sus siglas en ingls), Uevanal estudiante por cuatro distintas fases que culminan en una decisin de negocios. El sistema HTABpone inters en determinar qu implicacionesde
negocios, si las hay, resultan de la prueba de hiptesis. Para recalcar ms el inters en la toma de decisiones, la cuarta edicin contiene una presentacin de hiptesis sustantivas dentro de un contexto de
hiptesis de investigacin y estadisticas. Al examinar hiptesis sustantivas,el estudiante aprende a diferenciar entre significancia estadsticae importancia en negocios.

Problemasnuevos
Todos los problemas de la tercera edicin se examinaron respecto a si son oportunos, apropiados, claros y lgicos antes de incluirlosen la cuarta edicin. Los que no cumplieron estos requisitos fueron sustituidos o presentadosde otra forma. Se elaboraron diferentes problemas nuevos en un esfuerzo por
maximizarel aprendizajede los estudiantes. Se actualiz la mayor parte de problemas que tienen valores con base en el tiempo; mientrasque el nmero total de problemas del texto es todavfa alrededor
de 950, se ha hecho un esfuerzo concertado para incluir slo problemas que hacen una aportacin importante al proceso de enseanza.
Todos los problemas de demostracin,as como los problemas de ejemplo,se revisaron en su totalidad y se editaron para mayor eficiencia. Un problema de demostracines un ejemplo extra que contiene
algn problema y su solucin y se utiliza como herramientapedaggica adicional para complementar
explicaciones y ejemplos de los captulos. Prcticamente todos los problemas de ejemplo y demostracin de la cuarta edicin estn orientados a los negocios y contienen la informacin disponiblems actualizada de que se dispone.
Al igual que con la edicin anterior, aparecen problemas al final de casi todas las secciones de los
captulos. Se incluyen numerosos problemas adicionales en la seccin de Problemascomplementarios.

PREFAOO

xxili

Los Problemas complementarios son ejercicios "revueltos" que utilizan las diversas tcnicas descritas en
el captulo, de modo que el estudiante pueda probarse a st mismo su capacidad para discriminar y distinguir ideas y conceptos.

CARACTERSTICAS Y BENEFICIOS
Cada captulo de la cuarta edicin contiene: Objetivos de aprendizaje, un Dilema de decisin, Problemas de demostracin, problemas de seccin, Estadsticas en los negocios de hoy, una seccin En respuesta, y un Resumen del captulo, Trminos clave, Frmulas, Consideraciones ticas, Problemas
complementarios, Anlisis de bases de datos, un caso, Uso de la computadora y Salida de computadora
de Excel 2000 y MlNITAB versin 13.

Objetivos de aprendizaje. Cada captulo inicia con un enunciado de los principales objetivos
de aprendizaje del mismo. ste enunciado provee al lector de una lista de temas clave que se estudiarn y las metas establecidas por el estudio del captulo.

Dilema de decisin. Al inicio de cada captulo, un caso breve describe una situacin real de
alguna compaa o negocio en la que surgen preguntas gerenciales y estadsticas, En la mayor
parte de Dilemas de decisin, se proporcionan datos reales y se pide al estudiante que considere
la forma en que los datos pueden analizarse para contestar las preguntas.

Problemas de demostracin. Prcticamente toda seccin de cada captulo de la cuarta edicin


contiene problemas de demostracin. Un problema de demostracin contiene cierto problema
de ejemplo y su solucin, y se utiliza como herramienta pedaggica adicional para complementar explicaciones y ejemplos.

Problemas de seccin. Hay ms de 950 problemas en el texto. Se encuentran problemas de


prctica al final de casi cada seccin del texto. La mayor parte de problemas utilizan datos reales reunidos de gran variedad de fuentes. Se incluyen aqu algunos extractos de problemas reales
en el texto: "El Wall Street [ournal report que 40% de todos los trabajadores dicen que cambiaran de trabajo por un 'sueldo ligeramente ms alto'. Adems, 88% de las compalas dicen que
escasean de candidatos calificados para el trabajo" "En un estudio realizado por Peter D. Hart
Research Associates para el Nasdaq Stock Market, se determin que 20% de todos los inversionistas en acciones son personas jubiladas. Adems, 40% de los adultos en Estados Unidos han
invertido en fondos mutuos" "Un estudio dirigido por la Northwestern Nacional Life lnsurance
Company deja ver que 70% de trabajadores estadounidenses dicen que el estrs les causa frecuentes problemas de salud". De acuerdo con Padgett Business Services, 20% de todos los
pequeos propietarios de negocios dicen que el consejo ms importante para iniciar un negocio es prepararse para largas horas y trabajo duro. Veinticinco por ciento dicen que el consejo
ms importante es tener listo un buen financiamiento." "De acuerdo con un estudio realizado
por Gateway Computers, 59% de hombres y 70% de mujeres dicen que el peso es un factor extremadamente/(muy) importante en la compra de una computadora porttil".

Estadsticas en los negocios de hoy. Cada captulo de la cuarta edicin contiene un articulo de
Estadsticas en los negocios de hoy. stos se concentran en cajas que contienen una interesante
aplicacin con respecto a la manera en que las tcnicas de ese captulo en particular se emplean
en el mundo de los negocios de hoy. Suelen estar basadas en compaas reales, estudios o investigacin publicada.

En respuesta. Situado al final del captulo, el artculo En respuesta dirige las preguntas gerenciales y estadsticas que aparecen en el Dilema de decisin. Los datos dados en el Dilema de decisin son analizados por computadora con el uso de tcnicas presentadas en el captulo. Se
llega a las respuestas de las preguntas gerenciales y estadsticas del Dilema de decisin al aplicar
conceptos del captulo, con lo cual se cierra.

Resumen del captulo. Cada capitulo concluye con un resumen de los conceptos, ideas y tcnicas importantes del mismo. Este artculo puede servir como vista previa del captulo as como
de repaso.

Trminos clave. Los trminos importantes se escriben en negritas y sus definiciones en cursivas en todo el texto, cuando se citan. Al final de cada captulo se presenta una lista de los trminos clave. Adems, stos aparecen con sus definiciones en un glosario incluido al final del libro.

xx:iv ESTADISTICAEN LOS NEGOCIOS

Frmulas. Las frmulas importantes del texto se resaltan para facilitar su lectura, y al final de
cada captulo la mayor parte de ellas se ponen en lista como prctica consulta.
Consideracionesticas. Cada capitulo contiene un articulo de Consideraciones ticas que es
oportuno dada la gran brecha existente entre tica y falta de liderazgo moral de algunos ejecutivos de negocios en meses recientes. Con la abundancia de datos estadsticos y anlisis, existe
considerable potencial para el mal uso de estadsticas en tratos de negocios. Este articulo recalca
el potencial mal uso al analizar temas como mentir con estadsticas, no satisfacer suposiciones
estadsticas, no incluir informacin pertinente para quienes toman decisiones, y otros temas de
principios. Mediante este artculo, los maestros pueden iniciar por integrar el tema de tica con
aplicacionesde estadsticas en negocios. He aqu algunos cuantos extractos de artculos de Consideraciones ticas:"No es profesional ni tico sacar conclusiones de causa y efecto slo porque
dos variables estn correlacionadas"."El investigadorde negocios necesita dirigir el experimento
en un entorno tal que muchas variables concomitantes sean controladas cuanto sea posible. En
la medida que esto se realice, el investigador tiene una responsabilidad tica de reportar ese
hecho en sus hallazgos.""Se advierte al lector que el valor de lambda se supone constanteen un
experimento de distribucin de Poisson. Los investigadoresde negocios pueden producir resultados falsossi el valor de lambda se usa en todo un estudio; pero como el estudio es dirigido durante diferentes periodos, el valor de lambda est cambiando en realidad." "Al describir un
cuerpo de datos a una audiencia, es mejor usar cualesquiera medidas estadsticasque sean necesarias para presentar una imagen 'completa' de los datos. Al limitar las medidas descriptivas
empleadas, el investigador de negocios puede dar a la audiencia slo parte de la imagen y sesgar la forma en que el receptor comprenda los datos."
Problemascomplementarios.Al final de cada captulo est un extenso conjunto de problemas
adicionales, los cuales estn divididos en tres grupos: Clculo de estadsticas,problemas estrictamente de computacin;Pruebe su comprensin, problemas para aplicacin y comprensin; e
Interpretacin de la salida, que son problemas que requieren la interpretacin y anlisis de las
respuestas del software de computadora.
Anlisisde la base de datos. Hay siete bases de datos principales en el CD-ROM que acompaa a la cuarta edicin. Esta seccin, que aparece al final de captulo, contiene varias preguntas/
problemas que requieren la aplicacin de tcnicasdel capitulo a datos en las variablesde las bases
de datos. Se supone que Ja mayor parte de estas preguntas/problemas se resuelven con el uso de
una computadora.
Caso. Cada caso de fin de captulo est basado en una compaia real. Estos casos dan al estudiante una oportunidadde usar conceptos y tcnicas estadsticos presentados en el captulo para resolver un dilema de negocios. En algunos casos aparecen compaas muy grandes, por
ejemplo: la Shell Oil, Coca-Cola o Colgate-Palmolive.Otros se refieren a pequeos negocios,como Thermatrix,Robotron o DeBourgh, las cuales han superado obstculos para continuar en
operacin y desarrollo. La mayor parte de casos incluyen datos brutos (que tambin se encuentran en el CD-ROM) para anlisis y preguntas que estimulan al estudiante a usar diversas tcnicas presentadas en el capitulo. En muchos casos, el estudiante debe analizar las respuestas y
software de computadora para llegar a conclusiones o tomar decisiones.
Uso de la computadora.La seccin Uso de la computadoracontiene instrucciones para producir la salida de software de Excel2000 y MlNITABversin 13, que se presenta en el captulo. Se
da por hecho que los estudiantes tienen una comprensin general de un entorno Microsoft
Windows. Las instrucciones incluyen notas especificasacerca de las barras de men, mens descendentesy cajas de dilogo. No se estudian todos los detalles de cada caja de dilogo; la intencin es dar suficiente informacin para que el estudiante produzca la misma salida estadstica
analizada y estudiada en el captulo.
Presentacinde la salida del programa Microsoft"Excel y MJNITAB.La cuarta edicin tiene
un fuerte enfoque en los paquetes de software Excely M!NITAB.Se presentan ms de 250 salidas de Excel 2000 y M1NITABversin 13, generadas por computadora. Excel,debido a que es
parte de Microsoft Office,se ha instalado en millones de computadorasen todo el mundo. Casi todos Jos estudiantestienen acceso a Excel en su casa, escuela o trabajo. Por la gran capacidad
de la herramienta de Anlisisde datos y la funcin Paste (pegar), Exceltiene considerable capacidad estadfstica. MINITAB tambin es importante porque ha realizado un excelente trabajo
para mantener el paso con los continuos cambios y demandas de la estadstica en negocios.

PREFAOO
MINlTAB

versin

13, que aparece

en este texto,

cuenta

con

tcnicas

para analizar

XD'

proporcio-

y archivos que incluyen hojas de clculo


mltiples, la capacidad de ejecutar regresin de polinomios, as como presentacin ms clara y

nes, mayores

capacidades

de administracin

de datos

reforzada de herramientas de calidad. Adems, es ms fcil usar la hoja de clculo MINITAB.

Bases de datos. Esta edicin contiene siete bases de datos, las cuales estn en formato Excel y
MlNlTAB listas para usarse. Una base de datos de manufactura, una base de datos financiera,
una base de datos de mercado accionario, una base de datos de empleo internacional, una base
de datos de energa, una base de datos de salud pblica y una base de datos de negocios agrcolas dan ms de 8350 observaciones y 56 variables. Todos los datos son reales y de fuentes confiables que los usuarios reconocern; la U.S. Bureau of Labor Statistics, la Casa de Bolsa de
Nueva York, el U.S. Department of Agriculrure, Moody's Handbook of Common Stocks, la
American Hospital Association, y la U.S. Bureau of the Census. Cuatro de las siete bases de datos
incluyen datos de series de tiempo; una contiene 168 meses de datos de series de tiempo para demostracin y anlisis de tcnicas de pronstico de descomposicin.

MATERIALES AUXILIARES PARA ENSEANZA Y APRENDIZAJE


CD-ROM para estudiantes
Cada ejemplar de la cuarta edicin viene con un CD-ROM para estudiantes. El CD-ROM contiene todas las bases de datos en formatos Excel y MTNITAB para fcil acceso y uso. El CD-ROM tambin contiene archivos de datos Excel y MINITAB de todos los problemas del texto y todos los casos. Los
maestros y estudiantes ahora tienen la opcin de analizar cualquiera de los conjuntos de datos utilizando la computadora. El CD-ROM contiene una versin completa y actualizada del capitulo 19, Anlisis
de decisin, en formato pdf Esto permite al maestro abarcar el material de este capitulo de la manera
acostumbrada, al mismo tiempo que mantiene el texto manejable en tamao y duracin. Adems, el
CD-ROM contiene una seccin a cerca de Tcnicas avanzadas de suavizamiento exponencial (del capitulo 16) que ofrece al maestro una oportunidad para ahondar en el suavizamiento exponencial, si as
lo desea. La deduccin de las frmulas de pendiente e interseccin del capitulo 13 tambin se incluyen
en el CD-ROM, junto con teora didctica sobre sumas.

Material de recursospara el maestro


Todo el material de apoyo para el maestro se incluye en un CD-ROM. En este prctico formato est incluido:
Manual del maestro: preparado por Ken Black, este manual contiene las soluciones a prcticamente todos los problemas del texto. Adems, este manual contiene objetivos de captulo, compendios de captulo, estrategias de enseanza de captulo y soluciones a los casos.
Transparencias de presentacin PowerPoint: las transparencias de presentacin contienen
grficas para ayudar al maestro a crear clases interesantes. Las transparencias PowerPoint 2000
se pueden adaptar con el uso del programa PowerPoint para facilitar su uso en clase.

Banco de pruebas: preparado por Aarn Brown de la Arkansas State University, el Banco de
Pruebas incluye preguntas de opcin mltiple para cada captulo. El Banco de pruebas se presenta en formato Microsoft" Word.

RECONOCIMIENTOS
/ohn Wiley & Sons, Leyh Publishing, y yo agradecemos a los revisores y asesores que se ocuparon en
darnos su excelente consejo e ideas, que empleamos para dar forma y moldear el texto en la cuarta edicin. Estos colegas incluyen a;
Thomas McCullough, University of California-Berkeley
Tade O. Okediji, University of Oklahoma
Michael Panik, Univesity of Hartford

xxvi ESTADSTICA EN LOS NEGOCIOS


Randall K. Russell, Yavapai College
Daniel Shimshak, University of Massachusetts-Boston
Abbas A. Taheri, University of Wisconsin, Fox Valley
Michael Walcott, Faulkner University
Nuestro agradecimiento especial a Aaron Brown, Arkansas State University, quien de nuevo prepar el Banco de pruebas para la cuarta edicin. Como siempre, deseo dar mi reconocimiento a mis colegas en la University of Houston-Clear Lake por su continuo inters y apoyo en este proyecto. En
particular, desea agradecer a William Staples, director; Jim Hays, director y Ted Cumrnings, decano de
la School of Business and Public Administration, por su particular inters en el libro y su apoyo administrativo. Tres miembros de facultad de la School of Business and Public Administration en la UHCL
que me han dado especialmente su ayuda y estmulo en este proyecto son Mike Hanna, Vanee Etnyre y
Lee Revere.
Hay varias personas dentro del grupo John Wiley & Sonsa quienes me gustarla dar gracias por su
invaluable ayuda en este proyecto. Ellos son: Gitti Lindner, gerente de mercadotecnia; Beth Golub, editora ejecutiva; y Susan Elbe, editora de publicaciones. Tambin me gustara dar gracias a Rick Leyh, director de Leyh Publishing, quien visualiz el potencial para este proyecto y ha dado continuo apoyo y
motivacin. Tambin de Leyh Publishing, me gustarla agradecer a Lari Bishop por su sostenido esfuerzo a nombre de este libro, Benjamin Reece por su diaria ayuda en asuntos detallados, y Michele Chancellor y Jennifer Fisher por su fuerte trabajo de produccin.
Deseo expresar especial agradecimiento a mi esposa de 34 aos, Carolyn, quien es el amor de mi
vida y sigue dndome su apoyo profesional y personal en mi escrito. Gracias tambin a mis hijas, Wendi y Caycee, por su paciencia, amor y apoyo.
Ken Black

ACERCA DEL AUTOR

Ken Black es actualmente maestro en Ciencias de decisin en la Escuela de Negocios y Administracin


Pblica de la University of Houston-Clear Lake. Naci en Cambridge, Massachussets y fue criado
en Missouri, obtuvo su titulo de licenciatura en matemticas del Graceland College, titulo de Master en
matemticasde la University ofTexas en El Paso, un Ph.D. en administracinde negocios y ciencia administrativa,y un Ph.D en investigacin educacional de la University of North Texas.
Desde que se uni a la facultad en 1979, el Profesor Black ha dado clases en todos los niveles de
cursos de estadstica, pronsticos, ciencia administrativa, investigacin de mercado y administracin
de produccin/operaciones.Ha publicado quince artculos y ms de veinte ensayos profesionales,asi
como dos textos: Estadistica en Negocios: Curso de Introduccin y Estadistica de Negocios: Toma de
Decisiones Contempornea. El Profesor Black ha sido asesor para numerosas empresas, incluyendo
Atena, City of Houston, NYLCare, AT&T, Johnson Space Center, Southwest lnformation Resources,
Connect Corporation y Eagle Engineering.
Ken Black y su esposa Carolyn tienen dos hijas, Cayceey Wendi. Sus pasatiempos favoritos incluyen tocar guitarra, leer, viajar y participaren competencias atlticas de pista y campo para maestrosas
como salto de longitud.

CAPTULO

Introduccin
a la estadstica
~ ~~ --~
.

'~

OBJETIVOS DE APRENDIZAJE
El objetivo fundamenta] del captulo 1 es introducir al lector al mundo de la estadstica, con lo cual podr:

l. Definir la estadstica.
2. Estar consciente de Ja amplia gama de aplicaciones que tiene la estadstica en los
negocios.
3. Distinguir entre estadstica descriptiva e inferencial.
4. Clasificar nmeros por nivel de datos y comprender por qu es importante hacerlo
as.

~,~: s~t;4;tia de~~Hb~. ei estado de los negocios

):

~--, '.i~.- e:-__ -.;

- ~:

~en la'.zona rural.d


-

.... ~

ta' India ,..

~:ili':2._~-~"

- ----~~-

La India es el segundo pas ms grande del mundo, con ms de mil millones de habitantes. Tres cuartas partes de la poblacin vive en zonas rurales, pero aun asi el mercado rural representa slo alrededor de un tercio de las ventas totales de productos nacionales. No obstante lo anterior, debido a las
reformas de mercado libre que ocurrieron en la dcada de 1990 y a Ja fuerte produccin agrcola, el
mercado rural de la India ha estado ms abierto al comercio en artculos de consumo. Aun cuando
el mercado urbano de la lndia parece estar saturado, los mercados en las zonas urbanas estn relativamente sin explotar, con lo cual ofrecen enorme potencial. Debido a estos factores, numerosas empresas
estadounidenses, por ejemplo Microsoft, General Electric, Kellogg's, y otras, han entrado al mercado de
la India.
En la actualidad, la India rural se puede describir como pobre y con alto ndice de analfabetismo.
Ms de 65% de la poblacin de las zonas rurales gana menos de $574 dlares al ao, y 23% gana entre
$574 y $1 146. Sesenta y seis por ciento de las mujeres son analfabetas, al igual que 38% de los hombres.
Estos porcentajes son casi el doble de los de zonas urbanas. Setenta y siete por ciento de hogares de
zonas rurales usan madera como combustible para cocinar, 39% tienen electricidad, 18% tienen agua
potable y 7% tienen retretes con agua de descarga.
Con todo, las condiciones estn cambiando y estn entrando empresas en este mercado en apariencia no explotado. Por ejemplo, a finales de la dcada de 1990, Colgate-Palmolive plane aumentar
su presupuesto de mercadeo rural a cinco veces ms que en 1991. La meta de esta compaia es que ms
de la mitad de sus ingresos para el ao 2003 provenga de la zona rural de la India, que en la actualidad
constituye slo 30% del negocio.
Las ventas en la India rural son un desafio y se requiere de mtodos no tradicionales porque los
porcentajes de analfabetismo son altos y slo alrededor de un tercio de los hogares tiene televisin. Uno
de estos mtodos es el uso de camionetas tipo Combi, con-sistemas de video en los cuales se presentan
anuncios que en zonas rurales duran media hora. Una de estas camionetas entra en un pequeo poblado con altavoces que reproducen una popular meloda de cine. Cuando los pobladores se acercan al
vehculo, un vendedor abre la puerta y presenta en una pantalla, un video con escenas que describen
la necesidad de un determinado producto. Despus de terminar el video, se distribuyen muestras gratis. Hindustan Lever Ltd., la principal empresa de la India de productos de consumo, estima que el costo
por contacto de este mercadeo es alrededor de cuatro veces ms que el costo a quienes viven en ciudades, pero el mercado rural para productos de cuidado personal est creciendo tres veces ms rpido
que en mercados urbanos, lo cual hace ms viable estos esfuerzos de mercadeo. Otras empresas utilizan campaas de venta de puerta en puerta para promover productos en zonas rurales de la India.
Adems, el advenimiento de televisin por satlite a casas y poblaciones rurales en la India abre algunos medios nuevos para hacer publicidad y mercadeo a este segmento de la poblacin.
Las estadsticas de que se dispone de la primera mitad de la dcada de 1990 arrojaron alguna luz
sobre el mercado potencial de la India rural. El consumo de pasta dentfrica en la India rural se duplic de 8 825 toneladas mtricas en 1990 a 17 023 en 1994. El consumo anual per cpita en pasta dentfrica es todava de 30 gramos por persona en la India rural, en comparacin con los 160 gramos en
zonas urbanas de la India y 400 gramos en Estados Unidos. Por tanto, el potencial para un crecimiento mucho mayor ya est ah. Las ventas para otros productos se han incrementado rpidamente en este
mercado en desarrollo. Las ventas de detergente para lavanderia aumentaron de 272 540 toneladas
mtricas en 1990 a 422 741 toneladas mtricas en 1994. El jabn de tocador aument de 158 919 toneladas mtricas en 1990 a 231 084 toneladas mtricas en 1994. Las ventas de champ aumentaron a casi
cuatro veces, de 497 mil litros a dos millones 116 mil litros en 1994.
La India rural es un enorme mercado que los negocios no han explotado. Algunas evidencias indican que los consumidores de estas regiones de la India estn comprando productos en nmeros crecientes, pero las estadsticas de ingresos muestran una limitada capacidad de compra. El dilema al que
se enfrentan las empresas es entrar a este mercado y, si es as, en qu medida y en qu forma.
3

ESTADISTICA

EN LOS NEGOCIOS

Preguntas gerenciales y estadsticas


l. Qu clases de estadsticasse presentan en este reporte?
2. Son exactos estos datos o estimaciones?
3. Cmo saldran los investigadoresa recabar estos datos?

4. Al medir la India rural como mercado,qu otras estadsticaspodrlan reunirse!


5. Qu niveles de medicin estn representados en estos datos?Si se reunieran otras estadsticas,
qu otros niveles de medicin de datos podran estar representados?
6. Cmo podran los gerentes usar estas estadsticas para tomar mejores decisiones acerca de
entrar a este mercado?
Futnttt adaptado de Raja Ramachandran,"Understanding the Market Envircnment o lndia",Business Horuons. enero 2000.
M1riam Jordn, "ln Rural India, Video VansSell Toothpaste and Shampoo~W1dlStrttt /ournal,10 de enero de 1996. RinlruPegu,
"Maya Buar", Th< l\'..t, 30 de mayo, 1999. hrrp:/lwww.rhe.....Jc.com/99may301bizHtm.

En todo momento en das hbiles, se toman decisiones en empresas en todo el mundo que determinan
si las empresas sern rentables y en crecimiento o si estarn estticas y desaparecern.La mayor parte
de estas decisionesse toman con la asistencia de informacin reunida acerca del mercado, el entorno
econmicoy financiero,la fuerza laboral, la competencia y otros factores.Esta informacinsuele llegar
en forma de datos o est acompaada de ellos. Las estadsticasde negociosson la herramienta mediante la cual estos datos se recolectan,analizan, resumen y presentan para facilitar el proceso de toma de
decisiones.Por tanto, en el siglo XXI, las estadsticas de negociosdesempean un importante papel en
el presenteconjunto de hechos de toma de decisin dentro del dinmico mundo de los negocios.

1.1 LA ESTADSTICA EN LOS NEGOCIOS


Prcticamente todos los aspectos de los negocios utilizan estadsticasen la toma de decisiones.He aqu
algunos ejemplosdel uso de la estadstica en diversos camposde negocios.

El mejor camino al mercado


Un estudio dirigido por Pitney Bowesde 302 directores y vicepresidentesde mercadeo y comunicaciones de mercado,en empresas estadounidenses medianas y grandes,dej ver que casi 35% dijeron que
el correo directo y catlogos eran la forma ms eficiente en costo para llegar a sus clientes. Once por
ciento dijeron que Internet era el de costo ms eficiente. El estudio tambin mostr que ms de 25%
dijeron que la mejor forma de aumentar la identidad de marcas era por correo directo o catlogos.~tas
y otras estadsticasreunidas y resumidas en dicho estudio pueden ayudar a quienes toman decisionesa
resolver el dilema de encontrar vehiculos eficientes en costo para sus productos.

Estrs en el trabajo
Si quienes toman decisiones buscan maneras de reducir gastos de servicio mdico entre sus trabajadores, entonces haran bien en enterarse de un estudio hecho a unos 46 mil empleadosy dirigido por
la Health Enhancement Research Organization.En ste, los investigadores descubrieron que la depresin y el estrs parecen tener mayor impacto en gastos mdicos ms altos que el alto contenido de azcar en la sangre, obesidad o hbito de fumar. El estudio demostr que los trabajadoresdeprimidos
tenan gastos mdicos 70% ms altos que los no deprimidos,y quienes los que decan estar bajo constante estrs tenan gastos 46% ms altos que sus semejantes libres de l. Por otra parte, los gastos
mdicos para personas que sufren de alta presin sangunea eran slo 11 % mayores que los que no
tenian esta enfermedad. Dicha informacin, junto con otras estadsticas reportadas en este estudio,
puede ayudar a quienes toman decisiones para disear una estrategia y reducir gastos mdicos entre
trabajadores.

CAPtruLo 1 INTRODUCCIN A LA ESTAD!ST!CA 5

Decisiones financieras
En un estudio reportado por RHI Management Resources, a los principales oficiales financieros se les
pregunt cul de las siguientes iniciativas pondran en espera en una economa incierta: 1) expansin,
2) fusin o adquisicin, 3) lanzamiento de un nuevo producto o servicio, 4) mejora de tecnologa,
5) ninguno de estos factores, y 6) otro. Treinta y dos por ciento de los encuestados indicaron que pondran en espera sus planes de expansin en una economa incierta, seguida por una fusin o adquisicin
(23%), mejora de tecnologa (18%), lanzamiento de un nuevo producto o servicio (10%), ninguno
(9%) y otro (8%).

Cmo est la economa?


Un informe del Wal/ Street loumal, publicado para ayudar a inversionistas y otras personas que toman
decisiones para averiguar el estado de Ja economa, incluy estadlsticas de negocios como son el nmero de ventas de casas nuevas, un Indice de confianza del consumidor, el aumento en porcentaje en el
producto interno bruto, el nmero de solicitudes iniciales de personas sin trabajo, y el porcentaje de
desempleo. Estas estadsticas, y otras, pueden servir como indicadores de estados econmicos y financieros por venir y quienes hacen pronsticos pueden usarlas cuando tratan de pronosticar futuros climas de negocios. La figura 1.1 es una grfica producida en Excel, del Indice de precios al consumidor
para todos los consumidores urbanos cada cinco aos por los ltimos 40 aos. Los datos fueron publicados por el Federal Reserve Bank en St. Louis.

El impacto de la tecnologa en el trabajo


Greenfield Online dirigi por Internet un estudio de 1 403 encuestados, para la Society of Financia!
Service Professionals, para determinar si los usuarios de tecnologa aprecian los beneficios de la tecnologa ms en 2001 que en 1998. Ochenta y siete por ciento de los encuestados en 2001 dijo que la tecnologa expande el conocimiento relacionado con el trabajo, en comparacin con 54% en 1998.
Ochenta por ciento en 2001 estuvo de acuerdo con que la tecnologa aumenta la productividad durante
las horas normales de trabajo, en comparacin con 66% en 1998. Ochenta por ciento en 2001 respondi
que la tecnologa mejora la comunicacin con clientes, comparada con slo 42% en 1998. Cincuenta y
cuatro por ciento en 2001 dijo que la tecnologa alivia el estrs del trabajo, comparado con slo 26%
en 1998.
En este texto examinaremos diferentes tipos de grficas para representar datos cuando estudiemos
diversas maneras de ordenar o estructurar datos que sean tiles y tengan sentido para quienes toman
decisiones. Aprenderemos las tcnicas para que el muestreo de una poblacin permita realizar estudios
a menor costo y en forma ms oportuna en el mundo de los negocios. Tambin vamos a explorar diversas maneras de pronosticar valores futuros y examinar tcnicas para pronosticar tendencias. Este texto
tambin incluye numerosas herramientas estadsticas para probar hiptesis y para estimar valores de
poblaciones. stas y otras estadsticas interesantes, as como sus tcnicas estadsticas nos esperan en
nuestro viaje por la estadJstica para negocios. Empecemos.

ce de precios
msurnidor
1todoslos
nes urbanos
i0-2000)

:s

ae

140
120
100

o
V
-;

80

60

...,.,.,

40

.s

20

~c.

:;

1960

1965

1970

1975

1980
Ao

1985

1990

1995

2000

ESTADISTICA

EN LOS NEGOCIOS

1.2 CONCEPTOS ESTADSTICOS BSICOS


La estadstica, al igual que muchos otros campos de estudio, tiene su propio lenguaje. Es importante
empezar nuestro estudio con una introduccin de algunosconceptos bsicos para comprender el tema
y comunicamos. Empecemos con un anlisis de la palabra estadstica, que tiene varios significados diferentes en nuestra cultura. El Webster's Third New /nternational Dictionary da una definicin completa
de estadstica como una ciencia que se refiere a la acmnulacin, anlisis, interpretacin y presentacin de
datos numricos. Vista desde esta perspectiva,la estadsticaincluye todos los temas presentados en este
texto; tambin es una rama de las matemticas y la mayor parte de la ciencia estadstica est basada en
pensamiento y deduccin matemticos. Muchos campos acadmicos,incluyendo el de negocios, ofrecen cursos de estadsticadentro de sus propias disciplinas;sin embargo,la estadstica se ba convertido
en un curso de estudio por derecho propio.
Es frecuente que algunas personas se refieran a la palabra estadstica como un grupo de datos.
Pueden decir,por ejemplo, que han reunido estadsticas de la operacin de su negocio. A lo que se refieren es a datos y cantidades medidas. Los medios de comunicacinusan la palabra estadstica para referirse a una muerte; ser una estadstica en este sentido de la palabra es obviamente indeseable.
La palabra estadstica se usa en por lo menos otras dos formas importantes;primera, puede ser un
conjunto de medidas descriptivas calculadas de una muestra y empleadas para hacer determinaciones
acerca de una poblacin. Este uso se estudia ms adelante en este libro; segunda, pueden ser las distribuciones empleadas en el anlisis de datos. Por ejemplo, un investigador que utiliza la distribucin t
para analizar datos puede referirse al empleo del estadstico tal analizar los datos.
Los siguientes son algunos de los usos comunes de la palabra estadstica.
l. Ciencia que rene, analiza, interpreta y presenta datos.

2.
3.
4.
5.
6.
7.

Rama de las matemticas.


Curso de estudio.
Datos y cifras.
Una muerte.
Medicin de muestra.
Tipo de distribucin empleada para analizar datos.

El estudio de la estadstica se puede organizar en diversas formas. Una de las principales es subdividirla en dos ramas: estadstica descriptiva y estadstica inferencia!. Para comprender la diferencia
entre estadstica descriptiva e inferencia!, son tiles las definiciones de poblacin y de muestra. El
Webster's Third New Intemational Dicrionary define poblacin como 1111 conjunto de personas; objetos o
artculos de inters. La poblacin puede ser una categora ampliamente definida,por ejemplo "todos los
automviles" o puede ser estrechamente definida, como "todos los autos Ford Mustang producidos de
1998 a 2002". Una poblacin puede ser un grupo de personas, por ejemplo "todos los trabajadores
actualmente empleados por Microsoft",o puede ser un conjunto de objetos, como "todas las lavadoras
producidas el 3 de febrero de 2003, por la General Electrc Company en la planta de Louisville". El
investigador define a la poblacin como cualquier cosa que estudie. Cuando los investigadoresre11en
datos de toda la poblaci11 para una medida de inters determinada, la Uaman censo. Casi todos estamos
familiarizados con el censo de Estados Unidos. Cada 10 aos, el gobierno trata de medir toda la poblacin que vive en este pas. Si un investigador est interesado en averiguar las calificaciones de la
Scholastic AptitudeTest (SAT) de todos los estudiantes de la Universityof Arizona, una forma de hacerlo es llevar a cabo un censo de todos los estudiantesque en la actualidad se encuentren inscritos en esa
universidad.
Una muestra es una parce del conjunto y, si se toma adecuadamente,es representativa del conjunto. Por varias razones (que se explican en el captulo 7), los investigadoresa veces prefieren trabajar con
una muestra de la poblacin en lugar de toda la poblacin. Por ejemplo, al realizar experimentos de
control de calidad para determinar el promedio de vida til de bombillas elctricas, un fabricante
de bombillas podra muestrearal azar slo 75 bombillas durante un lote de produccin.Debido a limitaciones de tiempo y dinero, un gerente de recursos humanos podra tomar una muestra al azar de 40
empicados en lugar de usar un censo para medir el estado de nimo de la compaa.
Si un analista de negocios 11tiliw los datos que ret11e 1m grnpo para describir o llegar a condusiones
acerca de ese mismo grupo, la estadstica se llama estadstica descriptiva. Por ejemplo, si un maestro

CAPITULO 1 INTRODUCCIN A LA ESTADISTICA 7

produce estadsticas para resumir el esfuerzo de examen de un grupo y las emplea para llegar a conclusiones acerca de slo ese grupo, las estadsticas son descriptivas. El maestro puede usar estas estadsticas para analizar el promedio del grupo, hablar acerca de los mrgenes de calificaciones del grupo,
o presentar cualesquiera otras medidas de datos para el grupo con base en la prueba.
La mayor parte de estadsticas deportivas, por ejemplo promedio de bateo, rebotes y primer down
son estadsticas descriptivas porque se usan para describir el esfuerzo de un individuo o de un equipo.
Muchos de los datos estadsticos generados por negocios son descriptivos. Podran incluir el nmero
de empleados en vacaciones durante el mes de junio, el promedio de salario en la oficina de Denver,
ventas corporativas para 2002, promedio de calificacin de satisfaccin gerencial sobre un censo de las
actitudes de los empleados en la compaa y el promedio de rendimientos sobre inversin para la
Lofton Company entre 1988 y 2002.
Otro tipo de estadlstica se denomina estadstica inferencial. Si un investigador rene datos de 11na
muestra y utiliza la estadstica generada para llegar a conclusiones acerca de la poblacin de la cual se toma
la muestra, la estadstica es inferencial. Los datos reunidos se emplean para inferir algo acerca de un
grupo ms grande. Las estadsticas inferenciales se conocen a veces como estadsticas inductivas. El uso
e importancia de la estadstica inferencia! contina en crecimiento.
Una aplicacin de estadstica inferencia! es en investigacin farmacutica. La produccin de algunos medicamentos nuevos es costosa para producirlos, por tanto las pruebas deben estar limitadas a
muestras pequeas de pacientes. Con el uso de La estadstica inferencial,los investigadores pueden disear experimentos con pequeas muestras de pacientes seleccionadas al azar y tratar de llegar a conclusiones y hacer inferencias acerca de la poblacin.
Los investigadoresde mercados utilizan estadistica inferencia! para estudiar el impacto de la publicidad en diferentes segmentos del mercado. Supongamos que una empresa fabricante de bebidas gaseosas crea un anuncio publicitario que representa una mquina despachadora que habla al comprador y
los investigadores de mercado desean medir el impacto del nuevo anuncio en varios grupos de edades.
El investigador podra estratificar la poblacin en categoras de edades que van de jvenes a viejos,
muestrear al azar cada estrato y usar estadstica inferencial, para determinar la efectividad del anuncio
para los diversos grupos de edades de la poblacin. La ventaja de usar estadstica inferencia! es que
hace posible que el investigador estudie efectivamente una amplia gama de fenmenos sin tener que llevar a cabo un censo. La mayor parte de los temas estudiados en este texto pertenecen a estadstica inferencial,
Una medida descriptiva de la poblacin se denomina parmetro. Por lo general los parmetros se
denotan con letras griegas. Ejemplos de parmetros son media poblacional (.), varianza poblacional
(cr2), y desviacin estndar de poblacin (o), Una medida descriptiva de una muestra se llama estadstico y suelen denotarse con letras romanas, como la media muestra! (X), varianza muestra! (s2), y desviacin estndar muestra! (s).
La diferenciacin entre los trminos parmetro y estadstico es importante slo con el uso de la
estadstica inferencial. Un investigador de negocios a veces desea estimar el valor de un parmetro o
realizar pruebas acerca del parmetro. Sin embargo, el clculo de parmetros por lo general es imposible o no factible debido al tiempo y dinero necesarios para llevar a cabo un censo. En tales casos, el
investigador de negocios puede tomar una muestra al azar de la poblacin, calcular un estadistico en la
muestra, e inferir por estimacin el valor del parmetro. La base para la estadstica inferencial, entonces, es la capacidad para tomar decisiones acerca de parmetros sin tener un censo completo de la
~K~

Por ejemplo, un fabricante de mquinas lavadoras probablemente desea determinar el nmero


promedio de cargas que una mquina nueva puede lavar antes que necesite reparaciones. El parmetro
es la media poblacional o nmero promedio de lavadas por mquina antes de reparaciones. Un experto en estadstica de una compaia toma una muestra de mquinas, calcula el nmero de lavadas antes
de reparar por cada mquina, promedia los nmeros y estima el valor poblacional o parmetro con el
uso de la estadstica, que en este caso es el promedio muestral, La figura 1.2 demuestra el proceso inferencial,
Las inferencias acerca de parmetros se realizan bajo incertidumbre. A menos que los parmetros
se calculen directamente de la poblacin, el experto en estadstica nunca sabe con certeza si los estimados o inferencias hechos a partir de muestras son verdaderos. En un esfuerzo por estimar el nivel de
confianza en el resultado del proceso, los estadsticos usan expresiones de probabilidad. Por tanto, parte
de este texto est dedicado a la probabilidad (captulo 4).

ESTADISTICA EN LOS NEGOCIOS

ifilfli
Proceso de
estadstica
inferencia! para
estimar la media
poblacional()

Poblacin

Muestra

(parmetro)

(estadstica)

Seleccionar
una muestra
al azar

1.3 MEDICIN DE DATOS


Millones de datos numricos se captan todos los das en negocios, los cuales representan miles de artculos. Por ejemplo, los nmeros representan costos en dlares de artculos producidos, lugares geogrficos de establecimientos de venta al menudeo, pesos de embarques y clasificaciones de
subordinados en revisiones anuales. Todos estos datos no deben ser analizados de la misma manera
estadstica porque las'entidades representadaspor los nmeros son diferentes. Por esta razn, el investigador de negocios necesita saber el nivel de medicin de datos representado por los nmeros que se
analicen.
El uso dispar de nmeros se puede ilustrar con los nmeros 40 y 80, que podrian representar los
pesos de dos objetos que se embarcan, las clasificacionesrecibidas en una prueba al consumidor por
dos productos diferentes,o los nmeros en la camiseta de un equipo de ftbol de un defensa y un
receptor abierto. Aun cuando 80 libras es el doble de 40 libras, es probable que el receptor abierto no
sea del doble del tamao del defensa. Promediar los dos pesos parece razonable pero promediar los
nmeros de las camisetas en ftbol no tiene sentido. Lo correcto del anlisis de datos es que depende
del nivel de medida de los datos recolectados. El fenmeno representado por los nmeros determina el
nivel de medicin de datos. A continuacin veamos cuatro niveles comunes de medicin de datos.
l. Nominal
2. Ordinal
3. Intervalo
4. De razn

Nivel nominal
El nivel ms bajo de medicin de datos es el nivel nominal.Los nmeros que representan datos de nivel
nominal (la palabra nivel se omite a veces) se puede usar slo para clasificar o asignar categoras. Los
nmeros de identificacin de empleados son un ejemplo de datos nominales. Los nmeros se emplean
slo para diferenciar empleados y no para hacer una exposicin del valor de ellos. Numerosas preguntas demogrficasde estudios resultan en datos que son nominales debido a que las preguntasse emplean
slo para clasificacin. El siguiente es un ejemplo de esta pregunta que resultara en datos nominales:
Cul de las siguientes clasificacionesde empleo describe mejor su campo de trabajo?
a) Educador
b)
e)
d)
e)
f)

Trabajador de la construccin
Trabajador de manufacturas
Abogado
Doctor
Otro

Supongamos que, para fines de cmputo, a un educador se asigna un 1, a un trabajador de la construccin un 2, a un trabajador de manufacturas un 3, y as sucesivamente. Estos nmeros deberan

CAPITULO

INTRODUCCIN

A LA ESTADISTICA

usarse slo para clasificar personas que respondieron la encuesta. El nmero J no denota la clasificacin ms alta. Se usa slo para diferenciar un educador (1) de un abogado (4).
Algunos otros tipos de variables que con frecuencia producen datos de nivel nominal son el sexo,
religin, grupo tnico, ubicacin geogrfica y lugar de nacimiento. Los nmeros de seguro social,
nmeros telefnicos,nmeros de identificacin de empleados y nmeros de cdigo postal son ejemplos adicionales de datos nominales. Las tcnicas estadsticas que son apropiadaspara analizar datos
nominales son limitadas, no obstante algunas de las estadsticas ms empleadas,por ejemplo la estadstica ji cuadrada, se puede aplicar a datos nominalesque producen informacintil.

Nivel ordinal
Una medicin de datos de nivel ordinal es ms alta que el nivel nominal. Adems de las posibilidades
del nivel nominal, la medicin de nivel ordinal se puede usar para clasificar u ordenar objetos. Por
ejemplo, con el uso de datos ordinales,la supervisora puede evaluar tres empleadosal clasificar su productividad con los nmeros del J al 3. Con datos ordinales,la supervisora podria identificar al empleado ms productivo, al menos productivo y a quien est entre los anteriores. No obstante, el
supervisorpodra no usar datos ordinales para establecer que son igualeslos intervalosentre los empleados clasificados1 y 2 y entre los empleados clasificados2 y 3; esto es, ella podra no decir que las diferenciasen la cantidad de productividad entre los trabajadores clasificados 1, 2 y3 son necesariamente
las mismas. Con datos ordinales, las distancias o separacin representadas por nmeros consecutivos
no siempre son iguales.
Algunas escalasdel cuestionario tipo Likert son consideradas por muchos investigadorescomo de
nivel ordinal. El siguiente es un ejemplo de una de estas escalas:

Este material didctico de computadora es:


no
til

poco
til
2

moderadamente
til
3

muy
til
4

extremadamente
til
5

Cuando esta pregunta de estudio se codifica para la computadora,slo permanecern los rimeros del 1 al 5, no los adjetivos. Prcticamentetodos estarn de acuerdo con que 5 es ms alto que 4 en
esta escala y que es posible clasificar las respuestas,pero la mayoria de quienes responden a la encuesta no considerarlan como iguales las diferencias entre no til, un poco til, moderadamente til, muy
til y extremadamente til.
Los fondos mutuos como inversionesse clasificana veces en trminos de riesgo al usar medidas de
riesgo por incumplimiento,monetario y de tasas de inters. Estas medidasde riesgo se aplican a inversionescuando se clasificancomo de alto, medio y bajo riesgo.
Ahora bien, si al alto riesgo se le asigna un 3 de calificacin,al riesgo medio 2 y al bajo l; por otra
parte, si a un fondo se le asigna 3 en lugar de 2, lleva ms riesgo,y asl sucesivamente.No obstante,las
diferencias en riesgo entre las categorias 1, 2 y 3 no son necesariamenteiguales,por lo que estas medidas de riesgo son slo medidas de nivel ordinal. Otro ejemplo del uso de nmerosordinales en negocios es la clasificacin de las 50 compaas ms admiradas en la revista Fort11ne. Los nmeros que
clasifican a estas empresas son slo ordinales en su medicin.Ciertas tcnicas estadsticasson especialmente apropiadas para datos ordinales pero otras muchas no son apropiadas para usarse en este tipo
de datos.
Debido a que los datos nominales y ordinalesse deducen a vecesa partir de mediciones imprecisas, como las preguntasdemogrficas,la categorizacinde personas u objetos,o la clasificacinde artculos, los datos nominale.s y ordinales son datos no mtricos y a veces se conocen como datos
cualitativos.

Nivel de intervalo
La medicin de datos de nivel de intervaloes el siguiente al nivel ms alto de datos en el qut las distancias entre nmeros consecutivos tienen significado y los datos son siempre n11mricos. Las distancias representadas por las diferencias entre nmeros consecutivos son iguales; esto es, los datos de intervalo
tienen intervalos iguales. Un ejemplo de medicin de intervalo es la temperatura Fahrenheit. Coa
nmeros de temperatura Fahrenheit, las temperaturas se puedan clasificar y las cantidades de calor
entre lecturas consecutivas, por ejemplo 20, 21 y 22, son las mismas.

~~~~~~~----"======================!!!!!!!!!'!!!!!!!!!!'!!!!!!!!!!'!!!!!!!!!!'!!!!!!!!m--------------~
10 ESTADISTICA EN WS NEGOCIOS

Adems,con datos de nivel de intervalo, el punto cero es un asunto de convencin o conveniencia


y no un punto cero natural o fijo. El cero es slo otro punto en la escala y no significaausencia del fen-

meno. Por ejemplo, cero grados Fahrenheit no es la temperatura ms baja posible. Algunos otros ejemplos de datos de nivel de intervalo son el porcentaje de cambio en empleo, el porcentaje de rendimiento
de una accin financiera, y el cambio en dlares en el precio de acciones.
Con datos de nivel de intervalo, convertir las unidades de una medicin a otra implica multiplicar
por algn factor, a, y sumar otro factor, b, tal que y = b + ax. Como ejemplo, convertir de temperatura en centgrados a temperatura Fahrenheit hace necesaria la relacin:
Fahrenheit

32 +

centgrados

Nivel de razn
La medicin de datosde nivelde razn es el nivel ms alto de medicin de datos. Los datos de razn tienen las mismas propiedades que los datos de intervalo pero los datos de razn tienen un cero absoluto y
la razn entre los dos nmeros es significativa. La nocin de cero absoluto significa que cero es fijo, y el
valor cero en los datos representa la ausencia de la caracterlstica en estudio. El valor de cero no se puede
asignar en forma arbitraria porque representa un punto fijo. Esta definicin hace posible que el experto
en estadstica pueda crear razones con los datos.
Ejemplos de datos de razn son la altura, peso, tiempo. volumen y la temperatura Kelvin. Con
datos de razn, un investigador puede expresar que 180 libras de peso es el doble que 90 libras, o bien,
en otras palabras hacen una razn de 180:90. Muchos de los datos capturados por mquinas en la
industria son datos de razones.
Otros ejemplos en el mundo de los negocios, que son nivel de razn en mediciones, son el tiempo
de ciclo de produccin, tiempo de medicin de un trabajo, millas pasajero, nmero de camiones vendidos, quejas por 1 O mil volantes, y nmero de empleados. Con datos de nivel de razn, no se requiere
del factor b para convertir unidades de una medicin a otra, esto es, y = ax. Como un ejemplo, al convertir altura de yardas a pies: 1 pie = 3 yardas.
Debido a que los datos de nivel de intervalo y de razn suelen ser capturados por instrumentos
precisos que con frecuencia se emplean en procesos de produccin e ingeniera,en pruebas de estndares nacionales, o en procedimientos estandarizados de contabilidad, se denominan datos mtricos y
a veces se conocen como datos cuantitativos.

Comparacinde los cuatro niveles de datos

ifiilii
Uso del potencial
de varios niveles de
datos

La figura 1.3 muestra las relaciones del potencial de uso entre los cuatro niveles de medicin de datos.
Los cuadros concntricos denotan que cada nivel ms alto de datos puede ser analizado por cualquiera de las tcnicas empleadas en niveles inferiores de datos pero, adems, puede ser utilizado en otras
tcnicas estadsticas. Por tanto, los datos de razn pueden ser analizados por cualquier tcnica estadstica aplicable a los otros tres nivelesde datos ms algunas otras.
Los datos nominales son los ms limitados en trminos de anlisis estadsticos que se utilicen con
ellos. Los datos ordinales permiten al investigador realizar cualquier anlisis que se pueda elaborar
con datos nominales y algunos anlisis adicionales. Con datos de razn, es posible para un experto en
estadstica hacer comparaciones de razn y apropiadamente realizar
cualquier anlisis posible en datos nominales, ordinales o de intervalo. Algunas tcnicas estadsticas requieren de datos de razn y no
se pueden usar para analizarotros niveles de datos.
De intervalo
Las tcnicas estadsticas pueden separarse en dos categoras:
estadisticas paramtricas y estadsticas no paramtricas. Las estadsticas paramtricasrequieren que los datos sean de intervalo o de
razn. Si los datos son nominales u ordinales,deben usarse estadsticas no paramtricas.Las estadisticas no paramtricas tambin se
pueden usar para analizar datos de intervalo o de razn. Este texto
se concentra principalmente en estadsticas paramtricas, con
excepcin los capitulo 12 y 17, que contienen tcnicas no paramtricas. Por tanto, buena parte del material de este texto requiere que
los datos sean datos de intervalo o de razn.

E]

CAPITULO 1

INTRODUCCIN A U\ ESTAD!SnCA

11

Continan presentndose muchos cambios en la industria de la salud. Debido a que hay mayor
competencia por atender pacientes entre proveedores y la necesidad de determinar la forma en
que stos pueden servir mejor a sus clientes, administradores de hospitales a veces envan por
correo una encuesta de satisfaccin de calidad a sus pacientes despus que stos son dados
de alta. Los siguientes tipos de preguntas se formulan a veces en las encuestas. En qu nivel de
medicin de datos resultarn estas preguntas?
1. Hace cunto tiempo que se dio de alta del hospital?

2. En qu tipo de unidad estuvo la mayor parte de su estancia?


atencin coronaria
cuidados intensivos
maternidad
unidd mdica
unidad peditrica
unidad de ciruga

3. Al seleccionar un hospital, qu tan importante fue la ubicacin del mismo?


!Circule uno)
Muy
importante

Poco
importante

No muy
importante

Nada
importante

4. Qu tan grave era su estado de salud cuando fue ingresado al hospital?


_menor
_crtica
_grave
_moderada
5. Clasifique la capacidad de su mdico:
_excelente

_buena

_muy buena

_regular

_mala

6. En la siguiente escala de uno a siete, clasifique la atencin de enfermeras:


Mala

Excelente

Soluci6n
La pregunta 1 es una medicin de tiempo con cero absoluto y por tanto es una medicin de nivel
de razn. Una persona que ha estado fuera del hospital durante dos semanas lo ha estado el
doble de tiempo que alguien que ha estado fuera slo una semana.
La pregunta 2 rinde datos nominales porque al paciente se le pide slo categorizar el tipo de
unidad en que l o ella estuvieron. Esta pregunta no requiere jerarqua o clasificacin del tipo
de la unidad. Es probable que las preguntas 3, 4 y 5 resulten en datos de nivel ordinal. Supongamos que se asigna un nmero a los descriptores en cada una de estas tres preguntas. Para la
pregunta 3, a "muy importante" podra asignarse un 4, a "poco importante" un 3, a "no muy
importante" un 2, y a "nada importante" un 1. Ciertamente, cuanto ms alto el nmero, ms importante es la ubicacin del hospital. Por tanto, estas respuestas se pueden clasificar por seleccin. No obstante, los aumentos en importancia de 1 a 2 a 3 a 4 no son necesariamente iguales.
Esta misma lgica se aplica a los valores numricos asignados en las preguntas 4 y 5.
La pregunta 6 muestra siete opciones numricas con iguales distancias entre los nmeros
mostrados en la escala, y no se asignan adjetivos descriptivos a los nmeros. Muchos investigadores diran que esto es una medicin de nivel de intervalo debido a la distancia igual entre
nmeros y la ausencia de un cero verdadero en esta escala. Otros investigadores podran argir
que por la imprecisin de la escala y lo vago de los valores de seleccin entre "malo" y "excelente", la medicin es slo ordinal en su nivel.

Anlisis estadstico usandola computadora: Excel y MINITAB


El advenimiento de la computadora moderna abri numerosas y nuevas oportunidades para el anlisis estadstico. La computadora permite almacenar, recuperar y transferir grandes conjuntos de datos.
Adems, el programa de la computadora se ha perfeccionado para analizar datos por medio de refinadas
tcnicas estadsticas. Algunas de las tcnicas estadsticas ampliamente usadas, por ejemplo la regresin
mltiple, son tan tediosas y lentas de calcular en forma manual que fueron de poco uso prctico para
investigadores antes de que se perfeccionaran las computadoras.

12

ESTADISTICA EN LOS NEGOOOS

Los expertos en estadstica de negocios emplean muchos de los populares paquetes de software de
estadstica, incluyendo el M!NJTAB, SAS y SPSS. Muchos paquetes de software de hojas de clculo
de computadora tambin tienen capacidad de analizar datos estadlsticamente. En este texto, la salida
estadstica de computadora presentada es del MIN!TABy del software Microsoft Excel.

La estadsticadescribe el estado de los negocios


. en zonas ruralesde la India
En el Dilema de decisin, muchas estadsticas se reportaron acerca de la India rural, su potencial como
mercado, y de sus ventas. Se report el promedioanual de consumo de pasta dentfrica por persona. Se
dan porcentajes que describen caractersticas demogrficas de la India rural, incluyen porcentajes de
analfabetismo y posesin de comodidades domsticas. Los autores de las fuentes de donde se tomaron
datos del Dilema de decisin nunca expresan si las cifras son en realidad tomadas de un censo de poblacin o son clculos tomados de una muestrade estas personas. Si las cifrasprovienen de un censo, entonces los totales, promedios y porcentajes presentados en el Dilema de decisin son parmetros.Debido a
que el gobierno a veces lleva a cabo censos, estos datos podran ser parmetros.No obstante, con ms
frecuencia, se recolectan datos de muestras de personas o cosas.
En muchos pases, los investigadores tienen la posibilidad de reunir datos tiles y relativamente
precisos al tomar una muestrabien planeada que es representativa de la poblacin. Los datos resultantes son analizados y producen estadsticas que, a su vez, se pueden usar para estimar parmetros de
poblacin. Este proceso es inferencia!. Diversas razones haran preferible el uso de un proceso inferencia! a llevar a cabo un censo. En el capitulo 7 vamos a explorar el uso del muestreo con mayor detalle.
En esta situacin particular, para hacer ventas en zonas rurales de la India, los investigadores podrlan ser enviados a regiones representativas de la India rural y realizar un estudio de consumidores
acerca de su estado econmico, posesiones, caracterlsticas personalesy familiares,usos de consumo de
productos y su voluntad para expandir sus compras. Podra reunirse una amplia variedad de estadsticas que representen varios niveles de datos. Por ejemplo, podrlan obtenerse mediciones de nivel
de razn de cosas como el ingreso, nmero de hijos, edad del padre de familia, nmero de cabezas de
ganado, valor de su casa o tierras, y gramos de pasta dentlfrica consumida por ao. En algunos ejemplos, se usan escalas Likert (mediciones de 1 a 5) para obtener respuestas acerca de intereses y cosas

;m.1mw1HflllHiil}l.11.1 ._

_,

Crece el uso de la comunicacin inalmbricaen Estados Unidos


Segn un estudio semestral de la industria de comunicaciones de la Cellular Telecommunications & Internet Association, ms de 11 O millones de clientes en Estados Unidos
usaron telfonos celulares en el ao 2001. Esta cifra represent un crecimiento de casi 28% desde que termin 1999.
No slo hubo ms personas que usaron aparatos inalmbricos, sino que tambin lo hicieron con ms frecuencia. El
promedio de duracin de una U amada en 2001 fue de 3
minutos en comparacin con 2 minutos y 38 segundos al
trmino de 1999.El promedio de la cuenta mensual por el
uso del inalmbrico,que refleja este aumento en uso, pas
de $41.24 a $45.27 en el mismo periodo de un ao.
Los ingresos totales para empresas operadoras de inalmbricos en Estados Unidos llegaron a $50 mil millones
para el afio 2000. Los ingresos por roaming (unidad fuera de

rea asignada) bajaron, lo cual refleja la continua expansin


de la red. A medida que las empresas de telefonla expanden
sus territorios cubiertos, los ingresos por roaming bajan
porque los usuarios estn en la red con ms frecuencia.
Qu pasar con el uso del inalmbricoen el futuro?A
medida que el mercado sea ms maduro, se nivelar su
uso? Factores como la preocupacin por la seguridad
pblica, leyes para conductores de vehculos,seguridad personal o los debates de etiqueta podrn contener el uso de
aparatos inalmbricos? stas y otras preguntas se pueden
manejar mediante la recoleccin y anlisis de estadsticas
para negocios.
Futnt~ adaptado de "No Slump in U.S. Wireless Usage"; al/NetDil-ica, 27
April 2001, http://www.allnetdevicu.com/wirelesslnews/2001
/04/27/
no_slump.html

CAPITULO 1

INTROOUCCIN A LA ESTADISTICA

13

CONSIDERACIONES TICAS
Con la abundancia y proliferacin de datos estadsticos, el mal uso de la estadstica en el manero
de negocios es un problema. Es, en efecto, un comportamiento no tico en negocios, emplear
estadlsticas fuera de contexto. Las personas no ticas en negocios podran usar slo datos selectivos de estudios para subrayar su punto de inters, omitiendo estadsticas de los mismos estudios que discuten contra su caso. Los resultados de estudios estadsticos se pueden expresar mal
o exagerar para ganar un favor.
En este capitulo se hizo notar que si los datos son nominales u ordinales, entonces slo estadsticas no paramtricas son apropiadas para su anlisis. El uso de estadsticas pararntricas para
analizar datos nominales y/u ordinales es errneo y podra ser considerado bajo algunas circunstancias como no tico.
En este texto, cada captulo contiene una seccin sobre tica que analiza la forma en que los
negocios pueden dar mal uso a las tcnicas presentadas en el captulo en una forma no tica.
Como usuarios y productores, los estudiantes de administracion de negocios necesitan estar
conscientes de potenciales problemas ticos que pueden ocurrir con la estadstica.

semejantes, con lo cual se produce un nivel ordinal de mediciones. Por razones de privacidad, algunos
temas de preguntas como la edad o ingreso se expresan en rangos de clase que tambin resultan en un
nivel ordinal de medicin. Adems, a los habitantes de zonas rurales de la India se les puede pedir que
clasifiquen diversos productos en trminos de cules serla ms probable que compraran, lo que darla
datos ordinales. Otras variables como son la ubicacin geogrfica, afiliacin a un partido poltico, ocupacin y religin resultaran en datos nominales.
La decisin para entrar al mercado de la India rural no es slo una decisin de mercadeo. Comprende la capacidad de produccin y problemas de fechas de entrega, dificultades en transportes,
compromisos financieros, crecimiento gerencial o reasignacin, problemas de contabilidad (la contabilidad para la lndia rural puede diferir de las tcnicas empleadas en mercados tradicionales), sistemas
de informacin y otros campos relacionados. Con tanto en la lnea, quienes toman decisiones en la
compaia necesitan tanta informacin relevante disponible como sea posible. En este Dilema de decisin, es obvio para quien tome decisiones que la lndia rural es todava muy pobre y analfabeta. Su capacidad como mercado es grande. Las estadlsticas en las crecientes ventas de algunos productos de
cuidado personal parecen promisorias. Cules son los pronsticos futuros para el poder adquisitivo
del pueblo en la India rural? Problemas culturales importantes bloquearn la adopcin de los tipos de
productos que las compaas desean vender al? Las respuestas a stas y muchas otras interesantes y
tiles preguntas se pueden obtener con el correcto uso de la estadlstica. Los 750 millones de personas
que viven en la India rural representan el segundo grupo ms grande de personas en el mundo.
Ciertamente, es un segmento de mercado digno de ms estudio.

RESUMEN
La estadstica es una importante herramienta para Ja toma de
decisiones en negocios y se utiliza en prcticamente todos los
campos de negocios. La palabra estadlstica tiene muchas connotaciones. Entre los significados ms comunes de la palabra
estn: 1) la ciencia que rene, analiza, interpreta y presenta
datos, 2) una rama de las matemticas, 3) un curso de estudio,
4) datos y cifras, 5) una muerte, 6) medicin de muestra y
7) tipo de distribucin empleada para analizar datos. Las estadisticas se utilizan ampliamente en negocios e incluye las
disciplinas de contadura, ciencias de toma de decisiones, economa, finanzas, administracin, sistemas de administracin de
informacin, mercadeo y produccin.

El estudio de estadsticas puede subdividirse en dos categoras principales: estadstica descriptiva y estadlstica i11ferencial. La estadstica descriptiva resulta de recolectar datos de un
cuerpo, grupo o poblacin y llegar a conclusiones slo acerca
de ese grupo. La estadstica inferencia! se genera a partir del
proceso de recolectar datos muestrales de un grupo, cuerpo o
poblacin y llegar a conclusiones acerca del grupo ms grande del cual se tom la muestra.
El tipo apropiado de anlisis estadlstico depende del nivel
de medicin de datos, que puede ser 1) nominal, 2) ordinal,
3) i11tervalo o 4) de razn. El nominal es el nivel ms bajo, que
representa la clasificacin de slo datos tales como la ubica-

14

ESTADISTICA

cin

geogrfica,

nivel es ordinal,

EN LOS NEGOCIOS
sexo o nmero
que produce

de seguro

mediciones

social.

El siguiente

de ordenamiento

de

razn a veces se llaman mtricos o datos cuantitativos. Los


datos nominales y ordinales a veces se conocen como daros no

rango en el que los intervalos entre nmeros consecutivos no

mtricos o cualitativos.

necesariamente representan distancias iguales. El de intervalo


es el siguiente nivel ms alto de medicin de datos en el que
las distancias representadas por nmeros consecutivos son
iguales. El nivel ms alto de medicin de datos es el de razn,
que tiene todas las cualidades de medicin de intervalo, pero
los datos de razn contienen un cero absoluto y las razones
entre nmeros tienen significado. Los datos de intervalo y de

Los tipos principales de estadstica inferencia! son 1) esta110 paramtrica. El uso de


estadstica paramtrica requiere datos de intervalo o de razn
y ciertas suposiciones acerca de la distribucin de los datos.
Las tcnicas presentadas en este texto son principalmente
paramtricas. Si los datos son slo nominales u ordinales en
nivel, deben usarse estadsticas no paramtricas.

dstica paramtrica y 2) estadstica

TRMINOSCLAVE
censo

datos de nivel ordinal

estadstica descriptiva

datos a nivel de intervalo

datos mtricos

estadstica inferencia!

muestra

datos a nivel de razn

datos no mtricos

estadsticos

parmetro

datos de nivel nominal

estadstico

estadstica no paramtrica

poblacin

estadlstica paramtrica

PROBLEMAS COMPLEMENTARIOS
1.1 D un ejemplo especifico de los datos que podran ser
reunidos de cada una de las siguientes disciplinas de

b. El nmero de cuarto de galn de leche que una fami-

negocios: contadura, finanzas, recursos humanos. rnercadotecna, sistemas de informacin, produccin y admi-

c. La clasificacin de cuatro mquinas en su planta des-

nistracin. Un ejemplo en el campo de la mercadotecnia


podra ser "nmero de ventas por mes por cada vendedor".
1.2 Exprese ejemplos de datos que pueden reunirse para fines
de toma de decisiones a partir de cada una de las siguientes industrias: manufactura, seguros) viajes, ventas al
menudeo, comunicaciones, computacin, agricultura,
banca y servicios de salud. Un ejemplo en la industria de
viajes podra ser el costo de un viaje de negocios por dla
en varias ciudades de Europa.
1.3 D un ejemplo de estadstica descriptiva en la industria de
msica grabada. D un ejemplo de la forma en que la
estadstica inferencia/ podran usarse en la industria de la
msica grabada. Compare estos dos ejemplos. Qu hace
la diferencia?
1.4 Supongamos que el estudiante es gerente de operaciones
de una planta que manufactura bateras. D un ejemplo
de cmo podra usar la estadstica descriptiva para tomar
mejores decisiones gerenciales. D un ejemplo de cmo
podra usar la estadstica inferencia/ para tomar mejores
decisiones gerenciales.
1.5 Clasifique cada uno de los siguientes datos como nominales, ordinales, de intervalo o de razn.
a. El tiempo necesario para producir cada neumtico en
una linea de ensamble.

1 ia consume en un mes.
pus que se les ha designado como excelente, buena,
satisfactoria y mala.
d. La clave de larga distancia automtica
Estados Unidos.

de clientes en

e. La edad de cada uno de sus empleados.

f. Las ventas en dlares en el restaurante local de pizzas


cada mes.
g. El nmero de identificacin

de un empleado.

h. El tiempo de respuesta de una unidad de emergencia


1.6 Clasifique cada uno de los siguientes datos como nominal, ordinal, de intervalo o de razn.
a. La clasificacin de una compaia

500.

hecha por Fortune

b. El nmero de billetes vendidos en un cine en una


noche cualquiera.
c. El nmero de identificacin

en un cuestionario.

d. Ingreso per cpita,

e. El saldo comercial en dlares.


f. Clase socioeconmica (baja, media, alta).
g. .Prdidas o ganancias en dlares.

h. Identificacin de impuesto de una compaa


i. Clasificacin de bonos de la Standard & Poor's de ciudades con base en las siguientes escalas:

CAPITULO 1 INTRODUCCINA LA ESTADISTICA 15


Oasificacin

Calificacin/tipo
AAA

Calidad ms alta
Calidad alta

AA

Calidad media alta

A
BBB
BB
B

Calidad intermedia
Poco especulativa
Calidad baja, especulativa
Calificacin baja, posible
incumplimiento
Calificacin baja, posible
recuperacin parcial
Incumplimiento,
improbable

recuperacin

ccc
ce
e

la construccin. Aproximadamente900 contratistas elctricos compran alambre anualmente a Rathburn. El


director de mercado de Rathburn desea determinar la
satisfaccin de estos contratistas con el alambre de
Rathburn, l elabor un cuestionario que da una calificacin de satisfaccin entre 1 O y 50 para participantes que
respondan a esta encuesta. A una muestra aleatoria de 35
de los 900 contratistas se les pidi contestar y llenar una
encuestade satisfaccin.Las calificacionesde satisfaccin
para los 35 participantesse promedian para obtener una
calificacin media de satisfaccin.
a. Cul es la poblacin para este estudio?
b. Cul es la muestra para este estudio?
c. Cul es la estadistica para este estudio?
d. Cul seria un parmetro para este estudio?

1.7 La Rathburn Manufacturing Companyproduce conductores elctricos, que vende a contratistas en la industria de

ANLISIS DE LA BASE DE DATOS


Se pueden usar siete bases de datos principalespara aplicar las
tcnicas presentadas en este curso. Estas bases de datos se
encuentranen el CD-ROM que acompaa a este texto, y cada
una de estas bases de datos se encuentra ya sea en formato
~UNITABo Excelpara mayor comodidad.Estas siete bases de
datos representan una amplia variedad de campos de accin
de negocios,por ejemplo el mercadode acciones, manufactura, mano de obra internacional
, finanzas, energa, atencin

mdica y agroindustrias. En conjunto, estas bases de datos


contienen 56 variables y 8 350 observaciones. Los datos se
recolectan de fuentes confiables como lo es la Oficina del
Trabajo, la Casa de Bolsa de Nueva York, el U.S. Department
of Agriculture,el Moody's Handbook of Common Stocks, la
American Hospital Association y el U.S. Census Bureau.
Cuatro de las bases contienen datos de series de tiempo que
pueden ser especialmente tiles para pronsticos y anlisis
de regresin.A continuacin se encuentra una descripcin de
cada una de las bases, junto con informacin que puede ser
til al estudiante para interpretar resultados.

do como 2, o cerca de este dia, y una observacin del da 30 del


mes denotadocomo 3. Esta base de datos fue elaborada a partir de datos mostrados en el Internet por la New York Stock
Exchange. Es posible tener acceso a los datos originales en Ja
Data Library en http://www.nyse.com/marketinfo/marketinfo.html bajo el titulo NYSEStatistics Archive.
Base de datos de manufactura

Esta base de datos contiene ocho variables tomadas de 20


industriasy 140 subindustriasen Estados Unidos.La fuente de
la base de datos es la 1996Annual Surveyof Manufactures,que
es publicado por el Census Bureau del U.S. Departrnent of
Commerce. Algunas de las industrias son productos alimenticios, productos textiles, muebles, productos qumicos, productos de caucho, metales primarios, maquinaria industrial y
equipo de transporte. Las ocho variables son Nmero de
empleados, Nmero de trabajadores de produccin, Valor
agregado por manufactura,Costo de materiales,Valor de embarques de la industria,Gastos nuevos de capital, Inventarios
de fin de ao, y Grupo industrial. Dos variables, Nmero de
Base de datos del mercadode acciones
empleadosy Nmero de trabajadores de produccin,estn en
La base de datos del mercado de acciones contiene ocho varia- unidadesde mil. Cuatro variables,Valor agregado por manubles relativasal New York Stock Exchange.Tres observaciones factura, Costo de materiales,Gastos nuevos de capital, e Inpor mes durante nueve aos da un total de 324 observacio- ventario de fin de ao, estn en unidades de millones de
nes por variable. Las variables incluyen el Composite lndex, dlares. La variable Grupo industrial consta de nmeros del
Industrial Index, Transportation Jndex, Utility Index, Stock l al 20 para denotar el grupo industrial al cual pertenece la
Volume, Reported Trades, Dollar Value y Warrants Volumen. subindustria en particular. Valor de Embarques de Industria
El Dollar value (valor del dlar) se reporta en unidades de se ha recodificado a la siguiente escala de l a 4.
millonesde dlares. Al reconocer que el tiempo del mes puede
1 = $0 a $4.9 mil millones
hacer una diferencia en el valor de la observacin, cada varia2 = $5 mil millones a $13.9 mil millones
ble contiene una observacindel da diez de cada mes, o cerca
3 = $14 mil millones a $28.9 mil millones
de este da, denotado en la base de datos como 1 bajo la varia4 = $29 mil millones o ms
ble Parte del Mes,una observacindel da 20 del mes denota-

16 ESTADISTICA EN LOS NEGOCIOS

Base de datos de mano de obra internacional

2 =Noreste

Esta base de datos de series de tiempo contiene los porcentajes de desempleo civil en siete paises presentados anualmente
entre 1959 y 1998. Los datos son publicados por la Bureau of
Labor Statistics del U.S. Department of Labor. Los paises son
Estados Unidos, Canad, Australia, Japn, Francia, Alemania e
Italia.

3 = Medio Oeste

Base de datos financiera


La base de datos financiera contiene observaciones sobre ocho
variables para 100 compaas, Las variables son tipo de industria, ingresos totales ($ millones), activos totales ($ millones),
rendimiento sobre acciones (%), ganancias por accin ($),
promedio de rendimiento (%), dividendos por accin ($), y
razn entre precio promedio por utilidades (P/E). Los datos
fueron tomados del Moody's Handbook of Common Stocks
(verano 1998). Las compaas representan siete tipos diferentes de industrias. La variable tipo muestra el tipo de industria
de una compaia como:
1 =vestido
2 = productos qumicos
3 = energa elctrica
4 = abarrotes
5 = productos para atencin mdica
6 =seguros
7 =petrleo
Base de datos de energa
La base de datos de energ!a consta de datos sobre siete variables de energa en un periodo de 26 aos. La base de datos est
adoptada del MonthlyEnergy Review, February 1999 (Office of
Energy Markets and End Use, Energy lnformation Administration, U.S. Departrnent ofEnergy). Las siete variables son
World Crude Oil Production (millones de barriles por da),
U.S. Energy Consumption (trillones de BTUs por ao), U.S.
Nuclear Electricity Gross Generation (miles de millones de
kilowatt-horas), U.S. Coa! Production (millones de toneladas
cortas), U.S. Fue! Rate for Automobiles (millas por galn) y
Cost ofUnleaded (regular) Gasoline (U.S. promedio en la ciudad).
Base de datos de hospital
Esta base de datos contiene observaciones para 11 variables en
hospitales de Estados Unidos. Estas variables comprenden la
Geographic Region, Control, Service, Number of Beds, Number of Admissions, Census, Number of Outpatients, Number
of Births, Total Expenditures, Payroll Expenditures, y Personnel. La informacin para estas bases de datos se toma de la

American HospitalAssociation Guide to the Health-Care Field,


edicin 1998-99, publicada en Chicago, lllinois.
La variable de regin est codificada de 1 a 7, y los nmeros representan las siguientes regiones.
1 =Sur

4 =Suroeste
5 = Montaas Rocallosas
6 = California
7 =Noroeste
El control es un tipo de propiedad. Cuatro categorlas de
control estn incluidas en la base de datos:
1 = gobierno, no federal
2 = no gobierno, no con fines de lucro
3 = con fines de lucro
4 = gobierno federal
El servicio es el tipo de hospital. Los dos tipos de hospitales empleados en esta base de datos son:
1 = medicina general
2 = psiquiatra
Las variables del total de gastos y nmina estn en unidades de $1 000.
Base de datos de series de tiempo de agroindustria
La base de datos de series de tiempo de agroindustria contiene el peso mensual (en mil libras) de propiedades de almacenamiento en fro para seis legumbres diferentes y para
legumbres totalmente congeladas en un periodo de 14 aos.
Cada una de las siete variables representa 168 meses de datos
desde 1984 a 1997. Las seis legumbres son judas verdes, brcoli, zanahorias, maiz, cebollas y chcharos. Los datos estn
publicados por la National Agricultural Statistics Service del
U.S. Department of Agriculture.
Utilice la base de datos para contestar las siguientes preguntas.
l. En la base de datos de manufactura, cul es el nivel de
datos para cada una de las siguientes variables?
a. Nmero de trabajadores de produccin
b. Costo de materiales
c. Valor de embarques de la industria
d. Grupo de industria
2. En la base de datos de hospital, cul es el nivel de datos
para cada una de las siguientes variables?
a. Regin
b. Control
c. Nmero de camas
d. Personal
3. En la base de datos financiera, cul es el nivel de datos para
cada una de las siguientes variables?
a. Tipo de industria
b. Total de activos
c. Razn P/E

CAPITULO 1 INTRODUCCIN A LA ESTADISTICA 1;

CASO: DIGIORNO PIZZA: INTRODUCCIN DE UNA PIZZA CONGELADA


PARA COMPETIR CON LAS PIZZAS PARA LLEVAR
hlaft's DiGiorno Pizza lleg al mercado. DiGiorno
gran xito con ventas de $120 millones el primer
O. $_00 millones el siguiente. No fue suerte ni coincidenDGomo Pizza tuviera un xito instantneo. Antes de
p:=.~ ~ publico Kraft llev a cabo una extensa investiga& ::xrcado. Numerosas preguntas tuvieron que contesa:s;e&:::es que Kraft iniciara la produccin. Por ejemplo, por
d p6hLco consume pizzas], cundo comen pizzasi, creen
GCSmJUdorcs que las pizzas para llevar son siempre ms

lector estuviera a cargo de llevar a cabo esta investigacin para


ayudar a lanzar ese nuevo producto, qu decisiones tomarla
usted acerca de a quin entrevistar, dnde y cundo hacer la
encuesta, y qu medir?

l. Cules son algunas de las poblaciones en las que Kraft


pudo estar interesado en usar estos estudios? Trat Kraft
en realidad de hacer contacto con todas las poblaciones?
Qu muestras se tomaron? En vista de estas dos preguntas,
cmo es que Kraft utiliz el proceso inferencia! en su
investigacin de mercado? Puede usted considerar otra
0-Alcott realiz un estudio de investigacin para Kraft
estadstica descriptiva que pudiera usar Kraft en el proceso
que enviaron 1 000 encuestas para quienes gustan de pide toma de decisin?
=. loo resultados indicaron que el pblico consume pizza
~ocasiones sociales divertidas, o en casa, cuando nadie 2. En los diversos esfuerzos de investigacin de mercado por
Kraft para DiGiorno, algunas de las posibles medidas apa~
axinar. El pblico utiliz pizzas congeladas principal~
por comodidad pero seleccionaba pizzas para llevar
recen en la lista siguiente y clasiquelas por nivel de datos.
nrias otras razones, incluyendo calidad y no tener que
Considere algunas otras medidas que los investigadores de
c:cmr. El Loran Marketing Group se concentr en grupos
Kraft pudieran usar para este trabajo de investigacin y clai?E2 K.~ con mujeres entre 25 y 54 aos. Lo que encontraron
siquelas por nivel de datos.
is3ostr que las personas consumen pizzas congeladas por
a. Nmero de pizzas consumidas por semana por casa.
~d pero deseaban que tuvieran el gusto de las pizzas
b. Edad del comprador de pizzas.
;:z::z
rar, Para satisfacer estas metas aparentemente diverc. Cdigo postal de quien respondi a la encuesta.
g::::es comodidad y gusto), Kraft cre la Pizza DiGiomo, la
se infla en el horno cuando se cocina. Esto impresion a
::uanbros del grupo, y en una serie de pruebas de gusto
t ~llevada a cabo por Product Dynamics, DiGiorno Pizza
~
a todas las pizzas congeladas y termin en segundo
_ slo detrs de una marca para llevar.
Por medio de publicidad Kraft pudo superar dos proble~ qae surgieron por la investigacin de mercado: el pblico
taifa problemas para pronunciar DiGiorno y necesitaban estar
::ftllcidos de que la pizza congelada en realidad tiene buen
abar. Kraft hizo repetir el nombre DiGiorno varias veces en
a:::mcios para asegurarse que los consumidores podlan pro=iar el nombre. Como subproducto, los anuncios tambin
~n fuerte identificacin de la marca. Adems, los
aauncios destacaron el sabor de recin horneada y el aspecto
de rosca inflada del producto, lo cual ayud a convencer al
rblico de la ms alta calidad del sabor de DiGiorno.
DiGiorno Pizza, en la actualidad tiene 13% del mercado
& Estados Unidos, de $2.3 mil millones de la categorfa de pizzas congeladas. Es el producto Kraft de ms rpida crecimienllD al romper la barrera de los $200 millones.
Anlisis
Piense en la investigacin de mercado que fue realizada por

Kraft y en el hecho de que usaron diferentes compaas. Si el

d. Dlares gastados por mes en pizzas por persona.


e. Tiempo entre compras de pizzas.
f. Clasificacin del gusto de una marca dada de pizzas en
una escala de 1 al 1 O, donde 1 es muy mal sabor y 10 es
un sabor excelente.
g. Clasificacin del sabor de cuatro marcas de pizzas en
una prueba degustacin.
h. Nmero que represente la ubicacin geogrfica de
quien respondi a la encuesta
i. Clasificacin de calidad de una marca de pizza como
excelente, buena, promedio, abajo del promedio, mala.
j. Nmero que represente la marca de pizza que se evale.
k. Sexo de quien respondi a la encuesta.

Fu<nt<: adaptado de "Upper Crusr'; Amtrican D<magraphia,


p. 58; Marketwatch~News That Matters sitios Web, "'What's in

mano de 1999,
a Name? Brand
E.xtension Pctential" y "'OiGiorno Rising Crust Delivers $200 Million ..,
antes en http://www.foodexplon:r.com/BUSINESS/ProduCU/MarketAnalysi>/
PF02896b. btm, ltimo acceso en 1999.

CAPTULO 2

Tablas y grficas
OBJETIVOS DE APRENDIZAJE
El objetivo general del captulo 2 es que el estudiante domine varias tcnicas para
resumir y representar datos, con le que podr:
l. Reconocer la diferencia entre datos agrupados y no agrupados.
2. Construir una distribucin de frecuencia.
3. Construir un histograma, un polgono de frecuencia, una ojiva, una grfica de
pastel, una grfica de tallo y hoja, una grfica de Pareto y una grfica de dispersin.

18

Estado de la manufactura de autos

Segn los datos publicados por el Automotive News Data Center, General Motors Corporation es la
nmero uno en el mundo en ventas totales de autos y camiones ligeros. Ford Motor Company es la nmero dos seguida por Toyota Motor Corporation y Volkswagen, respectivamente. Entre 1999 y 2000,
General Motors mantuvo su posicin nmero uno, vendiendo casi 200 000 autos menos en todo el
mundo. Durante este mismo periodo, Ford Motor aument ventas en ms de 200 000. El crecimiento
de mayor porcentaje de 1999 a 2000 fue para PSA Peugeot-Citroen, que aument ventas en 14.2%. A
continuacin veamos las cifras mundiales de ventas para los JO principales fabricantes de autos y
camiones ligeros para 1999 y 2000.
Compaa
General Motor
Ford Motor
Toyota Motor
Volkswagen
DaimlerChrysler
PSA Peugeot-Citroen
Fiat

1999

2000

%de cambio

8 786 000

8 591 327

-2.2

7 148 000

7 350 495

2.8

5 359 000

5 703 446

6.4

4 860203

5 161188

6.2

4 864 500

4 749000

-2.4

2 519 600

2 877 900

14.2

2 521 000

2 646 500

5.0

Hyundai Motor
Nissan Motor

2 600 862

2 634 530

1.3

2 567 878

2 629 044

2.4

Honda Motor

2 395 000

2 540000

6.1

Preguntas gerenciales y estadsticas


Supongamos que el lector es analista de negocios para una de estas compaas. Su gerente le pide que
elabore un breve reporte que muestre el estado de ventas de autos y camiones ligeros en todo el mundo.
Usted debe comparar la posicin de su compaa con otras empresas.
l. Cul es la mejor forma de expresar los datos de ventas en un reporte? Son suficientes los datos
sin procesar? Puede usted en efecto exhibir la informacin grficamente?
2. Supongamos que DaimlerChrysler toma al azar muestras de 40 distribuidores y descubre que
los siguientes datos indican cuntos autos y camiones ligeros se vendieron en estas distribuidoras el mes pasado. Puede usted resumir estos datos en un reporte?
34 58 40 49 49 57 44 57 69 45 64 31 47 30 44 44 SI 65 60 65
61 62 68 43 66 63 44 34 57 44 67 614767 52 34 58 59 45 33
3. Cmo podra usted representar grficamente los datos de 1999 contra los datos de 20001
F11tt1tt: adaptado de Automotivc Ncws Data Cerner, "Top 1 O Auto Manufacturers", Ad Age Almariac, 31 de diciembre de 2001,
p. 23.

19

20

ESTADISTICA EN LOS NEGOCIOS

TABLA 2.1
Porcentajes de desempleo en
Francia en 40 aos (datos no
agrupados)
1.6
1.5
1.2

1.4
1.6
1.2
1.6
1.6

2.1

2.1
2.7
2.3
2.5
2.8
2.9
2.8
.2.9

4.2
4.6

5.2
5.4
6.1
6.5
7.6
8.3

8.6
JO.O
10.S
10.6
10.8
I0.3

9.6
9.1

9.6

10.4
11.8
12.3
11.8
12.5
12.4
11.8

En los captulos 2 y 3 se presentan diversas tcnicas para reformar o reducir datos y que
stos sean ms manejables y se puedan usar para ayudar de manera ms eficiente a quienes
toman decisiones. Dos tcnicas para agrupar datos son la distribucin de frecuencia y la
grfica de tallo y hoja que en este captulo se presentan. Adems, en el captulo 2 se estudian y exhiben varias herramientas grficas para resumir y representar datos, incluyendo
histogramas, polgono de frecuencia, ojiva, grfica de pastel y grfica de Pareto para datos
de una variable, y la grfica de dispersin para datos numricos de dos variables. Con el uso
de stas y otras tcnicas, quienes toman decisiones pueden empezar a "echar mano" de la
informacin contenida en los datos y usar stos para mejorar el proceso de toma de decisiones.
Los datos sin procesar, o datos que 110 han sido resumidos en ninguna forma, se conocen
a veces como datos no agrupados. La tabla 2.1 contiene datos sin procesar de los porcentajes de desempleo en Francia en ms de 40 aos. Los datos que se han organizado en una
distribucin de frecuencia se denominan datos agrupados. La tabla 2.2 presenta una distribucin de frecuencia para los datos mostrados en la tabla 2.1. La distincin entre datos no
agrupados y agrupados es importante porque los clculos de estadstica difieren entre los
dos tipos de datos. Este capitulo se concentra en organizar datos no agrupados y mostrarlos grficamente.

DISTRIBUCIONES DE FRECUENCIA

Una herramienta particularmente til para agrupar datos es la distribucin de frecuencia, que es un
resumen de datos presentados en la forma de intervalos y frecuencias de clase. Cmo se construye una
distribucin de frecuencia a partir de datos sin procesar? Esto es, cmo se construyen distribuciones
de frecuencia -<0mo la que se ilustra en la tabla 2.2- a partir de datos sin procesar como los de la
tabla 2.1? Las distribuciones de frecuencia son relativamente fciles de construir. Aun cuando algunas
directrices y reglas prcticas ayudan en su construccin, las distribuciones de frecuencia varlan en su
forma final y diseo, aun cuando los datos sin procesar originales sean idnticos. En cierto sentido, las
distribuciones de frecuencia se construyen segn el gusto individual de los investigadores de negocios.
Cuando se construya una distribucin de frecuencia, el investigador de negocios debe determinar
primero el rango de los datos sin procesar. El rango se define a veces como la diferencia entre los nmeros ms grande y ms pequeo. El rango de los datos de la tabla 2.1 es 11.3 (12.5-1.2).
El segundo paso en construir una distribucin de frecuencia es determinar cuntas clases contendr. Una regla prctica es seleccionar entre S y 15 clases. Si la distribucin de frecuencia contiene muy
pocas clases, el resumen de datos puede ser demasiado general para ser til. Muchas clases pueden
resultar en una distribucin de frecuencias que no agrega los datos suficientes para ser til. El nmero
final de clases es arbitrario. El investigador de negocios llega a un nmero si examina el rango y determina el nmero de clases que abarcar el rango en forma adecuada y tambin que sea significativo para
el usuario. Los datos de la tabla 2.1 se agruparon en seis clases para la tabla 2.2.
Despus de seleccionar el nmero de clases, el investigador de negocios debe determinar el ancho del intervalo de clase. Una aproximacin del ancho de clase se puede calcular
al dividir el rango entre el nmero de clases. Para los datos de la tabla 2.1, esta aproximaTABLA2.2
cin serla 11.3/6, o sea 1.9. Normalmente, el nmero se redondea al siguiente nmero entero, que en este caso es 2. La distribucin de frecuencia debe empezar en un valor igual a o
Distribucin de frecuencia de
menor al nmero ms bajo de los datos no agrupados y terminar en un valor igual o mayor
los porcentajes de desempleo
que el nmero ms alto. El porcentaje ms bajo de desempleo es 1.2 y el ms alto es 12.5,
en Francia (datos agrupados)
de modo que el investigador de negocios inicia la distribucin de frecuencias en 1 y la terlotttValo
mina en 13. La tabla 2.2 contiene la distribucin de frecuencia completada para los datos
de clase
Frecuencia
de la tabla 2.1. Los puntos finales de la clase se seleccionan de modo que ningn valor de
l-rnenor de 3
16
los datos pueda caber en ms de una clase. La expresin de intervalo de clase, "menor de';
3-menorde 5
2
en la distribucin del la tabla 2.2 evita este problema.
5-menordc 7

Marca de clase

7-menordc9
9-menor de 11

l l-menor de 13

El punto medio de cada intervalo de clase se llama marca de clase y a veces se conoce como
punto medio clase. Es el valor a la mitad entre ti intervalo de clase y se puede calcular

CAPITULO 2 TABLAS Y GRAFICAS 21

como el promedio de los dos puntos finales de clase. Por ejemplo, en la distribucin de la tabla 2.2, el
punto medio del intervalo de clase 3-menor de 5 es 4 o (3 + 5)/2. Una segunda forma de obtener la
marca de clase es calcular la mitad de la distancia en el intervalo de clase (la mitad del ancho de clase)
y sumarla al punto inicial de clase, como para la distribucin de porcentajes de desempleo:
Punto inicial de clase = 3
Ancho de clase = 2
Marca de clase = 3

+ .!.(2)
2

=4

La marca de clase es importante, porque se convierte en el valor representativo para cada clase en
la mayor parte de clculos de estadlstica de grupo. La tercera columna de la tabla 2.3 contiene las marcas de clase para los datos de la tabla 2.2.

Frecuencia relativa
La frecuencia relativa es la proporcin de la frecuencia total que estd en cualquier intervalo de clase dado
en una distribucin de frecuencia. La frecuencia relativa es la frecuencia de clase individual dividida
entre la frecuencia total. Por ejemplo, de la tabla 2.3, la frecuencia relativa para el intervalo de clase
5-menor de 7 es 4/40 o .10. La consideracin de la frecuencia relativa es preparatoria al estudio de probabilidad del capitulo 4. De hecho, si se seleccionaran valores al azar de los datos de la tabla 2.l , la
probabilidad de sacar un nmero que sea "5-menor de 7" serla .10, la frecuencia relativa para esa clase
de intervalo. La cuarta columna de la tabla 2.3 es una lista de las frecuencias relativas para la distribucin de frecuencia de la tabla 2.2.

Frecuencia acumulada
La frecuencia acumulada es u11 total corriente de frecuencia por las clases de una distribucin de frecue11cia. La frecuencia acumulada para cada intervalo de clase es la frecuencia para ese intervalo de frecuencia sumado al total acumulado precedente. En la tabla 2.3, la frecuencia acumulada para la primera
clase es la misma que para la frecuencia de clase: 16. La frecuencia acumulada para el segundo intervalo de clase es la frecuencia de ese intervalo (2) ms la frecuencia del primer intervalo ( 16), lo cual da
una nueva frecuencia acumulada de 18. Este proceso contina hasta el ltimo intervalo, en cuyo punto
el total acumulado es igual a la suma de las frecuencias ( 40). El concepto de frecuencia acumulada se
emplea en muchos campos de accin, incluyendo ventas acumuladas en un ao fiscal, marcador final
de deportes durante un concurso (puntos acumulados), aos de servicio, puntos ganados en un curso
y costos por hacer negocio en un periodo. La tabla 2.3 indica frecuencias acumuladas para los datos de
la tabla 2.2.

TABLA 2.3
"'untos medios de clase,
~enca relativas,
y frecuencia acumuladas para
datos de desempleo

1..-lo
l-menorde3
3-mmorde5
5-menorde7
7-menorde9
9-menor de 11
11-nwnordel3

1bliia

fNcumda
16
2
4
3
9

..i
40

~-iio
dedme
2
4
6
8
10
12

F...--la

nlidha

111-ia
_....

.oso

.400

16
18

.100

22

.075
.225

34

~
1.000

25
40

22

ESTADISTICA EN LOS NEGOCIOS

PROBLEMA DE
DEMOSTRACIN
2.1

Los siguientes datos son el promedio de tasas semanales de inters de hipoteca para un periodo de 60 semanas.
7.29
6.69
6.98
7.39
7.11
7.30
7.16
6.87
7.08
6.96
7.02
6.99

7.03
7.02
7.56
7-.28
6.95
7.17
6.78
6.80
7.24
6.70
7.40
6.94

7.14
7.40
6.75
6.97
7.23
6.96
6.79
7.10
7.34
6.57
7.12
7.29

6.77
7.16
6.78
6.90
7.31
6.78
7.07
7.13
7.47
6.88
7.16
7.05

6.35
6.96
7.11
6.57
7.00
7.30
7.03
6.95
7.31
6.84
7.16
6.84

Construya una distribucin de frecuencia para estos datos. Calcule y muestre los puntos
medios de clase, frecuencias relativas y frecuencias acumuladas para esta distribucin de frecuencia.
Soluci6n
Cuntas clases debera contener esta distribucin de frecuencia? El rango de los datos es 1.21
(7.56-6.35). Si se utilizan 13 clases, cada ancho de clase es aproximadamente:
Ancho de clase

Rango
Nmero de clases

=~

13

= 0.093

Si se utiliza el ancho de una clase de .1 O, es posible construir una distribucin de frecuencia


con puntos finales que sean de aspecto ms uniforme y permitan la presentacin de la informacin en categoras ms conocidas para usuarios de tasas de inters por hipotecas.
El primer punto final de clase debe ser 6.35 o menor, para incluir el valor ms pequeo; el
ltimo punto final debe ser 7 .56 o ms alto para incluir el valor ms grande. En este caso la distribucin de frecuencia empieza en 6.30 y termina en 7 .60. La distribucin de frecuencia resultante, marcas de clase, frecuencias relativas y frecuencias acumuladas aparecen listados en la
siguiente tabla.
Intervalo de clase

6.30-menor de 6.40
6.40-menor de 6.50
6.50-menor de 6.60
6.60-menor de 6.70
6.70-menor de 6.80
6.80-menor de 6.90
6.90-menor de 7 .00
7.00-menor de 7.10
7.10-menor de 7.20
7 .20-menor de 7.30
7.30-menor de 7.40
7.40-menor de 7.50
7.SO-menor de 7.60
Totales

Marcas de
Frecuencia

clase

Frecuencia
relativa

6.35
6.45
6.55
6.65
6.75
6.85
6.95
7.05
7.15
7.25
7.35
7.45
7.55

.0167
.0000
.0333
.0167
.1000
.1000
.1667
.1333
.1833
.0833
.1000
.0500
.0167
1.0000

o
6
6
10
8
11
5
6
3
_L

60

Frecuencia
acumulada

3
4
10
16
26
34
45
50
56
59
60

Las frecuencias acumuladas y frecuencias relativas de estos datos dejan ver las clases de tasas
de inters de hipotecas que es probable se presenten durante el periodo. Casi todas las tasas de
inters de hipotecas (52 de las 60) estn en las clases que empiezan con (6.70-menor de 6.80) y
pasaa a (7.30-menor de 7.40). Las tasas con la mayor frecuencia, 11, estn en la misma clase
(7.10-menor de 7.20).

CAPITUW 2 TABLAS Y GRFICAS 23

l.1 PROBLEMAS
2.1 Los siguientes datos representan las temperaturas altas vespertinas para 50 das de construccin
durante un ao en St. Louis.
42
55
16
38
31
69
31
17
64

12

70
85
40
79
38
73
62
40
75
61

64
to

81
35
52
38
47
36
53
43

47
24
15
36
16
48
63
44

31
30

66
45
35
23
81
25
84
17
60
33

a. Construya una distribucin de frecuencias para los datos usando cinco intervalos de clase.

b. Construya una distribucin de frecuencias para los datos usando JO intervalos de clase.
c. Examine los resultados de (a) y (b) y comente sobre la utilidad de la distribucin de frecuencias
en trminos de capacidad de resumir temperaturas.
2.2 Se supone que un proceso de empaque debe llenar pequeas cajas de pasas con aproximadamente 50 pasas, de modo que cada caja pese lo mismo. No obstante, va a variar el nmero de pasas de
cada caja. Supngase que se muestren al azar 100 cajas de pasas, se cuentan stas y se obtienen los
siguientes datos.
57
44

49
49
51
54

55
46
59
47

51
53
49
52
48
46
53
59
53
52

53
45
44

49
55
51
50
57
45
48

52
57
54
54
53
48
47
47
45
50

50
39
46
57
55
53
57
61
56
45

60
53
52
52
47
56
49
60
40
56

51
58
55
52
53
48
43
49
46
47

51
47
54
53
43
47
58
53
49
47

52
51
47
49

52
48
53
47

48

46

49
52
41
50
48

57
44

48
57
46

Construya una distribucin de frecuencias para estos datos. Qu deja ver la distribucin
cuencias acerca de los llenados de cajas?

de fre-

2.3 El propietario de un restaurante de comida rpida averigua las edades de una muestra de clientes.
A partir de estos datos, el propietario construye la distribucin de frecuencias que se muestra a
continuacin. Para cada intervalo de clase de la distribucin de frecuencias, determine la marca de
clase, la frecuencia relativa y la frecuencia acumulada.
Intervalo de clase
O-menorde5
5-menor de 10
10-menor de 15
15-menor de 20
20-menor de 25
25-menor de 30
30-menor de 35

Frecuencia

17
23
18
10
4

Qu indica la frecuencia relativa al propietario del restaurante de comida rpida acerca de las edades de clientes?

24 ESTADISTICA EN LOS NEGOCIOS


2.4 El gerente de recursos humanos de una gran compaia encarga un estudio en el que se examinan

los registros de empleados de 500 compaas para observar el ausentismo durante el ao pasado.
8 investigador de negocios que lleva a cabo el estudio organiza los datos en una distribucin de
frecuencias para ayudar al gerente de recursos humanos en el anlisis de los datos. A continuacin
se muestra la distribucin de frecuencias. Para cada clase de la distribucin de frecuencias, determine la marca de clase, la frecuencia relativa y la frecuencia acumulada.
Intervalo de clase

Frecuencia

O-menor de 2

218

2-menor de 4

207

4-menor de 6
6-menor de 8

56
11

8-menor de 10

2.5 Liste tres usos especficosde frecuencia acumuladas en negocios.

2.2 REPRESENTACIN GRFICA DE DATOS


Uno de los mecanismos ms efectivos para presentar datos de manera significativa a quienes toman
decisiones es una representacin grfica. Por medio de tablas y grficas , quien tome decisiones puede
con frecuencia obtener un panorama general de los datos y llegar a alguna conclusin til con slo
estudiar la tabla o grfica. La conversin de datos a grficas puede ser creativa e ingeniosa. Con frecuencia, el paso ms dificil en este proceso es reducir datos importantesy a veces costosos a una imagen grfica que sea tanto clara como concisa, pero a la vez consistente con el mensaje de los datos
originales. Uno de los usos ms importantes de una representacin grfica en estadstica es ayudar al
investigador a determinar la forma de una distribucin. A continuacin se presentan seis tipos de
representacin grfica: 1) histograma, 2) polgono de frecuencia, 3) ojiva, 4) grfica de pastel, 5) grfica de tallo y hoja, y 6) grfica de Pareto.

Histogramas
Un histograma es un tipo de grfica de barras verticales que se utiliza para representar una distribucin
de frecuencias. La construccin de un histograma comprende marcar el eje x (abscisa) con los puntos
finales de clase y el eje y (ordenada) con las frecuencias, trazando un segmento de recta horizontal del
punto final de clase al punto final de clase en cada valor de frecuencia y conectando cada segmento de
recta verticalmente desde el valor de frecuencia al eje x para formar una serie de rectngulos. La figura
2.1 es un histograma de la distribucin de frecuencias de la tabla 2.2, producido con el uso del software
MINITAB.
Un histograma es una herramienta til para diferenciar las frecuencias de intervalos de clase. Una
mirada rpida a un histograma deja ver qu intervalos de clase producen los totales de frecuencia ms
altos. La figura 2.1 muestra claramente que el intervalo de clase l-menor de 3 proporciona con mucho
el conteo de frecuencia ms alto (16). Un examen del histograma revela en dnde se presentan grandes
aumentos o reducciones entre clases, por ejemplo de la clase -rnenor de 3 a la clase 3-menor de 5, una
reduccin de 14, y de la clase 7-menor de 9 a la clase 9-menor de 11, un aumento de 6.
Ntese que las escalas empleadas a lo largo de los ejes X e y para el histograma de la figura 2.1 son
casi idnticas, pero, debido a que los rangos de nmeros significativos para las dos variables que se
grafican a veces difieren considerablemente, la grfica puede tener diferentes escalasen los dos ejes. La
figura 2.2 muestra cmo se verla el histograma de los porcentajes de desempleo si la escala del eje y
fuera menor que la del eje x. Ntese que la menor diferencia en la longitud de los rectngulos parece
representar las frecuencias en la figura 2.2. Es importante que el usuario de la grfica comprenda da-

CAPITULO2 TABL'.SY GRFICAS 25

Histograma
MINITAB de datos

15

oe desempleo en
=rancia

11

13

Porcentajesde desempleo en Francia

ramente las escalas que se emplean para los ejes de un histograma. De otra forma, el creador de una
grfica puede "mentir con la estadstica" al alargar o comprimir una grfica para formar un punto:

Uso de histogramas para obtener una visin general de los datos


Debido a la generalizada disponibilidad de computadoras y programas de estadstica para investigadores de negocios y para quien tome decisiones, el histograma sigue siendo muy importante. A veces, a
quienes toman decisiones se les presenta una gran base de datos de informacin y no saben por dnde
empezar al tratar de entender lo que significan los datos. El anlisis del histograma de estos datos puede
dar informacin inicial acerca de la forma de la distribucin de los datos, la cantidad de variabilidad
de los datos, la ubicacin central de los datos, y los datos de resultados aislados. Aun cuando casi todos
los conceptos se presentan en el capitulo 3, aqu se presenta la nocin de histograma como herramienta inicial de acceso a estas caracteristicas de los datos.
Por ejemplo, una de las variables de la base de datos de Stock Market (que se ve en el CD-ROM) es
el Stock Volume. La base de datos contiene 324 observaciones de volumen de acciones. Supongamos

Histograma
MINITAB de datos
de desempleo
en Francia (eje y
comprimido)

15

"

~ 10

u.

11

13

Porcentajes de desempleo en Francia

Debe sealarse que el paquete Excel utiliza el trmino histograma para referirse a una distribucin de frecuencia, pero

al hacer die en Chart output de la caja de dilogo de histograma Excel, tambin se crea un histograma graco.

26 ESTADISTICA EN LOS NEGOCIOS

que quien tome decisiones financieras desea usar estos datos para llegar a algunas conclusiones acerca
del mercado de acciones. La figura 2.3 muestra un histograma de estos datos producido por el MINITAB.
Qu se puede saber a partir de este histograma? Prcticamente todos los volmenes del mercado de
acciones caen entre cero y mil millones de acciones. La distribucin toma una forma que es alta en el
extremo izquierdo y se hace aguda hacia la derecha. En el captulo 3 veremos que la forma de esta distribucin est sesgada hacia el extremo derecho. En estadstica, a veces es til determinar si los datos
estn normalmente distribuidos en forma aproximada (curva en forma de campana), como se muestra en la figura 2.4. Podemos ver, al examinar el histograma de la figura 2.3, que los datos del volumen
del mercado de acciones no estn normalmente distribuidos. Aun cuando el centro del histograma est
ubicado cerca de 500 millones de acciones, una gran parte de las observaciones del volumen de acciones cae en el extremo inferior de los datos en algn punto entre 100 millones y 400 millones de acciones.
Adems, el histograma muestra algunos resultados aislados en el extremo superior de la distribucin.
Los resultados aislados son puntos de datos que aparecen fuera del cuerpo principal de observaciones
y pueden representar fenmenos que difieren de los representados por otros puntos de datos. Al observar el histograma, se notan algunos datos que se acercan a los mil millones. Se podra concluir que en
pocos dJas del mercado de acciones, se vende un gran volumen de acciones. Se pueden captar stas y
otras nociones al examinar el histograma y mostrar que los histogramas desempean un papel importante en el anlisis inicial de datos.

Polgonosde frecuencia
Un polgono de frecuencias es una grfica en la que segmentos de recta "que enlazan puntos" representa
una distribucin de frecuencias. La construccin de un polgono de frecuencias empieza, al igual con un
histograma, al asignar escala a puntos finales de clase a lo largo del eje x y a los valores de frecuencia a
lo largo del eje y. Se determina un punto para el valor de frecuencia en el punto medio de cada intervalo de clase (marca de clase). El enlace de estos puntos medios completa la grfica. La figura 2.5 muestra un polgono de frecuencias de los datos de distribucin de la tabla 2.2, obtenido con el uso del
programa Excel. La informacin captada a partir del polgono de frecuencias e histogramas es semejante. Al igual que con el histograma, el cambio de escalas de los ejes puede comprimir o alargar el polgono de frecuencias, lo cual afecta la impresin del usuario de lo que representa la grfica.

Ojivas
Una ojiva es un polgono defrecuencias acumuladas. AquI tambin se inicia la construccin al marcar el
eje x con los puntos finales de clase y el eje y con las frecuencias. No obstante, el uso de valores de frecuencia acumulada requiere que la escala a lo largo del eje y sea suficientemente grande para incluir el
total de frecuencia. Un punto de frecuencia cero se grafica al principio de la primera clase y la construccin contina al marcarse un punto en el extremo de cada intervalo de clase para el valor acumulado. Al enlazar los puntos se completa entonces Ja ojiva. La figura 2.6 presenta una ojiva obtenida con
el Excel para los datos de la tabla 2.2.

0011111._
Histograma
de volmenes de
acciones,
1990-1998

50
40
30

20

10

500 millones

1000 millones

CAPtruLO

2 TABLAS Y GRFICAS

27

Las ojivas son ms tiles cuando quien tome decisiones desea ver totales corrientes. Por
ejemplo, si un controlador est interesado en controlar costos, una ojiva podrfa representar costos acumulados de un ao fiscal.
Las pendientes pronunciadas de una ojiva se pueden usar para identificar aumentos agudos en frecuencia. En la figura 2.6 pueden presentarse pendientes agudas en la clase l-menor
de 3 y la clase 9-menor de 11, lo cual significa grandes totales de frecuencia de clase.

RGUllA 2.4
:>..s:.ribucin normal

Grficas de pastel
Una grfica de pastel es una representacin circular de datos donde el rea de todo el pastel
representa 100% de los datos en estudio y las rebanadas representan una descomposicinen
porcentaje de los subniveles. Las grficas de pastel muestran las magnitudes relativas entre
partes y un todo. Se utilizan ampliamente en negocios, en particular para representar factores como por
ejemplo categoras de presupuesto, porcentaje de participacin en el mercado y asignaciones de tiempo y recursos. No obstante, el uso de grficas de pastel es mnimo en ciencias y tecnologa debido a que

1,:-1,111-

18

-gono de
29c:uencia,
~en
:.a::el de los datos
::.esempleo

16
14

..

12

e
;:)

10

~
"-

6
4

o
3

45
40

.,,.

-3
e

35
30

25

20

o"
;:)

~
"-

15
JO

Puntos finales de dase

11

13

11

13

28 ESTADISTICA EN LOS NEGOCIOS

HA1fii!i.1111.111Mi[.fi.J+M .._

Dnde se venden bebidas gaseosas?


El mercado de bebidas gaseosas (refrescos) es sumamente
grande y creciente en Estados Unidos y en todo el mundo.
En un ao reciente, 9 600 millones de cajas de refrescos se
vendieron slo en Estados Unidos. Dnde se venden bebidas gaseosas? Los siguientes datos de Ja investigacin de
Sanford C. Bernstein indican que los cuatro Jugares principales para ventas de bebidas gaseosas son supermercados,
fuentes de sodas, tiendas de alimentos envasados o gasolineras y mquinas despachadoras.
Lupr de wntas

Tiendas de alimentos
~dos/gasolineras
16%

Pon:mtaje

Supermercado
Fuente de soda.
Tienda de alimentos
envasados/gasolineras
M'quinas expendedoras
Comerciantes
Farmacias

24
16

11

so------------------~ 30

Estos datos se pueden exhibir grficamente en varias


formas. Aqul se ilustra una grfica de pastel de Excel y una
grfica de barras de MINITAB de los datos. Algunos expertos en estadstica prefieren el histograma o la grfica de
barras, en Jugar de la grfica de pastel, porque piensan que
es ms fcil comparar categorias que son similares en tamao con el histograma o Ja grfica de barras que con la grfica de pastel.

j :=-<-=l=........:1=->-=11::.. .L. =_=...L...::_=-.i


Super- Fumt<
merado dr .OO..

Tiendas
M~.
de .!im. vendecnvasadosl doras
guolintras

Comer Panmoames
ciu

Lugardcvcnw

pueden llevar a juicios menos precisos de lo que es posible con otros tipos de grficas." En general, para
un observador es ms dificil interpretar el tamao relativo de ngulos en una grfica de pastel que juzgar la longitud de rectngulos en un histograma o la distancia relativa de un punto de polgono de frecuencias desde el eje x. En el artculo Statistics in Business Today, "Where Are Soft Drinks Sold?" las
representaciones del porcentaje de ventas por lugar fueron mostradas tanto por una grfica de pastel
como por una grfica de barras verticales.
En la construccin de la grfica de pastel primero se determina la proporcin entre la subunidad
y el entero. La tabla 2.4 contiene cifras de ventas generadas por Information Resources, !ne., para las
principales 10 marcas de pastas dentales. Primeramente, las cifras de ventas de nmero entero son proporciones convertidas al dividir cada cantidad de ventas entre la cantidad total de ventas. Esta proporcin es anloga a la frecuencia relativa calculada para distribuciones de frecuencia. Debido a que el
crculo contiene 360 grados, cada proporcin se multiplica por 360 para obtener el nmero correcto de
grados y representar cada artculo. Por ejemplo, las ventas de Aquafresh de $177 989 000 representan
una proporcin de .1319 del total de ventas {177 989 000/1349 326 000 = .1319). Multiplicar este valor
por 360 resulta en 47.48. Las ventas de Aquafresh constituyen 47.48 del pastel. La grfica de pastel se
completa entonces con el uso de un comps para trazar las rebanadas. La grfica de pastel de la figura
2.7, construida con el uso de MINITAB, describe los datos de la tabla 2.4.

"william S. Cleveland, The El<ments of Graphmg Data {Monterey, CA: Wadsworth Advanced Books and Software, 1985).

CAPITULO 2 TABLAS Y GRAFICAS

tul.A 2.4
:mas de pasta
="lea
de 10
:ic oales marcas

Marca
Crest
Colgate
Aquafresh
Mentadent
Arm &Hammer
Rembrandt
Sensodyn

Vmtu

Proporcin

Grados

$370 437 000

.2745

98.82

321084000

.2380

85.68

177 989000

.1319

47.48

170630000

.1265

45.55

109 512 000

.0812

29.23

52 067 000

.0386

13.90

50 133 000

.0372

13.39

Listerine

40 107 000

.0297

10.69

Closeup
Ultrabrite
Totales

32 009 ()()()

.0237

8.53

25 358 000

.0187

____n_

oro

1.0000

360.00

1;:1 .,.

s1

349 326

29

Closeup
2.4%

:O-T"ica de pastel
~AB de ventas
.::e oasta dentfrica
pe-. -narca

Sensodyn
3.7%

Listerine
3%

PROBLEMA DE

DEMOSTRACIN
2.2

Segn la National Retail Federation y el Center fer Retailing Education de la University of Florida,
las cuatro principales fuentes de disminucin de inventario son robos de empleados, robos de
clientes en tiendas, errores administrativos y fraude de vendedores. la disminucin estimada en
cantidad anual en dlares (millones de dlares), asociada con cada una de estas fuentes, es:
Robos de empleados
Robos de clientes
Erroradministrat
ivo
Fraude de vendedor
Total

$17 918.6
15191.9
7 617.6
2 553.6
$43 281.7

Construya una grfica de pastel para representar estos datos.


Solucin
Convierta cada cantidad de dlares sin procesar a una proporcin al dividir cada cantidad individual entre el total.
Robos de empleados

17 918.6/43 281.7 = .414

Robos de clientes
Error administrativo

15191.9/43 281.7 = .351


7 617.6/43 281.7 = .176

Fraude de vendedor
Total

2 553.6/43 281.7 = .059


1.000

Convierta las proporciones a grados al multiplicar cada proporcin por 360.

30 ESTADISTICA EN LOS NEGOCIOS

.414. 360 =
.351 . 360 =
.176. 360 =
.059 . 360 =

Robos de empleados
Robos de clientes
Error administrativo
Fraude de vendedor
Total

149.0'
126.4
63.4
21.2'
360.0

Fraude de vendedor
6%

Robos de clientes
35%

Grficas de tallo y hoja


Otra forma de organizar datos sin procesar en grupos es por una grfica de tallo y hoja. Esta tcnica es
sencilla y da una vista de caractersticas nicas de los datos. Una grfica de tallo y hoja se construyeal
separar los dgitos de cada nmero de los datos en dos grupos, un tallo y una hoja. Los dgitos de la extrema izquierda son el tallo y estn formados por los dgitos de ms alto valor. Los dgitos de la extrema
derecha son las hojas y contienen los valores ms bajos. Si un conjunto de datos tiene slo dos dgitos,
el tallo es el valor de la izquierda y la hoja es el valor de la derecha. Por ejemplo, si 34 es uno de los
nmeros, el tallo es 3 y la hoja es 4. Para nmeros con ms de dos dgitos, la divisin del tallo y hoja es
cuestin de preferencia del investigador.
La tabla 2.5 contiene calificaciones de un examen sobre poltica y reglas de seguridad de una planta, al que se sometieron 35 estudiantes para posiciones en esa planta. En la tabla 2.6 se muestra una grfica de tallo y hoja de estos datos. Una ventaja de esta distribucin es que el instructor puede fcilmente
ver si las calificaciones estn en el extremo superior o inferior de cada corchete, as como determinar la
dispersin de las calificaciones. Una segunda ventaja de las grficas de tallo y hoja es que los valores de

TABLA 2.6
TABLA 2.5
Calificaciones de examen de
seguridad para estudiantes
de planta
86
76
23
77
81
79
68

77
92
59
68
75
83
49

91
47

72
82
74
70
56

60
88
75
97
39
78
94

55
67
83
89
67
91
81

Grfica de tallo y hoja para


datos de examen de
seguridad de planta
Tallo
3
4
6
7
8
9

Hoja
3
9
7
5

o
o
1

9
6
7
2

9
7
4
2
2

8
5
3
4

8
5
3
7

6
6

7
8

7
9

CAPITULO 2 TABLAS Y GRAFICAS

31

los datos originales sin procesar se retienen (en tanto que casi todas las distribuciones de frecuencia y
representaciones grficas usan el punto medio de clase para representar los valores en una clase).

PROBLEMA DE

DEMOSTRACIN
2.3

Los siguientes datos representan los costos (en dlares) de una muestra de 30 remesas postales hechas por una compaa.
3.67
1.83
3.34
3.64
9.15

2.75
10.94
7.80
4.95
3.45

5.47
1.93
3.20
5.42
5.11

4.65
3.89
3.21
8.64
1.97

3.32
7.20
3.55
4.84
2.84

2.09
2.78
3.53
4.10
4.15

Con el uso de dlares como tallo y centavos como hoja, construya una grfica de tallo y hoja
de los datos.
Solucin
Tallo

Hoja

1
2
3
4
5
6

83
09
20
10
11

93
75
21
15
42

20
64
15
94

80

8
9
10

97
78
32
65
47

84
34
84

45
95

53

64

67

89

Grficas de Pareto
Un concepto y movimiento importantes en negocios es la Administracin de Calidad Total (vase el
capitulo 18}. Uno de los importantes aspectos de la administracin de calidad total es la constante bsqueda de causas de problemas en productos y procesos. Una tcnica grfica para mostrar causas de problemas es el anlisis de Pareto, que es un registro cuantitativo del nmero y tipos de defectos que se
presentan en un producto o servicio. Los analistas emplean este registro para obtener una grfica de

bamu verticales que exhiba los tipos de defectos ms comunes, clasificados en el orden en que se presentan
de izquierda a derecha. La grfica de barras se llama grfica o diagrama de Pareto,

Las grficas de Pareto se denominan as! en honor al economista italiano Vilfredo Pareto, quien
observ hace ms de 100 aos que casi toda la riqueza de Italia estaba controlada por unas cuantas
familias que eran los principales motores detrs de la economa italiana. El experto en calidad J.M.
Juran aplic esta nocin al campo de la calidad al observar que la mala calidad puede a veces resolverse
al atacar algunas causas principales que resultan en casi todos los problemas. Una grfica de Pareto hace
posible que quienes tomen decisiones en control de calidad separen los defectos ms importantes de los
defectos triviales, para establecer prioridades en el trabajo de mejora de calidad segn sea necesario.
Supongamos que el nmero de motores elctricos que son rechazados por inspectores de una compaa se increment. Los directores de la compaa examinan los registros de varios cientos de motores en los que se encontr por lo menos un defecto y encuentran que 40% de los defectos son por
alambres defectuosos, 30% por cortocircuito en las bobinas, 25% por clavijas defectuosas y 5% por cojinetes pegados. La figura 2.8 muestra una grfica de Pareto construida a partir de esta informacin, en
la que los principales tres problemas con motores defectuosos; es decir, alambres defectuosos, cortocircuito en las bobinas y clavijas defectuosas, justifica 95% de los problemas. De la grfica de Pareto,
con lo cual los directores pueden formular un plan lgico para reducir el nmero de defectos.
Es probable que directores y trabajadores de la compaa comiencen a mejorar la calidad al examinar los segmentos del proceso de produccin que se relacionen con el alambrado para posteriormente estudiar la construccin de las bobinas y luego las clavijas y el proceso del proveedor de stas.

32

ESV.DISTICA

EN LOS NEGOCIOS

ma11i!I!: ..

Grfica de Pareto
para problemas de
motores elctricos

40

..

30

-;
-e

25

35

;:*-

20

o
o.

10

15

Alambre Conocimllto Clavija


defectuoso en bobina defectuosa

U@i1tt..

Cojinetes
pegados

r---l---;::==================::;---------------100

Grfica MINITAB
de Pareto para problemas de motores
elctricos

80

..

~ so

.,

60

.u

40

.:

;:

20

Defecto
Cuenta
Porcentaje
%acum.

Alambre
defectuoso
40
40.0
40.0

Cortocircuito

en bobina
30
30.0
70.0

Clavija
defectuosa
25
25.0
95.0

Otros
5
5.0
100.0

La figura 2.9 es una presentacin MINITAB de la grfica de Pareto. Adems del anlisis de la grfica de barras, el anlisis de MINITAB de Pareto contiene una grfica de linea de porcentaje acumulado.
Observe las pendientes en la grfica de linea en la que las pendientes mayores representan los problemas que se presentan con ms frecuencia. Cuando las pendientes bajan, los problemas se presentan con
menor frecuencia. La grfica de lnea proporciona a quien tome decisiones otra herramienta para
determinar cules problemas resolver primero.

2.2 PROBLEMAS
2.6

Construya un histograma y un polgono de frecuencia para los siguientes datos.


Intervalo de clase
30-menor de 32
32-menor de 34
34-menor de 36
36-menor de 38
38-menor de 40
40-menor de 42
42-menor de 44
44-menor de 46

Frecuencia
7
15

21
34
24
17
8

CAPITULO

2.7

2.8

33

Construya un histograma y un polgono de frecuencia para los siguientes datos.


Intervalo de clase

Frecuencia

!O-menor de 20
20-menor de 30
30-menor de 40
40-menor de SO
SO-menorde 60
60-menor de 70
70-menor de 80

9
7
10
6
13
18
IS

Construya una ojiva para los siguientes datos.


Intervalo de clase
3-menor de 6
6-menor de 9
9-menor de 12
12-menor de IS
IS-menor de 18
18-menor de 21

2.9

2 TABLAS Y GRFICAS

Frecuencia
2

s
10
11

17

Construya una grfica de tallo y hoja usando dos dgitos para el tallo.
212
2S7
243
218
2S3
273
2SS

239
271
261
238
227
220
226

240
266
249
2S4
270
226

218
234
230
249
2S7
239

222
239
246
2SO
261
2S8

249
219
263
263
238
2S9

26S
2SS
23S
229
240
230

224
260
229
221
239
262

2.10 A continuacin aparece una lista de las compaas de contabilidad ms grandes de Estados
Unidos, junto con sus datos de ingresos netos para 1997 (millones de dlares), segn el Public
Accounting Report.
Firma

Andersen Worldwide
Emst&Young
Deloitte & Touche
I<PMG Peat Marwick
Coopers & Lybrand
PriceWaterhouse
Grant Tbornton
McGladrey & Pullen
BDO Seidrnan

Ingresos
$S44S
4416
3 600
2 698
2S04
2 344
289
270
240

Construya una grfica de pastel para representar estos datos. Aplique leyendas a las rebanadas con
los porcentajes apropiados. Comente sobre la efectividad de usar una grfica de pastel para exhibir los ingresos de estas empresas de contabilidad ms importantes.
2.11 Segn la Air Transport Association of Amrica, Delta Airlines encabez todas las lneas en cuanto al nmero de pasajeros transportados en un ao reciente. Las cinco principales aerolneas fueron Delta, United, American, U.S. Airways y Southwest. A continuacin aparece el nmero de
pasajeros transportados (en miles) por cada una de estas aerolneas:

34 ESTADISTICA EN LOS NEGOCIOS


Aerolnea

TABLA 2.7
Valor de construcciones
nuevas en un periodo
de 35 aos
Residmcial

No residencial

169635

96497

155113

115372

149410

96407

175822

129275

162706

140569

134605

145054

195028

131289

231396

155261

234955

178925

266481

163740

267063

160363

263385

164191

252745

169173

228943

167896

197526

135389

232134

120921

249757

122222

274956

127593

251937

139711

281229

153866

280748

166754

297886

177639

315757

175048

Fuente: U.S. Census Bureau, Current


Construction Reports (en millones

de dlares estables).

Pasajeros

Delta

103133

United

84 203

American

81 083

US Airways

58 659

Southwest

55 946

2.12 Information Resources, Inc. reporta que, en un ao reciente, Huggies fue la marca de
paales de mayor venta en Estados Unidos con 41.3% de la participacin en el mercado. Otras marcas que destacan son Pampers, con 25.6%, Luvs con 12.1 %, Drypers
con 3.3%, Fitti con 0.9%, y marcas libres con 15.8%. Utilice esta informacin para
construir una grfica de pastel de la participacin en el mercado de paales.
2.13 Los siguientes datos representan el nmero de pasajeros por vuelo en una muestra de
50 vuelos procedentes de Wichita, Kansas, a Kansas City, Missouri.
23

46

66

67

13

58

19

17

65

17

25

20

47

28

16

38

44

29

48

29

69

34

35

60

37

52

59

51

33

46

23

38

52

so

80

48

17

57

41

77

45

47

49

19

32

64

27

61

70

19

Construya una grfica de tallo y hoja para estos datos. Qu nos dice la grfica de tallo
y hoja acerca del nmero de pasajeros por vuelo?
2.14 Una aerolnea utiliza un banco central telefnico y un proceso semiautomtico telefnico para tomar reservaciones. Ha estado recibiendo un nmero anormalmente
alto de quejas de clientes acerca de este sistema de reservaciones. La compaia llev
a cabo un estudio de clientes, en el cual preguntaron si haban tenido cualesquiera de
los siguientes problemas al hacer reservaciones: tono de ocupado, desconexin, mala
conexin, demasiado tiempo en espera para hablar con alguien, no comunicarse con
un agente, conectado a extensin equivocada. Supongamos que el estudio de 744
dientes quejosos result en el siguiente total de frecuencia.
Nmero de quejas
184

Queja
Demasiado tiempo en espera

10

Transferido a extensin equivocada

85

No comunicarse

37

Desconexin

420
8

con un agente

Tono de ocupado
Mala conexin

Construya un diagrama de Pareto, a partir de esta informacin, para mostrar los diferentes problemas encontrados al hacer reservaciones.

2.3 DESCRIPCIN GRFICA DE DATOS NUMRICOS DE DOS VARIABLES:


GRFICAS DE DISPERSIN
En investigaciones de negocios, muchas veces es importante explorar la relacin entre dos variables
numricas. En los captulos 3 y 13 se exponen mtodos estadsticos ms detallados, pero aqu presentamos un mecanismo grfico para examinar la relacin entre dos variables numricas: la grfica de dispersin (o diagrama de dispersin). Una grfica de dispersin es una grfica en dos dimensiones donde

las parejas de los puntos son dos variables numricas.

Como ejemplo de dos variables numricas, considere los datos del la tabla 2. 7 donde aparecen los
valores de construcciones residenciales nuevas y no residenciales nuevas en Estados Unidos para varios

CAPITULO

h~11i' 111
Grfica MINITAB
oe dispersin de
construccin
-esidencial y
-o residenciet
ueva

2 TABLAS Y GRFICAS

35

180000
160000

5
~
zo

140000

-e

120000
100000
80000
120000

220000

320000

Residencial

aos en un periodo de ms de 35 aos. Tienen alguna relacin estas dos variables numricas? Podra
parecer lgico, cuando hay auge de construcciones que al mismo tiempo hubiera auge en construcciones residenciales y no residenciales; sin embargo, la grfica de dispersin MINITAB de estos datos que
se ve en la figura 2.10 muestra resultados mixtos. La aparente tendencia es que hay ms construccin
de edificios residenciales nuevos cuando tiene lugar ms construccin de no residenciales y menos
construccin de residenciales nuevos cuando est a menores niveles la construccin de no residenciales. La grfica de dispersin tambin muestra que en algunos aos hubo ms construccin de residenciales nuevos y menos construccin de no residenciales al mismo tiempo y viceversa.

2.3 PROBLEMAS
2.15 La U.S. National Oceanic and Atmospheric Administration, National Marine Fisheries Service,
publica datos sobre la cantidad y valor de pesca nacional en Estados Unidos. A continuacin aparece la cantidad (en millones de libras) de peces capturados y empleados para consumo humano
y productos industriales (aceite, carnada, alimento para animales, etc.) en ms de una dcada. Es
una relacin evidente entre la cantidad empleada para consumo humano y la usada para productos industriales para un ao dado? Construya una grfica de dispersin de los datos. Examine
la grfica y discuta la intensidad de Ja relacin de las dos variables.
Alimento humano

Productos industriales

3 654

2 828

3 547

2 430

3 285

3 082

3 238

3 201

3 320

3 118

3 294

2 964

3 393

2 638

3 946

2 950

4 588

2 604

6 204

2 259

2.16 Existe relacin entre el dinero invertido en publicidad por una compaia y los ingresos totales
por ventas? Los siguientes datos representan el dinero invertido en publicidad y los ingresos por
ventas para varias compaas en una industria dada durante un ao reciente. Construya una grfica de dispersin de los datos a partir de las dos variables y comente la relacin entre las dos
variables.

36 ESTADISTICA EN LOS NEGOCIOS

Publicidad
(en millones de dlares)

Vontas
(en millones do dlares)

4.2
1.6
6.3

155.7
87.3
135.6
99.0
168.2
136.9
101.4
158.2

2.7

10.4
7.1
5.5
8.3

Estado de la manufacturade autos


Debido a que los datos sin procesar del Dilema de decisin estn en millones, es ventajoso representar
grficamente los datos para el lector o el oyente. Como ejemplos de lo que se puede hacer grficamente, en la figura 2.11 se ilustran los datos de participacin en el mercado para 1999 en una grfica de pastel de MINITAB; los datos para 2000 se muestran en un histograma Excel en la figura 2.12.
Los datos de distribuidorasse pueden resumir si se usa una distribucin de frecuencia o una grfica de tallo y hoja. La siguiente distribucin de frecuencia de los datos muestra que los intervalos de
los datos son 69 - 30 = 39. Si los anchos de clase son 5 y la distribucin de frecuencia empieza en 30,
se necesita de 8 clases.

30-menor de 35
35-menor de 40
40-menor de 45
45-menor de 50
50-menor de 55
55-menor de 60
60-menor de 65
65-menor de 70

6
2

6
6
7

CONSIDERACIONES TICAS
Las consideraciones ticas para las tcnicas aprendidas en el capitulo 2 empiezan con los datos
escogidos para la representacin.Con la abundancia de datos disponibles en negocios, la persona que construya el resumen de datos debe ser selectiva al escoger las variables reportadas. El
potencial es grande para el analista que seleccionar las variables o incluso datos dentro de las
variables que sean favorables para su propia situacin o que se perciba sean bien recibidos por el
oyente.
La seccin 2.1 hizo notar que el nmero de clases y el tamao de los intervalos en distribuciones de frecuencia por lo general son seleccionados por el investigador,quien debe ser cuidadoso para seleccionar valores y tamaos que sean un reflejo honesto y exacto de la situacin y no
un caso sesgado, exagerado o subestimado.

En las secciones 2.2 y 2.3 estudiamos cmo construir cuadros y grficas sealando que en
muchos casos tiene sentido usar escalas desiguales en los ejes. No obstante, hacer esto ltimo abre
la posibilidad de "engallar con la estadstica"al alargar o comprimir los ejes para recalcar el punto
de vista del analista o investigador. Es imperativo que las distribuciones de frecuencia, asi como
tablas y grficas, se construyan de modo que reflejen datos reales y no simplemente la propia
observacin del investigador.

CAPITULO 2 TABLASY GRFICAS 37

Una grfica de tallo y hoja de estos datos aparecera como se ve a continuacin.


Tallo
4

5
6

Hoja
013444
0344444557799
12777889
o 112345567789

Es posible emplear una grfica de dispersin para examinar la relacin entre los datos de 1999 y 2000.
En la figura 2.13 aparece una grfica Excel de estas dos variables numricas.

-----11.
~~oastel
_:::;a.z.....:. a

Honda Motor (5.5%)


DaimlerChrysler

HyundaiMotor
(6.0%)

(ll.2%)

Toyota motor
(12.3%)

10000000
9000000

cz::s oe ventas
2

:ompaa

8000000
7000000

-;:
'Q
e

!!
e

6000000
5000000
4000000

-!t 3000000
2000000
1000000

o--'-'~-+-~1---+~+---+~+-__,f---+-~+---i

38

ESTADISTICA

EN LOS NEGOCIOS

ma11!111
Grfica de
dispersin de
una compaa
de ventas. Los
datos son de 1999
y 2000

10000000
9000000
8000000
7000000
o 6000000
o
o 5000000
"' 4000000
3000000
2000000
1000000

,,

RESUMEN
Los dos tipos de datos son agrupados y no agrupados. Casi
todo el anlisis de estadstica se realiza con datos no agrupados, es decir, sin procesar. Los datos agrupados son datos organizados en una distribucin de frecuencia. Es importante
distinguir entre datos agrupados y no agrupados, porque las
operaciones estadsticas en los dos tipos se calculan de modos
diferentes.
La construccin de una distribucin de frecuencia exige
varios pasos, el primero de los cuales es determinar el rango
de los datos, que es la diferencia entre el valor ms grande y el
valor ms pequeo y, a continuacin, se determina el nmero
de clases, que es una seleccin arbitraria del investigador. No
obstante, pocas clases agregan en exceso los datos en categoras
sin sentido y muchas clases no resumen los datos lo suficiente
para que sean tiles. El tercer paso en la construccin de una
distribucin de frecuencia es determinar el ancho del intervalo de clase. La divisin del rango de valores entre el nmero de
clases da el ancho aproximado del intervalo de clase.
La marca de clase es el punto medio de un intervalo de
clase. Es el promedio de los puntos finales de clase y representa el punto a la mitad del intervalo de clase. La frecuencia relativa es un valor calculado al dividir una frecuencia individual
entre la suma de las frecuencias. La frecuencia relativa representa la proporcin de valores totales que est en un intervalo
de clase dado. Es anloga a la probabilidad de sacar al azar, de
todos los valores, un valor de un intervalo de clase dado. La
frecuencia acumulada es una cuenta corriente de frecuencia
total que se inicia con el primer valor de frecuencia y suma
cada frecuencia resultante al total.
Los tipos de representaciones grficas presentadas en este
capitulo son histogramas, polgonos de frecuencia, ojivas, grficas de pastel, grficas de tallo y hoja, grficas de Pareto y
grficas de dispersin, La representacin grfica de datos es-'
especialmente til para ayudar a expertos en estadstica a
determinar la forma de distribuciones. Un histograma es una
grfica de barras verticales en donde un segmento de recta
enlaza puntos finales de clase en el valor de la frecuencia. Dos

rectas verticales enlazan este segmento de recta hasta el eje x,


formando as un rectngulo. Los histogramas estn tomando
una creciente importancia como herramienta inicial de anlisis. El experto en estadstica puede saber mucho acerca de la
forma de la distribucin, y otras importantes caractersticas
de los datos, si examina un histograma de los datos. Un polgono de frecuencia se construye al graficar un punto con la
marca de cada intervalo de clase por el valor de cada frecuenca y luego enlazar los puntos. Las ojivas son polgonos de frecuenda acumulada. Los puntos en una ojiva se grafican en los
puntos extremos de clase. La grfica de ojiva se inicia en el
comienzo del primer intervalo de clase con un valor de cero y
contina por los valores de las frecuencias acumuladas hasta
los puntos extremos de clase.
Una grfica de pastel es una representacin circular de
datos. La cantidad de cada categora se representa como una
rebanada del pastel proporcional al total. Las rebanadas se
determinan al multiplicar por 360 la proporcin de cada
categora, para calcular el nmero de grados del circulo asignados a cada categora El investigador debe tener cuidado con
el uso de grficas de pastel, porque a veces es difcil distinguir
los tamaos relativos de las rebanadas. Las grficas de tallo y
hoja son otra forma de organizar datos. Los nmeros se dividen en dos partes, un tallo y una hoja. Los tallos son los dgitos de la extrema izquierda de los nmeros y las hojas son
los dgitos de la extrema derecha. El investigador de negocios
determina cmo dividir los dgitos en tallos y hojas. Los tallos se
ponen en lista individualmente, con todos los valores de hoja
correspondientes a cada tallo mostrado junto a ese tallo.
Una grfica de Pareto es una grfica de barras verticales
que se utiliza en Administracin Total de la Calidad paramostrar grficamente la causa de problemas en orden descendente para ayudar a quien tome decisiones a priorizarlas. La
grfica de dispersin tiene dos dimensiones en parejas de
puntos que provienen de dos variables numricas y se utilizan
para determinar si existe cualquier aparente relacin entre las
dos variables.

CAPITULO 2 TABLAS Y

GRFICAS

39

[ TIHINOS CLAVE
frecuencia
grfica de
grfica de
grfica de

z;rupados
no agrupados
=i..."'Jn de frecuencias
'=IXDa acumulada

relativa
dispersin
Pareto
pastel

grfica de tallo y hoja


histograma
marca de ciase
ojiva

polgono de frecuencias
punto medio de clase
rango

PltOBLEMAS COMPLEMENTARIOS
de estadsticas

:_1- Para los siguientes datos, construya una distribucin de


frecuencia con seis clases.
57
26
46

23
51
43
41
42
46

50

31
28

35
47
29
19
52
33

18
29
23
36
29
28

2.22 Un examen de rechazos muestra por lo menos 1 O problemas. A continuacin veamos un total de frecuencia
de los problemas. Construya una grfica de Pareto para
estos datos.

21
21
39
28
18
20

Frecuencia

1
2

673
29
108
379
73
564
12
402
54
202

4
5
6
7
8
9
10

Para cada intervalo de clase de la distribucin de frecuencia dada, determine la marca de clase, la frecuencia
relativa y la frecuencia acumulada.
Intervalo de clase

Frecuencia

20-menor de 25
25-menor de 30
30-menor de 35
35-menor de 40
40-menor de 45
45-menor de 50

17
20
16
15
8
6

2.23 Construya una grfica de dispersin para las siguientes


dos variables numricas.

s.:.
12
17

Intervalo de clase

Frecuencia

SO-menor de 60
60-menor de 70
70- menor de 80
80-menor de 90
90-menor de 100

13
27
43
31
9

Construya una grfica de pastel a partir de los siguientes


datos.
Leyenda

Valor

A
B

55
121
83
46

e
D

312
314
290
306

324
309
311
286

289 335
294 "s26
317 301
308 284

10
14
8

2.24 La Whitcomb Company fabrica un anillo metlico para


motores industriales que por lo general pesa 50 onzas.
Una muestra aleatoria de 50 de estos anillos metlicos
produjo los siguientes pesos (en onzas).
53
53
44

56
42
52
41

50
57
56
52
63
46
50
52

44
46
50
69
42
36
62
43

47
55
57
53

46
51
54
47
47 52
53
58
51
38 49
39
44
55 43
42
57
49
Construya una distribucin de frecuencias p:tra estos
datos usando ocho clases. Qu puede usted observar
acerca de los datos a partir de la distribucin de frecuencias?
44
57

298
317
316
324

Pruebe sus conocimientos

51
53
41

2.21 Construya una grfica de tallo y hoja para los siguientes


datos. Haga que la hoja contenga un dgito.

10
15
8

!..19 Construya un histograma, un polgono de frecuencia, y


una ojiva para la siguiente distribucin de frecuencia.

~O

Problema

40

ESTADISTICA

EN LOS NEGOCIOS

2.25 Una compaa de distribucin ubicada en el noroeste de


Estados Unidos hizo una encuesta a 53 de sus gerentes
de nivel medio. La encuesta obtuvo las edades de estos
gerentes, los cuales posteriormente fueron organizadas en
la distribucin de frecuencia que se muestra a continuacin. Determine la marca de clase, frecuencia relativa y
frecuencia acumulada para estos datos.
Intervalo de clase
20-menor
25-menor
30-menor
35-menor
40-menor
45-menor

de 25
de 30
de 35
de 40
de 45
de 50

Frecuencia
8
6
5
12
15
7

2.26 A los siguientes datos se les ha dado aproximadamente la


forma de una distribucin normal (vase el captulo 6).
47.5
61.4
27.3
26.4
37.4
30.4
47.9
63.9
46.8 67.9
19.1
81.6
73.4
54.6 65.1
53.3
71.6 58.6
74.1
60.2
57.3
87.8
71.1
48.9
55.1
48.2
54.8
60.5
32.5
61.7
56.8
60.1
52.9 60.5
55.6
38.1
46.8
27.3
77.4
58.1
76.4
19.9
54.9 32.7
40.1
52.7
32.5
32.1
35.3
39.1
Construya una distribucin de frecuencias que inicie con
10 como el punto ms bajo de clase y utilice un ancho
de clase de 10. Construya un histograma y un polgono de
frecuencias para esta distribucin de frecuencias y observe la forma de una distribucin normal. Con base en los
resultados que obtenga de estas grficas, qu aspecto
tiene la distribucin normal?
2.27 Utilice los datos del problema 2.25.
a. Construya un histograma y un polgono de frecuencias.
b. Construya una ojiva.
2.28 En una ciudad del sur de tamao medio, 86 casas estn
en venta, cada una de unos 2 000 pies cuadrados de construccin. Los precios de ellas varan. La distribucin de
frecuencias que se ilustra contiene las categoras de precios para las 86 casas. Construya un histograma, un polgono de frecuencias y una ojiva a partir de estos datos.
Precio pedido
Frecuencia
$ 60 000-menor de S 70 000

70 000-menor
80 000-menor
90 000-menor
100 000-menor
110 000-menor

de 80000
de 90000
de 100 000
de 110000
de 120000

21
27
18
11
6
3

2.29 Una atencin prenatal buena y de costo relativamente


bajo puede evitar toda una vida de gastos debidos a
complicaciones que resultan del bajo peso de nacimiento de un beb. En un estudio muestra al azar se pidi a
57 madres primerizas que calcularan cunto gastan en
atencin prenatal. El investigador totaliz los resultados

y los present en la distribucin de frecuencias que se ve


a continuacin. Utilice estos datos para construir un histograma, un polgono de frecuencias y una ojiva.
Cantidad gastada en
atencin prenatal
$

O-menor
100-menor
200-menor
300-menor
400-menor
500-menor

Frecuencia de
madres primerizas

de $100
de 200
de 300
de 400
de 500
de 600

3
6
12
19
JI
6

2.30 Un grupo de consumidores hizo una encuesta de precios


de alimentos en 87 tiendas de la costa atlntica; entre
los precios de alimentos medidos estaba el azcar. De los
datos recolectados, el grupo construy la distribucin de
frecuencias de los precios de cinco libras del azcar
marca Domin en las tiendas encuestadas. Calcule un
histograma, un poligono de frecuencia y una ojiva para
los siguientes datos.
Precio

Frecuencia

$1.75-menor de $1.90
1.90-menor de 2.05
2.05-menor de 2.20
2.20-menor de 2.35
2.35-menor de 2.50
2.50-menor de 2.65
2.65 menor de 2.80

9
14
17
16
18
8

2.31 Los diez principales gneros musicales, segn SoundSean para un ao reciente, son R&B, alternativa (rock),
rap y msica country. A continuacin aparecen stos y
otros gneros musicales, junto con el nmero de lbumes vendidos de cada uno (en millones).
Gnero
R&B
Alternativa
Rap
Country
Pista
Metal
Clsica
Latina

lbumes vendidos
146.4
102.6
73.7
64.5
56.4
26.6
14.8
14.5

Construya una grfica de pastel para estos datos, que


muestre el porcentaje del total que representa cada uno
de estos gneros.
2.32 Las siguientes cifras de importaciones en Estados
Unidos de productos agrcolas y artculos manufacturados se tomaron de aos seleccionados entre 1970 y 2000
(en miles de millones de dlares). La fuente de los datos
es la U.S. lnternational Trade Administration. Construya
una grfica de dispersin para estos datos y determine
cualquier relacin evidente entre importaciones de productos agrcolas e importaciones de articulos manufacturados durante este periodo.

CAPfTUW 2 TABLAS Y GRFICAS 41

..,..._

lfODClas

27.3
54.0
133.0
257.5
388.8
629.7

[l.A

19.5
~.3
?9.3
~

Construya una grfica de tallo y hoja para los datos,


donde cada hoja contenga dos dgitos.

Articulas manufacturados

:..!
93

2.36

2656
2742
2200
2976
2344
2996

aparece una lista de industrias con el

i;Zs

~e
de descarga de productos qumicos
199 , segn la U.S. Environmental Protection

fl!CI..--.;. Construya
7

una grfica de pastel para represenmonnacin.


......,.
Descarga total (libras)
737 100 000
566 400 000
229 900 000
109 700000
102 500 000
89 300 000
85 900 000
63 300 000
29 100 000

F.is:Xm y caucho
~
& transporte

~&bcados

~dtrico
::3J

=rafila manufacturera produce botellas de plspzn b industria lechera. Algunas de las botellas son
=r'iazadas por su mala calidad. Las causas de botellas de
a!idad incluyen plstico defectuoso, etiquetas
=atas.
decoloracin, grosor incorrecto, agarradera
erres, Los siguientes datos para 500 botellas de
~que
fueron rechazadas incluyen los problemas y
,;a. ~cia
de los problemas. Utilice estos datos para
una grfica de Pareto. Analice las implicacio'XI de la grfica.
Problema
Nmuo

2301
2830
2764
2375
2760
2437

2975
2405
2337
2602
2555
2268

3002
2677
2961
2670
2524
2448

2468
2990
3010
2922
2814
2460

Construya una grfica de tallo y hoja para estos 30 valores, donde el tallo contenga dos dgitos .

tOS:&

i!'!cdla:msquunicos
~primarios

A continuacin aparece una lista de 30 diferentes promedios de acciones del Dow Jones industrial.

Interpretacin de salida de computadora


2.37 Suponga que son entrevistados 150 compradores en una
zona comercial de nivel econmico elevado, donde una de
las preguntas es el nivel de ingresos de la familia. Estudie
el histograma MTNITAB de los siguientes datos y discuta
qu se puede deducir acerca de los compradores.
30

Oe
""
~
u.

20
10

= .-

50 000
100 000
Ingresos de la familia en dlares

Dtco&oran

Gn>:.or
A?rradera rota

lla en plstico
Etiqueta

32
117
86
221
44

504~
.f.653
4730
-4;58
4866

-4116
525
53o6

-4199

5221
5556
5338
4963
5366
5858
4328
5048
4212
5263

4299
4361
4512
5090

5431
4346
4459
4232
5669
4339

5831
5737
4388
4822
5291
4734
5832
4878
4224
4834

2.38 A continuacin se ilustra una grfica de pastel producida


en Excel, que representa especialidades mdicas. Qu
dice esta grfica acerca de las diversas especialidades?
Especialidades mdicas
Psiquiatrla

::.:!> E:i d censo de 2000, una organizacin de investigacin


seleccion 50 poblaciones de Estados Unidos de entre
.f oon v 6 000 habitantes como muestra para representar
~os
poblados para fines de estudio. A continua3)o, los habitantes de estos pueblos.
+L"'ll

150 000

5750
4654
5923
4304
5254
5919
5873
5166
4440
5478

Anestesiologa

Medicina
familiar

Pediatrla

Ciruga general
2.39 Supongamos que se hace un estudio a 100 empresas de
contadores pblicos titulados, para determinar cuntas
auditorias realizan en un cierto tiempo. Los datos estn
resumidos con el uso de la grfica MINITAB de tallo y hoja

42 ESTADISTICA EN LOS NEGOCIOS

que se ilustra. Qu se puede saber acerca del nmero de


auditoras realizadas por estas empresas en la grfica?
Nmerosen tallo y hoja
TaUo y boja de nmero de auditorias N
Unidad de boja = 1.0
9
1
222333333
16
4445555
26
6666667777
35
1
888899999
39
2
0001
44
2
22333
49
2
55555
(9)
2
677777777
42
2
888889
000111
35
3
29
3
223333
23
3
44455555
15
67777
3
10
3
889
7
4
0011
3
4
222

100

2.40 La siguiente ojiva Excel muestra ventas de juguetes por


una compaa en un periodo de 12 meses. A qu conclusiones puede llegarse acerca de las ventas de juguetes
en esta compaa!

~e
~E
e

100

!!

"
',,

60

"'3"

=-

40

20

'!t

80

F<b.

Mar.

Abril

May.

Nov.
Sep.
Jul.
Jun.
Agos,
Oct.
Dic.
M<S

ANLISIS DE LA BASE DE DATOS


l. Con el uso de la base de datos de manufactura, construya
una distribucin de frecuencia para Ja variable, nmero de
trabajadores de produccin en todas las industrias. En
Excel la distribucin de frecuencias se refiere a un histograma. En MINITAB, produce una distribucin de frecuencias al construir un histograma que verifica Frecuencia
bajo Opciones y hacer clic en Mostrar Leyendas de Datos bajo
Anotacin, con lo cual deja ver las cuentas de frecuencia
de clase. Qu revela la distribucin de frecuencia acerca del
nmero de trabajadores de produccin?
2. Con el uso de la base de datos de mercado, construya un
histograma para la variable, Reported Trades. Qu forma
tiene el histograma? Es alto en la parte media o cerca de
uno o ambos puntos extremos? Es relativamente constan-

te en tamailo en las clases (uniforme) o parece no tener


forma? Parece estar normalmente distribuida?
3. Construya una ojiva para la variable, Type, en la base de
datos financiera. Las 100 compaas de esta base de datos
estn cada una clasificada en uno de siete tipos de cornpaas, Estos tipos aparecen en lista al final del captulo l.
Construya una grfica de pastel de estos tipos y comente
la salida. Por ejemplo, qu tipo es ms prevaleciente en la
base de datos y cul es el que menos se ve?
4. Con el uso de la base de datos de desempleo internacional,
construya una grfica de tallo y hoja para Italia. Qu
muestra la grfica acerca del desempleo para Italia en los
ltimos 40 aos? Qu es lo que no muestra la grfica?

CASO: LAS JABONERASPRESENTAN BATALLAS


Procter & Gamble ha sido la principal fabricante de jabn en
Estados Unidos desde 1879, cuando introdujo el jabn Ivory
(Marfil). No obstante, a finales de 1991 su principal rival,
Lever Bros. (Unilever), la rebas al alcanzar 31.5% del mercado de jabn personal con ventas de $1 600 millones, del
cual Procter & Gamble tuvo una participacin de 30.5%.
Lever Bros habla estado detrs de Procter & Gamble desde
que entr al mercado de jabones con Lifebuoy en 1895. En
1990 Lever Bros. introdujo un nuevo jabn, el Lever 2000,
en sus productos como jabn para toda la familia. Se cre un

nicho para este jabn por la segmentacin del mercado de


jabones en jabones especialmente para nios, mujeres y
hombres. Lever Bros. tuvo la idea de vender un jabn para
toda la familia y la respuesta del consumidor fue slida;
Lever 2000 vendi $113 millones en 1991, poniendo a Lever
Bros. delante de Procter & Gamble por primera vez en la
competencia de ingresos por venta de jabn personal.
Procter & Gamble todava vende ms jabn, pero las marcas
de Lever cuestan ms, con lo cual resulta en ventas ms altas
en general.

CAP!TUW 2 TABLASY GRFICAS 43


:;a

pa ~

decir que Procter & Gamble fue rpida

tma respuesta al xito del Lever 2000. Procter &

nrias estrategias posibles, incluyendo el repo-

_,

Safeguard, el cual se ha visto como jabn para

A i:nal de cuentas, Procter & Gamble respondi al


~su jabn para bao humectante Oil of Olay.
ziio de distribucin nacional, este producto fue
-.-a::a:o por un esfuerzo publicitario que cost $24 milloj:abn tuvo gran xito y Procter & Gamble vol-=z sa participacin en el mercado.
~representa las cantidades ms recientes de los
"Wm::z;:ks ptx>nes para uso personal en Estados Unidos, con
.._:eccmus ventas,Cada uno de estos jabones es producid.e cuatro fabricantes de jabones: Unilever, Procter
DW y Colgate-Palmolive.

....

D.:w
[h!

~~
->pring
Los:

e.res.
Ctrv
Spw"d

..::.:zs:

Fabricante
Unilever
Dial
Unilever
Colgate-Palmol.ive
Procter & Gamble
Procter & Gamble
Unilever
Procter & Gamble
Procter & Gamble
Dial

Ventas
($en millones)
271
193
138
121
115
94
93
69
48
44

, la participacin del mercado de jabn fue para


G3:nble con 37.1 %, Lever Bros. (Unilever) con 24%,
l:'
Colgate-Palmolive con 6.5% y los dems con
!'L"ll 1991, las participaciones del mercado de jabn
~
Bros. (Unilever) con 31.5%, Procter & Gamble
Dial con 19%, Colgate-Palmolive con 8% y los
.:IXl l l por ciento.

~os

que el estudiante est haciendo un reporte


:= Procter & Gamble que muestre su participacin en el
-m:::::adc Junto con la participacin de otras compaas
~
ia; aos 1983, 1991 y las ltimas cantidades. Con el
n sea de Excel o de MTNITAB, trace grficas de las par~mes
del mercado de jabn personal para cada uno
.% ~
aos. Para los datos de las ltimas cantidades,
~
que el total de "los dems" es de $119 millones.
observa sobre las participaciones del mercado de las
~
compaas al estudiar las grficas? En particular,
est Procter & Gamble respecto a aos anteriores?
~os que Procter & Gamble vende unos 20 millode iabones por semana, pero la demanda no es consy .a gerencia de produccin desea conocer cul es la

mejor manera en que se distribuyen en todo el ao. Las


siguientes cantidades en ventas, dadas en millones de jabones, representan las ventas de jabones por semana en todo
un ao. Construya un histograma que represente estos
datos. Qu ve usted en la grfica que pudiera ser til para
el personal de produccin (y ventas)?
17.1

19.6

15.4

17.4

IS.O

18.5

20.6

18.4

20.0

20.9

19.3

18.2

14.7

17.1

12.2

19.9

18.7

20.4

20.3

15.5

16.8

19.1

20.4

15.4

20.3

17.5

17.0

18.3

13.6

39.8

20.7

21.3

22.5

21.4

23.4

23.1

22.8

21.4

24.0

25.2

26.3

23.9

30.6

25.2

26.2

26.9

32.8

26.3

26.6

24.3

26.2

23.8

Construya una grfica de tallo y hoja con el uso de nmeros


enteros como los tallos. Qu ventajas ofrece la grfica de
tallo y hoja de estas cantidades de ventas sobre el histograma? Cules son algunas desventajas? Cul usara usted en
reuniones de trabajo con personal de produccin y por qu?
3. Se prueba la calidad de una muestra aleatoria de jabones
terminados y en sus envolturas. Se examinan las causas de
problemas de todos los jabones defectuosos. Entre los problemas encontrados estn: envoltura inapropiada, etiquetas
errneas, sello defectuoso, forma errnea del jabn, superficie estropeada del jabn, color errneo en el jabn, fragancia impropia, mala consistencia del jabn, entre otros.
Aqu se proporcionan algunas de las principales causas de
problemas y el nmero de ellas. Utilice una grfica de Pareto
para analizar estas causas de problemas. Con base en sus
hallazgos, qu recomendara usted a la compaia?
Causa del problema
Superficie del jabn
Color
Fragancia
Etiqueta
Forma
Sello
Etiquetado
Consistencia del jabn

Frecuencia
89
17
2
32
8
47
5
3

Fuente: adaptado de Valcric Reitman, '"Buoyant Sales of Lever 2000 Soap


Bring Sinking Sensation to Prceter & Gamble': Wall Strttt }01m1al1 19 marzo,
1992, p. 81. Reimpreso con premiso de The Wall Street Joumal, 1992, Dow
Iones & Company, lng. Todos los derechos reservados en el mundo; Pam
Weisz, "$40 M Extends 1.<0V<r 2000 Family~ Bmndwuk, vol. 36, num. 32 (21
de agosto de 1995), p. 6; Laurie Freernan, "P&G Pushes Back ?mSl Unilever
in Soap", Ad..,.,ismg Age, vol. 65, numero 41 (28 de septiembre ,1994), p. 21;
Ieanne Whalen and Pat Sloan, "tntros Help Boost Soap Coupons"; Adwrtismg
Age, vol. 65, nm. 19 (2 de mayo de 1994), p. 30; y "P&G Places Coast Soap
Up for Sale", The Post, World Wide Web Edition of The Ci11dnnati Post, 2 de
febrero de 1999, http://www.cincypost.com.business/pg022599.html.

44 ESTADISTICA EN LOS NEGOCIOS

USO DE LA COMPUTADORA
EXCEL
Con el Chart wizard, Excel ofrece la capacidad de producir
muchas de las tablas y grficas presentadas en este capitulo.
Adems, Excel puede generar distribuciones de frecuencia e
histogramas con el uso de D.ata analysis.
Muchas de las tcnicas de este curso se puede realizar en
Excel con el uso de una herramienta llamada .[!ata analysis.
Para tener acceso a Ja funcin D.ata analysis, seleccione Iools
en la barra de mens. D.ata analysis est ubicado en el fondo
del men de despliegue descendente. Si .[!ata analysis no aparece en este men, debe agregarse. Este agregado o mdulo
slo se hace una vez. Para agregar .[!ata analysis, seleccione
Add-jns en el men Iools. En la caja de dilogo Add-jns que
aparece, haga clic en Analysis ToolPak (no Analysis Too!PakVBAJ. Haga clic en OK (aceptar) y Analysis Too!Pak quedar
agregado a la capacidad de Iools.
Excel se refiere a las distribuciones de frecuencia como
histogramas. En Excel las clases se llaman bins (directorios). Si
el usuario no especifica bins, Excel automticamente determina el nmero de bins. Si el usuario desea especificar los bins,
cargue los puntos finales de clase en una columna. Para calcular la distribucin de frecuencia, seleccione Iools en la barra
de mens de Excel. Seleccione Uata analysis del men descendente Iools y seleccione Histogram de la caja de dilogo
.[!ata Analysis. Ponga la ubicacin de los valores sin procesar
de datos en Input Range. Si desea especificar los puntos finales de clase, ponga la ubicacin de los puntos finales en .Rin
Range. Si desea que Excel automticamente determine los
bins, deje esto en blanco. Si tiene etiquetas, entonces haga clic
en Labels. Si desea una grfica de histograma, haga clic en
.Chart Output en la parte baja de la caja de dilogo. Si desea
una ojiva, seleccione Curnulative Percentage junto con .Chart
Output, y Excel producir una grfica de histograma con una
ojiva sobrepuesta en la misma. Seleccione una de las opciones
de salida. Despus de hacer clic en OK se obtiene una distribucin de frecuencia como salida con bins y frecuencia junto
con una grfica de histograma.
Despus de construir una distribucin de frecuencia, el
usuario puede construir histogramas, polgonos de frecuencia
y ojivas con la funcin Chart Wizard. Para tener acceso a
Chart Wizard seleccione Insert en la barra de men. Del
men descendente seleccione .Chart Aqu se dispone de varias
tablas y grficas. La primera se llama Column, con la que es
posible construir una del tipo histograma. Estas tablas de
columna son en realidad grficas de barras verticales con
espacios entre las clases. Seleccione Column, y luego avance
por las cuatro cajas de dilogo que siguen, llenando la informacin apropiada. En la caja de rango de datos ponga la ubicacin de los bins y las frecuencias de la distribucin de
frecuencia. En el Chart Wizard es posible modificar los ttulos, ejes, leyendas y ubicacin de la salida segn se desee. Para
convertir una grfica de barras verticales en un histograma al
eliminar la brecha entre barras, haga clic con el botn derecho
del ratn sobre una de las barras de la grfica. Del men que
aparece, seleccione FQrmat Data Series. De la caja de dilogo

que aparece, seleccione Options. En el espacio junto a Gap


IDdth, ponga un cero o reduzca el nmero a cero. Haga clic en
OK, con Jo cual desaparece la brecha.
Es posible construir un polgono de frecuencias polgono
de frecuencia al seleccionar Line en el Chart Wizard. Los
pasos son prcticamente los mismos para la grfica Line (rengln) que para la grfica Column.
Para construir una ojiva, los datos deben ser acumulados
primero cuando la distribucin de frecuencia se est construyendo al hacer clic en Cumulative Percentage en la caja de
dilogo Histogram. El Chart W1Z8rdse puede usar entonces
para construir la ojiva al seleccionar grfica Line. Las cajas de
dilogo de cuatro pasos son prcticamente las mismas que las
empleadas para construir grficas de barras verticales y polgonos de frecuencia, excepto que en el paso 2 se debe seleccionar la ficha Series. Bajo Series, seleccione Frequency y
seleccione l!,emove, que deja al usuario con precisamente los
porcentajes acumulativos o una ojiva.
Para construir una grfica de pastel en Excel, cargue las
etiquetas (compaia, persona, etc.) en una columna y los valo-
res (frecuencia, valor en dlares, porcentaje, etc.) en otra
columna. Seleccione [nsert de la barra de mens, luego seleccione Chart del men descendente. Seleccione Pie de este
men y siga las instrucciones en los cuatro pasos. El usuario
tiene la opcin de incluir una leyenda, determinar qu etiquetas de datos usar, si as! lo desea, y determinar la ubicacin final
de la grfica de pastel.
Para construir una grfica de dispersin en Excel, cargue
los datos para cada variable en una columna separada.
Seleccione lnsert de la barra de men, luego seleccione Chart
del men descendente. Seleccione XY (ScatterJ de este men
y siga las instrucciones en los cuatro pasos. El usuario tiene la
opcin de incluir una leyenda, determinar qu etiquetas usar,
si as! lo desea y determinar la ubicacin final de la grfica de
dispersin.

MINITAB
MINITAB tiene la capacidad de construir histogramas, polgonos de frecuencia, ojivas, grficas de pastel, grficas de tallo y
hoja, grficas de Pareto y grficas de dispersin junto con lo
necesario para construir una distribucin de frecuencias. Con
excepcin de las grficas de Pareto, a las que se tiene acceso
mediante el S.tat, a todas estas tablas y grficas se tiene acceso al
seleccionar !iraph en la barra de mens.
Histogramas, polgonos de frecuencia y ojivas se construyen en el MINITAB con el uso de la opcin Histogram del
men descendente !lraph. Para empezar, inserte la ubicacin
de columna de los datos sin procesar en el primer rengln bajo
!lraph variables de la caja de dilogo Histogram. Es posible
hacer mltiples grficas al insertar ubicaciones en diversos
renglones bajo !lraph variables. En .[!ata display, seleccione
el tipo de grfica deseada. Utilice Bar para un histograma y
Connect para un polgono de frecuencias o una ojiva. Existen
diferentes opciones en esta caja de dilogo para establecer el
nmero de clases, dando a la grfica un titulo, modificar los

CAPITULO2 TABLAS Y GRFICAS 45

ejes, etc. La caja de dilogo {}!tions es especialmente importante para modificar el nmero de clases, determinar el tipo
de intervalos empleados y construir una ojiva. Para construir
una ojiva, seleccione Cumulative Frequency de la caja de dilogo {}!tions. Para construir un pollgono de frecuencias, un
histograma o para determinar frecuencia para una distribucin de frecuencia, seleccione frequency. Casi todo lo esencial
de una distribucin de frecuencia se puede obtener al construir un histograma, al seleccionar Annotation de la caja de
dilogo Histograrn y luego seleccionar Qata labeJs. En la caja
de dilogo Qata labels, haga clic en Show data labels. Esta
opcin agregar frecuencia a la grfica. A partir de estas frecuencia y los puntos finales de clases mostrados en la grfica,
se puede construir una distribucin de frecuencias.
Las grficas de pastel se construyen al seleccionar Pi~
Chart del men descendente Y.raph. En la caja de dilogo
Pi~ Chart, las dos principales opciones son !;hart data in y
Cbart table. Utilice la opcin !;hart data in si los valores a
usar al construir la grfica de pastel estn en una sola columna. Utilice la opcin Chart table si las categorlas estn en una
columna y los valores de frecuencia estn en otra columna.
Existen otras opciones, por ejemplo para ordenar las rebanadas de pastel, explorar rebanadas, colores o leyendas.
Las grficas de tallo y boja se construyen al seleccionar
Stem-and-leaf ... del men descendente !l_raph. En la caja de
dilogo Stem-and-leaf ... escriba la ubicacin de los datos y
haga clic en OK. La salida contiene tallos y hojas pero adems

da una cuenta de frecuencia acumulada arriba y abajo del


valor medio (que se muestra a la izquierda de la salida).
Para construir una grfica de Pareto, empiece por seleccionar Stat de la barra de mens. Del men descendente que
aparece, seleccione Quality Tools. Del men descendente
Quality Tools seleccione fareto Chart. De la caja de dilogo
fareto Chart seleccione Chart defects table si usted tiene un
resumen de los defectos con las razones (Labels) en una columna y la frecuencia de ocurrencia (.Erequencies) en otra
columna. Escriba la ubicacin de las razones en 1abels y la
ubicacin de las frecuencias en .Erequencies. Si tiene datos sin
resumir, puede seleccionar !;hart defects data in. En el espacio que aparece, d la ubicacin de la columna con todos los
defectos que se presentaron. Es posible tener los defectos ya
sea por nombre o con algn cdigo. Si usted desea tener las
etiquetas en una columna y los defectos en otra, entonces
seleccione BY variables in y ponga ah la ubicacin de las
etiquetas.
Para construir una grfica de dispersin, seleccione !l_raph,
luego seleccione flot En la caja de dilogo flot bajo Graph variables, ponga la ubicacin de la variable y en el primer espacio bajo Y y la ubicacin de la variable x en el segundo espacio
bajo X Es posible crear mltiples grficas al llenar los espacios junto a Graph 2, Graph 3, etc. Para obtener una grfica
de dispersin (en lugar de grfica de lnea, etc.), seleccione
Symbol bajo Display en la porcin Data display de la caja de
dilogo.

CAPTULO

Estadstica descriptiva
OBJETIVOS DE APRENDIZAJE
El captulo 3 se centra en el uso de tcnicas estadsticas para describir datos, con lo
cual el estudiante puede:
l. Distinguir entre medidas de tendencia central, medidas de variabilidad, medidas
de forma y medidas de asociacin.
2. Comprender los significados de media, mediana, moda, cuartil, percentil y rango.
3. Calcular media, mediana, moda, percentil, cuartil, rango, varianza, desviacin
estndar y desviacin media absoluta en datos no agrupados.
4. Diferenciar entre muestra y varianza de poblacin y desviacin estndar.
S. Comprender el significado de desviacin estndar como es aplicado al usar la regla
emprica y el teorema de Chebyshev.
6. Calcular la media, moda, desviacin estndar y varianza en datos agrupados.
7. Entender el sesgo, curtosis y grficas de caja y bigote.
8. Calcular el coeficiente de correlacin e interpretarlo.

46

Estadsticas de lavanderas
Segn Procter & Gamble, 35 mil millones de cargas de lavandera se ejecutan en Estados Unidos cada
aiio. Cada segundo se inician 1100 cargas. Las estadsticas demuestran que una persona en Estados
Unidos genera un cuarto de tonelada de ropa sucia cada ao. Los estadounidenses parecen estar pasando
ms tiempo lavando de lo que pasaban hace 40 aos. Hoy da, el promedio de mujeres estadounidenses pasa de siete a nueve horas a la semana en una lavandera, pero una investigacin de esa industria
muestra que el resultado es que hay ropa ms sucia que en otros pases desarrollados. Diversas compaas venden versiones nuevas y mejoradas de lavadoras y detergentes y, con todo, los estadounidenses
parecen resistirse a innovaciones de fabricantes de este equipo. En Estados Unidos, el promedio de
mquina lavadora emplea unos 16.galones de agua; en Europa esta cifra es de slo 4 galones. El promedio de ciclo de lavado de una mquina hecha en Estados Unidos es de unos 35 minutos, comparado con 90 en Europa. Los estadounidenses prefieren mquinas que se cargan desde arriba porque no
tienen que inclinarse, y estas ltimas mquinas son ms grandes. Los europeos emplean mquinas ms
pequeas que se cargan por el frente porque tienen espacios de vivienda ms reducidos.

Preguntasgerenciales y estadsticas
Prcticamente todas las estadsticas citadas aqu se obtienen de estudios o encuestas.
l. Supongamos que se lleva a cabo un estudio de uso de lavanderas en 50 casas en Estados Unidos
equipadas con lavadoras y secadoras. Se toman mediciones de agua en cuanto al nmero de
galones usados por cada lavadora en un ciclo. Los siguientes datos son el nmero de galones
empleados por cada lavadora durante el ciclo de lavado. Resuma los datos para que sea posible
reportar resultados de este e~tudio.
15 17 16 15 16 17 18 15 14 15
16 16 17 16 15 15 17 14 15 16
16 17 14 15 12 15 16 14 14 16
15 13 16 17 17 15 16 16 16 14
17 16 17 14 16 13 16 15 16 15
2. El promedio de ciclo de lavado para una mquina hecha en Estados Unidos es de 35 minutos.
Supongamos que la desviacin estndar de un ciclo de lavado para una mquina de este tipo es
de 5 minutos. Dentro de qu rango de tiempo caen la mayor parte de ciclos de lavado de una de
estas mquinas?
3. La cantidad de lavandera hecha al ao en una casa, est relacionada de alguna manera con el
ingreso familiar? Supongamos que ocho familias de dos adultos y dos niiios se eligen al azar
para un estudio. En un periodo de un ao, se lleva registro del peso de la ropa lavada por cada
familia, y se averigua su ingreso anual. De los siguientes datos de estudio, determine si existe
relacin entre el ingreso de esa familia y la cantidad de lavanderfa hecha (en peso).
Cantidad de lavandera
(peso en libras)
1210
875
l 890
1450

Ingreso familiar
(en miles de dlares)
42
31

2 040

110

1 330
660
1490
1950

60

68
45
56
72

93

Fuente: adaptado de Emily Nelson, "In Doing l.aundry,Americans Cling to Outmoded Ways",Wall Srreet fournal, 16 de mayo de
2002, pp. Al & AIO.

47

Cz
48

ESTADISTICA

EN LOS NEGOCIOS

El captuloZ describe tcnicas grficaspara organizar y presentar datos. Por ejemplo, tratamos de resumir 40 aos de porcentajes de desempleo para Francia con una distribucin de frecuencias, un histograma, un polgono de frecuenciasy una ojiva.Aun cuando estas grficaspermiten que el investigador
haga algunas observacionesgenerales acerca de la forma y dispersin de los datos, es posible obtener
una comprensin ms completa de ellos si se resumen mediante el uso de estadsticas. Este captulo
presenta medidas estadsticas, que incluyen medidas de tendencia central, de variabilidady de forma.
El clculo de estas medidas es diferente para datos no agrupados y agrupados. En consecuencia, presentamos algunas medidas para datos no agrupados y agrupados. Adems, se puede usar una de las
estadsticas presentadas para calcular la correlacin y relacin entre dos variables numricas.

3.1

MEDIDAS DE TENDENCIA CENTRAL: DATOS NO AGRUPADOS


Un tipo de medida que se utiliza para describir un conjunto de datos es la medida de tendencia central. Las medidas de tendencia central dan informacin acerca de la parte central, o media, de un grupo
de nmeros. La tabla 3.1 muestra precios ofrecidospara las 20 ofertas pblicas iniciales ms grandes en
Estados Unidos en un ao reciente, sein Securities Data. Para estos datos, las medidas de tendencia
central pueden dar informacin como Jo es el promedio de precio ofrecido,el precio medio ofrecido y
el precio ofrecido que se presenta con ms frecuencia. Las medidas de tendencia central no se concentran en el intervalo del conjuntode datos o en qu tan lejos estn los valoresdesde los nmeros del centro. Las medidas de tendencia central presentadas aqu para datos no agrupados son la moda, la
mediana, la media, percentilesy cuartiles.

Moda
La moda es el valor que se presenta con ms frecuencia en un conjunto de datos. Para los datos de la tabla
3.1, la moda es $19.00 porque el precio ofrecido que se present ms veces (4) fue $19.00. La organizacin de los datos en un conjunto ordenado (ordenacin de los nmeros de menor a mayor) ayuda a
localizar la moda. El siguientees un conjunto ordenado de valores de la tabla 3.1.
7.00
21.00

11.00
22.00

14.25
23.00

15.00
24.00

15.00
25.00

15.50
27.00

19.00
27.00

19.00
28.00

19.00
34.22

19.00
43.25

Esta agrupacin hace ms fcil ver que 19.00 es el nmero que se presenta con ms frecuencia.
En el caso de empate para el valor que se presenta con ms frecuencia, se hace una lista de dos
modas. Luego entoncesse dice que los datos son bimodales.Si un conjunto de datos no es exactamente birnodal pero contiene dos valores que son ms dominantes que otros, algunos investigadores se
toman Ja libertad de denominar al conjunto de datos como birnodal incluso sin un empate exacto para
la moda. Los conjuntos de datos con ms de dos modas se conocen como multimodales.
En el mundo de los negocios, el concepto de moda se usa con frecuencia al determinar medidas.
Por ejemplo, fabricantes de zapatos podran producir zapatos de bajo costo en slo tres anchos: pequeo, mediano y grande. Cada medida de ancho representa un ancho modal de pies. Al reducir el nme. ro de medidas a unas cuantas medidas modales, las compaas pueden reducir costos totales del
producto al limitar costos de preparacin de mquinas. Del mismo modo, la industria
del vestido produce camisas, vestidos, trajes y muchos otros productos de vestido en tallas
modales.Por ejemplo, todas las camisas talla M en un lote dado se producen en Ja misma
TABLA 3.1
talla",Esta talla es alguna medida modal para hombres de tamao medio.
La moda es una medida apropiada de tendencia central para datos de nivel nominal.
Precios de oferta para las 20
La moda se puede usar para determinar qu categora se presenta con ms frecuencia.
ms grandes ofertas pblicas
iniciales eri un ao reciente
$14.25

$19.00

$11.00

$28.00

24.00

23.00

43.25

19.00

27.00

25.00

15.00

7.00

34.22

15.50

15.00

22.00

19.00

19.00

27.00

21.00

Mediana
La mediana es el valor medio de un conjunto ordenado de nmeros. Para un conjunto con

un nmero impar de trminos, la mediana es el nmero de en medio. Para un conjunto


con un nmero par de trminos, la mediana es el promedio de los dos nmeros de en
medio.

CAPITUW 3 ESTADISTICADESCRIPTIVA 49
PASO l. Acomodar las observaciones en un conjunto ordenado de datos.
PASO 2. Para un nmero impar de trminos, hallar el trmino de en medio del conjunto ordenado. ste

es la mediana.
PASO 3. Para un nmero par de trminos, hallar el promedio de los dos trminos de en medio. Este promedio es la mediana.
Supongamos que un investigador desea determinar la mediana para los siguientes nmeros.
15

11

14

21

17

22

16

19

16

19

20

El investigador acomoda los nmeros en un conjunto ordenado.


3

11

14

15

16

16

17

19

19

20

21

22

Como el conjunto contiene J 7 trminos (nmero impar de trminos), la mediana es el nmero de


en medio, o sea 15.
Si se eliminara el nmero 22 'de la lista, el conjunto tendra slo 16 trminos.
3

11

14

15

16

16

17

19

19

20

21

Ahora, para un nmero par de trminos, el experto en estadstica determina la mediana al promediar los dos valores de en.medio, 14 y 15. El valor resultante de mediana es 14.5.
Otra forma de localizar la mediana es hallar el trmino (n + 1 )/2 en un conjunto ordenado. Por
ejemplo, si un conjunto de datos contiene 77 trminos, la mediana es el trmino 39. Esto es:
n + 1 77 + 1 78
-- = -- = - =
2

terrruno 39

Esta frmula es til cuando deba manipularse un gran nmero de trminos.


Considere los datos de precio ofrecido en la tabla 3.1. Debido a que este conjunto de datos contiene 20 valores o n = 20, la mediana para estos datos se localiza como (20 + 1)/2 o sea el trmino 10.5.
Esta ecuacin indica que la mediana est situada a la mitad entre los trminos 10 y 11, o sea el promedio de 19.00 y 21.00. As, el precio ofrecido mediano para las 20 ms grandes ofertas pblicas iniciales
en Estados Unidos es $20.00.
La mediana no resulta afectada por la magnitud de los valores extremos. Esta caracterstica es una
ventaja, porque valores grandes y pequei\os no influyen en forma desproporcionada en la mediana. Por
esta razn, la mediana es a veces la mejor medida de ubicacin a usar en el anlisis de variables como
son costos de casas, ingreso y edad. Supongamos, por ejemplo, que un corredor de bienes ralees desea
determinar la mediana del precio de venta de JO casas que aparecen con los siguientes precios:
$67 000
91 000
95000

$105 000
116 000
122 000

$148 000
167 000
189 000

$5 250 000

La mediana es el promedio de los dos trminos medios, $116 000 y $122 000, o sea $119 000. Este
precio es una representacin razonable de los precios de las 10 casas. Ntese que la que tiene un precio
de $5 250 000 no entr en el anlisis como no sea para contar como una de las 10 casas. Si el precio de
la dcima casa fuera $200 000, los resultados seran los mismos. No obstante, si los precios de todas
se promediaran, el precio promedio resultante de las 1 O casas originales serla de $635 000, ms alto que
nueve de los 10 precios originales.
Una desventaja de la mediana es que no usa toda la informacin de los nmeros. Por ejemplo, la
informacin acerca del precio especifico que se pide de la casa ms costosa no entra realmente en el
clculo de la mediana. El nivel de medida de datos debe ser por lo menos ordinal para que una mediana tenga sentido.

Media
La media aritmtica es el promedio de
dividirlos entre el total de ellos. Debido
tos en estadstica la Uaman simplemente
La media poblacional se representa
x. Las frmulas para calcular la media
siguen:

un grupo de nmeros; se calcula al sumar todos los nmeros y


a que la media aritmtica tiene tanto uso, casi todos los exper-

media.
con Ja letra griega mu(.). La media muestra! se representa con
poblacional y Ja media muestra! se dan en los recuadros que

50 ESTADISTICA EN LOS NEGOCIOS

MEDIA
POBLACIONAL
1

MEDIA
. MUESTRAL
1

11

11

La letra sigma mayscula griega (I,) se utiliza por lo comn en matemticas para representar una
suma de todos los nmeros de una agrupacin." De igual modo, N es el nmero de trminos de la
poblacin 11 es el nmero de trminos de la muestra. El algoritmo para calcular una media es sumar
todos los nmeros de la poblacin o muestra y dividir entre el nmero de trminos.
Una definicin ms formal de la media es:
N

x;
,=--r=J
N
Sin embargo, para los fines de este texto:
N

Ex denota l:x;
i=I

Es incorrecto usar la media para analizar datos que no sean por lo menos del nivel de intervalo en una
medicin.
Supongamos que una compaa tiene cinco departamentos con 24, 13, 19, 26 y 11 trabajadores
cada una. El nmero de trabajadores de la media poblacional en cada departamento es 18.6trabajadores. A continuacin veamos el clculo.
24
13
19

Ex=
y

26
ll
93

Ex 93
=-=-=18.6
11
5

El clculo de una media muestra! utiliza el mismo algoritmo que para una media poblacional y
producir la misma respuesta si se calcula con los mismos datos. No obstante, es incorrecto calcular una
media muestra! para una poblacin o una media poblacional para una muestra. Debido a que poblaciones y muestras son importantes en estadstica, es necesario el uso de un slmbolo por separado para
la media poblacional y para la media muestra!.

PROBLEMA DE
DEMOSTRACIN
3.1

A continuacin aparece el nmero de autos en servicio en las principales compaas de renta de


autos de Estados Unidos en un ao reciente, segn Auto Renta/ News.
Compaa

Enterprise
Hertz
ANC Rental Group
Avis
Budget
Dollar
Thrifty
U-Save
Toyota
Rent-a-Wreck
Advantage
Payless

ACE

Nmero da autos en servicio


460 000
350 000
322 000
220 000
146 000
78 000
51 000
15 000
12 000
12 000
12 000
B 000
8 000

La matemtica de las sumas no se estudia aqui. En el CD~ROM se incluye una explicacin ms detallada.

ff

CAPITULO 3 ESTADISTICA DESCRIPTI\">.

51

Calcule la moda, la mediana y la media.


Solucl6n

Moda:
Mediana:
Media:

12 000
Con 13 diferentes compaas en este grupo, n = 13. la mediana est situada en la
posicin (13 + 1)/2 = 7a. Como los datos ya estn ordenados, el sptimo trmino es
51 000, que es la mediana.
El nmero total de autos en servicio es 1 694 000 = Ix
,=Ex=

1694000=130 307.7
13

La media es afectada por todos y cada uno de los valores, que es una ventaja. La media utiliza todos
los datos y cada rengln de ellos influye en la media. Tambin es una desventaja, porque valores extremadamente grandes o pequeos pueden dirigir la media hacia el valor extremo. Recuerde el anlisis
precedente de los precios de 1 O casas. Si la media se calcula para las 1 O casas, el precio medio es ms
alto que nueve de las casas porque la de $5 250 000 est incluido en el clculo. El precio total de las 10
casas es $6 350 000 y el precio medio es $635 000.
La media es la medida de ubicacin ms comnmente empleada porque utiliza cada rengln de
datos en su clculo, es una medida conocida y tiene propiedades matemticas que la hacen atractiva
para usarla en anlisis estadstico inferencial.

Percentiles
Los percentiles son medidas de tendencia central que dividen tm grupo de datos en 100 partes. Hay
99 percentiles, porque se requiere de 99 divisores para separar un grupo de datos en 100 partes. El n-simo
percentil es el valor tal que al menos 11 por ciento de los datos estn bajo ese valor y a lo sumo (100 - n)
por ciento estn arriba de ese valor. Especficamente, el percentil 87 es un valor tal que al menos 87%
de los datos estn abajo del valor y no ms de 13% estn arriba del valor. Los percentiles son valores en
escaln, como se ve en la figura 3.1, porque el percentil 87 y el percentil 88 no tienen percentil entre
ellos. Si el operador de una planta toma un examen de seguridad y 87.6% de las calificaciones del examen de seguridad estn abajo de la calificacin de esa persona, l o ella todava califican con slo el percentil 87, aun cuando ms de 87% de las calificaciones son menores.
Los percentiles se utilizan ampliamente para reportar resultados de pruebas. Casi todos los estudiantes de facultades o universidad han tomado el examen SAT, ACT, GRE o GMAT. En la mayor parte
de los casos, los resultados de estos exmenes se reportan en forma de percentil y tambin como calificaciones sin procesar. A continuacin se muestra un resumen de los pasos empleados para determinar
la ubicacin de un percentil.

Pasos para determinar la ubicacin de un percentil


l. Organizar los nmeros en un conjunto de orden ascendente.
2. Calcular la ubicacin del percentil () con:

i=....!:_(n)
100

donde:
P = el percentil de inters
i = ubicacin de percentil
n = nmero del conjunto de datos

lj@'l;!Jl ..
Percentiles en
escalera

1-----------------------l;ijiiiiiiii~-;pe:r:c.:n:t~ils8;1

1
percentil 86

percentil 87

52 ESTADISTICA EN LOS NEGOCIOS

3. Determine la ubicacin de (a) o de (b).


a. Si i es un nmero entero, el P-simo percentil es el promedio del valor en la i-sima ubicacin y el valor en la (i + !)va ubicacin.
b. Si i no es un nmero entero, el valor del P-simo percentil est ubicado en la parte del nmero entero i + l.
Por ejemplo, supongamos que el estudiante desea determinar el percentil 80 de 1240 miembros. P
es 80 y n es 1240. Primero, ordene los nmeros de menor a mayor. A continuacin, calcule la ubicacin
del percentil 80.
j

= ~(1240) = 992
100

Como i = 992 es un nmero entero, siga las instrucciones del paso 3(a). El percentil 80 es el promedio del nmero 992 y el nmero 993.
p

_ (992 nmero
80 -

PROBLEMA DE
DEMOSTRACIN
3.2

+ 993
2

nmero)

Determine el percentil 30 de los siguientes ocho nmeros: 14, 12, 19, 23, 5, 13, 28, 17:
Soluci6n
Para estos ocho nmeros, deseamos hallar el valor del percentil 30, de modo que n
Primero, organizamos los datos en orden ascendente:

5
12
13
14
17
A continuacin, calculamos el valor de i.

19

23

= 8 y P = 30.

28

i=~(8)=2.4
100

Como i no es un nmero entero, debe usarse el paso 3(b). El valor de i + 1 es 2.4 + 1, o sea
3.4. La parte del nmero entero de 3.4 es 3. El percentil 30 est ubicado en el tercer valor. El tercer valor es 13, de modo que 13 es el percentil 30. Ntese que un percentil puede o no puede ser
uno de los valores de datos.

Cuartiles
Los cuartiles son medidas de tendencia central que dividen un grupo de datos en cuatro subgrupos o partes. Los tres cuartiles estn denotados como 01, 02 y 03 El primer cuartil, 01, separa el primer, o ms
bajo, cuarto de los datos de los tres cuartos ms altos y es igual al percentil 25. El segundo cuartil, 02,
separa el segundo cuarto de los datos del tercer cuarto. 02 est ubicado en el percentil 50 y es igual a la
mediana de los datos. El tercer cuartil, 03, divide los primeros tres cuartos de los datos del ltimo cuarto y es igual al valor del percentil 75. Estos tres cuartiles se muestran en la figura 3.2.
Suponga que desearnos determinar los valores de 01, 02 y Q3 para los siguientes nmeros.
106

109

114

116

121

122

O@i1tt1..
Cuartiles

primer un cuarto
primeros dos cuartos
primeros tres cuartos

125

129

CAPITULO 3 ESTADISTICA DESCRIPTIVA

53

El valor de Q1 se encuentra en el percentil 25, P25, con:


paran =B, i=~(8)=2
100
Como i es un nmero entero, Pis se encuentra como el promedio de los nmeros segundo y tercero,
(109+ 114) = 111.5

2
El valor de Q1 es Pis= 111.5. Ntese que un cuarto, o dos, de los valores (106 y 109) son menores a 1115.
El valor de Q2 es igual a la mediana. Como el conjunto contiene un nmero par de trminos, la
mediana es el promedio de los dos trminos de en medio.

Q2 =mediana= (1 l6+121)

118.5

Ntese que exactamente la mitad de los trminos son menores a Q2 y la mitad son mayores a Q2
El valor de Q3 se determina con P75 como sigue:
i=~(8)=6
100
Como i es nmero entero, P75 es el promedio de los nmeros sexto y sptimo.

F5 = (122+125)

123.5

El valor de Q3 es P75 = 123.5. Ntese que tres cuartos, o seis, de los valores son menores a 123.5 y dos
de los valores son mayores a 123.5.

PROBLEMA DE
DEMOSTRACIN
3.3

Lo siguiente muestra ingresos de las principales organizaciones de publicidad del mundo, segn
Advertising Age. Determine el primero, segundo y tercer cuartiles para estos datos.

Organizecin publicitllri

Oficln matriz

Ingreso bruto en el mundo


(Smillonff)

WPP Group
lnterpublic Group of Cos.
Omnicom Group
Publicis Communication
Dentsu
Havas Adversiting
Grey Adversiting
Cordination Communications Group
Hakuhodo
Asatsu
TMP Worldwide
Carlson Marketing Group
lncepta Group
OigitasA
Tokyu Agency
Daiko Adversiting

Londres
Nueva York
Nueva York
Pars
Tokio
Pars
Nueva York
Londres
Tokio
Tokio
Nueva York
Minnepolis
Londres
Boston
Tokio
Tokio

8 165
7 981
7 404
4 770
2796
2733
1 864
1 175
874
396
359
356
248
236
204
203

Solucin
Para 16 organizaciones publicitarias, n = 16. 01 = P25 se encuentra con:
i=~(16)=
100

54 ESTADISTICA EN LOS NEGOCIOS


Como i es nmero entero, 01 es el promedio de los valores cuarto y quinto desde abajo.
= 248 + 356
2

01

302

02 = P50 = mediana; con 16 trminos, la mediana es el promedio de los trminos octavo y


noveno.
02=874+1175=1

024.5

P75 se resuelve con:


r=~(16l=12
100

~se

encuentra al promediar los trminos doceavo y treceavo.

o3-- 2 796+4
2

3.1

770

3 783

PROBLEMAS
3.1

Determine
2

la moda para los siguientes nmeros:

3.2

Determinar la mediana para los nmeros del problema 3.1.

3.3

Determinar la mediana para los siguientes nmeros:


213

3.4

345

3.8

243

444

524

199

682

44.5

31.6

40.0

52.8

38.8

30.1

78.5

-2

-3

-6

-7

-4

-5

-8

Calcular el percentil 35, el percentil 55, Q, Q2 y Q3 para los siguientes datos:


16

3.7

167

Calcular la media para los siguientes nmeros:


7

3.6

073

Calcular la media para los siguientes nmeros:


17.3

3.5

609

28

29

13

17

20

11

34

32

27

25

30

19

18

33

Calcular P20, P47, P83, Q1, Q2 y Q3 para los siguientes datos:


120

138

97

118

172

144

138

107

94

119

139

145

162

127

112

150

143

80

105

116

142

128

116

171

Los siguientes datos muestran el nmero de autos y camiones ligeros en un ao reciente entre los
principales fabricantes de autos en el mundo, reportados por AutoFacts, unidad de Coopers &
Lybrand Consulting. Calcular la media y mediana. Cul de estas medidas es la ms apropiada
para resumir los datos y por qu? Cul es el valor de Q2? Determine el percentil 63 para los datos.
Determine el percentil 29 para los datos.

CAPITUlo3

Pabricante

55

Produccin (en miles)

General Motors
Ford Motors
Toyota
Volkswagen
Chrysler
Nissan
Honda
Fiat
Peugeot
Renault
Mitsubishi
Hyundai
BMW
Daimler-Benz
Daewoo
3_9

ESTADISTICA DESCRIPTIVA

7 880
6 359
4 580
4161
2 968
2646
2 436
2 264
1 767
1 567
1 535
1 434
1 341
1 227
898

La siguiente es una lista de los principales bancos del mundo clasificados por activos segn

American Banker. Calcular la mediana, Q3, P20 P60, Pso y P93.


Activos (miles de
millones de dlares)

Banco
Citigroup (Nueva York)
Deutsche Bank (Frankfort)
Bank of Tokio-Mitsubishi
J. P. Morgan Chase (Nueva York)
UBS (Zurich)
HSBC Holdings (Londres)
BHV AG (Munich)
BNP-SG-Paribas(Pars)
BankAmerica (Charlorte)
ING NV (Amsterdam)

902
873

721
715
674
673
654
652
642
613

3.10 La siguiente es una lista del nmero de accidentes mortales por aerolnea comercial de vuelos
regulares en un periodo de 17 aos, segn la Air Transportation Association of America. Con
estos datos, calcular la media, la mediana y la moda. Cul es el valor del tercer cuartil? Determine

P11, P35, Pss Y P61


4

3.2 MEDIDAS DE VARIABILIDAD: DATOS NO AGRUPADOS


Las medidas de tendencia central dan informacin acerca de puntos particulares de un conjunto de
datos. No obstante, investigadores de negocios pueden usar otro grupo de herramientas anahticas para
describir un conjunto de datos. Estas herramientas son medidas de variabilidad, que describa: la 1fpersin de un conjunto de datos. Con el uso de medidas de variabilidad en conjuncin con medidas de
tendencia central es posible obtener una descripcin numrica ms completa de los datos.
Por ejemplo, una compaa tiene 25 vendedores en el campo y la mediana anual de Ymtb ?4r.l
estas personas es de $1.2 millones. Tienen o no tienen xito estos vendedores como grup:Y. La mediana da informacin acerca de las ventas de la persona del medio, pero qu hav de !0$ ouos ftnciedcres~
Todos venden $1.2 millones anualmente o varan mucho estas cifras, con una persona qne .-mde $5
millones al ao y otra slo $150 000 al ao? Las medidas de variabilidad proporcionan la informacin
adicional necesaria para contestar esa pregunta.

56 ESTADISTICA EN WS NEGOCIOS

La figura 3.3 muestra estas tres distribuciones en las que la media de cada distribucin es la misma
(. = SO) pero las variabilidadesdifieren. La observacin de estas distribuciones muestra que una medida de variabilidad es necesaria para complementar el valor medio al describir los datos. Los mtodos
de las medidas de variabilidad de clculo difieren para datos no agrupados y agrupados. Esta seccin se
concentra en siete medidas de variabilidad para datos no agrupados: rango, rango intercuartil, desviacin media absoluta, varianza, desviacin estndar, valor de Z y coeficiente de variacin.

Rango
El rango es la diferencia entre el valor ms grande de un conjunto de datos y el valor ms pequeo. Aun
cuando por lo general es un solo valor numrico, algunos investigadoresde negocios definen el rango
como el par ordenado de nmeros ms grande y ms pequeo (ms pequeo, ms grande). Es una
medida burda de variabilidad que describe la distancia a los lmites exteriores del conjunto de datos.
Reflejaesos valores extremos porque se construye a partir de ellos. Una ventaja del rango es su facilidad de clculo. Un uso importante del rango es en aseguramiento de la calidad, donde el rango se
emplea para construir grficas de control. Una desventaja del rango es que, como se calcula con los
valores que estn en los extremos de los datos, stos son afectados por los valores extremos. Por tanto,
su aplicacin como medida de variabilidad es limitada.
Los datos del la tabla 3.1 representan los precios ofrecidos para las 20 principales ofertas pblicas
inicialesde Estados Unidos en un ao reciente. El precio ms bajo de oferta es de $7.00 y el ms alto de
$43.25. El rango de los precios ofrecidos se puede calcular como la diferencia de los valores ms alto y
ms bajo:
Rango = Ms alto - Ms bajo = $43.25 - $7.00 = $36.25

Rango intercuartil
Otra medida de variabilidad es el rango intercuartil.El rango intercuartil es el rango de valores entre el
primero y tercer cuartiles. En esencia, es el rango de 50% central de los datos y se determina al calcular
el valor de <2J - Q1 El rango intercuartil es especialmente til en situaciones donde los usuarios de
datos estn ms interesados en valores hacia el medio y menos interesados en los extremos. Al describir un mercado de viviendas, los corredores de bienes races podran usar el rango intercuartil como
medida de precios de viviendas cuando describan la mitad media del mercado a compradores interesados en casas con valoresde rango medios. Adems, el rango intercuartil se utiliza en la construccin
de grficas de caja y bigote.
RANGO INTERCUARTII.

Los siguientes datos indican los 15 principales socios de Estados Unidos por exportaciones de ese
pas a otros pases en un ao reciente, segn la U.S. Census Bureau.
Exportaciones
Pas
Canad
Mxico
Japn
Reino Unido
Corea del Sur
Alemania
Taiwn
Pases Bajos
Singapur
Francia
Brasil
Hong Kong
Blgica
China
Australia

($miles de millones)
$151.8
71.4
65.S
36.4
25.0
24.S
20.4
19.8
17.7
16.0
15.9
15.1
13.4
12.9
12.1

CAPITULO 3 ESTADISTICA DE.SOUl"Il\ \ 5"i

Tres distribuciones
con la misma
media pero
diferentes
dispersiones.
, = 50

Cul es el rango intercuartil para estos datos? El proceso empieza al calcular los cuartiles primero y tercero como sigue:
Despejando Q1 = P25 cuando n = 15:
25
.
i=-(15)=3.75
100
Como i no es un nmero entero, entonces P25 es el cuarto trmino desde abajo.
Q = P2s = 15.1

Al despejar Q3 = P75:
i=~(l5)=11.25
100
Como i no es un nmero entero, se encuentra que P75 es el trmino 12 desde abajo.

El rango intercuartil es:


Q3 - Q = 36.4 - 15.I = 21.3
El 50% medio de exportaciones de los 15 principales socios comerciales de Estados Unidos abarca
un rango de 21.3 ($miles de millones) .

..

Jid.!(ii[!.ijll"fjliJ+Ii!.illi!!.t..

Estaclfsticasde telecomunicaciones
Un estudio realizado ,por Telework America patrocinado
por AT&T en 2001 revel que 28 millones de estadounidenses trabajan por computadora a distancia (teletrabajo).
De stos, 24.1% trabajan de viaje, 21.7% trabajan fuera de
sus casas, 7.5% trabaja en centros de trabajo a distancia y
4.2% trabajan en oficinas por satlite. Ms de 40% de estas
personas trabajan en ms de un lugar. Se estima que 30
millones de teletrabajadores estarn laborando en Estados
Unidos para finales de 2004.
El teletrabajador tpico vive en el Oeste o el Noreste, es
hombre, tiene educacin universitaria, tiene entre 35 y 44
aos de edad, es casado y gana por lo menos $40 mil al ao.
El ingreso medio para teletrabajadores es de S44 mil. La
mayora de ellos trabajan en impuestos {IT), bienes ralees o
administracin de empresas. Los teletrabajadores, por lo
general, viajan en automvil unas 18 millas al trabajo y
ahorran casi 53 minutos de tiempo de viaje cada da de trabajo hbil en que laboran a distancia. En promedio, trabajan uno o dos dlas por semana fuera de casa.
Los teletrabajadores estn relativamente satisfechos
con su trabajo. Setenta y cinco por ciento de quienes traba-

jan en casa reportaron un ingreso cuantificable, en productividad y calidad de trabajo, cuando cambiaron de trabajos
tradicionales en oficinas a trabajar a distancia. Dos tercios
de teletrabajadores expresaron ms satisfaccin en su trabajo y dicen que lo hacen ms horas que quienes no trabajan a distancia, pero que sus trabajos interfieren menos con
sus vidas personales.
Trabajar a distancia puede ahorrar costos para las
empresas debido a que no hay ausentismo, disminucin de
costos en bienes ralees y que el trabajo se con sen-a por mS
tiempo. Se estima que empicados que trabajan a dstaDcia
pueden ahorrar a sus empleadores un promedio de SIO
cada uno al disminuir el ausentismo y cansen-ar ms txm
po el trabajo. Los costos de bienes races se pueden reduru
de 25 a 90%. AT&T ahorra $3 mil anualmente por trXa3bajador y $25 millones al ao en costos de bienes r2icrS por
empleados que son de tiempo completo.

,,...,.te;

adaptado de YouCanWorkfromAn)~
a>m
......,.
ycwfa.comnfoccntcrrfacts.htm; Ioni Kislntt "A=w! Sar....... ~
Dcbunk Telework Mvths~ Na. l\\rrm :!9 do< oad!re do< _ 1 m
http://www.nwfusion.c~m/nct.worhr rolummsul!OC ~h!ml.

58 ESTADISTICA EN LOS NEGOCIOS

Desviacin media absoluta, varianza y desviacin estndar


Otras tres medidas de variabilidad son la varianza, la desviacin estndar y la desviacin media absoluta. Se obtienen por medio de procesos similares y, por tanto, se presentan juntas. Estas medidas no
tienen sentido a menos que los datos sean por lo menos de nivel de intervalo. La varianza y desviacin
estndar se utilizan ampliamente en estadstica. Aun cuando la desviacin estndar tiene un potencial
independiente, lo importante de la varianza y la desviacin estndar est principalmente en su papel
como herramientas empleadas junto con otros procedimientos estadsticos.
Supongamos que una pequea empresa inici una lnea de ensamble para fabricar computadoras.
Durante las primeras cinco semanas de trabajo, la produccin es 5, 19, 16, 17 y 18 computadoras, respectivamente. Qu estadstica descriptiva podrla usar el propietario para medir el primer avance de
produccin? En un intento por resumir estas cantidades, el propietario podrla calcular una media.
X

5
9

16
17
18

Ex=65

Ex

65

tt=-=5=13

Cul es la variabilidad en estas cinco semanas de datos? Una forma en la que el propietario
comience a ver la dispersin de los datos es restando la media de cada uno de los datos. Restar la media
a cada valor de datos da la desviacin respecto a la media (x - ,). La tabla 3.2 muestra estas desviaciones para la produccin de computadoras. Ntese que algunas desviaciones respecto a la media son
positivas y algunas son negativas. La figura 3.4 muestra que geomtricamente estas desviaciones negativas representan valores que estn abajo (a la izquierda) de la media y las desviaciones positivas representan valores que estn arriba (a la derecha) de la media.
Un examen de desviaciones respecto a la media puede revelar informacin sobre la variabilidad de
datos. No obstante, las desviaciones se utilizan casi siempre como herramienta para calcular otras medidas de variabilidad. Ntese que en la tabla 3.2 y en la figura 3.4, el total de estas desviaciones es cero.
Este fenmeno se aplica a todos los casos. Para un conjunto de datos dado, la suma de todas las desviaciones respecto a la media aritmtica es siempre cero.

T~BLA 3.2

Dlrrild6eele la media (X - fa)

Nthncro(x)

Desviaciones de
la media para
produccin de
computadoras

l:x =

5-13 = -8

9-13 = -4

16

16-13+3

17

17-13 = +4
18-13=+5

1!

I.(x- )=O

65

-8
Distancias
geomtricas desde
la media (de la
tabla 3.2)

-4

13

16 17 18

CAPITULO 3 ESTADISTICA DESCRIPTI\

LA SUMA DE DESVIACIONES
RESPECTO A LA MEDIA
ARITMETICA ES SIEMPRE CERO

I(x-

59

)=o

Esta propiedad exige considerar los modos alternativos para obtener medidas de variabilidad.
Una forma obvia para forzar la suma de desviaciones para que tenga un total diferente de cero es
tomar el valor absoluto de cada desviacin alrededor de la media, con lo cual es posible despejar la desviacin media absoluta.

Desviacin media absoluta

La desviacin media absoluta (MAD) es el promedio de los valores absol11tos de las desviaciones alrededor de la media para un conjunto de nmeros.
DESVIACIN MEDIA
ABSOLUTA

MAD

= Elx - I
N

Con el uso de los datos de la tabla 3.2, el propietario de la compaia de computadoras puede calcular una desviacin media absoluta al tomar los valores absolutos de las desviaciones y prornediarlos,
como se muestra en la tabla 3.3. La desviacin media absoluta para los datos de produccin de computadoras es 4.8.
Debido a que se calcula con el uso de valores absolutos, la desviacin media absoluta es menos til
en estadstica que otras medidas de dispersin. No obstante, en el campo de pronsticos, se usa ocasionalmente como medida de error.

Varianza
Como los valores absolutos no conducen a una manipulacin fcil, expertos en matemticas crearon
un mecanismo alternativo para superar la propiedad de sumacero de desviaciones desde la media. Este
mtodo utiliza el cuadrado de las desviaciones a partir de la media. El resultado es la varianza. una
importante medida de variabilidad.
La varianza es el promedio del cuadrado de desviaciones alrededor de la media aritmtica para un
conjunto de nmeros. La varianza de poblacin est denotada por u2.
1 VARIANZA POBLACIONAL

E(x-1)2

u=----

La tabla 3.4 muestra los nmeros de produccin original para la compaa de computadoras, las
desviaciones desde la media y el cuadrado de desviaciones desde la media.

La sama del cuadradode las desviaciones alrededor de la media de un conjunto de valores -Ilamada
suma de cuadrados de x y a veces abreviada como SS,,- tiene amplio uso en estadfstica. Para la compaa de computadoras, este valor es 130. Al dividirlo entre el nmero de valores de datos (5 semanas)
se obtiene la varianza para la produccin de computadoras.
u2
TABLA 3.3
Desviacin de
media absoluta
(MAD) para datos
de produccin de
computadoras

j%-I'!

%-p.

+8

-8
-4

16

+3

+3

17

+4

+4

+S

+5

l:x - 65

I(x -

) = o

MAD = ~=

+4

Ijx24

j = 24

= 4.8

=~=
5

26.0

60 ESfADISTICA EN LOS NEGOCIOS


Debido
sa en trminos

a que la varianza
de unidades

se calcula

desde el cuadrado

de medida

cuadradas.

de desviaciones,

el resultado

final se expre

Es problemtico interpretar la estadstica con med

das en unidades cuadradas; considere, por ejemplo, a Mattel Toys tratando de interpretar costos de
produccin en trminos de dlares al cuadrado o medir la variacin de produccin de Troy-Bilt en trminos del cuadrado de podadoras de pasto. Por tanto, cuando se usa como medida descriptiva, l.
varianza puede ser considerada como un clculo intermedio en el proceso de obtener la desviacin
estndar muestral.

Desviacin estndar
La desviacin estndar es la una medida de variabilidad preferida. Se utiliza como entidad separada v
como parte de otros anlisis, por ejemplo para calcular intervalos de confianza y en pruebas de hiptesis (vanse los captulos 8, 9 y 10).
DESVIACIN
ESTNDAR
POBLACIONAL

a=~E(x~)z

La desviacin estndar es la raz cuadrada de la varianza. La desviacin estndar poblacional se


denota con u.
Al igual que la varianza, la desviacin estndar utiliza la suma del cuadrado de desviaciones alrededor de la media (SSxl Se calcula al promediar este cuadrado de desviaciones (SS,/N) y tomar la raif
cuadrada de ese promedio. Una caracterstica de la desviacin estndar que la distingue de una varianza es que la desviacin estndar se expresa en las mismas unidades que los datos sin procesar, mientras
que la varianza se expresa en el cuadrado de esas unidades. La tabla 3.4 muestra la desviacin estndar
para la compaia que produce computadoras: v'26 o 5.1.
Qu significa la desviacin estndar de 5.1? El significado de desviacin estndar se entiende ms
fcilmente por su uso, que se explora en la siguiente seccin. Cuando la desviacin estndar y la varianza estn estrechamente relacionadas y se pueden calcular entre si, distinguirlas es importante porque
ambas tienen amplio uso en estadstica.

Significado de desviacin estndar


Qu es una desviacin estndar? Qu hace y qu significa lo que hace? La manera ms precisa de definir una desviacin estndar es al detallar la frmula empleada para calcularla. Con todo, es posible
entender la nocin del concepto de desviacin estndar al ver la manera en que se aplica. Dos modos
de aplicar la desviacin estndar son la regla empirica y el teorema de Chebysbev.

TABLA 3.4
Clculo de
la varianza y la
desviacin
estndar de los
datos de
produccin de
computadoras

s
9
16
17

!!
I.x = 65

" --8"

lx- "'
64

-4
+3
+4
+5
!(x- )=O

16
9

16

~
!(x - )2 = 130

SSx-= !(x- )2

130

varianza=u2=ss" =!(x-)2 =~=26.0


N
N
5

-=ieg1a emprica
:iara una y dos
iJeSViaciones
estndar de precios
oe gasolina

CAPtruW 3 ESTADISTICA t>ESCKJPin:\

61

68%
-la

+la

Sl.34 Sl.42 $1.50


.=$1.42
a =$0.08

$1.26

$1.42
.=$1.42
u =S0.08
B

Regla emprica
La regla emprica es una importante regla prctica que se usa para expresar el porcentaje aproximado
que est dentro de un nmero dado de desviaciones estndar desde la media de un conjunto de datos, si los
datos estn distribuidos normalmente.
La regla emp[rica se usa slo para tres veces la desviacin estndar: lo, 20' y 30'. En el captulo 6 se
presenta un anlisis detallado de otros nmeros de valores cr, tambin en el capitulo 6 se estudia con
mayor detalle la distribucin normal, distribucin simtrica unimodal que tiene forma de campana (o
montlculo). El requisito de que los datos estn normalmente distribuidos tiene alguna tolerancia y la
regla emprica por lo general aplica mientras los datos tengan forma aproximada de montculo.

REGIA
EMPlR.JCA

Distancia desde la media


:!::la
:!:: 20'
:!:: 30'

Valores dentro de la distancia


68%
95%
99.7%

.. Con base en la suposicin de que los datos estn aproximadamente distribuidos de manera aproximada.

Si un conjunto de datos est normalmente distribuido, o tiene forma de campana, cerca de 68'!1. de
los valores de datos estn dentro de una desviacin estndar de la media, 95% estn dentro de dos de5'713ciones estndar, y casi 100% estn dentro de tres desviaciones estndar.
Supongamos que un informe reciente expresa que, para California, el precio promedio a nivel $atal de un galn de gasolina de tipo regular es de $1.42. Supongamos tambin que los precios de gasolina regular variaron en el estado con una desviacin estndar de $0.08 y estuvieron norrnalmente
distribuidos. Segn la regla emprica, alrededor de 68% de los precios deber[an caer dentro de
1:,
o $1.42 :!: 1($0.08). Ms o menos 68% de los precios estaran entre $1.34 y $1.50, como se ve en b ~
3.SA. Alrededor de 95% debera caer dentro de. :!: 20' o $1.42 :!: 2($0.08) = $1.42 S0.16, o sea=
$1.26 y $1.58, como observa en la figura 3.58. Casi todos los precios de gasolina regular (99.# )dmeran caer entre $1.16 y $1.66 (. :!: 3u).
Ntese que 68% de los precios de gasolina caen dentro de una desviacin estndar~
de la
media, alrededor de 32% estn fuera de este rango. Como la distribucin normal es smEtria, ~::'.
puede dividirse a la mitad de la moda que 16% se encuentre en cada cola de la <furribocin. Ezr..onco,
alrededor de 16% de los precios de gasolina deben ser menores a $1.34 y ms o menos 169& de los precios deben ser mayores a $1.50.
Normalmente, numerosos fenmenos estn distribuidos en forma de campana. ~
la mayorfa de las caractersticas humanas como son la estatura y el peso; por tanto, la regla emprica se aplica
en muchas situaciones y se usa ampliamente.

62 ESTADISTICA EN LOS NEGOCIOS

PROBLEMA DE
DEMOSTRACIN
3.4

Una compaa produce una vlvula ligera que est especificada para pesar 1365 gramos. Por
desgracia, debido a imperfecciones en el proceso de manufactura, no todas las vlvulas producidas tienen un peso exacto de 1365 gramos. De hecho, los pesos de las vlvulas producidas
estn normalmente distribuidos con un peso medio de 1365 gramos y una desviacin estndar
de 294 gramos. Dentro de qu rango caeran alrededor de 95% de los pesos de vlvulas?
Aproximadamente
16% de los pesos seran mayores que cul valor? Aproximadamente 0.15%
de los pesos seran menores a qu valor?
Soluci6n
Debido a que los pesos de las vlvulas estn normalmente distribuidos, aplica la regla emprica.
Segn sta, casi 95% de los pesos caeran dentro de. 2u = 1365 2(294)= 1365 588. As,
casi 95% deberan caer entre 777 y 1953. Aproximadamente 68% de los pesos deberan caer dentro de. 1uy 32% debera caerfuera de este intervalo. Debido a que la distribucin normal es
simtrica, cerca de 16% debera estar arriba de. 1u =1365 + 294 = 1659. Casi 99.7% de los
pesos deberan caer dentro de. 3u y 0.3% deberan caer fuera de este intervalo. La mitad de
esto ltimo; es decir, 0.15%, debera estar abajo de. - 3u = 1365 - 3(294)= 1365 - 882 = 483.

Teorema de Chebyshev
La regla emprica aplica slo cuando se sabe que los datos estn normalmente distribuidos de manera
aproximada. Qu utilizan los investigadores cuando los datos no estn normalmente distribuidos o
la forma de la distribucin es desconocida? El teorema de Chebyshev aplica a todas las distribuciones cualquiera que sea su forma y por tanto se puede usar siempre que la forma de la distribucin de
datos sea desconocida o sea anormal. Aun cuando el teorema de Chebyshev puede en teora aplicarse
a datos que estn normalmente distribuidos, la regla emprica es ms conocida y se prefiere siempre que sea apropiado. El teorema de Chebyshev no es una regla prctica, como es la regla emprica,
sino que ms bien se presenta en formato de frmula y, por tanto, se puede aplicar con ms amplitud.
El teorema de Chebyshcv expresa que por menos 1 - lfk2 valores caern dentro de ::!:k desviaciones

estndar de la media, cualquiera que sea la forma de la distribucin.


TEOREMA DE

CHEBYSHEV

Dentro de k desviaciones estndar de la media, . ::!: ka, existe por lo menos:


1 - _!_

proporcin de valores.
Suposicin: k > 1
Especficamente, el teorema de Chebyshev dice que al menos 75% de todos los valores estn dentro de ::!:2a de la media, cualquiera que sea la forma de una distribucin, porque si k = 2 entonces 1 lfk2 = 1 - 1/22 = 3/4 = .75. La figura 3.6 da una ilustracin grfica. En contraste, la regla emprica
expresa que si los datos estn normalmente distribuidos 95% de todos los valores estn dentro de, ::!:
2a. De acuerdo con el teorema de Chebyshev, el porcentaje de valores dentro de tres desviaciones estndar de la media es por lo menos 89%, en contraste con 99.7% para la regla emprica. Como se usa una
frmula para calcular proporciones con el teorema de Chebyshev, se puede usar cualquier valor de k
mayor a 1 (k > 1). Por ejemplo, si k = 2.5, al menos 0.84 de todos los valores estn dentro de,::!: 2.5a,
porque 1 - l/k2 = J - 1/(2.5)2 = 0.84.

Aplicacin del
teorema de
Chebyshev 'para
dos desviaciones
estndar
.

CAPITULO 3 ESTADISTICA DESCRIPTIVA

PROBLEMA DE
IOEMQSTRACIN
3.5

63

En la industria de la computacin, la edad promedio de empleados profesionales tiende a ser ms


joven que en muchas otras profesiones de negocios. Supongamos que el promedio de edad de
un profesional empleado por una compaa de computadoras en particular es de 28, con una desviacin estndar de cinco aos. Un histograma de edades de empleados profesionales con esta
firma revela que los datos no estn normalmente distribuidos sino que estn amasados en los
veintes y que pocos trabajadores tienen ms de 40 aos. Aplique el teorema de Chebyshev para
determinar dentro de qu rango de edades caera al menos 85% de las edades de trabajadores.
Solucin
Como las edades no estn normalmente distribuidas, no es correcto aplicar la regla emprica y
por tanto el teorema de Chebyshev debe aplicarse para contestar la pregunta.
El teorema de Chebyshev expresa que al menos una proporcin de 1 - 1/k2 de los valores
est dentro de ka. Como 85% de los valores estn dentro de este rango, sea:
1
1 -1(2

.15

= k2

.85

Al despejar k se obtiene:
1

k2 = 6.667
k

2.58

El teorema de Chebyshev dice que al menos 0.85 de los valores estn dentro de 2.58ude
la media. Para = 28 y u = 5, al menos 0.85 o sea 85% de los valores estn dentro de 28
2.58(5) = 28 12.9 aos de edad o entre 15.1 y 40.9 aos.

Poblacin contra varianza muestra! y desviacin estndar


La varianza muestra! se denota por s2 y la desviacin estndar muestra! por s. El principal uso para
varianzas rnuestrales y desviaciones estndar son como estimadores de varianzas poblacionales y desviaciones estndar. Debido a esto, el clculo de la varianza muestra! y desviacin estndar difiere ligeramente del clculo de la varianza poblacional y la desviacin estndar. La varianza muestra! y la
desviacin estndar muestra! utilizan n - 1 en el denominador en lugar de n, porque usar n en el
denominador de la varianza muestra! resulta una estadstica que tiende a subestimar la varianza de
poblacin. Si bien el estudio de las propiedades de buenos estimadores est fuera del alcance de este
texto, una de las propiedades de un buen estimador es ser no sesgaio. Mientras que usar n en el denominador de la varianza muestra! lo hace un estimador sesgado, usar n - 1 le permite ser un estimador
no sesgado, que es una propiedad deseable en estadstica inferencia!.
VARIANZA

E(x-x)2

=----

MUESTRAL

s2

DESVIACIN
ESTNDAR
MUESTRAL

s= ~E(x-~)2

n-1

n-1
A continuacin aparece una muestra de seis de los principales despachos de contadores en Es:aOas
Unidos y el nmero de socios relacionados con cada empresa, segn reporta el Pubtu: .'\ll==~

Repon.
Empresa
PriccWaterhouse
McGladrey & Pullcn
Dcloitte & Touche
Andcrscn Worlwide
Coopers & Lybrand
800 Seidrnan

Nmero de socios
1062
381
1 719
1673
1 277
217

La varianza muestra! y desviacin estndar muestrales se pueden calcular cae:

64 ESTADISTICA EN LOS NEGOCIOS


X

1062
381
1719
1673
1277
217
Ex= 6329

(x-x)2
51.41
454 046.87
441 121.79
382 134.15
49 359.51
701959.11
E(x-x)2 = 2 028 672.84

x = 6 329 = 1 054.83
6

E(x - x)2 2 028 672.84


s2 =---=
n-1
5
s=

405 734.57

.f1 = .J405 734.57 = 636.97

La varianza muestra! es 405 734.57 y la desviacin estndar muestra! es 636.97.

Frmulas de clculo breve para varianza y desviacin estndar


Existe un mtodo alternativo para calcular varianza y desviacin estndar, que a veces se conoce como
mtodo de clculo breve o mtodo breve. Algebraicamente:

E(x- )2 = Ex2 - (Ex)2


N

Al sustituir de estas expresiones equivalentes, en las frmulas originales para varianza y desviacin
estndar, obtenemos las siguientes frmulas de clculo breve.
FORMULA

Ex2- (Ex)2

COMPUTACIONAL
PARA VARIANZA Y
DESV1ACI0N
ESTANDAR

<12=
<1=

FORMULA

COMPlITACIONAL
PARA VARIANZA

52

MUESTRALY

DESV1ACI0N ESTANDAR

,;;

Ex2 - (Ex)2
n
n-1

s=f1

Estas frmulas de clculo breve utilizan la suma de los valores x y la suma de los valores x2 en lugar
de la diferencia entre la media y cada valor y desviaciones calculadas. Antes de que se usaran las calculadoras, este mtodo por lo general era ms rpido y fcil que usar las frmulas originales.
Para situaciones en las que la media ya est calculada o se da, las formas alternativas de estas
frmulas son:

(12

Ex2-N2

s2

Ex2 -n(x)2
n-1

CAPITULO 3 ESTADISllCA DESCIUP'T1\:\ 65

TABLA 3.5

Calculos de frmula
de clculo breve de
varianza y
desviacin
estndar para
datos de
produccin de
computadoras

25

81

16

256

17

289
324

!!

"Ix= 65

.. 975

975 (65)l
5 "" 975-845
5
5
u=v'6 .. 5.1

"2

= !!!. = 26
5

Con el uso del mtodo de clculo breve, el propietario de la compaia que inicia la produccin de
computadoras puede calcular una varianza poblacional y desviacin estndar para los d tos de produccin, como se ve en la tabla 3.5. (Compare estos resultados con los de la tabla 3.4.)

PROBLEMA DE
DEMOSTRACIN
3.6

Es posible medir la efectividad del fiscal de un distrito judicial por medio de varias vari bles, incluyendo el nmero sentencias por mes, el nmero de casos manejados por mes y el mero total
de aos de sentencias por mes. Una investigadora utiliza una muestra de cinco fisc es de distrito
en una ciudad y determina el nmero total de aos de sentencia que cada fiscal g contra acusados durante el mes pasado, como se reporta en la primera columna de las siguientes tablas.
Calcule la desviacin media absoluta, la varianza y la desviacin estndar para estas cifras.
Solud6n
La investigadora calcula la desviacin media absoluta, la varianza y la desviacin estndar para
estos datos en la forma siguiente:

lx-Xj

55
100
125
140

___Q.
I:x=480

x=

41
4
29
44

I:lx-Xj = 154

I:x =

48

(x-x)2
1 681
16
841
1 936
1 296
I:(x-x )2 = 5 770

=96

154
= 30.8
5
5
s2 = :10 = 1 442.5 y s = ~

MAD =

= 37.98

A continuacin, utiliza frmulasde clculo breve para despejar 52 y s para comparar los resul!Mb..

x'-

55
100
125
140
60
Ex=480

. s=

3 025
10 000
15 625
19 600
3 600
Ex2 = 51 850

(480)2
51 05o--4

,/1 442.5 = 37.98

51 850-46 080 5 770


=--=1442.5
4
4

66

ESTADISTICA

EN LOS NEGOCIOS

Los resultados son los mismos. La desviacin estndar muestra! obtenida por ambos mtodos
es 37.98 o sea 38 aos.

Valores z
Representan el nmero de desviaciones estndar que un valor (x) est arriba o abajo de la media de un
conjunto de nmeros cuando los datos estn normalmente distribuidos. Al utilizar el valor z es posible
transformar la distancia bruta de un valor de la media en unidades de desviacin estndar.

z=x-
a

1 VAWRESz

Para muestras:

x-x

Z=--

Si un valor z es negativo, el valor sin procesar (x) est abajo de la media. Si el valor z es positivo, el
valor sin procesar (x) est arriba de la media.
Por ejemplo, para un conjunto de datos que est normalmente distribuido con una media de 50 y
una desviacin estndar de 10, supongamos que un experto en estadstica desea determinar el valor z
para uno de 70, el cual seria (x = 70) que est 20 unidades arriba de la media, de modo que el valor
zes:
z= 70-50 =+2.00
10
Este valor z significa que 70 est dos desviaciones estndar arriba de la media. Cmo se interpreta el valor z? La regla emprica expresa que 95% de todos los valores estn dentro de dos desviaciones
estndar desde la media si los datos son aproximados y distribuidos en forma normal. La figura 3.7
muestra cmo el valor de 70 est dos desviaciones estndar arriba de la media (z = +2.00) 95% de
los valores estn entre 70 y el valor (x = 30), que est dos desviaciones estndar abajo de la media o
= = (30-50)/10 = -2.00. Como 5% de los valores estn fuera del rango de dos desviaciones estndar
desde la media y la distribucin normal es simtrica, 21/2% {1/2 del 5%) estn abajo del valor de 30.
Entonces 9"'1/1% de los valores estn abajo del valor de 70. Como el valor z indica el nmero de desviaciones estndar que tiene un valor individual de datos respecto a la media, la regla emprica se puede
expresar tambin en trminos del valor z.
Entre z = -1.00 y z = + 1.00 son aproximadamente
Entre z = -2.00 y z = +2.00 son aproximadamente
Entre z = - 3.00 y z = + 3.00 son aproximadamente

68% de los valores.


95% de los valores.
99.7% de los valores.

El tema de los valores z se estudian con ms detalle en el captulo 6.

Coeficiente de variacin
El coeficiente de variacin es un estadstico dado por la razn entre la desviacin estndar y la media

expresada en porcentaje y se denota como CV.


COEFICIENTE DE
VARIACIN

CV=~(lOO)

El coeficiente de variacin esencialmente es una comparacin relativa de una desviacin estndar


con su media. El coeficiente de variacin puede ser til al comparar desviaciones estndar que han sido
calculadas a partir de datos con diferentes medias.
Supongamos que cinco semanas de precios promedio para la accin A son 57, 68, 64, 71y62. Para
calcular un coeficiente de variacin para estos precios, primero determinarnos la media y desviacin
estndar: u. = 64.40 y a = 4.84. El coeficiente de variacin es:
aA
4.84
CVA =-(100)=--(I00)=.075=7.5%
A
64.40

CAPITULO 3 ESTADISTICA DESCltlP'Il\'A 61

!1@1!1-ii ..
Porcentaje de
descomposicin de
estadsticas. Dos
desviaciones
estndar desde la
media

. =50
z =O

=30

z =-2.00

=70

z = +2.00

La desviacin estndar es 7 .5% a partir de la media.


A veces los investigadores financieros utilizan el coeficiente de variacin, la desviacin estndar o
ambos, como medidas de riesgo. Imaginemos una accin con un precio que nunca cambia; por tanto,
un inversionista no corre el riesgo de perder dinero porque el precio baj, ya que no hay variabilidad
en el precio. Supongamos, en contraste, que el precio de la accin flucta en forma desordenada. Un
inversionista que compre a precio bajo y vende a precio alto puede obtener una buena ganancia, pero
si el precio cae por abajo de lo que el inversionista compra, el propietario de la accin tendra una prdida potencial. Cuanto mayor sea la variabilidad es mayor el potencial de prdida. Por esta razn, los
inversionistas utilizan medidas de variabilidad como la desviacin estndar o el coeficiente de variacin
para determinar el riesgo de una accin. Qu puede prevenir el coeficiente de variacin sobre el riesgo de una accin, que no hace la desviacin estndar?
Supongamos que los precios promedio de una segunda accin, B, sobre estas mismas cinco semanas son de 12, 17, 8, 15 y 13. La media de la accin Bes 13.00 con una desviacin estndar de 3.03. El
coeficiente de variacin se puede calcular para la accin B como:
CV8 =

us (100) =
P.B

3 3
13

(100) = .233 = 23.3%

La desviacin estndar para la accin B es 23.3% a partir de la media.


Con la desviacin estndar como la medida de riesgo, la accin A es ms riesgosa sobre este periodo porque tiene mayor desviacin estndar. No obstante, el precio promedio de la accin A es casi cinco
veces ms que el de la accin B. Por otra parte, la cantidad invertida en la accin A alcanza la desviacin estndar de $4.84 que podra no representar tanto riesgo como la desviacin estndar de $3.03
para la accin B, la cual tiene un precio promedio de slo $13.00. El coeficiente de variacin deja ver el
riesgo de una accin en trminos del tamao de la desviacin estndar con respecto al tamao de la
media (en porcentaje). La accin B tiene un coeficiente de variacin que es casi tres veces el coeficiente de variacin para la accin A; es decir, que el uso del coeficiente de variacin como medida de riesgo indica que la accin B es ms riesgosa.
La opcin de usar el coeficiente de variacin o la desviacin estndar para comparar desviacioaes
estndar mltiples es cuestin de preferencia. El coeficiente de variacin da un mtodo opcional de
interpretar el valor de la desviacin estndar.

3.2 PROBLEMAS
3.11 Un conjunto de datos contiene los siguientes siete valores:
6

a. Encuentre el rango.
b. Encuentre la desviacin media absoluta.
c. Encuentre la varianza poblacional.
d. Encuentre la desviacin estndar poblacional.

68

ESTADISTICA EN LOS NEGOCIOS


Encuentre el rango intercuartil
f. Encuentre el valor z para cada dato

e.

3.12 Un conjunto de datos contiene los siguientes ocho valores:

a. Encuentre el rango.
b. Encuentre la desviacin media absoluta.
c. Encuentre la varianza muestra].
d. Encuentre la desviacin estndar muestral.
e. Encuentre el rango intercuartil.
3.13 Un conjunto de datos contiene los siguientes seis valores:
12

23

19

26

24

23

a. Encuentre la desviacin estndar poblacional con el uso de la frmula que contenga la media
(la frmula original).
b. Encuentre la desviacin estndar poblacional con el uso de la frmula de clculo breve.
c. Compare los resultados. Qu frmula fue ms rpida de usar? Qu frmula prefiere usted?
Por qu piensa usted que la frmula de clculo breve se conoce a veces como la frmula de
"mtodo breve"?
3.14 Utilice su calculadora o computadora para encontrar la varianza muestral y desviacin estndar
muestra! de los siguientes datos:
57

88

68

43

93

63

51

37

77

83

66

60

38

52

28

34

52

60

57

29

92

37

38

17

67

3.15 Utilice su calculadora o computadora para hallar la varianza poblacional y desviacin estndar
poblacional para los siguientes datos:
123

090

546

378

392

280

179

601

572

953

749

075

303

468

531

646

3.16 Determine el rango intercuartil de los siguientes datos:


44

18

39

40

59

46

59

37

15

73

23

19

90

58

35

82

14

38

27

24

71

25

39

84

70

3.17 Segn el teorema de Chebyshev, al menos qu proporcin de los datos estarn dentro de.:!: ka
para cada valor de k?
a. k = 2
b. k = 2.5
c. k = 1.6
d. k = 3.2
3.18 Compare la variabilidad de los siguientes dos conjuntos de datos al usar tanto la desviacin
estndar como el coeficiente de variacin:
Conjunto 1 de datos

Conjunto 2 de datos

49

159

82

121

77

138

54

152

CAPl11JLO 3 ESTADISTICA DESCllIPTIU

3.19 Una muestra de 12 pequeos despachos de contadores deja ver los siguientes nmeros de profesionales por oficina:
7

10

14

ti

12

13

a. Determinar la desviacin media absoluta.


b. Determinar la varianza.
c. Determinar la desviacin estndar.
d. Determinar el rango intercuartil.
e. Cul es el valor z para la empresa que tiene seis profesionales?

f. Cul es el coeficiente de variacin para esta muestra?


3.20 La siguiente, proporcionada por Marketing lntelligence Service, es una lista de las compaas con
los ms nuevos productos en un ao reciente.
Compaia
Avon Products
L'Oreal
Unilever U.S.
Revlon
Garden Botanika
Philip Morris
Procter & Gamble
Nestl
Paradiso
Tsumura lnternational
Grand Metropolitan

Nmero de nuevos productos


768
429
323

306
286
262
215
172
162
148

145

a. Encuentre el rango.
b. Encuentre la desviacin media absoluta.
c. Encuentre la varianza poblacional.
d. Encuentre la desviacin estndar poblacional.
e. Encuentre el rango intercuartil.
f. Encuentre el valor z para Nestl.
g. Encuentre el coeficiente de variacin.
3.21

Una distribucin de nmeros tiene aproximadamente la forma de una campana. Si la media de


los nmeros es 125 y la desviacin estndar es 12, entre cules dos nmeros caera aproximadamente 68% de los valores? Entre cules dos nmeros caera 95% de los valores? Entre cules dos
valores caera 99.7% de los valores?

3.22 Algunos nmeros no estn normalmente distribuidos. Si la media de los nmeros es 38 y la desviacin estndar es 6, qu proporcin de valores caera entre 26 y 50? Qu proporcin devalores caera entre 14 y 62? Entre cules dos valores caera 89% de los valores?
3.23 Segn el teorema de Chebyshev, cuntas desviaciones estndar desde la media incluiran pw lo
menos 80% de los valores

3.24 El tiempo necesario para ensamblar una pieza particular de mueble con experiencia
DIXmalmente distribuida con un tiempo medio de 43 minutos. Si 68% de los tiempos de~
estn entre 40 y 46 minutos, cul es el valor de la desviacin estndar? Suponga que 99.IS de b
tiempos de ensamble estn entre 35 y 51 minutos y la media es todava de 43 =~~sena
ahora el valor de la desviacin estndar? Suponga que el tiempo necesario para ~
o=-a
pieza de mueble no est normalmente distribuida y que el tiempo medio de ~
es :.S
minutos. Cul es la desviacin estndar si al menos 77% de los tiempos de ~
csn
24 y 32 minutos?

70 ESTADISTICA EN LOS NEGOCIOS

3.25 Los ambientalistas estn preocupados por las emisiones de dixido de azufre a la atmsfera. El
nmero promedio de dlas por ao en el que los niveles de dixido de azufre excede de 150 miligramos por metro cbico en Miln, Italia, es 29. El nmero de dias por ao en que se exceden los
limites de emisin est normalmente distribuido con una desviacin estndar de 4.0 ellas. Qu
porcentaje de los aos promediara entre 21 y 37 dias de exceso de emisiones de dixido de azufre? Qu porcentaje de los aos excederla de 37 dias? Qu porcentaje de los aos excederla de 41
dias? En qu porcentaje de los aos habra menos de 25 das con exceso de emisiones de dixido
de azufre
3.26 La Runzheimer Cuide publica una lista de las ciudades menos costosas en el mundo para agentes
viajeros. A continuacin aparece una lista de las 10 ciudades menos costosas con sus respectivos
costos de gastos de viaje. Utilice esta lista para calcular el valor z para Bordeaux, Montreal,
Edmonton y Hamilton. Trate esta lista como una muestra.
Ciudad

Gastos de viaje ($)

Hamilton, Ontario

97

London, Ontario

109

Emonton, Alberta

111

Jakarta, Indonesia

118

Ouawa

120

Montreal

130

Halifax, Nova Scotia

132

Winnipeg. Manitoba

133

Bordeaux, Francia

137

Bangkok, Thailand

137

3.3 MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD:DATOS AGRUPADOS


Los datos agrupados no dan informacin acerca de valores individuales. Por tanto, las medidas de tendencia central y variabilidad para datos agrupados deben calcularse de la moda diferente a las de datos
no agrupados o sin procesar.

Medidas de tendencia central


Aqui se presentan dos medidas de tendencia para datos agrupados: la media y la moda.

Media
Para datos no agrupados, la media se calcula al sumar los valores de datos y dividir entre el nmero de
valores. Con datos agrupados, los valores especificas son desconocidos. Qu se puede usar para representar los valores de datos? El punto medio de cada intervalo de marca de clase se utiliza para representar todos los valores en un intervalo de clase. Este punto medio es valorado por la frecuencia de
valores en ese intervalo de clase. La media para datos agrupados se calcula entonces al sumar los productos del punto medio de clase y la frecuencia para cada clase y dividir esa suma entre el nmero total
de frecuencias. A continuacin aparece la frmula para la media de datos agrupados.
MEDIA DE DATOS
AGRUPADOS

donde:

i = el nmero de clases

f=

frecuencia de clase
N = total de frecuencias

CAP!TuLo 3 ESTADlsnCA DESCIJPiI\'.:\

TABLA 3.6
Distribucin de frecuencias de
os porcentajes de desempleo
en Francia
Intervalo
de clase

Frecuencia

I-rncnor de 3

16

3-menor de 5
s-menor de 7

--menor de9

9-menor de 11
Ll-menor de 13

il

La tabla 3.6 proporciona la distribucin de frecuencias de los porcentajes de desempleo de Francia de la tabla 2.2. Para hallar la media de estos datos, necesitamos !._(y !.~f.
El valor de 'if se puede determinar al sumar los valores de la columna de frecuencia.. Para
calcular 'ifM, debemos determinar primero los valores de M, o la marca de clase. A continuacin multiplicamos cada una de estas marcas de clase por la frecuencia en ese intervalo de clase, f, resultando en JM. Sumar estos valores de fM da el valor de 'ifM.
La tabla 3.7 contiene los clculos necesarios para determinar la media de grupo. La
media de grupo para los datos de desempleo es 6.25. Recuerde que como cada intervalo de
clase fue representado por la marca de clase en lugar de los valores reales, la media de grupo
es slo aproximada .

Moda
La moda para datos agrupados es la marca de clase de la clase modal. La clase modal es el
intervalo de clase con la frecuencia ms grande. Con el uso de los datos del cuadro 3.7,

el intervalo de clase 1-menor de 3 contiene la frecuencia ms grande, 16. Entonces, la clase modal
es 1-menor de 3. La marca de clase de esta clase modal es 2. Por tanto, la moda para la distribucin de
frecuencias mostrada en la tabla 3.7 es 2. El porcentaje de desempleo modal es 2 por ciento.

Medidas de variabilidad
Aqu se presentan dos medidas de variabilidad para datos agrupados: la varianza y la desviacin estn. dar. De nueva cuenta, la desviacin estndar es la raz cuadrada de la varianza. Ambas medidas tienen
frmulas originales y de clculo breve.

FORMULAS PARA

Frmula original

VARIANZA
POBLACIONALY
DESVIACIN
ESTNDARDE
DATOS
AGRUPADOS

\(ersin de clculo breve

L,f(M-)2

a-----N

a=,W
donde:

f = frecuencia
M = punto medio de clase
N = 'if o frecuencias totales de la poblacin
. = media agrupada para la poblacin

TABLA 3.7
Clculo de media
agrupada

Intervalo de clase
1- menor de 3

Frecuencia

(!)

Marca de clase (M)

3- menor de 5
5- menor de 7

11- menor de 13

24

24

10

90

..i

12

7- menor de 9
9- menor de 11

fM
32

16

~f= N= 40

'2:.JM 250
=--=-=6.25
'2:.
40

..11.
!./M = 250

r=--72 ESTADISTICA EN LOS NEGOCIOS

TABLA 3.8
Clculo de varianza
agrupada y
desviacin
estndar con la
frmula original

/M M-p

/(11-1'>1

l-menorde3

16

32

-4.25

18.063

3-menorrkS

-2.25

S.063

10.126

S-menorde7

24

-0.lS

0.063

0.252

7-meoordc9

24

1.75

3.063

9.189

9- menor de 11

10

90

3.75

14.063

126.567

..!

12

5.75

33J>63

Intern1o de da.e

11-menor de 13

.n

IJM= 250

If-N= 40
=

,, =

(M-p)'A

289.00S

.!2!:m..
I/(M - )l = 633.520

250
=-=6.25

'i.f

4Q

'i. JCM -e>2


N

=~

40

= 15.838

"= Vl5.838 = 3.980

. f

TABLA 3.9
Clculo de varianza
agrupada y
desviacin
estndar con la
frmula de clculo
breve

32

5-menorde7

24

7- meoorde9

24

192

9-mmorde 11

10

90

900

12

f=N=

64

32
. 144

72

fM= 250

40

'i./M2-('i.fM)2 2196- (Z50)


=----~n~- --~40~

u= \

FRMULAS PARA

3-menordrS

11- menor de 13

VARIANZA
MUESTRALY
DESVIACIN
ESTNDAR DE
DATOS
AGRUPADOS

fMZ

fJl

l-menorde316

864

fW

= 2196

40

= 2196-1562.5 = 633.5 = 15.838


40

40

15.838 = 3.980

Frmula original

s2

Versin de clculo breve

2
= E/(M-x)
n-1

s=N
donde:

f=

frecuencia

M = punto medio de clase

N = I.f o total de frecuencias de la poblacin


. = media agrupada para la muestra

Por ejemplo, calculemos la varianza y desviacin estndar de los datos agrupados de desempleo en
Francia como una distribucin de frecuencias en la tabla 3.6. Si los datos se tratan como poblacin, los
clculos son como sigue:
Para la frmula original, los ckulos se muestran en la tabla 3.8. El mtodo para determinar a2 y
u al usar la frmula de clculo breve se muestra en la tabla 3.9. En cualquier caso, la varianza de los
datos de desempleo es de 15.838 (cuadrado de porcentaje) y la desviacin estndar es de 3.98%. Al igual

CAPITULO 3 ESTADISTICA DESCRIPII\':\.

'3

que con el clculo de la media agrupada, la marca de clase se utiliza para representar todos los valores
en un intervalo de clase. Este mtodo puede o no ser aproximado, dependiendo de si el valor promedio en una clase est en el punto medio. Si esta situacin no ocurre, entonces la varianza y desviacin
estndar son slo aproximaciones. Debido a que la estadstica agrupada se calcula por lo general sin
conocer los datos reales, este clculo es slo aproximado.

PROBLEMA DE
DEMOSTRACIN
3.7

Calcule la media, moda, varianza y desviacin estndar en los siguientes datos muestrales:
Intervalo de clase

Frecuencia

10- menor de 15
15- menor de 20
20- menor de 25
25- menor de 30
30- menor de 35
35- menor de 40
40- menor de 45
45- menor de 50

6
22
35
29
16
8
4
2

Soluci6n
La media se calcula como sigue:
Clase
10- menor de
15- menor de
20- menor de
25- menor de
30- menor de
35- menor de
40- menor de
45- menor de

15
20
25
30
35
40
45
50
H=n=

6
22
35
29
16
8
4
2
122

12.5
17.5
22.5
27.5
32.5
37.5
42.5
47.5

fM

75.0
385.0
787.5
797.5
520.0
300.0
170.0
95.0
HM=3130.0

X= EfM = 3130 = 25.66


Ef
122
La media agrupada es 25.66.
La moda agrupada se puede determinar si se encuentra la marca de clase del intervalo de
clase con la frecuencia ms grande. La clase con la frecuencia ms grande es 20-menor de 2.5
con una frecuencia de 35. La marca de clase en este caso es de 22.5, que es fa moda agrupaaa.
La varianza y desviacin estndar se pueden encontrar como se muestra a continuacio.-Primero, usamos la frmula original
Clase
10- menor de 15
15- menor de 20
20- menor de 25
25- menor de 30
30- menor de 35
35- menor de 40
40- menor de 45
45- menor de 50

M
6
22

35
29
16
8
4
2
U= n= 122

12.5
17.5
22.5
27.5
32.5
37.5
42.5
47.5

Ef(M-x)2
52 =
n-1
s = .Js1.11=7.56

M-x

(M-X)2

-13.16
-8.16
-3.16
1.84
6.84
11.84
16.84
21.84

173.19
66.59
9.99
3.39
46.79
140.19
283.59
476.99

f(M-Xl2

1 039.14
1 464.98
349.65
98.3.
7~

1121..:::
1 13.!3':

=-=- =::

:H(M-W=

6910.58 =57.11
121

::

:L:iii!

74 ESTADISTICA EN LOS NEGOCIOS


A continuacin,

usamos

la frmula

de clculo

breve.

Clase

101520253035-

menor de 15
menor de 20
menor de 25
menor de 30
menor de 35
menor de 40
40- menor de 45
45- menor de 50

6
22
35
29
16
8
4
2
U= n = 122

; fM2 _ (E fM)2

n
=
n-1
5 = ,/57 .11 = 7 .56

s2

12.5
17.5
22.5
27.5
32.5
37.5
42.5
47.5

fM
75.0
385.0
787.5
797.5
520.0
300.0
170.0
95.0
IfM= 3130.0

87 212.5-

fM2

937.50
6 737.50
17 718.75
21 931.25
16 900.00
11 250.00
7 225.00
4 512.50
IfM2 = 87 212.50

(3 130l2
122

121

6 910.04
121

= 57.11

La varianza muestra! es 57 .11 y la desviacin estndar es 7 .56.

3.3 PROBLEMAS
3.27 Calcule la media y la moda para los siguientes datos:
Clase

O- menor de 2
2- menor de 4
4- menor de 6
6- menor de 8
8- menor de JO
JO- menor de 12
12- menor de 14

39

27
16
IS
10
8
6

3.28 Calcule la media y la moda para los siguientes datos:

Clase
1.2- menor de 1.6
1.6- menor de 2.0
2.0- menor de 2.4
2.4- menor de 2.8
2.8- menor de 3.2

220
ISO
90
110

280

3.29 Determine la varianza poblacional y desviacin estndar para los siguientes datos con el uso de
la frmula original:
Clase

20- menor de 30
30- menor de 40
40- menor de SO
SO- menor de 60
60- menor de 70
70- menor de 80

7
11
18
13
6

CAPITULO 3 ESTADISTICA DESOUl"rro

rs

3.30 Determine la varianza muestra! y desviacin estndar para los siguientes datos coa el uso de b
frmula de clculo breve.
Clase
5-menor de 9
9-menor de 13
13-menor de 17
17-menor de 21
21-menor de 25

f
20
18
8
6

3.31 Una muestra aleatoria de votantes ea Nashville, Tennessee, est clasificada por grupo de edad,
como se ve en los siguientes datos:
Gru~deedad
18-menor de 24
24--menor de 30
30-menor de 36
36-menor de 42
42-menor de 48
48-mcnor de 54
54--menor de 60
60-menor de 66
66-menor de 72

Frecuencia
17
22
26
35
33
30
32
21
15

a. Calcule la media de los datos.


b. Calcule la moda.
c. Calcule la varianza.

d. Calcule la desviacin estndar.

3.32 Los siguientes datos representan el nmero de citas de negocios hechos por intervalo de 15 minutos, por solicitud telefnica, para una compaia de jardinera:
Nmero
de citas

frecuencia
con que ocurren

O-menor de 1
!-menor de 2
2-menor de 3
3-menor de 4
4--menor de 5
5-menor de 6

31
57
26
14
6

a. Calcule la media de los datos.


b. Calcule la moda.

c. Calcule Ja varianza.
d. Calcule la desviacin estndar.

76 ESTADISTICA EN LOS NEGOCIOS

3.33 La Air Transport Association of Arnerica publica datos sobre los aeropuertos de mayor movimiento en Estados Unidos. La siguiente distribucin de frecuencias se elabor a partir de estos
datos para un ao reciente:
Nmero de pasajeros
que llegan y salen
(millones)

Nmero de
aeropuertos

20-menor de 30
30-menor de 40
40-menor de 50
50-meoor de 60
60-menor de 70
70-menor de 80

8
7
1
O
3

a. Calcule la media de los datos.


b. Calcule la moda.
c. Calcule la varianza.
d. Calcule la desviacin estndar.
3.34 La distribucin de frecuencias que se muestra representa el nmero de granjas por estado para 49
de los 50 estados, con base en informacin del US Departrnent of Agriculture. Determine el
nmero promedio de granjas por estado a partir de estos datos. La media calculada desde los
datos originales no agrupados es de 37 816 y la desviacin estndar es de 29 341. Cmo se compara la respuesta con estos datos agrupados? Por qu podrlan ser diferentes?
Nmero de granjas por estado

O-menor de 20 000
20 000-menor de 40 000
40 000-menor de 60 000
60 000-menor de 80 000
80 000-menor de 100 000
100 000-menor de 120 000

16
II

10
6
5

3.4 MEDIDAS DE FORMA


Las medidas de forma son herramientas que se pueden usar para describir la forma de una distribucin
de datos. En esta seccin, examinamos dos medidas de forma, sesgo y curtosis; adems, examinamos las
grficas de caja y bigote.

Sesgo
Una distribucin de datos en los que la mitad derecha es una imagen reflejada de la mitad izquierda es

simtrica. Un ejemplo de una distribucin simtrica es la distribucin normal o curva de campana, la


cual se presenta con ms detalle en el capitulo 6.
El sesgo se presenta cuando una distribucin es asimtrica o carece de simetria. La distribucin en
la figura 3.8 no tiene sesgo porque es simtrica. La figura 3.9 muestra una distribucin que est sesgada a la izquierda o negativamente sesgada y la figura 3.10 muestra una distribucin que est sesgada a
la derecha o positivamente sesgada.
La parte sesgada es la parte larga y delgada de la curva. Muchos investigadores usan distribucin
sesgada para denotar que los datos estn dispersos en un extremo de la distribucin y acumulados en
el otro extremo. En ocasiones los maestros universitarios se refieren a una distribucin de calificaciones como sesgada, con lo cual quieren decir que pocos estudiantes calificaron en un extremo de la escala
de calificaciones muchos calificaron en el otro extremo.

CAPITULO 3 ESTADlsnCA DESCIUPll\:\

~bucin simtrica

1 i @!fil
~elacin de media,
"lediana y moda

Distribucin sesgada a la derecha


o sesgada positivamente

Distribucin sesgada a la izquierda


o sesgada negativamente

~=
Mediana
Moda

(a)
Distribucin simtrica
(no hay sesgo)

Mediana

Mediana
(e)
Positivamente
sesgada

(b)
Negativamente
sesgada

Sesgo y la relacin de la media, mediana y moda


El concepto de sesgo permite entender la relacin de la media, mediana y moda. En una distribucin
unimodal (distribucin con un solo pico o moda) que est sesgada, la moda es el vrtice (punto ms
alto) de la curva y la mediana es el valor del medio. La media tiende a estar ubicada hacia la cola de la
distribucin, porque la media es afectada por todos los valores, incluyendo los extremos. Una distribucin en forma de campana o normal con la media, mediana y moda, todos en el centro de la distribucin, no tiene sesgo. La figura 3.11 muestra la relacin de la media, mecliana y moda para diferentes
tipos de sesgo.

Coeficiente de sesgo
Al experto en estadstica Karl Pearson se le da el crdito de idear por lo menos dos coeficientes de sesgo
que se pueden usar para determinar el grado de sesgo en una clistribucin. Aqu presentamos uno de
estos coeficientes, conocido como coeficiente de sesgo o de Pearson, el cual compara la media y mediana en vista de la magnitud de la desviacin estndar. Ntese que si la distribucin es simtrica, la media
y la mediana son del mismo valor y por tanto el coeficiente de sesgo es igual a cero.
COEFICIENTE
DE SESGO O DE
PEARSON
donde:
Sk = coeficiente de sesgo
Md =mediana
Supongamos, por ejemplo, que una distribucin tiene una media de 29, una mediana de 2" rm;.a
desviacin estndar de 12.3. El coeficiente de sesgo se calcula como:

sk =

3(29- 26)
12.3

= +o.73

Como el valor de Sk es positivo, la distribucin es positivamente sesgada. Si d valor de S fuera


negativo, la distribucin sera negativamente sesgada. Cuanto mayor sea la magnitud de S. ms sesgada
ser la distribucin,

78 ESTADISTICAEN LOS NEGOCIOS

Curtosis

FIGURA 3.12
Tipos de curtosis

La curtosis describe la cantidad de apuntamiento de una distribucin. Las distribuciones que


son altas y delgadas se conocen como distribuciones leptocrticas; las que son planas y dispersas como distribuciones platicrticas. Entre estos dos tipos hay distribuciones que son
ms "normales" en su forma como las mesocrticas. Estos tres tipos de curtosis se ilustran
en la figura 3.12.

Grficas de caja y bigote


Distribucin leptocrtica

Distribucin platicrtica

Otra forma de describir una distribucin de datos es mediante el uso de una grfica de caja
y bigote. Una grfica de caja y bigote, a veces llamada grfica de caja, es un diagrama que

utiliza los cuartiles superior e inferior junto con la mediana y los dos valores ms extremos para
describir grficamente una distribucin. La grfica se construye con el uso de una caja para
encerrar la mediana. Esta caja se extiende hacia fuera desde la mediana a lo largo de un
continuo hasta los cuartiles inferior y superior, encerrando asl no slo la mediana sino
tambin 50% de los datos. Desde los cuartiles inferior y superior, unas rectas conocidas
como bigotes se prolongan desde la caja hacia los valores de datos extremos. La grfica de
caja y bigote se determina a partir de cinco nmeros especficos.
l.

La mediana (Q2).

2.

El cuartil inferior ( Q1).

3.

El cuartil superior ( Q3)

4.

El valor ms pequeo de la distribucin.

5.

El valor ms grande de la distribucin.

La caja de la grfica se determina al localizar la mediana y los cuartiles inferior y supeDistribucin mesocurtica
rior en un continuo. La caja se traza alrededor de la mediana con los cuartiles inferior y
superior ( Q1 y Q3) como los puntos extremos de la caja. Estos puntos extremos de caja ( Q1
y Q3) se conocen como las bisagras de la caja.
A continuacin, el valor del rango intercuartil (IQR) se calcula con Q3 - Q1 El rango
intercuartil incluye 50% de los datos y debe ser igual a la longitud de la caja. No obstante, aqu, el rango
intercuartil se utiliza tambin fuera de la caja. A una distancia de l.5 IQR hacia afuera desde los cuartiles inferior y superior estn lo que se conoce como cercas interiores. Un bigote, o segmento de recta,
se traza desde la bisagra inferior de la caja hacia afuera del valor de los datos ms pequeo. Un segundo bigote se traza desde la bisagra superior de la caja hacia afuera del valor de datos ms grande. Las
cercas interiores se establecen como sigue:

Q1
Q3

1.5 IQR
1.5 IQR

Si los datos caen ms all de las cercas interiores, entonces pueden construirse cercas exteriores:

Q1

- 3.0 IQR

Q3 +

3.0 IQR

La figura 3.13 muestra las caractersticas de una grfica de caja y bigote.


Los valores de datos fuera de la corriente principal de valores en una distribucin se ven como
resultados aislados. Los resultados aislados pueden ser simplemente los valores ms extremos de un conjunto de datos, pero a veces se presentan debido a errores de medicin o registro. Otras veces son valores tan diferentes de otros valores que no deberan ser considerados en el mismo anlisis como el resto de
la distribucin. Los valores de la distribucin de datos que estn fuera de las cercas interiores pero den-

UM'1t+HF

ll1sagra

Bisagra

i.:

Grfica de caja y
bigote

l.SIQR\
3.0IQR

Q1

Mediana

Q3

3.0JQR

CAPITULO 3 ESTADISTICA DESCRIPm

;11

tro de las cercas exteriores se conocen como resultadosaislados leves. Los valores que estn fuera ~ bs
cercas exteriores se conocen como resultados aisladosextremos.As], uno de los principales usos de ar.a
grfica de caja y bigote es identificar resultados aislados. En algunas grficas de caja y bigote generadas
por computadora, los bigotes se trazan a los valores de datos ms grandes y ms pequeos dentro de
las cercas interiores. Un asterisco se imprime entonces para cada valor de datos ubicado entre las cercas interior y exterior para indicar un resultado aislado leve. Los valores fuera de las cercas exteriores
se indican con un cero en la gr:lfica. Estos valores son resultados aislados extremos.
Otro uso de las grficas de caja y bigote es determinar si una distribucin es sesgada. La ubicacin
de la mediana en la caja puede relacionar informacin acerca del sesgo de 50% de los datos. Si la mediana est ubicada en el lado derecho de la caja, entonces el 50% medio est sesgado a la izquierda. Si la
mediana est ubicada en el lado izquierdo de la caja, entonces el 50% medio est sesgado a la derecha.
Al examinar la longitud de los bigotes a cada lado de la caja, un investigador de negocios puede hacer
un juicio acerca del sesgo de los valores exteriores. Si el bigote ms largo est a la derecha de la caja,
entonces los datos exteriores estn sesgados a la derecha y viceversa. Vamos a utilizar los datos la tabla
del cuadro 3.10 para construir una grfica de caja y bigote.
Una vez organizados los datos en un conjunto ordenado, como se muestra en la tabla 3.11, es relativamente fcil determinar los valores del cuartil inferior (Q1), la mediana y el cuartil superior (Q3). A
partir de stos, el valor del rango intercuartil se puede calcular.
Las bisagras de la caja estn situadas en los cuartiles inferior y superior, 69 y 80.5. La mediana est
situada dentro de la caja a distancias de 4 desde el cuartil inferior y 6.5 desde el cuartil superior. La distribucin de 50% de los datos est sesgado a la derecha, porque la mediana est ms cerca de la bisagra
inferior o izquierda. La cerca inferior se construye con:
Q1

1.5 IQR

= 69 -

1.5(11.5) = 69 - 17.25 = 51.75

y
Q3 + 1.5 IQR = 80.5 + 1.5(11.5) = 80.5

17.25 = 97.75

Los bigotes se construyen al trazar un segmento de recta desde la bisagra inferior hacia afuera del
valor de datos ms pequeo y un segmento de recta desde la bisagra superior hacia afuera del valor de
datos ms grande. Un examen de los datos muestra que ninguno de los valores de datos de este conjunto de nmeros est afuera de la cerca interior. Los bigotes se construyen hacia afuera del valor ms
bajo, que es 62 y del valor ms alto, que es 87.
Para construir una cerca exterior, calculamos Q1 - 3 IQR y Q3 + 3 IQR, como sigue:
Q1 - 3 IQR = 69 - 3(11.5) = 69 - 34.5 = 34.5
Q3 + 3 lQR = 80.5 + 3(11.5) = 80.5 + 34.5 = 115.0

TABLA 3.IO

La figura 3.14 es la salida impresa MINITAB de una computadora para esta


grfica de caja y bigote.

Datos para grfica de caja y bigote


71
76
70
82
74

87
79
79
74
62

82

64

72

65
63
74

68

80

75
73

81
85

62
73

81

84

71
73

84

64

68

73

72
82

81
69

65
71

69

FIGURA 3.14
Grfica MINITAB de caja y bigote

TABLA 3.11
Datos en conjunto ordenado con cuartiles y mediana
8i
80

73
69

85
79
73
68

84

84

79
73

77
72

82
76
72
65

82
75
71

65
64
Q, =69
Qz = mediana = 73
68

OJ = 80.5

82
74
71

81
74
71

64

63

IQR = Q3 - Q1 = 80.5 - 69 = 11.5

81
74
70
62

81
73
69
62

60

ro

50
Datos de tibia

90

80 ESTADISTICAEN LOS NEGOCIOS

3.4

PROBLEMAS
3.35 En cierto dJa el promedio de precios al cierre de un grupo de acciones en la bolsa de Nueva York

es $35 (al dlar ms cercano). Si el valor de mediana es $33 y la moda es $21, est sesgada la distribucin de estos precios de acciones? Si es as, cmo?
3.36 Un hotel local ofrece bailes de saln los viernes por la noche. Un investigador observa a los clien-

tes y estima sus edades. Analice el sesgo de la distribucin de edades si la edad media es 51, la edad
mediana es 54 y la edad modal es 59.
3.37 Los volmenes de ventas de las principales empresas de corretaje de bienes rafees en Estados

Unidos, para un afio reciente, se analizaron con el uso de estadstica descriptiva. El volumen
medio anual en dlares para estas empresas es de 5 millones 510 mil dlares, la mediana es de 3
millones 190 mil dlares y la desviacin estndar es de 9 millones 590 dlares. Calcule el valor del
coeficiente de Pearson y estudie su significado. Est sesgada la distribucin? Si es as, en qu
medida?

las edades de usuarios de Internet obtenidas de una


muestra. Utilice estos datos para calcular un coeficiente de Pearson. Cul es el significado del
coeficiente?

3.38 Supongamos que los siguientes datos son

41

15

31

25

23

21

22

22

24
18

30

20

19

19

16

23

27

38

34

24

19

20

29

17

23

3.39 Construya una grfica de caja y bigote con los siguientes datos y conteste si, estos datos contie-

nen resultados aislados? Y si, est sesgada la distribucin de datos?


540

690

503

558

490

609

379

601

559

495

562

580

510

623

477

574

588

497

527

570

495

590

602

541

3.40 Suponga que le pide a un grupo de 18 consumidores que conserven una bitcora de sus prcticas
de compra y que los siguientes datos representan el nmero de cupones empleados por cada uno
en el periodo anual. Use los datos para construir una grfica de caja y bigote. Haga una lista de la
mediana, Q1, Q3, los puntos extremos para las cercas interiores y los puntos finales para las cercas
exteriores. Analice el sesgo de la distribucin de estos datos y seale cualquier resultado aislado.
81

68

70

100

94

47

66

70

82

110

105

60

21

70

66

90

78

85

3.5 MEDIDAS DE ASOCIACIN


Las medidas de asociacin son estadsticas que proporcionan informacin respecto a la relacin de
variables numricas. En este capitulo analizamos slo una medida de asociacin, la correlacin y lo
hacemos as slo para dos variables numricas.

Correlacin
La correlacin es una medida del grado de relacin de variables. Puede ayudar a que un investigador de
negocios determine, por ejemplo, si las acciones de dos lineas areas suben y bajan de una manera relacionada. Lgicamente, los precios de dos acciones de la misma industria deben estar relacionados. Para
una muestra de pares de datos, el anlisis de correlacin puede proporcionar un valor numrico que
represente el grado de relacin de los dos precios de acciones en el tiempo. En la industria del transporte, hay una correlacin evidente entre el precio del transporte y el peso del objeto que se enva?; el

CAPITULO 3 ESTADISTICA DESCmP'I1U

precio y la distancia muestran alguna relacin?; qu tan fuertes son las correlaciones.' U:s
decisiones de precios pueden estar basadas, en parte, en los costos de embarque que esA
'.latos para el ejemplo de
correlacionados con otras variables. En economa y finanzas, qu tan fuerte es la correlaEconomics
cin entre el ndice de precios al productor y el porcentaje de desempleo? En ventas al
menudeo, qu variables estn relacionadas a las ventas de una tienda en particular?; estn
las ventas relacionadas a la densidad de poblacin, nmero de competidores, tamao de la
tienda, cantidad de publicidad, u otras variables?
7.43
221
Existen diferentes medidas de correlacin, la seleccin de las cuales depende principal7.48
222
mente del nivel de datos que se analice. En el ideal, a los investigadores les gusta despejar p,
8.00
226
el coeficiente poblacional de correlacin, pero como prcticamente siempre manejan datos
7.75
225
4
muestrales, esta seccin introduce un coeficiente de correlacin muestra! r, de amplio uso.
224
5
7.flJ
Esta medida es aplicable slo si ambas variables analizadas tienen al menos un nivel de
intervalo de datos. El captulo 17 presenta una medida de correlacin que se puede usar
223
7.63
6
cuando los datos son ordinales.
223
7.68
El estadstico r es el coeficiente de correlacin de Pearson, nombre que recibe 'en
226
7.67
8
honor a Karl Pearson (1857-1936), estadstico ingls que ide varios coeficientes de corre7.59
226
9
lacin junto con otros importantes conceptos de estadstica. El trmino res una medida
235
8.07
10
de la correlacin lineal entre dos variables. Es un nmero que varia de -1 a + 1, que repre233
11
8.03
senta la fuera de la relacin entre las variables. Un valor r de + l denota una perfecta rela241
12
8.00
cin positiva entre dos conjuntos de nmeros. Un valor r de - 1 denota una perfecta
correlacin negativa, lo cual indica una relacin inversa entre dos variables: cuando una se
hace ms grande, la otra se hace ms pequea. Un valor r de O significa que no existe relacin lineal
entre dos variables.

TABLA 3.12

COEFICIENTE
DE CORRELACIN
DEPEARSON

L:(x - x)(y- y)

La figura 3.15 representa cinco diferentes grados de correlacin: a) representa fuerte correlacin
negativa, b) representa moderada correlacin negativa, e) representa moderada correlacin positiva,
d) representa fuerte correlacin positiva (e) no contiene correlacin.

TABLA 3.13
Clculo de r para el
ejemplo de
Economics

.......
,...._

lndlice

Dla
s
T
----------------------------7.43
221
7.48
222
2
8.00
226
3
7.75
225
4
7.60
224
5
7.63
223
6
7.68
223
7
7.67
226
8
7.59
226
9
235
10
8.07
8.03
233
11
241
12
a.oo
Ix 92.93 I12ns

(21 115.07)r=

1112

55.205
55.590
64.000
60.063
57.760
58.217
58.982
58.829
57.608
65.125
64.481
64.000
~-720.220

"T
48841
1642.03
1660.56
49284
1808.00
51076
50625
1 743.75
50176
1 702.40
49n9
1 701.49
49729
1 712.64
51076
1 733.42
1 715.34
51076
1896.45
55225
54289
1870.99
58081
1928.00
I,.Z= 619207 Ixy =21 115.07

(92.93)(2n5)
l

= .815

(720.22)- (92.93)2~ (619.207) - (2725) 2'


12
12

82

ESTADISTICA EN LOS NEGOCIOS

U@lfii@.

Cinco correlaciones

a) Fuertecorrelacin negativa (r = -0.933)

'.,.

. ; .

s:

..... . . . ..
.. .... . .
. . . . .... '
.-.. ...
,,. ",.. .
. ... . .

...

. ... . . . -... .
. ..: .. ...
.

d) Fuertecorrelacin positiva (r = .909)

e) Moderada correlacinpositiva(r= .518)

:
..
.
.
.. ,~. .... .
, - ...
i: :. _, ..
... .. '. ...
. ..
.
.
:.
.
.
.. .... :.. .

. ....
.
... . ..
.
.
.
,
..... . .:.. . :... .
.. .: ., ..

. ~:

..

..

..

,,. 'f
;.,

e) Prcticamenteno hay correlacin (r = -0.004)

..

..
..~-:. , ..

. ' .

... ..... . '.


.
h'fll!;Mi..
Salida Excel y
MINITAB para
el ejemplo de
Economics

Salida Excel
A
1
2

lnterest Rata

3 Futuras lndex

b) Moderada correlacin negativa (r -0.674)

lntarast Rata

Futuras lndex

. ..

1
0.815

Salida MINITAB
Correlaciones:TASA DE INTE~, INDICEFUTUROS
Pearson correlation of INTEREST RATE and FUTURES INDEX

0.815

CAPITUW 3 ESTADISnCA DE.Sall"m \ 13

Cul es la medida de correlacin entre la tasa de inters de fondos federales y el ndice de futuros
de mercancas o productos? Con datos como los que se muestran en la tabla 3.12 y que representan b
valores de tasas de inters de fondos federales e ndices de futuros de mercancas o productos para una
muestra de 12 das, es posible calcular un coeficiente r.
El examen de la frmula para calcular un coeficiente de correlacin de Pearson deja ver que los
siguientes valores deben obtenerse para calcular r: Ix, lx2, ly,Iy2, Ixy y n. En anlisis de correlacin,
no importa cul variable se designe x y cul se designe y. Para este ejemplo, el coeficiente de correlacin se calcula como se ve en la tabla 3.13. El valor r obtenido (r = 0.815) representa una relacin positiva relativamente fuerte entre tasas de inters e ndice de futuros de mercancias o productos en un
periodo de 12 dias.
La figura 3.16 muestra salidas de Excel y MINITAB para este problema.

3.5 PROBLEMAS
3.41 Determine el valor del coeficiente de correlacin, r, para los siguientes datos:
X
y

11

14

17

18

12

13

21

3.42 Determine el valor de r para Jos siguientes datos:


X
y

158

296

87

110

436

349

510

301

322

550

3.43 En un esfuerzo por determinar si existe alguna correlacin entre el precio de acciones de aerolneas, un analista muestre seis dias de actividad del mercado accionario. Con el uso de los
siguientes precios de la accin Delta y la accin Southwest, calcule el coeficiente de correlacin.
Para mayor comodidad, los precios de acciones se han redondeado al dcimo ms cercano:
Delta

Southwest

47.6

15.l

46.3

15.4

50.6

15.9

52.6

15.6

52.4

16.4

52.7

18.1

3.44 Los siguientes datos son las reclamaciones (en millones de dlares) por prestaciones de BlueCross
BlueShield para nueve estados, junto con el sobrante (en millones de dlares) que la compaa
tenla en activos en esos estados:
Estado
Alabama
Colorado
Florida
!llinois
Maine
Montana
Dakota del Norte
Oklahoma
Texas

Reclamacin
$1425

Sobrante
$277

273

100

915

120

l 687

259

234

40

142

25

259

57

258

31

894

141

Utilice los datos para calcular un coeficiente de correlacin r, para determinar la cornbcin entre
reclamaciones y sobrantes.
3.45 El National Safety Council public los siguientes datos sobre porcentaies de inci<lmc:a. por lesiones mortales o que hacen perder tiempo de trabajo, por 100 empleados de varias industrias en
tres aos recientes.

CAPITUW 3 ESTADISnCA DE.Sall"m \ 13

Cul es la medida de correlacin entre la tasa de inters de fondos federales y el ndice de futuros
de mercancas o productos? Con datos como los que se muestran en la tabla 3.12 y que representan b
valores de tasas de inters de fondos federales e ndices de futuros de mercancas o productos para una
muestra de 12 das, es posible calcular un coeficiente r.
El examen de la frmula para calcular un coeficiente de correlacin de Pearson deja ver que los
siguientes valores deben obtenerse para calcular r: Ix, lx2, ly,Iy2, Ixy y n. En anlisis de correlacin,
no importa cul variable se designe x y cul se designe y. Para este ejemplo, el coeficiente de correlacin se calcula como se ve en la tabla 3.13. El valor r obtenido (r = 0.815) representa una relacin positiva relativamente fuerte entre tasas de inters e ndice de futuros de mercancias o productos en un
periodo de 12 dias.
La figura 3.16 muestra salidas de Excel y MINITAB para este problema.

3.5 PROBLEMAS
3.41 Determine el valor del coeficiente de correlacin, r, para los siguientes datos:
X
y

11

14

17

18

12

13

21

3.42 Determine el valor de r para Jos siguientes datos:


X
y

158

296

87

110

436

349

510

301

322

550

3.43 En un esfuerzo por determinar si existe alguna correlacin entre el precio de acciones de aerolneas, un analista muestre seis dias de actividad del mercado accionario. Con el uso de los
siguientes precios de la accin Delta y la accin Southwest, calcule el coeficiente de correlacin.
Para mayor comodidad, los precios de acciones se han redondeado al dcimo ms cercano:
Delta

Southwest

47.6

15.l

46.3

15.4

50.6

15.9

52.6

15.6

52.4

16.4

52.7

18.1

3.44 Los siguientes datos son las reclamaciones (en millones de dlares) por prestaciones de BlueCross
BlueShield para nueve estados, junto con el sobrante (en millones de dlares) que la compaa
tenla en activos en esos estados:
Estado
Alabama
Colorado
Florida
!llinois
Maine
Montana
Dakota del Norte
Oklahoma
Texas

Reclamacin
$1425

Sobrante
$277

273

100

915

120

l 687

259

234

40

142

25

259

57

258

31

894

141

Utilice los datos para calcular un coeficiente de correlacin r, para determinar la cornbcin entre
reclamaciones y sobrantes.
3.45 El National Safety Council public los siguientes datos sobre porcentaies de inci<lmc:a. por lesiones mortales o que hacen perder tiempo de trabajo, por 100 empleados de varias industrias en
tres aos recientes.

84 ESTADISTICAEN LOS NEGOCIOS


Industria

Ao!

Ao2

Textil

.46

.48

Ao3
.69

Qumica

.52

.62

.63

.90

.72

.81

Maquinaria

1.50

1.74

2.10

Servicios

2.89

2.03

2.46

Metales no ferrosos

1.80

1.92

2.00

Alimentos

3.29

3.18

3.17

Gobierno

5.73

4.43

4.00

Comunicaciones

Calcule r por cada par de aos y determine cules aos tienen mayor correlacin.

3.6 ESTADSTICA DESCRIPTIVA EN LA COMPUTADORA


Tanto MINITAB como Excel dan extensas estadsticas descriptivas. Aun cuando cada paquete de
cmputo puede calcular estadsticas individuales como lo es una media o una desviacin estndar, tambin pueden producir estadsticas descriptivas mltiples. La figura 3.17 muestra una salida MINITAB
para las estadsticas asociadas con los datos de produccin de computadoras presentados anteriormente en esta seccin. La salida MINITAB contiene, entre otras cosas, la media, la mediana, la desviacin estndar rnuestral, el mnimo y mximo (que se pueden usar para calcular el rango), y Q1 y Q3 (de
los cuales se puede calcular el rango intercuartil). La salida de estadsticas descriptivas de Excel para los
mismos datos de produccin de computadoras se ve en la figura 3.18. La salida de Excel contiene la
media, la mediana, la moda, la desviacin estndar muestral, la varianza muestral y el rango. La funcin de estadstica descriptiva en cualquiera de estos paquetes de computadora proporciona mucha
informacin til acerca de un conjunto de datos. MINITAB y Excel tambin tienen la capacidad de
calcular el coeficiente de correlacin r.

rna11i!llE

Salida MINITAB
para el problema
de produccin de
computadoras

ifll;f fM
Salida Excel para
el problema de
produccin
de computadoras

ESTADISTICAS DESCRIPTIVAS
Variable
N
Mean
Computer
13.00
5
Variable
Computer

Mini.mum.
5.00

Ma.ximum

18.00

Median
16.00

TrMean
13.00

Q,

7.00

17.50

DATOS DE PRODUCCIN DE COMPUTADORAS


1

z
3
4

e
7

e
.9

10
11
112
J;j

A
Mean
Standard error
Median
Mode
Standard devianon
Sample variance
Kurtos1s
Skewness
Ranga
Msn1mum
Max1mum
Sum
Count

B
13
2.5495
16

N/A
5.7009
32.5
-1.7112

-0.8096
13
5
18
65
5

stoev

SE Mean

5.70

2.55

CAPfTULo 3 ESTADISTICA DESCRJPTIVA 85

Estadsticas de lavandera
Las estadisticas descriptivas presentadas en este captulo son excelentes para resumir y presentar conjuntos de datos en formatos ms concisos. Por ejemplo, la pregunta 1 de las preguntas gerenciales y
estadJsticas del Dilema de decisin reportamedidas de agua para SO casas en Estados Unidos. Con el
uso de Excel y/o MINITAB, muchas de las estadJsticas descriptivas presentadas en este captulo se pueden aplicar a estos datos. Los resultados se ilustran en las figuras 3.19 y 3.20.
Estas salidas de computadora muestran que el promedio de uso de agua es 15.48 galones con una
desviacin estndar de 1.233 galones. La media es 16 galones con un rango de 6 galones (12 a 18). El
primer cuartil es 15 galones y el tercer cuartil es 16 galones. La moda es tambin 16 galones. La grfica
MINITAB y las medidas de sesgo muestran que los datos estn ligeramente sesgados a la izquierda. La
aplicacin del teorema de Chebyshev a la media y desviacin estndar muestra que por lo menos
88.9% de las mediciones deben caer entre 11.78 galones y 19.18 galones. Un examen de
los datos y el mnimo y mximo revelan que 100% de los datos en realidad caen dentro
FIGURA 3.19
de estos lmites.
Estadstica descriptiva
Segn el Dilema de decisin, el tiempo medio de ciclo de lavado es 3S minutos con una
de Excel
desviacin estndar de cinco minutos. Si de manera aproximada los tiempos de ciclo de
lavado estn normalmente distribuidos, podemos aplicar la regla emprica. Segn la regla
USO DE AGUA
emprica, 68% de los tiempos caeran dentro de 30 y 40 minutos, 9S% de los tiempos caeA
B
ran dentro de 25 y 45 minutos y 99.7% de los tiempos de lavado caeran dentro de 20 Y. SO
1 Mean
15.48
minutos. Si los datos no estn normalmente distribuidos, el teorema de Chebyshev deja ver
0.174
2 Standard error
que al menos 75% de los tiempos deberan caer entre 2S y 4S minutos y 88.9% debera caer
16
3 Median
16
4 Moda
entre 20 y 50 minutos.
1.233
5 Standard deviation
Est la cantidad (peso) de lavandera correlacionada con el ingreso familiar? Si se
1.52
6 Sample variance
calcula un coeficiente de correlacin sobre los datos del Dilema de decisin, se encuentra r de
0.264
7 Kurtosis
0.723. Este resultado indica que es probable alguna correlacin entre los dos conjuntos
'._Q,531
8 Skewness
de datos. No obstante, no es una correlacin perfecta ni es una correlacin muy fuerte. La
6
9 Ranga
tendencia parece ser que las casas con ms altos ingresos hacen cantidades de lavandera
10 M1nimum
12
ms grandes; sin embargo, en algunos casos, los hogares con menores ingresos todava hacen
11 Max1mum
18
12 Sum
774
cantidades relativamente grandes de lavandera y los de ingresos ms altos a veces hacen menos
13 Count
50
lavandera.

hflltiij1.

Variable: uso de agua

Estadstica
descriptiva

Prueba de normalidad AndersonDarling


A cuadrado
1.598
Valor P
0.000

MINITAB

12
1

13

14

15
1

16
1

18

17
1

J
IS.O

15.5

15.4800
1.2329
1.52
-5.3E--01
0.263785
50

Mnimo
Primer cuartil
mediana
Tercer cuartil
mxima

12.0000
15.0000
16.0000
. 16.0000
18.0000

95% de intervalo de confianza


para Mu
15.83G'

95% de intervalo de confianza para Mu

Media
Desviacin estndar
Varianza
Sesgo
Curtosis
Variable N

15.1296
1
16.0

95% de intervalo de confianza para Mediana

95% de intervalo de con"ianza


para Sigma
l.0299

15.0000

1.5363

95% de intervalo de confianza


para mediana
16.0000

CONSIDERACIONES

~TICAS

UD cuerpo ele datos a una audiencia, es mejor uaar cua&esquiera medidas que sean
necearias para presentar una imagen "completa" de los datos. Al limitar las medidas descriptivas
~
el iimstigador de negocios puede dar a la audiencia slo parte de la imagen y puede
8C9f la forma en que el receptor entienda los datos. Por ejemplo, si un investigador presenta
slo la media. la audiencia no tendr nociones de la variabilidad de los datos; adems, la media
pocii:4 desordenadamente grande o pequea debido a valores extremos. Del mismo modo,
la~
ele la media impide una imagen que incluya estos valores. El uso de la moda puede causar qpe el receptor de la informacin se concentre slo en valores que ocurren con frecuencia.
A,l menos una medida de variabilidad suele ser necesaria cuando menos con una medida de
~
central para que la audiencia comience a entender q~ aspecto tienen los datos.
~ores no ticos podrian tratar de presentar slo la medida descriptiva que lleve la imalJl!D ele los datos que desean que la audiencia vea; en cambio, los investigadores 4!ticos usarAn cualquiera y todos los mtodos que presentan la imagen ms informativa y ms completa posible de
los datos.
Una fuerte correlacin no necesariamente indica causa y efecto. No es profaiooal ni ~
sacar conclusiones de causa y efecto slo porque dos variables estn n:lacionadas. Por ejemplo,
suponga que el nmero de furgonetas rentadas aumenta con la temperatura. Algunos ejecuUpodrian pensar que entre ms caliente sea el da ms personas las rentarn, La realidad es que lo
hacen cuando los estudiantes salen de vacaciones para evitar que dejen de asistir a la escuela, ya
que tienen vacaciones por lo general en verano en casi todos los paises cuando las temperaturas
son m lidas. Por tanto, puede ser que el calendario escolar sea el que provoque que las furgonetas se renten, no la temperatura. Una rae.ha de calor en enero no necesariamente genera ms
rentas.
El ex gobernador de Colorado, Richard Lamm, se menciona como autor de la frase de "los
demgrafos son acadmicos que pueden demostrar estadsticamente que el promedio de personas en Miami nace cubano y muere judo ... " Es ms probable que las personas lleguen a este tipo
de conclusin si los investigadores dan estadsticas descriptivas incompletas o confusas.
Ala L Ollm. "l'llople l'atleml/Odds and !!neis.The Wall Street Journal, 29 de )UDIO de 19'12, p. B 1 Rcimprno con permlle 4e 1" .. SlrM """"'1l O 1992. Dow Iones & Company,lnc. Todoslos derechos reservados en el mundo.

RESUMEN
Las medidas estadsticas descriptivas incluyen medidas de tendencia central, de variabilidad y medidas de forma. las medidas de tendencia central y medidas de variabilidad se calculan de
manera diferente para datos no agrupados y agrupados. las
medidas de tendencia central son tiles para describir datos
porque comunican informacin acerca de las partes ms centrales de los datos. las medidas ms comunes de tendencia
central son las tres m: moda, mediana y media. Adems, los
percentiles y cuartiles son medidas de tendencia central.
la moda es el valor que se presenta con rns frecuencia en
un conjunto de datos. Si dos valores empatan para la moda,
los datos son bimodales. Los conjuntos de datos pueden ser
multimodales. Entre otras cosas, la moda se emplea en negocios para determinar tamaos.
La mediana es el trmino medio de un conjunto ordenado de nmeros que contienen un nmero impar de trminos.
Para un conjunto con nmero par de trminos,la mediana es
el promedio de los dos trminos medios. La frmula (n + 1)/2
especifica la ubicacin de la mediana. Una mediana no resulta

afectada por la magnitud de valores extremos. Esta caracterstica hace de la mediana una medida ms til y apropiada de
ubicacin al reportar elementos como son el ingreso, edad y
precios de casas.
La media aritmtica se utiliza mucho y por lo general es
lo que los investigadores citan cuando usan la palabra media.
La media aritmtica es el promedio. La media poblacional y la
media muestra] se calculan de la misma manera pero se denotan con simbolos diferentes. A la media aritmtica la afecta
cada valor y es influenciada por valores extremos.
Los percentiles dividen un conjunto de datos en 100 grupos, lo cual significa que se requiere de 99 percentiles. Los
cuartiles dividen datos en cuatro grupos. Los tres cuartiles son
Q1, que es el cuartil ms bajo; Q2, que es el cuartil de en medio
e igual a la media; y Q3, que es el cuartil superior.
Las medidas de variabilidad son herramientas estadsticas
empleadas en conjuncin con medidas de tendencia central
para describir datos. las medidas de variabilidad dan una descripcin de datos que las medidas de tendencia central no

CAPITULO 3 ESTADISTICA DESCRIPTIVA 87

pueden dar: informacin acerca de la dispersin de los valores


de datos. Estas medidas incluyen el rango, desviacin media
absoluta, varianza, desviacin estndar, rango intercuartil y
coeficiente de variacin para datos no agrupados.
Una de las medidas ms elementales de variabilidad es el
rango. Es la diferencia entre los valores ms grande y ms
pequeo. Aun cuando el rango es fcil de calcular, tiene utilidad limitada. El rango intercuartil es la diferencia entre los
cuartiles tercero y primero. Es igual al rango de 50% de los
datos.
La desviacin media absoluta (MAD) se calcula al promediar los valores absolutos de las desviaciones desde la
media. La desviacin media absoluta da la magnitud de la
desviacin promedio pero sin especificar su direccin. La des+iacin media absoluta tiene uso limitado en estadstica, pero
hav creciente inters para el uso de MAD en el campo de pronsticos.
La varianza se utiliza ampliamente como herramienta en
estadstica pero se emplea poco como medida independiente
de variabilidad. La varianza es el promedio del cuadrado de
desviaciones alrededor de la media.
La raz cuadrada de la varianza es la desviacin estndar.
Tambin es una herramienta muy usada en estadstica. Se
emplea con mayor frecuencia que la varianza como medida
independiente. La desviacin estndar se comprende mejor al
examinar sus aplicaciones para determinar en dnde estn los
datos en relacin con la media. La regla emprica y el teorema
de Chebyshev son enunciados acerca de las proporciones de
valores de datos que estn dentro de varias veces la desviacin
estndar desde la media.
La regla emprica revela el porcentaje de valores que estn
dentro de una, dos o tres desviaciones estndar de la media
para un conjunto de datos. La regla emprica aplica slo si los
datos son una distribucin en forma de campana. De acuerdo
con la regla emprica, aproximadamente 68% de todos los
valores de una distribucin normal estn dentro de ms o
menos una desviacin estndar de la media. Noventa y cinco
por ciento de todos los valores estn dentro de dos desviaciones estndar a cualquier lado de la media, y prcticamente
todos los valores estn dentro de tres desviaciones estndar de
la media.

El teorema de Chebyshev tambin delinea la proporcin


de valores que estn dentro de un nmero dado de desviaciones estndar desde la media; sin embargo, aplica a cualquier
distribucin. Segn el teorema de Chebyshev, al menos 1 1 / k2 valores estn dentro de k desviaciones estndar de la
media. El valor z representa el nmero de desviaciones estndar que un valor est desde la media para datos normalmente
distribuidos.
El coeficiente de variacin es una razn entre una desvacin estndar y su media, dado como porcentaje. Es especialmente til para comparar desviaciones estndar o varianzas
que representan datos con medias diferentes.
Algunas medidas de tendencia central y algunas medidas
de variabilidad se presentan para datos agrupados. Estas
medidas incluyen la media, moda, varianza y desviacin
estndar. En general, estas medidas son slo aproximadas para
datos agrupados porque los valores de los datos reales sin procesar son desconocidos.
Dos medidas de forma son el sesgo y la curtosis. El sesgo
es la falta de simetra en una distribucin. Si una distribucin
est sesgada, est alargada en una direccin o la otra. La parte
sesgada de la grfica es su parte larga y delgada. Una medida
de sesgo es el coeficiente de Pearson.
La curtosis es el grado de apuntamiento de una distribucin. Una distribucin alta y delgada se conoce como leptocrtica. Una distribucin plana es platicrtica, y una
distribucin con un apuntamiento ms normal se dice que es
mesocrtica.
Una grfica de caja y bigote es una representacin grfica
de una distribucin. La grfica se construye al usar la mediana, el cuartil inferior y el cuartil superior. Puede dar informacin acerca del sesgo y resultados aislados.
La correlacin bivariada puede lograrse con varias medidas diferentes. En este captulo se presenta slo un coeficiente
de correlacin: el coeficiente de correlacin, r, de Pearson. Este
valor va de -1 a +l. Un valor r de + 1 es una correlacin positiva perfecta y un valor r de - 1 es una correlacin negativa
perfecta. La correlacin negativa significa que a medida que
una variable aumenta en valor, la otra variable tiende a decrecer. Para valores r cercanos a cero, existe poca o ninguna
correlacin.

TRMINOSCLAVE
birnodal

desviacin estndar

medidas de tendencia central

coeficiente de correlacin ( r)

medidas de variabilidad

regla emprica

coeficiente de sesgo

desviacin media absoluta


(MAD)

rango intercuartil

mesocrtica

sesgo

coeficiente de variacin ( CV)

grfica de caja y bigote

moda

suma de cuadrados de x

correlacin

leptocrtica

multimodal

teorema de Chevyshev

cuartiles

media aritmtica

percentiles

valor z

curtosis

mediana

platicrtica

varianza

desviacin desde la media

medidas de forma

rango

88 ESTADISTICA EN LOS NEGOCIOS

FRMULAS
Media poblacional (no agrupada)
Ex

Desviacin estndar muestra!

11=-:

Media muestra] (no agrupada)

-x=- Ex
11

Ex2- (Ex)2

Desviacin media absoluta


MAD= Elx-I
N

E(x-)2

Ex2-11(x)2
11-I

Teorema de Chebyshev

Ex2_ (Ex)2

l--

u2

11-I

5=

Varianza poblacional (no agrupada}


u2

11

5=

k2

Valoresz

Ex2 -N2
N
Desviacin estndar poblacional (no agrupada)

x-
z=-u

a=J;;l

Coeficiente de variacin

a=~

CV=~(IOO)

Lx2 - (Ex)2
N
N

Rango intercuartil
!QR

Varianza muestra] (agrupada)

u=~
Media agrupada

Ef(M-x)2

E/M

n-1

11agrupada= N

n-1

Desviacin estndar muestra! (agrupada)

Varianza poblacional (agrupada)

= Q3-Q1

Ef(M-)2

EJM2 - (EJM)2
N

Desviacin estndar poblacional (agrupada)

5=

Ef(M-x)2 =
n-1

EJM2 - (E/M)2
11

n-1

Coeficiente de Pearson

E/M2 - (E/M)2
N
N
Varianza muestra!
52

n-l

r=

Lx2 - (Ex)2
52

Coeficiente de correlacin de Pearson

= E(x-x)2
=

11

n-1

-11(x)2
= Ex211-I

L:(x-x)(y-y)
JE(x-xh:.(y-y)2

(L:xL:y)
L:xy---11

CAPITULO 3 ESTADISTICA DESCRIPTIVA

89

ROBLEMAS COMPLEMENTARIOS
aleulo de estadsticas
-16 En el censo de Estados Unidos en 2000 se pidi a cada
familia informar respecto a las personas que vivan en
cada hogar. Suponga que para una muestra de 30 hogares seleccionados, el nmero de personas en cada una se
report como sigue:
2

5
2

3 2
8 3

3
2

2
3

Calcule la media, mediana, moda, rango, cuartiles inferior y superior y rango intercuartil para estos datos.
.47 En el censo de Estados Unidos en 2000 se pidi la edad
de cada persona. Supongamos que una muestra de 40
familias mostr la edad de la primera persona registrada en la siguiente forma:

42

29

3( 38 55

27

28

33

49

70

25

21

38

47

63

22

38

52

50

41

19

22

29

81

52

26

35

38

29

31

48

26

33

42

58

40

32

24

34

25

l8 Segn la National Association of Investment Clubs


PepsiCo es la accin ms cotizada en los clubes de inversin, ya que cuenta con l 388 clubes que poseen acciones
de PepsiCo. Intel es un cercano segundo lugar,seguido de
Motorola. Para la siguiente lista de las acciones ms cotizadas en clubes de inversin, calcule la media, mediana,
P30, P60, P90, Q,, Q3, rango y rango intercuartil.
Nmero de clubes
que poseen acciones

PepsiCo
Intel
Motorola
Tricon Global Restaurants
Merk &Co.

11 388
11 019

AFLAC

6 796
6 552
6 498
6101
5 563
5 414
5 390
5 033
4 541

Diebold
McDonald's
Coca-Cola
Lucent Technologies
Home Depot
Clayton Homes
RPM

Cisco Systerns

Promedio de circulacin
Peridico

Calcule P10,Pso' Q, Q3, el rango intercuartil y el rango


para estos datos.

Compaa

3.49 Editor & Publisher lntemational Yearbook public una


lista de los principales 10 peridicos de Estados Unidos,
como se muestra aqui. Utilice estos datos poblacionales
para calcular la media y la desviacin estndar. Las cifras
son los promedios de circulacin diaria de lunes a viernes. Como los nmeros son grandes, puede ahorrarse
trabajo si se modifican los datos moviendo el punto decimal seis lugares a la izquierda (por ejemplo, 1 -- 4 880
se convierte en 1.77488). Si el lector modifica los datos
en esta forma, la media y desviacin estndar resultantes sern correctas para los datos modificados. Para
reescribir las respuestas y que sean correctas para los
datos originales, de nuevo mueva el punto decimal a la
derecha seis lugares en las respuestas.

9 863
9 168
8 687

Wall Street Journal


USA Today
New York Times
Los Angeles Times
Washington Post
(New York) Daily News
ChicagoTribune
Long lsland Newsday
Houston Chronicle
Dallas Morning News

diaria
1 762 751

1692666
1 097 180
1 033 399
762 009
704 463
661 699
576 345
546 799
495 597

3.50 Mostramos las compaas con mayor capacidad de refinacin de petrleo en el mundo, segn el Petroleum
Intelligence Weekly. Utilice estos datos poblacionales y
conteste las preguntas.
Compaa
ExxonMobil
Royal Dutch/Shell
China Petrochemical
Petroleos de Venezuela
SaudiArabian Oil
BP Amoco
Chevron
Petrobas
Texaco
Petroleos Mexicanos(Pemex)
National lranian Oil

Capacidad
(miles de barriles
pordia)
6 300
3 791
2 867
2 437
1 970
1 965
1661
1 540
1 532
1 520
1 091

a. Cules son los valores de la media v la ~


Compare las respuestas y exprese cul 'prefiere como
medida de situacin para estos datos y por qu.

90 ESTADISTICA

EN LOS NEGOCIOS

e. Calcule

el coeficiente

de Pearson

y comente

Nmero de empleados que


trabajan en ventas por televisin

sobre el

sesgo de esta distribucin.


3.51

El U.S. Department
produccin
10 principales
bustible

of the Interior

de minerales.
estados

en Estados

Estado

publica

A continuacin

de produccin

~menorde20
2~ menor de 40
4~ menor de 60
6~ menor de 80
8~ menor de 100

cifras sobre
aparecen

mineral

los

no com-

Unidos.

Valor (millones

de dlares)

California

3 350

Nevada

2 800

Ar izo na
Texas
Florida
Michigan
Georgia
Minnesota
Utha
Missouri

2 550
2 050
1 920
1 670
1 660
1 570
1 420
1 320

Nmero de
compaias
32
16
13
10
19

a. Calcule la media y moda para esta distribucin.


b. Calcule la desviacin estndar para estos datos.
3.54 Determine el coeficiente de correlacin de Pearson para
los siguientes datos.
X
Y84

10

9 6
457

2
9

Pruebe sus conocimientos

Frecuencia

3.55 Los analistas financieros gustan de usar la desviacin


estndar como medida de riesgo para una accin.
Cuanto ms grande es la desviacin en el precio de una
accin con el tiempo, mayor es el riego de invertir en la accin. No obstante, los precios promedio de algunas
acciones son considerablemente ms altos que el precio
promedio de otras, considerando el potencial de una mayor desviacin estndar de precio. Por ejemplo, una
desviacin estndar de $5.00 en una accin de $10.00 es
considerablemente diferente que una desviacin estndar de $5.00 en una accin de $40.00. En esta situacin,
un coeficiente de variacin podra dar intuicin sobre el
riesgo. Supongamos que la accin x cuesta un promedio
de $32.00 por accin y mostr una desviacin estndar de
$3.45 en los ltimos 60 das. Supongamos que la accin
Y cuesta un promedio de $84.00 por accin y mostr
una desviacin estndar de $5.40 en los ltimos 60 das.
Utilice el coeficiente de variacin para determinar la
variabilidad para cada accin

9
16
27
44
42
23
7
2

3.56 La Polk Company report que el tiempo promedio de


un auto en las carreteras de Estados Unidos recientemente es de 7 .5 aos. Supongamos que la distribucin
de tiempo de los autos en las carreteras es aproximadamente en forma de campana. Si 99.7% de los tiempos
son entre 1 y 14 aos, cul es la desviacin estndar de
tiempos? Suponga que la desviacin estndar es 1.7 aos
y la media es 7.5 aos. Entre cules valores caeran 95%
de los tiempos ?

a. Cules son la media y edades modales de radioescuchas de mayor edad?


b. Cules son la varianza y desviacin estndar de las
edades de radioescuchas de mayor edad?

3.57 Segn un informe de Human Resources, un trabajador en


los paises industrializados pasa un promedio de 419
minutos al da en el trabajo. Suponga que la desviacin
estndar de tiempo empleado en el trabajo es 27 minutos.

3.53 Una agencia de investigacin realiza un estudio demogrfico a 90 compaas de ventas por televisin para
determinar el tamao de sus operaciones. Cuando se
pidi informar cuntos empleados trabajan ahora en su
operacin de ventas por televisin, las compaas dieron
respuestas que variaban de 1 a 100. El analista de la agencia organiza las cifras en una distribucin de frecuencias.

a. Si la distribucin de tiempo empleado en el trabajo


tiene aproximadamente la forma de una campana,
entre cules tiempos estaran 68, 95 y 99.7% de las
cifras?
b, Si la forma de la distribucin de tiempos se desconoce, aproximadamente cul porcentaje de los tiempos
estara entre 359 y 479 minutos?

a. Calcule la media, mediana y moda.


b. Calcule el rango, rango intercuartil, desviacin media
absoluta, varianza muestra! y desviacin muestra!
estndar.
c. Calcule el coeficiente de sesgo de Pearson para estos
datos.
d. Dibuje una grfica de caja y bigotes.
3.52 El mercado para quienes escuchan msica por la radio
es diverso. Los formatos para el radioescucha incluyen
msica contempornea para adultos, lbumes de rock,
las mejores 40, antiguas, rap, country y western, clsica y
jazz. Al estudiar audiencias, los investigadores de mercado necesitan concentrarse en las edades de los radioescuchas atrados a formatos particulares. Supongamos
que un investigador de mercado estudi una muestra de
170 radioescuchas y estaciones de msica antigua y
obtuvo la siguiente distribucin de edades.
Edad
15- menor
2~ menor
25- menor
3~ menor
35- menor
4~ menor
45- menor
5~ menor

de 20
de 25
de 30
de 35
de 40
de 45
de 50
de 55

CAP(TUWJ ESTADISTICA DESCRIPTIVA 91

c. Suponga que un trabajador pasa 400 minutos en el


trabajo. Cul seria el valor Z y qu le dirfa al investigador?
l.58 Durante la dcada de 1990, se esperaba que los negocios
mostraran mucho inters en paises de Europa central y
oriental. Cuando empezaron a abrirse nuevos mercados,
empresarios estadounidenses necesitaban una mejor
idea del mercado potencial de esa regin. Las siguientes
son cifras de PIB per cpita para ocho de estos pases
europeos, publicadas por el World Almanac:
Pals
Albania
Bulgaria
Croacia
Alemania
Hungra
Polonia
Rumania

Bosnia y Herzegovina

PIB per calpita (USS)


1 650
4300
5 100
22 700
7 800
7 200
3900
1 770

a. Calcule la media y desviacin estndar para Albania,


Bulgaria, Croacia y Alemania.
b. Calcule la media y desviacin estndar para Hungria,
Polonia, Rumania y Bosnia y Herzegovina.
c. Utilice un coeficiente de variacin para comparar las
dos desviaciones estndar. Trate los datos como poblacionales.
3.59 Segn la Bureau of Labor Statistics, el salario promedio
anual de un trabajador en Detroit, Michigan, es $35 748.
Suponga que la mediana del salario anual para un trabajador de este grupo es $31 369 y la moda es $29 500. Est
sesgada la distribucin de salarios para este grupo? Si es
as, cunto y por qu? Cul de estas medidas de tendencia central utilizara usted para describir estos datos?
Por qu?
3.60 Qu tan fuerte es la correlacin entre la tasa de inflacin y los rendimientos de bonos a 30 aos de la tesorerla? Los siguientes datos publicados por Fuji Securities
se dan como pares de tasas de inflacin y rendimientos
de bonos de la tesorera para aos seleccionados en un
periodo de 35 aos:
Rendimiento de bonos
Tasa de inflacin
a 30 aos
1.57%
2.23
2.17
4.53
7.25
9.25
5.00
4.62

3.05%
3.93
4.68
6.57
8.27
12.01
10.27
8.45

Calcule el coeficiente de correlacin de Pearson para


determinar la intensidad de la correlacin entre estas dos
variables. Comente sobre la intensidad y direccin de la
correlacin.

3.61 De acuerdo con el US Army Corps of Engineers, los 20


principales puertos de Estados Unidos, clasificados por
tonelaje total (en millones de toneladas) fueron como
sigue:
Puerto

Lousiana del Sur, LA


Houston, TX
Nueva York, NY y NJ
Nueva Orlens, LA
Corpus Christi, TX
Beamount, TX
Ba ton Rouge, LA
Puerto de Plaguemines, LA
Long Beach,CA
Valdez,AK
Pitsburgh, PA
Tampa, FI
Lake Chales, LA
Ciudad de Texas, TX
Mobile,AL
Duluth-Superior, MN y WI
Los Angeles, CA
Norfolk Harbor, VA
Filadelfia, PA
Baltimore, MD

Total de toneladas
214.2
158.8
133.7
87.5
78.0
69.4
63.7
62.5
60.9
53.4
52.9
51.5
50.7
49.5
45.4
42.3
42.3
40.8
39.3
37.3

a. Construya una grfica de caja y bigote para estos


datos.
b. Estudie la forma de la distribucin desde la grfica.
c. Hay resultados aislados?
d. Cules son ellos y por qu piensa usted que son
resultados aislados?
3.62 Runzheimer International publica datos sobre costos de
viaje de negocios en el extranjero. Estos datos reportan
que el promedio de viticos diarios para un agente viajero en Pars, Francia, es $349. Suponga que se desconoce la forma de la distribucin de los costos de viticos
diarios de un agente viajero en Pars, pero que 53% de
las cantidades por viticos estn entre $317 y $381.
Cul es el valor de la desviacin estndar? El promedio
de viticos en total para un agente viajero en Mosc es
$415. Si se desconoce la forma de la distribucin de costos de viticos de un agente viajero en Mosc y si 83%
. de los costos de viticos en Mosc estn entre S3l y
$459, cul es la desviacin estndar?

Interpretacinde salida
3.63 American Banker compil una lista de las principales
100 compaas banqueras del mundo segn el total de
sus activos. Encabeza la lista el Bank of Toho-Mi15Ubishi, seguido por el Deutsche Bank. El resul~do de la
estadstica descriptiva de Excel es una lista dd total de
activos variables (millones de dlares] para estos 100
bancos, analcelos y describa con sus propias palabras lo
que puede deducir de los activos.

92 ESTADISTICA E.-.: lOS l'-'EGOCIOS

).65 En ti mundo I<' encuentran numerosas y grandes compar.las. El nmero de empleados rara .f6 di.' los mis
grandes empleadores, con oficinas matrices fucra de
Estados Unido, K' anJliz con la funcin de otadl$lica
descriptiva de Excel, A comlnuacin apam:m estos
datos, Con d estudie de los resultados realice un anili
s con lo que ha aprendido aceres del numero de
empleados p.ira estas compalas .

A
1
1
TopWootdBenb
2134oon
Mean
12972 00
Standard error
1&CS73
Med:an
NIA
Mode
129720
Standafd dovia:'"
~VIN!IC:e
16827278273
KurtOS13
105
118
Skewness
Ranoe
615029
76891
Mnrnum
E!l1920
Maxmum
21349677
Sum
Count
100

..

5
7

10
11
12
13

,..

..

3 Standard enor
Mecloan
5 Mode
Standard devlat>on
7 Slmllle vanance
Ku:IOS<S
8 Skewness
10 Rango
11 Mn:mum
12 Maiamum
13 Sum
14 Counl

dantes del mercado htsWtO.


al~

7 S60
5.8S60
:U.64SS
).6214
17.1851
50
.t2S
4.50
S.75
8.625
40.00

Scsp>
Cunas.is
N
Mlnimo

PrimaawtiJ
median.a

Tn= .:u.anil
mimo
9~ ck intcn'IJo ck confimu pan IA
6.1!132

15

tadlttica detcriptiva

9.5288

Top 2SA

400000
1

7
1

8
1

1
9
1

25 712i02 6IJ82J
~tinimo
.w59S8

723681

~timo
22269)4

{[]-

35

25

;mzg

84331Ml
41

l.66 La Compctith"' Media Reporting and Publishm lnformation Bureau compil una fta de 10) principales 25
anunciante.. en Estado> Unid' p.ira un a.ilo reciente. El
total de guto. de publicidad para cada compaAb (en
miles de dlares) ~analiz con la funcin de estadisueas dncriptivu numricas de Mf:-:ITAB }"$U funcin de
grfica de caja; amba> K muestran a continuacin.
E&tudie esta d resultado y resuma los gutos de los 25
principales anuncimto, con su. propW. p)abr:

Vul>k
Top2H

9480.HH:>C
15767(
13!>Wt
64302 COO!
413481027!
0.825C
1.2996
2561()j
12589.l

l.64 Hispanic Business; lnc.; compil una lista de los principalc:s anunciantes que cuhivan d mercado hispmo.
Estos datos (mllonn di.' dbm) K' introdujm>n en una
hoja de alkulo Ml~ITAB y K' analiuron mediante b
funcin de t'Swlistica dcsaipm-a grifica. Estudie los resultados y describa Jos pstos di.' t'StOS ~
anun\"ariahk:~
Media
Dnviacin~
\'uunz.1

~
E"'lllOYen Oublde of the Unlted s-l.
1833271304
2 Mean

10
1

-136067

QI
484600

87213

Q2
;mS6

1400000
Princi~2S~

2 ~DODOD

CAPmJlO

J ~TA.DbTICA

DESCIUl'JlH

ANLISIS DE LA BASE DE DATOS


eoeficientes y comente. u~ la base de dato' de hospital
para construir una grfica de caja y bigote para nacimientos. Pensando en instalacicne de ho pitales y obstetricia
comente por qui! la grfica de caja y bigote puede verse corno

l. Utilice la base de datos de manufactura. Cul es la meda


de ?\e\\ Capital Expenditures? (Cul es la mediana de 'ew
Capital Expendilures? Cuando compara la meda y la
mediana cul es su anlisis!
2. Para la base de datos del mercado de acciones "describa" la
variable Dollar Value. lnclu}-a medidas de tendencia central, variabilidad y sesgo. Qu~ encontr?
3. Con la base de datos financiera estudie Eamings per Share
(ganancias por accin) para Tipo 2 r 7 (compaias de productos qumicos y compaia> pttroquimicas). Calcule el
coeficiente de variacin para cada tipo. compare l~~ dos

se ve,

4. Produzca una matriz de correlacin para l~ variables Beds


(camas], Admj,.,jon.,, Census, Ourpatient \'isih, Births

(nacimiento ), Total Expenduures (gasto totales), Payroll


Expenditures (gato de nmina) y Personnel (personal)
para la base de dato del hospital. Culc variables tienen
mayor correlacin y cules tienen menor?

CASO: COCA-COLA SE HACE PEQUEA EN RUSIA


la Coca-Cola Company es el vendedor nmero uno de bebida> gaseosas en el mundo. Todos los das, un promedio de m.li
de mil millones de Coca-Cola, Diet Coke, Sprite, Fanta y otro.
productos de Coca-Cola se consumen en todo el mundo. la
compaia tiene el sistema de produccin y distribucin ms
grande del mundo para bebida> g3SCOi3> y vende ms del doble
de refrescos que su m.b cercano competidor. Los producto de
Coca-Cola se venden en mas de 200 patsb en el mundo.
Por varias razone>, la compaia piensa que continuar
creciendo internacionalmente. Una de esta. razones es que
et aumentando el ingreso desechable, Otra es que fuera de
E.tados Unido y Europa. el mundo cs ms joven. Adems, lle
gar a mercado> mundiales o m.b f.icil a medida que caen
barreras politica> y se superan dificultades de transporte. Otra
ra1n es que compartir ideas, culturas y noticias alrededor del
mundo crea oportunidades de mercado. Parte de la 11U>in de
la compaa o para que Coca-Cola mantenga la marca m.li
poderosa y efectivamente utilice el Stcma de distribucin
mas eficaz y penetrante del mundo.
F.o junio de 1999 Coca-Cola Rusia introduio una botella
de Coca-Cola de 200 mi (unas 6.8 onzas) en \'olgogrado,
Rusia, en una campaa para vender Coca-Cola a sus clientes
ms pobres. Esta estrategia fue exitoq para Coca-Cola en
otros pa~. India por ejemplo. La botella ..e vende en 12 cenuvos, que la hace accesible a casi todo>. En 2001, Coca-Cola
empic 25~ de crecimiento por volumen en Rusia. incluyen
do un aumento de 18% en ventas de caj.u de Coca-Cola.
Anlisis
l. Debido a la variabilidad de maquinaria para embotellar es
probable que cada botella de 200 mi de Coca-Cola no con-

tenga exactameme 200 mi de liquido. Algunas botella) pueden contener mb liquido )'otras menos. Como los llena
dos de la. botella son poco comunes, un ingeniero de
produccin desea probar alguna> de la\ botellas de lo> primeros lotes de produccin para determinar qu tan cerca
e>t.in de la especificacin de 200 mililitro>. Suponga que
los siguientes datos son las mediciones de llenado de una
muestra al var de SO botellas. Utilice las tnica> presenta
da,~ en este capitulo para describir la muestra. Considere
medidas de tendencia central, variabilidad y sesgo. Con
base en este analisis, cmo cst.i trabajando el proceso de
embotellado?
200.I
200.1
199.7
200.I
200.4
199.6
200.1
200.3
200.2
200.2

199.9
200.9
200.4
199.4
199.8
200 . .f
200.8
200.5
200.5
199.5

200.2
200.1
200.3
199.6
199.9
200.4
199.9
199.9
200.2
200.6

200.2
200.3
199.8
199.2
200.2
200.6
200.0
201.I
199.7
200.3

200.0
200.S
199.3
200.2
199.6
200.6
199.9
199.7
200.9
199.8

2. Suponga que otra planta de Coca-Cola e<;t.i llenando hoce-

Uas tradicionales de 20 onzas de lquido. Cn labon:onci.al


azar, muestrea 1 SO botellas y las pruebas en cua::::o ~
&s.
volumen de limado. Los multado. de las estad
cripti''ll> se obtuvieron en MTNlTAB y Exccl EsaCa
breve resumen para los supervisores acerca dd

Estadlsticas descriptivas: llenado de botellas

Media
20.003

Variable
Botella F

::-\
150

Variable
Bottlla F

Mtnimo
19.920

Mediana
20.005

~tximo
20.090

TrMtdia
20.003

Q.

19.985

Desvadn cstncW
0.02;

Variable: llenado de botellas


Pruebl de normelidad Anderaon01rling
A cuadrado
0.588
V1lor P
O 123
Medi1
O..Viacln mandar
V1rena
Sesgo
Curtosis
V1ri1ble N

199!
1

IY9S
1

IY.98
1

20.01
1

200028
0.0268
7.09E-O
-8.6E-02
1.01598
150

Minlmo
Primer cuertil
medi1n1
Tercer cuartil
m6ximo

20.C>l
1

199200
19.9851
20.008
20.0208
200898

95% de intervalo de conl11ni1

19 9985

00239
1
!0.000

1
20.010

'
20.005

19.9977
-.~de lntm-.Jo& <.:un,.nz.a ~

1
Bottle lls

.5

Mean

3 SW>dlrd error
Med'8ll

Mode

6 StandarO devia:ion

7
8
9
10
11
12
13
14

:>ama&

vanance

Kuttosos
Sl:ewroess
Ranos
M.nornum
MalOITIUITl
Sum
Coon:

95"'- de intervalo de confi1nz1


pera Sigma
95% de 1ntervalo de confianza
per1 Mediana

20.0071

0.0300

200091

~lcdWia

S.Wda de Eiicd
1

per1 Mu

....

20003
0002
20005
20 004
0027
0001
1.015
-0085
o 170
1992
20090
3000416

150

Fuente; adaptado dr "Cokr. Avis Adjun 111 Ruui.", Adwrr111n1 Aft, S de julio de 1999. p. !S; s11o \\<b CocaCola
a1 bnpJ/www. eo<a<Ola.romlhom<.hunl El inform< anual 2001 dt Tbe <:oaCola Company w ....,...,,,. a1
hUrJi-..-2.coa-<Ola.<oml
imaton/onnualttpottl!OOlfmda.html.

USO DE LA COMPUTADORA
EXCEL
Excel puede analiur dato> al usar varia. de la. ttcnia> presentadav en este capuulo. Tiene un comando particularmente
poderoso que genera muchas C">tad.>tiou descriptivas.
Estdisticu dncriptivas
Excd puede tener acceso a '"ria. de la. cstad1sti~ descripti''OI> presentadas en este capuulo mediante el uso del comando

De-criptive Smi>ti~. Comience por seleccionar Jools de la


barra de mens Excel, En el men descendente seleccione
J2ata A.nalysis. En la aia de dilogo de anafjj de datos seleccione la opcin Descriptive St1tistics lnrroduzca el rango de
lo> dato> a describir, Haga clic '' lo dato> 50n agrupado> por
columna o fila. Haga clic para leyendas en la primera fila. ~
importante hacer clic en la caja de Summary Stltistics que
e>t~ en la parte inferior izquierda para que Excel mdu)'a un
amplio rango de medidas descriptivas.

CAPtn!IO) [' TADISTICA DESCRIPTT\'A 9S

El resultado incluye media, mediana, moda, desviacin


~y varianza maestral: ademas, una medida de curtosis,
i::ia

de -esgo, rango, mnimo, maximo, suma y cuenta.

IR.ango y pereentil
.:d tiene un comando Uamado Rank and Percennle que
ordena los dato,, lei, asigna rangos y da salida a lo. percenules.
Para tener acceso a este comando, seleccione Iools de la barra
de men de Excel, En el men descendente que aparece, )CICC
cione Data Analysis. Aparece la caja de dilogo de an.fui> de
dato.>. Seleccione Rank and Pereenrle. Aparece una caja de dilogo de rango y percennl. lnrroduzca el rango de dato.. Haga
die ~i los datos estn en columna. o fil.u y para lcycn~ en la
primera fila.
MINITAB
Ml~ITAB \\'indo-., es capaz de ejecutar mucha. de la. tarra
presentadas en este capitulo, incluyendo e.tad1stica. descriprin., y grfica. de caja.
E.stadfsticas descriptivas
Mtdiantc el U\O del comando Descripnve Statistics, ~11:-=tTAB
da un numero considerable de las tcnicas cstadistica.s men
''"nadas en este capitulo. El proceso se inicia con la seleccin
Je .Stat en la barra de mens.
Dd men descendente, seleccione Basic Stati5tics Del
men descendente de estadsticas bsicas. seleccione Display
Descriptive Statistics y aparece una caja de dilogo. lntroduzca el nmero de columnas que de-ea anali7ar. Si usted hace
die en QK, entonces el resultado incluir el tamano muestral,
media, mediana, desviacin estndar, mnimo, maxmo, el
primer y el tercer cuartil, Sin embargo. si usted selecciona la
opcin Graph ... , tendr varias opciones ms de salida que
relativamente se explican por si solas. Las opciones incluyen
Histogram of data, Histogram of data with .oormal curve,
Dotplot of data, Boxplot of data y Graphical swnmary. Si

usted selecciona ~raphical summary, obtendr una ..alida


como la que se muNra en el caso de C:O.-a Cola \Obre ti llenado de botella. ~ta ..alida incluye ta, funciones bajo QJida tabular ms un histograma con datos sobrepuestos ron una curva
normal, una grfica de caja otra salida que se explicar m.h
adelante en el texto.
Estadisticas de columna
Las cstadisticas de columna se pueden obtener al sel~ciorur
el comando Cale en la barra de men> ~11!\'TTAB \1
Del men descendente, seleccione el comando !:olumn Sta
tistics. Aparece la caja de dilogo column stausucs, 1 .
e
de eliminar la estadistica que usted desea calcular Introduzca
la columna con los datos. F.I resaltado incluir.i los elementos
que solicite.
& posible encontrar un elemento Row S1atisLC> m el
men descendente Cale. selo si su. daros esl.in ul 1,-ad~ en
una fila. Obtendr una caja de dilogo de t>tad1>lic:u vln procesar que es prcticamente idntica a la caja de dilogo de
c.1adstica. en columna. Siga los mismos pasos que los empleado. con etadi>1icas en columna para obtener una ~id.i de
dato sin procesar,
Grifica de caja y bigo1e
~ povible producir una grfica de caja y bigote si se selecciona Graph en la barra de mens. En ti men descendente que
aparece, seleccione Boxplot del men )' aparecer una caja de
dialogo de boxplot (grfica de caja. Introduzca la ubicacin
de variable en Y. Seleccione IQRange Box bajo Oispla)'. \'ariu
opcicnes grficas, por ejemplo agregar un mulo. ~ dan en la
caja de dilogo del fondo. Una opcin particularmente til es
trasponer la grfica dela moda que los bigotes queden paralelos al eje X. Para hacer este, seleccione 011tions en la parte
inferior de la caja de di.i.logo. Tendr entonces la oportunidad
de hacer clic en una caja que desea trasponer hacia X y l'. La
salida resultante es una grfica de caja y bigote con un asterisco
que representa resuhados aislado>.

CAPTULO

Probabilidad
OBJETIVOS DE APRENDIZAJE
El principal objetivo del captulo 4 es ayudar al estudiante a entender los principios
bsicos de probabilidad, con lo cual podr:
1. Comprender las diferentes formas de asignar probabilidades.
2. Comprender y aplicar probabilidades marginales, de unin, conjuntas y condicio-

nales,

3. Seleccionar la ley de probabilidades apropiada para usar en la resolucin de problemas.


4. Resolver problemas con el uso de leyes de probabilidades, incluyendo Ja ley de Ja
suma, la ley de la multiplicacin y la ley de probabilidad condicional.
5. Revisar probabilidades con la regla de Bayes.

96

Igualdad de gnero en el lugar de trabajo


La Ley de Derechos Civiles fue firmada y oficializada en las leyt) de Estado Unido> en 1964 por el
presideme Lyndon Johnson. E.ta ley, que fue enmendada en 1972, result en va0> "utulos" que abordaron la discriminacin en la sociedad estadounidense a varios niveles. Uno de ello es el Titulo VII,
que est relacionado e pecficamenre con la discriminacin del empleo.Aplica a todos la. empleadores
con ms de 15 empleados. junto con otras instituciones. Una de las disposiciones del Titulo VII hace
ilegal el rechazo a contratar una persona con base en el gnero de e;a persona.
Hoy dla, los procedimiento de contratacin de una compaia deben e-otar dentro de la previsin
y estructura de los lineamiento. de la Equal Employmenl Opportunity Commission (EEOC) y el Titulo
Vil. Cmo defiende una compal\.la sus prcticas de contratacin de personal o cmo sabe cundo
estn dentro de limites aceptables? 'Cmo pueden "probar"su caso individuos o grupos que sienten
que hao sido victimas de prcticas ilegales de contratacin? Cmo puede un grupo demostrar que sus
miembros han sido "adversamente impactados" por prcticas discriminatorias de conrratacin de una
compaia?
Las estadsticas tienen uso generalizado en acciones de discriminacin de empleo y por compailias
que tratan de satisfacer lo. lineamiento de la EEOC. Cantidades importantes de dato> de recursos
humanos se anotan y analiu.n diariamente Se reuni una pequea parte de 10> da10> de recursos huma
no> de una compaia cliente.
DATOS DE RECURSOS HUMANOS DE UNA
COMPAA CLIENTE, POR GENERO
Cimero

Tipo de posicin
G<rcnaal

Proc.ional
ncnco
Oficini>u
Total

Masculino Fmimino

Total

11

31

13

4-4

S2

17

69

22

31

100

SS

ISS

Preguntas gerenciales y estadsticas


1. Suponga que se ha expresado alguna preocupacin 1(831 porque un nmero desproporcionado
de per-onal gerencial de una compaia cliente son hombre>. Si de una compaa diente >< selecciona al azar un 1rabaiador, cu.ti es la probabilidad de que el trabajador sea mujer? Si 1 per
sona gerencial se selecciona al azar, cu.l e la probabilidad de que C$3 persona sea rm er ,Qut
factores podran entrar en la aparente discrepancia entre probabilidades!
2. Suponga que a una persona del rea tcnica se le otorga un bono especial este ao. Si el bono se

concede al azar, c:WJ es la probabilidad de que \'il)'il a una mujer dado que ese traba~r es dd
rea tknica? Es esta discriminacin contra trabajadores tcnico hombre>' Qu~ ctorcs
podran entrar en la concesin del bono que no sea la seleccin al aur?
3. Suponga que en una fiesta anual feriada el nombre de un empleado de la compa!tia dit'lltt se
sacara al azar para ganar un viaie a Hawai, Cul es la probabilidad de que una pcnom profesional sea la ganadora?
4. Cual es la probabilidad de que el ganador <ea un hombre o una oficmista' (Cuil es b probabi
ldad de que el ganador sea una mujer y en administracin? Supon? que d ?Dador es hom
bre. Cu.l es la probabilidad de que sea del grupo tcnico]
l'Ucntt:: mlorlN(i6n de la UOC aohuda de Riclunl O. A~ y Roben 11. Foky.Farnns.., Sdb: ~
dcln. ( Rtaclin. MA. Adcbso11 \\<dty l'llblishing Company,1992).

oqundo cd...

97

98 e.TADISTICA e: l05 SEGOCIOS

En negocio>. la mayor parte de la toma de decisiones involucra la incertidumbre. Por t;emplo, un


gerente de operaciones no sabe si una \'lvula de la planta va a funcionar mal o continuar funcionando. o bien. i contina, durante qu tiempo. Cundo debe cambiarse! Cu.il o la probabilidad de que
b vlvula funcione mal dentro de la semana siguiente? .En la industria de la banca. cule) son lo. pro)j,ec1os del nuevo presidente para hacer que funcione bien un departamento!
rnpuot3) a o~ pre-

gunw son inciertas.

En el caso de un edificio alto, cu.il es la probabilidad de que un sistema contra incendios funcione cuando sea necesario, si tiene instalado equipo superfluo? Quienes se ocupan de negocio) deben
manejar a diario ~tas)' milo de preguntas semejantes. Como gran parte de olas pregunta) no timen
respuestas definidas, la toma de deciscnes se basa en la incertidumbre. En muchas de estas suuaciones,
se puede asignar una probabilidad a la posibilidad de un resultado . .Este capitulo trata de aprender
cmo determinar o asignar probabilidades.

4.1 INTRODUCCIN A LA PROBABILIDAD


En el capitulo 1 vuno) la diferencia entre otadistica descriptiva e inferencial, Buena parte del anfu
cstatico n infcrencial, r la probabilidad o la base para la cstadi)tka inferencial, Recordemos que la 01adis1ica inferencial comprende; tomar una muotra de una poblacin, calcular una ti.tadistica 'Obre la
muestra e inferir, a pan ir del valor estadistico, del parmetro correspondiente de la poblacin. La razn
para hacerle a) es que el valor del parmetro e) desconocido: debido a que es desconocido, el anafta
realiza el proceso inferencial bajo incertidumbre pero, al aplicar reglas y lcyc>. puede con frecuencia
a,imar una probabilidad de obtener lo) resultados. La figura 4.1 representa ole proceso.
Supongamos que un inspector de control de calidad selecciona al azar una mue tra de 40 bombi
llas dctric3) de una poblacin de bombillas de marca X y calcula el numero promedio de horas que
ilumman las bombilla) de muestra. Con el u-o de las tcnicas que )C vern m.l) adelante en este texto,
el espe."ialista estimad nmero promedio de hora) que iluminan a la pobla6n de bombillas elctri(3)
de marca X a partir de: esta informacin muestral, Como la) bombillas que M! analiun son slo una
muestra de la poblacin. el numero promedio de horas que iluminan las 40 bombillas puede o no estimar con predsin d promedio para todas 13) bombillas de la poblacin. Los resultados son dudosos.
Al aplicar las k)n presentadas en este captulo, el inspector puede asignar un valor de probabilidad a
este estimado.
Adcm, bs probabilidades se usan directamente en arnas indu.triL' y aplicacione industriales.
Por ejemplo, la industria de seguros utiliza probabilidades en cuadro. actuariales para determinar la
probabilidad de cienos resultados rara ntablc.:n tarifas especcas y coberturas, l.a industria de lo.
jucgoo emplea valores de probabilidad para esubleeer .::argos y pagos.. t:na manera de determinar si las
prctica) de contratacin de una rompa.tifa satisfacen los lineamientos de la EEOC del gobierno, mencionado. en el Dilema de decisin o comparar varios desgloses de sus empicados (por e1ni.b, gnero. edad,
entre otros) a las proporciones de la poblacin general de la cual se contratan empicados. Al comparar
las cifras de la compaia con la> de la poblacin general, los juzgados podran estudiar la, probabilidado de una compaia que al azar contrata cieno perfil de empicados de una poblacin dada. En otras
industrias, por ejemplo la manufactura y la aeroespacial, es importante conocer la vida de una parte
mecanizada r la probabilidad de que pueda fallar durante cualquier tiempo para proteger a la compaia de fallas mayores.

l@il,1,18 ..
Probabilidad en el
proceso de
estadstica
inferencial

Par!m<tro ..unud<
(Oll <1tadiitM
rrobabdidaJ de confianza
~1unmul1"'1

CAPITULO 4 PROl!ABIUIW)

42

99

MTODOS PARA ASIGNAR PROBABILIDADES


tres mtodos de asignar probabilidades son l) el mtodo clsico, 2) el mtodo de frecuencia relativa, y 3) probabilidado subietiva<

l.())

Mtodo clsico de asignar probabilidades


Cuando se asignan probabilidades con base en leya y reglas, el mtodo se conoce como mtodo clsico de asignar probabilidades Este mtodo comprende un experimento, que es 1111 pro.:aoqut produc
rcs11/111dos, y un evento, que c. un resuhado de un experimento.
Cuando asignamos probabilidades con el uso del mtodo clasico, la probabilidad de que ocurra un
evento se determina como la razn entre el numero de elementos de una poblacin que contengan el
evento (11,) y el nmero de elementos de la poblacin (N). Esto es P(E) = n,J.\'. Por ejemplo, si una
eornpata tiene 200 trabajadores y iO son muieres, la probabilidad de seleccionar al az.ar una muieres
70/200 = .35.

MtTOOO
CUSICODE
A~IG~
PROBABILIDADES

P(E)=

11,

donde
N nmero total posibte de resultado. de un experimento
11, el nmero de re ultados en los que el evento ocurre de .V re uhado

Por ejemplo. en una planta en particular, tres maquinas fabrican un determinado producto. La
m.iquina A siempre produce 40% del numero total de este producto. Diez por ciento de los aruculos
producidos por la maquina A son defectuoses. Si los productos terminado> se mezclan bien respecto a
cul mquina los produjo y <i uno de esto producto> se selecciona al azar, el mtodo clasico de asignar
probabilidades nos dice que la probabilidad de que la pieza ha1-a sido producida por la maquina A y
este defectuosa es 0.04. Esta probabilidad se puede determinar incluso antes que la pieza ~ muestreada porque, con el metodo clsico, las probabilidades se pueden determinar a priori. esto es.se putdtn
determinar ante dtl experimento.
Como 11, nunca puede ser mayor que 1' (no m.t> de N resultado> de la poblacin podnan po-iblemente tener atributo t), el valor m.h alto de cualquier probabilidad es l. Si la probabilidad de que ocurra
un resultado es 1. e. seguro que el evento ocurra. La probabilidad m.t> pequea posible es O. Si ninguno
de lo. resultados de las.\" posibilidades tiene la caracterstica deseada, e, la probabilidad" a \ O. y es
-eguro que el evento no ocurra.
RA.'iGOOE
PROBABWDADES

o ::5 P\El

::5 1

Entonces, la~ probabilidades son fraccione. propias no negativas o valores decimales no nrptm>5
menores o iguale> a 1.
Lo. valores de probabilidad se pueden convenir en porcentajes <i se multiplican por 1
l.m
meteorlogos reportan a \'CCe~ probabilidades del clima en forma de porcentaje. Por ermplo. a:a=xlo
pronostican 60% de probabilidad de Uu\ia para matlana, estn diciendo que la probabilidad de
para maana e' .60.

Frecuencia relativa
El mtodo de frecuencia rclaLi~-. para asignar probabilidade. se ba,,;i en datos hmricos acure:cbdos.
Con este mtodo, la probabi/.,1,ufde qut ooum 1111 event o ig1111/ al 11mco dr -rus que- n't!:t:l oaun6
tn ti pasado di1idido entre el 11mm1 rora/ de oportunidades para qut ocu"

100

ESTADISTICA

EN LO) l'EGOCIOS

PROBABWDAD

Nmero de veces que ocurri un evento


Nmero total de cponunidades para que ocurra el evento

POR FR.ECUEl\ClA
IWATIVAOE
OCUJl.REl\CIA

La frecuencia relativa no c.t basada en reglas o leyes sino en qu ha ocurrido en el pasado. Por
ejemplo. una compaa desea determinar la probabilidad de que m inspectores \'ayaD a rechazar el
siguiente lote de materias primas de un proveedor. Les datos reunido. en lo libro. de registros de la
compata mue tran que en el pasado el proveedor emi a 13 compal'lla 90 lores y lo. inspectores rechazaron 1 O de ellos. Por el mtodo de la frecuencia relativa de ocurrencia, la probabilidad de que los inspeetores rechacen el siguiente lote c. 10190 o Sta .11 Si el siguiente c. rcchaz.ido. la probabilidad por
frecuencia relativa para el embarque posterior cambiarla a 11/91 .12.

Probabilidad subjetiva
El ., rodo s11bjtllll() dt asignar probabilidad ar basado en la imprtsi6n o inruiciJn de la person que
drtmnma la probabilidad. La probabilidad subjetiva proviene de la intuicin o razonamiento de la persona. Aun cuando no c. un mtodo cientfico aplcado a la probabilidad. el mtodo subjetivo e>t basado
en oca,,ione. en la acumulacin de conocimiento. comprensin y experiencia almacenada y procesada en
b mente humana. A veces es ~lo una suposicin, pero en otras la probabilidad <ubjeti\-a puede potencialmcnte dar probabilidades pre<:1>as. La probabilidad subjetiva se puede us.1r para capitalizar con base
en los antecedente de rrabajadore, y gerente. experimentados en la toma de decisiones.
Supongamos que a un director de transporte de una companta petrolera se le pide la probabilidad
de obtener un embarque de petrleo de Arabia Saudita a Estados Unidos en ~lo tres semanas, Un
director que ha programado muchos de estos embarque. tiene conocimiento de la poltica rabe. y adem> c.t consciente de que las condiciones climatolgicas y econmicas actuales pueden dar una pro
babilid.td precisa de que el embarque se pueda hacer a tiempo.
La probabilidad subjetiva tambin puede ser una forma potencialmente til de aprovechar la experienda. conocimiento e intuicin de una persona y usar todo esto para pronosticar la ocurrencia de
algn evento, Un mecnico experimentado de una aerolnea puede, por lo general, asignar una proba
bildad lgica de que un avin en panicular tendr cieno tipo de dificultad mecnica. A vece. los mdicos a.ignan probabilidades subjetivas a la esperanza de vida de personas que padecen cncer,

4.3 ESTRUCTURA DE LA PROBABILIDAD


En el e tud10 de probabilidad o til crear un lenguaje de trmino y simbolos, La estructura de la pro
babilidad proporciona un marco comn dentro del cual se pueden explorar los temu de probabilidad.

Experimento
Como ya ~ diio antes. un ~rimcnto es 11n proctse q11t produo: m11/1ados. Ejemplos de experimentos orientados a negocios, con resultado. que pueden ser analizado. estadsticameme, podran incluir
lo siguiente:
Entrevistar a 20 consumidores seleccionados al azar y preguntarlo qu marca de aparato electrodomsnco prefieren.
Muestrear una de cada 200 botellas de salsa de 1omate de cierta linea de produccin )'pe.ar el
contenido.
Probar nuevos medicamento> en muestras de paciente. con cncer y medir su mejora.
Auditar una de cada 10 cuenta. para detectar cualquier error
Registrar el promedio industrial Dow lenes el primer tune. de cad.t mes durante 10 anos.

CAPft'UUH

PROllAllILID...0

101

Evento
Debido a que un evento es un rc.sultaJo de un expenmento, el experimento define I~ posibilidades del
evento, Si d experimento e muestrear cinco boteilas que salgan de una linea de produccin, un evento podria ser obtener una botella defectuosa )' cuatro buenas. En un experimento de tirar dado>. un
evento podria ser tirar un nmero par y otro evento podria ser tirar un nmero mayor de dos. lo> evento> se denotan con letras maysculas; las letras imy>CUias cursivas (por ejemplo, A )' E1, E2, ) represenran el caso general o absrracto y las ma)'~uW tipo Romanredondas (por ejemplo, H y T para
cabezas y colas [cara o cruz J) denotan C0$3) y personas especficas.

Eventos simples
Los cn:111os qr..: ne St' puedan separar o drscompo11cr en otro eventos se Uaman eventos simples Lo>
eventos simples se denotan con letra.\ minsculas [p. ej. c1, c2, e), ... 1. Supongamos que el ezpenmento e> tirar un dado. lo> eventos <imples para este experimento son tirar un 1 o tirar un 2 o tirar un J,
etctera. Tirar un numero par o un evento, pero no e> un evento elemental porque el nmero par
puede descomponerse en los eventos 2, 4 y 6.
En el experimento de: tirar un dado. hay~ eventos imples ( l, 2, J, .f, 5, 6}. Tirar un par de dados
resulta en 36 posibles eventos simples ( resultados), Por cada uno de los seis evento> <imple> posibles al
tirar un dado, hay seis posibles C:\"Cnt0> simples en el tiro del segundo dado, como se describe en el da
grama de rbol de la figura -1.2. La tabla 4.1 contiene: una lista de esto' 36 re ultados,
En el experimento de: tirar un par de: dado-, otros eventos podran incluir resultados talo como
do> nmeros pares, una suma de: 10, una suma mayor de cinco, y otro>. l'o obstante, ninguno de estos
eventos es un evento elemental porque cada uno se puede descomponer en vario> de los eventos simples mostrados en la tabla .f. l.

TABLA 4.1
Todos los posibles eventos
s:mplos en el tiro de un par de
.3tos !espacio muestrall

1.1

4,1

5;1

(6Jl

(1.2)

(4.2)

(5,1)

(6.2)

(4.J)

15.J)

(6.))

(l.J)

(2,3)

(1,4)

(2.4)

(3.4)

(4,4)

(5,4)

(6.4)

(l.S)

(2.S)

(3.S)

(4.S)

(S.S)

(6.5)

(1,6)

(2,6)

(),6)

(4,6)

(S,6)

(6.6)

Posibles resultados
de tirar un par de
dados

&nito> ..un un dodo (6)

2 E...,.tos C011 un scpmdo dado J6

102

bTADhTICH.-.;

LO> :-;EGOCIO)

Espacio muestra!
l:n t'pcio muestral es una lina complet dt to;loJ los evento mnplt; para un expenmmto. La t.ibla 4.1
o un espacio muestra! para tirar un par de dados, El espacie maestral para el tiro de: un wlo dado es
11. 2. 3, 4 ,5, 6).
El espacio mue:.tral puede avudar a encontrar probabilidades, Suponga que un experimento o
tirar un par de dado>. Cu.il es la probabilidad de que el dado sume 71 Un examen del espacio muestral que se ilu$tra en la tabla .f. l deja ver que son seis resultndos en lo> que la suma del dado ea
7-1(1,6), (2,5),(3,4),(-1,3), (5,2).16.1))-cn el total posible de J6cvcnto,s1mplc.en el espacio muestral. Al usar t>ta informacin, podemo concluir que la probabilidad de tirar un par de dados sumen 7
o 6136, o $ta .1667. Sin embargo, el uso del esp.1C10 muesrral para determinar probabilidades es engorroso y dificil de manejar cuando el espacio rnuestral e grande. Por tanto, lo> experto> en t>tad1tica
utilizan otro' mtodos m.1< dicientes para determinar probablidade .

Uniones e intersecciones
La notcin de conjunto , e decir, el u.'IO de llaves para agrupar numeras, se utilu como hertamienta rnnb6lica pura 11mants t inttr~11t5 en e-te capitulo. la unin de X. r se forma al romb111i1r tltmentas dt ambo.1 ron1111tos y$(' denota X u r. IJn elemento se d.i.ifrca en la unin de x. r si C>t~ ra
sea en X o en Yo tanto en X como en r. la expresin de unin X U r se puede traducir en X o r. Por
ejemplo. $i:
X= (1,-1,7,91 y }' m /2.3.-1.5.6)
xu r-11.2.3.4.5.6.7,91
Kte.e que todo. lo. valores de X y todo. lo. valoro de re.un en la unin: sin embargo, ningu
no de lo> \<l10rQ aparece mh de una vez en la unin. En la figura -1.3, la regin sombreada del diagra
ma de \'enn denota la unin.
Una interseccin se denota X n r. Para da.;ficarsc en la interseccin. un demento debe e tar tanto
en X como en r. La interseccin conucn /oj elementos co1111mc.1 dt ambo; conjuntos. Por tanto, el -imbolo de interseccin. n, se lec a veces como y, La interseccin de X. Y se lec como X y Y. Por ejemplo, vi:
X= ft,-1,;,91 y l' /2,J..1.5,61

xn Y!-11

:-:tesc que slo el valor de -1 es comn a lo> do. conjunto X y Y. La interseccin e> m.> cxdu'i"a
que la unin r por tanto es igual O (por lo general) ms pequea que la unin. los elementos deben ser
carscten tico' tanto de X como de r para da)ificar. En I~ figura 4.-1, la regin sombreada denota la
iotcncin.
FIGURA 4.3
Una unin

FIGURA 4.4
Una interseccin

Eventos mutuamente excluyentes


Do' o mas eventos son mutuamente excluyentes 'i la ocurrencia de
un t>tnto impide q11t ocurra ti otro evemois}. Sta caracterstica 'itt
nifica que los eventos mutuamente excluyentes no pueden ocurrir
en forma ,iJnultnca y, por tanto, no uenen interseccin.
La "anablc "gnero" presenta do, resultados mutuamente
excluyentes, masculino y femenino: un empicado seleccionado al
uar para que S<"a parte de un estudio es hombre o muier, pero no
puede ser ambos. Una piva manufacturada estj defectuosa o C>t!
bien: la pieza no puede estar defectuosa )" bien aJ mismo tiempo
porque "bien" ydcfcctuOA son categoras mutuamente excluyentev, En una muestra de productos manufacturados, el evento de
seleccionar un pieza defectuosa es mutuamente exclusiva con el
evento de seleccionar una pieza no dcfectuo'-1. Suponga que un
edificio de oficinas c:)t~ a la venta y dos compradores potenciales le
ponen predo al edificio, !'o es posible que ambos lo compren, por
lo cual el evento de que el comprador A compre el edificio es

CAPITUL04

PROBABIUD.\D 103

mutuamente excluyente con el evento de que el comprador B compre el edificio. Al tirar una moncd.J.,
el que caiga can o cruz es un evento mutuamente excluyente. La persona que lance al aire una moneda ver o cara o cruz. pero nunca ambas. En el uro de un par de dados. el evento (6, 6), mulas, es
mutuamente exclusivo con el evenro ( 1, 1) ojo de vbora, Obtener mula. y ojos de \1bora en el mismo
tiro de dados es imposible.
La probabilidad de que se presenten dos eventos mutuamente excluyc:ntQ al mismo tiempo es cero,
~L''TO XyY
:TUAME.''TE
Dll.l1YfXTES

P(X'I Y) O

Eventosindependientes
Dos o mh eventos son eventos independientes ~laocurrencia o no ocurrtnda dt 11no dt los evento no
afra la ocurrtnda o no ocurrtnda dtl otro ntnto(s). Cienos experimentos, por ejemplo tirar dados,
dan eventos independientes: cada dado es independiente del otro. Que )a!ga un 6 en el primer dado no
inOu)e en el segundo dado. Los~
al aire de moneda. siempre son independientes entre si. El evento de que salga cara en el primer tiro al aire de una moneda es independiente de que salga cruz en el
segundo tiro. En general se piell.\a que ciena. caractersricas humana. son independientes de otros
C\CntO. Por ejemplo, es probable que ser zurdo sea independiente de la posesin de una tarjeta de er
dito. E. probable que i una pe~na u.a lentes o no. esto es independiente de la marca de leche que
prefiera.
)lfuchos experimemos que utiliun seleccin aleatoria pueden producir evento. independientes o
no independientes. En e.to experimento>. lo resuhados son independientes si el muestreo se hace con
reemplazo; es decir. despub que cada elemento se seleccione y se determine el resultado, el elemento se
reintegra a la poblacin y la poblacin " revuelve, En t'Sta forma, cada tiro se hace independiente del
tiro prevro. Suponga que un inspector selecciona al azar tomillo. de un depsito que contiene 5% de
pi~ defectuosas. Si el inspector muestrea un tomillo defectuoso y lo Tegm.1 al depsito, en el segun
do saque todava habr 5% de piezas defectuosas en el dcp)ito sin considerar el hecho de que el primer resultado fueran sido pieza defectuosa. S el inspector no regresa la pieza en el primer saque, la
segunda pina no es independiente de la primera; en este caso. quedan menos de 5% de piezas defectuo~ en la poblacin. Por tanto. la probabilidad del segundo resultado o dependiente del primero.
Si X e Y son independientes, se utiliza la siguiente notacin.

PIX)Y) PIXJ y PO'IX) P(Y)


P(X)}') denota la probabilidad de que X ocurra dado que Y ha ocurrido. Si X y Y son independientes, entonces la probabilidad de que X ocurra dado que Y ha ocurrido e. exactamente la proN!lilidad de que X ocurra. Saber que Y ha ocurrido no afecta la probabilidad de que ocurra X porque X
Y son independientes. Por ejemplo, PI prefiera Pep>ilpcrwna co derecha l P( prefiere Peps) porqut g
una persona co derecha o es zurda es independiente de la preferencia de la marca.

Eventoscolectivamente exhaustivos
Una li ta de "en tos colectivamente exhaustivos contiene todos los posibltS tltrnmtos sunpla
experimento, En consecuencia, todos los espacios muestrales son listas colectivamente ~La
ti.ta de posibles resultados por tirar un par de dados, contenida en la tabla 4.1, es una bu cXJl~:q..
mente exhaustiva, El espacio muestra! para un experimento se puede describir como um
to> que son mutuamente excluyente. y colectivamente exhaustivos, Los eventos de espKJO
se traslapan o intersecan, y la lista est completa.

Eventos complementario
s
El complemento de un "coto .A se denota como A', que se Ice no A. Todos los non:::s
experimento no m A comprtndtn su complemento. Por qemplo, si al tirar un dado d ~A

doe2

l 04 ESTAD1STICA E,-.; LOS SEGOCIO~

en el nmero par, el complemento de A es teniendo un nmero impar. Si el evento A se detiene en el


nmero 5 al tirar el dado, el complemento de A tendra 1, 2, J, 4 o 6. El complemento de A contiene
cualquier parte del espacio muestral que el evento A no contenga. como muestra el diagrama de Venn
de la figura 4.5.
PROBABIUDADDEL
CO\fPl.EMENl'O

P(A')

DEA

=1

- (A)

Suponga que 32% de lo$ empleados de una compaMa tienen grado universitario, Si un empleado se
selecciona al azar de la c:ompailla, la probabilidad de que la persona no tenga grado universitario es
1 - .J:? .68. Suponga que 42% de todas las piezas producidas en una planta se moldean en la maquina A r J 1 % en la mquina B. Si al azar se selecciona una pieza, la probabilidad de que fuera moldeada.
no por b mquina A ni por la mquina Bes de 1 - .73 .27. (Suponga que una pieza se moldea ~lo
en una mquina.)

Conteo de posibilidades
En ~llc:a,
es posible usar un conjunto de tcnicas y reglas para contar el nmero de resultados que
pueden ocurrir para un experimento en partic:ular. Algunas de estas reglas y tcnicas pueden delinear
d tamaAo del espacio muestral. AquJ se presentan tt de estos mtodos de conteo.

La regla de conteo mn
Suponga que un cliente decide comprar un auto nuevo de cierta marca.Las opcioaes para el auto induym dos motora difercnto,cinco colores diferentes de pintura y tres paquetes del interior Si existe cada
una de esus opciones con cada una de I~ otras, de cuntos autos diferentes podra escoger el cliente!
Para determinar C\tc nmero. podemos usar la regla de conteo

m".

lAR.EGlADE
CO~"TtO..,,

Para um opaacin que se puc:da hacer en m formu )' una squncb o><racin que se pueda hacer en n
!onms. w dM operaciones pueden ocurrir, en orden, en mn form.u. bta ~la se pu~ atcnckr a ~
con ucs o ms operaciones.

Con el 11$() de la regla de conteo mn podemos determinar que el comprador del auto tiene disponibk$ (2) (5)(3) ., JO diferentes combinaciones de motor, color de pintura e interiores del auto.
St:p0r.p que un investigador desea iniciar un diseo de invotigacin para estudiar le efectos del

sfncro (M, F), estado civil (soltero, divorciado, casado) y clase econmica (baja, media y alta) en la frecuencia de compras de boleto) de avin por ao, El inve tigador iniciarla un diseo en el que se toman
1 S muestras diferentes para representar todo) los grupo) posible generados por estas caracteruticas del
cliente,
.
Nmero de grupos (Gnero) (estado civil) (clase econmica)
(2) (J) (J) 18 grupo)

Muestreo de una poblacin con reemplazo


En el segundo mtodo de conteo, el muestreo den elemento) de una poblacin de tammo N con reem-

plazo darla:

(N) po$ibildad~

FIGURA 4.5

Donde:

El complemento
del evento A

N = tamallo poblacional
A'

" = tamao

mucstral

Por ejemplo, cada vez que se tire un dado que tenga seis lados
los multados son independientes (con reemplazo) del tiro ante
rior, Si un dado se tira tm vece. en sucesin, cuntOi resultados

CAPITIJLO 4 PROBIJ!ll.JD.U>

IOS

diferentes puede ocurrir? Esto es, cuil es el tanullo del espacio muestrsl para este experimento? El
tamatlo de la poblacin, N, c. 6. lo. sris lados dd dado, ~1.1mo muestreando tres tiros de dados. n .. 3.
El opado muestra! es:
(]\.')~ - (6)3 - 216
Suponga que en una lotera se ucan seis nmeros de lo. dgitru del O al 9, con reemplazo (10) dgitos $C pueden usar otra \'C7). Cuntas agrupaciones diferente de sch nmeros se pueden ucar? N es
la poblacin de 10 nmeros (0 al 9) y ne el tamao rnuestral, sri$ nmeros,
(N) (10)6 1000000
Esto o. existe un milln de nmeros de seis dig11os!

Combinaciones:muestreo ~e una poblacin sin reemplazo


El tercer mttodo de conteo ua combinaciones que muestrea n elementos de una pobladn de tamallo
N sin reemplazo y se obtiene:
NI
,.e,.= (,\'}
=---n
n!(N-11)!

po.bilidades.
Por ejemplo, suponga" que una pequee empresa de abogado. tiene 16 empleados y tres de ellos
han de ser seleccionados al v.ar para representar la compaJ\ia en la reunin anual de la American Bar
A,.(~iation. Cunta. diferentes combinaciones de abogad()) podran set enviadas a la reunin? Esta
situacin no permite muestrear con reemplazo porque tres diferente. abogado. .crn seleccionados
para asistir. Este problema se resuelve con el uso de combinadones: N 16 y n 3, as que:
16!
111C. = 16C3 =--=560

3!13!
Un total de 560 combinaciones de tres abogados podrian seleccionarse para representar la firma.

(.1

PROBLEMAS
4.1 Un proveedor remiti un lote de ~is piezas a una compea, tres de la. cuales estaban defectuosas,
Suponga que el cliente dccid seleccionar al azar do. pa.a) r probarla. para ver si tenan defeetos. Qut tan grande es un c:.pado muestra! con el que esti trabajando potencialmente el cliente?
Haga una li>ta del espacio. Con el uso de la lista del espacio maestral, determine la probabilidad de
que el diente seleccione una muestra con exactamente un defecto.
4.2 Dado X 11. 3, 5, 7, 8, 9). r 12. 4, 7, 91 y Z.,. { r, 2, 3, 4, 71, resuelva lo siguiente.
xuz-_
b. xnr-_
c. xnz_
d. xu ruz-_
e.
n Y nz=_
(X u Y) n
g. (Y n Z) u ex n Y) _
h. x o r - _
i. YyX_
4.3 S una poblacin consta de lo nmeros pares positivos hasta 30 y si A (:Z. 6, 12, 24 (~es A!
4.4 El 5i~tema telefnico 800 del scrvicio a clientes de una compallla est~ instalado de modo que quien
llama tiene sei.\ opciones. Cada una de estas seis opciones lleva a un men con cuatro opaotlCl-o
Para cada una de estas cuatro opciones existen tres opciones ms. Para cada una de esas un
opciones estn presentes otras tres opciones. Si una persona llama al nmero 800 pidiendo IJUda,
cuntas opcione en total son posibles?
4.5 Un recipiente contiene seis piCU5. de la~ cuales dos estn defectuosas v cuatro son acqiubles. 51
tres de ta. seis pieza. se seleccionan del recipiente. qut' tan grande es el csp300 muntraP. (CWI
regla de conteo utili76 usted y por qu~? Para este espacio maestral, cuil es la probabilid.ld de que
exactamente una de Lu tres pi~'US muestreadas sea defectuosa!

c.

z _

<t.6 Una compaflla coloca un nmero de serie con siete dlgito en cada pieza que fabrica. Cada digito
del numero de serie puede ser cualquier nmero de O a 9. U dgit~ se pueden repetir en el nmero de serie. Cuntos numeres de serie diferentes son posibles!
<t.7 Una pequer\a compatl.ia nene 20 empleados, seis de los cuales sern seleccionados al azar para ser
entrevstados como parte de un programa de ~tisfaccin de empleado . Cuit' grupos diferentes de se se pueden seleccionar!

4.4 PROBABILIDADES MARGINALES, DE UNIN, CONJUNTAS Y CONDICIONALES


En este capitulo presentemos cuatro tipos parnculares de probabilidad; el primer tipo es el de proba
bilidad muginal que se denota P(E), donde 5 es algn evento. Por lo general una probabilidad marginal
se ca!nda al divdir algn subroral entre d entero. Un ejemplo de probabilidad marginal e. la probabilidad de que una persona posea un auto Ford. Esta probabilidad se calcula al di,idir el nmero de pro
piewios de Ford entre el nmero total de propietarios de autos. La probabilidad de que una persona
ese lentes tambin es una probabilidad marginal. Esta probabilidad se calcula al dividir el nmero de
penoms que usen lentes entre el nmero total de personas.
Un segundo tipo de probabilidad es la unin de dos eventos. La probabilidad de unin se denota
P(E1 U E2), donde E1 y E2 son dos eventos. P(E1 U E2) e> la probabilidad de que E1 ocurra o que E2
ocurra o que ocurran tanto E1 como E2 Un ejemplo de probabilidad de unin c. la probabilidad de
que una persona posea un Ford o un Chevrolet. Para llenar lo. requisitos para la unin, la persona slo
debe tener al menos uno de esto auto . Otro ejemplo c. la probabilidad de que una persona use lente
o sea pdirrojo. Todas las personas que usen lentes esun incluidas en la unin, junto con todos los pelirrojos y todos los pelirrojo que usen lentes, En una compar\Ja, la probabilidad de que una persona sea
hombre u oficinista c. una probabilidad de unin. Una persona llena I' requisitos para la unin al
ser hombre o ser oficinii.ta o ser ambos (oficinista hombre).
Un tercer tipo de probabilidad es la interseccin de dos eventos, o probabilidad conjunta. La probabilidad conjunta de los eventos E1 y E2 se denota como P(E1 n E2). A veces P1 E1 n E2) se lee como
b probabilidad de E1 y E2 Para llenar los requisito de la interseccin, deben ocurrir ambos eventos.
Un ejemplo de probabilidad conjunta es la probabilidad de que una persona posea un Ford y un Chevrolct.
l'osttr' UD tipo de auto no es suficiente. Un segundo ejemplo de probabilidad conjunta e. la probabilidad
de que una persona sea pelirroja y use lento.
Un cuarto tipo es Ja probabilidad condicional que se denota por P( E1 1 E2 ). Esta expresin se lee:
La probabilidad de que E1 ocurra, dado que E2. se sabe que ha ocurrido. Las probabilidades con
dicionales comprenden el conocimiento de alguna informacin pmia. La informacin conocida o
dada se escribe a la derecha de la lnea vertical del enunciado de probabilidad. l.:n ejemplo de probabilidad condicional es la probabilidad de que una persona posca un Chevrolet dado que ella posee un
Ford. E.su probabilidad condicional C$ ~lo una medida de la proporcin de propietarios Ford que uenen un Olc-\-role1 -no la proporcin del total de propietarios de auto que poseen un Chevroler. w
probabilidades condicionales se calculan al determinar el nmero de elementos que tienen un resultado que se obtuve de algun subtotal de la poblacin. En el ejemplo do: propietario) de auto>, las posibilidades se reducen .a los propietari~ de un Ford, y luego se determina el nmero de propietarios de
Chevrolet fuera de propietarios de Ford. Otro ejemplo de una probabilidad condicional es la probabilidad de que un trabaiador de una com>Mlia sea un profesional dado que es hombre. De nuestros cuatro
tipo> de probabilidad, ~lo la probabilidad condicional no tiene la poblacin total como su denominador. Las probabilidades condicionales tienen un subtotal de poblacin en el denominador. La figura 4.6
resume estos cuatro tipos de probabilidad.

4.5 LEYES DE LA ADICIN


Eiu:.ten varias herramientas para usar en Ja solucin de problema, de probabilidad. Esw herramientas
inclu)cn espacio muestral, di.:igranw de rbol, leyes de probabilidad, matrices de probabilidad e intuicin. Debido a la individualidad y variedad de problemas de probabilidad. al~nas tcnicas aplican ms
fcilmente en cierta> ituacionc. que m otra., .. !'\o existe el mejor mtodo para resolver todos los pro-

CAJ>tn.Jl.O 4 PROBA.BIUllt\D IOi'

Conjuui

conjuntas y
::::r.i:!Qonales

P(,\1

P\XvY)

P(Xn Y)

P\Xh1

La

La
probabilidad
QIXXyl"
ocurran

La
probabilidad
QIXXyt'
ocurran

La
probabilidad
QIXX

probabllidad
QIXX

ocurra

ocurro

dado qlk'

r ha ocurrido
Utiliza multados
posibles
loulntnd
dtnomi-iot

V1ibu rnuludos
posibln
IOblamd
daiomimdor

U1ilw rnulwloa
poliblcs
1ocalaen d
daiomllwlor

U1iliu d aub1ow
d~lotpoubla
rnuludo>md
dmominador

blemas de probabilidad. En algunos ejemplos, la ma1riz de probabilidad trua un problema de un modo


que se puede resolver fcilmente. En otros casos, establecer la matriz de probabilidad es mas dificil que
resolver el problema de otro modo. Las I~ de probabilidad casi siempre se pueden usar para resolver
problemas de probabilidad. pero pan alguno. problema) la solucin se puede determinar sin aplicar
formalmente las leye).
Una de las herramientas ya presentadas es el espacio muestral; Otra) incluyen las leyes de probabilidad. En este capnulo se presentan cuatro leyes de probabilidad.
leyes de la adicin, probabilidad
condicional, las leyes de la multiplicacin y la regla de Ba}-es. Las ltye$ de la adicin y las leyes de la multipliacin tienen cada una de ellas una ley general y una ley especial. La ley general de la adicin se utiliza para encontrar la probabilidad de la unin de dos eventos, P(X U Y). La expresin P(X U Y) denota
la probabilidad de que X ocurra o que Y ocurra o que ocurran X r Y.

Ul' GE.'."tRAl.

DE LA ADICJON

P(X U Y) P(.\1 + P(Y) - P(X n Y)


Donde X, Y son eventos y (X n Y) es fa interseccin de X y Y.

Yankelovich Partners llev a abo un estudio para la American Society of Interior De igners en el
que se pregunt a trabajadores cu.iles eran los cambios en disd\o de oficinu que aumentarian la pro
ducuvidad. A quienes respondieren se les permiti contestar m~ de un tipo de cambio de diseo. El
cambio nmero uno que 70% de lo trabajadorts diieron aumentara la productividad era reducir el
ruido. En segundo lugar~ espacio de almacenamiento o de archive.seleccionado por 6i% de los rrabaiadores, Si al aur 5C selecciona uno de quienes respondieron y se le pregunta qu cambio) de diseo
de oficina aumentarla la productividad del trabajador, cul es la probabilidad de que esta persona
seleccionaria la reduccin de ruido o m copado de almacenamiento o de archivo?
Hagam06 que N represente el evento "reducir ruido y que S represente el evento ms espacio de
almacenamiento o de archi-o': La probabilidad de que una persona responda con N o S se puede simbolizar estadsticamente como una probabilidad de unin con el uso de la ley de la adicin.
P(:SUS)
Para satisfacer con xito la bsqueda de una persona que responda con reducir el ruido o m.is ~cio de almacenamiento o de archivo, slo necesuamos encontrar una persona que drsce 11/ menos aDO
de estos eventos. Como 70% de los entrevistados respondieron que reducir el ruido crearla mis preductividad, P(!') ... 70. Adcm.t\, como 67% respondieron que aumentar el espacio de almacmar:llt!lto mejorara la productividad. P1 S
.67. Cualquiera de bto. s.atisfaria el requisito de la unin. Por
tanto, la solucin del problema parece ser
P(N U SI P(N)

+ PIS)

.i'O

+ .67

1.37

108 lSTAl>bTICA E." LOS NECOCIOS

,flGURA 4.7

.. ~

Despeje de la unin
en el problema
de productividad
en oficinas

!'o obstante, )'a establecimos que las probabilidades no pueden ser mis de 1.00. l es el problema aqul1 NttM! que todas
las personas que respondieron que tanto, reducir el ruido como
aumenur el espacio de almacenamiento mejorara la productividad se incluyen en cada una de 1.. probabildades marginales P(N)
y Pl,S1. Ciertameme una persona que responda y recomiende estas
dos me;oru debe incluirse como que favorece al menos una. Sin
embargo. como an incluidas en el P\N) y el P(S), las personas
que recomendaron ambas mejora se cuentan doblement. Por esa
rvn, la ley general de la adicin resta la probabilidad de interseecin, PIN n S).
F.n la figura 4.7, diagram.i. de Venn ilustran este anlisis. Ntese
que el rea de interseccn de N y S esU doblemente sombreada en
el diagrama A, lo que indica que se ha contado do. veces. En el da
grama 8, el sombreado es consistente en todo N y S porque el rea
de interseccin se ha resudo. Por Unto el diagrama 8 ilusua la apli
caci6n correcta de la ley general de la adicin.
Entonces cual es la respuesta a la pregunta de probabilidad de unin de Yankelovich Partners!
Suponga que 56% de todos los que respondieron a la encuesta habian dicho que tanto la reduccin de ruido
romo aumentar el espacio de almaanamiento o de archh~ mejorara la productividad; P(N n S) 56.
Entonces podramos usar la ley general de la adicin para resolver la probabilidad de que una persona
responda que ya sea la reduccin de ruido o aumentar espacio de almacenamiento mejoraran la productividad.
PlN U S)"' P(N)-+ PI.Si - P\N l SI

.70 + .. 67 - .56 .81

Por tanto. 81 'MI de los trabajadores encuestados respondieron que ya sea la rtd11cri6n dt mido o
aumentar t$pacio de almactnamicnto mejoraran la productividad.

Matrices de probabilidad
Ademis de las frmul~ otra berramiema til al resolver problemas de probabilidad es una matriz de
probabilidad. Una matriz de probabilidad; mueura las probabldadcs malfnalts y las probabilidadts
dt m1mccci6n dt un problema dado. Las probabilidades de unin y probabilidades condicionales deben
ser calculadas desde la matriz, En general, una matriz de probabilidad se construye como un cuadro
de dos dimensiones con una variable en cada lado del cuadro. Por ejemplo, en el problema del diseo de
una oficina, la reduccin de ruido estarla en un lado del cuadro y aumentar el espacio de almacenamiento en el otro. En este problema, una fila S y una fila No se aeartan para una variable y una columna Si y una columna ~o se crcarian para la otra variable, como se ve en la tabla 4.2.
Una vci creada la matriz. podemos escribir las probabilidades marginales. P(N) .70 es la proba
bilidad margiiul de que una persona responda si a la reduccin de ruido. Este valor se coloca en el margen de la fila de SI a reduccin de ruido, como se ve en la tabla 4.3. Si Pt ~) .70, entonces 30% de las
personas entrcviiudas no pensaron que la reduccin de ruido aumentar1.1 la productividad, Por tanto,
P\no :-;") 1 - .iO = .30. E:.te valor, tambin una probabilidad marginal, va en la fila indicada por No
bajo reduccin de ruido. En la columna bajo, S para aumentar espacio de almacenamiento. se registra
la probabilidad marginal P(S - .67. Finalmente, la probabilidad marginal de No para aumentar espacio de almacenamiento. pt no S
1 -0.67 se coloca en la columna No.

TABLA 4.2
Matriz de probabilidad para
el problema de disello de
oficinas

CAPTULO 4 PROBA6lUDAD 109

"IUl.A4.3

SI

!l&iciL de probabilidad del

~~-ma

OfHldo de 41lmtiamrmiento

de diseo de

No

Sl~.70

~.as

Noa.3
.67 .33 l.00

llllA

4.4

-e
~

columna S para matriz de


idad del problema
a :::!:seo de oficinas

.67

En esta matriz de probabilidad se dan las cuatro probabilidades marginales o se pueden calcular
con slo usar la probabilidad de una regla complemento, P(no S) = 1 - P(S). La interseccin de reduccin de ruido y aumentar espacio de almacenamiento se da como P(N n S) = 0.56. Este valor se escribe en la matriz de probabilidad en la celda bajo S S, como se ve en la tabla 4.3. El resto de la matriz se
puede determinar al restar, de las probabilidades marginales, los valores de la celda. Por ejemplo, restar
0.56 de 0.70 y obtener 0.14 da el valor para Ja celda bajo S por reduccin de ruido y No por aumentar
espacio de almacenamiento. En otras palabras, 14% de todos los que respondieron la encuesta dijeron
que la reduccin de ruido mejorara la productividad pero el aumento de espacio de almacenamiento
no la mejorara. Llenar el resto de la matriz resulta en las probabilidades que se ven en la tabla 4.3.
Ahora podemos resolver la probabilidad de unin, P(N U S), en al menos dos formas diferentes
con el uso de la matriz de probabilidad. El enfoque est en la fila S por reduccin de ruido y la columna S por aumentar espacio de almacenamiento, como se ve en la tabla 4.4. La probabilidad de que una
persona sugiera reduccin de ruido o aumentar espacio de almacenamiento como solucin para mejorar la productividad, P(N U S), se puede determinar a partir de la matriz de probabilidad al sumar las
probabilidades marginales de Sf para reduccin de ruido y S para aumentar espacio de almacenamiento y luego restar la celda S S, siguiendo el modelo de la ley general de probabilidades.
P(N U S) = 0.70 (dela fila S)+ 0.67 (de la columna SO
- 0.56 (de la celda S S) = 0.81
Otra forma de despejar la probabilidad de unin de la informacin mostrada en Ja matriz de probabilidad es sumar todas las celdas en cualquiera de las filas o columnas S. Observe lo siguiente de la
tabla 4.4.
P(N U S) = 0.56 (de la celda S S)
+ 0.14 (de S en reduccin de ruido y No en aumentar espacio de almacenamiento)
+ 0.11 (de No en reduccin de ruido y S en aumentar espacio de almacenamiento)
= 0.81

PROBLEMA DE

DEMOSTRACIN
4.1

Los datos de la compaa cliente del Dilema de decisin dejan ver que 155 empleados trabajaron uno de cuatro tipos de posiciones. Aqu se muestra de nuevo la matriz de valores sin procesar (tambin llamada cuadro de contingencia), con las cuentas de frecuencia para cada
categoray para subtotales y totales que contengan un desglose de estos empleados por tipo de
posicin y por gnero. Si un empleado de la compaa se selecciona al azar, cul es la probabilidad de que el empleado sea mujer o un trabajador profesional?

l l 0 ESTADISTICA zx

LO)

SEGOC"JO!>
DATOS OE RECURSOSHUMANOS OE COMPAMA

Hombr

Mu1er

Gerencial

11

1lpo

Profesional

31

13

"

po9k10n

Tknlco

52

17

69

Of'ICinita

22

31

100

55

155

Sol11<in
Denotemos por F el evento de mujer y P denota el evento de trabajador profesional. La pregunta
es
PIF U PI

Por la ley general de la adicin,


P(F u P) P(FI - P(P) - PIF n PI
De los 155 empleados, 55 son muieres. Por tanto, PIF)
55/155 0.355. los 155 empleados
incluyen 44 profesionales. Por tanto, P(PI 441155 0.284. Como 13 empleados son mujeres y
profesionales, PIF n PI - 13'155 0.084. La probabilidad de unin se resuelve como
PIF

u PI

.355 + .284 - .084 ... 555

Para resolver esta probabilidad con el uso de una matriz. se puede ya sea usar la matriz de
valores sin procesar que vimos previamente, o bien, convertir la matriz de valores sin procesar
a una matriz de probabilidad al dividir todos y cada uno de los valores de la matriz entre el valor
de N. 155. La matriz de valor sin procesar se utiliza de un modo semejante al de la matriz de probabilidad. Para calcular la probabilidad de unin de seleccionar una persona que es ya sea mujer
o trabajador profesional de la matriz de valor sin procesar, se suma el nmero de personas de la
columna Mujer !551 al nmero de personas del rengln Profesional 1441, luego se resta el nrnero de personas en la celda de interseccin de Mujer y Profesional 1131. Este paso da el valor de
55 + 44 - 13., 86. Dividir este valor (86) entre el valor de N(155) produce la probabilidad de unin.
P(F U PI 86'155 .555
Una segunda forma de obtener la respuesta a partir de la matriz de valor sin procesar
sumar 1odas las celdas una vez que estn ya sea en la columna Mujer o en la fila Profesional

es

3 + 13 + 17 + 22 + 31 - 86
y luego dividir entre el nmero total de empleados. N 155 se obtiene:
P(F U PI

PROBLEMA DE
DEMOSTRACIN
4.2

861155 .555

A con1nuacin se muestran la matriz de valores sin procesar y la correspondiente matriz de probabilidad. para los resultados de un estudio nacional de 200 ejecutivos a quienes se pidi idan
tificar la ubicacin geogrfica de sus compaflas y el tipo de industria de las mismas. A los
ejecutivos slo se les permiti seleccionar una ubicacin y un tipo de industria.

CAPM"ULO 4 PROBABILIDAD 111


MATRIZ DE VALMES SIN PROCESAR

Noreste

Sureste

Regln
central

Oeste

Finanzas A

24

10

14

56

Manufacturas 8

30

22

12

70

28

18

12

16

82

34

71po
de

lnduUrla

Comunicacion11C

200

MATRIZ DE l'ROBABIUDAD

Noreste

Sureste

71po
de

lndwtrlll

Medio
oeste-Regin
central

Oeste

.12

.05

.04

.07

.28

M11nuf11C1urasB

.15

.03

.11

.06

.35

Comunicaconu C

.14

.09

.06

.08

.37

.41

.17

.21

.21

Fin11n1111A

1.00

Suponga que de estos datos se selecciona al azar uno de los que respondieron al estudio.

a. Cul es la probabilidad de que quien respondi sea del Medio Oeste-Regin central (Fl7
b. Cul es la probabilidad de que quien respondi sea de la industrie de comunicaciones
(CI o del noreste IDl7
c. Cul es la probabilidad de que quien respondi sea del sureste (El o de la industria de
finanzas (A17
Solucl6n

a. P(Reginl
b. PIC U DI
c. P(E U Al

P(F)

.21

PICI PIDI - PIC n DI .37 + .41 - .14 .64


PIE) P(AI - PIE n Al .17 + .28 - .05 .40

Al calcular la unin con el uso de la ley general de adicin, la probabilidad de interseccin se resta
porque ya est incluida en ambas probabilidades marginales .. Esta probabilidad ajustada deja una probabilidad de unin que apropiadamente incluye "atores marginales> el valor de interseccin. Si Ja proba
bilidad de interseccin -e rt>ta una segunda vez, la Interseccin se elimina, dejando la probabilidad de
X o Y pero no ambas.
P(X o Y) pttO no ambu P\Xl + PO') - P(X n Y) - P!X n Y) P(X u Y) - Pi.\' n Y\
En la figura 4.8 es el diagrama de Venn para esta probab~
E:cnodeXo Y
~no ambos

Complemento de una unin


La probabilidad de la unin de dos eventcs Xv r r~!'C:S(!lU b probabilidad de que el resultado sea o X, o }; o amM. X r Y. La m6n
incluye todo excepto la posibilidad de que no sea ninguna (X o }').
Otra forma de expresarla es ni .\' ni r. lo cual puede csw repre-

112 ESTADISTICA EN LOS NEGOCIO:.

sentado simblicamente como P(no X n no Y). Como es el nico


caso posible que no sea la unin de X o Y, o el complemento de
una unin. Dicho ms formalmente,

flGUIA 4.9
El componente de
una unin: la
regin nVni

P(ni X ni Y)

= P(no X n no Y)

1 - P(X

u Y)

Examine el diagrama de Venn de la figura 4.9. Ntese que el


complemento de la unin de X, Y es d rea sombreada fuera de los
creulos, Esta rea representa la regin ni X ni Y.
!l:iXru Y
En el estudio que hicimos sobre la creciente productividad de
trabajadora al cambiar el disetio de oficinas, la probabilidad de que
un 1.rabajador seleccionado al aur respondiera con reduccin de ruido o mayor espacio de almacenamiento fue determinada como:
P(N U S) P(N)

P(S) - P(N

n S)

70

+ .67 -

.56 .81

La probabilidad de que un trabajador respondiera con ni reduccin de ruido ni mayor espacio de


almaccn.tmiento se calcula como el complemento de esta unin.
P(ni N ni S) P(no N

n no S)

1 - P(N U S) 1 - .81 .19

Entonces, 19% de los trabajadores no seleccionaron reduccin de ruido ni mayor espacio de alma
cenamlemo como soluciono para aumentar la productividad. En la tabla 4.J, esta probabilidad ni/ni
se encuentra en la celda No No de la matriz, 0.19.

ley especial de la adicin


idos e-ente son mutuamente excluyentes, la probabilidad de la unin de los dos eventos es la pro
babilidad dd primer evento m.u la probabilidad del segundo evento. Como los eventos mutuamente
aduyente< no se intersecan, no tiene que restarse nada.
LEY ESPEClAL
DEUADIOOS

Si X, Y son mutuamente excluyentes, P(X U Y) P(X)

+ P( Y)

La ky especial de la adcin es un caso particular de la ley general de la adicin. En cierto sentido.


b ky gmen1 se aiu.ta a todos lo C&SC pero. cuando los eventos son mutuamente excluyentes se inserta WI m-o en la frmula de la ley general para la interseccin y rei.ulta la frmula de la ley especial,
En d estudio acerca de mejorar la productividad al cambiar el diseno de oficinas, a quienes respondieron se les permiti escoger ms de un posible cambio de diseo de oficinas. Por tanto. es de lo
r!W probabk que ninguna de las opciones de cambio fueran mutuamente excluyentes, y la ley especial
de la adicin no apliaria a ese ejemplo.
En otro estudio. sn embargo. a quienes respondieren se les permiti seleccionar slo una opcin
para su mpucsa. lo cual hizo mutuamente exduyentes las posibles opciones. En este estudio. dirigido por
\mkelovich Pvtnen para W"illam M. ~1~r. lnc., a le trabajadores se les prqunt qu entorpece su
productividad y se les deron slo las siguientes selecciones de las que podla.n escoger slo una respuesta.
Falta de dittccin
Falta de apoyo
Dem~iado trabajo
Proceso ineficiente
No hay suficiente equipo o abasto
Bajo salario o pocas probabilidades de avanzar
La falta de dittccin la citaron ms trabajadores (20%), seguida por falta de &po)'O ( 18%), demasiado 1.rabajo ( 1899), proceso ineficiente (8%), no hay suficiente equipo o abasto (799), bajo salario o
pocas probabilidades de avance (#%) y otros factom agregad< por quienes respondieron. Si un trabajador que respondi a esta encuesta es seleccionado (o si el estudio en realidad refleja los puntos de
vista del pblico trabajador y se selecciona un trabajador en general) y a ese trabajador se le pregunta
cul de las selecciones dadas entorpece su productividad, cul es la probabilidad de que el trabajador
mponda que es demasiado trabajo o proceso ineficiente?

Denotemos por M d evento "demasiado trabajo" y por 1 el evento "proceso intficiente': La preguna a:
P(M U 1) ?
Como el 18% de quienes contestaron dijeren demuiado trabajo':
P(M} .18
Como el 8% de quienes contestaron dijeron "proceso ineficiente",
P(I) .08
Dado que no es po ible seleccionar m.b de una re puesta,
P(M n 1) ... 0000
La implementacin de la ley especial de adicin da

P(M U 1) P(M) + P(I) ... 18 + .08 .26

PIOBLEMA DE
BEMOSTRACIN

4.3

Si se elige a un trabajador al azar en la compallla descrita en el problema de demostracin ' 1,


cu61 es la probabilidad de que el trabajador sea tknico u oficinista? Cu61 es la probabilidad de
que el trabajador sea profesional u oficinista?
Soludn
Examine la matriz de valor sin procesar de los datos de recursos humanos de la compallla que
aparecen en el problema de demostracin ' 1. En numerosas matrices de probabilidad y de valor
sin procesar como 6sta, las filas no se traslapan ni son mutuamente excluyentes, como son las
columnas. En esta matriz, un trabajador puede ser clasificado como que slo est6 en un tipo de
posicin y como que es hombre o mujer, pero no ambos. Asl, las categoras de tipo de posicin
son mutuamente excluyentes, como son las categoras de gnero y la ley especial de la adicin se
puede aplicar a los datos de recursos humanos para determinar las probabilidades de unin.
Denotemos por Ta un t6cnico, O un oficinista y P un profesional. La probabilidad de que un
trabajador sea t6cnico u oficinista es
P(T

u Ol

Pm + P(Ol = ~
+ .1.!..
155 155

100

155

645

La probabilidad de que un trabajador sea profesional u oficinista es:


P(P U O)

PROBLEMA DE
DEMOSTRACIN
4.4

= P(Pl +

P(Ol ~

155

.1.!..
'"' ~
155 155

484

Utilice los datos de les matrices del problema de demostracin .2. Cu61 es la probabilidad de
que uno de quienes contestaron, escogido al azar. sea del Sureste o del Oeste?
PIE U Gl 7
Soludn
Debido a que la ubicacin geogr6fica es mutuamente excluyente (la ubicacin del trab91() Yll
sea en el Sureste o en el Oeste pero no en ambos),
PIE U Gl

PIEi ..,. PIGI

.17

+ .21

.38

4.2 PROBLEMAS
4.8 Dado P(A) .10, P(B) .12, P(C} .21, P(A n C) .05 y P(B
siguiente.

n C}

.03, resuelva lo

114 FSTADISTICA ES LOS :"EGOCIOS


a. P(AUC) _
b .Pl'B IC) .. _
4.9

c. S1 A y B son mutuamente excluyentes. P(A U 8) =V I< valores de la matriz para resolver lu ecuaciones dadas.
D

12

10

a. P(AU D) _
b. P(EUB) _
c. PIDU E)_
d. ptCUF)_
4.10

Use lo> valore> de la matriz para resolver las ecuaciones dadas.

a.
b.
c.
d.

.10

.O)

.04

,12

.27

.06

.)1

.07

P(AUF) _
P(EUB)=_

PtBUC)

P(EU F) _

4.11

Suponga que 47% de todos los estadounidenses han volado en avin por lo menos una vez y que
2 % de todo. los estadounidense han viajado en un tren por lo meno> una \U. Cul es la probabilidad de que un estadounidense seleccionado al aur haya viajado en tren o volado en avin?
Plttde resolverse este problema? Bajo qu condiciones puede resolverse? Si el problema no se
puede resolver, qu informacin es necesaria para que pueda resolverse!

4.12

~
b U.S. Bureau of labor Statistic, 75% de mujeres de 25 a 49 al'I~ de edad participan en la
fueru de trabajo. Suponga que 78<\0 de las mujeres de ese grupo de edades o casada. Suponga
tambitn que 61% de todas las mujeres de 25 a 49 ailos son casadas y participan en la fueru de
trabajo.

a. Cuil es la probabilidad de que una mujer de ese grupo de edades seleccionada al aur set
casada o participe en la fuerza de trabajo?
b, W e. la probabilidad de que una mujer de ese grupo de edades seleccionada al azar sea
casada o participe en la fueru de trabajo pero no en ambas?
c. Cul es la probabilidad de que una mujer de ese grupo de edades seleccionada al az.ar no sea
casada ni participe en la fueru de trabajo?
4.13 Segn ~iel-cn .\tedia Research, aproximadamente 67% de hogaru en Estado> Unido con televisin tienen televisin por cable. Setenta y cuatro por ciento de todos los hogares de Estados
Unido .. con televisin tienen dos o ms televisores. Suponga que 55% de todos los hogares
de Estado~ Unidos con televisin tienen televisin por cable y dos o ms televisores, Un hogar de
Estad~ Unido> se selecciona al azar.
a. Cul es la probabilidad de que el hogar teng.1 televisin por cable o dos o m.U televisores?
es la probabilidad de que tenga televisin por cable o dos o mi televisores pero no
ambos?

b, Cul

c. Cu.il es la probabilidad de que no tenga televisin por cable ni do. o m.is tde-."Ores?
d. Por qu la ley especial de la adicin no se aplica a este problema?
4.14 Un estudio realizado por la :-:orthwc.tern University Lindquist-Endicon Repon pidi a 3~
cornpaas informaran sobre los procedimiento. que usan p.ira contratar personal, Slo S4% de las
que contestaron revisan la copia de la universidad del solicuante como parte del procese de contratacin, y slo 44% considera referencias de una facultad. Suponga que e.to porcentajes son
verdaderos para la poblacin de compaas en Estado. Unidos y que 35% de t~ ~ comp.u'lla.
usan la copia de la universidad del solicitante y su referencias de facultad.
L Cul es la probabilidad de que una compatlla seleccionada al azar utilice ya sea referencias de
facultad o copia de la universidad como parte del proceso de contratacin?
b. Cul es la probabilidad de que una compallia seleccionada aJ azar utilice ya ~ referencias de
facultad o copia de la universidad, pero no ambas, como parte del pl'OCC)() de contratacin?
c. Cu.il es la probabilidad de que una compall.la seleccionada aJ azar no utilice referencias de
facultad ni copia de la universidad como partedel proceso de contratacin?
d. Construya una matriz de probabilidad para este problema e indique las ubicadones de sus
respuestas para las panes (a), (b) y (e) en la matriz.

li

LEYES DE LA MULTIPLICACIN
ley general de la muhiplicacin
Como se expres en la -cin 4.4, la probabilidad de la interseccin de do. eventos (X n Y) recibe el
nombre de probabilidad conjunta. La ley general de la multiplicacin se usa para encontrar la probabilidad conjunta:

u:r GE.'-'EVJ.
MU.

P(X

Mt.'U1PUCACJ0N

n Y)"' Pf.X) Pf.YIX> = Pf.Y) Pf.XJY)

La notacin X n Y significa que X y\' dtbni ocurrir.La ley general de la multiplicacin da la probabilidad de que tanto ti evento X como ti C\en10 Y ocurran al mismo tiempo.
Segn la U.S. Bureau of Labor Stati<tic~. 46% de la fuerza de trabajo en Estados t.:nidos son muieres. Adems, 25% de las muieres de la fuerza laboral trabajan tiempo parcial. Cu.1.1 es la probabilidad
de que un miembro seleccionado al azar de la fuerza laboral en 81ado. Unido. sea mujer y trabaje
tiempo parcial! Esta pregunta es de probabilidad conjunta, y la ley general de la multiplicacin <e puede
aplicar para responderla.
Denotemos por W el evemo de que el miembro de la fuerza laboral su mujer. Denotemos por T
el evento de que el miembro es trabajador tiempo parcial. La pregunta C):
ptWnT)?
Segn la ley general de muluplicacin, este problema se puede resober con:
P(W

n T) - Pl W) PCTIW)

Como 46% de la fuerza laboral son muieres. P(W)


P(TJ\\') es una probabilidad condicional que se puede c:ipRSU
como la probabilidad de que un trabaiador sea de tJta:?) pm:W
dado que el trabajador C mujer, E.ta condkin es b qur se dio ea
el enunciado de que 25% dt las 11111pts dt la fuar;z
~
tiempo parcial. Por tanto. P(TJW) = .25. De aqu K dcduct que:

, AGUR,A 4.10
Probabilidad
con1unta da qua
una mujer est' en
141 fuerza laboral y
tea trabajadora de
tiempo parcial

P(W
P(Wl"'IT).115

n T)

P(W) P(TJW) 1.46)(.25) .115

Se puede decir que 11.5% de la fueru labo:al en Estados Unxlos


son mujeres r trabajan tiempo parcl. El ~
de \'mn de la
figura 4.10 muestra estas relaciones y b probabfficlad conjunta.

116 ESTADISTICA EN LOS l'-'EGOCIOS

--

TABLA 4.5

....
......

Matriz de probabilidad de
datos de recursos humanos de
campal'Ha

.6&5

...,

.071

,ua

M5

.214

f; . .MI

.21111

..

1.000

~tmninar probabilidades conjuntas a partir de valores sin procesar o de matrices de probabilidad es fcil porque cada celda de estas matrices es una probabilidad conjunta.De hecho, algunos expertos en estadistica llaman cuadro dt probabilidadconjunta a una matriz de probabilidad.
Por ejemplo, supongamos que la matriz de valor sin procesar de datos de la compataJa diente, en
el problema de demostracin 4.1 y el Dilema de decisin, se conviene a matriz de probabilidad al dividir entre el nmero total de empleados (N = 155), con lo cual resulta la ubla 4.5. Cada valor de celdas
de la ubla 4.5 es una interseccin, y la ubla contiene todas las posibles interseccicnes (probabilidades
conjuntas) para lo) eventos de gnero y tipo de posicin. Por ejemplo, la probabilidad de que un trabajador seleccionado al azar sea hombre y trabajador tcnico, P(M n T}, es .335. La probabilidad de
que un trabalador seleccionado al aur sea mujer y trabajador profesional, f'\F n P), es .084. Una''
construida una matriz de probabilidad para un problema, por lo general la forma m.h fcil para despejar la probabilidad conjunta es encontrar la celda apropiada de la mauit y seleccionar la respuesu,
~o ob)unte, debido a lo que se da en un problema, a veces el uso de la frmula es ms fcil que construir la matriz,

PROBLEMA DE
DEMOSTRACIN
4.5

Una compal'la tiene 140 empleados. de los cuales 30 son supervisores. Ochenta de los empleados son casados, y 20% de los empleados casados son supervisores. Si se selecciona al azar un empleado de la compal'lla, cu" es la probabilidad de que el empleado sea casado y sea supervisor1
Soluci6n
Denotemos por M a un casado y por S a un supervisor. La pregunta es:
P(M

n S)

Primero calculamos la probabilidad marginal.


P(M) -

~ 5714
140

Luego entonces, ntese que 20% de los empleados casados son supervisores, es la probabilidad
condicional, P(S M) = .20. Finalmente, al aplicar la ley general de la multiplicacin tendremos
P(M

n S)

P(M) P(SIMI (.5714)(.201

= .1143

Por tanto, 11.43% de los 140 empleados son casados y son supervisores.

PROBLEMA DE
DEMOSTRACIN
4.6

De los datos obtenidos de las entrevistas de 200 ejecutivos en el problema de demostracin


encontramos:

a.

P(B ()El

b. P(G ()Al
c. P(B n C)

'2.

C\PrTVl.O 4 PROBABIUDA.D 117

MA11bZ DE VALORESSIN PROCESAR

Oeste

Surest

24

10

14

56

30

22

12

70

28

18

12

16

74

34

42

42

200

Finanzas A

Comunicacion ..

Regin

Noreste

central

82

MA11bZ DE l"ftOeAM.JDAD

Noreste

Sureste

1'1o

tM
lndwrria

Regln

central

Oeste

.12

.05

.04

.07

.28

Manufacturas 8

.15

.03

.11

.06

.35

.14

.09

.06

.08

.37

.21

.21

1.00

FinanznA

Comunicaciona

17

.41

De la celda de la matriz de probabilidad, PIB n E) 61200 .03. Para resolver por le frmula PIB n El PIBI

PIE!BI, primero hallamos PIB):


PIBI ~
35
200

La probabilidad PIEIBI de que E ocurra, dado que B ha ocurrido, se puede determinar con
la matriz de probabilidad como PIEIB) .031.35. Por tanto,
PB

n El

PB PEIB

35

(353)

.03

Aun cuando la frmula funciona, encontrar la probabilidad conjunta en la celda de 1


matriz de probabilidad es m's r'pido que usar la frmula.
Una frmula alternativa es PIB n El PIEi PIB!EI. pero PIEi 0.17. Entonces PIB El sig
nifica la probabilidad de B si se de E. Hay 0.17E en la matriz de probabilidad v 0.038 en
estas E. Por tanto,
PBIEI :~~ V PB

nE

PE

PBIE

.17c~)-

.03

b. Pare obtener PIG n Al, encuentre la celda donde se cruzan G v A en la metnz de probeb1lided, 0.07. o use una de las siguientes frmulas:
PG

nA

PG PAG .21(~~)-

.07

PG

nA

PA PGIA .28 ('~~)-

.07

o bien,

TABLA 4.6
Table de contingenciade datos
de eventos independientes
D
E

:~:
Cm

c. Le probabilidad P(B n CI significa que uno de quienes contestaron tendra que


trebejar en la industriamanufacturera y en la industria de comunicaciones El estudio utilizado para captar datos de los 200 ejecutivos. no obstante, requiri que
cada persona que haya contestado especificara slo un tipo de industria para su
compallia.La matriz no muestra lnteraeccin para estos dos eventos. Por tanto, B
y C son mutuamente excluyentes.Ninguno de quienes contestaron est en manufactura y en comunicaciones.En consecuencia,
PIB

n CI

.O

IS

)4

51

85

ley especial de la multiplicacin

Si lo.\ eventos X y Y 50n independientes,e> posible usar una ley especialde multiplicacinpara encontrar
la intcrscin de X y r. futa ley especial utiliza d hecho de que cuando do. eventos, X. y son independientes, P(X!Y)- P(.>ol y P( YIX) - PI. Y). Por tanto,la ley general de la multiplicacinP(X n Y) - P(X)
P(.\1}') \C luce P(X n Y) P(.>ol P( Y) cuando X y Y son independiente>.
LEY ESPEClAL
DEU.

Si X. Y son independientesPIX

MUlllPUCACION

n Y)

PtX) P( Y)

Un estudio realizado por Bruskin-Goldring Research para SEIKO encontr que 28'141 de adulto.
estadounidensepimsa que el cajero automticoha tenido el impacto ITW imponanteen la vida diaria.
Otro estudio de ~id M1cluelson & Associates para Dale Camegie & Associate. eumin lo> puntos
de vistade Cll'.f'kad0$. sobre el espritu de equipo en el lugar de trabajo. y descubrique 72'141 de todos
los empicados pimsa que trabajarcomo parte de un equipo reduce el estrs, Los puntosde vina de personas sobre CIJCTOS automticos, "<>n independientesde su> puntos de vista cobre el espritu de equlpo en d h:.-pr de trab3jo? Si son independientes,entonce> la probabilidad de que una persona ~a
sdeccionada al aur, que piense que el cajero automtico ha tenido un impacto importanteen la vida
diaria y que uabar como parte de un equipo reduce el estrs, se encuentra como sigue. Denotemos
por A un ajm> automticoy por S que el trabajo en equipo reduceel estr,.
P(A - .28
P(A) .28

P(A

n S) = P(A) PtS) = (.28l(.i2) = .2016

Por Wlto. ~.16'9 de la poblacinpiensa que el cajero autom.tticoha tenido un impacto importanteen
la ida diaria y que trabaiar como parte de un equipo reduce d c~trb.

PROBLEMA DE
DEMOSTRACIN

4.7

Una empresa manufacturera produce cuadernos de papel, de los cuales 3% estn mal encuadernadas. Al azar, un inspectorescoge dos y una a la vez. Debido al gran nmero de cuadernos
que SI producen durante la inspeccin, el muestreo que SI realiza es. en esencia, con restitucin.
Cul es la probabilidad de que dos cuadernos seleccionados estn mal encuadernadas?
Solucin
Denotemospor 1 un encuadernado incorrecto. El problemaes determinar
Pll1n1211
Le probabilidadde 1 -O .03, o 3% es que son incorrectamenteencuadernadas.Como el muestreo
se realiza con reemplazo. los dos eventos son independientes.Por tanto:
PU1n121

PU11 Pll2I (.031(.031 .0009

Casi todas las matrices de probabilidad contienen variables que no son independientes.Sl
una matriz de probabilidad contiene eventos independientes.la ley especial de la multiplicacin

CAPITULO 4 PROBABILIDAD

119

se puede aplicar. Si no, la ley especial no se puede usar. En la seccin 4.7 exploramos una tcnica para determinar si son eventos independientes. La tabla 4.6 contiene datos de eventos independientes.

Utilice los datos de la tabla 4.6 y la ley especial de la multiplicacin para encontrar P(B n D).
Solucin

P(B

D)

= P(B)

P(D)

5o
= 85

34

85

= . 2353

Este mtodo funciona slo para cuadros de contingencia y matrices de probabilidad en las
que la variable de un lado de la matriz es independiente de la variable del otro lado de la matriz.
Ntese que la respuesta obtenida con el uso de la frmula es la misma que la respuesta obtenida con el uso de la informacin de la celda de la tabla 4.6.
P B n D) = ~~ = .2353

U PROBLEMAS
4.15 Use los valores del cuadro de contingencia para resolver las ecuaciones dadas.
C
A

11

16

a. P(An E)=_
b. P(DnB) =_
c. P(Dn E)=d. P(AnB) =4.16 Use los valores de la matriz de probabilidad para resolver las ecuaciones dadas.

.12

.13

.08

B .18

.09 .04

.06 .24

.06

a. P(En B) =_
b. P(CnF)=_
c. P(En D) =4.17

a. Un lote de SO piezas contiene seis defectos. Si al azar se sacan dos piezas, una a l.1 vez y sin
reemplazo, cul es la probabilidad de que ambas piezas sean defectuosas?
b. Si se repite este experimento, con sustitucin, cul es la probabilidad de que ambas piezas
sean defectuosas?

4.18 Segn el grupo sin fines de lucro llamado Zero Population Growth (Crecimiento Cero de
Poblacin), 78% de la poblacin de Estados Unidos vive ahora en zonas urbanas. Cientficos de la
Princeton University y la University of Wisconsin reportan que alrededor de 15% de todos los
adultos en Estados Unidos cuidan de familiares enfermos. Suponga que 11 % de adultos que viven
en zonas urbanas cuidan de familiares enfermos.

120

ESTADISTICA

E..'I LO~ SEGOCIOS

a. Utilice la ley general de la muhiplicad6n pua determinar la probabilidad de seleccionar al


azar un adulto de la poblacin de E..llldos Unidos que viva en zona urbana y cuide de un familiar enfermo.
b. Cul es la probabilidad de seleccionar al aur un adulto de la poblacin de Estado> Unidos
que viva en zona urbana y no cuide de un familiM enfermo?
c. Comtru)OJ una matriz de probabilidad y muestre en dnde se encuentra la rC'SpUC'Sta a este
problema en la matriz.
d. De la nutriz de probabilidad, determine la probabilidad de que un adulto que vive en zona
no urbana cuide de un familiar enfermo.
4.19 Un estudio de Peter D. Hart Research Asseciates para el ~asdaq Stock ~larket revel que 43% de
todos los adultos en tadO> Unidos son accioni-w. AdenW. el estudio determin que 75% de todos
lo. acaorusus adultos de Eittados Unidos tienen algn grado de educacin uni,enitaria.
Suponga que 3i% de: todo> lo> aduho> de tado. Unido> tienen alglin grado de educacin un
versitaria, Se selecciona un ciudadano al azar.
a. Cul C'S la probabilidad de que el adulto no tcn:a acdono?
b. Cul es la probabilidad de que ti adulto posea accione y tenga algn grado de educacin
UIU\miwU?
c. Cul n la probabilidad de que el aduho posea acciono o tenga algun grado de educacin
un\wsitaria?
d. Cul es la probabilidad de que el adulto no tenga educacin univcnitaria ni posea acciones!
c. Cul o la probabilidad de que el adulto no posea acciones o tenga educacin univer-ltaria!
f. Cul es la probabilidad de que el adulto tenga alguna educacin univer>itaria y no posea
acnoncs?
4.20 Segn la Consumer Electronics Manufacturen As.6ociation, 10% de todas las familias en E&tados
Unidos tienen un fax y 52% tienen computadora personal. Suponga que 91% de toda las familas en Estados Unido> que tienen fax tambin tienen computadora personal. Se selecciona al aur
una familia de Estado> Unido>.
a. ,Cul es la probabilidad de que la casa tenga fu y una computadora personal!
b. Cul es la probabilidad de que la casa tenga fu o una computadora personal!
c. Cul es la probabilidad de que la ca>a tenga fax y no tenga una computadora personal?
d. Cul es la probabilidad de que la ca>a no tenga fax ni una computadora personal!
e. Cul es la probabilidad de que la casa no tenga fax pero si tenga computadora personal!
4.21 Un estudio de Becker A:1.<0eiatcs, consultor de viajes de San Diego, encontr que 30% del pblico \-iajm> dijo que sus selecciones de vuelo estn influenciado> por percepciones de seguridad de
la aerolnea, Treinta y nueve por ciento del publico \iaiero desea saber la edad dd avin. Suponga
que s;c, del pblico viajero que dijo que SU) selecciones de vuelo Nn influenciados por percepciones de seguridad desea saber la edad del avin,
a. Cul es la probabilidad de seleccicnar al azar una persona del pblico viajero y encontrar que
ti o ella digan que: la seleccin del nido ~t.i influenciada por percepciones de la seguridad de
la aerolnea y no ddca conocer la edad del 'in?
b. (Cul es la probabilidad de seleccionar al azar una persona del pblico viajero y encontrar que
ti o ella digan que la seleccin del vuelo no ot.i influenciada por percepciones de la seguridad de la acrollnca ni desea conocer la edad del avin?
c. Cul o la probabilidad de seleccionar al azar una persona del pblico viajero rencontrar que
.!I o ella digan que la seleccin del vuelo no ot.i influenciada por percepciones de la seguridad
de la aerolinca y desea conocer la edad del 'in?
4.22 El U.S. Encrgy Dtpartmmt expresa que 60% de todas !.u familW en Estados Unidos tienen ventiladores instalados en el techo. Adems, 29% tienen parrilla para 31 al aire libre. Suponga que 1 }'MI
de estas familia. tienen ventiladores de techo r parrilla para asar. Se selecciona al azar una familia.
a. Cul o la probabilidad de que la familia tenga ventilador de techo o una parrilla para llS3rl
b. Cul es la probabilidad de que la familia no tenga \~ntilador de techo ni una parrilla para asar?

CAPITULO 4 PROBABILIDAD

121

c. Cul es la probabilidad de que la familia no tenga ventilador de techo y tenga parrilla para
asar?
d. Cul es la probabilidad de que la familia tenga ventilador de techo y no tenga parrilla para
asar?

- PROBABILIDADCONDICIONAL
Las probabilidades condicionales se calculan con base en el conocimiento que un experto en estadstica tenga sobre uno de los dos eventos que estudie. Si X, Y son dos eventos, la probabilidad condicional
de que X ocurra dado que Y se conoce o ha ocurrido se expresa como P(XIY) y se da en la ley de probabilidad condicional:
u:"" DE
~ABlllDAD
CD !ffi!CIONAL

P(XIY)= P(XnY)
P(Y)

= P(X)P(YiX)
P(Y)

La probabilidad condicional de (XJ Y) es la probabilidad de que X ocurrir dada Y. La frmula para


probabilidad condicional se deduce al dividir entre P( Y) ambos lados de la ley general de la multiplicacin.
En el estudio de Yankelovich Partners para determinar qu cambios en el diseo de oficinas mejoraran la productividad, 70% de quienes respondieron pensaron que la reduccin de ruido mejorara
la productividad y 67% dijeron que aumentar el espacio de almacenamiento mejorara la productividad. Adems, suponga que 56% de quienes respondieron pensaron que la reduccin de ruido y el
aumento en espacio de almacenamiento mejoraran la productividad. Se seleccion al azar un trabajador y se le pidi sobre cambios en diseo de oficina. Este trabajador piensa que la reduccin de ruido
mejorarla la productividad. Cul es la probabilidad de que este trabajador piense que aumentar el
espacio de almacenamiento mejorara la productividad? Esto es, cul es la probabilidad de que una
persona seleccionada al azar piense que el espacio de almacenamiento mejorada la productividad dado
que l o ella piensan que Ja reduccin de ruido mejora la productividad? En smbolos, la pregunta es
P(SIN) =?
Ntese que parte de informacin dada aparece a la derecha de la lnea vertical de la probabilidad
condicional. La solucin utilizando la frmula es:

P(SIN)=

P(SnN)
P(N)

P(N)=.70
P(SIN)=

e::;,''tHI

~bilidad
-::::-<l1Cional de
'1:'2''01 espacio de
mt"'acenamiento
:a:a una
~sJCCin de ruido

y P(SnN)=.56

P(SnN) = .56 = .80


P(N)
.70

Ochenta por ciento de trabajadores que piensan que la


reduccin de ruido mejoraria la productividad tambin creen que
si se aumenta el espacio de almacenamiento mejorara la productividad.
Ntese, en la figura 4.1 l, que el rea para N del diagrama de
Venn est sombreado por completo el rea del trabajador que piensa que la reduccin de ruido mejorara la producnvidad. Tambin
ntese que la interseccin de N y S est ms sombreada, porque
esta parte de reduccin de ruido incluye ms espacio de almacenamiento y es la nica que aumenta en relacin con la reduccin

122

ESTADISTICA

EN

WS NEGOCIOS

de ruido y como las personas saben que favorece la reduccin de ruido, es la nica rea de inters que
incrementa el espacio de almacenamiento.
Examine la matriz de probabilidad de la tabla 4. 7 para el problema del diseo de oficina. Ninguna
de las probabilidades dadas en la matriz son probabilidades condicionales. Para reiterar lo que ya se
mencion, una matriz de probabilidad contiene slo dos tipos de probabilidad, marginal y conjunta.
Los valores de celda son probabilidades conjuntas y los subtotales de los mrgenes son probabilidades
marginales. Cmo se determinan las probabilidades condicionales desde una matriz de probabilidad?
La ley de probabilidades condicionales muestra que una probabilidad condicional se calcula al dividir
la probabilidad conjunta entre la probabilidad marginal Entonces, la matriz de probabilidad tiene la
informacin necesaria para resolver una probabilidad condicional.
Cul es la probabilidad para que un trabajador seleccionado al azar piense que la reduccin de
ruido mejorara la productividad dado que el trabajador cree que aumentar espacio de almacenamiento mejorara la productividad? Esto es:
P(noNjS) =?
La ley de probabilidad condicional expresa que:
P(noNnS)

P(no NIS)

P(S)

Ntese que como S est dada, estamos interesados slo en la columna sombreada en la tabla 4.7, que es
la columna marcada con S para espacio aumentado de almacenamiento. La probabilidad marginal,
P(S) es el total de esta columna y se encuentra en el margen al fondo de la tabla como 0.67. P(no N n S)
se encuentra como la interseccin de No para ruido y Si para almacenamiento. Este valor es 0.11. Por
tanto, P(no N n S) es O.! l. En consecuencia:

P(no NIS)

P(no NnS)
P(S)

~=.164
.67

La segunda versin de la frmula de la ley de probabilidad condicional es:


P(XjY) = _P(_X_)
P_(Y~IX_)
P(Y)
Esta versin es ms compleja que la primera, P(X n Y)IP( Y). Sin embargo, a veces debe usarse la
segunda versin debido a la informacin que se proporciona en el problema, por ejemplo, cuando se
resuelva P(XjY) pero se da P(YjX). La segunda versin de la frmula se obtiene de la primera versin al
sustituir la frmula por P(X n Y) = P(X) P(YjX) en la primera versin.
Corno ejemplo, en la seccin 4.6, se presentaron los datos que relacionan a las mujeres de la fuerza laboral de Estados Unidos. En esta informacin se incluye el dato de que 46% de la fuerza laboral de
Estados Unidos son de mujeres y que 25% trabajan tiempo parcial. Adems, se sabe que 17.4% trabajan tiempo parciaL Cul es la probabilidad de que un trabajador de Estados Unidos seleccionado al

TABLA 4.7

Aumenforapodode almaunmnimto
Sf

Matriz de probabilidad para el


problema de diseo de oficinas

IWuccl6n de n4a

No

Sf~.70

No

.30
.67

.33

1.00

CAPfTUW 4 PROBAB!UDAD 123

azar sea mujer si se sabe que es trabajador de tiempo parcial? Denotemos por W el evento de seleccionar una mujer y por T el evento de seleccionar un trabajador de tiempo parcial. En smbolos, la pregunta es:
P(WIT) =?

La primera forma de la ley de probabilidades condicionales es:


P(WjT)= P(WnT)
P(T)
Ntese que esta versin de la ley de probabilidades condicionales requiere el conocimiento de la
probabilidad conjunta, P(W n T), que no se da aqu. Por tanto, intentamos la segunda versin de la ley
de probabilidades condicionales que es:
P(WjT) =-P(_W_)_P_(T~jW_)
P(T)
Para esta versin de la frmula, todo se da en el problema:
P(W) = .46
P(T) = .174
P(TjW) = .25

La probabilidad de que un trabajador sea mujer, dado que la persona trabaja de tiempo parcial, se
puede calcular ahora:
P(WIT)= P(W)P(TjW)
P(T)

(.46)(.25)
(.174)

= .661

Por tanto, 66. l % de trabajadores de tiempo parcial son mujeres.


En general, es probable que esta segunda versin de la ley de probabilidades condicionales se use
cuando P(X n Y) se desconozca pero P( YjX) sea conocida.

PROBLEMA DE
DEMOSTRACIN

4.9

Los datos de las entrevistas a ejecutivos dados en el problema de demostracin 4.2 se repiten
aqu. Utilice estos datos para encontrar:
a. P(BIFl
b. P(GICl
c. P((DIFl)

MATRIZ DE VALORES SIN PROCESAR


Ubicacin geogrfica

Tipo

de
Industria

Noreste
D

Sureste
E

Regin
central
F

Oeste
G

Finanzas A

24

10

14

Manufacturas 8

30

22

12

Comunicaciones C

28

18

12

16

74

82

34

42

42

200

56
70

124

ESTAObTlCA E.-.: l.OS !'EGOCI05


MATRIZ OE MOeABIUDAD

Regin
Noreste

Sureste

.12

.05

Manuf:rura1B

.15

.03

Comunaciofl# C

.1'

tHi
/ndulfrl

central

Oeste

'

.07

.28

.11

.06

.35

.09

.06

.08

.37

.17

.21

.21

1.00

Solucin

PIB[FI PIB n fl d!, 52


PIFI
.21 '

lJI determinacin de probabilidades condicionales desde una matriz de probabilidad, con el uso

de la formula, es un proceso relativamente fcil. En este caso, la probabilidad conjunta, PIB n FJ,
aparece en una celda de la matriz 1.111; la probabilidad marginal, PIF), aparece en un margen
(.211. Unir estas dos probabilidades por medio de la frmula produce la respuesta, .111.21 .52
Esta respuesta significa que 52.% de los ejecutivos del Regin Central (los valores fl estn en
manufactures (los valores B).
PIGIC) PIG n CI .08 .216
PICI
.37

b.

Este resultado significa que 21.6% de los ejecutivos de la industria de comunicaciones que respondieron, ICI son del Oeste (G).
PIDIF) PID n F) .00 00
PIDI
.21 '

c.

Como O y F son mutuamente excluyentes. PID n F) es cero y as es PIDJFI. La razn fundame""


tal que esta tras PIOIF) O es que. si se da F (quien se sabe contest que est ubicado en el
Regin Central), quien contest no podra estar ubicado en O (el Noreste).

Eventos independientes
EVE.,lOS
l~OE.PEi,'DIENTES

X,Y

Para determinar i X y

r son eventos independientes, puede usarse la 'iguiente definicin.


P(..\1)'} .. P(X) y P(Yl.\1 P(}1

En cada ecuacin, no importa que X o Y se d porque X y Y son indtpendicnta. Cuando X y Y


independientes, la probabilidad condicional se resuelve como una probabilidad marginal.
A \'CCO. es importante probar con el cuadro de contingencia de materiales sin procesar para determinar , lo eventos son independientes.Si (UQ!quitr combinacin de do. eventos de lo. lados dfnmlQ de la matriz no pasa la prueba, P(..\1)'} PI.X}; la matriz no contiene eventos independientes.

PROBLEMA DE
DEMOSTRACIN
4.10

Pruebe con la matriz para las 200 respuestas de ejecutivos pare determinar s el tipo de industria es independiente de la ubicacin geogrfica.

CAPITULO

PROIW!!LIDAD 125

H1H10111.s111+Ii!.f'11:1.t...

Las HMO: las probabilidadesde regular y reformar


El movimiento hacia las HMO (Health Management
Organization) de proveedores de salud tradicionales ocuci rpidamente en la dcada pasada. Aun cuando algunas
~nas estn satisfechas con las HMO, otros piensan que
estas organizacionesnecesitan reformas. Un articulo publicado en The Wall Street fournal el 25 de junio de 1998 presenta
numerosas estadsticas respecto a estadounidenses y su sercio de salud. El articulo indica que 51 % de consumidores
piensan que la aprobacin de nuevas leyes sobre estas orgamzaciones son una buena idea, pero 32% de consumidores
~nsan que es mala idea. Estas dos cantidades pueden
verse como probabilidades marginales:

Adems, el U.S. Census Bureau reporta que 12.6% de la


poblacin tiene por lo menos 65 aos de edad y 16.1 % de
Ja poblacin de Estados Unidos no tiene seguro:
P(:2:65) = .126 y P(sin seguro)

.161

Algunas de estas probabilidades se pueden combinar


para obtener probabilidades de interseccin como son:
P(:2:65

n buena idea) = P(:2:65} . P(buena ideaf:2:65)


= (0.126) (0.46) = 0.058

P(sin seguro n buena idea) =

P(buena idea) = .51 y P(mala idea) = .32

P(sin seguro) P (buena idea/sin seguro)


El apoyo para la aprobacin de este reglamento vara
= (0.161) (0.60) = 0.097
segun la afiliacin poltica de los partidos, edad y tipo de seguro que se tenga. Por ejemplo, 57% de demcratas piensan
De acuerdo con estas cifras, 5.8% de consumidores tieque aprobar nuevos reglamentos sobre las HMO es una nen por lo menos 65 aos de edad y piensan que nuevos
buena idea, pero slo 43% de republicanos piensan lo reglamentos para las organizaciones de administracin de
mismo. Cincuenta y cinco por ciento de consumidores de
salud (HMO) son buena idea, mientras que 9.7% de con!8 a 29 piensa que nuevos reglamentos son una buena idea, sumidores no tienen seguro y piensan que nuevos regla
pero la cifra cae a 46% para consumidores de 65 aos o
mentos para estas HMO son una buena idea.
ms. Cuarenta y nueve por ciento de consumidores que tieCon el uso de la ley de la adicin, podemos tambin
nen Medicare/Medicaid apoyan Jos nuevos reglamentos, y
60% de consumidores que no tienen seguro apoyan los calcular las probabilidades de unin como Jo es la probabinuevos reglamentos. Estas cifras se pueden expresar como lidad de que un consumidor seleccionado al azar no tenga
seguro o piense que los nuevos reglamentos para las HMO
probabilidades condicionales.
son una buena idea:
P(buena ideafdemcrata) = .57
P(buena ideajrepublcano)= .43
P{sin seguro U buena idea) =
P(buena ideaj18 a 29) = .55
P(sin seguro) + P{buena idea)
P(buena ideal65 o ms) = .46
- P{sin seguro n buena idea)
P(buena ideajMedicare/Medicaid) = .49
P(buena ideajsin seguro) = .60
= 0.16i + 51 - 0.097 = 0.574
MATRIZ DE VALORESSIN PROCESAR
Ubicacingeogrfica

Noreste
O
Tipo
de
industria

Sureste
E

Regin
central
F

Oeste
G

Fi':}anzas A

24

10

14

Manufacturas B

30

22

12

ComunicacionesC

28

18

12

16

74

82

34

42

42

200

56
1

70

Solucin
Seleccione una industria y una ubicacin

P(AjG) = P(A)?

P(A!Gl =

geogrfica

..!
42

(por ejemplo A-Finanzas y G-Oeste. Es

y P(AJ =

200

126 FSTADISTICA E.-: L()<; ~"EGOCIO~


14142 es igual a 5612007 No, .33 .;. .28. El tipo de industria y la ubicacin geogrfica no son
independientes porque por lo menos est presente una excepcin a la prueba.

PROBLEMADE
DEMOSTRACIN

Determine si la tabla de contingencia que se muestra como tabla 4.6 y repetida aqu conuene
eventos independientes.

4.11

A~1220
8
20 30 50

15

34

51

85

Solud6n
Pruebe la primera celda de la matriz para encontrar si P!AJDI PIAI.
PIAIDI
. 38
4 .2353
PIAI

!~

.2353

El proceso de prueba debe continuar hasta que se determine que todos los eventos son inde
pendientes. En esta matriz, todas las posibilidades se comprueban. Por tanto, la tabla 4.6 contiene eventos independientes.

4.4 PROBLEMAS
4.lJ L'tilice los valores de la tabla de contingencia para resolver las ecuaciones dadas.

a.

15

12

11

17

19

21

32

2;

18

13

12

PlGIA> _

b, P(BJF) =-

=-

c. P(qE)
d. P(EJG) _

:m

4.24 Ulilcelos valores de la tabla de contingencia para resolver las ecuaciones dadas.
C

. P(CjA) - -

b. PBIDJ _
c. P(AJB) =-

CAPITULO 4 PROBAJllUDAD 127

4.25 A continuacin aparecen los resultados de un estudio que pregunta: "Tiene usted calculadora
y/o computadora en su casa?"
Calculadora
S
Computadora

5{~6
No

No
3

49

11

15

26

57

18

75

Es la variable calculadora independiente de la variable computadora? Por qu si o por qu no?


4.26 En 1997, las quiebras financieras en Estados Unidos llegaron a 83 384, segn Dun & Bradstreet.
La industria de la construccin tuvo 10 867 de estas quiebras. Los estados del Atlntico sur tuvieron 8 010 quiebras. Suponga que 1 258 de todas las quiebras fueron negocios de construccin
situados en estados del Atlntico sur. Un negocio en quiebra de 1997 raras veces se muestrea al
azar.
a. Cul es la probabilidad de que el negocio est situado en estados del Atlntico sur?
b. Cul es la probabilidad de que el negocio sea de la industria de la construccin o est situado en estados del Atlntico sur?
c. Cul es la probabilidad de que el negocio sea de la industria de la construccin si se sabe que
el negocio est situado en estados del Atlntico sur?
d. Cul es la probabilidad de que el negocio no est situado en estados del Atlntico sur si se
sabe que el negocio es de la construccin?
e. Cul es la probabilidad de que el negocio no est situado en estados del Atlntico sur si se sabe
que no es negocio de la construccin?
f. Dado que el negocio es de la construccin, cul es la probabilidad de que el negocio no est
situado en los estados del Atlntico sur?
4.27 Arthur Andersen Enterprise Group/National Small Business United, Washington, realiz una
encuesta nacional de propietarios de pequeos negocios para determinar los desafos de crecimiento de sus negocios. El principal reto, seleccionado por 46% de los propietarios de pequeos
negocios, era la economa. Un cercano segundo lugar fue el de trabajadores capacitados (37%).
Suponga que 15% de los propietarios de pequeos negocios seleccion tanto la economa como
encontrar trabajadores capacitados como desafos de crecimiento. El propietario de un pequeo
negocio se seleccion al azar.
a. Cul es la probabilidad de que el propietario piense que la economa es un desafo de crecimiento, si el propietario piensa que encontrar trabajadores calificados es un desafo para el
crecimiento?
b. Cul es la probabilidad de que el propietario piense que encontrar trabajadores capacitados
es un desafo para el crecimiento, si el propietario piensa que la economa es un desafo para
el crecimiento?

c. Dado que el propietario no selecciona la economa como desafo para el crecimiento, cual es
la probabilidad de que el propietario piense que encontrar trabajadores capacitadas es un
desafo para el crecimiento?
d. Cul es la probabilidad de que el propietario piense que ni la economa es un desafiopara el
crecimiento fil encontrar trabajadores capacitados es un desafo para el crecimienm?
4.28 A fines de 1998, un estudio de usuarios en lnea fue realizado por Iupiter Communications para
determinar por cul tipo de compra es que un consumidor prefiere un servicio a dientes en vivo,
Cuarenta y siete por ciento de los usuarios respondieron que cuando compran boletos de avin,
prefieren servicio a clientes en vivo. Suponga que de quienes prefieren servicio a dientesen V\'O para
comprar boletos de avin, 81 % prefieren servicio a clientes en vivo para transacciones de prstamos. Si se selecciona al azar a un usuario en lnea, determine las siguientes probabilidades:

128

ESTADISTICA tx LOS SEGOCIO~

a. El usuario en linea prefiere servido a clientes en vlvo pua comprar boletos de in;n y pua
transaccin de prbtamos.
b. El usuario en linea prefiere servicio a clientes en vivo para transaccin de prstamos pero no
prefiere servido a dientes en \+.'O pua comprar boletos de a\in.
c. El usuario en linea no prefiere servicio a dlentes en vi\'O para transaccin de prstamos pero
si para comprar boletos de avin.
4.29 Arco11111i11g To"'Y report que 37% de contadores compran su hardware de computadora por
pedido directo por correo y que 54% compran su software de la misma manera. Suponga que
97% de los contadores que compran su hardware por pedido directo por correo compran su
software por pedido directo por correo. Si se selecciona al azar un contador, determine las
siguientes probabilidades:
a. El contador no compra su software por pedido directo por correo dado que no compra su
hardware de la misma manera.
b. El contador compra su software por pedido directo por correo dado que no compra su hardware por pedido directo por correo.
c. El contador no compra su hardware por pedido directo por correo si se sabe que compra su
software por pedido directo por correo.
d. El contador no compra su hardware por pedido directo por correo si se sabe que no compra
su software por pedido directo por correo.

4.8 REVISIN DE PROBABILIDADES: REGLA DE BAYES


Una extensln de la ley condicional de probabilidades es la regla de Baycs, que fue aca<U por Thomas
Ba)~ (1702-1761) en cU)'O honor lb-a su nombre.La regla de Bayn es unafJrmulaqucatk1ulccl
uso
dt 111 ley dc probabilidallts condiciona/n para permitirla rtviswn dt probabida.lts originalts con nuC\11

informad6n.

REGU DE BAV'tS

P(x

'

In-

P(

x'> P<YI.xi >

P(X1)P(r!Xi)+P(X2)PO'IX2)+

.. +P(Xn)P(YIX,,)

Rordcmos que la ter de probabilidad condicional para


l'(Xdl')
Es:
P( XJY) P(X,) P(t]X1)
l

PO')

Compare la regla de Bayes con esta regla de probabilidad condicional. Los numeradores de la regla

de Bares)' la ley de rrobabili<UJ condicional son los mismos, con la interseccn de X, y Y m0$lrada en
forma de regla general de la multiplicadn. La nueva airactmstka que usa la regla de Bayesse encuentraen el denomlnador de la regla:

El denominador de la regla de &)n nduye una n:pmin del producto (intersccdn) pua cada
particin del espacro maestral, Y, incluyendo el evento (X,) mismo. El denominador es entonces una lista
cxhausth-a y colectiva Je resultados mutuamente excluyentes de Y. Este dmominador se conoce a veces
como la frmula dt probabilidadtotal.Representa un promedio ponderado de las probabilidades condidonales, con los valores de las probabilidades previas del evento correspondiente.

CAPITULO 4 PROBABIUDAI> 1 ?9

Al expresar la ley de probabilidades condicionales en esta nueva forma. la regla de Ba}~ hace posible que d experto en estadstica haga nuevas y diferentes aplicaciones con el uso de probabilidades con
dicionales. En particular. lo~ estadsticos usan la regla de Bayb para revistarprobabilidades en vista de
que hay nueva informacin.
Un tipo panicular de cinta de mpre-ora es producida por slo dos compaas, Alamo Ribbon
Compan) y South Jeney Products. Suponga que Alamo produce 65% de w cintas y que South Jersey
produce 35"<>. Ocho por ciento de las cintas producidas por Alamo son defectuow y 12% de ~ cintas
de Soutb Jeney son defectuosas. Un cliente compra una cinta nueva. Cul es la probabilidad de que
Alamo produjo la cinta? Cul es la probabilidad de que South Jcrey produjo la cinta? La cinta se prueba y multa defectuosa. Ahora, cul b la probabilidad de que Alamo produjo la cinta? y de que South
Jerwy produjo la cinta?
La probabilidad era .65 de que la cinta provino de Alamo y .35 de South Jersey.~tas K llaman pro
babilidades previas porque estn basadas en la informacin original,
La nueva informacin de que la cinta e) defectuosa cambia las probabilidades porque una compsl\fa produce un porcentaie mh aho de cintas defectuosa> que la otra compala. Cmo puede usarse
esta informacin para actualizar o revisar las probabilidades originales? La rtgla de Bayes permite esta
actualiudn. t:na forma de trazar una revisin del problema de probabilidades es usar una tabla. La
tabla 4.8 muestra el anli>i) del problema de la cinta.
El proceso se inicia con las probablidades previas: .65 Afamo y .35 South Jerwy. En.u probabilidades previas aparecen en la "!!Unda columna de la tabla 4.8. Debido a que el producto K encontr
defectuoso deben usarse las probabilidades condicionales P(defcctuoso!Alamo) y P(deftctuosolSouth
JefKY). Ocho por ciento de las cintas de Alamo son defectuosas: P(defe.:tuoso!Alamo) .08. Doce por
ciento de las cintas de South Jerser son defectuosas: P(defcctuosolSouth Jersey) .12. ~tas dos pro
babilidades condicionales aparecen en la tercera columna. Ocho por ciento de 65% de las cinta.) de
Alamo son defectuosas: (.08)(.65) = .52 o 'lea 5.2% del total. Esta cantidad aparece en la cuarta columna de la tabla 4.8; es la probabilidad conjunta de obtener una cinta que fue hecha por Alamo y es defectuosa, Como la cinta comprada e> defectuosa. stas son las nicas cint.li de inters de Alamo. Doce por
ciento de 35% de las cint.u de South Jersey son defectuosas. la multiplicacin de estos dos porcentajes
da la probabilidad conjunta de obtener una cinta de South Jef'.Cy que es defectuosa. ~ta cantidad tambito aparece en la cuarta columna de la tabla 4.8: (.12)(.35) .042 o sea '4.2% de todas las dnt.u son
hechas por South Jersey y son defectuosas. 8te porcentaje incluye las nicas cintas de inters de South
Jer>ey porque la cinta comprada es defectuosa,
La columna 4 se totaliza para obtener .094, que indica que 9.4% de todas las dotas son defectuosu (Alamo r defectuosas == .52 + South Jer-cy y defectuosas .042). El otro 90.6% de las cintas, que
$00 aceptable>. no son de inters porque la cinta comprada e> defectuosa. Para calcular esta quinta
columna, las probabilidades poneroreso revisadas,implica dividir cada valor de la columna 4 entre el
total de la columna 4. Para Alamo, .052 del total de cintas son Alamo y defectuosasdel total de .094 que
son defectuosas.Dividir .052 entre .094 da .553 como probabilidad revisada de que la cinta comprada
fue hecha por Alamo. Esta probabilidad e> menor que la probabilidad previa u original de .65 porque
menos de las cintas de Alamo (como porcentaje) son defectuosas que las producidas por South Jenq.
La cinta defectuosa es ahora menos probable que provenga de Alamo que antes de saber de b anta
defectuosa. la probabilidad de South )er>ey se revisaal dividir la probabilidad conjunta de .042, de que
la cinta t' hecha por South Jer\t)' y es defectuo"1, entre la probabilidad total de que la cinta o defeetuosa (.094 ).

TABLA 4.8
Tabla de Bayes para revisin de

probabilidades del problema


de cintas

.....

......

.. 1=;
IW

"'

.3S

,.,

......
1
Pfli!!)

ProbebWdecl
caajuDta

P(E I"\ 111

.08

.OS2

.12

~
l'{~).094

m
.,.....
.~

Pu'

~2 - ..55.3
.094

P42

094

'"' 44~

130 l:STADbTICA L" tos NF.GOCIO:.

C:h1tHF

.052]-

Diagrama de rbol
para probabilidades
del problema de
cintas

.094
.598
.042

.308

El resultado C$ .042/.094 .447. La probabilidad de que la cinta defectuosa o de Soulh Jmey aumeru
porque un porcentaje ms alto de cintas de South Jeney son defectuosas,
Los diagramas de rbol son otra forma comun de resolver problemas de la regla de Bares. La figura 4.12 muestra la solucin para el problema de la cinta. Ntese que el diattrama de rbol contiene
todas I~ posibilidades, incluyendo cintas defectuosas y aceptables. Cuando se da nueva informacin,
slo las ramas pertinentes se seleccionan y utilizan. Los valores de probabilidad conjunta al final de las
rama. apropiad.u se emplean para revisar y calcular las posibilidades pcsterores. Usar el nmero total
de cintas defectuosas, .052 + .042 '"' .094, el clculo es como sigue.

Probabilidad revisada Alamo = 09 52 .553


. 4
Probabilidad revisada: South JeNy 09042 .447

PROBLEMA DE
DEMOSTRACIN
4.12

Las mquinas A, B y C producen todas las mismas dos piezas. X y Y. De todas las piezas producidn, la mquina A produce 60%, la mquina B produce 30% y la mquina C produce 10%.
Adem,
40% de las pieza hechas por la mquina A son pieza X.
50% de las pieza hechas por la mquina B son pieza X.
70% de las pieza hechas por la mquina C son pieza X.
Una pieza producida por esta compal'lla es muestreada al azar y se determina que es una pieza
X. Con el conocimiento de que es una pieza X. revise las probabilidades de que la pieza pro
venga de la mquina A, B o C.
SokK'6tl
La probabilidad previa de que la pieza provenga de la mquina A es .60, porque la mquina A
produce 60% de todas las piezas .. La probabilidad previa es .30 de que la pieza provenga de B y
.10 de que provenga de C. Estas probabilidades previas son ms pertinentes si no se sabe nada
acerca de la pieza, pero se sabe que es una pieza X. Las probabilidades condicionales muestran
que las diferentes mquinas producen proporciones distintas de piezas X. Por ejemplo, .40 de
las piezas hechas por la mquina A son piezas X. pero .50 de las piezas hechas por la mquina
By .70 de las piezas hechas por la mquina C con piezas X. Es lgico que la probabilidad de que
la pieza provenga de la mquina C aumentara y que la probabilidad de que la pieza fue hecha
en la mquina A aumentara porque la pieza es una pieza X.
La tabla siguiente muestra cmo es que las probabilidades previas. las probabilidades condicionales, las probabilidades conjuntas y la probabilidad marginal, P()(), se pueden usar para
revisar las probabilidades previas para obtener probabilidades posteriores.

C\PIT\Jl.04

Previa
PIE'

Condldonal
Pl~E'

.60

.40

.30

.50

.10

.70

Evento

Conjunta
P(Xn E'
(.601(.40)

PROBABlllDAD 131
Posterior

.24

~.46 . 52

.15

.:.J!.
.46 -

.07

~.46 15

P!)() - .46

. 33

Une vez revisadas las probabilidades, es evidente que la probabilidad de que la pieza sea hecha
en la mquina A disminuyeron y que las probabilidades de que le pieza fue hecha en las mquinas B y C aumentaron. Un diagrame de rbol presenta otra viste de este problema.
Probabilidades revisadas: Mquina A:
Mquina B:

:!:
:!:

Mquina C .07
.46

.52
.33
.15

.24
.36
.15
.15
.07

.03

"5 PROBLEMAS
En una planta manufactuma, la m.lquina A produce 10% de cieno producto. la m.lqwna 8 produce 40% de este producto. y la m.lquina e produce 50% de este producto. Cinco por ciento de !O> produetos de la m.lquina A son dcfcctuo.o..., 12% de loo. productos de la mquina B son defectuosos y
8% de loo. productos de la mquina C son defectuosos. fJ inspector de la compaflia ha muestreado
un producto de esta planta y ha encontrado que es defectuoso. Determine las probabilidJdcs misadas de que el producto muestreado fue producido por la m.lquina A, mquina B o mquina C.
4..31 Alex, Alicia y Juan despachan pedidos en un restaurante de comida rpida. Alcx despacha meorreetamente 20% de los pedidos que toma. Alicia de.pacha incorrectamente 1:!% de los pedidos
que toma. Juan despacha incorrectamente 5% de los pedidos que toma. Alcx despacha 30% de
todo) lo) pedido), Alicia despacha 45% de todos los pedidos y Juan 25% de todos los pedidos.
Acaba de despacharse una orden.
a. Cul es la probabilidad de que Alicia despach el pedido?
b, Si el pedido fue despachado por Juan, Cu.il es la probabilidad de que se haya despachado
correctamente?
c. Se desconoce quin despach el pedido, pero ste se despach incorrectamente. Cilcs son
las probabilidades revisadas de que Alex, Alicia o Juan despacharan el pedido?
d. Se desconoce quin despach el pedido, pero 6te se despach correctamente. Cu.lle. son ~
probabilidades revisadas de que Alo., Alicia o Juan despacharan el pedido?

4.30

4.32 En un pequeo poblado. dos companas de jardiner fertilizan prado> durante c:I verano, TriState Lawn Service tiene 72% del mercado. Trtinta por dmto de lo. prado. fcniliudo. por Tri-State
podrian clasicarse como muy sanos un mes despus del servicio, Greenchem time el otro 28%
del mercado. Veinte por ciento de lo> prados ferulizados por Greenchem podrian clasificarse
como muy sanos un mes despus del servicio. Al azar se selecciona un prado que ha sido trata
do con fertilizantes por una de estas compaas dentro del ltimo mes. Si el prado se clasifica
como muy sano. cules son las probabilidades de que Tn-State o Greenchem trataron el prado?
4.33 Las comparuas dan capacitacin a empleado. por muchas razones diferentes, entre las que se:
cuentan la lealtad del empleado. retencin de ste )' calidad del trabajo. Suponga que 65% de
toda. las compaas dan alguna capacitacin a sus empleados pero que esta cantidad varia segn
el tarnatlo de la compaa. Suponga adems que 18% de todas las compaas que dan capacita
cin son pequeas r que 75% de todas las compatlla. que no dan capacitacin son pequeas, Se
muestrea al azar una compatlia sin consi~erar su tamatlo. Cul es la probabilidad de que la com
pania d capacitacin? Suponga que se determina que la compatl[a seleccionada no es pequea.
Cul es la probabilidad de que la compatlia d capacitacin? Qu proporcin de todas las compaflias no o pequea]

Igualdad de gneros en el lugar de trabajo


Los dato.' de la compatla cliente dado. en el Dilema de decisin ~ muestran en forma de matriz de
valores sin procesar. Con el uso de las tcnicas presentadas en este capitulo, es posible cstad~ticamen
te responder la. pregunta. gerenciales. Si al azar <e selecciona un trabajador de lo> 155 empicados, la
probabilidad de que el trabajador sea mujer, P(W), es 55/155 o sea .355. ~ta probabilidad margin.tl
india que alrededor de 355% de todo. lo> empleados de la compaia cliente 50n muiere>. Dado que
d empicado tiene una posicin gerencial, la probabilidad de que el empicado o;ca mujer, P( \\'IM) es
3/11 o sea .2i3. La proporcin de gerente> que son mujeres en la compallia e menor que la proporcin
de todos los trabajadores de c>ta compaa que son muiere . \'arios factores podran estar relacionados
con esta discrepancia, algunos de los cuales podrlan ser justificables por la compatlia, incluyendo upe
rimcia. educacin e historia previa de xitos, pero otros factores no podran ser justificable,
51.-po11&3 que al azar se selecciona un empleado tcnico para darle un bono. Cul o la probabilidad
de que una mujer sea selecdonada, dado que el trabajador es un empicado tcnico? Es decir. P\ Fff) ?
Al aplicar b ley de probabilidades condicionales a la matri1 de valore> sin procesar dada en el Dilema de
decisin. P(Ffl1 = 1 i/69"' .246. Con el uso del concepto de eventos complementarios, la probabilidad
de que se seleccione un hombre dado que el empleado es una persona tcnica C> 1 - .246 .754. ~
ms de tres veces probable que un tcnico seleccionado al azar sea hombre. Si una mujer fuera una de
las escogidas para el bono, un hombre podra alegar discriminacin con base meramente en lu proba
bilidades, pero quienes toman decisiones en la compaa podran presentar entonces documentacin
de los criterios de seleccin basados en productividad, sugerencias tcnicas, medidas de calidad y otros.
Suponga que un empleado de la compaa clieme se selecciona al azar para ganar un viaie a Hawa,
La prob.ibilidad nwginal de que el ganador sea un prefesional C$ P(P) 4-l/155 .284. La probabilidad de que el ganador se-a hombre o empleado oficinista es una probabilidad de unin. es decir:
Pl,M U C) P(M) + P(C) - P(M

n C)

100
-

155

31

122

+ -155 - -155 = -155

.787

La probabilidad de que un hombre o empleado o6cinta de la compar'tia cliente gane el viaje es


.787. La probabilidad de que el ganador sea mujer )' gerente es una probabilidad conjunta. es decir,
P(F

n M)

31155 .019

Har meno> de 2% de probabilidad que una mujer gerente sea seleccionada al azar como ~
del viaje.
Cul e. la probabilidad de que d ganador sea del grupo tcnico si se sabe que el empleado es hombre~ Esta probabilidad condicional es como sigue:

P(T!M) "' 52/100 .52


fa posible responder a muchas otras preguntas acerca de la 'tuacin de recursos humanos de la
ccmpaa cliente que use probabilidades.
FJ mtodo de probabilidad a un grupo de recursos humanos e real, objeuvo y numrico para la
seleccin de persona. sin considerar talentos individuales, conocimiento> y valor de la compal'lla. Por
supuesto, cm ca.i todos los casos. muchas otra. consideraciones entran en la contratacin, promocin
r recompensa> de trabajadores adcmh de sacar al aur su nombre. t-:o obstante, la administracin de
la compaMa debera estar atenta a que a veces existen ataque. a la> prcticas de contratacin. promocin y recompensas con el uso de anfoi> estad>tk0> como los aqui presentados. Ko se argumenta aqul
que la administracin debe b.iwr sus decisiones meramente en l.u probabilidades dentro de categora>
particulares. En cambio, ,i est consciente de las probabilidades, la administracin puede considerar su.
decisiones con evidencia documentada de la productividad del trabajador)' el valor de la organizacin.

CONSIDERACIONESrnos

RESUMEN
El estudio de probabilidad aborda modos de asignar probabilidades, tipos de probabilidade, y leye) de probabilidades. Las
probabilidades apoyan la nocin de estadsticas internas. El
uso de datos muesrrales para estimar y probar hiptesis acerca de parmetros poblaconales se hace con incertidumbre, Si
se toman muestras al 11.ar, o posible asignar probabilidades a
resultados dd proceso inferencial.
Tres mttodos de asignar probabilidades son 1) el mtodo
disico, 2) d mtodo de frecuencia relativa y 3) probabilidades
sub~tivu. El mtodo clsico puede asignar probabilidades a
priori, o antes que tenga lugar el experimento, Se apoya en la~
leyn y~
de probabilidad. El mtodo de frecuencia relati'~ asigna probabilidades con base en datos hi>trico~ o datos
deducidos nr.pfricammte. La. probabilidades >ubjcti\'U est.\n
basadas en los sentimientos. conocimiento )' experiencia de la
persona que determine la probabilidad.
Omos bpos cspcciales de eventos necesitan correcciones
a algunas de
leyes de probabilidad: eventos mutuamente
OOU)'mtr5 y C"'ml0$ independientes. Los primeros IOn evcntos que no pueden ocurrir al mismo tiempo. de modo que la
probabt'lidad dc su inttnein es cero. En la determinacin
de b unin dc dos C'\'m!OS mutuamente excluyentes. la ley de
adicin SC
al suprimir fa interseccin. Con eventos
indcpcndimtcs, b prcsmtacin de uno no tiene impacto o
influcnc:U en b presentacin del otro. Ciertos experimentos,
por ejemplo los de monccbs o dados. de manera natural pro

comse

ducen eventos independientes. Otr06 experimentos producea


eventos independientes cuando el experimento se reali7~ coa
reemplazo. Si lo) eventos son independientes, la probabilbc!
conjunta se calcula al multiplicar las probabilidades indh..,..
duales. que o un caso especial de la ley de la multiplicacin.
Tres tcnica. para contar las posibilidades en un experimento son la regla de conteo mn, las posibilidades N, y combinaciones. La regla de conteo mn se usa para determinar ~
cuantas formas posibles en total puede presentarse un expenmento en una serie de operaciones secuenciales. La frmWJ '
:-in se aplica cuando se hace muestreo con reemplazo o b
eventos son independientes. Se usan combinaciones pan determinar las posibilidades cuando el muestreo se hace
reemplazo.
Cuatro tipos de probabilid.id son probabilidad marginL
probabilidad condicional, probabilidad conjunta y probabilidad de unin. La ler general de la adicin se usa para calculz:
la probabilidad de una unin. La ley general de la multiplica- ,
cn se usa para calcular probabilidades conjuntas, La ley condicional se usa para calcular probabilidades condicionales.
La regla de Bayes es un mtodo que se puede usar ~
revisar probabilidades cuando se dispone de informaci:::
nueva; es una variante de la ley condicional. La regla de 8.J)u
toma la. probabilidades previas de eventos que ocurran
ajusta o revisa esa> probabilidades con base en lnformad
acerca de lo que ocurre despus,

TRMINOS CLAVE
a priori
combinaciones
complemento
complemento de una unin
espado muestra!

eventos independientes
eventos mutuamente
cxdu}Tntc.
eventos simple,

evento

frecuencia relativa de
presentacin

ezperimento

eventos colectivamente
exhaustivos

interseccin
matriz de probabilidad
mtodo clsico de asignar
probabilidades
notacin de conjuntos
probabilidad condicional
probabilidad conjunu

probabilidad de: unin


probabilidad marginal
probabilidad subjetiva
regla d~ Baycs
regla mn de conteo
unin

FRMULAS
Regla de conteo

Lq general de adicin

PC.X U

mn

Muestreo con reemplazo

Y)

= P(X) + P( Y)

P(X U Y)= P(X)

Muc.tTeo sin reemplazo

PIX n Y)

+ P(Y)

Lq general de multiplicadn
P(X

Frmula de combinacin

N)
N!
::Cn (n n!(N-

ley especial de adicin

n Y).,.

P(X) P(YJX)

= P(Y) P(XJY)

ley especial de multiplicacin


n)!

P{X

n Y)'"'

P(X) P(Y)

CAPfTUlO 4 PROIW!IUDAD

de protYb1hdad condicional

Rtglade &vn

P(\lY) P(X n Y) P(X) P(YJ,\1

PO')
P(Y)

'PROBLEMAS

P(XAY>

P(X,) PO'IX,)

P{X1)P1)1X1) + P\Xi) P\}1Xz) + ... + P\X.J PO'\X.J

COMPLEMENTARIOS
~ttDICOS DE E.U. E.'I; ~ A.'1;0 REO.EKTE

Ciiculo de estadfsticq

Etbl (ailos)

Use los Vlllom de d cudro de contingmcia para resolver


ecuaciones dadas.

A
\Wiabk2

10

20

15

30

15

1
1
L

b,
L

P(E) -

c.

b. P(BUD)_
c. P(An E) .. _

d.

d. P(BJEl e. P(AUB)_
. P(B\C) =g. .P(DJC) =-

e.

h. P(AIB>L Son independientes


por qu no?

f.

w variables

1 y U Por qu si o

12

30

.11

.20

.19

.12

.16

...

.os

.()4

.02

.01

.22

.28

.23

.14

.17

1.00

.07

.18

Cul o la probabilidad de que un mdico seleccionado al 11.ar tenga de 35 a 44 ano) de edad?


Cul es b prob.lbilid.1d de que un mdico sdc.::don.a
do al aur 1a mujer y tmga de 45 a S4 ao6 de bd>
Cuil es la probabilidad de que un mdico seleccionado al aur ~ hombre o de 35 a .. aos de edad!
Cul es la probabilidad de que un mdico seleccionado al azar tenga menos de 35 aJ\<>5 de edad o tenga
de 55 a 64 aflO) de edad!
Qdl es la proNbilidad de que un medico selecdonado al aur 1a mujer si tiene de 45 a 54 ail< de edad!
Cu.ll o la probab1lid.id de que un m~ko ~cccion.ado
al azar no tea mujer ni tenga de 55 a 64 ano de edad?

Pruebe eue conOCJmlentoe

LJ5 U~ los valores del cuadro de contingcnc~ para resolver


w ecuaciones dadas.

PIFlA)_
b .P(A\8) _
c. P(B) _
L

d. P(En F) _
e. P(DJB) _

t 35

4.37 Purch.ising. U~) pregunt a profesionales de compras

qu caractertkas de ventas I~ haban impresionado


m en un representarae de ventas, Setenta y ocho por
ciento seleccionaron "minudosidad"; Cuarenta por cien10 respondieren que conocimiento de u "propio producto': A los prcfescnales de compras se les permiti
dar una lma de una o m. aracteri>licas. Suponga que
27% de lo profesionales de compras anotaron "miaucxhidacl9 y"conorunim10 de su propio producto" como
caractcrl.ticas de ventas que m. lo> impresionaron. Se
seleccion al u.ar un profe.1oo.al de compras.
L Cuil C5 b probabilidad de que el prottstonal selecdon "mmudosid.id" o "conocimiento de su propio
producto"?
b. cdl e la probabilidad de que d proft'Sional no han
seleccionado ni "minuciosidad" ru "conocunimto de
su propio producto"?

f. P(BJD) _
g. PIDUC)_
h. P(F)_

c. Si se sailt que d profesional sclcion "mmuaosid.ad":.


cuil ~ la probabilidad de que d pro!csiona1 han
sclcionado "conocimlento de su propio product0"1

La siguimte matriz de probabilidad contiene un desglose


cklaecbdygintrock~~m
un ao
reciente, aegn rq><>rta b American Med1cal &sociation.

d. cdl es la probabilidad de que d profC'SIOn.il no 5C'lcc


cion "minuciosidad" r $1 sdecaon "conodmientc
de su propio preducto "?

136

ESTADlmCA

E.-.:~ NEGOCIOS

4.38 La U.S. Bureau of Labor Sranstics public datos sobre


lo. pm~nes efreeidas por pequcl\as com~ias a sw
empicado . Slo 42% ofrecen planes de retiro mientra>
que 61 % ofrecen seguro de vida Suponga que 33% efrecm planes de retiro y stgUro de vida como prestaciones
Si una pequea compallla se selecciona al azar, determine bs ~igumtcs probabilidades:
a. La compatlla ofrece un plan de retiro dado que ofrecen stgUro de vida.
b. La compatlia ofrece seguro de vida dado que ofrecen
plan de retiro.
c. La com~la ofrece seguro de \ida o un plan de rt'tro.
d. La com~la ofrece un plan de retiro y no ofrece
seguro de vida.
e. La com~la no ofrece w-gu.ro de vida , se sabe que
ofrece un plan de retire,

seguridad social estuviera seguro en 20 al\Ql, De los que


respondieron y que tenan 45 aos de edad o ms, 70%
pensaron que con d si>tcma estarla ~
en 20 allo~
De las personas entrevistadas, 57% tenan menos de 45
at\Ol. Se seleccion al azar uno de IOl que respondieron.
a. Ctl e> la probabilidad de que la persona tenga 45
ailO> O m;is?
b. Cul es la probabilidad de que la persona 1enga
menos de 45 al\0) y piense que con el salema de
<eg11rdad social estar' stgUro en 20 allos?
c. Si la persona seleccionada piensa que el sutcma de
stgUridad social estar' stgUro en 20 allos, cu.ti es la
probabilidad de que la persona tenga 45 o n:W at\os?
d. Cu.il es la probabilidad de que la persona tenga
menos de 45 al\os o piense que el sistema de seguridad social no estari stgUro en 20 al\Ql?

4.39 ~
Link Resources, 16'!9 de b poblacin en Estado.
Unido. est. orientada a b tecnologa, pero estas cantidades \'Uan por rq;onn. Por qemplo, en el oeste la
cifra es W% m d noreste es de 1 i'lll. Veintin por
ciento de b pobbn en EsudOl Unido. en general est.t
en el oeste y ~ m d eoresre. Suponga que al azar se
sd"ciona un csudounidrnst.
a. Cu.ti es b probabilidad de que la pcnona vi'-a en el
ante y sea una pcnona orientada a la tecnologla?
b. Cm! es b probabilidad de que la persona viva en el
oorme y sea una pcnona orientada a la tecnologa!
c. Suponp que se~ que b persona seleccionada est.t
orimuda a b trcno1ogia. Ctl es la probabilidad de
qix b pcnona m-.a ea d oeste?
d. Suponp que se sabe que la persona seleccionada est.t
orimuda a b tccnologb. Cm! es la probabilidad de
que b persona ,fu en d nomtc?
e. Suponp que se sabe que b penona seleccionada estJ
orientada a la ucno1ogfa. Cu.ti es b probabilidad de
que la persona no
en d oeste ni el noreste?

4.42 Una encuesta por telfono

4.40 En cierta ciudad, 30% de las rnilias tienen tarjeta


MuttrCard, 20% timen Amcrian Expreu y 25% tienen
\~ISI.Ocho por ciento de las Wnilias ucnen Ma.ttrCard

4.43 La Slttlcase Workplacc Inda estudi IOl tipos de actividades rebcionadas con el trabajo que hkieron estadounideeSb que estaban de vacaciones en el \-erano. Entre otras
COllS. 40% Icen maltrial rd.acionado con d trabajo. Treinu
y cuatro por ciento se registraron con d jefe. A quienes
rcspondicron al estudio se les permiti seleccionar ~
de una actividad. Suponga que de quienes leen maten..
relacionado con el trabajo, 78"il se registraron con el.
jefe. Uno de quienes rbpondieron se seleccion al azar.
a. Cu.il es la probabilidad de que al estar de vacaciones
esta penona que respondi al es1udio se registrara
con el jefe y lea el material relacionado con el trab.tjo?
b. Cu.ti es la probabilidad de que al estar de vacaciones
esta persona que respondi al estudio no se registre con
el jefe ni lea el mattrial relacionado con el trabajo?
c. Ctl es la probabilidad de que al estar de vacaciones
esta penona que respondi al estudio I~ el mate
ria! relacionado con el trabajo dado que se registr
con el jefe?

m-a

y American Express. Doce por ciento tienen Visa y


~la.tcrrd. se porcier.10timen.~~
y\'"ia
a. Ctl es la probabilidad de sdcccionar una familia
que no tenga t:irjeta \rlA ni American Exprc?
b, Si una familia tiene MMtcrCard, CIW es l;a probabihdad de que tenga tarjeta \"iQ?
c. S1 una familia tiene tarjeta \sa, cul es la probabdidad de que tenga Ma.terard!
d. La posesin de una tarjeta \risa, es independientede
poseer una ~futerCard? Por qut sl o por qu no?
e. La posesin de una tarjeta Amcri<:an Exp,_, (Q mutua
mente cxdu~iva de la po icin de una tarjeta \'isa?

4.41 Hace unos cuantos anos, un estudio encargado por Tht


\\brld Almarw y Marunry .\cwsStrvicc rqion que 51 %
de quienes respondieron no creyeron que con d \isttma de

realiuda por la compallla


Maritz Mar~g Rescarcb encontr que 43'41 de n1adounidenses espera ahorrar ms dinero el at\o prximo
que lo que ahorr el ano puado. Cuarenta y cinco por
ciento de los entrevistados planea reducir su dC'Uda el at\o
prximo. De quienes esperan ahorrar ms dinero el
allo prXImo, 81 % planea reducir su deuda el allo prxilno. Se selecciona al azar un estadounidense.
a. Cul es la probabilidad de que esta persona espere
ahorrar ms dinero el afto prximo y planee reducir
su deuda el at\O prximo?
b. Cu.il es b probabilidad de que esta penona espere
ahorrar ms dinero el afio prximo o planee reducir
su deuda el al'lo prximo?
c. Cu.tl es la probabilidad de que esta persona no espere
ahorrar ms dinero el afio prximo ni planee reducir
su deuda el allo prximo?
d. Cu" b la probabilidad de que esca persona espere
ahorrar m.ts dinero el ano prximo y no planee
reducir su deuda el atlo prximo?

CAPITULO~

d. Cul Q la probabilidad de que al estar de vacaciones

Qla persona que respondi al estudio no se regisirara


con el jefe dado que ley material relacionado coo el
1rabajo?
e. Cul Q la probabilidad de que al estar de vacaciones
Qla pcMna que respondi al estudiono se regmara
con el jefe dado que no ley material relacionado con
el trabajo?
f. Conslru}-a una matriz de probabilidad para este problema.

PROBABfUDAO

137

d. Cul es la probabilidad de que la compal\ia d capacitacin para retener empleados o para mejorar sus
procesos!
e. Cul es la probabilidad de que b compal'a no d
capacit.tcin para retener empleados ni para mejorar sus procesos?
f. Suponga que se sabe que la comp.il\la no da capacitacin para mejorar procesos. Cul es b probabilidad de que la compallla d capacitacin para retener
empleados?

4.44 Health Righ1s Hotline public los tt)Uhado) de un estu- 4.46 Pimey Bowe) entrevist a 302 directores y vicepresdenlQ de mercadeo de empresas estadounidenses grandes y
dio de 2 400 personas en el norte de California, en el que
medianas. para determinar qu era lo que pensaban es
se pidi a consumidores compartir sus quejas acerca de
el mejor vehtculo para educar a quienes loman decisioatmcin dirigida. La queja nllmero uno fue la denegacin
nes sobre complejos problemas para vender productos )'
de atencin, con 17%de 10) consumidoresparticipantes
<ervicios. El porcentaje m~ alto de compal'lias escogieque Ja seleccionaron. Varias otras quejas se observaron,
ron la venia directa por correo o ca1log0), seguida por
incluyendo atencin inapropiada ( 14%), servicio a clienventa directa o venta por representantes, La venia directes ( 14%), reclamaciones con pagos ( 11%), atencin de
especialidad ( 10%), demoras para obtener atencin (8%)
la por correo o por ca1logo fue seleccionada por
38% de las compal'la-<, ninguna de
cuales seleccion
y medicamentos de recela (?'lb). Esw ca1cgor1as de quejas
venia directa por correo )' catlogos o ventas directas
son mutuamenteexduyentes.Suponga que lo) resultados
o venta por representantes. Suponga tambin que 41%
de este e tudio pueden llevar-e a iodos los consumidono seleccion venia directa por correo o cat.tlogo) ni
res de atencin dirigida. Si un consumidor de atencin
venia directa o por representantes. Si una de las compadirigida se selecciona al aur, determine las siguiemes
l'llas se selecciona al aur y se en1UV1sta a su mejor venprobabilidades:
dedor acerca de este asumo, determine la siguien1es
L El consumidor se queja por reclamadcnes de pago o
probabilidades:
atencin de especialidad,
a. El vendedor seleccion venta directa por correo o
b.. El consumidor se queja de medicamentos de recela y
por catlogo) y no seleccion venta directa o por
servicio a clientes.
representantes de ventas.
c. El consumidor se queja de atencin inapropiada
b. El vendedor seleccion venta directa o venta por
dado que el consumidor se queja de la atencin de
representantes.
especialidad,
c. El vendedor seleccion venta directa o venta por
d. El consumidor no se queja por demoras en obtener
representantes, dado que la persona ~leccion \'tnta
atencin ni se queja por reclamaciones de pago.
directa por correo o por catalogos.
c.~ ~umerosas compmias dan capacitacin a empleados
d. El vendedor no seleccion venta ditteta por correo o
por dferemesrazones, entre las que se incluyen la lealtad
por catlogos. dado que el vendedor no seleccion
del empleado, cenificacin, calidad y mejora de proceventa directa o por representantes,
sos. En un estudio nacional de compaas, 81 Learning

.:r\lems reportaron que 56% de las compaAias que respondieron citaron la retencin del empleado como
razn pncipal para la capacitacin. Suponga que 36%
de las compatas respondieron que otorgan capacitacin
pua mejorar sus procesos y para retener el empleado.
Adems, suponga que de las compaasque dan capacitacin para mejorar sus procesos, 90% lo hacen para
retener empleados. Se seleccion al azar una compaJ\a
que da capacitacin.
L Cul es la probabilidad de que la compaa d capacitacin para retener empleados y oo para mejorar
sus procesos?
b.. Si se ~be que la compallia 01orga eapacuacin para
retener empleados, cul C) la probabilidad de que d
capaci1acin para mejorar sus procesos?
c. Cul es la probabilidad de que la compallla d capacitacin para mejorar sus procesos?

4.47 Una pequea prctica independiente de mdicos time


tres mdicos. La doctora Sarabia atiende a 41 % de los
pacientes, el doctor Tran a 32% y la doctora lackson el
resto, La doctora Saraba pide pruebas sanguneas a 5%
de sus pacientes, el doctor Tran pide pruebas sanguinas
a 8% de sus pacientes y la doctora Jack.-on pide pruebas
sanguneas a 6% de sus pacientes. Un auditor sdccciona
al azar un paciente de la semana ~da y descubre que
la paciente se le rtaliz una prueba ~
como
resultado de la visita de un mdico. C.Onocimdo esu
informacin, cu. es la probabilidad de que d paaente
viera a la doctora Sarabia? Para q~ porcmtaic de todos
los pacientes en ei.ta prctica se requieren pruebas sanguineas?
4..48 Una encuesta realizada por el Anhur Andmen Enterprise
Group/Na1ional Small Busine<s United ua1 de determinar cule< son los prindpales dcsa~ para el crec-

miento y continuacin de operaciones de pequeos


negocios, Aunque cuando la economa y encontrar trabajadores calificadoi. fueron los principales desafos,
aparecieron ot~ en lo. resultado. del estudio incluyendo
reglamentos, citado. por 30% de los negocios, y la carga
impo itiva, citada por 35%. Suponga que 71 % de l<b
compalas que citan reglamentos como un desafio tambin cuaron la carga Impositiva como desafio. Suponga
que e to porcentajes se cumplen para todo. lo. peque
nos negocios, Si al azar se selecciona un pequeo negocio, determine las siguientes probabilidades:
a. El pequeo negocio cita la carga impositiva y regla
memo como desafio.
b. El pequeo negocio cita la carga impositiva o reglamemos como desafio.
c. El pequeo negocio cita ya sea la carga impositi\-a o
reglamentos pero no ambos como desafio.
d. El pequeo negocio cita reglamentos como desafio
dado que cita la carga imposiliva como desafio.
e. El pequeno negocio no cita reglamentos como desaAo dado que cita la carga impo iliva como desafio.
f. El pequeo negocio no cita reglamentos como desaAo dado que no cita la carga impositiva como desafio.
4.49 Sc!:n la Public \'oice for Food and Heahh Policy, aire
dedor de 1i% de todo> las ~ras en un ano reciente no
contaban con etiqueta de informacin nutrimental.
Aproximadamente 113% de carnes ~ra desayuao y m.

o meno. 59% de productos para ptrrosa1/1011a no


taban con etiqueta de informacin nutrimcntal. ~
que si estos tres grupo de almemos se comb
60% serian productos de sopas, 35% ~ran ca.mtS
desayuno y 5% serian ptrroj a1/1tnta. Un in'
recibe de manera oculta un producto alimenticio de
de estoi. tres grupos, y se le dice que el producto no
ta con etiqueta de informacin nutrimental, Re\
probabilidades de que el producto sea de wpa.
para desayuno. y un producto de perro) cal1tntes.
4.50 Una encuesta realizada por la serie de media hora

"The Great American TV Poli", de Lifetime, p


estadounidenses qu es lo que consideran ~
unre en sus vidas. Veintinue\"e por ciento
"buena salud", 21% respondieron que "un mat
feliz" y 40% conte.t que "fe en Dio.': Debido a q:x
le. pregunt cul de estas cosas es lo mis imporwne..
entrevistado no poda seleccionar ms de una r
a. Cul es la probabilidad de que una persona
diera "un matrimonio feliz" o "fe en Dios"?
b. Cu.ti es la probabilidad de que una perwna
ra "un matrimonio feliz"o "fe en Do6" o "buena
c. Cul ~ la probabilidad de que una persona
diera "fe en Dios"? y "buena salud"?
d. Cul e. la probabilidad de que una persona
diera ni "fe en Dios" ni "buena salud" ni "un
monio feliz"?

ANLISIS DE LA BASE DE DATOS


l.

En la base <le <lato~ manufactura). cul o la probabilidad de que una industria de Cdigo SIC seleccionada al
azar este en el grupo industrial 13> Cul es la probabili
dad de que una industria de Cd1~0 SIC seleccionada al
.uar tenga un valor de embarque- 1ndu..tnalo de 4? cul
es la probabilidad de que una industria de Cdigo SIC
seleccionada al azar est en el grupo industrial 13 y tenga
un valor de embarque. de industria de :?? Cul es la pro
babilidad de que una industria de Cdigo SIC selecdonada al azar est en el grupo industrial 13 o tenga un
valor de embarques de industria de 2? Cul es la probabilidad de que una industria de Cdigo SIC seleccionada
al azar no cst~ en el grupo industrial 13 ni tenga un valor
de embarques de industria de 2?

2. Utilice la base de dato> del ho pita!. Contnm


matriz de valores sin procesar para la ~n y para
control. El estudiante debe obtener una matriz de i
Con esta matriz. conteste 13) siguientes preguca
(Consulte el capitulo 1 para miembros de cat
Cul es la probabilidad de que un hospital selec
al aur es1~ en el Medio Oeste si se sabe que el
persigue fines de lucro? Si se sabe que el ho.p1tal cm
el sur, cul e. la probabilidad de que sea un hospiu!
gobierno. no federal? Cul es la probabilidad de qac
ho.pital est en la regin de las Rocallosas o sea un
pita! que no persiga fines de lucro ni sea del gob
Cul es la probabilidad de que un hospital persiga
de lucro situado en California?

CASO: COLGATE-PALMOLIVE HACE UN ESFUERZO "TOTAL"


A mcdia(b de la dcada de 1990, Colgatc-Palmol\-c percion
una nueva~ dentfrica para el mercado ot3douniderue, Da
mada Colga~ Total, con un ingrediente anu"bactcriano que ya se
\'m<a muy bien en el extranjero. No obstante. la palabra annbacttri.ino no era pcmulida para eso. producto. por w ~ de la
Food and DrugAdminbuation. Por tanto. Colgate-Palmol.ivclcnla
que ~ugmr otra forma de vender sta y otras aractcrsucas de <u

''

nueva pasu dental 1consumidores en Esudos l.hdo.. ~ im


gadores de mercado dijeron a Colgate PalmolM que co
dores estaban cansados de tratar de dstinguir entre dif
ventajas de varias marcas de pasta dental y deseaban <implifx>
cin en sus vidas al comprar. En respuesta, se dio el no
"Total" al producto en Estados Unidos: esta linica palabra~
sa que la pasta dental e> el paquete "total" de varios ben

CAPITULO 4 PROBABILIDAD

Young & Rubicam inventaron varios comerciales que


iii::suan los beneficios de Total y probaron los comerciales con
?::t!pOS de enfoque. Un comercial que vende los beneficios de
h:-? duracin de Total tuvo especial xito. Entre tanto, en
.:- Colgate-Palmolive recibi aprobacin de la FDA para
IA:x::!J. cinco aos despus que la compaa lo haba solicitado.
E: producto fue lanzado al mercado en Estados Unidos en
=de 1998 con el uso de comerciales que fueron diseados
'"'ideas ms exitosas de pruebas del grupo de enfoque. Sigui
=campaa de anuncios impresos.
Antes de tres meses, la Colgate-Palmolive se apoder de Ja
_;r:icipacin nmero uno del mercado de pastas dentfricas.
~meses despus, 21 % de todas las casas en Estados Unidos
:L::;.an comprado Total por primera vez. Durante este mismo
~o.
43% de aquellos que inicialmente probaron Total la
eeeapraron de nuevo. Colgate Total habla sido exitosamente
=oclucida en el mercado estadounidense.

l. Qu probabilidades se dan en este caso? Utilice estas


probabilidades y las leyes de probabilidad, para determinar qu porcentaje de familias en Estados Unidos
compr Total por lo menos dos veces en los primeros
10 meses de su anuncio.
2. Es la categora de edades independiente de la voluntad de probar nuevos productos? Segn la U.S. Census
Bureau, aproximadamente 20% de todos los estadounidenses estn en la categora de edades entre 45 y 64

139

aos. Suponga que 24% de los consumidores que


compraron Total por primera vez durante el periodo
inicial de 1 O meses eran de la categora de edades de 45
a 64 aos. Utilice esta informacin para determinar si
la edad es independiente de la compra inicial de Total
durante el periodo de introduccin. Explique su respuesta.
3. Con el uso de las probabilidades dadas en la pregunta
2, calcule la probabilidad de que un consumidor estadounidense seleccionado al azar tenga edad de 45 a 64
aos o compr Total durante el periodo inicial de 10
meses. Cul es la probabilidad de que una persona
seleccionada al azar comprara Total en los primeros 10
meses dado que la persona est en la categora de 45 a
64 aos de edad?
4. Suponga que 32% de todos los consumidores de pasta
dentfrica en Estados Unidos vio los comerciales Total.
De aquellos que vieron los comerciales, 40% compraron Total al menos una vez en los primeros 1 O meses
de su introduccin. De quienes no vieron los comerciales, 12.06% compraron Total al menos una vez en
los primeros 10 meses de su introduccin. Suponga
que al azar se selecciona un consumidor de pasta dentfrica y se sabe que compr Total durante los primeros
1 O meses de su introduccin. Revise la probabilidad
de que esta persona vio los comerciales Total y la probabilidad de que la persona no vio los comerciales
Total

CAPTULO

Distribucionesdiscretas
OBJETIVOS DE APRENDIZAJE
El objetivo general de aprendizaje del capitulo 5 es ayudar al estudiante a que entienda una categora de distribuciones de probabilidad que produce slo resultados discretos, con lo cual podr:
l. Distinguir entre variables aleatorias discretas y variables aleatorias continuas.
2. Saber cmo determinar la media y varianza de una distribucin discreta.
3. Identificar el tipo de experimentos estadsticos que pueden ser descritos por la distribucin binomial y saber cmo resolver esos problemas.
4. Decidir cundo usar la distribucin de Poisson al analizar experimentos estadsucos y saber cmo resolver esos problemas.
S. Decidir cundo es posible calcular problemas de distribucin binomial por medio
de la distribucin de Poisson y saber cmo resolver esos problemas.
6. Decidir cuando usar la distribucin hpergeometrica y saber cmo resolver esos
problemas.

140

El bueno y el malo de la imagen pblica

de la industria bancaria

En aos recientes, la industria bancaria se ha enfrentado a numerosos desafos y oportunidades. Una


serie de quiebras bancarias debidas a la competencia dentro de la industria, opciones alternativas de
banca, asl como mala administracin y prdidas financieras por prstamos hipotecarios riesgosos y
otros prstamos a finales de la dcada de 1980 y principios de la de 1990, resultaron en una evidente
calda en la confianza del consumidor en bancos. Hoy dla algunos lideres empresariales piensan que los
bancos han perdido contacto con sus clientes y ya no tienen utilidad. Otros piensan que la percepcin
de los consumidores respecto a la industria bancaria ha mejorado en aos recientes, en particular despus que la industria experiment tres aos consecutivos de ganancias rcord, Cmo es vista realmente la industria bancaria por el consumidor?
Un estudio reciente efectuado por la GaUup Organization y encargado por la American 8anken
A.ssociaon entrevist a 1 002 consumidores que actualmente hacen negocios con un banco. Los resultados del estudio fueron mixtos y variados. La buena noticia para los bancos es que 80% de los usuarios consideraron que un banco es su institucin financiera principal y que 65'16 estaban muy satisfecho)
con su institucin. Setenta y nueve por ciento dijeron que los bancos eran muy mportanr~ para la salud
de la economb y 64% pensaron que los bancos son ms competitivos hoy que hace cinco afto-. Ochenta y
siete por ciento de los entrevistados se sienten seguros con los cajeros automaticos,En el lado negativo, 41 %
de qwenes hablan solicitado un prstamo a un banco dijeron que el proceso era muy dillcil. Cincuenta y
dos por ciento de consumidores pensaron que no era apropiado que lo) bsncos cobraran comisiones por
sus servicios y slo 33% estuvieron decididamente de acuerdo con que los servicios bancarios representaban buen valor para el dinero. Aun cuando 87% pensaron que los banqueros deberan interesarse por
sus comunidades,slo 31% estuvieron de acuerdo con que asl lo hacen lo) bancos. Slo 29% estuvieron
de acuerdo con que lo) bancos son Oexibles para satisfacer las necesidades financieras de los consumidores,
Algunos otros datos encontrados en el estudio incluyeron lo siguiente: 39% de todos los consumidores d1~ron que la comodidad es la razn ms importante de mantener una ~)acin en su institucin
financiera principal, seguida por un servicio amable o bueno ( 19%), relacin duradera (14% ), emisin de
cheques ah ( 11%), y buenas tasas de inters por prstamos ( 11 %). El mal servicio a clientes encabez
la lisia de las razones por las que el pblico cambi o consider cambiar de insmuciont) financieras
principales ( 19%), seguida por cambio de domicilio ( 18%), cambios en comisiones o servicios ( 18%),
was de inters ( 16%) y comodidad/ubicacin ( 13%).

Preguntas gerenciales y estadsticas


l. Este estudio fue efectuado en iodo el pas por la Gallup Organization, En opinin del lector,
estos estudios son caractersncos de su regin geoglifica, en Estados Unidos o de consumidores financieros de otros paises?
2. El estudio sugiere que 80% de iodos los consumidores financieros consideren u banco como b
institucin financiera principal. Si suponemos que el estudiante selecciona al azar 25 amsu:ndores financieros en su comunidad, cul es la probabilidad de que 18 o m.h de estos consu:nidorcs
considere que su banco es la insutucin financiera principal s1 80% se alcanza en su cocmz::idad?
3. Segun el estudio, 65% de iodos los consumidores financieros estan mur sansfhos con StJ msmucin principal. Suponga que al azar se seleccionan 15 consumidores ~con
base en
las cifras del estudio. cul es el nmero esperado de estos 15 que esn mur sausfo:hos con su
institucin principal?
4. Suponga que efectuamos un estudio local de 32 consumidom de instituciones bancarias y
encontrarnos que 26 se sienten seguros de usar caje~ autcmucos, Si al azar seleccionamos i
de estos 32 para hacer algunas entrevistas adicionales, cuil es la probabilidad de que ex.act.tmente 4 de los 7 se sientan seguros de usar cajeros au1omatcos?
141

S. Un banco realiza un estudio de trnsito de dientes para determinar modelos de llegadas de 10


am a 11 am en das hbiles. Los resultados muestran que, en promedio. cada dos minutos llegan al banco 3.8 dientes. Con base en ola informacin, uponga que al azar se selecdona uo
periodo de dos minutos; cul es la probabilidad de que no lleguen clientes durante este tiem
po? Cuil es la probabilidad de que ms de cinco dientes lleguen en este periodo de do> minutos? Cul es la probabilidad de que menos de tres dientes lleguen en un intervalo de cuatro
minutos escogido al azar?

En experimentos estadtsticos que abarcan probabilidad, los resultados ocurren de manera aleatoria. Suponga, como ejemplo de este tipo de xpcrimen10. que un fabricante de bateras selecciona a!
azar tres bateras de un lote grande de para probar su calidad. Cada batera seleccionada ha de dasifi.
carsc como buena o defectuosa. las bateras estn numeradas de 1 a 3, una batera defccruosa se designa
con una D. y una bateria buena se designa con una G. Todos los posibles resultados se muestran en b
tabla 5.1. La expresin, Dt G2 03, denota un resultado panicular en el que la primera y tercera bateri
as son defectuosas y la segunda barera es buena. En este capitulo examinamo las probabilidades de
distintos resultados que pueden ocurrir con tipos paniculares de experimentos.

5.1 DISTRIBUCIONES DISCRETAS CONTRA CONTINUAS


Una variable aleatoria e una variablt que cont1t11t los resultados dt u11 experinmuo de probabilidad. Por
ejemplo. suponga que un experimento es medir las llegada de automviles a una caseta de autopista
durante un periodo de JO segundos, W posbles resuhados son; O, 1, 2, , n automviles. Esto nmeros (O. 1, 2, . ,n) son los valores de una variable aleatoria. Suponga que otro experimento es medir d
tiempo mire la terminacin de do. 1rabaio en una linea de produccin. Los valores van a variar de O
scgundos a n segundos. Esw mediciones de tiempo son los valora de otra variable aleatoria. las dos
Cllttb(lrlas de \Wbks aleatorias son:
(1) variables aleatorias dismtas
(2) \""Uiablcs aleatoria. continuas

Una ,-uiabJe aleatoria es una variable aleatoria discreta s1 ti conjunto dt todos los poHblts ~alom
a a lo sumo un finito o un mimtro contablememe mfimto ele posibles valora. En l:a$ todas las 'itu~
nes csudistkas, las variables aleatorias discretas producen valores que son nmeros enteros no negau'"OS Por ejemplo. si $5 personas se seleccionan al aur de una poblacin y se ha de determinar cu~nw
de las seb son zurdas, la variable aleatoria producida es discreta. W$ nico. nmeros posibles de zurdo. de la muestra de seb son 0, 1, 2, 3, 4, S y 6. No puede haber 2.75 zurdo) en un grupo de se~ personas; obtener valores de nmeros no enteros e) imposible. Otros ejemplos de experimentos que dan
'-ariable$ aleato~ discretas incluyen los siguientes:
TABLA 5.1
Todos los posibles resultados
para el experimiento de la
bate ria
Gi Gz G,
D, Gz G,
G, o, G,

Gi Gz

'

o,

o,

G,

o, Gz o,
G, o, o,
o, o,

l.

Seleccionar al azar 25 pc>nas que consuman bebidas gaseosa. [refrescos)


determinar cuntas prefieren bebidas de dieta.

2.

Determinar el nmero de defecto) en un lote de SO artculos,

3. Contar el nmero de personas que lleguen a una'rienda durante un periodo de


cinco minutos.
Muestrear 100 votantes registrado) y determinar cunto. votaron por el pre.idnu
en la ltima eleccin.
El experimento de la batera descrito al principio del captulo produce una distribucin que tiene resultados discretos. Cualquier intento del experimento contendr O, I, 2 o 3
bateras defectuosas. No o posible obtener 1.58 bateras defectuosas. Podria decirse que las
variables aleatorias discretas suelen generarse en experimentos en los que ta. cosa. se
"cuentan",no se miden.
Las variables aleatorias continuas, toman valores t11 cada punto. t11 un ntavalo cuh
En esta forma, las variables aleatorias continuas no tienen brechas o valores no tomados..
4.

CAPITULO S DIST!UBUQOSES DlSCRETAS

143

Podrla decirse que las variables aleatorili conunuas se generan en experimentos en lo> que I~ c~ se
"miden'; no se "cuentan" Por ejemplo. si una persona ot ensamblando un componente en un producto, el tiempo que tarda en lograr este objetivo podra ser cualquier valor dentro de un lapso razonable,
como podra ser tres minutos 36.4218 segundos o 5 minuto> 17.5169 segundos. Una lista de medidas
para las cuales se podran generar variables aleatorias continuas incluirla el tiempo, altura, peso y volumen. Otros ejemplos de expermentcs que dan va!Ubles altatorias continuas incluyen lo siguiente:
l. Muestrear el volumen de nitrgeno lquido en un tanque.
2. Medir el tiempo entre llegadas de clientes a una tienda de venta al menudeo.
3. Medir las longitudes de automviles recin diseados,
4. Medir el peso de granos en un elevador en diferentes puntos de tiempo.

Una va medidos y registrados los datos conunuos se convienen en datos discretos porque se
redondean a un numero discreto. Por tanto. en b pr4ctica casi todos los datos son discretos; sin embargo. el anlisis de datos se facilita mucho si se usan distribuciones continuas en datos que originalrnente eran continuos.
Los resultados de variables altato~ y sus probabilidades asociadas se pueden organizar en distribuciones. Los dos tipos de distribuciones son distribuciones discretas, construidas d variablts a/tato
rias diserttns y distribuciones continuas. basadas en vanablts altaronas co111i1mas. Las distribuciones
discretas incluyen la distribucin binomial, distribucin de Poi son y distribucin hipergeomtrica, Las
distribuciones continuas incluym la distribucin normal, distribucin uniforme, distribucin exponencial, distribucin r, distribucin ji cuadrada y distribucin F. En este captulo vamos a explorar dstribuciones discretas. El capitulo 6 aborda distribuciones continuas.

i2 DESCRIPCIN DE UNA DISTRIBUCIN DISCRETA

Ull.l 5.2

Cmo podemos describir una distribucin discreta~ Una forma es construir una grtfica de la distribucin y estudiar la grfica. En el capitulo 2 se realiz el anlisis de algunos tipos de grtficas que podran
ser suficiente para este trabajo. incluyendo el histograma y polgono de frecuencia. El histograma, o gr4
fica de barras verticales es probablemente la forma de grtfica ms comn para describir una distnbucin discreta. No obstante, algunas distnbuciones contienen resultados slo para cienos puntos de dato$
y dejan un vaco entre valoro. Por tanto. el histograma que se emplea a veces contiene lmeas delgadas
en lugar de barras o rectngulos.
Observe la distribucin discreta de la tabla 5.2. Una ejecutiva es considersda en un viaje de negocios fuera de la ciudad para un viernes dado y reconoce que podra ocurrir al menos una crisis el dia que
salga y est preocupada por esta posibilidad. En la tabla 5.2 se muestra una distribucin discreta que con
tiene el nmero de crisis que podran ocurrir durante el da que salga y la probabilidad de que ocurra
cada nmero. Por ejemplo, existe 0.37 de probabilidad que no ocurra crisis, 0.31 de probabilidad que
haya una, y asl sucesivamente. El hi.tograma de la figura 5.1 describe la distribucin dada en la tabla 5.2.
Ntese que el eje x del histograma contiene los posibles resultados del experimento (numero de cnsis
que podrlan ocurrir) y que el eje y contiene las probabilidades de que stas ocurran.
Resulta evidente en el estudio de la grfica de la figura 5.1, que el numero mis proba
ble de crisis es de O o 1. Adems. podemos ver que la distribucin es discreta y qix no se
muestran probabilidades para valores entre bs cruis de valoro enteros.

Distribucin discreta de sucesos

ee crisis diarias

. , ,.. ,
.37
.ll
.ll
.t/t
,04

.Ol

Media, varianza y desviacin estndar de distribuciones discretas


Qu otros mecanismos se pueden usar para describir distribuc._:io ... ....cm-.. ~
de
describirbs grtficamente? Las medidas de tendencia central y medidas de ''ariabilicbd estudiadas en el capitulo 3 para les datos agrupados pueden aplicar-e a d1S1nbudon~ dscretas para calcular la meda, la -arianz.a y la des'"iacin estndar. Cada una de csu. medida>
descriptivas (meda, ,-aanz y desviacin estndar) se caJcu) en dati agru~
median
te el uso del punto medio de clase como el valor para representar 1o$ datos del intervalo de
clase. Con distribuciones discretas, el uso del punto medio de clase no es necesario porque
el valor discreto de un resultado (O, 1, 2, 3, ) se usa para representarse a >I mismo. Por
tanto, en lugar de usar el valor del punto medio de clase (,\f) para calcular ot~ medidas

144 ESTADISTICA EX LOS NEGOCI~

0.4

Histograma
MINITAB de
distribucin
discreta de datos de
crisis

TABLA 5.3

0.37

C61culo de la media de los


datos de crisis

0.31

0.3

0.18

0.2

0.04

o.o

1
2

IW
.J1

JIO

.JI
11

.JI

o
0.09

0.1

..

2
0.01
1

'

Nmero de crisis

M
..J6
.rt
16

.M
.Ol

.IS

Ilir
fj

JI(&)) - 115
115.W.

descnpuvaspara datos agrupados, se U'.Qn los resultados (x) del experimento discreto. Al calcular e5W
medidas descriptivas en datos agrupados, la frecuencia de cada inten-alo de clase se wa para valorar d
punto medio de clase. Con analsis de distribucin discreta, la probabilidad de cada ocurrencia se wa
como el valor.

Valor medio o esperado


El valor medio o esperado de una distribucin discreta es ti promedioa largo plazo dt sumos. Debemos
saber que cualquier intento de usar una variable aleatoria discreta proporciona wlo un resultado; ~in
embargo, si el proceso se repite suficientemente (el juego se realiza en tiempo suficiente), el promedio
de los resultado es mis probable que se aproxime al promedio a largo plazo, valor esperado o valor
medio. Este valor medio, o operado. se calcula como sigue:
VALOR MfDIO O

ESPERADO DE USA
DISTRlBUCJON
DISCRETA

E(x) ![x P(x)]

donde
E(x)

x
P(x)

= promedio a largo pino


= un resultado

= probabilidad

de ese resultado

Como ejemplo, calculemos el valor medio o esperado de la distribucin dada en la tabla 5.2. Vase
en la tabla 5.3 los valores resultantes. A largo plazo, el nmero medio o esperado de crisis en un viernes dado para esta ejecutiva es 1.15 crisis. Por supuesto, la ejecuti\-a nunca tendr 1.15 crisis.

Varianza y desviacin estndar de una distribucin discreta


La varianza y desviacin estndar de una distribucin discreta se despejan con el uso de los resultados
(x) y probabilidades de resultados [P(x)] en forma semejante a la de calcular una media. Adem. los
lculos de varianza y desviaciones estndar usan la media de la distribucin discreta, Vase la frmula
para calcular la varianza.
VAJUANZADE UNA
DISTJUBUOON
DISCRETA

q2

:Wx

-)2. P(x)]

donde
x
= un resultado
P(x) = probabilidad de un resultado dado

= media

CAPITULO S OISTll1Bl'CIO~E5 OLSCRETAS 14S

tulA

5.4

de varianza V
~nestndar en datos
cnsis

o
.JI
2

.01

(O- Ll5)2 l.3l


(1-115>2. Jl2
<2-115>2 .n
(J-1 15>2. J.42
(4-1.15>2 1.12
(5- 1.15>2. 14.12

La wriama de

(l.J2)(.J7) ..
(UZX.JI) Al
(G.72X lt)

(MJ)(MJ .JI
Cl.12)(.IM)- .J2
04.12X.OU 15
E[~ - 1'>2 P(.)J IAI
= El~p)l ~)J IAI

v-JLiil.19aW1

La...,_adacllra

La desviacin estndar se calcula luego al tomar la rafz cuadrada de la varianza.


Db>1ACJON

EST.o\.,'DA.RDE UNA

u= J~<x-1)2 P(x)I

DISTllBUClON

Dt~
La varianzay desviacin es1.tndar de los datos de crisis de la tabla 5.2 se calculan y muestran en la
tabla 5.4. La meda de los datos de crisis es 1.15 crisis. La desviacin estandar es 1.19 crisis, y la varianza es 1.41.

PROBLEMA DE
DEMOSTRACIN
5.1

Durante una temporada de vacaciones, la loterfa de Texas llev a cabo un juego llamado
Stocking Stuffer. Con este juego, habla premios totales de $34.8 millones al instante en 70 millones de billetes de $1, con precios de billetes de $1 a $1 000. A continuacin observe los diversos
premios v la probabilidad de ganar cada uno de ellos. Utilice estos datos para calcular el valor
esperado del juego, la varianza la desviacin estndar del juego.

Premio l.wl

Probebllidad P(.wl

$1000
100
20
10

.00002
.00063
.00400

2
1

.00601

.02403
.08877
.10479
.77176

Solud6n
La media se calcula como sigue.
Premio l.wl

1tPl.wl

$1000
100
20
10

.00002
.00063
.00400

4
2
1

.02403
.08877
.10479
.77176

o
. -

.00601

Ex Ux P\xJ)

.02000
.06300
.08000
.06010
.09612
.17754
.10479
.00000
Ux P(x)] 60155
60155

La recompensa esperada por un billete de $1 en este 1uego es 60 2 centavos. Si una persona juega durante largo tiempo, puede esperar un promedio de alrededor de 60 centavos en
ganancias.

146 ESTADISTICA E.'\ LOS 1''EGOCI~

A largo plazo, el panicipante perder ms o menos Sl.00 - .602 .398, o sea unos 40 centavos
por juego. Desde luego, un individuo nunca ganar 60 centavos en ningn juego.
Con el uso de esta media, . - .60155, la varianza y desviacin estndar se puede calcular
como sigue.

,.,..,

lt

$1000
100
20
10

.00002
.00063

(1t-

12

(1t - .12. ,.,..,

99879126190
9680.05186
376.29986
88.33086
11.54946
1.95566
0.15876
0.36186

1997595
-22443
.00400
-1.50520
.00601
--0.53067
.02403
--0.2n53
.06877
--0.17360
.10'79
--0.01664
.77t76
--0 27927
Dlx- 1112 PIMll 2898349
~ Dlx )2 PIMll 28.98349

2
1
o

"= J;r = Ju1x - .12 Plxll

J28.98349

= 5 38363

La varianza es 28.98351 (dlares)2 y la desviacin estndar es $5.38.

5.1 PROBLEMAS
S.l Determine la media, varianza y desviacin estndar de la siguiente distribucin discreta.
X

P(x)

3
4

.. 238
290
.1;;
.ISS

.u;

5.2 Determine b media, varianza y desviacin estndar de la siguiente distribucin discreta.


1'!1tl

"o

.IOJ
.11
.246
.229
.13.
.<194
.Oil
.001

2
3
4

5
6
i

S.3 Los siguientes datos son el resultado de un estudio histrico del nmero de defectos encontradCll
en una tau de porcelana producida por una empresa fabricante. Utilice estos datos y las pro
lidades asociadas para calcular el nmero esperado de defectos y la desviacin estndar
defectos.
Dd'tctos

ProbebWdad

.461

.285

.129

3
4

.087
.038

CAPIT\;LO 5 DISTIUJIUOO:"-'E~ Dl~AS

147

S.4 Suponga que 20% de la poblacin de una ciudad prefiere Pepsi-Cola como su refresco favorito. Si
al azar se escoge una muestra de seis personas, el nmero de quienes toman Pepsi podra variar
de cero a seis. A connuacin se ven los posibles nmeros de quienes toman Pepsi en una muestra de seis personas y la probabilidad de que ese nmero de quienes toman Pepsi se presente en la
muestra. Utilice los datos para determinar el nmero medio de quienes toman Pepsi en una muo
tra de seis personas de la ciudad y calcule la desviacin estndar.
Nmtt0 de quienes toman Pq)si

Probabilicbd
262

.393
2
3
4

.246
.082
.OIS

.002
.000

DfSTRIBUCIN BINOMIAL
Qu1 la ms ampliamente conocida de todas las distribuciones discretas es la distribucin binomial,
que se ha empleado durante siglo). Vari.15 suposiciones etn detrs del uso de la distribucin binomial:

El experimento comprende n pruebas idnticas,


Cada prueba tiene slo dos posibles resultados denotado) como wto o fracaso.
Cada prueba e> independiente de las pruebas anteriores.
lo) trminos p y q permanecen constantes en todo el experimento. donde el trmino p es
la probabilidad de obtener un xito en cualquier prueba y el trmino q ( 1 - p) es la pro
babilidad de obtener un fracaso en cualquier prueba.

Como indica la palabra binomial, cualquier prueba individual de un experimento binomial contiene slo dos po ibles resultados, que se marcan como bcito o fracaso. Por lo general, el resultado de
in ters al investigador se marca como txito. Por ejemplo, si un analista de control de calidad busca produetos defectuosos, pod.ria considerar que un producto defectuoso tuviera wto aun cuando la compada no considerarla como wto un producto defectuoso. Si los investigadores estn estudiando personas
zurdas, el multado de encontrar una en una prueba de un experimento es un mto. El otro po'ible
resultado de una prueba en un experimento binomial se llama fracaso. La palabrafriicaso se 11$3 ~en
oposmn a txito. En los experimentos precedentes, un fracaso pod.ria ser obtener una pieza aceptable
(opuesto a una pieza defectuosa) u obtener una persona derecha (opuesto a una persona zurda). En un
experimento de distribucin binomial, cualquier intento puede tener slo dos resultado) posibles,
mutuamente excluyentes (derecho/zurdo. defectuoso/bueno, hombre/mujer, etcttera ).
La distribucin binomial es una distribucin d.screta. En n pruebas, slo x bito) son po,ibJes, doode
x es un nmero entero entre O y n. Por ejemplo, si al azar se seleccionan cinco piezas de un lote. slo son
po)ibles o. l, 2, 3, .o 5 piezas defectuosas en b.l muestra. En una muestra de cinco pieus. obtma
2.714 piezas defectuosas no es posible, ni lo es obtener ocho piezas defectuosas.
En un experimento binomial, las pruebas deben ser independientes. Esta restriccn signifia qix
el experimento por naturaleza produce pruebas independiente> (por ejemplo lanzar al aire monedas o
tirar dados) o el experimento se realiza con restitucin. El efecto del requisito de prueba indepmdlentc
es que p. la probabilidad de obtener un bllo en una prueba, permanece constante de una prueba a oua.
Por ejemplo. suponga que 5% de todas las piezas de un recipiente estan defectuosas,La p:obabilidad
de sacar una pieza defectuosa en el primer intento es p .OS. Si la primera pieza saada no se resntuye, la ~unda pieza que ~ saque no es independiente de la primera. r el \-alor p a.mbW para el
siguiente saque. La distribucin binomial no toma en cuenta p para cambiar de prueba en prueba dentro de un experimento. Sin embargo, si la poblacin o grande en comp.vacin ron d wna1lo muestra!, el efecto de muestrear sin sustitucin es mlnimo y la suposicin de independencia se satisface en
esencia, o decir, p permanece relativamente constante.

148 ESTADISTICA e; LOS SECOCIOS

En general, si el tamal'lo muestral, " e menor a 5% de la poblacin, la suposicin de independencia no e. para inquietarse. Por tanto, el tamao muestra! aceptable para u-ar la distribucin binomial con muestras tomadas sin restitucin es

ti< 5%.'\'
Donde:
t1 tamailo muestra!
N tamallo poblacional

Por ejemplo, suponga que 10% de la poblacin del mundo es zurda y que al azar se selecciona una
muestra de 20 personas de la poblacin del mundo. Si la primera persona selec.cionada es zurda, y el muestreo se realiza sin restitucin, el valor de p = .10 prcticamente no multa afectado porque la poblacin
del mundo es tan grande. Adems, con muchos experimentos la poblacin se reabastece continuamente
incluso cuando se realiza el muestreo. Esta condicin es a veces el caso con muestreos de control de calidad de producto) de lotes grandes de produccin. A continuacin veamo algunos ejemplos de problemas de distribucin binomial.
l. Suponga que una mquina que produce chi~ de computadora produce 6% de piezas defectuosas, Si una compaa compra 30 de estos chip~ cul es la probabilidad de que ninguno ~
defectuoso!
2. Un estudio de hica sugiere que 84% de las compailas en E>tad06 Unido tienen cdigo de tica.
De una muestra tomada al azar de IS companas, cu.\l e> la probabilidad de que al meno. 10
tengan un cdigo de tica?
3. Suponga que la marca X de bateras para automviles tiene una participacin de 35% del mercado. Si al azar se seleccionan 70 automviles, cu.\l es la probabilidad de que al menos 30
automviles tengan una batera de la marca X?
4. Un estudio encontr que casi 67% de agentes de compras de una compailla dijeron que su
compaia tena programas para compradores preferidos. Si al azar se toma una muestra de
SO comparuas, cu'1 es la probabilidad de que 40 o ms tengan compailias con programas para
compradores preferidos?

Resolucin de un problema binomial


Un estudio de reubicacin de administradores hecho por Runzheirner International permiti ver \"ari.u
razones por l.u que los trabajadores se niegan a aceptar ofertas de reubicacin. En la lista estn inclu
das coasideraciones de familia, razone financieras y otras. de
cuales 4% de quienes contestaron
dijeron que rechazan ofertas de reubicacin porque reciban muy poca ayuda para su reubicacin,
Supor.p.mos que cinco trabajadom que acaban de rechazar ofertas de reubicacin se seleccionan al
azar y son entrevistado . Si se supone que 4% se cumple para todo lo> trabajadores a quienes se ofrece
rtubicacin. cul es la probabilidad de que el primer trabajador entrevistado rechace la oferta debido
a la poca ayuda que recibi para su rtubicacin y los siguientes cuatro trabajadores rechacen la oferta
por otra> razones?
Representemo con T la poca ayuda para su reubicacin y con R otras razones. La secuencia de
entrevistas para este problema quedara como sigue:

''

T. Rz, R,, ~. R~
la probabilidad para obtener esta secuencia de trabajadores se calcula con la regla especial de la
multiplicacin para eventos independientes ($i se supone que los trabajadores se seleccionan independientemente de una gran poblacin de trabajadores). Si 4% de 105 trabajadores que rechazan ofertas <k
reubicacin lo hacen porque reciben muy poca ayuda, entonces la probabilidad de que una persona
seleccionada al azar y que rechace ofertas de reubicacin por ba razn es O.o.&, que es el valor de p. El
otro 96% de lo trabajadores que rechacen ofertas de reubicacin lo hacen por otras razones, Por tanto,
la probabilidad de seleccionar al azar un trabajador que rechace ofenas de reubicacin por otras razones quedara entre 1 -O.o.& ... 96, que es el valor de q. la probabilidad de obtener e$la secuencia de
cinco trabajadores que han rechazado ofertas de rtubicacin ~ria:
P(T1

n R2 n RJ n ~ n R5>

(.o.&)(.96)(.96)(.96)(.96> = .03397

CAJ>m.11.0 S DbTIUBOOOSES DISCRETAS

149

Ob\iammte, en la sckccin al aur de trabajadores que rechazaron ofertas de reubicacin, debido a que
recibieron muy poca ayu~ para su reubicacin podra ser el segundo trabajador o el tercero o el cuarto
o el quinto. A continuacin \UJnOStodas las ~iblcs secuencias para obtener un trabajador que rtdwa
ra la reubicacin por la poca ayu~ que recibi y cuatro trabajadores que la rechazaron por otras razone>

T. R2. R3, R.. s,


R, T2. R3, R.. Rs
R, R2, T3, R.. Rs
R1, R2. R,, T4, Rs
R, R2, R3, R.. r,
La probabdidad de que cada una de estas secuencias se presenta se calcula como sigue:
(.04)(.96)(.96)(.96)(.96)
(.96)(.04)(.96)(.96)(.96)
(.96)(.96)(.04)(.96)(.96)
(.96)(.96)(.96)(.04)(.96)
(.96)(.96)(.96)(.96)(.04)

- .03397
- .03397
... 03397
- .03397
- .03397

Ntese que en cada caso la probabilidad final es la misma. Ca~ una de las cinco secuencias tienen
el producto .04 y cuatro veces .96. La propiedad conmutativa de la muluplicacin toma en cuenta el
reordenamiento de las cinco probabilidades individuales en cualquier secuencia. Las probabdades
en eada una de las cinco secuencias pueden reordenarse y resumirse como (.04)1(.96). Cada secuencia
contiene las mismas cinco probabilidades, lo cual hace innecesario \'OIVl!r a calcular la probabilidad de
cada secuencia. Lo que sf es imponante es determinar CI!ltaS deferencias de secuencias se pueden formar y multiplicar con esa cantidad por la probabilidad de que se presente una secuencia. Para las cinco
secuencias de este problema, la probabilidad total de obtener exactamente un trabajador que rechace la
reubicacin por la poca ayu~ recibida para su reubicacin, en una muestra aleatoria de cinco trabajadores que rechazaron ofertas de ubicacin es:
5(.04)1(.96)4 - .16985
Una forma ms fcil de determinar el nmero de secuencias es realizar una lista con todas las posibilidades y usar combinaciono para calcularlas. (El concepto de combinaciones se introdujo en el capltulo 4.) Cinco trabajadores se muestrean, entonces n 5 y el problema es obtener un trabajador que
rechaz una oferta de reubicacin debido a la poca ayu~ recibida para su reubicacin, x 1. Por tanto,
,.Cx dar el nmero de formas posibles para obtener x itos en n intentos. Para este problema, 5C1 es
el nmero de secuencias de posibilidades.
5!
sC1 = l!(5 _ !)! = 5
Al ponerle un valor a la probabilidad de una secuencia con la combinacin se obtendr.
5C1(.04J(.96)

= .16985

Cuando se usan combinaciones se simplifica la determinacin de las secuencias que son posibles
para cieno valor de x en una distribucin binomial.
Ahora suponga que 70% de los estadounidenses piensan que limpiar el medio ambiente es un problema importante. Cu.ti es la probabilidad de muestrear al aur cuatro estadounidense) r tener aactameme dos que digan que limpiar el medio ambiente es un problema importante? Representereos por
E el bito de obtener una persona que piense que limpiar el medio ambiente es un problenu in:por
tante. Para este ejemplo. p .70. Representemos por N el fracaso de no obtener una persona q\lt piense
que limpiar es un problema importante (N denota no importante). La probabilidad de obtener um &
estas personas es q .30.
Ahora veamos las diversas secuencias para obtener dos E en una muestra de cuatro.
E,, E2. N,, N4

E,, Nz, E,, N4

E,, Nz, N3, f.


N1, Ez, E,, N4
N1, E2, N,, E.
N1, N2, E3, f.

ISO ESTADISTICA E." ~Nl!GOCIO:.


~
~xilO) en una muestra de cuatro pueden ocurrir en seis formas. Con el uso de combinaciones,
el numero de secuencia> es

La probabilidad de seleccionar cualquier secuencia individual e :


(.70)2(.)0)2 - .04-41
Por umo, la probabilidad tolal de obtener exactamente dos personas que piensen que limpiar el
ambiente es importame,de cuatro personas seleccionadas al azar, cuando 70% de los estadounidenses
piensan que limpiar el ambiente es importante, seria:

4C2(.70J2(.30)2 .2646
Si generalizarnos a panir de estos do) ejemplos obtenemos la frmula binomial, que se puede usar
para resolver problemas binomiales.

FRMVl.A
BlNOMIAL

P(xl ftCx

donde
11

nmero de

n'
r q"-"- -- r 'l"-"
xl(n - xi!

intentos (o nmero que se muestrea)

x nmero de xitos deseado


p probabilidad de obtener un xito en un intento
q 1 - p probabilidad de obtener un fracaso en un Intemo
La frmula binomial resume los pasos presentados hasta aqu para resolver problemas binomiales.
La frmula permite la solucin rpida y eficiente de esto problemas.

PROBLEMA DE
DEMOSTRACIN

- ...,
)

El estudio de Gallup analizado en el Dilema de decisin encontr que 65% de los consumidora
financieros estaban muy satisfechos con su institucin financiera principal. Si esta cifra todevi.
se cumple, suponge que al azar se muestrean O consumidores financieros. Cul es la probabilided de que exectamente 23 de los O estn muy satisfechos con su insutucin finenciera principal?
Solud6n
El valor de pes .65 (muy satisfechos). el valor de q 1 - p 1
.65
.35 (no muy satisfechos!,
n O y x 23. Con la frmula binomial se obtiene la respuesta final:

.oC23(.65)23(.35)11 - 188732378800)(.0000'9775)(.000000018)

.078

Si 65% de los consumidores financieros estn muy satisfechos, alrededor de 7.8% del
tiempo el investigador obtendrla exactamente 23 de los o consumidores finencieros que estan
muy satisfechos con su institucin financiera. Las probabilidades estn contra obtener 23 de los
consumidores financieros que al azar estn muy satisfechos con su institucin financiera
Cuntos consumidores muy satisfechos serla posible obtener en O consumidores financieros
seleccionados al azar? Si 65% de los consumidores financieros estn muy satisfechos con su ins
litucin financiera principal, uno esperara obtener alrededor de 65% de O o sea (.65HO> O 2!
consumidores financieros muy satisfechos. En cualquier muestra individual de O consumidores
financieros, el nmero de los que estn muy satisfechos es probable que difiera de 26. En promedio. el nmero esperado es 26. Un investigador que de
obtenga 23 consumidores fina!\o
cieros muy satisfechos puede ver este nmero en vista de los 26 que esperarla.

'

'

PROBLEMA DE
DEMOSTRACIN

5.3

Segn el U.S. Census Bureau, aproximadamente 6% de los trabajadores en Jackson, Mississippt.


estn desempleados. Al llevar a cabo una encuesta al azar y por te16fono en Jackson, cul es la
probabilidad de obtener dos o menos trabajadores desempleados en una muestra de 207

CAPITULOS OlSTlUBUOO'-"ESOl~AS151

Soluc:l6n
Este problema debe resolverse como la unin de tres problemas:
1) cero desempleados, x O
21 un desempleado, x .. 1
31 dos desempleados, x 2.
En cada problema, p .06, q .94 y n 20.
De la frmula binomial se obtiene el siguiente resultado:

xO

20Co!.06)0(.94)20
.2901

XM1

+
+

20C1(.061(.94) 11
.3703

x2
20C21.06)2(.94)18
2246

- .8850

Si 6% de los trabajadores de Jackson, Mississippi, est6n desempleados, el encuestador por


telfono obtendrla cero, uno o dos trabajadores desempleados 88.5% del tiempo en una mues
tra aleatoria de 20 trabajadores. El requisito para obtener dos o menos se satisface al obtener
cero, uno o dos trabajadores desempleados. Entonces, este problema es la unin de tres proba
bilidades. Siempre que se use la frmula binomial para resolver xitos acumulativos (no un
nmero exacto), la probabilidad de cada valor x debe resolverse y sumarse a las probabilidades.
Si un estudio real produjo tal resultado, servirla para validar las cifras del censo.

Uso de la tabla binomial


Cualquier persona que resuelva suficientes problemas binomiales empezar a reconocer que la proba
bilidad de obtener x '"' 5 xitos de un tamao muestra! den 30 cuando p
.10 es la misma sin
importar si los cinco xitos de personas zurdas, piezas defectuosas. compradores de marca X o cualquier otra variable. Si la muestra comprende personas, piezas o productos no impona en trminos de
las probabilidades finales. La esencia del problema es la misma: n 30, x 5 y p .1 O. Al reconocer
este hecho, expertos matemticos construyeron un conjunto de cuadros binomiales que contienen probabilidades resueltas previamente.
Dos parmetros, n y p, describen o caracterizan una distribucin binomial. Las distribuciones
binomiales en realidad son una familia de distribuciones. Todo valor diferenteden y/o todo valor dife
rente de p proporciona una distribucin binomial diferente,y existen cuadros para varias combinaciones de valores n y p. Debido a limitaciones de espacio, los cuadros binomiales presentados en este texto
son limitados. La tabla A.2 del Apndice A contiene cuadros binomiales, cuadros encabezados por un
valor den. Nueve valores de p se presentan en cada con la tabla tamao n. En la columna situada abajo
de cada valor de p est la distribucin binomial para esa combinacin den y p. La tabla 5.5 contiene un
segmento de la tabla A.2 con las probabilidades binomiales para n 20.

P!OILEMA DE

JIEMOSTRACIN
5.4

Resuelva la probabilidad binomial para n


Apndice A.

20, p .40 y x 10 con el uso de la tabla A.2,

Solucl6n
Para usar la tabla A.2. primero hallamos el valor de n. Como n 20 para este problema se puede
usar la parte de los cuadros binomiales que contienen valores para n 20 represen-.-d en la
tabla 5.5. Una vez localizado el valor de n, busque el valor apropiado de p horilona!memeen
la parte superior dla tabla. En este problema, p M .40. La columna bajo O contiene las proba
bilidades para la distribucin binomial den - 20 y p 40 Para obtener la probablidad de x 10,
encuentre el valor de x en la columna de la extrema izquierda y localice la probabilidad en el euadro la interseccin de p .40 y x 10. La respuesta seria 0.117. Si se resuelve este problema
con la frmula binomial se obtiene el mismo resultado.

'

152 ESTADISTICA E.~ l..05 !'IE(;()(.'IOS

PROBLEMA DE
DEMOSTRACIN
5.5

Segn lnformation Resources, la cual publica datos sobre participacindel mercado para varios
productos, Oreos controla alrededor de 10C!I. del mercado de marcas de galletas. Suponga que
de la poblacin se seleccionan al azar 20 compradores de galletas. Cu61 es la probabilidad de
que menos de cuatro compradoresescojan Oreos?
Soludn
Para este problema. n 20, p .10 y x < 4. Como n 20, la parte de los cuadros binomiales
representadaen la tabla 5.5 se puede usar para resolver este problema. Busque a lo largo de la
fila de p valores para 0.10. Determinar la probabilidad al obtener x < 4 comprende sumar las
probabilidades para x O, 1, 2 y 3 Los valores aparecen en la columna x en la interseccin de
cada valor 1<Y p
10.
Velo."

1
2
3

.122
.270
.285
.190

lx< 4) .857

S 10% de todos los compradores de galletas prefieren Oreos y 20 compradoresde galletas se


seleccionanal azar,alrededorde ~.7% del tiempo menos de cuatro de los 20 seleccionarn Oreos.

Uso de computadora para producir una distribucin binomial


E.ud y MINITAB se pueden usar para producir la. probabildado para prcucamentecualquier distribucin binomial. Estos programade computadora ofrecen incluso otra opcin para resolver problmw bnomiale, ademh de usar la frmulabinomial o los cuadros binomiales. En realidad, los
paquetes de computadora en efecto imprimen lo que seria una columna de la tabla binomial. Las ven
taps de usar paquetesde cstad~tca para este fin son la comodidad (s no '<e dispone fcilmente de los
cuadros binomialesy de una computadora)y el potencial para generarcuadro>para muchosms valores que los impreso>en las cuadros binomiales.
TABLA 5.5
E1<tracto de la tabla A.2,
Apndice A

lO

o
1

2
3
4
5
6
7
8
9
10
11
12

14
15
16
17
18
19
20

.1
.122
.270
.215
190
090
.032
.009

.l

.ou
.851

.137
.205
.218
.175

.002
.000

.109
.055
.022

.000

.O<fl

.000

.002

.000

.000
.000
.000

.000
.000
.000
.000
.000
.000
.000
.000
.000

.000
.000
.000
.000
.000
.000
.000

- - - -..- -... .... - .....


... ... ........ ........
...
.-. ...... ~..
..
- ...... ..... ;~
..-... - -..- -- ... -

.J
.GOi

JlllO

Jl2I

.oos

m
.uo

.179
.192

.4

.5
JlllO

.012

.000
.001

.QJ5

.G05

.u.

.015
.llS7

..,,

.G65
.oJl

.160
.U7

.UD
.160
176

.001

.015

1114

.ou

.000
.000
.000

..,.
....

.7

.000
.G01

M!f1

.115

...,,

"11
.117

.IDO
AllO

.111 '.'W
...

.-.:...-

.,,
.124

.cm

.012

JlllO

.IDO
.IDO

JlllO

Jll5

M6

.114

" .w JIOO..
1

.179
.1'9
612

.,

JD2

.21'

.,

.Z7t

.012

.m

CAPtrul.O

S 015TIUBUOO!'-'I~ DISCRETAS

153

Por ejemplo, el estudio de dientes bancarios presentado en el Dilema de decisin indic que 64%
de todos los consumidores financiero piensan que los bancos son ms competitivo hoy de lo que fue.
ron hace cinco aflos. Suponga que al azar se seleccionan 23 consumidores financien y deseamos dererminar las probablidades de que ocurran varios valores x. La tabla A.2 del Apndice A no podra ~
porque esn incluidos slo nueve valores p diferentes y p .64 es uno de esos valores, Adem, n
23 no se incluye en la tabla. Sin la computadora, quedamos con la frmula binomial como la nica
opcin para resolver problemas binomiales para n 23 y p .64. Particularmente si se formulan las
preguntas de probabilidad acumulativa (por ejemplo. x s 10), la frmula binomial puede ser una
forma tediosa de para resolver el problema.
En la tabla 5.6 se muestra la salida de MINJTAB para la distribucin binomial den 23 y p .64.
Con esta salida de computadora, un investigador podra obtener o calcular la pro!nbilidad de cualquier
ocurrencia dentro de la distribucin binomial den 23 y p .64. La tabla 5.7 contiene salida MJNITAB
parad problema binomial en particular, P(x s 10) cuando n 23 y p .64, resueltos con el uso de la
funcin de probabilidad acumulativa de MINITAB.
En la tabla 5.8 se muestra la salida Excel para todos los valores de x que timen probabilidade
mayores de .000001 para la distribucin binomial analizada en el problema de dem~cin 5.3 (n 20,
p .06) y la solucin a la pregunta formulada en el mismo problema.

Media y desviacin estndar de una distribucin binomial


tllLA 5.6
~

MINITAB para la

bucin binomial de
- 23. p

6'

P(S :a)

......

0.0000

o .....

....

O.tOOO
0.0000
0.0000

. oo
1.00

.oo
.oo
.oo
oo
.00

.oo
.00

.oo

o.om
o.otn

O.OMO

O.UM
0.1 ..
0.1712
0.1512
0.1114

"
o.UOt

.....

.oo

O.tNO

.oo

TABLA S.7
Salida MITAB para el problema binomial,
P{x! ,. 10 n 23 y p
.64

maannrn
t..Cel

D 23 f p 0.6'0000

e<

11.00

a)

0.0357

o ...

0.0031
0.0090

00
.00

.oo

Una distribucin binomial tiene un valor esperado o un promedio de largo plazo que se
denota con. El valor de se determina con t1 p. Por ejemplo, sin 10 y p .4. entonces t1 p ( 10)(.4) 4. El promedio a largo plazo o valor esperado ~ignifica que, si se
muestrean n arnculos una y otra vez durante largo tiempo y si pes la probabilidad de obtencr un xito en un intento, el nmero promedio de xites por muestra ~ espera que ~
n p. Si 40% de todos los estudiantes graduados de administracin se seleccionan muchas
veces, la expectativa es que, en promedio, cuatro de los 10 estudianres sean muieres.

0.0110

TABLA 5.8
Salida Excel para el problema de demostracin 5.3 y la
distribucin binomial de n 20, p .06

ProblJd
02901
03703
02248

e.ozaa

l "9
IS

ta

l'r

"o
1

n.'\IUD

ta

nnnn<>

0.0001

l4A

"""""

'"12

nn<UU\

e;

CI

"""""x s

Th nrobabilirv

1
1
2 when

20 and

1
1

a .Ofl is: 0.8850

IS4 ESTADl$TICA EN LOS NEGOCIOS

MEDIAY
DESVlAOOS

ESTANDAR DE UNA
DISTJUBUOOS
811'\0\11A1

Al examinar la media de una distribucin binomial multa una opinin intuitiva acerca de la probabilidad de un resultado dado. Por ejemplo, supongamos que lo invesugadore generalmente estil:
de acuerdo con que 10% de todu IOb pe~n~ son 1urd~. t\o obstante, supongamo. que una invesugadora piensa que, como ya otros lo han expresado, esta cifra es mh alta para nm< que nacen de mujem de m.U de 35 allo.. En un intento por reunir cvidenciu, ella $Clccona al uar 100 nitlo que
nacieron de mujeres de m de 35 at\os y 20 de eUos multaron $Cr zurdos. Es probable que eUa ebtuviera 20 zurdos en una muestra de 100? Cu.intos debiera haber esperado obtener en una muestra clt
100? El valor medio o esperado paran 100 y p .10 es ( 100)(.10) 10 zurdo . ~ 20 niflo. zurdo&
de la muestra de 100, ocurrieron al aur o la investigadora es sacando dat< de una poblacin diferente que la poblacin general que produce 10% de zurdos? Ella puede invntigar m.b este multado
examina ~ probabilidades binomiales para este problema. No obstante, la media de la distribucin k
da un valor esperado del cual trabajar.
SegUn un estudio, 64% de todo, los consumidores financieres piensan que los bancos son m
compcuti~ hoy de lo que fueron hace cinco atlo>. S1 al aur se seleccionan 23 coruwnidom finannos.
cu.ti es el numero esperado que piensan que I< bancos son mh competitivo hoy de lo que fuerce
hace cinco afio,? te problema se puede describir por medio de una distribucin binomial de n ~
y p .64 dada en la tabla S.6. La media de esta distribucin binomial da el valor esperado para este
problema.
n p

23(.64) 14.72

A l;argo plazo, '' al uar se seleccionan 23 consumidores financi~ una y otra va y ,i en \'tfdad
64% de todos 105 consumidores finandero' piensan que lo' banc< son m competiti~ hoy, entonces d experimento dcbtt promediar 14.72 consumldores de 23 que piensen que IOl bancos 10n m
compctitiVQj hoy. El lector debe darse cuenta que como la distribucin binomial es una distribuci!l
ducrct1, nunca obtendr en realidad 14.72 personas de 23 que piensan que lo banco' son m.b compet1th'O, hoy. La media de la distribucin dea ver la relativa probabilidad de cualquier ocurrencia indl
\idual. E.x&mUle la tabla S.6. Nte$C que las mh altas probabilidades son aquellas cerca de x 14 7?.
P(x 15) .1712, P(x 14) .1605 y Ptx 16) .1522. Todas las otras probabilidades p.ira csu
distribucin son menos que estas probabilidades.
La desviacin estndar de una distribucin binominal se denota a y es igual a '-'" p q. Para e!
ejemplo de zurdos. a ~ \/100(.10)(.90) 3. La desviacin est.indar para el problema de consumidores financien descrito por la distribucin binomial de la tabla 5.6 es

TABLA 5.9

Probabilidades para tres


distribuciones binomiales

...
..
.

...

n8

, , a:. ,..
,

t. ,.....
l

2
J

.....-..

1671
."'5

.JtJI

.5

..-

.-

...

12

........
..2.... ,,.,....
.2117
.2nl
.lle'

11

.cmn

.JtJI

~-

\.

23)(.64)(.36) 2.30

El captulo 6 muestra que algunas dutribuciones binomiales son casi en forma de campana y puede calcularse con el u~ de la curva normal. La media y desviacin esndar de
una distribucin binomial son las herramientas usadas para convertir estos problemas
binomiales en problemas de curva normal.

Graficacin de distribuciones binomiales


La grfica de una distribucin binomial se puede construir con el uso de todo> los posibles
valores de x de una distribucin y sus probabilidades asociadas. Lo.. \'alores x suelen gr 1:.
earse a lo largo del eje x y las probabilidades $C grafican a lo largo del eje y
la tabla S.9 es una lista de w probabilidades para tres diferentes cfutribucioncs binomiales: n 8 y p .20, n 8 y p .50, y n 8 y p ... 80. La figura S.2 muestra grif1CB
Excel para cada una de estas tres distribuciones binomiales. Observe cmo es que la forma
de la distribucin cambia cuando el valor de p aumenta. Para p .SO, la distribucin es
simtrica, Para p .20 la distribucin ~ sc-gada a la derecha y para p .80 la distribocin esl.i sesgada a la izquierda. Esta figura es lgica porque la media de la cliwib

1.:-11.t ..

Distnbucin binomial: " - a y p - .20

~.:cas Excel para


distribuciones
CIOOlniales con

O.JS

O.J

0.2S

ct

O.IS

0.2

0.1

o.os
o

4
Valornx

DUtnbucin binomial: n S y p .SO


0.2S

~-

0.2
O.IS
0.1

o.os

4
Valornx

Distribucin bi.nornial: n 8 y p .80

O.JS
O.J
-o

0.2S

"

0.2

O.IS
0.1

o.os

4
Valornx

156 ESTADISTICA El' LOS NEGOCIOS


binomial n = 8 y p = .SO es 4, que est en el medio de la distribucin. La media de la distribucin n ,..
y p .20 es 1.6, que resulta en las ms altas probabilidades cerca de x 2 y x .. 1. Esta grfica t"
un pico al principio y se alarga hacia los valores ms altos de x. La media de la distribucin n =
p e.. .80 es 6.4, que resulta en las ms altas probabilidades cerca de x .. 6 y x 7. Entonces, el pico
la distribucin e~t ms cerca de 8 que a O y la distribucin se estira hacia x ... O.
En cualquier distribucin binomial el valor ms grande de x que puede ocurrir es n y el valor
pequeo es cero. Por tanto, la gr.tfica de cualquier distribucin binomial est restringida por cero y
Si el valor p de la distribucin no es .SO, esta restriccin resultara en que la grafica"se apila" en un~
mo y est sesgadaen el otro extremo.

PROBLEMA DE
DEMOSTRACIN
5.6

Una compal\la fabricante produce 10 mil tarros de plstco por semana. Esta compallla sun.nistra tarros a otra compallla, que los empaca como pane de juegos para dia de campo.
segunda compallla al azar muestrea 10 tarros enviados del proveedor. Si dos o menos de
tarros muestreados son defectuosos, la segunda compal\a acepta el lote. Cu61 es la proba
dad de que el lote sea aceptado si la compaia fabricante de tarros en realidad est producie
tarros que son 10% defectuosos? y 20% defectuosos? y 30% defectuosos? y 40% defectu
Solucin

En esta serie de problemas binomiales, n = 10, x:s 2, y pvaria de .10 a .40. De la tabla A.2 y acu
lando los valores tenemos la siguiente probabilidad de x s 2 para cada valor p y el valor
rado ( n pi.
p

Lote ec.pt.clo
P(x"' 2)

.10
.20
.30
.40

.930
.677
.382
.167

Nmo npllf8do
de defectos ()

1.0
2.0
3.0
4.0

Estos valores indican que si la compaia fabricante est produciendo 10% de tarros d
tuosos, la probabilidad es relativamente alta (.930) de que el lote sea aceptado por probabir
Para valores ms altos de o. la probabilidad de aceptacin del lote por probabilidad se red
Adems, cuando p aumenta, el valor esperado se aleja de los valores aceptables, x s 2.
movimiento reduce las probabilidades de aceptacin del lote.

52 PROBLEMAS
5.5 Resuelva los siguientes problemas con el U$O de la frmula binomial.
a. Si" 4 y p"' .10, encuentre P(x 3).
b. Sin 7 y p
.80, encuentre P(x 4).
c. Sin -= 10 y p .60, encuentre P(x 2 7).
d. Si n ., 12 y p "" .45, encuentre P(5 :S x :S 7).

=
=

5.6 Resuelva lo) siguiente) problemas con el U$O de los cuadros binomiales (vtase la tabla A.2).
a. Sin .. 20 y p .SO, encuentre P(x"" 12).
b, Si n = 20 y p ... 30, encuentre P(x > 8).
c. Sin "' 20 y p = .70, encuentre P(x < 12).
d. Sin = 20 y p = .90, encuentre P(x :S 16).
c. Sin= 15 y p = .40, encuentre P(4 :S x :S 9).
f. Si"
10 y p = .60, encuentre P(x 2 7).

5.7 Despejela media y desviacin estndarde las siguientes distribuciones binomiales.


a. n = 20 y p .70
b. n 70 y p .35
c. n = 100 y p .SO

CAPfnJlOS DlmuBUOO~CSDISCRFT...S 15i

S.8

Utilice 10$ cuadros de probabilidad de la tabla A.2 y trace la grfica de cada wu de bs sigmmtes
distribuciones binomiales. Ano1e en la gr6ca el lugar donde cae la di.nn'bucin.

n 6yp= .70
b. n20yp.50
c. n8yp.80
5.9 La revista Purchasing(Compras) report los resuliado. de un estudio en el que a compradores se
les hace una serie de pregun1as respecto al uso de Internet. Una pregunta era de cmo uQ.ffan b
Internet si pudieran resolverse la seguridad y otros problemas. Setenta y ocho por ciento dijeren
que la usarfan para conocer informacin de precios, 75% dijo que la usaran para enviar rdenes
de compra, y 70% dijeron que la usarfa para reconocimientos de rdenes de compra. Suponga
que estos porcentajes se cumplen para iodos I~ compradores. Un investigador muestrea al aur
20 compradores y les pregun1a cmo usaran la Internet ~i pudieran resolverse la seguridad r
otros problemas.

L Cul es la probabilidad de que exactamente 14 de estos compradores usaran la Internet para


informacin de precios!
b. Cul es la probabilidad de que todos los compradores usaran la Internet para enviar rdenes de compra?
c. Cu! es la probabilidad de que menos de 12 usaran la Internet para reconocimientos de rdenes de compra?
S.10 Th \\\:d/ Srrttr loumal report algunas etadi>liCb interesantes sobre el mercado de trabajo. Una
esiadtica es que 40% de iodo. los trabajadores dicen que cambiaran de 1rabajo por una paga
ligeramente ms alta': Adem.h, 88% de las compaas dicen que hay escasea de candidatos calificados. Suponga que 16 trabajadores se seleccionan al azar y se les pregunta si cambiaran de Ira
bajo poruna paga ligeramente ms al1a': Cu.il es la probabilidad de que nueve o mis di~ran que
si? ~les la probabilidad deque tres.cuatro.cineo o seis dijeran que si? Si se consulta a 13 compaflias, cu.ti es la probabilidad de que exactamente 1 O digan que hay escasa de candidatos cali
ficad<? Cu.ti es la probabilidad de que todas las companw digan que hay escasez de candidat0$
cali6cados? Cul es el nmero esperado de companias que drlan que hay C$CUCZ de candidatos cali6cad~?
S.11 Un nmero creciente de consumidores piensan que deben estar atento en el mercado. Segn un
estudio realizado por la Yankelovich Partners para la revisia USA WEEKEND. 60% de todos IO$
consumidores han llamado a un nmero de telfono 800 o 900 para informacin acerca de al~
producto. Suponga que una muestra alea1oria de 25 consumidores son entrevistados acerca de
US hbitos de compras.
L Cu! es la probabilidad de que IS o ms de estos consumidores hayan llamado a un numero
de telfono 800 o 900 para informacin acerca de algn producto?
b. Cul es la probabilidad de que m.is de 20 de estos consumidores hayan Uam.1do a un numero de telfono 800 o 900 para informacin acerca de algn producto?
c. Cul es la probabilidad de que menos de 10 de estos consumidores hayan llamado a e
nmero de telfono 800 o 900 para informacin acerca de algn producto?
L

S.12 Grafique la distribucin del problema 5.11. Para qu valores de x son m.ts alus las~des? Determine el valor esperado de esta distribucin. Cmo o que el valor cspendo K compara con los valores de x que tienen las probabilidades m.h alta>? Calcule la desviacin cs::ldz:..
Determine el intervalo :!: 2'7 para esta distribucin. Entre cules dos valores de x es eu
oten-alo? Cul es el porcentaje de valores dentro de este intervalo? Cmo se ~
esta respuesta con lo que darfa el teorema de Chebyshev o la regla emprica presentada en d
l?
S.13 En los pasados aftO$ recientes, realizar operaciones por comrato en el cxtran.icro se hi bccbo ~
frecuente que nunca an1e. en compaas estadounidenses, No obstante. rnbzu ~DO
ot.i libre de problemas. Un estudio reciente de la revista Purdiasing {Compras m&a que 20'!&
de las compailas que realizan operaciones por contrato en el extranjero ~
cc:=!:o:l'C$.
Suponga que al azar se seleccionan IS compailla. que realizan operaciones por cc:::ua:c.
L (Cu.ti es la probabilidad de que exactamente cinco compatlias que raliu.:1 opaaooocs por
contrato en el extranjero usen un consultor?

1 S8 ~TADlSTICA E,'1 LOS ~EGOCIOS

b. Cual o la probabilidad de que nueve compai'l(a) que ittlun operaciones por contrato en d
extranjero usen un consultor?
c. Cual o la probabilidad de que ninguna de las compallia) que realizan operadono
trato en el extranjero use un consultor?

por con

d. Cual a la probabilidad de que entre cuatro y siete (inclusive) compmas que ruliun opera
clones por contrato en el extranjero usen un consultor?
e. Construya una grfica para esta distribucin binomial. En vista de la grfica y el valor espera
do, aplique por qu la probabilidad resulta de haber obtenido las panes (a) a la ( d t.
S.14 Segn Cerulli Associates of Boston, 30% de todos lo) asesores financieros (contadores pblicos
titulados, CPT) tienen un promedio de tama.l\o de cliente entre S500 mil y un milln. Tienen
34911 un promedio de wnlilo de cliente entre uno y SS millones. Suponga que existe una li>u
completa de todos los asesores 6nancieros (CPT) y que de la lista al azar 18 se seleccionan.
L Cu.ti o el numero esperado de asesores financiero. (CPT) que tienen un promedio de tama
!lo de diento entre S500 mil y un milln? Cual es el nmero esperado con un promedio dt
tamao de clientes entre uno y $5 millones?
b. Cual es la probabilidad de que al menos ocho uaores financiero. ( CPT) tengan un promedio de wnano de diente entre $500 mil y un milln?
c. Cujl es la probabilidad de que dos, tres o cuatro asesores financiero) (CPT) tengan un promedio de wnano de cliente entre uno y SS millones?
d. Cul es la probabilidad de que ninguno de lo) a~res financiero) tiene un promedio dt
tamano de cliente entre $500 000 y SI milln? Cu.ti es la probabilidad de que ninguno tenga
un promedio de wnatlo de cliente entre SI milln y SS millones? Cual probabilidad o mis
alta y por qu!

5.4 DISTRIBUCIN DE POISSON


La dmnt>uaOn de Poisson es otra distribucin discreta; recibe ese nombre en honor a Simeon-Dena
Poisson (J; 1-1840), matemtico franc que public I~ puntos esenciales de esta d>,tribucin en un
articulo tcnico en 1837. La distribucin de Poisson y la distribucin binomial tienen algunas semeja01u. pero tambin algunas diferencias. La distribucin binomial describe una dimibucin de dos
posibles resultad0$ designados como xitos o fracU06 de un nmero dado de imentos. La distribue
de PoiJM>n st concentra !()/o tri ti nunrtro dt s11cts0s discretos sobrt 11/gn inttrWllo o seri cor111nuo. Uc
experimento de Poi510n no tiene un nmero dado de intentos (n) como lo tiene el experimento binomial. Por eiemplo, mientru que un experimento binomial podra usarse para determinar cuinto autlll
hecho' en &tado) Unido, e)tn en una muestra aleatoria de 20 auto., un experimento de ~wo:i
podra enfocarse sobre el nmero de autos que al azar llegan a un taller de servicio durante un mtervalo de 10 minutos.
La distribucin de Poisson describe la ocurrencia de eventos poco comuna. De hecho, la frmtda
de Poisson se ha atado como la ley de eventos improbablts. Por ejemplo, los accidentes serios en una
planta de productos qutmico) IOn poco comunes, y el nmero por ma podra ser descrito por la b
tribucin de Poisson, A veces la distribucin de Poi,<on se utiliza para describir el numero de llegadj
aleatoriu por algn intervalo, Si el numero de llegadas por intervalo ~ dema,iado frecuente, el ntervalo se puede reducir lo uficiente para que se espere un nmero poco comun de eventos, Otro tjem-plo de una distribucin de Poisson C) el numero de llegadas aleatorias de clientes por intervalo de ciDQI
minutOJ a una pequea boutique en las mananas de dlas hbiles.
La distribucin de Posson tambin tiene aplicacin en el campo de ciencias admanistrati~. lci
modelos empleados en la teora de colas (teora de lineas de espera) por lo general estn basado) en
supcscin de que la distribucin de Poisson es la distribucin apropiada para describir porcentaia de
llegadas aleatorias en cieno periodo.
La distribucin de Poisson tiene las siguiente) caractersticas:
Es una distribucin discreta.
Describe eventos poco comunes.

CAPnvLO S DlSTRlllUOO~"iS DISCRETAS 159

Cada ocurrenciaes independiente de los otros sucesos.


Describe sucesos discretas sobre una serie connnua o intervalo.
Los sucesos en cada intervalo pueden variar de cero a infinito.
El nmero esperado de suceso) debe mantenerse constante en todo el experimento.

Ejemplos de situaciones del tipo de Poisson son los siguientes:


l. Nmero de llamadas telefnicaspor minuto en un pequeo negocio.
2. Nmero de casos de una extral'la enfermedad de la sangrepor 100 mil personas.
3. Nmero de basureros peligrosos por condado en Estados Unidos.
4. Nmero de derrames importantesde petrleo en b regin de Nueva Inglaterra por mes.
S. Nmero de llegadas a una caseta de cobro de autopista por minuto entre las 3 y 4 a.m. en
enero en la Kansas Tumpike.
6. Nmero de veces que una impresora de un afio de antigedadse descompone por trimestre.
7. Numero de defectos de CO)tura por par de jeans durante la produccin.
8. Nmero de veces que una llanta se revienta en un avin comercial por semana.
9. t-imero de manchas de pintura por automvil nuevo.
10. Numero de defectospor pina de tela.

Cada uno de esto) ejemplosrepresenta un suceso raro de eventospara algn intervalo. 'te-.eque,
aun cuando el tiempo es un intervalo ms comn para la distribucinde Poissen, lo) intervalo pueden variar de un condado de Estado Unidos a un par de jeans, Algunosde lo) intervalosde estos ejemplos podrian tener cero sucesos. Adems, el promedio de sucesos por intervalo para muchos de esto)
ejemplosest probablementeen un digito ( 1-9).
Si se estudia un fenmeno de distribucinde Poisson sobre un largo periodo. es posible determinar un promtdio a largo plazo. Este promedio se denota como lambda(>.). Cada problema de Poi(son
contiene un valor lambda del cual se determinan las probabilidadesde sucesos paniculares.Aun cuando n y p se requieren para describir una distribucin binomial, una distribucin de Poisson puede ser
descrita por>. sola. La frmulade Peisson se utiliza para calcular la probabilidadde sucesosen un intervalo para un valor dado de lambda.
FORMULA O.E
POISSON

P(x) =-

donde
X=

>."t

>.

x!

0, I, 2,3, ...

). Promedio a largo plazo


t = 2.718282
Aqu,x es el nmero de sucesos por intervalopor el cual la probabilidad se calcula. >. es el premedio a largo plazo,y t 2.718282 es la base de logaritmos naturales.
Aqul es oponuna una palabra de advertencia acerca del uso de la distribucin de PolSSOD para
estudiar varios fenmenos.El valor). debe mantenerse constante en todo un experimentode PoWon..
El invesrigadcrdebe ser cuidadoso y no aplicar una lambda dada a intervalo para los cuala am!:tit
lambda. Por ejemplo.el nmero promedio de clientes que llegan a una tienda Sears durante an u::nvale de un minuto vara de hora en hora, dia a dla y mes a mes. Diferenteshcras dd da o scmim
podrian producir lambdas diferentes.El numero de defectospor par de jcaru podrla nnar de
a
viernes. El investigador debe ser especifico al describirel intervalo para el cual se wa >..

Resolucin de problemas de Poisson por frmula


Suponga que al aur llegan clientes de banco en la tarde de dtas hables a un promedio de 3.2 dimin
cada 4 minutos. Cu.ti es la probabilidadde que exactamente cinco clientes~
en un mtcn-alode
4 minutos en una tarde de dla hbil? La lambda para este problema es 3.2 dientes por 4 mmutos. El
valor de x es Cinco clientes por cuatro minutos. La probabilidad de que cinco dientes lleguen al azar

160 ESTADISTICA EN LO~ 1-"EGOOOS

el promedio

durante un intervalo de 4 minutos, cuando


minut~C5

de largo pluo ha sido de 3.2 clientes por .C

(3.2S)(r-J.2) (335.54)(.0408) "".l HI


S!
120

Si un banco promedia 3.2 clientes cada 4 minutos, la probabilidad de que cinco clientes llegucc
durante cualquier intervalo de 4 minutos es 0.1141.

PROBLEMA DE
DEMOSTRACIN

5.7

Al azar llegan clientes a un banco en tardes de da hbil a un promedio de 3.2 clientes cada '
minutos. Cu61 es la probabilidad de tener ms de siete clientes en un intervalo de ' minutos en
una tarde de da hbil?

>.

3.2 chentetl' minutos

x > 7 clientes/' minutos

En teora. la solucin requiere obtener los valores de x 8, 9, 10, 11, 12, 13,14, . "En realidad. cada valor x se determina hasta que los valores estn tan lejos de >. 3.2 que las probabtlidades se aproximan a cero. Las probabilidades exactas se suman entonces para encontrar x > 7

Pix 8IA 3.2) (3.2'lle

3.21 .0111

Pix 9IA 3.2) (3.2')(e

3 21 .0040

81

91

Pix

3 21
10jA 3.2) 132'He
101

.0013

3.2) (3.2''ll"32I
111

.0004

Pix,.. 12IA - 3.21<3.2'2l<"321

- .0001

Pix .. 111A

121

Pix 13IA
P(x > 7)

1321311'"3 21
.0000
131
81 .0169

3.2l

P(x

Si el banco ha estado promediando 3.2 clientes cada' minutos en las tardes de dfas hbiles, es
poco probable que mis de siete personas lleguen al azar en cualquier periodo de 4 minutos. Esta
respuesta indica que ms de siete personas llegaran al azar en un periodo de ' minutos slo
1.69% del tiempo. los oficiales de banco usan estos resultados para ayudarse a tomar decisiones de contratacin de personal.

PROBLEMA DE
DEMOSTRACIN

Un banco tiene un porcentaje promedio de llegadas aleatorias de 3.2 clientes cada ' minut05.
Cu61 es la probabilidad de obtener exactamente 10 clientes durante un intervalo de 8 minutos?

5.8
>.

x-

3.2 clientes/' minutos


10 clientes/8 minutos

Este e1emplo es diferente de los primeros dos ejemplos de Poisson en que los mtervalos para
lambda la muestra son diferentes. los intervalos deben ser iguales para usar>.
xjuntas en

CAPfTULO S 01Sl1UBUCIOSES Dl'iCRETAS 161


frmula de probabilidad. La forma correcta de abordar este dilema es ajustar el intervalo para
lambda de modo que>. y xtengan el mismo intervalo. El intervalo para xes 8 minutos, de modo
que >. debe ajustarse a un intervalo de 8 minutos. Lgicamente, si el banco promedia 3.2 clientes cada 4 minutos, debe promediar el doble, o sea 6.4 clientes cada 8 minutos Si xfuera para
un intervalo de 2 minutos, el valor da lambda se reducirla de 3.2 a 1.6 clientes por intervalo de
2 minutos. El mlltodo errneo para este dilema es igualar los intervalos al cambiar el valor de x.
Nunca ajuste ni cambie xen un problema. Slo porque 10 clientes lleguen en un Intervalo de 8
minutos no significa que habra necesariamente cinco clientes en un intervalo de cuatro minutos. No existe garantfa de cmo tos 10 clientes se distribuyan en el intervalo de 8 minutos.
Siempre ajuste el valor de lambda. Una vez ajustada lambda para un intervalo de 8 minutos. la
solucin es:
>.

6.4 clientes,18 minutos

10 clientes,18 minutos
(6.4l'e
101

' - 0528

Uso de las tablas de Poisson


Todo valor de lambda determma una distribucin de Poisson diferente. Cu.tlquiera que sea la naturaleu del intervalo asociado con una lambda, la distribucin de Poisson para una lambda en particular
e. la misma. La tabla A.3, Aptndice A, contiene las distribuciones de Poison para valores seleccionados de lambda. Las probabilidades se muestran en la tabla por cada valor x asociado con una lambda
dada si la probabilidad tiene un valor diferente de cero a cuatro lugares decimales. La tabla 5.10 pre
senta una parte de la tabla A.3 que contiene las probabilidades de x s 9 si lambda es 1.6.

PROBLEMA DE
DEMOSTRACIN

5.9

Si una oficina de bienes rafees vende 1.6 casas en un dla h6bil promedio y las ventas de casas
en dias h6biles son distribuciones de Poisson, cu61 es la probabilidad de vender exactamente
cuatro casas en un dla? Cul es la probabilidad de no vender casas en un dfa? Cu61 es la probabilidad de vender ms de cinco casas en un dfa? Cul es ta probabilidad de vender 10 o ms
casas en un dla? Cu61 es ta probabilidad de vender exactamente cuatro casas en dos dias?
Soludn
>. - 1.6 casas/dfa

Plx

41 >. - 1.61w1

la tabla 5.10 da tas probabilidades para >.


1.6. La columna izquierda contiene los valores
rengln x 4 da ta probabilidad .0551. Si una empresa de bienes rafees ha estado promediando 1.6 casas vendidas por da, slo 5.51% de los dfas vendera exactamente cuatro casas y
todava mantendra el valor lambda. El rengln 1 de la tabla 5.10 muestra la probabilidad da no
vender casas en un dfa (0.20191. Esto es, en 20.19% de los dlas, la compal'lfa no venderia ca. si
tas ventas son distribuciones de Poisson con>. 1.6 casas por dla. La tabla 5.10 no es acumitr.iva
Para determinar P(x> 5), ms de cinco casas, h611ense las probabilidades de x 6. x 7. x a,
x 9, x 1; sin embargo, en x 9, la probabilidad para cuatro lugares decimales es cero, y
la tabla 5.10 se detiene cuando indica un valor x de cero en cuatro lugares decimales A con:r
nuacin veamos la respuesta para x > 5.

x, Et

Prol>M>lllded

.0047

.0011

8
9

.0002

x>5

.0000
.0060

162 ESTADISTICA EN LOS SEGOCIOS


TABLA 5.10

.........

Tabla de Poisson para


).
1.6

.2019

.32'0

2
3

.2514

'5

.0551

.0047

.0011

.0002

.0000

1378
.0176

Cul es la probabilidadde vender 10 o ms casas en un dia? Como indica la


tabla en x 9, la probabilidad de x <!:: 10 es esencialmente0.0000; es decir, si la of..
cina de bienes races ha estado promediando slo 1.6 casas vendidas por dfa, 81!
prcticamente imposible vender 10 o ms casas en un dia. Cul es la probabilidac
de vender exactamente cuatro casas en dos das? En este caso, el intervalo se ht
cambiado de un dfa a dos dlas. Lambda es para un da, de modo que debe hacera
un ajuste:una lambda de 1.6 para un dla se convierteen una lambda de 3.2 para dOll
dias. La tabla 5.10 ya no aplica, de modo que la tabla A.3 debe usarse para resolve
este problema. La respuestase encuentra al buscar>. 3.2 y x ' en la tabla A.3: ,.
probabilidad es 0.1781 .

Media y desviacin estndar de una distribucin de Poisson


El valor medio o esperado de una distribucin de Poisson es>.. Es el promedio a largo plazic
de sucesos para un intervalo si se toman muchas muestras aleatorias. Lambda por lo general no es un nmero entero, de modo que casi siempre observar sucesos lambda en 1o;
intervalo es imposible.
Por ejemplo, suponga >. 6.5/intervalo para algn fenmeno con distribucin dt
Posson, Los nmeros resultantes de x sucesos en 20 muestras aleatorias diferentes de um
distribucin de Poisson con >. 6.5 podra ser como sigue:
6

9 7

6 6

10

10

El clculo del nmero medio de sucesos de este grupo de 20 intervalos da 6.6. En teora, para muestreo infinito el promedio a largo plazo es 6.5. De las muestras, ntese que cuando>. es 6.5, se presenur
varios 5 y 6. Raras veces se presentan sucesos de 1, 2, 3, 4, 11, 12,13, . cuando>. 6.5. Comprender
la media de una distribucin de Poisson da sentido para los sucesos reales que es probable que ocurraa,
la varianza de una distribucin de Poisson tambin es >.. la desviacin estndar es \/X. la combinacin de la desviacin estndar con el teorema de Chebyshev indica la dispersin de una distribucin de Poisson. Por ejemplo, si >. = 6.5, la varianza tambin es 6.5 y la desviacin estndar es 2.55. 8
teorema de Chebyshev expresa que al menos 1 - l//c2 valores estn dentro de le desviaciones estnda:
de la media. El intervalo :t 20' contiene al menos 1 - (12/2) .75 de los valores. Para = >. = 6.5
y O' = 2.55, 75% de los valores deberan estar dentro del rango de 6.5 :t 2(2.55) = 6.5 :t 5.1. Esto es.
el rango de 1.4 a 11.6 deberla incluir al menos 75% de todos los valores. Un examen de los 20 valores
generados al aza.r para una distribucin de Poisson con >. = 6.5 muestra que en realidad 100% de
valores estn dentro de este rango.

Grficas de distribuciones de Poisson


Lu> vaiores de la tabla A.3, Apndice A, se pueden usar para graficar una distribucin de Poisson. l.
valores x estn en el eje x y las probabilidades sobre el eje y. la figura 5.3 es una gnifica M INITAB pL."1
b distribucin de valoro para >. 1.6.
la grtfic:~ revela una distribucin de Poisson sesgada a la derecha. Con una meda de 1.6 y un posa.ble rango de x de cero al infinito, los valores obviamente se van a "apilar" en O y 1. Considere, sin embar
go, la grtfica ~fl!'IITAB de la distribucin de Poisson para >. .. 6.5 en la figura 5.4. Ntese que
>. 6.5, bs probabilidades son mximas para los valores de 5, 6, 7 y 8. la grfica tiene menos
porque la probabilidad de suceso de valores cercanos a cero es pequea, como son las probabilidades
de valores grandes de x.

Uso de computadora para generar distribuciones de Poisson


El uso de la frmula de Poisson para calcular probabilidades puede ser tedioso cuando uno trabaja preblernas con probabilidades acumulativas. las tablas de Poisson de la tabla A.3, Apndice A, son ms rpt.
das de usar que la frmula de Poisson: no obstante, las tablas de Poisson estan limitadas por la canti
de espacio disponible, y la tabla A.3 slo incluye valores de probabilidad para distribuciones de Po
con valores lambda a los lugares de dcimas en casi todos los caso). Para investigadores que deseen usr
valores de lambda con ms precisin, o que tengan la impresin que la computadora es mas conveni
que cuadro de libro) de texto, los paquetes de software de estadstica son una opcin atractiva.

CAP1nll.O S DlSTIUllUOO!'-'ES DISCRETAS 163

Hf'.!f''ii'!111.111HIi1.1.11:i.~----------------MIObneu

Quejas ..........

En Ndenta. lol .,..;en. de~


hui Clpftlldo Qinriaealll cm 1.02. DmllO de 111 10 aaai- mis grmdo
mucha m6I m..ailflorida por el semao 8eo qur nunca de &lados Uaidol, NonlMal MI> el D6mao promedio nW
antes. No es duo li lol ~
est en ralidad maM
llmdeque,111epad8ClllcmUI qilljaapor IOOmil ~
Debido 1 qae .........
.,._dio IOll rcbtl\~
rausibol por - aperimcm en vuelo O Ilo IOD U
naidolol. Laa queju induJm demoru en lol YUC1o1, ~
meDllr pequeftol. puege qae el ndmero mi de quqAS por
pept cxtRYi8do,, ...... clemans en pilta con poco o ninpa
100 mil es poc:o c:am6lt y puede..- una diltrlbudn de
mviao a bordo, welos cm amo de~.,..
P'oilloD. Ea esu cmo. l aepiaeala el nllmero promedio
oo ttdudo debido a vuelol cm m pu11e. vuelol ance- de ..,.a y el iDllerwlo es 100 mi ....-.
Por tJelllplo.
llcb rcm.,-- de lDll aceer. La mayorta de awiadofta -1
- 1.Glqaejal (Jln-so,..111e111 .. .-.-).
npltmmte eoartm y lOpClltlD. pero un adinero awdenlr 1t eubew...,... 100 mi .,....oa de a bordo.la piobebilidld
peujmll
_..,_en
el U.S. Deputmaaol de ...............
tltl de ellol pia:allllD .. que;. al
TllpOltllim.A.......
11cWc.llde1990,el .._..,
Dtpuuneat ol TruuporUlioa poddl calaallne CllllDO
promedio de qurju por 100 mil paajm)s de abonlo ...
0-66 En aftol lipimla. el promedio subi 1 0.74. G.16 .,
.0713
..os

..-n

(1.08'3~ -

En un do ndente, .pu el DeplrtmeDt ol'lnlllpor


., Cl, I 100 mi pmljaul de. boldo fUcrlD .......
-.
SouthlllllMrlm e1--.., promedio II beJO de
7.1,,. del acmpo CDdlmallle bel bubW~
por 100 mi cm 0.25. llpida por Alub Airlincs cb 11111.,
e1 Dqatmwl ol'lblllportlDon.
C11111 0.54, Dlba LiDa cm 0.79, US Airways CIOD O.U,r 1m pltltDUdo

MIN"ITAB producir una <fulribudn de Poisson para prkticarnmte cualquier valor de lambda.
Por ejemplo, un estudio realizado por el 'ational Center for Health Stati.ti~ indica que, en promedio,
un estadounidense time 1.9 enfermedades o ksiones agu<bi por afto. Si esto casos son distribuciones
de Poisson, lambda es 1.9 por ano. Qu aspecto tiene la distribucin de probabilidad de Poisson para
esta lambda? La tabla 5.11 contiene la wida MINITAB para esta distribucin,
Exul puede tambin generar probabilidades de dif~tcs valores de X para cualquier di>tribucin
de Po>50n. La tabla 5.12 muesua la. probabilidado produd~ por Exul para ti problema de bienes
ralees del problema de demostracin 5.9 usando una lambda de 1.6.

Clculo de problemas binomiales por la distribucin de Poisson


Cierto) tipo de problemas de dumbuc:in binorru.J se pueden calcular con el U$O de la distribucin de
Poisson, Lo~ problema$ binomiales con grandes ~~
muestrales y pequeos valores de p. que entonces gmeran eventos poco comuoes, son candid.it~ potmcialcs para usar la <fuanbucin de Poisson. Como
ttgla prctica, si n > 20 y n p s 7, la. aproximacin es suficientemente cercana para usar la dutribucin de Poisson para problemas binomiales.

.. -,

FIGURA
5.4
.
Grfica MINITAB de la distribucin de Poisson para>. - 1.6

O.IS

0.)

!
J o.os

~o:

GrflCI MINITAB de la distribucin de Poisaon para l. 6.5

0.10

0.1

o.o

'

10

164 ESTADISTICA EN LOS l'o'LGOOOS

TABLA 5.11

TABLA 5.12

Salida MINITAB para la distribucin de Poisson


A 1.9

Salida Excel para la distribucin


de Poisson A 1.6

...__,e;~
. . . ,. ...
'prf

1'K'Y1di

l'(Z .,

t.1411
O.Jtq

0.111

Si se satisfacen estas condiciones y el problema binomial es un candidato para este proceso, el procedimiento se inicia con el calculo de la media de la distribucin binomial, n p. Debido a que n
es el valor esperado de la binomial, se traduce al valor esperado, A, de la distribucin de Poisson. U=
como el valor A y usar el valor x del problema binomial permite el calculo de la probabilidad a par
tir de un cuadro de Poisson o por la frmula de Poisson.
Grandes valores den y pequeos valores de p suelen no incluirse en cuadros de distribucin binomial, por lo cual imposibilitan el uso de tcnicas de clculo binomial. El uso de la distribucin de
Poisson como aproximacin a tal problema binomial en tales casos es una alternativa atractiva; de hecho,
cuando no se dispone de una computadora, puede ser la nica alternativa.
Como ejemplo, el siguiente problema de distribucin binomial se puede resolver con el uso de la dis
tribucin de Poisson: n = 50 y p .03. Cul es la probabilidad de que x = 4? Esto es, P(x = 4ln = ~
y p = .03) =?
Para resolver esta ecuacin, primero determine lambda:

A==

n p= (50)(.03) = l.S

Cuando n > 20 y n p :S 7, este problema es un candidato para la aproximacin de Poisson. Parx 4, la tabla A.3 da una probabilidad de .0471 para la aproximacin de Poisson. En comparacin cor
esto, resolver el problema con la frmula binomial da los siguientes resultados:

soC4(.03)4(.97)46 .0456
La aproximacin de Poisson tiene una diferencia de 0.0012 respecto al resultado obtenido al usar
la frmula binomial para resolver el problema.
A continuacin veamos una grfica MINITAB para esta distribucin binomial.

0.3
-e

".a

0.2

::;

e 0.3
a.
o.o

3456789
Valon:sX

CAPITVlO 5 Dl.SiRIBUOO~"E.S DISCRETAS 165

Con~ 1.5, puede generarse la distribucin de Poisson. Veamos en ~ui<U una gr.ifia Ml~ITAB
para esia dis1ribucin de Posson.
0.3

0.2

0.)

o.o

11

Valora X

Al comparar las dos gr.lficas, es dificil distinguir entre la distribucin binomial y la distribucin de
Poisson debido a que es cercana la aproximacin de la distribucin binomial por la distribucin
de Poisson.

PIOBLEMA DE

BEMOSTRACIN
5.10

Suponga que la probabilidad de que un banco cometa un error al procesar un dep11to es .0003.
Si se auditan 10 mil depsitos In), cu61 es la probabilidad de que se cometan mb de seis erro
res al procesar depsitos?
Solucln
~

n p 110 000)(.0003) 3.0

Debido a que n ..> 20 y n p"" 7, la aproximacin de Poisson est6 cercana lo suficiente para
analizar x 6. La tabla A.3 da las siguientes probabilidades.
). - 30
X

Probeblllded
.0218

7
8

.0081
.0027
.0008
.0002

9
10
11

12

x>8

.0001
033!>

Para resolver este problema con el uso de la frmula binomial es necesario empezar con"

7.

10 ooo~l.0003)7(.9997)9913

Este proceso continuarla para valores x de 8, 9, 10, 11, .. , hasta que las probabilidades se
aproximen a cero. Obviamente, este proceso no es pr6ctico y hace de la aproximacin de
Poisson una alternativa atractiva.

5..3 PROBLEMAS

*'

5. lS Encuentre los siguientes valores con el uso de la frmula de Poisson.


P(x
2.3)
b. P(x 21>. 3.9)
c. P(x s 31>. 4.1)
d. P(x OI>. 2.7)
e. P(x ll>- 5.4)

(. P(4

<X< SI>- -

4.4)

166

ESTADISTICAEN LOS NEGOCIOS

5.16

Encuentre los siguientes valores con el uso de las tablas de Poisson del Apndice A.

a. P(x = 6IA = 3.8)


c. P(3

> 7IA
s Xs

d. P(x

= OIA =

b. P(x

e.

9IA = 4.2)
1.9)

P(x s 6IA = 2.9)

f. P(S
5.17

= 2.9)

<X s

8IA = 5.7)

Trace las grficas de las siguientes distribuciones de Poisson. Calcule la media y desviacin esta=
dar para cada distribucin. Localice la media en la grfica. Observe la forma en que las probab
lidades se grafican alrededor de la media.
a. A= 6.3
b. A=

1.3

c. A= 8.9

d. A= 0.6
5.18 Los lunes por la maana, el First National Bank tiene abierta slo una ventanilla de cajera parad
tos y retiros. La experiencia ha demostrado que el nmero promedio de clientes que llegan en un inR:I'
valo de 4 minutos los lunes por la maana es 2.8, y cada cajera puede atender con eficiencia ms de
nmero. Estas llegadas aleatorias a este banco los lunes por la maana estn distribuidas por Po
a. Cul es la probabilidad de que una maana de lunes lleguen exactamente seis clientes en
intervalo de 4 minutos?
b. Cul es la probabilidad de que no llegue ningn cliente a hacer depsito o retiro durante
intervalo de 4 minutos?
c. Suponga que una cajera puede atender a no ms de cuatro clientes en cualquier intervalo
4 minutos en esta ventanilla en un lunes por la maana. Cul es la probabilidad de q:
durante cualquier intervalo dado de 4 minutos, la cajera no pueda satisfacer Ja deman
Cul es la probabilidad de que la cajera pueda satisfacer la demanda? Cuando la demanda
pueda ser satisfecha durante cualquier intervalo dado, se abre una segunda ventanilla. Q
porcentaje del tiempo tendr que estar abierta una segunda ventanilla?

d. Cul es la probabilidad de que exactamente tres personas lleguen al banco durante un


de 2 minutos la maana de lunes para hacer un depsito o retiro? Cul es la probabilidad
que cinco o ms clientes lleguen durante un periodo de 8 minutos?
5.19

La gerente de un restaurante est interesada en tomar un mtodo ms estad1stico para pron car la carga de clientes. Ella inicia el proceso con una recopilacin de datos. Uno de los empl
de recepcin del hotel se asigna a contar clientes cada 5 minutos de 7 p.m. a 8 p.m. todos los
dos por la noche durante tres semanas. A continuacin aparecen los datos. Una vez reunida
informacin, la gerente calcula lambda con los datos de las tres semanas como un conjunte
datos como base para el anlisis de probabilidad. Qu valor de lambda encontr ella? Su
que estos clientes llegan al azar y que las llegadas son distribuciones de Poisson. Use el valer
lambda calculada por la gerente y aydela a calcular las probabilidades de las partes (a) a la
para cualquier intervalo dado de 5 minutos entre las 7 p.m. y las 8 p.m. de un sbado por la n
Nmero de llegadas
Semana 1
3
6
4
6
2
3
1
5
l

o
3
3

Semanal

Semana3

2
4

3
5
3
5
4
7
3
4
8
1
3

2
6
4
2
5
3
4

CAPITULO S DISTRIBUOO:\'E.5 Dl:>CaETAS 167

a. Cul es la probabilidad
minutos?

de que no lleguen dientes durante cualquier intervalo dado de 5

b. Cul es la probabilidad de que seis o ms clientes lleguen durante cualquier intervalo dado
de 5 minutos?
c. Cul es la probabilidad de que durante un intervalo de JO minutos lleguen menos de cuatro
dientes?
d. Cul es la probabilidad de que entre tres y seis (inclusive) clientes lleguen en cualquier intervalo de 10 minutos?
e. Cul es la probabilidad de que exactamente ocho clientes lleguen en cualquier intervalo de 15
minutos?
5.20

De acuerdo con el United National Environmental Program y la World Health Organization, en


Bombay, India, los estndares de contaminacin del aire por rnacropartculas han sido excedidos
un promedio de 5.6 das en cada periodo de tres semanas. Suponga que la distribucin del nmero
de das que exceden los estndares por periodo de tres semanas es una distribucin de Poisson.
a. Cul es la probabilidad de que el estndar no sea excedido en ningn da durante un periodo de tres semanas?
b. Cul es la probabilidad de que el estndar sea excedido exactamente 6 das de un periodo de
tres semanas?
c. Cul es la probabilidad de que el estndar sea excedido 15 o ms das durante un periodo de
tres semanas? Si este resultado ocurre en realidad, qu podria concluirse?

5.21

El nmero promedio de viajes anuales por familia a parques de diversin en Estados Unidos es
una distribucin de Poisson, con una media de 0.6 viajes por ao. Cul es la probabilidad de
seleccionar al azar una familia estadounidense y encontrar lo siguiente:
a. La familia no hizo un viaje a un parque de diversiones el ao pasado?
b. La familia hizo exactamente un viaje a un parque de diversiones el ao pasado?
c. La familia hizo dos o ms viajes a parques de diversiones el ao pasado?
d. La familia hizo tres o menos viajes a parques de diversiones en un periodo de tres aos?
e. La familia hizo exactamente cuatro viajes a parques de diversiones durante un periodo de seis
aos?

5.22

Las colisiones en el canal de navegacin de Houston son raras. Suponga que el nmero de colisiones son distribuciones de Poisson, con una media de 1 .2 colisiones cada cuatro meses.
a. Cul es la probabilidad de que no ocurran colisiones en un periodo de cuatro meses?
b. Cul es la probabilidad de que ocurran exactamente dos colisiones en un periodo de dos meses?
c. Cul es la probabilidad de que ocurra una o menos colisiones en un periodo de seis meses?
Si ocurre este resultado, qu podra concluirse acerca de las condiciones del canal de navegacin durante este periodo? Qu podra concluirse acerca del conocimiento de seguridad del
canal durante este periodo? Qu podria concluirse acerca de las condiciones del clima durante
este periodo? Qu podra concluir el estudiante acerca de lambda?

5.23 Una compaa fabricante de plumas para escritura promedia 1.2 plumas defectuosas por caia
producida (200 plumas). El nmero de defectos por caja es una distribucin de Poiss- n.
a. Cul es la probabilidad de seleccionar una caja y no encontrar plumas defectuosa>?
b. Cul es la probabilidad de encontrar ocho o ms plumas defectuosas en una e.ja)
c. Suponga que un comprador de estas plumas deja de comprarle a esta compaa si una caja
contiene ms de tres plumas defectuosas. Cul es la probabilidad de que una caja contenga
ms de tres plumas defectuosas?
5.24

Un investigador mdico estima que .00004 de la poblacin padece de una rara enfermedad de b
sangre. Si el investigador selecciona al azar 100 mil personas de la poblacin, ;cul es la probabilidad
de que siete o ms personas tengan esa rara enfermedad de la sangre? Cul es la probabilidad de
que ms de 10 personas tengan esa enfermedad? Suponga que el investigador obtiene ms de 10
personas que tengan esa rara enfermedad en la muestra de 100 mil pero que la muestra fue tornada
de una regin geogrfica particular. Qu podra concluir el investigador de los resultados?

5.25 Una empresa de regstro contiene gran cantidad de datos, Histricamente 9% de las pa:
de datos rcgimadoa por la compar\1a contienen errores, Si al azar se seleccionan 200 paginas
datos,
a. cul o la probabilidad de que seis o mas paginu contengan errores!
b, ;cul es la probabilidad de que m.i> de 1 O p.iginh contengan errores!
c. cu.il o la probabilidad de que ninguna p.lgina contenga errorc ?
d. cu!I o la probabilidad de que menos de 5 pginu contengan errores!
5.26 Un aho porcentaje de personas que se fracturan o dislocan un hueso consultan un m
Suponga que el porcentaje es 99%. Considere una muestra en la que 300 personas ~ selecci
al aur y que se han fracturado o dislocado un hueso,
a. l n la probabilidad de que exactamente cinco no consulte al mdico?
b. Cul es la probabilidad de que menos de cuatro no con ulte al mdico!
c. Cu.i.l es el nmero esperado de personas que no venan al mdico!

5.5 DISTRIBUCIN HIPERGEOMTRICA


Otra distribucin ntadsuca discreta o la distribucin hipergeomtrica. lo expertos en e tadlll
veces usan la distribucin hpergeomrrca para complementar los tipo de an.ilisis que <e pu
hacer con el uso de: la distribucin binomial Recordemos que la distribucin binomial aplica, en
ra, solo a experimentos en los que lo intente se hacen con restitucin (evento independientes).
d1Stribucizn bipergeomtrica aplica slo en experimento que intentan hacerlo sin resutucin.
La distribucin hipergeomtrica, al igual que la distribucin binomial, consta de do. posi
resuhadoc xito o fracase: pero el usuario debe: conocer el tamao de la poblacin y la proporcin
txllO> y frac:uos en la poblacin para apli<r la distribucin hipergeomtrica. En otrb palabras, d
a que la distribucin hpergeometrica se 11$3 cuando el muestreo se hace in restitucin, la informa'
acerca de la compo kin de: la poblac:in debe ccnecer-e para volver a determinar la probabilidad
un hito en cada mtenro sucesivo a medida que cambia la probabilidad.
La distribucin hipergeorntrica tiene las siguientes caracterisricas:
fa una dimibucin discreta.
Cada resultado consta de un xito o un fracaso,
El muestreo se hace in resutucin.
La poblacin, N, es finita y conocida.
El numero de xito. en Ja poblacin. J\, '>C' conoce.

FORMUU.
HlPfRGEOMtTIUCA

donde
.\' tamao de la poblacin
n tamao muesrral
J\ numero de xito. en la poblacin
x = nmero de xito en la muestra: el muestreo

'>C' hace

sin restitucin

Una dh1ribuan hipergeomtnca ~t caracterizada o descrita por tres parmetros: N.A y n.


la multitud de posibles combinadonn de oto> tre parmetros, crear cuadros para la distribucin h
geomtrica es pnlct1camentc imposible. Por unto, el 111,-estigador que seleccione la di~tribucin hi
mtrica para analizar datos debe: usar la frmula para calcular cada probabilidad. Como este t
puede 5C1' tedioso )' lento, la mayona de investigadores Usan la di tribucin hipergeomtrica
recurso cuando trabajan con problema. binomiale sin restitucin. Aun cuando la dstnbucin
mlal tericamente aplica slo cuando se hace muestreo con restitucin y p permanece constante, r
demos que, s la poblacin es uficiememente grande en comparacin con el tamao mue.tral.
impacto de muestrear sin restitucin en p o minimo, Entonces, la distribucin binomial 'C puede

CAPliUUl 5 DL~TRIBUCIOXE\ DISCRETAS

169

en algunas situaciones cuando el muestreo SC' hace >in restuucin. Debido a lo~ cuadros existentes es
preferible el uso de la dstnbucin binomial en lugar de la distribucin hipcr:comctrka -iempre que
~ posible. Como regla pnktica, si el tamai\o muestral e> menor a 5% de la poblacin, el uso de la distribucin binomial en lugar de la dstribucin hipergeorntrica C'S aceptable cuando el muestreo se hace
sin mutucin. La distribucin blpergeomtrica da la prob.abilidad ex.lela, y la distribucin binomial
da una buena aproximacin de la probabilidad en esta suuacones.
En resumen, la distribucin hipcrgcomtrica debera usarse: en Jugar de la dstribucin binomial
cuando cst~n presentes l.u ,jguientC'S condiciones:
l. El muestreo se hace sin restitucin,
2. n ~ 5%N.

Las probabilidades hipergeomtricas SC' calculan bajo ) suposicin de un muestreo igualmente


probable de demento> restante del espacio maestral.
Como aplicacin de la dimibucin hipergeomtrica, consdere el siguiente problema. Veinticuatro
personas, ocho de las cuales son muieres, solicitan un traNjo. Si al u.u se seleccionan cinco de lo. sol
citantes, cul e> la probabilidad de que exactamente tres de los muestreados sean muiere>?
Este problema contiene una poblacin pequea, finita, de 24, o 5C3 11 = 24. Se toma una muestra
de cinco ~licitante>, o n = 5. El muestreo se: reafa sin r<~titudn, porque los cinco -olicnames seleccienados para la muestra son cinco personas diferentes. El tamal'lo mu<~tral e> 21% de: la poblacin,
que es mayor al 5% de la poblacin (ni.\' 5/24 0.21 ). La distribucin hipergeomtrica e> la apro
piada para usarse, La \Ubdivsin de la poblacin es A 8 mujeres (x11os) )' n - A 24 - 8 16
hombres,La probabilidad de obtener x J muieres en la muestra de 11 5 es
aC, 1~C2 (56) 120)

-= _1581

42 5(M

24Cs

Conceptualmente, la combinacin en el denominador de la frmula hipcrgcomctrica da toda. la>


formas posibles de obtener n muestra, de una poblacin .\', incluyendo aquella> con resuhado desea
do. En este problema, hay 42 S<M formas de seleccionar cinco personas do: 24 pcr.o11a>. El numerador
de la frmula hipcrgcomtrica calcula todas lai. forma. po-ibles de obtener x xitos de lo, A xito' di~ponibles )' n - x fracaso. do: lo. .\' - A raca.o disponibles de la poblacin. Existen 56 formas de obrener tres mujeres de un grupo de ocho y 120 form~ de obtener do> hombre. de un grupo de 16. la>
combinaciones de cada una se multiplican en ti numerador porque la probabilidad conjunta de obrener x hitos y adems n - x fra~
se calcula.

PROBLEMA DE

DEMOSTRACIN
5.11

Suponga que 18 imponantes compal'lias fabricantes de computadoras operan en Estados


Unidos y que 12 estn ubicadas en Silicon Valley de California. Si se seleccionan al azar tres de
estas compaas de la lista, cul es la probabilidad de que una o ms de las compal'lias seleecionadas estn ubicadas en Silicon Valley7
Solucin

N 18, n 3, A 12 y x 2:: 1
Este problema es en realidad tres problemas en uno:
X
X
X

1
2
3

El muestreo se realiza sin restitucin, v el tamao muestra! es 16 6% de la poblacin. Por tanto,


este problema es un candidato pare la distribucin hipergeomtrca Veamos la solucin.
Xl

X2

~+~+
1aC3
.2206

1aC3
+ .4853

12C1 tCo
1aC3
2696

9755

170 ESTADISTICA EN LOS SEGOClOS

Un mtodo alternativo de solucin que usa la ley de complementos sera 1 (uno) menos
probabilidad de que ninguna de las compafllas Htuviera situada en Silicon Valley, o sea
1 - P{x OIN 18, n 3, A 121
Por tanto,
1-

nCo ,e,

1- .0245 .9755

18~

Uso de la computadorapara resolver probabilidades


de distribucin hipergeomtrica
Con MINITAB o Excel e) posible resolver probabilidades de dstribucin hipergeomtrica en la comp
tadora .. Ambo) paquetes de software requieren de la entrada de N, A, n y x. En cualquiera de los dol
paquetes, la salida resultante es la probabilidad exacta para ti valor particular de x. La sali<U MINIT
para el ejemplo presentado en esta seccin, donde n 24 ~>nu de lu cuales A 8 son muitM
n 5 se seleccionan al azar, y x 3 son mujeres, se ve en la tabla 5.13. La sali<U Excel para este mis
problema se presenta en la tabla 5.14.

5.4 PROBLEMAS
5.27 Calcule las siguientes probabilidades con el uso de la frmula hipergeomtrica,
a. La probabilidad de x 3 si N = 11, A 8 y n = 4
b. La probabilidad de x < 2 si N = 15, A = 5 y n = 6
c. La probabilidad de x - O si N = 9, A = 2 y n = 3
d. La probabilidad de x > 4 si N 20, A 5 y n = 7

S.28 A continuacin se muestran las principales 19 compaas en el mundo en trminos de capacicb!


de refinacin de petrleo. Algunas de las compaias son de propiedad privada y otras ~o
gobiernos. Suponga que al azar se seleccionan seis compaas,
a. Cul o la probabilidad de que exactamente una compaia sea de propiedad priva<U?
b. Cu.il e) la probabilidad de que exactamente cuatro compalu sean de propiedad priva<U,
c. Cu.il es la probabilidad de que las seis compaas sean de propiedad privada?
d. Cul es la probabilidad de que ninguna de las compalas sea de propiedad privada]
CompaJ\11
Estatus de propiedad
Euon~1obil
Ron! Dut,h/Shell
BPAmoco
Totiliintlf
Prlcos de \'ennuela
Sinopec
SaudiAnm<o
China P'1rochemical
~trleo Bmildro
~trleo1 Mw<n'
National lraniam Oil
Texaco
Chevron
Rtp10lYPF
Kuwait Petroleum
Agip Petrol
Nippon Miuubi>hi Oil
Marathon Mhland P'1ro
Pnumina

Privada
Privada
Privada
Privada
dd Estado
Privacb
del Estado
del Estado
cid tado
dd E..tado
del Estado
Prh'llcb
Pnvacb
Privacb
cid Estado
Privada
Privacb
Privada
del Estado

CAPm11.0S

DISTlUBUOO~~DISCRETAS

171

La publicacin Oira/og Agt contiene una lista de las principales 17 empresas de tados Unidos
por ventas anuales por calogo. DeU Competer es la nmero uno. seguida por Gatew.ay y J.C.
Penney. De las 17 empresas de la lisu,ocho est~n en algn upo de negocio rdacionado con eomputadoras. Suponga que al azar se seleccionan cuatro empresas,
L Cll es la probabilidad de que ninguna de las empresas est en algn tipo de negocio rela
cionado con computadoras?
b. Cll es la probabilidad de que las cuatro empresas estn en algun tipo de negocio rdacionado
con computadoras?
c. Cll es la probabilidad de que exactamente dos estn en negocio no relacionado con computadoras?
S.30 W. Edwards Deming, en su experimento de cuentas rojas, tena una caja de cuatro mil cuentas,
de las cuales 800 eran rojas y 3 200 blancas. Suponga que una investigadora va 1realizar una versin modificada del experimento de la cuenta roja. En su experimento, ella tiene una boba de 10
cuentas, de las cuales cuatro eran rojas y 16 blancas. Este experimento requiere que un partid
pante tome la bolsa y al azar seleccione cinco cuentas sin restitucin.
L Cll es la probabilidad de que el panicipante seleccione exactamente cuatro cuentas blancas?
b, Cll es la probabilidad de que el participante seleccione exactamente cuatro cuentas rojas?
c. Cll es la probabilidad de que el participante seleccione todas las cuentas rojas?
S.31 A continuacin aparecen las principales 10 ciudades de Estad~ Unidos clasificadas por nmero
de cuartos de hotel (informacin compilada por Smilh Travel Researeh).
NdnMro
Ciuclacl
NdnMro de CUU10S
ta. \'egu. NV
106100
2
Orlando, Fl
92 200
3
LM ngdesLong Bach,CA
80000
4
Atlanta,GA
73 100
S.29

Chicago. lL

6
7

Washington, OC
ll:ueva York. !\'Y
Da!W, TX
San Diego. CA

8
9

10

Anaheim-Sanu Ana, CA

71 000
68 700
66600
48 500
47 200
44 600

Suponga que al azar se selecdonan cuatro de estas ciudades.


L Cll es la probabilidad de que exactamente dos ciudades estn en California?
b. l es la probabilidad de que ninguna de las ciudades est al este del ro M.ssi"ippi'
c. Cll es la probabilidad de que exactamente tres de las ciudades tenga m~ de 70 mil cua."tOS?
S.32 Una compallla produce y enva 16 computadoras personales sabiendo que cuatro de ellas timen
alambrado defectuoso. La companla que compra las computadoras har pruebas minllomas a
tres de las computadoras y puede detectar el alambrado defectuoso. Cul es la proNbWcbd de
que la compallfa compradora encuentre lo siguiente?
L Ninguna computadora defectuo.a
b. Exactamente tres computadoras defectuosas
c. Dos o ms computadoras defectuosas
d. Una o men~ computadoras defectuosas
S.33 Una ciudad del oeste tiene 18 oficiales de polica elegibles pira promocin. Once de 1o$ 1 son
de origen hispano. Suponga que slo cinco de I~ oficiales son escogidos para promocin y que
uno es de origen hispano. Si los oficiales escogido. pua promocin lubi.an sido sde-cdonados
slo al azar, cul es la probabilidad de que uno o ~
de b cinco o6ciales promovido. hubiera
sido de origen hispano? Qu~ podra indicar este resultado?

172 ESTADISTICA E!' LO!> SEGOCIO~

TABLA S.13

TABLA S.14

Salida MINITAB para el problema


hipergeomtrico
Probability Denaity Punction

Salida Excel para un problema hipergeomtrico

1 1

Ri~ico
con N 24,
X 8, y n 5
X

o.oo

P(X

X)

0.106

El bueno y el malo en la imagen pblica


de la industria bancaria
Si los resultados del estudio de Ja banca nacional pueden ser aceptado> como cifras de poblacin.
numerosos porcentajes presentados se pueden usar como valoro p y aplicados al anlisis muestra)
el uso de distribucin binomial. Por ejemplo, 80''0 de todos lo> consumidores financiero> considera qtx
su banco es su institucin financiera principal. Si al azar se -elecconan 25 consumidores financieros.
nmero esperado de los que consideren que el banco es su insurucin financiera principal se puedec
determinar junto con Ja probabilidad de cualquier nmero panicular de O a 25. El valor de n es 25
es .80. El nmero esperado es u
n p (25)(.80)
20. Uno esperara que 20 de las 25 perso
seleccionadas consideran que el banco es su institucin financiera principal. La probabilidad que 1
mas considere que su banco es su institucin principal se puede obtener al sumar valores de x de 1
25 en la tabla A.2 que resulta en .997. Casi todo el tiempo en una muestra aleatoria de 25 consumidores financieros, 18 o ms dirn que su banco e> su institucin financiera principal si en verdad 8~
todo> los consumidores financieros asi lo piensan.
De igual modo, si 65% de todos los consumidores financieros estn muy satisfechos con su inst.
tucin primaria y se seleccionan al azar 15 consumidores financieros, se puede aplicar la distribu
binomial (n
15, p = .65). El nmero esperado es 11
n p = 15(.65) 9.75. Vemos que con
distribucin discreta nunca obtendremos 9.75 consumidores financieros de 15 que estn muy sati5!e
cho>; sin embargo, las probabilidades para los valores x alrededor de e:;ta cantidad deberan ser los
alto' para esta distribucin,
Suponga que un estudio local de 32 consumidores de banco> revela que 26 piensan que e> ~
usar cajeros automticos. Si al azar se toma una muestra de 7 de estos 32, cul es la probabilidad
que exactamente 4 de lo> 7 se sientan seguros de usar cajero> automtico>? En este problema hipergeemtrico.N= 32,,, = 7,A = 26 y x 4. La aplicacin de Ja frmula hipergeomtrica da una probabilida!
de 0.0888. En esta poblacin, 26 de 32 o sea 81% piensan que e> seguro usar cajeros automticos.
obstante, en la muestra de 7, slo 4 o sea alrededor de 51% piensan que e> seguro usar cajeros aut>
maticos. La probabilidad, 0.0888, significa que slo alrededor de: 8.88% del tiempo se presentarta al
este resultado (4 de 7) en esta poblacin.
8 frecuente que lo> problema> de llegadas aleatoria> sean descritos por Ja distribucin de Pois
Si, en promedio, un banco tiene 3.8 clientes que llegan cada 2 minutos, emonces es probable que
preguntas de probabilidad acerca de llegadas especficas de cliente. se puedan contestar con el U'>O
la distribucin de Poisson con lambda igual a 3.8 y siendo de 2 minutos el intervalo. La probabili
de que no haya llegadas en un periodo de 2 minuto> (x OJ es .0224 obtenida con el uso de la t
A.3 del Apendicc. La probabilidad de que ms de cinco cliente. lleguen en un periodo de 2 minutos
.1844. Si se emplea un intervalo de 4 minutos, lambda" ajusta al duplicar lambda para satisfacer
intervalo duplicado que resulta en una lambda de 7.6 para 4 minutos. La probabilidad de obteoe
menos de tres dientes en un intervalo de 4 minutos es .O 188.

CAPITUW S 01~TRIBUCIO'l:E.~ Ol'>CRETAS 173

RESUMEN
Los expenmentos de probabilidad producen resultados aleade un experimento aleatorio \C denomina variable aleatoria. Las variables
a:eatoria) tal~ que el conjunto de todos (0$ posibles valores es
a lo sumo un numero finito o contablemente infinito Je valores posbtes se llaman variables aleatorias discretas, La> varia
bles aleatoria.' toman valores en todo> los puntos sobre un
i::::tm-alo dado y se denominan variables aleatorias discretas.
Las distribuciones continua. se construyen de variables alea
lOria.s continuas, Tres distribuciones discreta. son la dstribucin binomial, la distribucin de Poisson y la distribucin
:pergromtrica.
La distribucin binomial se adapta a experimentoscuando
posible> slo do> resultados mutuamente exclusivos, En
rrorla, cada intento en un experimento binomial debe ser in
dependiente de 10$ otros intentos, No obstante, id tam:iilo pobbcion:al e suficientemente grande en relacin con tamallo
cuestral (n < 5%S), la distribucin binomial se puede usar
donde sea aplicable en caso> donde (0$ intentos no son independientes. La probabilidad de obtener un resultado deseado
en cualquier intento se denota como p. que es J;a probabilidad
dt obtener un suceso. La distribucin binomial se puede usar
~ analizar estudio, discretos que comprendan cosas como
;;;ua;'cruz. defectuoso/bueno y hombre/mujer. La frmula
bmomial se U$.1 para determinar la probabilidad de obtener x
=ltados en n intento' Lo problemas de di\tnbucin binose pueden resolver mas rpido con el uso de cuadros
bom1tles que por frmula. Una cuadro binomial se puede
;orios. tina variable que contiene los resultados

construir por cada par ditcrcntc de valores n y p. la tabla A.2


dd A~ndice A contiene cuadros binomiales para valores
seleccionados den y p. La media. o promedio a largo plazo, de
una Jmbudn binomial es m = n p. La desviaein estn
dar de una disrribucin binomial l'S Vn p q.
La distribucin Je Poisson se utiliza por lo general para
analizar fenmeno que producen >UCCSO> poco comunes. la
nica informacin necesaria para generar una distribucin de
Poisson es el promedio a largo plazo, que se denota por lambda
(>.). La Jistnl>udn de: Poisson e> propia de suceso de algun
intervalo. Las suposiciones son que cada suceso e> independiente de otros sucesos y que el valor de lambda permanece
constante en todo el experimento. Algun~ ejemplo de experimemos del tipo Je Poisson son el nmero Je errore por
p.igina de papel, numero de accidente> por 1 000 vuelo> Je
aerolneas comerciales, y numero de llamadas por minuto en un
conmutador. las probabilidades de Poisson se pueden determinar ya sea por la frmula Je Poisson o las cuadro. de Poisson Je:
la tabl.i A.3 dd Apndice A. Lambda es tanto la media como la
\"U.1n1.a de una distribucin de Pois-.on. La distribucin Je
Poisson se puede usar para calcular problema> de distribucin
binomial cuando n es grande (n > 20), p O pl"<Ucna y 11 p :S 7.
La distribucin hpergeomtrica () una distribucin di>
creta que sude usarse para experimentos tipo binomial cuando
la poblacin es pcqueila y finita y el muestreo se rcali1a \in restitucin. Debido a que usar la disrribucin hipergeomtrica cs
un procese tedioso, usar la distribucin binomial siempre que
sea posible c.generalmente m.U ventaioso.

TRMINOS CLAVE
distribucin hipcrgeomrica
distribucin de Poisson
lambcla(X)

t.::stribucin binomial
=nbuciones continuas
.::suibucionesdisaetas

variable aleatoria
variables aleatorias continua>
\-ariablo aleatorias discretas

valor medio o esperado

FRMULAS
\'alor medio (esperado) de una distribucin diKrcta

Oe$'iadn estndar de una distribucin binomial

E(x) ~[x P(x)]

\'arianu de una distribucin discreta


q2 L{(x -)2. P(x)]

Frmula de Poisson

Desviacin estndar de una distribucin discreta

"= J~(x-1)2 P\x)I


Frmula binomial

.c.. P' q"-~

,,,

.
P" q"-"
.x!(n-xl!

Media de una distribucin binomial


1 r1p

Frmula hipcrgcomttrica

CONSIDERACIONES TICAS
de cliltribucianel dilama
.......
11_.latlilb
lllltituci6n. ll t1m11oy.. ~"

Deben destacane ftriol pullCol ~del


~y/OA!pCllKKlllelelelllnllocleben
Sltu8C10IMI

doadetl........,

UIO

..imm

La
eD

.._

facmt al mu la dilaillud6u ele PoillOll pera calc:uJar v.olllemm libim l da Ba cWI; 1 a de


los cb ca-. DO lllilfarl8p MM lWI puede raullar 111 ......_
fllllL
Cuando 11 -.
el _, de diltribucionft binomilla ,.. ....,
....
E' fr1 ele
valor "se hlcr .....,.....,
pan tomar decilionea. Aun cuado 111 ,....,..., da - -ntiwncDlfcanma.,cumclo 11 a hice .-pw1t.1a pl'oWlAWdratllqaia'wlat.,....
br te mtacir ponp hlY ...
entre loe aJlles diYidir ... pdllll''
da ...........
"
- 100.,, .so. ..
de 1l 50el .1796. Ea. pn>WIW
rr be;. aun camelo
50 w el valor aperedo dt esca clilcribad6a ....._el
wlar _..
problble ... -.
....
6111
illd110DV.,.cildD..W..,.zhrU:
1

,...,...w...ae.

.. ..._,..,....,....._ ,

..-w,..--.

e1e..mr...- ......

.. rst

a prMlltz n --Jl(s 50) .-fts


50
En _ _.
l
-lllftltlO ele ... lbadda ele Poilloa. Alguw luwlllplaM puedm pmdudr 1 t fo .._,_
qmel wlardrA Clllllbla
atadlo. PorfjempD.-.ci ..........
..._tlwlarA
panel..._.,dr
...... eledBoaaunadmdaele,...._..
,,_ .,.,_.,
clk:leat.&Comocldeuae
1111 mes8Clho en
ele
elmocletlllpera
, .. 2,...
ee....., lllfa luipwoplrlllo.,.
cieno paneo. no aklD.
Loe tmlftll dt Jalcio CIOlllO
IOD
1'1111 cllio ile
{tllt MI lit
ftlca.Sla
fllle ...
'J
, 1
lsl
IUplllicbler 1plicado11alplOpiadu dt ettu tlllCIL La mapaddlll eMa di 111 's 'jan

..._an

dradwclf,..._dl......,,._ .....

proMllen
apertolell~

hacerlo 111 lbtt el canuno pen tomas de decisiones no fticls.

PROBLEMAS COMPLEMENTARIOS
C.lculo de ntad1sticas

5.37

S ..H Resueh11 las prob.lbilidadcs de los siguimtr$ problemasde


distribucin binomial con el uso de la frmub binomial.
a. Si n

11 y p

.23, cuil

a.

b.

es b prob3bilid3d de que

6 y p .50, cul es la probabilidad de que


l
c. Si n 9 y P .SS, ~cul es la probabilidad de que
X> i?
d. Sin 14 y pe: .;o, cul es la probabilidad de que
xs 3?
r

'2

S.35

Uiilkt la tabla A.2. Aptndice A. para encontrar los \'alOl'e$


los siguientes problema$ de distribucin binomial.

de

a. P(ic 14ln
b. l'tx< Slri
c. P(x <:: 12ln
d. P(x > 20ln

lOyp .60)
IOyp .30)
IS ;y p .60)
25 y p .40)

S.36 Utilia b frmub de PoWon p.uu rnoh'tt las pro!W>ilid.i


des de los siguimtcs problmw de distnbucin de Polsson.
a. Si). 1..25, (cuiJ es la prebablidad de que X 4?
b. Si). 6.3;', ccW.I es b probabilidad de que x s 1?
c. Si ). 2.4. cul es 1.1 probabilidad de que x > 5?

P<x JI>- - 1.s>

P(x <

51>- 3.3)
2.1)
sp, "" 4.2)

c. P(x <:: 31>d. />(2 <X S

.?
b. 51

Use la tabla A.3, Apfodice A. p.ira encontrar los siguimtes valores de: distribucin de Poisson.

S.38

Re>ud\"a los siguimto problmw con d wo dt la fn=


h~eomttrica.
a. Si S .. 6, ri 4 y A 5, ~cul es la probabilidad

quex .. 3~
b. Si N 1 O. n 3 y A 5, cul es la probabilicd de
qu~ s H
c. Si ~ 13, n 5 y A 3, cul es b pr<>Nbilidad de
que x <:: 2?
Pruebe aua conocimiento

htdio por Pfter D. Han Research ~


para la :-;.ucUq S1ock Markct, se dctmnin q11t 20%
todo. lo> invtrsionstas de acciones son penona5 jubila~Adanis, 40% dt todos 10:1 adultos m udos Unido&
invierten en fondos mutuos. Suponga qut se loma mucsira al azar de 25 im~rsionistas en acciontS. Cuil
la prubablidad de que c:xacumente siete i<'an peno
jubila.Ju? Cu.U o la probabilidad de: que 10 o m4>

S.39 En un estudio

CAPmJLO 5 OISTlUBUCI0:-01'.S DISCRETAS 175

peno~ jubiladas? Cunw personas jubiladas esperana u red encontrar en una muestra aleatoria de 25 inver6ionisw en acciones? Suponga que se toma una muestra
al var de 20 aduhOi de a,tado. Unidos, Cul es la pro
babildad de que exactamente ocho adultos in\ icrtan en
fondos mutuos! Cuil es la probabilidad Je que menos
de seis adultos inviertan en fondo mutuos? Cu.il es la
probabilidad Je que ninguno de los aduhos inviertan en
fondos mutuos! QUI es la probabilidad de que 12 o m.li
adulto.' inviertan en fondos mutuos? Para que! nmero
exacto de adulto~ o la probahilidad ms alta? Cmo se
compara ~ta cifra cnn el nmero esperado!
5.40 Una gasolinera tiene una bomba que dimibuyc com-
bustible dibcl a automviles. El propietario estima que
slo unos 3.2 autos usan la bomba de disel cada 2 horas.
Suponga que las llegad.u de usuarios de la bomba de
disel son una djstribucin de Poisson,
QUI es la probabilidad de que tro auto. lleguen a
11$.lr la bomba de Jikt-1 durante un periodo de 1
hora?
b. Suponga que el propietario necesita cerrar la bomba
de disel durante media hora para hacer reparaciones, aun cuando le disgusta perder un negocio, Cul
es la probabilidad de que no lleguen autos a uar la
bomba de disel durante el periodo de mtdia hora?
c. Suponga que cinco autos U~ durante un periodo de
una hora para usar la bomba de: disel, Cuil e~ la pro
babi.lid.1d de que cinco o ms autos lleguen durante un
periodo de 1 hora a usar la bomba de di6d? Si en realid.id OCWTC este resultado. que! podra conduincl

5.0

FJ l\ational Cerner for Health Statistia reporta que 25%


de todos los ntadounidcmt~ entre 65 y 74 aAos uenen
un padecimiento crnico del corazn, Supongamos que
el lector vive en un estado donde el ambimtc es propido para una buena salud r estr~ bajo, y que las condicione:~ en ese estado promueven corazones sanos. Para
inve tigar esta teora, el lector rcafa una encuesta tde
fnica aleatoria de 20 persona de entre 65 y ;.i aflos de
su estado,
Con base en la cifra del National Centtt for Health
Statisucs, cul es el numero aperado de personas
entre 65 y 74 afio en JU encuesta que timm un
padecimlento crnico del corazn!
b. Suponga que slo una persona en ota encunta time
un padecimiento crnico del corazn. Cu.al o la pro
babildad de tener una o mCOO) penona. con padecimiento crnico del corazn en una muestra de 20, si
25'!11 de la poblacin de esta edad time este problema
de salud? A partir de los daros muotralo, qu con
cluyc usted a.:crca de su estado nattH

S.44 t:na encuesta rcall..1da por la l"orthwntcm Nauonal Life


lnsurance Company m~16 que 70% de tratMjadom esta

Cuil o la probabilidad de que exactamente tres pie


za se hicieran en la mquina A?
b. Cul es la probabilidad de que la mitad de las piczu
se hicieran en cada mquina?
c. cCuil es la probabilidad de que toda> las piezas se
hicieran en la mquina B?
d. Cuil es la probabilidad de que: siete, ocho o nueve
picz~ se hicieran en la mquina B?

dounidenses dicen que el estrt. del trabajo In causa pro


blemas frecuente. de salud. Cno de cada tres dijm>n que
esperaban consumirse en el trabajo en un futuro cercano,
Treinta r cuatro por ciento dijeron que el allo pasado
pensaron seriamente en renunciar a \U trabajo por el
mm, de los cuales 5)% dijm>n que con much.'I frecoencia se lci. peda trabajar m.t. de 40 hor<b a la $CJT11Da.
a. Suponga que se scldona una muestra aleatoria de 10
trabajadores estadounidenses, Cuil es la probabilid.ad
de que ms de siete digan que el ntr~ del trabajo les
caw problema. frecuento de salud? Cuil es el nmero esperado de trabaiadore que dicen que el estrs
del trabaio lo caus frecuentesproblemas de salud'
b. Suponga que se selecciona al aur una muestra de 1 S
trabajadorc. ~tadounidcnso. (Cuil o el nmero cspe
rado de estos trabajadores muestreado. que dipn cpe
.e con<umirn en un futuro cercano? Cul es la probabilidad de que ninguno de los trabajadores d:p
que se con.urnir en un fururo cercano?
c. Suponga que al azar se IC!ecdona una muestra de sxtt
trabajadores. Cul es la probabilidad de que los
,iet<' digan que con &ecuenc .e les pide uabzja: ch
de 40 hora. por semana' Si
realidad ocwu es:t
resultado, qu podria co<1c
d lcaor~

5.4.? Suponga que, por cada lote de 100 chips de computadora


que produce una compai'a. un promedio de 1.4 son de
fectuosos. Otra compat\ia compra muchos lotes de esto
chips a la \~1.; uno de otos lotes se selecciona al arar y se
prueba en busca de defectos, e; el lote probado contiene
mis de tres defectos, cl comprador mhazan todo el
lote enviado en esa remesa, Cul es la probabilidad de
que el comprador acepte los lotes? Suponga que los
defectos por lote son una distribucin de Poisson,

5.45 De acuerdo con Padgcn Business 5ervia:5., ~de lodos


10> propietaria. de pcqudlos negoaos dm cpe d COD
5<'jo m~ importante' pa.ra inicu.r un DC'toOO es pnpa
ran.e para larg,i. horas y trabajar duro. \'cmtlCUXl) por
ciento di.:en que d consqo ms anpo:umc es tmcr listo
un buen linandamicnto. ~-in~
por aemo dicm
que: tener un buen plan es el consejo ms unporunte;
18% dken que cstudiar b industria es el consejo ms
importante y 1 'li citan otros consejos. upor.ga el ltaor

S.~1 En una planta manufacturera en particular, dos maquinas (A y B) producen una pina especial. Una mquina
(B) es mis nueva y mis rpid.i. En un periodo de 5 minutos se produce un lote formado por 32 piezas, 22 de l.u
cuales son producidas por la mquina By el resto por la
nquina A. Suponga que un inspector selecciona al azar
doce peus de este lote.
L

116

ESTADISTICA E~ LO) l'EGOCIOS

que se entrevista a 12 propietarios de pequd'l< negocio,,


y suponga tambin que los porcentajes se cumplen para
todos los otros propietarios de ptqumo> negocios.
a. Cul es la probabilidad de que ninguno de lo> propietario> diga que prepararse para~
horas y trabajo duro es el consejo ms importante!
b. Cul es la probabilidad de que .e o ms de los propietarios diga que prepararse para largas horas y trabajo duro e. el consejo m.4 importante?
c. Cul es la probabilidad de que exactamente cinco
propietarios digan que tena lllto un buen financiamiento e. el consejo ~ imporunte?
d. Cul es el nmero esperado de prop~
que drian
que tener un bum pbn es d consejo ~ importante?
S.46 De acuerdo con un estudio reciente, la probabilidad de
que un pasajero presente una queja ante el Department
of Transportation. :tara de una aerolnea estadounidense en particular, es .000014. Suponga que al azar se
seleccionan 100 mil~
que volaron en es1a aerolnea en p.irtkulu.
1. Cul es la probabilidad de que exactamente cinco
pasajeros presenten quejas?
b. Cul es b probabilidad de que ningn pasajero presente quejas?
c. Cul es b probabilidad de que ms de sc pasajero>
pmcmm qucja5?
S.47 Un otilista de pduqun ba estado un ano en este nego-

cio. Sesenta por ciento de sus diemes entran sin cita. Si al


uar muestrea ocho de las personas de la fta de clientes de
la 1ernana p.is;ida. cuiJ es b probabilidad de que tres o
menos entren sin cita? Si en realidad ocurriera este resultado, cu.ilcs iCrlan aJgmw de las explicaciones para ello?
S.48 Segn el US Ccn5u Burau.alttdedorde 20%de I06 residentes de ldaho ,;,-mm zonas mctropoti~
i::.te por
cenuje es el m.4 baio de los SO ~os de la l:nin. Una
compafa de ventas por aaUJoso de Georgia acaba de
adquirir una fta de consumidor-e. de ldaho, Su analista
de mercado selecciona al azar :!5 personas de esta l$ta.
Cul e> la probabilidad de que exactamente ocho
persona. vivan en zonas metropolitana>?
b. Cul es la probabilidad de que la analista obtuviera
ms de 10 persona. en esta muestra que vivan en
zonas metropolitana6?
c. Suponga que la analista obtuvo ms de 10 personas
que viven en zona> metropolitanas del grupo de 25.
Qu podrta concluir db acerca de la lista de la compata de consumidores de Id.abo? Qu podra con
cluir eUa acerca de lo> dato> del censo?

1.

S.49 Suponga que, por cada viaje de vacaciones familiares en

auto de m.h de 2 mil millas, en promedio ocurre .60 de


falla de neumticos. Suponga tambin qe toda la distribucn del numero de fallas de neumtico, por viaje de
ms de 2 mil millas es de Poisson, Cul es la probabilidad de que una familia haga un viaje de mis de 2 mil

millas y no tenga fallas de neumticos? Cuil es la pro


babilidad de que la familia tenga tres o ms fallas de
neumtico. en ese viaie? Suponga que los viajes son
independientes y el valor de lambda ~ cumple para
todos lo> viajes de ~de 2 mil millas. Si una familia hace
de viajes d m.4 de 2 mil millas durante un verano, cu.U
es la probabilidad de que la familia no tenga problemas
de neumticos en ninguno de esto. do. viajes?
S.SO La publicacin Editor and Publisher Ytarbook publica
cifras acerca de lo> principales peridicos de Estado>
Unido>. A continuacin \'Ca/110$ los 25 principales diarios de Estados Unidos, clasificado> de acuerdo con >U
circulacin.
Lugar
1
2

3
4

6
7
8
9
10
11
12
13
14

IS
16
17
18
19

20
21
22
23
24

2S

Pttidko

!\""'York Time. (1''Y)


Lo Angele> Times (CA)
WaJiington Po5t (DA)
Kcw "rk Daly ~ews (KY)
Ocago tribune (IL)
Long lsland K~scby (ISY)
Housten Chronicle(TX)
Dallas Morning K~ (TX)
Otiago Sun-Times {IL)

Boston Globe (MA)


5An Francisco Chroniclc (CA)

PhotnixAru.ona R<publc (AZ)


Kcw York Poo1 (~'Y)
Denver RoclqMoun1am "~"' (CO)
Deneer Poot ( CO)
!\cwark Slu Lcdgcr (NI)
PhiWklphu lnquittr (PA)
San D1qo Ynion-Tnbune (CA)
Dctroil Pree Pm> (MI)
OC\dand Plain Dealer (OH)
Orangc Country ~lr (CA)
Portland OrcgoniAn(OR)
Maami Htrald ( FL)
MumeapoJi,Sm Tribune (MN)
St. Pncnburg TunQ ( fl)

Suponga que una investigadcra de-ea muestrear


parte de estos peridico> y comparar los tamaosde
secciones de negocios de los peridicos dominicales.
azar ella muestrea ocho de estos peridicos.
1. Cul e. la probabilidad de que la muestra cont
exactamente un peridico localizado en el estado
Nue..-a York?
b. Cul es la probabilidad de que la mitad de los~
estn dasj6oit!o,,, enue los 10 primeros por circulaci::
c. Cul es la probabilidad de que ninguno de
peridicos estn localizados en California?
d. Cul es la probabilidad de que exactamente tres
los peridicos estn localizado> en estado>
empiezan con la letra M?

CAPfnlLO S DIST1UBUOO.SE5 DISCRETA:. 177

Una oficina de Albuqumuc tiene 24 trabajadores incluyen 5.55 Suponga que en la operacin de contabilidad de una gran
do b gercnda. Ocho de~ trabajadores \'iaian de un suburcorporacin, la probabilidad de un error de registro en
bio a su trabaio dock d bdo oeste del rio Grande (Bra'O).
cu.11quicr facturacin es .005. Suponga que b proNbilidad
Suponga que Iris de b olicinbw al azar se sdeccionan.
de un error de reg~tro de una fa.:turadn a b siguiente
es constante y un audtor muestrea al azar mil facturas..
a. Cul es la probabilidad de que lo> ~b trabajadores
a. Cuil es la probabilidad de que menos de cuatro fac
viaien de un suburbio a su trabajo desde el lado oeste
ruraciones contengan un error de registro?
dd no Grande?
b. Cuil o la probabilidad de que ninguno de lo. trab, Cu!I es la probabilidad de que m$ de JO actura
cienes contengan un error de facturacin!
baiadores viaje de un suburbio desde el lado oeste del
rio Grande?
c. Cul es la probabilidad de que la. mil facturaciones
c. Cil probabilidad. (a) o (b) es mejor? Por qu pim>a
no contengan errores de reg~tro?
eso.
5.56 De acuerdo con la American Medcal Association, aire
d. Cuil es la probabilidad de que la mitad de lo. traba
dedor de 36% de todos 10> m~CO> estadounidenses de
jadores no viajen de un suburbio desde el lado oeste
meno. de 35 ai'i0> de edad son mujeres. Su companla
del ro Grande?
acaba de contratar ocho mdicos de menos de 35 ai'io> y
ninguno es muier. Si un grupo de doctoras mujeres desea
.!.5.? ~
d U.S. Census Bureau, 20% de ~ traba~ra de
demandar a su compaa por prctiau discriminatorias
.\ll:uua usan transporte publico. Si se seleccionan al azar 25
de contratacin, tendra usted un caso dificil con base
trabajadores de Atbnta, cu.tl es d numero esperado que
en estos nmero? Utilice la distribucin binomial para
use transporte pblico? Gra6que b distnbucin binomial
determinar la probabilidad de que el resultado de la con
para e.ta muestra. Cu.iles son b medja y la desviacin
tratacin de la compaa ocum al azar y comente sobre
esndar para esta di)tnbucin? Cul es b probabilidad de
la potencial justificacin para una demanda.
que ms de 12 de los trabajadores seleccionados usen
transporte pblico? Explique conceptualmente y a par 5.57 El siguiente cuadro es una lista de las 32 m.is grandes
ur de la grfica por qu obtendra usted esta probabiliuniversidades de futado. Unido~ de acuerdo con cifras
dad. Supongamos que el lector muestrea al azar 25
de inscripciones de \\orld Almanac.
trabajadores de Atlanta y en realidad obtiene 14 que
Ull.Ya'Sidad
hucritos
us.in transpone pblico. Es probable este resultado?
Univtrsiy of Phoenix (AZl
66SJ4
<Cmo podria explicar usted este resultado?
~

s..;J lina de las primeras aplicaciones de la distribucin de

Poisson fue para analizar llarnadas entrantes a un con


mutador telefnico. Algunos analistas generalmente
piensan que las llamadas telefnicas aleatorias son dutribuciones de Poisson. Suponga que las llamadas tele
fnicas a un conmutador llegan a un ritmo promedio de
2.<I llamadas por minuto.
a. Si una operadora desea tomar un descanso de un
minuto, cuil es la probabilidad de que no haya lla
mad.i6 durante un intervalo de un minuto?
b. Si una operadora puede manejar a lo sumo cinco llamadas por minuto. cul es la probabilidad de que la
operadora no pueda manejar las llamadas en ningn
periodo de un minuto?
c. Cuil n la probabilidad de que exactamente tres llamadas lleguen en un intervalo de do> minuto>?
d. Cuil es la probabilidad de que una o menos llama
das lleguen en un intervalo de 15 segundos?
5.54 $lo 1% de todas las familias esudounidenses

no tienen
televisor a color. Un analilta de mercadeo de televisin
selecciona al azar 160 familias estadounidenses.
a. Cuntas familias esperana ti que no tengan televisor
a color?
b. Cuil es la probabilidad de que ocho o ms familias
no tengan televisor a color?
c. Cul es la probabilidad de que entre do> y sei> famila> [inclusive) no tengan televisor a color?

Uni\usiry ofTeras at Ausun (TIC)

Ohio Sme Uni'm11}'-Columbu. (OH 1


Univmity of Mnnesota (~t!\)
IJnh-mity of Florida t FL)
Arizona Smt IJnh-mty (AZ)
Tcus A&~t Univmiry--Collegt Station (TIC)
\lichigan Statt Unhmity (~U 1
Uni~ty of W'11COnsin-Madison (WI 1
Pmnsyh-aniaSuie-UnivmityPark (PA)
Ul\l\-mityo lllinoiJ...Ownpaign t IL)
Purdue Uni,'tmty-\\est u~1e
Univnsity of Michipn (MI)
~tw York Uni,rn.ity (:-.'Y)

(l~'l

Indiana Uni,'Cr>lty-Bloomington (1~")


Unitt>ity of California at Los .Angda (CA)
Univnsity of Wuhington( W:\
Univmity o South Florida t FL)
Rut8ff1 Uni~nity (:-111
Unh~nity of Arizona (AZI
Florida Statt Uni\Tnity ( FL)
Unl\-mityof Cmtral Florida (FL)
Unhmtyof Maryland->lkge Park (MD)
Brigham foung Unl\Tn11y(UT)
Un"-mityof Houston (TXl
Florida lntmiatoml Unh'mV (FL)
San Diege State Uni,'t'nlty (CA)
Univ~ty of Califonm at Bcdn- lCA)
Unirn.ity of Gorg (GA)
California State Uni.-enityLong 8rach (CA)

l.Duiuans 'itate Unhnuty (U.)


Waym \me UnMni1y (MI)

49996
47952
45481
45 11~
44126
44 026
4) J6
41 219
405il
3;965
3;8il
37 59S
3; 150
3; (r.6
'6
'6134
'6015
JS2J7

JH60

JJ951
33 713

"I

315.S4
31123
31945
31609
31 ).47
31 2SS
30916
30861
30405

Si de la lista se seleccionan al azar cinco universidades difcttnt~. cul es la probabilidad de que tres de
ellas tengan 40 mil o m alumno, inscritos?
b. Si de la lista se seleccionan al azar ocho universidades
diferentes, cu.il es la probabilidad de que dos o
menos san universidades de Michigan o Arizonal
c. Suponga que las universidadesse seleccionan al azar
de la lista y con restitucin. Si se muestrean cinco
universidades, cu.il es la probabilidad de que la
muestra contenga exactamente dos universidades de
Texas?
5.58 En una ciudad de la Regin Central, el gobierno tiene 14
cuas recuperadas, que al evaluarlas resulta que valen
casi lo mismo. Diez de la:. casas estn del lado norte de
la ciudad y el resto estn en el lado oeste. Un contratista
de la localidad remite una cotizacin para comprar cuatro de las casas.
a. Cu.iles de las casu que obtendr el contratista est
sujeta a retiro aleatorio?
b. Cul es la probabilidad de que las cuatro casas seleecionadas por el contratista estn en la lado norte de
la ciudad?
c. Cu.il es la probabilidad de que las cuatro casas selecdonadas por el contratista estn en el lado oeste de la
ciudad?
5.59 El Public Citizen's Health Research Group estudi las
-cvcr.u acciones disciplinaria, que se tomaron durante
un ao reciente a doctores no federales en Estados
Unidos El promedio nacional fue 3.84 acciones severas
por mil doctores, El estado con el nmero mas bajo fue
Mmncsota, con 1.6 acciones severas por mil doctores.
Suponga que los nmeros de acciones severas por mil
doctoro en Estados Unidos y en ~linnt.)Ota son distribuciones de Poi-wn.
a. Cul e> la probabilidad de seleccionar al azar mil
doctores de E:.tad~ Unid~ y no encontrar acciones
severas tomadas?
b, Cul es la probabilidad de seleccionar al azar 2 mil
doctores de Estados Unidos y encontrar seis acciones
severas tomadas?
c. Cul es la probabilidad de seleccionar al azar 3 mil
dcetores en Minnesota y encontrar menos de siete
acciones serias tomadas?
Interpretacin de le Nllde

5.60 Estudie la salida Mll'ITAB. Analice el tipo de distribucin, la media, desviacin estndar y la razn por la que
las probabilidades caen como se ve aqui.

Probablity
Binomial

X
0.00
1.00
2.00
3.00
4.00
5.00
6.00
7.00
8.oo
9.00
10.00
11.00
12.00
13.00
14.00
15.00

Oenaity

Function

n 15 and p 0.36000

with
P(X X)
0.0012
0.0104
0.0411
0.1002
0.1692
0.2093
0.1963
0.1419
0.0798
0.0349
0.0118
0.0030
0.0006
0.0001
0.0000
0.0000

5.61 Estudie la salida Excel. Explique la distribucin en trminos de forma y media. Son estas probabilidades bs
que se esperaran! Por qu si o por qu no?

1
2
3

'5
e

7
8
9
10
11

Poiaon Probebilities: A 2.78


0.0620
0.1725
0.2397
02221
0.16
00858
0.0398
0.0158
0.0055

o.

17
0.0005
0.0001

5.62 Estudie la salida grfica de Excel. Describa la distribucin y explique por qu la grfica toma la forma que K

ve aqu,

cormo s nisTRIBUOO:-b
Ol>lnbun binomlol: " - 22 'p - .64
o.i ......~~~~~~~~~~~'--~~---,

0.11
0.11>
0.14
~

DISCRETAS 179

5.63 tudie la grtfia ~llNITAB. Discuta la distnbuctn


incluyendo tipo, forma y resuhados de probabilbd.

O.)

0.12
0.1
0.08

0.2

0.1

;a

0.06
0.04
G.02

04-..~ ........~-.a.~~41.1,L.l,l.IJu,lol:i.u.u.i,i;~~
O 1234

S 6 719101112Ul41Sl6171119l02122
\'llom.r

10

ANLISIS DE LA BASE DE DATOS


t. Use la base de datos de manufactura. Cul es la proba
blidad de que una indus1ria de cdigo SIC al azar
seleccionada 1enga un valor de embarques industriale,
igual a 2? Use esto como el valor p para un experimento binomial. Si usted fuera a seleccionar al azar 12
industrias de cdigo SIC, cul es la probabilidad de
que meno) de tres tengan un valor de embarques
industriales igual a 2? Si usted seleccionara al azar 25
industrias de cdigo SIC. cul es la probabilidad de
que exactamente ocho tengan un valor de embarques
industriales igual a 2?
1.

Use la base de datos de hospital En esta poblacin de


200. cul es la subdivisin entre hospitales que son
hospuales generales y hospi1ales ~iqui.atricos? Con d
uso de estas cantidades como subdivisin de la poblacin y la distribucin bipergeomtrica, cul es la probabilidad de seleccionar al azar 16 hospitales de esta

base de datos y obtener exactamente nueve que sean


ho piules ~qui.itricos? Con el uso del nmero de hospitales privados en esta base de datos, calcule p probabilidad de que ~ un hospital privado. Ahora use la
frmula binomial para determinar la probabilidad de
seleccionar al azar 30 hospitales y obtener exactamente
1 O que sean privado .

3. Utilice la base de datos financiero) de compal\as fabricantes de productos qumicos, Si cinco de estas compaas se seleccionan al azar. cul es la probabilidad de
que exactamente tres tengan un rendimiento sobre
capital contable de 15% o m.u1 Su~~ncia: use la dstribucin hlpergeomtrica y una subdivisin de esta
poblacin de 19 compaas para calcular esta probabilidad. Cul es la probabilidad de seleccionar al azar ocho
compaas de seguros y obtener exactamente cuatro de
ellas con rendimientos promedio de menos de 1 %?

CASO: FUJI FILM INTRODUCE EL APS


pnnap1os de la dcada de 1990, fuji Photo Film, USA, uni
con cuatro de sus rivales para crear el sistema avanzado
tografia (APS) como el primer perfeccionamiento imporen la industria de pelculas desde que se introdujo la tec. de 35 mili.metro'- En febrero de 1996, se lanz el nuevo
~
de 24 mili.metro) que prometa fotografbs ITlU claras y
nldas. Para finales de ese afio. la falla de comunicacin
abasto l.imtado de productos hizo enojar a vendedo~ y~
=um.idores se sintieran frustrado .. Casi no exi.stla publicidad
como el producto lo fabricaban cinco industrias rivales, I~
=;>afilasllegaron a un acuerdo secreto en d que nadie fuera
~ b admm~tracin de la compal\ia, induvendo el personal de
conocerla IOl detallo sobre el producto ha)ia que cada
copa!tla introduicra sus productos APS el mismo dia. Cuando
producto se introdujo. en realidad lleg con poca informaaa a vendedores a detalle sobre el producto y pnlctiarnente
capacitacin a representantes de \'tola) del producto (de
~

modo que pudieran hacer demostraciones y aplicar las carac


leristicas ), a~
de que se tuvo una ~ube)timacin consickn
ble de la demanda por este producto. Afonunadamcnte. Fuji
pmion al adoptar la J)O'IUra de que la honesddad es b 1DtJOf
politica y explicar a vendedores y otros clientes lo qix babia
ocurrido y les pidi paciencia, Adem). aument su un
cin para comprobar mejor la posicin y tamIO dd merado.
Para 199i, habla multiplicado la produccin para Atisfxer b
demanda y aument la promocin a dientes, Los producto$
APS estaban camino dd hito. En 199 , las mara:s APS n
tenan 20% del mercado de airnaras para apuntar y cljsparar.
Anilisis
Supongamos que el lector es parte de un cqwpo Fui CU)'3
tarea es examinar problemas acerca de b partJCJp.Kin en d
mercado. aceptacin de clientes, qutjas y las razones por las
que los nuevos productos uenen xito.

180 E.STADIS-nCA E.' LOS :-.EGOCIO~


J. Como ya se dijo, para 1998 las cmaras APS tenan
20% del mercado de cmaras para apuntar y disparar.
En 2003 la participacin del mercado se aceraba a
40%. Supongamos que al azar se seleccionan 30 clientes del mercado de estas cmaras. Si la participacin
del mercado es en realidad 0.40, cul es el numero
esperado de clientes que compran una cmara APS?
Cul es la probabilidad de que seis o menos compren
una cmara APS' Suponga que usted en realidad obtuvo seis o menos clientes de APS en la muestra de 30.
Con base en la probabilidad que acaba de calcular, es
esto suficiente evidencia para convencerse de que la
participacin del mercado no es de 40%? Por qu si o
por qu no?
2. Suponga que las quejas de clientes sobre la pelcula de
24 milmetros son distribuciones de Poisson a un por
centaje promedio de 2.4 quejas por cada 100 mil rollos
vendido>. Suponga. adems, que Fuji tiene problemas
con embarques que llegan tarde y que un lote de 100
mil rollos proporciona siete quejas de clientes. Si se
supone que es inaceptable para la administracin que
el porcentaje promedio de quejas aumente, es esto

suficiente evidencia para convencer a la administracin de que el porcentaje promedio de quejas aument
o se puede escribir como un suceso aleatorio que ocurre."
con bastante frecuencia? Elabore la distribucin de
Poisson para ola pregunta y analice su implicacin
para este problema.
3. Un estudio de 52 lanzamientos de productos encontr
que los emprendidos con crecimiento de ingresos
como principal objetivo, tienen ms probabilidad de
fracasar que Jo, que pretenden aumentar la satisfaccin de clientes o crear nuevos mercados, como el sis
tema APS. Suponga que de los 52 productos lanzados,
34 fueron lanzados con crecimiento de ingresos como
su principal objetivo y el roto se lanz para aumentar
la satisfaccin del cliente o crear nuevos mercados,
Ahora suponga que slo 10 de estos productos tuvieron xito (los dems fracasaron) y siete fueron productos lanzados para aumentar la satisfaccin del
cliente o crear un nuevo mercado. Cul es la probabilidad de que este resultado ocurra al azar? Que nOI
dice esta probabilidad sobre la premisa bsica con respecto a la importancia del objetivo principal?

USO DE LA COMPUTADORA
EXCEL
Excet se puede usar para calcular probabilidades exactas o acumulativas para problemas con el uso de distribuciones bino
rniales, hipergeomtricas o de Poisson. Para cada uno de estos
clculos. el proceso se inicia al seleccionar la tecla Paste
Function.f,.. en la barra de herramientas, con lo cual aparece la
caja de di~
Paste Function (Pegar Funcin).

puesta. La primera lnea pide el nmero de xitos, x; la segunda es para el valor de ). )' la tercera es un valor lgico que
determina si la respuesta se da como probabilidad exacta
probabilidad acumulativa. Si el usuario responde con FALS!
en la linea, la respuesta ser~ dada como probabilidad exacta;
se pone TRUE en la lnea, la respuesta se dar como la probabilidad acumulativa de valore> entre cero y x.

Distribucin binomial

Distribucin hipergeomtrica

Para trabajar un problema de distribucin binomial con el


uso de Excel, seleccione el nombre de funcin, BINOMDIST,
de la caja de dilogo Paste Function. Aparece la cara de dilogo BINO~IDIST. Para usar esu funcin deben completarse
cuatro lineas de informacin. La primera pide el numero de
xitos, x; la segunda e> para el tamao muestral, n. En la ter
cera linea ponga el valor de p. la probabilidad de un solo xito.
La cuarta linea, acumulativa, es un valor lgico que determina
si la respuesta se da como probabilidad exacta o probabilidad
acumulativa. Si el usuario escribe FALSE en la lnea, la respuesta ser la probabilidad exacta de obtener x xitos en n
intentos: si escribe TRUE, la respuesta ">Cr la probabilidad
acumulativa de obtener de cero a x xitos. El resultado es el
valor de la probabilidad.

Cuando el usuario selecciona la opcin HIPERGEOMDIST


de la caja de dilogo Paste Function, aparece otra caja de diilogo. Para usar e)ta funcin deben completarse cuatro linea.
La primera pide el nmero de xitos en la muestra, x; la~
da pide el tamao muestral, n. La tercera linea e) el numero de
xitos de la poblacin, A, y la cuarta linea es para el tamao de
poblacin, N La salida ser un valor de probabilidad exacto.

Distribucin de Poisson
Los problemas de distribucin de Poisson se pueden resolver
con el uso de la opcin POISSON seleccionada de la caja de
dilogo Paste Function. En la caa de dilogo POISSON que
aparece, deben completarse tres lineas para obtener una res-

MINITAB
MINITAB Window) permite producir una distribucin bi!'l>rnial, una distribucin de Poi son. o una distribucin hrpergeomtrica. El proceso empieza por seleccionar la opcin Qt)c
la barra de men, con lo cual aparece el men descendente
Seleccione la opcin frobability ~i5tributions. Aparece
otro men descendente.
Distribucin

binomial

Para obtener una distribucin binomial, seleccione la opci=


D,inomial Aparece una caja de dilogo. De la caja, seleccioee
la forma en que las probabilidades se calculan para selecciomr

CA.PmJlOS l>l~TRJBUCIOSESOISCRETAS 181

Ra frob1bility, 'umulative Problbility, o Inverse


~ility. frobabiluy da Luprobabilidades eucw para cada
.:z: CumulJI~ Prob.ibiliry ds /.1prob.Jbilid.Jd scumulniv
:a:a todo> y cada uno de I< nmeros de ~ibles mios de cero
a.x.l!n'n'5C Probability dad inverso de Lu probabilidades acu" Numbcr of trills es el rama" maestral, n, y
~ility o( 1 suceess es el valor de p. Si el usuario daca tener
:lid.1dcs calculadas para vanos \-a.loro de x; pngalo> en
cnlumna, seleccione la opcin de columna de entrada. y
b !uta de la ubicacin de columna de lo> valores :c. Si slo
c:akular la probabilidad para un valor de x en particular,
die en Input const1111 y escriba el nmero de txitos que
evaluar, x. La salida sera la probabilid.ld exacta, la proba
acumulativa, o la probabilidad acumulati\'a inversa,
:::&::budndePoisson
obtener una distribucin de foisson, seleccione la
Polsson del menu descendente. Aparece una caja de
~ Sdcccione la forma en que la> probabilidades~ calculan
._ sO:caonar ya sea froblbility, Cumulative Problbility, o
~
Probability. frobability da las probabilidades exactas
~ valor x. Cumulati\'e Probability da la probabilidad
m-a para 1od0> y cada uno de los numeres de posible)
de cero a x. Inverse Probability da el n\'e> de las pro
es acumulativas. En la linea Mean escriba el valor de
~
tener probabilidades calculadas para varios valores
a 1;.pnpl:u en una columna, seleccione la opcin de colum-

na de entrada, y haga la fta de la ubicacin de columna para


los valores x, Si 5610 desea calcular la probabilidad para un
valor de A" en p.irru;u/~r. h.Jp .:/1<' en InputcoptlUlly cs.-rib.i
el nmero de txitos que desea evaluar, x. La salida ser la probabilidad exacta, la probabilidad acumulati\"a o la probablidad acumulativa inversa.
Distribucin hipugeomttrica
Para obtener una distribucin hipergeomtrica, seleccione la
opcin HYP"Seomctric del men descendente. Aparece una
caja de dilogo. Seleccione cmo se calculan las probabilidades al seleccionar ya sea Prob1bilid1d, Cumul1tive
Problbility o Jnverw Problbility. frobability da la> probabilidades exacw para cada valor x: Cumulative Probability da la
probabilidad acumulativa para tod< y cada uno de los numero> de posibles txita> de cero 1x. Inverse Probability da el
O\'tnO de lil> probabilidades acumulativas. En la cuarta lnea
escriba el tamao poblacional, S. En la siguiente lnea, escriba
el nmero de hita> de la poblacin, A. En la siguiente linea.
escriba el u.mmo muestral, n. Si desea tener probabhdades
calculadas para varios valores de x, pngalas en una columna,
seleccione la opcin de columna de entrada, y haga la fura de
ubicacin de columna de la> valores x. Si <lo dCRa calcular la
probabilidad para un valor de x en particular, haga clic en
lnput const1nt y escriba el nmero de xuos que desea evaluar, x. La Wida ser la probabilidad exacta, la probabilidad
acumulativa. o la probabilidad acumulativa inversa.

CAPTULO

Distribuciones continuas
OBJETIVOS DE APRENDIZAJE

El objetivo fundamental de aprendizaje del captulo 6 es ayudar al estudiante a que


comprenda distribucionescontinuas, con lo cual:
l. Entender los conceptos respecto a la distribucin uniforme.
2. Apreciar la importancia de la distribucin normal.
3. Reconocer los problemas de distribucin normal y cmo resolverlos.
4. Decidir cundo usar la distribucin normal para calcular problemas de distribucin binomial y cmo resolverlos.
5. Decidir cundo usar la distribucin exponencial para resolver problemas en negocios y cmo resolverlos.

182

Los rostros cambiantes de la industria de seguros

La industria de~
en&m1 muchos desaos en la dcada de 1990. Los mercados tradicionales
se desgastaron y surgieron nuevas oportunidades. En dcadas puadas, la. f~
tradicionales que
contaban con un solo ingreso se apoyaron en la cobertura de seguros de ,;da contra la muerte prematura del sostn de la familia. En esta dcada, lu parejas se c<Wn a mayor edad, tienen meno> hijos y a
veces son dos quienes sostienen la familia. ~w y otras tenden~ muJ1an menos dependientes de un
seguro de vida. De hecho. una encuesta realizada por Life lnsurance Marketing and Research
Associa1ion mostr que slo 59% de los estadounidenses creen que un seguro de vida es la mejor
manera de proteger financieramente una familia contra la muerte prematura del sostn de la famiha.
E!>ta cifra es menor a 72% de principios de la dcada de 1980. Financieramente, lOi anaf1as de esta
indu 1ria dicen que e 1a cada cue ta a las compar\iu de ~uros unos 700 mil millonl!li de dlares en
coberturas y 4 700 millones en ingreso por primas. Ahora. para realur nuevas \'tnla., lo> vendedores
de seguro observan de cerca otros mercados que antes eran poco utiliudos; por ejemplo, 10) tradicionalmente considerado, como re goso incluyendo familias con padres solteros o de bajO) ingr('S()> .
lo> seguro> de servicio medico, propietario de vivienda y de automvil, a.a como otros tipo de
aseguradores enfrentan situaciones difkilcs similare, excepto en lugares donde la cobertura de seguros
e obligatoria. El promedio de familia estadounidense ~ta S2 100 en todo tipo de seguros, de acuerdo
con la Bureau of Labor Staristics' Consumer Expendhure Survey, Es1a cantidad no incluye seguro
de servicio medico y de vida pagado en su totalidad o en parte por empleadores. Un desglose por tipo de
seguro es 39% por cobertura de servicio mdico, 33% por vehculos. 19% por seguro de vida y otro> se
guros perscnales y 9% para duei\os de viviendas y seguros relacionados.
La ubicacin geoglifica inOure mucho en las tarifas de seguro pagadas por consumidores. En pro
medio. un consumidor estadounidense gasta S69 l al al'IO en asegurar su automvil. Las tarifas ms alw
estn en r.;ueva Iersey (SI 100 al afio), Nueva York (S960 al aflO) y Hawai ($959 al ao). Las tarifas ma.'
baj~ eslin en Oakota del Norte, donde el promedio de tuifa por allo es $402. La cantidad promedio
en E!>tado. Unido> para asegurar una vivienda era de SHO, sin incluir a AJa.,ka y Hawai, Texas registr
el costo anual ms alto por asegurar una vivienda en $592. Maswchustll) en segundo lugar con SS48.
El promedio anual mh bajo se encontr en Wiscon,in. donde a de "6lo S27'1.
Los costos de seguro> tambin varan segn el valor del vehtculo y el tamano y ubicacin de una
casa. Es mh probable que familias con aduhos de mediana edad e hiios gasten m.ts en seguro El gasto
en seguros de servicio mdico tambin aumenta con la edad.

Preguntas gerencialesy estadsticas


l. En Estado> Unidos, el costo promedio anual de un seguro para automvil e) S69 l. Puesto que
ata cantidad varia por estados. localidado e individuos, cul distribucin de probabilidad describe mejor los costos anuales de seguro para aucomvil en Estados Unido)? Estos datos eswi
distribuidos de manera uniforme o normal? Si IO$ dato> estan dstribuidos de manera urufo:me. entre cules dos valores estaran 50% de la media? Si los data. aun distribuidos de manca
normal con una media de $691 y una desviacin estndar de Sl09, qu~ porcentaje de consurmdores pagan ms de S874?
2. Segn el estudio de la Bureau of Labor S1a1i>1ics', el costo promedio para ~ar
wa 'ivlmda
en Estados Unidos es de S420 al a/lo. Si lo> CO$IO$ para asegurar una son distribuidos de rm.ncn
uniforme. cu.U es la probabilidad de que un propietario de vivienda en part1culu ~~nos
de $-100? Suponga que los costos de seguro de vivienda estn distnbutdos de manera uruforme
en el estado de Texas. con un costo medio de S592 y una desviacin estndar de Si . ,Cuil es la
probabilidad de que un propietario de vivienda de Toa., seleceionado al aur, pague entre $500
y $650 por asegurar su vi\'ienda?

183

3. El estudio reportado por la Life lnsurance Marketing and Research Associaucn mctr que 2
de los consumidores de seguro. prefieren comprar seguros por teltfono o por correo, Supo
que se realiza un estudio de 80 estadounidenses seleccionados al azar. Cul es la probabilida:!:
de que 21 o ms de lo seleccionados piense que un seguro de vida es la mejor forma de proteger financieramente una familia contra muerte prematura del sostn de la familia?
4. Suponga que los cuadros con la anualidad de seguros muestran que, en promedio, 1.8 ~
hora son destruidas por incendio en Estados Unidos. Cul es la probabilidad de que t~
rra una hora y media sin que una casa sea destruida por incendio?
Fwnu:: adapudo dt n Lanon."lnwran<t 11 Rislr.': ~" ~""
oetubr< 1995,pp. SJS7; S.tloml ~
w..r.....,Comrnlssonm.71111\1111~ Jovnw/Alnwrw 1999. RocWcl J.Abop.cd.1ScwYork:a.llan1111e lloab.1999),p.

Mientru que el capitulo 5 ~ concentr en las caracterstica, y aplicaciones de distribuciones


creus, el capitulo 6 se concentra en informacin sobre distribuciones continuas, que se construyen
variables aleatorias continuas, en las que \C toman valores por cada punto respecto a un intervalo
y suelen generar experimentos en los que 101$ cosas se "miden" r no se "cuentan" Con dstrlbu
continuas, lu probabilidades de resultados que ocurren entre puntos particulares se determma::
calcular el rea bajo la curva entre esos puntos. Adcm.h, el rea bajo la curva es igual a 1. ~ num
distribuciones continuas en ctadistica incluyen la distribucin uniforme. la distribucin no
la distribucin exponencial, la disrnbucin 1, la distribucin ji cuadrada y la distribucin F. Este
tulo presenta la distribucin uniforme, la distribucin normal y la dismbucin exponencial.

6.1 DISTRIBUCIN UNIFORME


La distribucin uniforme, a veces llamada distribucin rcc1angular es continua y rdarivamenre
lla t11 la que la misma 11l111ra o f(x} ~ ob11cnc r11 1111 m11go de valores. La iguiente funcin de d
de probabilidad define una distribucin uniforme.
FUl\OOS DE DENSIDAD

DE PROBABILIDAD DE
UNA DlSTRlBUCIOS
l.'NlfORME

f(x)

1
-b-a
O

para <x <b


para todos l~ otro. valora

La figura 6.1 e) un ejemplo de una distribucin uniforme. En una distribucin uniforme o


tangular, el rea total bajo la curva es igual al producto de la longitud y el ancho del rcct!ngulo
igual a 1. Dado que la di~tribucin se encuentra, por definicin, entre IOi valores x de a y b, la lo
del rectngulo es ( b - a). Al combinar el clculo de e)la rea con el hecho de que el rea es igual a
altura dd rectngulo \C puede resolver como sigue:

f{xl

Distribucin
uniforme

~o

-----------...-

rn
'-----0,__

_1_

I
..,,

CAl'fTUl..06

DIST1UBtl00!1.'!SC0).1Th1:.\S

Arca de rectngulo (Longitudl(Altura)

185

=1

Pero
(b - a)

Longitud
Por tanto,

(b - a){Altura) .. 1

y
Altura-1(b-a)
~tos clculos muestran por qu, entre los valores x de a y b. la cllitrbucin tiene una altura constante
de l/(b - al.
La media y desviacin estndar de una distribucin uniforme estn dadas como sigue,
1=--

a+b
2
b-a

u=7i'

Surgen muchas situaciones posibles en las que los datos podran estar uniformemente distribuido). Como eiemplo, ~uponga que se prepara una lnea de produccin para manufacturar broches de
mquina en lotes de cinco por minuto durante un turno. Cuando lo) lotes se pesan, la variacin entre
106 pesos se detecta con pesos de lote que van de 41 a 47 gramos en una cllitribucin uniforme. La altura
de la distribucin es:
1
1
1
f(x)= Altura=--=---=(b-11) (47-41) 6
La media y desviacin est.indar de esta distribucin son:
Media=

a+b = 41+47
2
2

=~-
2

.
b-a
47-41
6
Deviaan estndar = ~
= ~:: -._112

._112

3.464

= 1.732

La figura 6.2 proporciona la distribucin uniforme para este ejemplo, con su media, desviacin estn
dar y altura de la distribucin.

Detenninacin de probabilidades en una distribucin unifonne


Con distribuciones discretas, la fun(in de probabilidad proporciona el valor de la probabilidad. Para
distribuciones continuas, I~ probabilidades se calculan al determinar el 4rea sobre un intervalo de la
funcin. Con distribuciones continuas, cualquier valor individual es posible pero tiene probab;!!cUd
cero. No existe rea bajo la curva para un punto individual. La )l(uiente ecuacin se usa para deterrmnar las probabilidades de x para una distribucin uniforme nitre a y Ir.
/(x)

:i:s:nbucin de
:esos de lote

----------!

___

----.-,-----..---. . .
u 1.732
___..;..
lPnos>

_/,A

186

ESTADISTICA E.-: LOS S'EGOOOS

l,'.~flf f$ ..

f{x)

Probabilidad
rHuelta en una
distribucin
uniforme

.5000

41
PROBABWDADES
EN\JNA
OISTRJBUCION
UNlFORME

------x

42

45

Pno. (gramos)

47

P(x)

donde:
a Sx1 Sx2

-xi
b-a

xi

Recuerde que el irca entre a y b o igual 1 l. La probabilidad para cualquier intervalo que in
a y b o l. La probabilidad de x 2! bode x sao cero porque no hay 'rea arriba debo abaio de a.
Suponga que en el problema de los broches de mquina deseamos determinar la probabilidad
que un lote pese entre 42 y 45 gramos. Esta probabilidad se calcula como sigue:
P(x)= x2 -x1 45-42 =!=.SOOO
b-a
47-41
6
La figura 6.3 muestra ~ta solucin.
La probabilidad de que un lote pese ms de 48 gramos es cero, porque x 48 es mayor que el
superior, x 47, de la distribucin uniforme. Un argumento similar proporciona la probabilidad
que un lote pese menos de 40 gramos. Como 40 o menor que el valor ms bajo del rango de dis
cin uniforme (41 ), la probabilidad o cero.

PROBLEMA DE
DEMOSTRACIN
6.1

Suponga que la cantidad de tiempo necesario pare ensamblar un mdulo de pl6stico vara di
a 39 segundos y que el tiempo de ensamble est uniformemente distribuido. Describa la di
bucin. Cu61 es la probabilidad de que un conjunto dedo tome entre 30 y 35 segundos? M
de 30 segundos?
Solucin

La altura de la distribucin es 1 12. El tiempo medio es 33 segundos con una desviacin


dar ele 3.'64 segundos.

""'

((xi./)

27

><33

v3.~
Tiempo (aegundotl

---x

39

PIJO<
-

X<
-

35-30
39-27

35)-

.1. 4167
12

Hay un .4167 de probabilidad que tome entre 30 y 35 segundos ensamblar el mdulo.

P(x < 30) a~


39-27

2..
. 2500
12

Hey un .2500 de probabilidad de que tome menos de 30 segundos enHmblar el mdulo. Como
no hay rea menor a 27 segundos, P{x < 30) se determina con usar slo el intervalo 27 s x < 30
En una distribucin continua, no hay rea en ningn punto (slo sobre un intervalo). Entonces
la probabilidad x < 30 es la misma que la probabilidad de x s 30.

PROBLEMA DE
DEMOSTRACIN

6.2

Segn la Natonal Auociation of lnsurance Commissioners, el costo promedio anual para un


seguro de automvil en Estados Unidos es $691. Suponga que los costos de asegurar un automvil estn uniformemente distribuidos en Estados Unidos con un rango de $200 a $1 182.
CuI es la desviacin estndar de esta distribucin uniforme? CuI H la altura de la dtstribucin7 CuI es la probabilidad de que el costo anual para asegurar un automvil en Estados
Unidos sea entre $410 y $8257
Solucin
La meda est dada como $691 El valor de a es $200 y bes $1182.

b
-;:-

(T

La altura de la distribucin es:

1_
1 182

200

Pj410 S X S 825)

1182

Ji2200 ... 283 . 5

~2 .001. x1 410 y

825-410 -~1182 200 982

x2

825

4226

La probabilidad de que una persona seleccionada al azar pague entre $410 y $825 anualmente
para asegurar su automvil en Estados Unidos es .4226. Esto es, alrededor de 42.26% de todos
los estadounidenses pagan en ese rango.
fM

__

..._
200

'10

" - 891 825


,,. 283..5

_.......__"
1 182

Uso de la computadora para resolver


probabilidades de distribucin uniforme
Con el uso de los valores de a, by x; MINITAB tiene la capacidad de calcular probabilidades pan b dis
tribucin uniforme. El calculo resultante es una probabilidad acumubU\11 desde el enmno 12quittdo
de la distribucin para cada valor x. Como ejemplo. la pregunta de probabilid.ad,P(410 s x s 25),
del problema de demostracin 6.2 puede resolverse con el wo de MIS'ITAB.

188 blADl~TICA E.'HO~ SK.o<:JO!,

TABLA 6.1
Salida MINITAB
para distribucin
uniforme

c:o.tiD_.

aauon oe zoo.ooo

125.0000
410.0000

PI 1

to

1112.00

C .,

O.&HS
0.2UI

MI!'.1TAB calcula la probabilidad de x s 825 y la probabilidad de x s 410, y estos resultados se maatran en la tabla 6.1. La respuesta final a la pregunta de probabilidad del problema de demostracin
se obtiene al restar estas dos probabilidades:
P(410 S

S 825)

= .6365 -

.2138 = .4227

Excel no tiene la capacidad para calcular probabilidades directamente cuando se usa la distribu
uniforme.

6.1 PROBLEMAS
6.1

Los valores siguientes estn uniformemente distribuidos entre 200 y 240.


a. Cul es el valor de ftx) para esta distribucin?
b. Determine la media y desviacin estndar de e:.ta distribucin.
c. Probabilidad de (x > 230) ?
d. Probabilidad de (205 S X S 220) ?
e. Probabilidad de (x s 225)
?
6.2 x est uniformemente distribuida sobre un rango de valores de 8 a 21.
a. Cul es el valor de f{x) para esta distribucin?
b. Determine la media y desviacin estndar de e:.ta distribucin.
c. Probabilidad de (10 s x < 17)?
d. Probabilidad de (x < 22) ?
e. Probabilidad de (x 2: 7) ?
6.3 El precio al publico de una caja mediana de una conocida marca de hojuelas de malz cuesta
S2.80 y S3. l 4. Suponga que estos precios estn uniformemente distribuidos. Cul es el pr
promedio y desviacin est.tndar de precios en esta distribucin? Si de esta lista se seleccioca
azar un precio, cul es la probabilidad de que sea entre S3.00 y S3. I O?
6.4 El promedio de volumen de llenado de una lata normal de refrescos es 12 onzas. Suponga que
volumen al llenarlas est entre 11.97 y 12.03 onzas y uniformemente distribuido. Cul es la
de esta distribucin? Cul es la probabilidad de que una lata seleccionada al azar contenga mb
12.01 onzas de liquido? Cul es la probabilidad de que ti volumen de Uenado sea entre 11
y 12.01 onzas?
6.S La familia estadounidense promedio gasta S2 100 al afio en todo tipo de seguros, Suponga que
cifras estn uniformemente distribuidas entre los valores de $400 y S3 800. Cul es la desvi
estindar y altura de esta distribucin? Qut proporcin de familias gasta m de $3 000 al alo
$CSUros? ~lh de S4 000? Entre S700 y SI 500?

62 DISTRIBUCIN NORMAL
Probablemente la ms conocida y empleada de todas las distribuciones es la distribucin normal
ajusta a numerosas caractertsticas humanas como la estatura, peso. altura, velocidad, coeficiente
lectual ( IQ), logros acadmicos y ailos de esperanza de vida, entre otras. Por otra parte, todos los
vi\"O~en la naturaleza como arboles, animales e insectos, entre otros, tienen diversas ca.racterislC3$
e:.ln normalmente distribuidas.

CAl'tTULO 6 DlSTRlBUOO!'-"ES 00!'-'ll!>'UAS 189

Muchas variables en negocios e: industria tambin estn normalmente: distribuidas,


Alguno. ejemplo. de variables que: podran producir mediciones normalmente distribuidu incluyen el costo anual de: ~ro familiar, d CO>lO de: rentar por pie cuadrado d espado en una bodega y la satisfaccin y apoyo de gerentes por la propiedad de una b.Ucub de
cinco punta.. Adem.L-. casi todo. lo. aniculm producidos o llenados por m!qumas estn
normalmente distribuidos.
Debido a sus difen:n10 aplicaciones, la dil.tribudn normal es sumamente importante,
Adem.is de las dininta. variables mencionadas que e>tn normalmente distribuidas, la distribucin normal y sus probabilidades asociadas QtJn integradas al control Je procesos
cstadisticos (vt.uc el captulo 18). Cuando se toman tamaos muestrales que son sufieieetemen te grandes, mucha. estadi>ticas cst.in normalmente disinbuida cualquiera que sea
la forma de la distribucin fundamental de la cual se toman (como se m0>tr c:n el captulo 7). La figura 6.4 es una rcpn:smt.uin gr.ifica de la distribucin normal: la curva normal,

IR~IIRA 6.4
la curva normal

JI

Historia de la distribucin normal


El descubrimiento de la curva de errores normal se acredita por lo general al matematco y atrnomo
Karl GallS) (17i7-1855),quien reconoci que los errores de mediciones repetidas de objetos e.tan a
veces normalmente distribuidos, Entcnces, la distribucin normal \C conoce a veces como dsrribuci6rr
dt Gauss o cun'll nomraldt mor. Una analogla moderna de la obra de GaUS> podN ser la distribucin de
mediciones de pina. producida. en mquina que a veces proporcionan una curva normal de: error
alrededor de una espc:ci.6cacin media.
En menor medida, tambin tiene algn credito Pierre-Simn de Laplace {17-i9-1827) por descubrir la distribucin normal. No obstante, muchas personas ahora piensan que Abraham de Moivre
(1667-17S4), matemrico francb fue el primero en entender la distribucin normal.De Moivrc determin que la distribucin binomial se aproxima a la distribucin normal como un limite. De ~loi\'l'e
trabaj con exactitud asombrosa. Sus valores de tabla publicados pua la curva normal estn a slo unos
cuanto) dcunilbmos de lo) cuadros de valores publicados actualmente,"
La distribucin normal tiene las siguientes caractersticas;

Es una distribucin continua.


Es una distribucin simtrica alrededor de su media.
Es aint1ica al eje horizontal.
Es unimodal.
Es una familia de curvas.
El rea bajo la cur.,.a es 1.

La distnbucin normal Q ,imttrica. Cada mitad de la distribucin es una imagen reflejada de la


otra mitad. ~lucho~ cuadro. de d:.tribucin normal contienen valores de probabilidad para slo un
lado de la disrribucn porque lo. valol"Q de probabilidad para el otro lado de la distribucin son adtn
ticos debido a la ~imetria.
En teora, la disrribucin normal o a<inttica al eje: horizontal: e decir, no toca al eje x )' n sino
pre en ca da direccin. La realidad C'.\ que la mayor parte de aplicaciones de la curva normal son experimento) que tienen lmites finitos de resultados potenciales. Por ejemplo. aun cuando las calificaaorxs
de exmenes de aptitud escolar (SAT, por sus ''~u en inglb) son analudu por la distribucin oormal.
el rango de cahficaeiones en cada parte del SAT o '6lo de 200 a 800.
A veces la curva normal se conoce como mna tn forma dt camparra. E. unimodal porqae n!otts
~amontonan en una parte de la grfica, el centro de la curva, La distribucin normal en rcalid.ad es coa
familia de curvas, Cada valor nico de la media y cada valor nico de la desviacin estncLu rcsulu en
una curva normal diferente. Ademh. ti drca toldl baio cualquier distrburi6n normal n 1. El ma bz;o b
curva proporciona lu probabilidades. de modo que el 1otal para una d:.tn'bucin normal es l. Debido
a que la dstribucin es simttrica. el rt"a de la distribucin en ada lado de b mcdia es 0.5.
0

'lohnA. lnramy Jotcpb C. \lonb, Suttmaf#~-'


~(Sao Dico: twcoun Btaa ~
Plzblishcts.
1989).
'RogrrE. Kirl.. ~
tssun: A Rt.wr .,. rlw Bc/Mn'iom! Wn<n 1~i..nun.,.. CA:. BtooLJCok Pllblisbio eo..1m.

Funcin de densidad de probabilidad de la distribucin normal


La distribucin normal se caracteriza por do) parmetro: La media,, y la doviacin c.tndar, o. lai
valores de y" producen una distribucin normal y la funcin de densidad de la distribucin nomli
es:
f(x)=

"ji;

t-(112ll{i-p)lo)t

donde:
=media de x
a dc~'-Ucin otndar de x
-:: - J.14159 .. y
t - 2.71828 ....

Debido a que la frmula tiene esta complejidad ~la para determinar ttaS bajo la curva es un tra
engorroso y lento. Prcticamente todo. le investigadores usan valores de tabla para analizar problnm:
de distribucin normal en lugar de usar esta frmula.

Distribucin normal estndar


Cada par nico de valores de 1 y a define una distribucin normal diferente. La figura 6.5 muestra
grficas MISITAB de distribuciones normales para le iguicntcs tres pares de parmetro :
l. 50yt15
2. u - 80 y t1 - 5
J. "' 50 y o - 10
~t~ que todo cambio en un parmetro ( o '1) determina una distribucin normal diferctr:t.
tita caracteri)tica de la curva normal (una familia de curvas) resulta tedio euando se analiza la
tribucin normal porque se requeriran los volmenes de tablas de curva normales, una por cada ca:::
binacin diferente de I' y" Por fortuna se ide un mecanismo para que las distribuciones normales
puedan convertir en una sola distribucin: o decir, la distribucin z, el cual proporciona la distribecin normal estndar (o curva), \'eamO) la frmula de conversin para cualquier valor x de una
tn'bucin normal dada:

1 FORMUU:

z=x-,
a

"""

La estadistica z es e/ nmero dt dcsviacionts estndar cuandoun 1alor x tSt arriba o abajo ih


mtdui.. i el valor de x es menor que la media, la estadstica z es negativa; si el valor de x o ms que
media, la <!$Udbtica z es po'iti"a; y si el valor de x o igual a la media, la estadstica z asociada es ce:
Esta frmula permite la convervin de la distancia de cualquier valor x desde su media, en unidades
dmiacin csndar. Una e-tadistica z ondar se puede usar para encontrar probabilidades para
quier problmY de curva normal que se convierta a estadsticas La distrbuen z es una disrrbu
normal ain una media de O y una ~vi.ui6n estndardt /.Cualquier valor de x en la media de una

z.

UM'PUm&

Curvas normales
para tres diferentes
combinaciones de
medias y
desviaciones
est~ndar

IT

o to

20

\'alorax

normal es cero desviaciones estndar desde la media. Cualquier valor de x que e<t a una desviacin
estndar arriba de la media tiene un valor z de l. La regla emprica que vimos en el capitulo 3 se basa
en la distribucin normal la cual dice que alrededor de 68% de los valores estn dentro de una desviacin estndar de la meda, cualesquiera que sean los valores de y <T. En una distribucin :, aproximadamente 68% de los valores z estan entre z -1 y z = +l.
Los valores de probabilidad de distribucin z se muestran en el apndice A, A.5; sin embargo, como
es tan frecuente su uso, la distribucin z tambin est impresa al final de este libro. En la tabla 6.:? -e
presenta una lista de valores de distribucin z para a)'Udar a su anlisis.
La tabla A.5 proporciona el rea total bajo la curva z entre O y cualquier punto del eje z povirivo,
Como la curva es simtrica, el rea bajo la curva entre z y O es igual si z es positiva o n~tiva (el ~ipio
del valor z designa si la estad.tica z est. arriba o abajo de la media). Las reas o probabilidades que se
muestran en la tabla 6.2 son siempre positivas.

Resolucin de problemas de curva normal


La media y desviacin estndar de una distribucin normal y la frmula z y tabla 6.2 hacen posible que
un investigador determinelas probabilidades para intervakde cualesquier valor de una curva normal.
Un ejemplo es el de los mucho> valores posibles de probabilidad de calificaciones GMAT que se examinan a continuacin:
El examen de aptitud de administracin para graduado> (GMAT. por sus siglas en ingls), pro
ducido por ti Educational Te ting Service en Princeton, l'tw Jersey lo usan mucho las escuelas de
administracin para graduado> de Estados Unidos como requisito de admisin. Si se supone que
las calificaciones estn normalmente distribuidas <e pueden determinar las probabilidades para aleanur calificaciones en diversos rango. del GMAT. Hasta hace poco tiempo la calificacin media GMAT
era de 494 y la desviacin estndar era alrededor de 100. Cul es la probabilidad de que una califica
cin seleccionada al azar ~ entre 600 y la meda?; es decir:
P(494

::lelcr1pein grfica del rea


e:::re una calificacin de 600 y
l"'edia en un GMAT

s xs

6001 - 494 yq 100) - !

La figura 6.6 es una representacin grfica de este problema.


La frmula z da el nmero de desviaciones estndar que ti valor
la media.
z=~=
(1

x. 600, est alciado

de

600-494 = 106 =l.06

100

100

El valor z de 1.06 deja ver que la calificacin GMAT de 600 es 1.06 desviaciones estndar ms que la media. Los valores de distribucin z de la tabla 6.2 dan la probabilidad de
que un \-alor est entre este valor de x y la media. La parte de numero entero y de dcimos
de la estadistica z aparecen en la primera columna de la tabla 6.2 (la parte 1.0 de esta esta
494 x 600
dstica z). En la parte superior de la tabla t tn los valores de la parte de centsimos de b
q 100
estadstica z, Para esta estadstica z, ti valor de centsimos es 6. El valor de probabilidad de
la tabla 6.2 para z "' 1.06 es .3554. La porcin sombreada de la curva de la parte supcrior
de la tabla indica que ti valor de probabilidad dado siempr es la probabilidad o rea entre
un valor de x y la media. En este ejemplo particular, (a es ti rea deseada. Por tanto, la respuesta
es que .3554 de las calificaciones del examen de aptitud de administracin para graduados (GMAT)

1RGURA'6.7

'

S:tuciones grificas
;::rot>lern del

:::MAT

,.94
a 100

<>

x 600
(b)

TABLA 6.2
Distribucin z

....

SEGUNDO WGAR Dll!CIMAL EN s

o.o
0.1
0.2
0.3
0.4

o.s
0.6
0.7
0.8
0.9
1.0
1.1

1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
U)

2.1

2.2
2.3

t.00

UI

G.02

UJ

0.84

o.os

.0000
.0398
.0793
.1179
.1554

.0040
.0431
.0832
.1217

.0080
.0478
.0871

.0120
.0517

.0160
.0557

.0910
.1293

.1331

.1915
.2257
.2580
.2881
.3159
.J413

.3645
.3849
.40J2
.4192
.4332
.4452
A5S4
.4641
.4713

.cm

.4121
.4161

.1591
.1950
.2291
.2'11
.2910
.3186
.3438
.3665

.3869
.4049
.4207
.4345
.4463
.4564

.4649
.4719
.4778
.4126
.41164

.1255
.1628
.1985

.2324
.2642
.l939
.3212
.3461
.l686
.3188
.4066

.4222
.4357
.4474
.4573
.4656
.4726
.4783

.4830
.41611

.4193 .4896

.4191

2.4
2.S

.4911
.4931

.4920
.4940

.4922
.4941

2.6
2.7
2.8

.4953
.4965
.4974

.4955
.4966

.4956
.4967
.4976

2.9
3.0
3.1
3.2

.4981
.4987
.4990
.4993

3.3
3.4
3.S

.4995
.4997
.4998

4.0
4.S
5.0
6.0

.49997
.499997

.4975
.4982

.4995

.4912
.4987
.4991
.4994
.4995

.4997

.4997

.4987
.4991
.4993

.4999997
.499999999

.1664

.1700

.0199
.0596
.0987
.1368
.1736

.2019
.23S7

.2054
.2389

.2088
.2422

.0948

.0239
.0636

0#1

.0279 .OJl9

.0714

.0359
.07S3

.1064
.1443
.1808

.1103
.1480
.1144

.1141
.1517
.1179

2157
.2486
.2794
.3078
.3)40

.2190
.2517

.2224

.2673

.2704

2734

.2967
.3238
.3485
.)708

.2995

.J02J

.3264
.3508
.3729
.3925

.3289
.3531
.3749

.3315
.3554
.3770

.'944

.4099

.4115

.4251
.4312
.4495
.4591
.4671
.4731
.4793

.4265
.4394
.4505
.4599

.'962
.4131
.4279

.3980
.4147
.4292

.4406
.4515

.4418
.4525
.4616

.3907

.4484
.4582
.4664
.4732
.4781
.4134
.4871
.4901
.4925
.4943
.4957
.4961
.4977
.49113
.4981
.4991

.4994
.4996
.4997

.4831
.4875
.4904
.4927
.494S
.4959
.4969
.4977
.4984
4981
.4992
.4994

.4996
.49'11

.4608

.3577
.3790

.2549
.2823 .2852
.3106 .313)
.3399
.3621
.3830
.3997 .4015
.4162 .41n
.4306 .4319
.4429 .4441
.4535 .4S4S
3365
.3599
.3810

.4625

.4671

.4686 .4693 .4699

.4744
.4791

.4803

.4842
.4878
.4906
.4929
.4946

.4960
.4970

.....
......

.4978

.4992

.4994
.4996

.wn

.4750
.4146
.4811
.4909
.4931
.4941
.4961

...,

.0675

.1026
.1406
.1n2
.2123
.2454
.2764
.3051

.4082
.4236
.4370

...

.4633
.4106
.47'7

.4756 .4761
.4808 .4112 .4117
.4850 .4154 .4157
.4814 .4U7 .480
.4911 .4913 .4916
.4932 .4934 .4936
.4949 .4951 .4952
.4962 .49153 .4964

...

.4972 .4973 .4974


.4980 .4911
.4915 .4'15 .4916 .4916

.4971

M79

.4989
.4992
.4994
.4996
.4997

.4979

.4990

.4990

.4992 .4993 .4993


.4995 .4995 .4995
.4996 .4996 .wn
.49J7 .4997 .4998

i,

estan entre una calificacin de 600 y la media de 494. u figura 6.7(a) describe grficamente la solu
en trminos de valores x. u figura 6.(7b) muestra la solucin en trminos de valores z.

CAPm:l.06 Dl~TRIBUCIOS~CO'lm:O."UAS
193

PROBLEMA DE
DEMOSTRACIN
6.3

Cu61 es la probabilidad de obtener una calificacin mayor a 700 en un examen GMAT que tiene
una media de 494 y una desviacin estndar de 1007 Suponga que tas calificaciones GMAT estn
normalmente distribuidas.

Plx > 7001

494 y

"

'9'
100

cr

1001

Soludn
Examine el siguiente diagrama.

Este problema pide determinar el rea de la cola superior de la distribucin. La estadstica z para
este problema es:
Z

X-
(T

700 494
100

206
100

2.06

En la tibia 6.2 se proporciona una probabilidad de 4803 pare la estadstica t. que es el valor
necesario para saber la probabilidad de sacar al atar un GMAT con una calificacin entre ta media
y 700. Encontrar la probabilidad de obtener una calificacin mayor de 700, que es la cola de la
distribucin. requiere restar a .5000 el valor de probabilidad de .4803 porque cada mitad de
ta distribucin contiene .5000 del rea. Et resultado es .0197 Ntese que un intento pare deter
minar el rea de x '1' 700 en lugar de x > 700 no seria diferente porque en distribuciones eontinuas, el rea ba10 un nmero exacto como es x 700 es cero. Un segmento de recta no tiene
ancho y por tanto no tiene rea .
. 5000 (probabilidad de

x mayor

que la medial

.0197 (probabilidad de

x mayor

que 7001

-L~O~(probabilidad de x entre 700 y la medial


La solucin se describe grficamente en (al para valores

x y en (bl

para valores

zO

6.4

lb)

lI

PROBLEMA DE
DEMOSTRACIN

z.

Para el mismo examen GMAT, cul es la probabilidad pera sacar al azar una calrfic.cin que su
5500 menos?
P(x

550j 494 y tr 1001

194

ESTADISTICA EN LOS ..'EGOCJOS

Solucin
Veamos un bosquejo de este problema y determine el rea bajo la curva para todos los valOfm
menores que o iguales a 550.

. '94
tT
100
La frmula

z proporciona

550

el rea entre 550 y la media.


550 494
56
100
100

0.56

El rea bajo la curva para z - 0.56 es .2123 es la probabilidad de obtener una califi~
entre 550 y la media. No obstante, obtener la probabilidad para todos los valores menores q.e
o iguales a 550 requiere incluir los valores menores a la media. Debido a que la mitad o .5000
los valores son menores a la media, la probabilidad de x s 550 se encuentra como sigue:
.5000 (probabilidad de valores menores que la medial
(probabilidad de valores entre 550 y la media)
.7123 (probabilidad de valores s 550)

:t.....1ill

Esta solucin se describe grficamente en a) para valores x y en b) para valores z:

.
tT

494
100

550

z O

()

PROBLEMA DE
DEMOSTRACIN
.5

z 0.56

(b)

Cul es la probabilidad para obtener una calificacin menor a 400 en el mismo examen GMA!?
P(x

< 400!.

- 494 y u .. 100) - ?

Solud6n
En la siguiente curva se comprueba que el problema es determinar el rea de la cola inferior
la distribucin:

400

. '94

v 100
La estadstica z para este problema es:

!!._.E.
(T

400-494--94--0.94
100

100

Ntese que el valor z es negetivo, el cual indice que el valor x est 1b1jo de 11 med11 y el
valor z est sobre el ledo izquierdo de le distribucin. Ninguno de los valores z de 11 t1bl1 6 2 es
negativo, pero, como 11 distribucin normal es simtrica, las prob1bilid1des pera valores zen el
ledo izquierdo de 11 distribucin son les mismas que los valores sobre el lado derecho de 11 dis
tribucin. El signo negetivo del valor z simplemente indica que el ree est en el ledo izquierdo
de 11 distribucin. Le probabilidad es siempre positiva. En 11 tibia 6.2 proporcione une probebi
lidad de .3264 pare un valor z de .94. El problema es encontrar el ree de 11 cole inferior de 11
distribucin, de modo que 11 probabilidad, .3264, debe restarse de .500 para obtener 11 respueste.
~

.5000 (probabilidad de valor menor que 11 medial


(probabilidad de valor entre 400 y 11 medial
1736 (probabilidad de valor menor 1 4001

Grficamente, 11 solucin se muestre en 1) p1r1 valores

x~

. '9
tr 100

x y en b) pare valores z.

-0.9

(el

PROBLEMA DE
DEMOSTRACIN

lb)

Cu61 es 11 prob1bilid1d de obtener 11 azar une calificacin entre 300y 600 en el examen GMATI

/'1300< X< 600 . 494 y

6.6

V 100) 7

Las curvas describen grficamente el problema; es decir, determinar el rea entre x 300y x
600, que abarca el valor medio. Debido 1 que les reas de la distribucin z se obtienen con rala
cin 1 la media, este problema debe trabajarse como dos problemas separados y los resultados
combinados.

Se determine une estadstica z pare cede valor x.

600 494 -~-1.06


100
100

x-
z---(T

300-494
100

-194
-----1.94
100

196 ESrADlSTICA f." L05 :--EGOCIOS


La probabilidad para z 1.06 es .3554; la probabilidad para z - -1.94 es 0.4738. La sot;.
cin de P(300< x < 6001 se obtiene al sumar las probabilidades.

.3554 (probabilidad de un valor entre la media y 6001


(probabilidad de un valor entre la media y 3001
.8292 (probabilidad de un valor entre 300 y 6001

GrMicamente, la solucin se muestra en a) para valores x y en bl para valores z.

x300

. 494
s100

600

1.94

(al

PROBLEMA DE
DEMOSTRACIN

(bl

Cules la probabilidad de obtener una calificacin entre 350 y 450 en el mismo examen G~,:.-r
P(350 <X< 4501 - 494 y U - 1001 ?

6.7
Solud6n

La siguiente curva muestra que la solucin del problema determina el rea de la porcin s.
breada en la mitad inferior de la curva.

&
X -

350

450

494

tT

100

En este problema, los dos valores x estn sobre el mismo lado de la media. Las reas o proti.
bilidades de cada valor x deben determinarse y encontrar la probabilidad final al determinar
diferencia entre las dos reas.

z---x-

350 494 =~--1.44


100
100

450 494
100

(T

La probabilidad asociada con z

La probabilidad asociada con z

-44
-=-0.44
100

-1.44 es .4251.
-0.44 es .1700.

La sustraccin proporciona la solucin.


. 4251 (probabilidad de un valor entre 350 y la medial

::....JlQQ (probabilidad de un valor entre 450 y la medial


.2551 (probabilidad de un valor entre 350 y 4501

x y en

Grficamente, la solucin se muestra en al para valores

-1.U

z --0.U

zO

lb)

lI

PROBLEMA DE
DEMOSTRACIN
6.8

bl para valores t.

Runzheimer lnternational publica costos de viajes de negocios para varias ciudades del mundo.
En particular, publican totales de gastos de viaje diarios, que representan los costos promedios
para el viajero tpico de negocios incluyendo tres comidas al da en restaurantes clase de nego
cios y alojamiento con terifa por persona en hoteles y moteles de clase de negocios. Si 86.65%
de los costos de gastos de viaje diarios en Buenos Aires, Argentina, son menores a $449 y si
la desviacin estndar de costos de gastos de viaje diarios es $36, cul es el promedio de costo de
gastos de viaje diarios en Buenos Aires? Suponga que los costos de gastos de viaje diarios estn
normalmente distribuidos.
Solud6n
En este problema, se dan la desviacin estndar y un valor x; el objeto es determinar el valor de
la media. El examen de la frmula de la estadstica z revela cuatro variables; x, p., u y t. En este
problema. se dan slo dos de las cuatro variables. Debido a que es imposible resolver una ecuacin con dos incgnitas, debe determinarse una de ellas. El valor de t puede determinarse con
la tabla de distribucin normal (vase la tabla 6.21.

Debido a que 86.65% de los valores son menores a x $449, 36 65% de los costos de gas
tos de viaje diarios son entre $449 y la media. El otro 50% de los costos de gastos de viaje d1a
ros estn en la mitad inferior de la distribucin. La conversin del porcentaje a una proporcin
proporciona .3665 de los valores entre el valor x y la media. Qu valor z est asociado con esta
rea? Esta rea o probabilidad de .3665 que se muestra en la tabla 6.2 est asociada con el valor
z de 1.11. Este valor t es positivo, porque est en la mitad superior de la distribucin. El U$O del
valor zde 1.11, del valor xde $449 y el valor ude S36 permite resolver algebraicamante la media.
l

!:._t!
(T

1.11- 5449-
$36
y
$449-

($361(1.111 $449-

$3996 $409.04

El costo medio de gastos de viaje diarios para un viaje de negocios en Buenos aires es de
$409.04.

TABLA td
Salida Excel y
MINrTAB para
distribucin
normal

.......
1

xValue

2
3

450
350

B
PYOl>lb<Ltv < X Value
03300
0.0749

PYob 1350 < X < 4501 -

0.2551

Sllilal8Nl'IU
CDIJLHlVB DD!llllllHll
llmml
undud

. ... ......,,,...
vt.u ..,~

.,
l'nlt

PROBLEMA DE
DEMOSTRACIN
6.9

uo.1111

e no

e.

tucncm

M.Off ud
100.000

?C ....

e ...

J 2$11

La U.S. Environmental Protection Agency publica cifras respecto a la generacin de d


slidos en Estados Unidos. Durante un afio, el nmero promedio de desechos generad'
persona por dia fue 3.58 libras. Suponga que la cantidad diaria de desechos generada por
sona estj normalmente distribuida, con una desviacin estjndar de 1.04 libras. De las ca
des diarias de desechos generadas por persona, a quj cantidad serla mayor 67.72%7

Solvcln
Se proporcionan la media y desviacin ostjndar pero x y z son incgnitas. El problema es
pear un valor x cuando .6772 de los valores x sean mayores que ese valor.
Si .6772 de los valores son mayores que x, entonces .1772 estj entre x y la media (.6
5000). La tabla 6.2 muestra que la probabilidad de .1772 estj asociada con un valor z de
Como x es menor que la media. el valor z en realidad es 0.46. Siempre que un valor Jr
menor que la media, su valor z asociado es negativo y debe reportarse esl:

Al despejar la ecuacin z resulta:

z .. !!...:J!.
(T

-046-~

1.04

y
X .. 3.58 .,. (-0.46)(1.04)

3.10

Por tanto, 67.72% da la cantidad promedio diaria de desechos slidos por persona P8A
de 3.10 libras.

Hlfii!fijlH.111Mi[.fi!+M-------------------sis1ema de elmCftU!miato
TomplN AS1ociata ttaliz una mcuau nacional desistemas de alnw:awnimto en E.siados Unidos cuyo multado
m~l mucho. dato& interesantes. El listam de almacmamiento es una industria de trabajo intauo que rtpmmta
una gran oportunidad para mejorar la productividad. ~Qui
aspecto presenta d a1macl bodega promedio? u construccin de nua'OI almacala est restringida por COSIOS
prohibitivos. Quiz por esa razn, la edad promedio de una
bodega es 19 a6o6. Los a1maanes vartan en tamaAo pm> d
tamalto promedio es de llll06 50 mil pies cUldndos (4 600 m2
aproximadmimte). Para visualiur esta bodega promedio':

imaginanol qix es un cuadrado con 224 pies por lado o un

l'KngWo de 500 pies por 100 pies. u altura libre prome-

dio de una bodega en Eludos Unidos es de 22 pies.


Suponga que las tdadcs de bodegas. las dimmsioncs de
sw y sus alturas libra esn normalmente distribuidas.
Con d uso de valora medios ya <Wfos y la desviaciones
esndar, es posiblt usar tnicas pmmtadas en esta seccin
para dcttrminar, por tjmiplo. la probabilidad de que una
bodega sdcionada al aur tenga mmos de 15 allos de anngOedad, mida 111'1de60 mil pies cuadrados (unos S 600 mZ)
o tenga una altura libtt entre 20 y 25 pits.

Uso de la computadora para resolver probabilidades


de distribucin normal
Tan10 Excel como ~llNITAB se pueden usar para resolver probabilidades de distribucin normal. En
cada caso, el paquete de computadora usa, C1 y ti valor de x para calcular una probabilidad acumulativa desde la izquierda. En la tabla 6.3 se ilustran '3ldas Excei y ~11!'/ITAB para la pregunta de proba
bilidad abordada en el problema de demostracin 6.7: P(350 < x < 4501 494yua100). Como los
dos paquetes proporcionan probabilidades junt.t> desde la izquierda, este problema se resuelve de
manera manual con la salida de computadora al encontrar la diferencia en Ptx < 450) y Pl,'C < 350).

i.2 PROBLEMAS
6.6

Determine: la probabilidad o rea para las porcione de la distribucin normal descrua .


.. z i!: 1.96
b. z<0.73
c. -1.46 < z :S 2.84
d. - 2.67 :S z :S l.Oll
c. -2.05 < z :s -0.87
6.7 Determine la. probabilidades p;ira los ~iguitntcs problemas de dstrbucin normal.
.. .. 604, C1 = 56.8.'C s 635
b. ~48,u= 12,."C<20
C. Jl = 111,CI = 33.8, 100 :S X< 150
d. Jl = 264, C1., 10.9, 250 <X< 255
e. =37,u=4.35,x>35
f. =156,u""ll.4,xi!:liO
6.8 Tompkiru Assodates reporta que la altura libre media para un almacn Clase A en Estados
Unidos es de 22 pi". Suponga que l.t> altul'3$ libres e.tn normalmente d1Stnbudas v que la desviacin e.tndar e. 4 pi". Al azar se selecciona un almacn Clase A en Estad< Crudos.
a. Cual e. la probabilidad de que la altura libre sea mayor de 1 i pies?
b. (Qu probabilidad existe de que la altura libre sea mayor de 13 pies?
c. Cuil es la probabilidad de que la altura libre sea entre ~5 y 31 pies?
6.9

Segn la CcUular Tdecommunications Jndu,1rr As<\Odation, el promedio local de la cuenu mensual de un telfono celular" S42.i8. Suponga que las cuenta locale. mensuales de telefono celular estan normalmente distribuidas. con una desviacin estndar de SI 1.35.

200 ESTADtsnC.A E."' 10. iNIGOCIOS

Ctl o la probabilidad de que una cuenta "Seleccionada al aur de telfono celular sea nm de
S67.75?
b. l o la probabilidad de que una cuenta seleccionada al azar de telfono celular sea mur
S30 y sso:
c. Cu.U o la probabilidad de que una cuenta seleccionada al azar de telfono celular no $C'3 ma
de S25?
d. Ctl o la probabilidad de que una cuenta seleccionada al azar de telfono celular sean:::
S45 y S55?
6.10 Segtln el lnternal Revenue Service, el rendimiento de impuesto. de un allo promediaron SI
en devoluciones para contribuyente. Una explicacin para esta cantidad es que los contribuy
tes preferiran que ti gobierno lo retenga mucho dinero durante el olio que deberle dinero 1
de ao. Suponga que la cantidad promedio de impuesto para fmales del ao es una dC''Olucin
SI 332, con una desviacin estndar de $725. Suponga que lu cantidades adeudad.u o que
deben en devoluciones de impuesto. cst.in normalmente distribuidas,
a. Qu proporcin de rendimientos de impuestos muestra una devolucin mayor a S2 mil'
b. Que proporcin de rendimientos de impuestos muestra que el contribuyente adeudad'
al goblemo!
c. Qu proporcin de rendimiento. de impuestos muestra una devolucin entre S 100 y S
L

6.11 ~ trab.ijadoro que laboran con herramientM mio propensos a lesiones rdadonadas con
oficio. Una enfermedad, causada por rcalilar esfuerzo con las manos y mul'la se conoce
sndrome de tnel carpiano y afC(ta hasta a 2J mil trabajadores al afio. El U.S. Labor Depart
estima que el coste promedio de esta afeccin a empleados y aseguradores es alrededor de S30
por trabaiador lesionado, Suponga que estos cestos estn normalmente distribuidos, con
desviacin cstindar de S9 mil.
a. Qut proporcin de lo. costos etn entre S 15 y 45 miU
b. Qut proporcin de los costos es mayor a SSO mm

c. Qut proporcin de costos ot.i entre SSO y 20 mil?


d. Suponga que la desviacin estndar se desconoce, pero 90.82% de lo. cono. son mb de
mil. Cul serla el valor de la desviacin estndar]
e. Suponga que se desconoce el valor medio, pero la desviacin ot.indar es toda\1a S9
Cuinto serla el costo promedio si 79.95% de los costos fuera menos de S33 miU
6.12 Supongamos que el lector e.U trabajando con un conjunto de datos que cstj normalmente
tribuido, con una meda de 200 y una desviacin estndar de 47. Determine el valorde x a
de la siguiente informacin.

6.13

6.14
6.1 S
6.16

a. 60% de IO$ valores son mayor~ que x.


b. x es menor que 17% de los valoro.
c. 22% de lo> valores son menores que x.
d. x es mayor que 55% de lo> valore
Resuelve los siguientes problemas y suponga que los datos estn normalmente distribuido$.
a. La desvacin estndar de la distnbucin es 12.56. y 71.97% de lo. valores son m.ayores a
Ctl es el valor de Jt?
b. La media de la distribucin es 352, y ~lo 13.35% de los valores son menores a 300. CuL
el valor de a?
Suponga que la desviacin estndar parad problema 6.8 se desconoce pero la median t
22 pies . Si i.2.4% de todo> lo> almacenes Cluc A de Estado. Unido. tienen una altura libre
a 185 pies, ,u( es la desviacin est.indar?
Suponga que la altura libre media de todos los almacenes Cla~ A de Estados Unidos se d.e.co;:=-
pero se sabe que la desviacin estndar es de: 4 pes. Cu;il es el valor de la altura libre m
29% de lo> almacenes Clase A de Estado> Unidos tienen una altura libre menor a 20 pies?
La informacin acumulada por la l'ational Climatic Data Cerner muestra que el promedie
velocidad del viente en milla. por hora para St, Louis, ~tissou, e. 9.i. Suponga q11C ta.
cienes de la velocidad del viento esran normalmente distribuidas para un lugar geogr.ic:o
Si 22.45% del tiempo las mediciones de la velocidad del viento son ms de 11.6 mil~ por
cu.il o la desviacin estndar de la velocidad del viento en St, Lous!

CAl'lnlW 6 DI~ TRIBl,,'CIO~E.' CO~'TISUA!>

201

6.3 USO DE LA CURVA NORMAL PARA CALCULAR APROXIMADAMENTE


PROBLEMAS DE DISTRIBUCIN BINOMIAL
Para cienos tipos de problemas de dis1ribucin binomial, la distribucin normal <e puede usar pau
calcular aproximadamente las probabilidades. Cuando los tamaos muesuales son mur grandes. las
distribuciones binomiales se aproximan a la distribucin normal en forma, cualesquiera quC' sea d
valor de p. Este fenmeno ocurre mis rpido (para valores ms pequeos den) cuando p est cerca
de .SO. Las figuras6.8 a la 6.10 muestran tres distribuciones binomiales. ~te:.equcen la figura 6.S aun
cuando el tamal'lo muestral, 11, C'> ~lo 10, la gr~fica binomial es muy parecida a una curva normal.
La grfica de la figura 6.9 (n .. 10 y p a .20) est sesgada a la derecha debido al bajo valor p y el
pequeo tamao, Para esta distribucin, el valor esperado es <61o 2 y las probabilidades <e acumulan
en x O y 1. No obstante, cuando tt es suficientemente grande, como en la distribucin binomial (tt
100 y p .20) presentada en la figura 6.10, la grfica e> relativamente simtrica alrededor de la media
( "' n p .. 20) porque suficientes y posibles valores de resultado a la izquierda de x .. 20 permiten
que la curva caiga al eje x.
Para valores grandes de n, la distribucin binomial e. dificil de analizar sin una computadora. La
tabla del Aptndicc A.2 llcga <6lo a n 25. Es importante saber que debido al 1amao de las factoriales
in"olucrados <e dC'bcr usar calculadora para resol" los problemas binomiales cuando n e:. mu) grande',
lo cual multa diftcil o imposible; ~in embargo, por fortuna, tenemos que la distnbucion normal e. una

Distribucin
binomial para
n 10y p 50

...

.3

.2

.1

c.

~URA 6.9

10

VaJon:.X

.3

Distribucin
binomial para
n 10 y p .20

.2
.1
OL-..l--L..--L--1~'---'--'--'-__JL-..._~--

FIGURA 6.10
:>istribucin
t. nomial para
100y p .20

10

\'alorn x

.10
~
-

.09
.08
.07

i::

.04
.03
.02
.01

O'-'l.'"'--'-'--'L......L--'--'-_._.._.__. ........_.__.__._-'-'--'--12 13 14 IS 16 17 18 19 20 21 22 23 24 25 26 27 28 29
\'alorcsx

202 ESTAI>bTICA v.; LOS SEGOOOS

hM'M'Mi

Gr6fica del

0.10

problema binomial:
n 60y p .30

1:.o

o.os
o.oo~. uu,ll

ul l l~..:....:....:..1111'-'-'-'11 '" '- '- , ~


IS

3S

\'alorax

FIGURA 6.12
Gr6fica de solucin aparente
de problema binomial
trabajado por la curva normal

buena aproximacin para problemas de distribucin binomial para valores


den.
Para trabajar un problema binomial con la curva normal se requiere un proceso
traslacin. La primera parte de este proceso es convertir I< dos parmetros de una di
bucin binomial, n y p. a lo. dos parametros de la distribucin normal, y a. Este proas
utiliza frmulas que se vieron en el capuulo 5:

npyaV7M
Ahora deber realiza~ una prueba para determinar s1 la distribucin normal es
aprox.i.madn suficientemente buena de la distribucin binomial:
18
a 3.55

x2:25

El intervalo de .:: 30', se encuentra entre O y n?

Recordemos que la regla emptrica expresa que aproximadamente 99.7%; es decir.


todos lo> valores de una curva normal otn dentro de tres desviaciones estndar ck
media. Para que una aproximacin de curva normal de un problema de distribucin sea acep
todo> los posibles valores de x deben estar entre O y n, que son lo> lmites inferior y superior, res
vamente, de una distribucin binomial. Si :!: 30' no est. entre O y n, 110 uu la distribucin n
para resolver un problema binomial porque la aproximacin no es suficientemente buena. m
demostracin de que la curva normal es una buena aproximacin para un problema binomial,
nue el procedimiento. Otra rtgla prctica para determinar cundo 11$1r la curva normal para ap
mar un problema binomial es que la aproximacin es buena lo suficiente si n p > 5 y n q > 5.
El proceso se puede ilustrar en la solucin del problema de distribucin binomial.
P(x ~ 25ln 60 y p .30) ?

:-:toe que este problema binomial contiene un tarnaflo muestra! relativamente


y que ninguna de las tablas binomiales del Apndice A.2 se puede usar para resolver el
blema, Este problema o un buen ejemplo para 11$1r la di>tribucin normal.
De la ua.<lacin de un problema binomial a un problema de curva normal se o

TABLA 6.4
Reglas pr6cticas para la
correccin de continuidad
v.llllaa
,

....

x>

rll!:
r<
rs
:SrS
<r<
.e

+.50
-.50
-.50
+.50
-.501 +.50
+.50y-.50
-.50r +.so

n p (60) (.30) 18 y a=

V"7H 3.55

El problema binomial se convierte en un problema de curva normal:


P(x ~ 251 ., 18 y a= 3.55) ?

Ahora se deber determinar <i la curva normal se ajusta lo suficiente a esta ds


cien binomial para justificar el uso de la cun-a normal.

= 18 ::!: 3(3.55) .. 18 :!: 10.65


7.35 s ::!: 3a s 28.65

::!: 30'

Este intervalc se encuentra entre O y 60 de modo que la aproximacin es s


para permitir el uso de la curva normal. La figura 6.11 es una grfica MINITAB de bU
tribucin binomial. ro:tese el gran parecido a la curva normal. La figura 6.12 es la
aparente de la versin de curva normal a este problema.

cornac 6
: Fi(fp

6.13

Grifica de una
porcin del
problema binomial:
n 60 y p .30

.a

.12
.ti
.10
.09
.08

.06

OlmtBUOOS'E.SCO~'TL'IUAS 203

.B .07

.os
.04
.03

.02
.01

1 1 1
13 14 IS 16 17 18 19 20 21 22 23 24 25 26
Valorux

Correccin para continuidad


La traslacin de una dstribucin discreta a una distribucin continua no es del todo kil. Se requiere
una correccin de +.50 o - .50 o :!:.50, dependiendo del problema. Esta correccin asegura que la
mayor parte de la informacin del problema binomial est correctamente transferida al an.Uis~ de curva normal y se conoce como correccln pan continuidad que ~ haa durant la amvrni6n dt una disrribuci6n discma a una disrribua6n continua.
La figura 6.13 es una parte de la grifica de la distribucin binomial, n 60 y p .30. Nt~ que
con una distribucin binomial todas las probabilidades estn concentradas en numeres
enteros. Por tanto, las respuestas para x ~ 25 se encuentran al sumar las probabilidades
, FIGURA 6.14
para x 25, 26, 27, . , 60. No hay valores entre 24 y 25, 25 y 26, . 59 y 60, pero la dls
tribucin normal es continua, y hay valores presentes a lo largo del eje x, Debe hacerse
Grfica de la solucin al
una correccin para esta discrepancia para que la aproximacin sea tan precisa como <ca
:~blema binomial resuelto
posible.
. r la curva normal
Como analogfa, visualice el proceso de fundir varillas de hierro en un horno. w vsriUas de hierro son como los valores de probabilidad en cada nmero entero de una distribucin binomial. Nte-.e que la grfica binomial de la figura 6.13 parece una serie de
\'lnllas de hierro en una linea. Cuando las varillas se colocan en un horno se funden y dispersan. Cada varilla se funde y se mueve para llenar el rea entre ella y las varillas adyaccn
res, El resultado es una 14mina continua de hierro <lido (hierro continuo) que se partee a
la curva normal. La fusin de las varillas es anloga a dispe~r la distribucin binomial
para aproximar la distribucin normal.
Qu~ distancia se dispersa cada varilla hacia las otru? Una buena estimacin es que
cada varilla avanza mis o menos a media distancia hacia las varillas adyacentes. En otras
TABLA 6.5
palabras, la varilla que estaba concentrada en x 25 se dispersa para cubrir el rea de ~4.5
a 25.5; x 26 se conviene en continua de 25.5 a 26.5 y asl sucesivamente. Para el probleValores de probabilidad para
ma P(x ~ 25ln 60 y p .30), la conversin a un problema de curva normal continua
el problema binomial: n 60,
da P(x ~ 24.51 18 y <T 3.55). La correccin para la continuidad es de -.50 porque
p .30 y X Z: 25
el problema cxgla la inclusin del valor de 25 junto con todos lo valores ms grandes; d
v.ilrS F1 J' ero e
valor binomial de x .. 25 se traslada al valor de curva normal de 24.5 a 25.5. 1 el proble.0167
2S
ma binomial hubiera sido analizar P(x > 25), la correccin hubiera sido ~.SO. que ruclu
26
.11116
en un problema de curva normal de P(x 2 25.5). El ltimo ca~ empeurla en ms ck 25
r1
porque el valor de 25 no estarla incluido.
La decisin en cuanto a cmo corregir para continuidad depende del 51px> de igua)28
dad y la direccin de los resultados deseados de la distribucin binomW. La tabla 6..4 es cm
29
.Gll2
lsta de algunas reglas pricticas que pueden ayudar en la aplicacin de b correccin para
JIDD5
continuidad.
)1
JIOIZ
Para el problema binomial P(x 2 25ln 60 y p .30), b run'I oormaJ 5C convime
32
en P(x 2 24.51 18 y a= 3.55), como <e ve en la figura ~.H y

...

.-

'
3)

.. z: 25

...-
.AB61

z= x-
<1

= 24.5-18
3.55

=l.83

204 f~TAI>ISTICA L" Lo:. :-;EGQCJOS

La probabilidad (vase la tabla 6.2) de este valor z es .4664. la respuesta a este problema est en
cola de la distribucin de modo que la respuesta final se obtiene al restar:

.5000
.0336

Si este problema se hubiera trabajado con la frmula binomial, la soluein hubiera sido como
ve en la tabla 6.5. la diferencia entre la aproximacin de la distribucin normal y los valores binoim.
les reales es de slo .0025 (.0361 - .0336).

PROBLEMA DE
DEMOSTRACIN
6.10

Resuelve el siguiente problema de distribucin binomial con el uso de le distribucin normal.

Plx

12ln 25 y p

'' 1

Solud6n
Encuentre p. y

u.
p. n p (25)(.40)

u .Jnp q

= 10.0

Jl25)(.40)(.60)

2.45

Pruebe :t Ju 10.0 :t 3(2.45) 2.65 en 17.35


Este rengo se ubica entre O y 25, de modo que le aproximacin es suficientemente cerca,.&.
A continuacin corrija para continuidad. Como el problema es determinar le probabilidad de qur
x sea exactamente 12, la correccin supone .50 y .50. Esto es, una probabilidad binomial e
x 12 se traslada a un 6rea de curve normal continua que est6 entre 11.5 y 12.5. Veamos la gr ..
fice del problema:

; - 10
v 2.45

12.5

"

n.s

Entonces

z---x-
(T

y
Z IS

!!::J!.. = ~
(T

2.45

0.61

z 1.02 produce une probabilidad de .3,61.


z 0.61 produce una probabldad de .2291.

De la diferencia entre las 6reas se obtiene le siguiente respuesta:


.3,61 - .2291 - .1170
Si este problema hubiera sido resuelto con el uso de los cuadros binomiales. la respuem
seria .11'. La diferencia entre la aproximacin de la curva normal y el valor obtenido con el usar
los cuadros es slo .003.

PROBLEMA DE
DEMOSTRACIN
6.11

Resuelve el siguiente problema de distribucin binomial con el uso de la distribucin normal.


P{x

< 27ln

100 y p

371

CAPtnno

6 DISTIUBU00'-1:' CO'-'TISI;\S

205

Solud6n
Como n1 el tamaflo muestra! ni el valor p estn contenidos en la tabla del Apndice A2. entonces resolver este problema con las t6cnicas de distribucin binomial no es prctico. Es un buen
candidato para la curva normal. Del ~lculo de . y u se obtiene:
. n p (100)(.37) 37.0

u Jnp q

.J(lOOl(.37)(.631 4.83

La prueba para determinar la cercana a la aproximacin es:


.:: 3tr - 37:: 3(4.831 - 37:: 14 49
El rango 22.51 a 51.49 es" entre O y 100. Este problema satisface las condiciones de la prueba. Ahora, corrija para continuidad: x < 27 como un problema binomial se traslada a x s 26.5
como un problema de distribucin normal. Veamos la grfica del problema:

x:.28.5

37
u 83

Entonces,
Z= X-=
(T

26.5-37 =-2,1?
4.83

La tabla 6.2 muestra una probabilidad de .4850 y al resolver la cola de distribucin se obtiene:
.500 - .4850 - .0150
que es la respuesta.
Si este problema se hubiera resuelto con el uso de la frmula binomial, las probabilidades
serian las siguientes:
Velor "
26
25
2
23
22
21
20

x<

27

l'fobebillded
.0059
.0035
.0019
.0010
.0005
0002

..2!!!U
.0131

La respuesta obtenida con el uso de la aproximacin de curva normal 1.01501 se compara


favorablemente a esta respuesta binomial exacta. La diferencia es slo .0019.

6.3 PROBLEMAS
6.17 Convierta los siguientes problemas de distribucin binomial en problmw de dutribua6n normal. Use la correccien para continuidad,
a. P(x s 16ln 30 y p .70)
b. P(IO<xS20ln25yp.SO)
c. P(x 22jn .. 40 y p .60)
d. P(x>14lrrl6yp.~5)

206

ESTADISTICA E.>,; 10> :O.'EGOCJOS

6.18 Use la prueba :!: Ja para determinar si las siguientes distribuciones binomiales se pueden aproximar con el uso de la distribucin normal.
a. n = 8 r p = .os
b. n = 18 y p = .80
c. n 12 y p .30
d. n 30 y p .75
e. n = 14 y p .50
6.19 Donde sea apropiado, trabaje los siguiente; problemas de distribucin binomial con el U$O de b
curva normal. Tambin, use la ubla del Apndice A.2 para encontrar las respuestas con el 11)() de
la distribucin binomial y compare las respuestas obtenidas por los dos mtodos.
a. Plx - 8lt1 - 25 y p - .40) - ?
b. Pix :?! 13ln = 20 y p .60) ?
c. P(x 7ln 15 y p .50) ?
d. P!x < 3ft1 = 10 y p .70) ?
6.20 La Zimmerman Agency realiz una encuesta para Residence Ion by Marrion de agente:> viajeros
que realizan ,iaje> de cinco noches o ms. Segn esta encuesta, 37% de esto; viajeros di>fru~
ser turistas ms que ninguna otra actividad que realizan en casa, Suponga que son entrt\istadol
120 "iajero> seleccionados al azar que realizan viajes de cinco noches o mas. Cu.ti e. la proNbtlidad de que meno; de 40 disfruten ser turistas ms que ninguna otra actividad que no hacen et:
as.t?
6.21 Un estudio respecto a satisfaccin de gerente.. con herramientas de administracin revela que 5
usan equipo> de trabajo autodirigidos como herramienta de administracin. Suponga que
entrevistados 70 gerentes seleccionados al azar en Estado. Unidos. Cul e. la probabilidad de qr
meno; de 35 utilicen equipo; de trabajo autodirigidos como herramienta de administradn?
6.22 Segun The Yanktt Group. 53% de las casas que tienen televisin por cable y clasifican a e:>t<l> co~
pall1a> como buenas o excelentes respecto a la calidad de transmisin. Se~nla por ciento de
casa> que tienen tele\'>in por cable clasifican a e>ta~ compallfas como buenas o excelentes
tener personal profe ional. Suponga que al azar son entrevistadas 300 familias de tienen telt\1~in por cable.
a. Cual es la probabilidad de que ms de 175 familias que tienen televisin por cable clasifiq=
a esta> compamas como buenas o excelente. respecto a la calidad de transmisin!
b. Cul e> la probabilidad de que entre 165 y 170 incluyendo a las familias que tienen telt\is::::
por cable clasifiquen a estas compaas como buenas o excelente> respecto a la calid:td
transmisin!
c. Cu.1.1 es la probabilidad de que entre 155 y 170 incluyendo a las familias que tienen televi
por cable clavifiquen a estas compalllas como buena. o excelentes respecto a la calidad
transmisin!
d. Cu~ e> la probabilidad de que menos de 200 familia. incluyendo a l<l> familias que titnc::
televisin por cable clasifiquen a olas compaas como buenas o excelente. como buenas
excelentes al tener personel profesional!
6.23 La lntcrnational Data Corporation reporta que Compaq e nmero uno en participacin en
mercado de computadoras personales (PC) en Estados Unido), con 16% del mercado. Su
que un investigador selecciona al azar 130 compradores recientes de: PC.
a. ;Cu.ti e> la probabilidad de que ms de 25 compradores de PC compren una Compaq?
b. ;Cul es la probabilidad de que entre 15 y 23 incluyendo a compradores de PC compren
Compaq?
c. Cul e> la probabilidad de que meno> de 12 compradores de PC compren una Compaql
d. Cul o la probabilidad de que exactamente 22 compradores de PC compren una Compacf
6.24 Una encuesta acerca de estrategias para competir en el mercado mundial expresa que 52%
entrevistado; concuerdan en que la; compalllas nece$ita.n hacer inversiones directas en otros paiseL
Tambin expresa que alrededor de 70% de entrevistados e.t.n de acuerdo con que es atractivo ~
una inversin conjunta para aumentar competitividad mundial Suponga que lo> directores de
compalliai. manufactureras se seleccionan al azar acerca de estrategias mundiale,

a. Cul es la probabilidad de que entre 4-1 y 52 incluyendo a directores estn de acuerdo


que las compaAJas deben hacer inversiones directas en otros pases!

b.
c.
d.

Cul es la probabilidad de que m de 56 directores esttn de acuerdo con esa aseveracin!


Cul es la probabilidad de que menos de 60 directores estn de acuerdo con que es atractivo
tener una inversin conjunta para aumentar competitividad mundial!
Cul es la probabilidad de que entre 55 y 62 di.rectom esttn de acuerdo con e1>a ~-eracin'

6.4 DISTRIBUCIN EXPONENCIAL


Otra distribucin continua til es la distnbucin exponencial. Est~ estrechamente relacionada con la
distribucin de Poisson. Mientras que la distribucin de Poisson es discreta y describe sucesos aleatorios en algn intervalo, la distribucin exponencial es conrinua y d=riM una disrrib11d6n de probabi
/idad dt los ritmpos entre suce10s akaronos. Las siguientes son caractersticas de la distribucin
exponencial.
Es una distribucin continua.
Es una familia de distribuciones.
Est sesgada a la derecha.
Los valores x van de cero a infinito.
Su vrtice est siempre en ;e O.
u curva aumenta continuamente cuando x se hace mas grande.
u distribucin de probabilidad exponencial est dettrminada por lo siguiente:
Fl!NCI NDE
OE.'ISIDAD
donde;
DE PROBABILIDAD
}C~
o
EXPONE.'ICIAJ.
.l>O

f(JC) - .A.t-M

yt - 2.71828 ...

Una distribucin exponencial se puede caracterizar por el parmetro A. Cada valor nico de .l
determina una distribucin exponencial diferente, resultando en una familia de distribuciones exponenciales. u figura 6.15 muestra grficas de distribuciones exponenciales para cuatro valores de .l. Los
puntos en la grfica se determinan al U)ar .l )' dverw. valores de JC en la frmula de densidad de pro
babilidad. u media de una distribucin exponencial es lfA. y la desviacin estndar de una distribucin exponencial es o 11.A..

Probabilidades de la distribucin exponencial


U~ probabilidades se calculan para la distribucrn exponencial al determinar el 'rea bajo la curva entre
do. puntos. u aplicacin de clculo a la funcin de densidad de probabilidad exponencial produce una
frmula que se puede usar para calcular las probabilidades de una distribucin exponencial.
PROBABIUDADES
DELA COLA
OEJlECHADE
LA DISTRJBUCION
UPONE.NCW.

P(x~.a;.) ,....,

donde;
JCo

e:: o

Para usar esa frmula se requiere encontrar valores de e-. Esto valoresse pueden akular en casi
todas las calculadoras o de la tabla del Aptndice A.4, que contiene los valores de e- para ,-aJores seleccionados de x. JCo es la fraccin del intervalo o el numero de intervalos entre llegadas en b pregunu de
probabilidad y >. es el pcrcenuje promedio de llegadas.
Por ejemplo, las Uegadas de Poisson a un banco estn distribuidas con una ;. de l.~ dientes cada
minuto. Cul e. el tiempo promedio entre Uegadas y cul es la probabilidad de que al meno> ~ nunutos transcurran entre una y otra llegada? Puesto que el intervalo para lambda e. 1 minuto y deseamos

flGURA 6.15

J{x)

Grficas de
algunas
distribuciones
exponenciales

2.0

Distribucin
exponencial para
). 1.2 y solucin
para x ~ 2

1.2
11

Jxl
1.0
9
8
.6

.s
.4

.3
.2
.1

llBLA 6.6
Salida Excel y
MINITAB para
distribucin
exponencial

,i:=::::=---"

WW.bml
A

1 xValue
2
3
0.75

Probebdaty < x Value


06448

Salida MINrJ'All
Cl.mllatift DlstrillaUcn hnoticn

Expoaeatial vitb .... 0.72'600


P( X<
)
0.7500 0.6448

"

conocer la probabilidad de que al menos 2 minutos transcurran entre llegadas (doble el interv
lambda),XQ es 2.
lo> tiempo> entre llegadas y llegadas aleatorias estn exponencialmente distribuidos. La m
esta distribucin exponencial es
1/
1/1.2 a .833 minuto> (50 segundos). En promedio.
minutos, o sea 50 segundos, transcurrirn entre llegadas al banco. La probabilidad de un interv
2 minutos o ms entre llegadas se puede calcular con:

P(x;?:

21>- =

1.2) = rum

'"' .0907.

Alrededor de 9.07% del tiempo cuando en el ritmo de llegadas aleatorias es 1.2 por min
minutos o ms transcurrirn entre llegadas, como se ve en la figura 6.16.

CAPITVLO 6 DISTRIBUOO~U CO~Tl''UAS 209

Este problema recalca el potencial de usar la dstrbucin exponencial en coordinacin con la <fu.
tribucin de Posson para resolver problemas, En la nw,tigacin de operaciones r ciencias administrath-as estas do. distribuciones se utiliun juntas para resotver problemasde colas (teora de linfa' de
espera). La distribucin de Poi..on se puede usar para analizar la'\ llegadas a b cola, y la distribucin
exponencial se puede usar para analizar el tiempo entre llegadas.

P!OSLEMA DE
BEMOSTRACIN

6.12

Una empresa manufacturera ha panicipado en un control estadistico de calidad durante varios


aflos .. Como pane del proceso de produccin, al azar se seleccionan y prueban piezas. De los
registros de estas pruebas se establece que una pieza defectuosa se presenta en un patrn que
est distribuido de Poisson en promedio de 1.38 defectos por cada 20 minutos durante lotes de
produccin. Utilice esta informacin para determinar la probabilidad de que menos de 15 minutos transcurran entre dos defectos.
Soludn

El valor de A es 1 38 defectos por intervalo de 20 minutos. El valor de p. se puede determinar con

= ..!..X = 1- =.7246
1.38

En promedio, es .7246 del intervalo, o sea (.7246)(20 minutos) U.49 minutos, entre defec
tos. El valor de Xo representa el numero deseado de intervalos entre llegadas o sucesos para la
pregunta de probabilidad. En este problema, la pregunta de probabilidad comprende 15 minutos y el intervalo es 20 minutos. Por tanto, Xo es 15120 .75 de un intervalo. La pregunta aqul
es determinar la probabilidad de que haya menos de 15 minutos entre defectos. La frmula de
probabilidad siempre da la cola derecha de la distribucin -en este caso, la probabilidad de que
haya 15 minutos o ms entre llegadas. Con el uso del valor de Xo y el valor de A, se puede determinar la probabilidad de que haya 15 minutos o ms entre defectos.

La probabilidad de .3552 es la probabilidad de que al menos 15 minutos transcurrirn entre


defectos. Para determinar la probabilidad de que haya menos de 15 minutos entre defectos,
calcule 1 - P(x). En este caso, 1 - .3552 .6448. Existe la probabilidad de .6'48 para que menos
de 15 minutos transcurran entre dos defectos cuando se tiene un promedio de 1.38 defectos por
intervalo de 20 minutos o un promedio de 14.49 minutos entre defectos.

Uso de la computadora para determinar probabilidades


de distribucin exponencial
faccl y ~11NITABse puede usar para resolverprobabilidades de distribucin exponencial. Excel utiliza
el valor de A y x.i, pero ~111\ITABpide (igual a 1/A) y Xo- En cada caso, la computadora da la proba
bilidad acumulativa desde la i1quierda (d complemento de lo que da la frmula de probabi:dad mostrada en est;i seccin). De l;i tabla 6.6 se obtienen las salidas Exccl y Ml!'llTAB para la pregunta
formulada sobre la probabilidad en el problemade demostracin 6.12.

1.1 PROBLEMAS
6.25 Utilice la frmula de densidad de probabilidad para trazar las grficas de Lu sipicntcs distribuciones exponenciales:

. }. =

i. = 0.1
0.3
c. i. 0.8
d. i. - 3.0
b.

110 ESUDISTICA

e- tos SEGOCIOS
6.26 Determine la media y desviacin estndar de las siguientes distribuciones exponenciales:

. )., = 3.25
b. )., = 0.7
c..i..=1.1
d. J..= 6.0
6.27 Determine las siguientes probabilidades exponenciales:
a.
b.
c.
d.

P(x C!: sjA .. 1.35)


P(x < 3!.i..
0.68)
P(x > 41.i.. - 1.7)
P(x < 6!.i..
0.80)

6.28 El tiempo promedio entre llegadas a una caseta de pago en una autopista es de 23 segundl1
Suponga que el tiempo entre llegadas a la'caseta est distribuido exponencialmente.
a. Cul es la probabilidad de que un minuto o ms transcurra entre llegadas?
b, Si un auto acaba de pasar por la caseta de pago, cul es la probabilidad de que no apara.::a
un alto por lo menos en tres minutos?
6.29 Un concurrido restaurante determin que entre las 6:30 p.m. y 9:00 p.m. y durante las noches
viernes, las llegadas de clientes segn la distribucin de Poisson tienen un ritmo promedio de
gada de 2.44 por minuto.
a.
b.
c.
d.

Cul
Cul
Cul
Cul

es la probabilidad de que al
es la probabilidad de que al
es la probabilidad de que al
es el tiempo esperado entre

menos 10 minutos transcurran entre llegadas?


menos 5 minutos transcurran entre llegadas?
menos 1 minuto transcurra entre llegadas?
llegadas?

6.30 Durante el verano en un pequeo aeropuerto privado en el oeste de Nebraska, la llegada no ~


gramada de aviones segn la distribucin de Poisson tienen un ritmo promedio de llegadas
1.12 aviones por hora.
a. Cul es el tiempo promedio entre llegadas de aviones?
b. Cul es la probabilidad de que al menos 2 horas transcurran entre llegadas de aviones?
c. Cul es la probabilidad de que dos aviones lleguen con menos de 10 minutos de diferen

6.31 La distribucin exponencial se puede usar para resolver problemas de Poisson en el que los in~
valos no sean tiempo. El Air Travel Consumer Repon publicado por el U.S. Department
Transportation report que, en un ao reciente, Amrica West era el primer lugar nacional par
tener menos quejas por el mal manejo de equipaje y un ritmo medio de 3.39 por cada mil ~
jeros. Suponga que las quejas por el mal manejo de equipaje son distribuciones de Poisson. Aho:a
bien, con el uso de distribucin exponencial para analizar este problema, determine el nmctt
promedio de pasajeros entre sucesos. Suponga acaban de manejar mal un equipaje. Cul es
la probabilidad de que el equipaje de al menos 500 pasajeros se maneje correctamente antes
se presente la siguiente queja por el mal manejo de equipaje? Cul es la probabilidad de que
nmero sea menos de 200 pasajeros?
6.32 La Foundation Corporation se especializa en construir cimentaciones de concreto para casas nuevas en el sur. La compaa sabe que debido a los diversos tipos de suelos, condiciones de humedad, construccin variable, entre otros factores, eventualmente la mayor parte de cimentaciones
necesitarn reparacin mayor. Con base en sus registros, la directora de la compaa piensa quc.
en promedio, la cimentacin de una casa nueva no necesitar reparaciones mayores durante
anos. Si la compaila desea garantizar el trabajo contra reparaciones mayores y satisfacer rbmaciones a no ms de 10% de sus garantas, por cuntos aos debe garantizar su trabai
Suponga que los casos de reparaciones mayores son distribuciones de Poisson.
6.33 Durante el mes seco de agosto, una ciudad en Estados Unidos tiene lluvia mensurable en promedio slo dos dlas por mes. Si la llegada de das lluviosos es una distribucin de Poisson en esu
ciudad durante el mes de agosto, cul es el numero promedio de das que pasarn entre llu,;.
mensurables? Cul es la desviacin estndar? Cul es la probabilidad durante este mes que~
un periodo de menos de 2 das entre lluvia?

CAPfruLO 6 DIST'IUBCCIOSES CO~'TlSvAS

211

Los cambiantes rostros de la industria de seguros

La encuesta reporta el promedio de gastos para adquirir seguros para automvil, de propietario de
vivienda y todo tipo de seguros. Otros valore) medios se obtienen para algunos de lo) estados ms
extremos. Las preguntas de probabilidad se pueden contestar respecto a estos datos si se sabe la manera
en que estn distribuidos los datos poblacionales. Las tcnicas para probar el ajuste de varias distribudones a los datos se presentan en un capitulo ms adelante, pero, si los datos estn uniformemente drstribuidos y se conocen los valores mnimo y mximo (a y b), las preguntas de probabilidad respecto a
intervalos particulares se pueden contestar. Por ejemplo, suponga que las tarifas de seguro anual de
automvil en Estados Unido) van de $274 a SI 108 (a= 274, b = 1 108). Entre cuales dos valores esta
ria 50% de en medio de los datos? La diferencia entre a y b es 834. Para que la probabilidad de distribucin uniforme sea igual a .50, x2 - x1 tendra que ser 417. La media, $691, est a la mitad entre a y
by tambin est a la mitad entre x2 - x1 para encontrar el 50% de en medio. El 50% de en medio est
entre $691:!:1/2($417)= $691 :!: $208.50 = $482.50 y $899.50. Suponga que el rango de pagos anuale) por seguro de propietario de vivienda en Estados Unidos es de $100 a $740 con una media de $420.
La probabilidad de que una persona seleccionada al azar pague menos de $400 se puede calcular con
las tcnicas de la seccin 6.1 con

a $100, b $740, x2 $400 y x1 $100 como .4688


Suponga que las tarifas anuales de seguro de automvil estn normalmente distribuidas con una
media de $691 y una desviacin estndar de $109. Con el uso de las tcnicas presentadas en la seccin
6.2, es posible determinar que el valor z para x $874 es 1.68con una probabilidad asociada de la tabla
de distribucin normal estndar como .4535. La probabilidad de que una persona seleccionada al azar
pague ms de $874 anualmente por seguro de automvil es .5000 - .4535, o sea unos .0465. Suponga
que los costos anuales de seguro de propietario de vivienda estn normalmente distribuidos. El costo
medio en Texas es $592. Suponga que la desviacin estndar es $78. Con el uso de las tcnicas presentadas en la seccin 6.2, es posible determinar que la probabilidad de que una persona de Texas seleccionada al azar pague entre $500 y $650 anualmente para seguro de propietario de vivienda es
.6514.
El capitulo 6 present tcnicas para trabajar problemas binomiales con la distribucin normal.
Veinte por ciento de estadounidenses prefieren comprar seguro de vida por telfono o por correo.
Suponga que 80 estadounidenses se seleccionan al azar; cul es la probabilidad de que 21 o ms pensen asP. En este problema de distribucin binomial, n 80, p ... 20 y x 21. Los datos pasan la prueba
para indicar que la distribucin normal serla una aproximacin lo suficientemente buena de este problema para usar como herramienta. Los datos se convierten en parmetros de distribucin normal y
resultan en 16 y <T = 3.58. El valor de x se corrige a 20.5 dando un valor z de 1.26 y una probabilidad de .1038 (.5000 - .3962).
Suponga que expertos de seguros de vida dicen que en Estados Unidos, en promedio, cada hora
son destruidas 1.8 casas por incendio. Si se puede suponer que un incendio es una distrbudn de
Poisson, entonces ). 1.8 casas por hora. Con el uso de la informacin presentada en la secoen 6A,el
tiempo promedio entre casas que son destruidas por incendio es .555 de hora, o sea cada 33.J mmutos. Cul es la probabilidad de que transcurrira al menos una hora y media entre incendios que des
truyan casas? Con el uso de la distribucin exponencial, Xo "' 1.5 y la probabilidad es .()6;::. E:lpertos
de seguros de vida pueden usar estos tipos de probabilidades para asistirlos a fin de esubleca ta.rifas.

:?12 ESTAl>lSTICA L" 105 >,;EGOCJO~

CONSIDERACIONES TICAS

Vlriol punllDI deben Wlllidenne 11 tnlbejlr cm cllm......_ Q1111ti1n La poNld6n que se


estudia, a la misma de la cu.i 1e cletaminaron p.nmmo. me&. denillc:in-...:
A)r Si
no es ISi, los raukldos pueden no aer rilidol para d an'1isis que 1e rnlice. Se pueden ablelwr
multados no rilidol o Wsos si 1e man pernetros de una poblacin para lnaliDr otra. Por
ejemplo. UDI cnalllla ele mamdo fD Nueva Inglaterra puede moduir que la cmtidad ele pacado
QJllllllDcll por mea por edabot elt6 nonDllmente dilttibuida C1DG el pmmedio ele 2.3 libru de
peecado por ma. Una invalipdora ele meradocid IW'Oetlc no debe lllpCIDel' que.._ antidada aplican 1 IU poblacin. Ea pnJblble que la poblacin CD el IUlot* teDp Wblm muy dik
reata para mnmmir peecado que en Num lnlaterra y a pniblble que la lplic:aci6n ck
pemdrol ele la poblad6n de Nueva IJlllalerra al swocste raulre cuationlbles.
MI como era wnlaclero con la distribucin de PoWon del a*ulo S. d uso ele >. CD la dis
uibuci6n aponmc:ial debe aer IClftUdo porque una >. para un iatmllo m un periodo e litua
cin clildol puede no aer la milllla que una >. pua el mumo iDllenllo ta an periodo o litulcin
dlfaata. Porejcmplo.d DWnao ele liepdla por periodo de S IDiDUtllll UDralaUrlideen Wr
neapor la noche a probable que no wa el llllllllO que el n6mm> ele .....
en UD periodo de 5
minutoa en el millilo ratauraate Clllle laa 2 y la 4 p.m. durante los clluWbila. Al 11111' pari
mdnll escablccidoltala a>iDO p. y )., UD iiMltipdordebe estar qulO que la pobladn de la
que se detamin el pm.metro es, en wrclad. la iiUSIDI poblacin en -.dio.
A veces se utiliza una distn"bucin normal para analizar dalm cuando t101 no son nomu
les. Dicho an4l puede producir resultados falsos. Cierta tcnicas para probar una disuibucin
ele daiOI pueden determinar si atm diatribuidol ele cierto modo. Algunu ele lu tcnicu se presentan en el capitulo 17. En smenL las tcnicu del capitulo 6 pueden utilirane 11111 li se aplica
el tipo errneo de diluibuciD a los claloto la dillribuci6o empicada pin amlilis es la cometa
y los punetros (,a,>.) no se ajmtan a los dalm ele la poblKin que 1e est analizando.

RESUMEN
mquina, muchas mediciones de entornos biolgicos y
rales, numerosas caractersticas humanas como son eslat
peso, IQ y calificaciones en exmenes. La curva normal
Distribucin uniforme.
continua, simtrica, unimodal y asinttica al eje; en re
Distribucin normal.
es una familia de curvas,
Distribucin exponencial.
Los parmetros necesarios para describir una dit
Con distribuciones continuas, el valor de la funcin de cin normal son la media y la desviacin estndar. Por c
densidad de probabilidad no proporciona la probabilidad didad, los datos que son analizados por la curva normal
pero si la altura de la curva en cualquier punto dado. De estandarizarse al usar la meda )' desviacin estndar
hecho, con distribuciones continuas, la probabilidad en cua calcular estadsticas z. t:na estadstica z es la distancia a la
lesquier punto discreto es .0000. Las probabilidades se deter- un valor x est desde la media,, en unidades de desviac
minan para un periodo y en cada caso, la probabilidad es el estndar. Con la estadstica z de un valor x, la prob3bil..UC
rea bajo la curva para el intervalo en consideracin. En cada que ese valor <e presente al azar desde una distribucin
mal dada se puede determinar con el uso de un cuadro
distribucin, la probabilidad o rea total bajo la curva es 1.
Probablemente la ms sencilla de estas distribuciones es estadsticas z y sus probabilidades asociadas.
La distribucin normal se puede usar para trabajar
la distribucin uniforme, a veces conocida como distribucin
rectangular. La distribucin uniforme est.i determinada por tos tipos de problemas de distribucin binomial. Hacerlo
una funcin de densidad de probabilidad que contiene valores requiere convertir los valores n y p de la distribucin bin
iguales a lo largo de algn intervalo entre los puntos a y b. a y u de la distribucin normal. Cuando sea resuelta
B'icamente, Ja altura de la curva es la misma en todas panes uso de la distribucin normal. la solucin de una distrib
entre estos dos puntos. Las probabilidades se determinan al binomial es slo una aproximacin. Si los valores de
calcular la porcin del rectngulo entre los dos puntos a y b estn dentro de un rango de O a n, la aproximacin es r
blemente precisa. Hacer ajuste. para el hecho de que un
que <e considere.
La ms empleada de todas es la distribucin normal. blema de distribucin discreta se trabaja con el uso de
Mxhos fenmeno' estn normalmente distribuidos. inclu- distribucin conunua requiere una correccin para con
-.'Cldo caractensucas de cavi todas las piezas producidas a dad. La correccin para continuidad implicar sumar o mw

En este capuulo estudiamos tres distribuciones continuas diferentes:

CAPITI:LO 6 DISTRIBUCIOSU U>:"<ilNUAS 213


al valor x que se analice. Esta correccin suele mejorar la aproximacin de la curva normal.
Otra distribucin continua o la dstribucion exponen
cial. Complemente la distnbucin discreta de PoSM>n. La dis
aibucin exponencial se usa para calcular las probabilidades

de tiempos entre suceso aleatorios. La cfu1ribucin exponencial es una familia de distribuciones descritas por un parmetro, u. La distribucin oU sesgada a la derecha y siempre tiene
su valor m.i.s alto en x O.

TRMINOS CLAVE
Cistribucin exponencial

distribucin normal estandarizada


distribucin rectangular

Cistribucin normal

distribucin uniforme

mrrcin para conunuidad

distribucin z
estadstica z

FRMULAS
fCDan de densidad de probabilidad de una distribucin
=forme
1
f(x)= b-a

1O

paraa:Sx:Sb
para otres valore

Frmula r.

x-1
z=--

"

Conversin de un problema binomial a la curva normal

11=11p

Media r desviacin oi.indar de una dimibucin uniforme


a+b
2
b-il
a=~
"12

r a:J11pq

Funcin de densidad de probabilidad exponencial

J=--

f{x) =

).rU

Probabilidades de la cola derecha de la distribucin exponen


cial

F-Dcin de densidad de probabilidad de la dbtribucin normal:


/(x)=

"Ji:

r-lll2l(b-)/ol~

PROBLEMAS COMPLEMENTARIOS
iculo de est1dlstlcas

Los datos es1n dismbuidos uniformemente entre lo


valore de 6 y 14. Determine el valor de /{x). Cu.les son
la media y desviacin otfodar de ota distribucin?
Cual es la probabilidad de seleccionar al azar un valor
mayor que 11? Cul es la probabilidad de seleccionar al
azar un valor entre 7 y 12?
Suponga una distribucin normal y encuentre las
,jguien10 probabilidades.
1. P(x< 21112Sya4)
b. P(x :a: 771-= SO v o 9)
c. Pf.x > 471 = SO y u 6)
d. P\13 <x< 29' 23yu =4)
e. P(x C!: 1051 90 )'<1"" 2.86)
<i.36 Trabaje los siguientes problemas de di>tribucin binomial con el uso de la distribucin normal. Verifique sus
respuestas con el uso de la tabla del Apndice A.2 para
resolver las probabilidades.

Ptx 1211 = 25 )' p .60)


b, Ptx > 5ln 15 y p .SO)
c. P(x :S 3ln
10 y p .. SO)
d. P(x 01! 8 n 15 y p .40)
6.37 Encuentre las probabilidades para los siguientes problemas de distribucin exponencial.
1.

=
=

1.P(x:a:31'-= 1.3)

b. P\x < 2IA = 2.01


c. pr 1 :S X :S 3IA 1.65)
d. P(x > 21'- = .405 1

Pruebe sus conocimientos

6.38 La U.S. Bureau of Labor Stafbtl(S reporta que las personas que por lo general trabaiau tiempo compkto, d
nmero promedio de horas uabajadas por semana es
43.4 Suponga que el numero de horas trabajadas por
semana. por quienes suden traba1ar uempo completo.
est normalmente distribuido, Suponga que 1::!% de

estos empkados trabaian mis de 48 horas. Con base en

porcentaje, cWl a la desviacin estndar del


ndmno de horas trabajadas por semana para estos
mipleados?
Una encuesta de la U.S. Bureau of Labor Statistio mosu que uno de cada cinco personas de 16 aJ\o> de edad
o ~yortS es voluntario en parte de su tiempo. Si esta
cifra se cumple para toda la poblacin y 'i se toma al
azar una muestra de 1 SO perwnas de 16 afio> o mayores,
cu! es la probabilidad de que m de SO de lo> muestreado> trabaje voluntariamente
t:n empresario abri una pequea ferretera en una
zona comercial. Durante las primera. semanas, el negocio tena poco> clientes y <lo atendan a uno cada 20
minuto> en la mallana . Suponga que la llegada aleatoria
de clienta a una dtribucin de Poisson.
L Cu!! es la probabilidad de que al meno> 1 hora
transcurra entre clienta?
b, Cu.ti es la probabilidad de que de 10 a 30 minutos
transcurran entre cliente>?
c. Cu! es la probabilidad de que meno> de 5 minuto>
transcurran entre diente)?
En un ano reciente, el precio promedio de un paquete de
sofu.-are de actualizacin Microsoft Windows era S90.28
segn PC Data. Suponga que 10> precio> de ese paquete
ese aJ\o ataban normalmente distribuido>, con una desviacin estndar de 58.53. Si un vendedor al pblico de
paquetes de computadoras"
seleccion al azar ese allo,
cu.il C. la probabilidad de que el precio fuera arriba de
S95? Cul Q la probabilidad de que el precio estuviera
entre $33 y S8P
Segn el U.S. Depanment of Agriculturc, los producto
res de huevo de Alabama producen millones de huevos
al ano, Suponga que la produccin por aJlo en Alabama
est.i normalmente distribuida, con una desviacin estndar de 83 millones de huevos. Si durante <lo 3% de los
aos se producen m.h de 2655 millones de huevos, cu!
es la produccin media por parte de granjeros de
Alabama?
La U.S. Bureau of Labor Statinio public cifras sobre el
numero de trabajadora de tiempo completo >' trabajadores a sueldo con hcrarios flexibles, lo> trabajadores
de tiempo completo y a sueldo de cada categora de edad
es1.tn casi uniformemente distribuidos por edad, con
edades que van de 18 a 65 ~
Si un trabajador con horario Oexible se selecciona al azar de una fuerza de trabajo
de Estados Unidos, cual e> la probabilidad de que
tenga entre 25 y 50 allos de edad? Cul es el valor
medio para esta distribucin? Cul e> la altura de la
distribucin!
Una convencin de negocios mantiene su registro el
viernes por la matlana entre la. 9 a.m. r las 12 p.m.
Experiencias pasadas muestran que las personas que lle
gan se registran y siguen una distribucin de Poi550n a
un ritmo promedio de 1.8 cada 15 segunde . Por fortu
na, se dspene de \-arw instalaciones para registrar
miembros a la convencin,
este

6.39

6.40

6.41

6.42

6.43

6.44

Cul es el nmero promedio de segundos entre


gadas al lugar de registro pan esta conferencia,
base en resultados pasados?
b, Cual es la probabilidad de que transcurran
segundos o m.ts entre llegadas al registro?
c. Cual es la probabilidad de que transcurran
de 5 segundos entre llegadu?
d. Suponga que las computadora. de registro se
componen durante un periodo de 1 minuto. e
situacin seria un problema? Cul e> la probab
de que transcurra al menos 1 minuto entre 11
6.45 A-1/PF R&11rdt, Inc: tiene registrado el promedio de
mensual por departamento en alguna. de la. diud.lm .
ms costosas en Estados Unidos. Segn su reporte
costo promedio para rentar un departamento
Mmneapol~ es S951. Suponga que la desviadn
dar para rentar un departamento en Minne.ipolis es
y que las renta. en Minneapolis cstn normalmente
tribuidas. Si un departamento en Minneapolis se
ciona al azar, cul es la probabilidad de que el
L

<>ea:

6.46

6.47

6.48

6.49

a. SI 000 o mas?
b. entre S900 y SI 100?
c. entre S825 )' S925?
d. Meno> de S700?
Segn The \\'irthlin Rtport, 24% de lo. trabai
dicen que su trabajo es muy estresante, Si al azr
seleccionan 60 trabajadore, cual e> la probabi.;.idad
que 17 o m.is digan que su trabajo es muy estr
Cual es la probabilidad de que mis de 22 digan qut
trabajo es muy est~nte? Cual es la probabilidad
que entre 8 y 12 (inclusive) digan que su trabajo es
estresante!
La U.S. Bureau of Labor Statistio reporta que el
promedio anual en la zona metropolitana de Bostcm
$45 121. Suponga que los salarios anuales de la
metropolitana de Boston estn normalmente dst
dos, con una desviacin estndar de S4 246. Al azr
selecciona un trabajador de la zona de Boston.
L Cu.il c. la probabilidad de que el salario anua!
trabajador ~ mis de SSO mil?
b. Cu! es la probabilidad de que el wrio anual
trabajador sea menos de S40 mil?
c. Cu.il es la probabilidad de que ti salario anual
trabajador sea mas de S35 mil?
d. Cual es la probabilidad de que el salario anual
trabajador sea entre S39 mil y $47 mil?
Suponga que los intervalos de una sala de emergmcu
un hospital durante un dia hbil estn di~1n"b
exponencialmente, con un tiempo promedio entre
gadas de 9 minutos. Si la. llegadas son dbtribudono
Poisson. cual 5Cria el nmero promedio de llegadas
hora? Cual es la probabilidad de que menos de 5
tos transcurran entre cualesquiera do> llqadas?
Suponga que la. velocidades promedio de trenes
pasajeros que viajan de Sewark, Sew Jersq,
Philadelphia, Pcnnsylvania, estn normalmente

CAPIT\iLO 6 OISTIUBl/OOSE$ CO!'."lTh"UAS 215

6.50

6.51

.5?

li.SJ

LS4

buldas, con un promedio de velocidad media de 88


millas por hora y una desviacin otndar de 6.4 millas
por hora.
a. Cul es la probabilidad de que un tren promedie
menos de 70 millas por hora?
b. Cul es la probabilidad de que un tren promedie
ms de 80 millas por hora?
c. Cul es la probabilidad de que un tren promedie
entre 90 y 100 millas por hora?
La Conference Board public informacin de por qu
las compalltas esperan aumentar el numero de trabajos
de tiempo parcial y reducir lo) puestos de trabajo de
tiempo completo. Ochenta y uno por ciento de las compal'l.las dijeron que la razn era obtener una fuerza de
trabajo Oexible. Suponga que se identifica y entrevista a
200 companias que esperan aumentar el nmero de trabajo de tiempo parcial y reducir los puestos de trabajo
de tiempo completo. Cul es el nmero esperado de
estas compallias que estaran de acuerdo en que la razn
es obtener una fuerza de trabajo Oexible? Cul es la probabilidad de que entre 150 y 155 (sin incluir la 150 o la
155) den esa razn? Cul es la probabilidad de que mas
de 158 den esa razn? Cul es la probabilidad de que
menos de 144 den esa razn?
Segn la U.S. Bureau of ihe Census, alrededor de 75% de
usuarios de transporte suburbanos en Estado Unidos
van solos en su auto al trabajo. Suponga que al azar K
muestrean 150 viaieros.
a. Cul es la probabilidad de que menos de 105 viajeros vayan solos en auto a su trabajo?
b. Cul es la probabilidad de que entre 110 y 120
(inclusive) viajeros varan solos en auto a su trabajo?
c. Cul es la probabilidad de que ms de 95 ~iajeros
vayan solo) en auto a su trabajo?
Segun lu cantidade) publicadas por el National
Agricultura! Statini~ Service del U.S. Department of
Agricuhure, la produccin de trigo en Estados Unidos
en los ltimos 20 al\os ha sido distribuida uniformemente. Suponga que la produccin media en este periodo es de 2 165 millones de bushtls. Si la altura de esta
distribucin es de .862 mil millones de bushtls, cules
son los valores de a y b para esta distribucin?
El Federal Reserve S)"$tem publica datos sobre ingl"C$0S
familiares con base en su encuesta de linanus del consumidor, Cuando el jefe de familia tiene grado unversitario. el ingreso medio de la familia antes de impuestos
es S85 200. Suponga que 60% de los ingresos de la familia antes de impuesU estn entre $75 600 y $94 800 y que
estos ingresos esun normalmente distribuidos. Cul es
la desviacin esndar de ingresos de la familia antes de
impuestos cuando el jefe de la familia tiene grado universitario?
Segn The Polk Company, una encuesta de familiu
que usan Internet para comprar o rentar autos report que
81 % estaban buscando informacin de precio . Adems,
"""" estaban buscando informacin sobre productos
ofrecidos. Suponga que se entrevistan 75 familias selec-

6 .SS

6.56

6.S7

6.S8

clonadas al azar y que usan Internet para comprar orentar autos.


a. Cul es el nmero esperado de famlw que buscan
informacin de precios?
b. Cu'1 es el nmero esperado de familia. que buscan
informacin acerca de productos ofrecidos?
c. Cul es la probabilidad de que: 67 o m. familias
busquen informacin de precios?
d. Cul es la probabilidad de que menos de 23 familia..
busquen informacin acerca de productos ofrecidos?
Los negocios situado~ en la costa a lo largo del Golfo de
Mtxico desde Texas hasta Florida se preocupan por la
amenaza de huracanes durante la estacin de junio a
octubre. Los negocios se ponen especialmente inestables
cuando entran huracanes al Golfo de Mxico. Suponga
que la llegada de huracanes durante esta estacin es una
distribucin de Poisson, con un promedio de tres huracanes que entran al Golfo de Mxico durante la estacin
de cinco meses. Si un huracn acaba de entrar al Golfo de
Mxico, cul es la probabilidad de: que transcurra al
menos un mes antes que: al golfo entre el siguiente huradn? Cu.ti es la probabilidad de que otro huracn entre
al golfo de Mxico en dos semanas o menos? Cu'1 es el
tiempo promedio entre huracanes que entran al Golfo
de Mxico?
Con el creciente inters por la tecnologa r el entorno
cambiante de los negocios, muchos trabajadores estn
descubriendo que la capacitacin en forma de reeducacin, desarrollo de habilidades r crecimiento personal
son de gran ayuda en d mercado de trabajo. IJna reciente
encuesta de Gallup encontr que 80%, de quienes son
de la generacin X, consider la disponibilidad de capacitacin pagada por la empresa como un factor para
valorar al tomar un trabajo. Si al azar se seleccionan 50
personas de la generacin X. cu.ti es la probabilidad de
que menos de 35 consideren la disponibilidad de: capa
citacin pagada por la empresa como factor para valorer
al tomar un trabajo? Cul o el numero esperado? Cul
es la probabilidad de que entre 42 y 47 {induslve) con
slderen la disponibilidad de capacitacin pagada por
la empresa como un factor para valorar al tomar un trabajo?
Segun la Air Transport Aisociation of America, d costo
promedio de operacin de un avn ~ID-SO es S20S7
por hora. Suponga que los costo> de ~raOOn de: an
l'in .MD-80 estn normalmente distribuidoscon ana
desviacin estndar de $175 por hora. A qui COSU> de
operacin serian menos 20% de los costos de openn?
A qu costo de operacin Krian mis 65% de los cos:os
de operacin? Qu costo de operacin seria m$ de
85% de los costos de operacin?
Por lo general los >upermercados suden estar llW concurtidos a N> de la. 5 p.m. en dW ~biln. porque:
mucho> rrabaiadores se detienen en 5U canuno 1 Cl$a
para comprar. Suponga que 1 esa hora las llepdas a una
caja rpida de pago del supennerado son una dstribucin de Potsson, con un promedio de .8 penon.a.s/minuto.

216

ESTADISTICA

E.'l l.05 :>:EG0005

Si la ajera acaba de hacer el cobro a la ltima persona


de la fila. cu.U e> 1.a probabilidad de que tran~urra al
menos un minuto antes que llegue el siguiente cliente?
Suponga que la cajera desea ir a la oficina del gerente y
hacer una prqunta rpida y necoita 2.5 minutos para
hacerlo. Cul es b probabilidad de que la empleada
regrese antes que llegue el siguiente cliente?
6.59 Stgn Edrror and Pub/1.W,. fo1rfiook,d promedio de cireuladn diaria de Th \\'ali Strttt lournal con base en
cifraa dd alto 2000 e 1 762 751. Suponga que Ja desvacin C61indar es 50 940. Suponga que la circulacin dari.t del peridico est normalmente distribuida. En
qu~ porcentaje de das rebasarla una circulacin de
1 850 000? Suponga que el peridico no puede soportar
los gastos fijos de una preparacin de circulacin cornpleta si la circulacin cae por abajo de 1 620 000. Si Ja
probabilidad de que ocurra este evento es baja, el geren
te de produccin podra tratar de mantener b plantilla
completa de perscnal en >U Jugar y no alterar operariones, Con qu ftt.:uencia ocurrir este evento, con base
en inform.:adn histrica?
6.60 Las llamadas telefnica. emrames por lo general 5C con
sidttan de distribucin de Poisson, Si una operadora
promedia 2.2 llamadas cada 30 segundos. cul es el
tiempo esperado (promedio) entre llamadas? Cul es la
probabilidad Je que transcurra un minuto o m. entre
lbnudu entrantes? Dos minutos!
Interpretacin de i. aalide
6.61 A continuacin se ilustra una valida Ml~ITAB. Suponga

que los datos representan el numero de compaeros de


ventas que trabajan en una tienda de departamento. en
cualquier dla hbil. Describa la distribucin que incluya

Ja media y b des'iadn estndar. Interprete la forma de b


distn'bucin )'la media en vista de lo> date esiudadcs.
Cul si;mfican la> expresiones de probabilidad?

CUHULATIVE DISTRIBUTION FUNCTION


Continuoua uniform on 11.0000
to 32. 0000
X

28.0000
34.0000
16.0000
21.0000

P(X

<

X)

0.8095
1.0000
0.2381
0.4762

6.62 Un.:a compatlia fabricante produce una varilla de metal.


Utilice la salid.:a Eltcd que !!C muestra aqu para describir
el peso de la \-arilla. Interprete los valores de probabili
dad en trmmos del proceso de manufactura.

6.63 Suponga que Ja ulida MISITAB que se muestra


representa el anilisis de la duracin de llamadas de
fono celular p.ira uso en casa, en trminos de mil"i=i
Describa la d~1ribucin de duracione> de llamada
telfono celular e interprete el signfkaJo de las
siones de probabilidad.

CUMULATIVE DISTRIBUTION FUNCTIOS


Normal with mean 2. 35000 and
standard deviation O .110000
X

<

P(X

2.6000
2.4500
2.3000
2.0000

X)

0.9885
0.8183
0.3247
0.0007

6.64 Un restaurante promedia 4 .51 clientes por 1 O


durante el verano en las ltimas boras de la tarde.A
1inuaci6n se muestran salidas Excrl y MINTTAB
este restaurante. Analice el tipo de distribudn
Jo y el ,jgnificado de
probabilidades.

11
Distrlbution: A ' 51

2 )( Values Probabi'.:tv" s
3

0.1
02
0.5
1o

4
1

0.5942
0.8951

o~

1 oooc:

o~

CUMULATIVE DISTRIBUTION FUNCT:


Exponential with mean 0.221
X

0.1000
0.2000
0.5000
l.0000
2.4000

P(X

<

0.3630
0.5942
0.8951
0.9890
1.0000

X)

...

CAPfTULO 6 DISTRIBUCIO:SES

CO!'lll.'1,'tJA!>

217

ANLISIS DE LA BASE DE DATOS


L Seleccione la base de datos de sene de nempo de una emp:n:a agrcola industrial y realice una grfica de l)tograma

para cebo!W o para brcoli. De manera aproximada. cada


cm de esus variables est distribuida normalmente.
Cakule la media y la desviacin estndar para cada distribocin. Los datos de esta base de datos representan el peso
~ual (en miles de libras) de cada legumbre. En trmiDOS de pe-o mensual, describa cada una de t<>ta.s legumbres
aboU.~ v brcoli 1 Si al azar se selecciona un mes de la discbudn0de cebollas, cuAI es la probabilidad de que cl peso
tca ms de SO mm Cul u la probabilidad de que el
peso ~ entre 25 mil y 35 mil? Si al azar se selecciona un
me de la distribucin de brcoli, cu.il es la probabilidad
de que el peso sea m> de 100 mil? Cual es la probabili6d de que el peso ~a entre 135 mil y 170 mil?

2. Utilice la base de dato de manufactura. La variable del


grupo industrial e<t casi uniformemente distribwda en
esta base de dato, con valores de a 1 a b 20. Cuil es
la altura de esta distribucin! Cul es la probabilidad de
seleccionar al az.a.r un grupo Industrial de 7 a 13 (inclus
ve) de e.ta poblacin si la d)tribucin es uniforme? Utilice
la teora de distribucin uniforme para 1rabajar este problema. no lo) nmeros reales de la base de datos,
3. Construya grfica) de histograma de las variables de la
base de datos de manufactura. Encuentre al menos una
gr(ka que parezca tomar la fonm de una dimibucin
exponencial. Calcule estadsticas descriptivas p;ua esa
variable . .b1udie las estadisricas y analice qw! informadn
transmitida por la.s estadsticas indicarla que la forma de la
distribucin podra ser exponencial.

' CASO: MERCEDES VA TRAS COMPRADORES JVENES


mis de 1res dcadas, Mm:tdes y B~f\\' han competido
con cabeza por 'U participacin en el mercado de aUIO)
En 1959, Baycrische Mo1oren Werke (B~IW) casi se
:a b quiebra y casi fue \cndida a Daimler-Benz, fabricante
autos Mercedes-Benz. u B~IW pudo recuperarse, al
que en 1992 rebas a Mercedes en ventas en todo el
Entre las razone> del xito de la BM\\' fue su capacipra vender modelo> que eran m.b lujoso) que los modez:::a10rc> pero se concentr en proporcionarle calidad al
==llOOr y responsabilidad ambiental, En panicular, 8/11\\'
como objetivo su campo de ventas hacia el merado de
mientras que Mercedes retena una base de cliente)

En mpucsta al xito de BM\\', xtercede, trata de cambiar


al lanzar varios producto> en un esfuerzo por atraer
:::::=;ndores jvene interesados en autos deportivos y de
docmpeo. BMW, influida por Merccdc-; e-1.i presiopara que s~ autos sean ms refinados )' cmodos. De
un experto automotriz dice que .\ler(tdc> desea con
m B~IW y viceversa, :-.10 obstame, segn un experto
motores, el inters est todava en el luio y comodidad
Mcctdes en tanto que 8/11\\' se concentra en el deserny manejo dinmico de sus autos. Aun cuando cada una
cs:zs compa[as produce muchos modelo) diferentes, dos
-~~wcs cupt relativamente comparables son el B~IW
Yd Mercede, CU:: 320. Ha.sta el afio 2002, el precio pro
ckl 330ci era de S34 990 en comparacin con S-13 215
an C.K 320. El rendimiento de combustible para el 330ci
30 miJW por galn en carretera y 21 milla> por galn en
en comparacin con 29 millas por galn en carretera
cilhs por galn en la ciudad para el CLK 320.

~23que ~tcrctcbe1 preocupada porque los precios


de distribuidores del CLK 3:!0 no 50n consistentes r que
cuando el precio e> S-13 21 S, los precios estn en reali-

dad normalmente distribuidos con una desviacin estn


dar de .S2981. Suponga tambin que Mcrcc:de) cree que a
S42 mil. el CU.: 320 tiene un precio que est fuera del mercado del B~I\\' 330ci. Que! porcentaje de los precios de
distribuidore para el Mcrct-dcs Cl.K 320 es m.b de S42 mil
y por tan10 fuera del mercado del B~IW .330d? El precio
promedio de un BMW 330ci e) Sl4990. Suponga que estos
precios tambin estn normalmente distribuidos con una
desviacin estndar de S2367. Qu porcentaje de distribuidore de B~I\\' fijaron el precio del 330ci a mis del
precio promedio de un Cl.K 320? Qu porcentaje de distribuidorcs de Mercedes es1an fijando el precio del Cl K
320 a menos que el precio promedio de un 330ci? Suponga
que un distribuidor de B~IW vende un 330ci en S3;' 059.
Qu porcentaje de distribuidores de ,\krctdn fijad precio del CLK 320 a menos de este precio? En rrmnos del
Cl.K .320 que compile con d 330ci por precio. que! nos
di'cn <:>10$ dato'?
2. Suponga que el rendimicn10 en m'.!las por galn para
\'arios autos cu::. incluyendo d hho de que algunos con
due1or~ son menos eficiente que olros, est uniforme
mcnlc dis1ribuido sobre un rangn de 24 milla$ por g.ln a
34 millas por galn en carretera. Qu~ proporcin dc autos
cae en d rango de 26 a 30 millas por galn? Suponga que
el rcndimknto en millas por galn pJra \-arios autos 3 JOa
C)l.l uniformcmen1c dis1ribuido sobre un rango de ::.~
milla' por galn a 35 milla.) por galn en arreura.. (Qu
proporcin de au10' .330ci cae en el rango de 26 .1 30 r.:=
por galn? Cmo ~ compara este rcndmumto con b
cifra para el CU\? Qu~ significa csu compuao6t!>
Suponga qu~ es1as can1idadcs fueron '-crdadtras v M~de\ desea apelar a compradOttS coruamtes cid ambiente
con base en cconomia de combustible. Cakuk b proporcin de cada uno de los dos moddos de autos que obutncn .~O millas o mis por pin segn estas cantidades. v
compare lo' resuhados.

218

J.

ESTADISTICA E..''LOS NEGOCIOS

Suponga que en una distribuidora se vende un promedio de 1.37 CLK cada 3 horas (durante un db de 12
hora. de expo>icin) y que esas ventas son distribuciono de Poisson. !.a) siguientes probabilidades produci~ por Excel indican la presentacin de diferentes
l.lempoi entre venias con base en esta informacin.
E.midie la glida e imerpr1da para los vendedores. Por
ejemplo, cuil es la probabilidad de que transcurra
n>m()) de una hora entre \"Cntas? Ctdl es la probabilidad de que traJJSCUm nW de un db ( 12 horas por dla)
amo de la siguiente venta una \U que se baya vendido
un auto? Qu pueden hacer los gerentes de la distribuidora con esta informacin? Cmo puede esto ayudar en la contratacin de personal? Cmo puede
usarse esta informacin como medio de seguimiento

para el impacto de publicidad? Hay opcin de que


estas probabilidades cambien durante el ano? Si es uf.
por qu?

dt tiempo de 3 horas

Prob8billdadts txponenci&lts
ICIUDuiativas dtsdt
la liqula'da

0.167
0.)33

0.2045
0.3663

0.667
1

0.5990
0.7459
0.9354
0.9836
0.9958
0.991!9

Partt de un marco

3
4
5

USO DE LA COMPUTADORA
EXCEL

Excel ~ putek usar para calcular probabilidades acumulativas


para ,-aJores~
de x ya sea de una distribucin exponencial o de una dstribucin normal. En cualquier de los dos
casos, comience por seleccionar la tecla de funcin, /10 de la
barra de bnramknw. Produciri la funcin Paste Function.
A continuacin K!Kcione la funcin, Statistical, del lado
izquierdo de la YCl!Wla ~te Function. Aparece una nueva lista de opciones en d lado derecho.

Distribucin normal

w probabilidades de curva normal se pueden obtener al


seleccionar la funcin NORMDlST del lado derecho de la
funcin StatisticaL Aparece una caia de dilogo. La caja de
dilogo tiene cuatro lintU a w que se debe responder. Escriba
el valor de x en la primera linea. la media en la segunda lnea,
y la desvacin est.indar en la tercera linea. La cuarta linea
requiere una re.puesta lgica )"ll sea TRUE (VERDADERO) o
FALSE (FALSO). Si el usuario escribe TRUE. obtendr4 las probabilidades acumulativa. para todos los valores hasta x; si
escribe FALSE. obtendr el valor de la funcin de densidad de
probabilidad para esa combinacin de x; )' u. En este capitulo, estarnos intelbado en resolver y usar probabilidades y,
por lo 1an10, casi siempre usaremos la respuesta lgica TRUE.
Distribucin exponencial
~ po ible obtener probabilidades de una durnbucin exponencial al seleccionar la funcin EXPONDIST de la lista del
lado derecho de la funcin StatisticaL Aparece una caja de
di.ilogo EXPONDIST. Esta caia de di.ilogo contiene tres lineas
a las que el wuario debe responder. Ponga el valor de Xo en la
primera linea y el valor de .\ en la segunda linea La tercera
linea requiere una respuesta lgica ya~ TRUE o FALSE. Si el
usuario escribe TRUE, obtendr las probabilidades acumula-

tivas desde cero al valor de xo; si escribe FALSE. obtcndri d


valor de la frmula de densidad de probabilidad. Para problemas trabajados en este texto, estarnos interesados en las prebabilidades acumulativas y pondremos TRUE como mpuea
en esta caja.
MINITAB
MINITAB ofrece la funcin de producir probabilidades pan
distribuciones exponenciale-, distribuciones normales o di5tribuciones uniformes. Comience el proceso al seleccionar
opcin ~c en la barra de men, que multa en un men
eendeme. En este men, seleccione Probability J2is
tions. Cuando el usuario seleccione esta opcin, aparea
men descendente.

Distribucin uniforme
Para usar MINITAB Window) para calcular probab
desde una distribucin uniforme, seleccione Uniform
men descendente Probability Distributions. Esta
resuhara en una caja de di!logo. Esco1a cmo se calcu1z:;
probabilidades al seleccionar Probability IXnsity,
Iatlve Probability o Inverse Probability. Probabilty
proporciona el valor de la densidad de probabilidad para
combinacin panicular de a, b y x, Cumulatrvt Pn
produce las probabilidades acumulati~-as para valores
o iguales a x: Con lnverse Probability da la inversa de !al
babilidades acumulativas. Aqul estarnos interesado$ p
mente en probabilidad acumulativa. En la otra lnea.
tndpoint, escriba el valor de a. En la linca, Upper en
escriba el valor de b. Si el usuario d~ tener probab~
calculadas para varios valores de x, pngalas en una
seleccione la opcin de columna de entrada, y ponga ci:
lista la ubicacin de columna de los valore. x. Si slo
calcular la probabilidad para un valor particular de x. ba;z
en constan le de entrada y escriba x.

CAJ>llVLO 6 DISTIUBUC101''ESC01'"111''VAS 219

Distribucin normal

Distribucin exponencial

Pan usar MlNITAB para calcular probabilidades desde una


d.in1>ucin normal, seleccione qponeotial del men deseendente Probabiliry Distributioos. Esta seleccin resultar
en una caja de dilogo. Elija cmo se calculan probabilidades
al seleccionar Probability Density, Ounulative Probability o
ID\tne Probability. Probabiluy Density dad valor de la deos:xiad de probabilidad para una combinacin particular de x,
', o. Cumulative Probability produce las probabilidades acuculativas para valores menores o iguales a x. lnverse
Probabi/11y proporciona la inversa de las probabilidades acuculativas. Aquf estamos interesados principalmente en problbilidad acumulativa. En la linea, .Mean escriba el valor de,
J en la linea Standard desvarien, escriba el valor de o Si el
auario desea tener probabilidades calculadas para \'UIO~
res de x, pngalas en una columna, seleccione la opcin de
umna de entrada, y ponga en una lista la ubicacin de cot:::zona de lo) valores x. Si slo desea calcular la probabilidad
:wa un valor panicular de x, hap clic en constante de entra
a y escriba JC.

Para usar MINITAB para calcular probabilidades desde una


distribucin exponencial, seleccione EJponMrial del men
descendente Probability Disrriburions. Esta seleccin ruultari
en una caja de dilogo. Escoja cmo se calculan probabilidades al seleccionar Probability IXnsity, Cumu/ari-t Probabiliry, o
lnvtrU Probability. Probability Density proporciona d valor
de la densidad de probabilidad para una combinacin particular de JCo y. Cumulative Probabilty produce las probabilidades acumulativas para valores menores o gualb a JCo. lnverse
Probability da la inversa de las probabilidades acumulativas,
Aquf estarnos interesados principalmente en la probabilidad
acumulativa. En la lnea .Mean, escriba el valor de Si el
usuario desea tener probabilidades calcufadas para vario)
valores de
pngalas en una columna, seleccione la opcin
de columna de entrada, r ponp en una lista la ubicacin de
columna de IO$ valores JCo. S slo desea calcular la probabilidad para un valor particular de JCo. haga clic en constante de
entrada y escriba JCo. J\"ota:MINITAB usa la meda, 11>.,
no el valor de >..

"'

CAPTULO

Muestreo y distribuciones
muestrales
OBJETIVOS DE APRENDIZAJE
Los dos objetivos principales del captulo 7 van a proporcionar al lector una aprecia
cin para la correcta aplicacin de tcnicas muestrales y la comprensin de las distribuciones muestrales de dos estadsticas, con lo cual podr:
l. Determinar cundo usar muestreo en lugar de un censo.
2. Distinguir entre muestreo aleatorio

r muestreo no aleatorio.

3. Determinar cundo y cmo usar diversas tcnicas de muestreo.


4. E tar alerta de los diferente' tipos de errores que pueden presentarse en una
encuesta.
S. Comprender el impacto del teorema central de limite en un anlisis estadstico.
6. Usar las distribuciones muesrrales de la media i y la proporcin

220

p.

Cul es la actitud de los trabajadores de maquiladoras?

A principio> de la dcada de 1960 el gobierno

de Mxico estableci un programa de maquiladoras.


Este programa permiti a corporaciones estadounidenses construir plantas de manufactura dentro del
territorio mexicano, donde pudieran imponar suministros y materiales de Estados Unidos, libres de
impuestos, para ensamblar y fabricar producto), y luego exportar los artculos terminado> de regreso a
Estados Unidos. La idea era convencer empresas estadounidenses pua construir en Mxico por la mano de obra barata que hay en este pas, y asl crear trabaio$ para mexicanos.
El programa ha sido exitoso. con ms de 3 500 compatlw registradas en l. Para el atlo 2000 estaban empleados ms de 1.1 millones de trabajadores, Se ntima que l3$ maquiladoras gastaron 50 mil
millcnes de dlarn con proveedores en 1999, con exportaciones de la industria maquiladora unos
65 mil millones de dlares. Casi 85% de la manufactura de maquiladoras e>l.i en lo> e>tado> del norte
de Mhico que hacen frontera con Estados Unido>. Estas empresas estn concentradas en Ciudad luarez.. Tijuana, .Mexicali. Nuevo Laredo y .Ma1amOTO$. El programa de maquiladoru abarca ahora compatlias de todo el mundo, incluyendo Japn, Corea, China. Canad y muchos pal~ europeo>.
Qu perfil tienen lo) trabajadores mexicanos de maquiladora.? Cu.tics son sus actitudes hacia sus
trabajo. y sus compaflias? Hay brechas culturales entre compatlia y trabajador que deben cerrarse para
utilizar con ms eficiencia lo> recursos humano>? Qu actitudes y expectativas basadas en la cultura
llevan los trabajadores de maquiladoras a su trabajo? Cmo se ocupa un investigador de negocios en
encuestar trabaiadores!

Preguntas gerenciales y estadsticas


Suponga que unos mvesugadores deciden encuestar a trabajadores de maquiladoras para averiguar lu
actitudes de los trabajadores hacia el entorno del trabajo y la compaa, y lo que de ella esperan,
l. Deben k investigadores tomar un censo de todos los trabajadores de una maquiladora o ~.lo
una muestra? Cules son las razone' de cada una de ellas?
2. Si ~utiliza una muestra, qu tipo de tcnica de muestreo ganarla la informacin m.i> valiosa?
Cmo pueden lo> investigadores estar seguros que la muestra de trabajadores es representativa
de la poblacin?
). Qu tipos de pregunw deben formularse y cmo deben expresarse?
4. Pueden 13$ preguntas ser analizadas cuanmauvamente! Si es asr, qu tcnicas estadsticas son
mas apropiadas?
S. En qu formato pueden los investigadores 11~-ar con ms eficiencia los re ultados del estudio
a la administracin?
6. Cmo puede la administracin hacer uso completo de los resultado'> de una encuesta para tener un entorno de trabajo ms productivo!
adopl.do
L Noll.Moi<an M~1bdon \~
Altitud<Towvd Y.'brking."
"" E'.Gmo..aa.
vol IX. no.l ISpring 19921. pp.14; MaJ/lblit ,\Wp:iM, hnyJ/www~mihtm.
acUU<d
s~ 8. Ziiitr. ~~iladora 2001 UnckrmnJllliland Prq>orq."aVlibblc at bnp:/1-w.nwgwdccomlmal ~
Fwntt:

do Ch<tyl

An

Scvt!n.n: ~

S-

2000;

221

222

ESTADISTICA ES ios SEGOCIOS

Este capuulo explora el proceso de muestreo r las distribuciones muestrales de algunas enadsti~.Cmo obtenemos los datos empleados en anlisis estadstico? Por qu a veces los investigadores
toman una muestra en lugar de realizar un censo? Cu~les son las diferencias entre muestreo aleatorio
y no aleatorio? Este captulo aborda 6tas y otras preguntas acerca del muestreo.
Tambin se presentan las distribuciones de dos estadsticas:
La media muestral.
1..1 proporcin muestral.
Se ha determinado que estas estadi>tcas estn casi normalmente distribuidas bajo ciertas cond:
cienes. El conocimiento ruso de la meda muestra] y proporcin muestral es importante en el estu
de estadlstica res bisico para gran pule del anlisis estadstico.

7.1 MUESTREO
El muestreo se utiliza ampliamente en negocios como medio para reunir informacin til acerca
una poblacin. Se renen datos de muestras y se sacan conclusiones acerca de la poblacin como panr
del proceso de estadsticas inferenciales, En el Dilema de deciliin sobre trabajadores de maquilador&
podra tomarse una muestra aleatoria de trabajadores de una amplia seleccin de compafllas en '-UUS
industrias de las ciudades fronterizas ms importantes. Un cuestionario cuidadosamente formu
que sea culturalmente sensible para ~ mexicanos podra aplicaN a trabajadores seieccionados p:t
determinar actitudes de trabajo, expectativas )' diferencias culturales entre trabajadores y compl!
Los im-ngadore podran compilar y analizar 10> datos recogidcs de las respuestas, Asi como hacmr
resmenes y observaciones acerca de la perspecnva y cultura en el programa de maquiladoras. 1..1 a~
rilitracin y quienes toman decisiones podrlan entonces tratar de usar lo. multado. del estudio
mejorar el rendimiento y motivacin de trabajadores. A veces, una muestra proporciona medios ra
nables p.ira reunir esta til informacin para toma de decisiones que, de otra manera, podra 'ICr
canzable y no asequible.

Razones para muestreo


Tomar una muestra en lugar de llevar a cabo un censo ofrece varias ventajas.
l. La muestra puede ahorrar dinero.
2. La muestra puede ahorrar tiempo.

). Para recursos dados. la muestra puede ampliar el alcance del estudio.


4. Como el proceso de investigacin a veces es destructivo, la muestra puede ahorrar produ~
S. Si el acceso a la poblacin es imposible, la muestra es la nica opcin.
Puede ser ms barato obtener una muestra que un censo para cierta cantidad de preguntas,
ejemplo. s se rcafa una entrevista telefnica de 8 minutos, llevar a cabo las entrevistascon una n:;a.
tra de 100 dientes en lugar de con una poblacin de 100 mil clientes obviamente es menos c
Ademh de ahorros en costo, el nmero considerablemente menor de entmistas por lo general
menos tiempo total. As, si obtener los resultado. es materia de urgencia. muestrearlos seria mh r:
Con la velatilidad de alguno) mercados y el constante bombardeo de la nueva competencia )' n
ideas. muestrear tiene gran ventaja sobre un censo en trminos del tiempo del ciclo de inve.tgaci&:.
Si los recursos asignados a un proyecto de investigacin son fijos. es posible reunir informacin
tallada si se toma una muestra que si se realiu un censo. Con recursos concentrados en menos n:;;
duos o articules, el estudio puede ampliarse en alcance para tomar en cuenta ms p~
especializadas, Una organizacin asign un presupuesto de S 100 mil para un estudio'! opt por
un censo en lugar de una muestra al U$3r una encuesta por correo. Los investigadores enviaron po:
rreo miles de ejemplares de una tarjeta computarizada que pareca voto de un juego de estrellas de
bol de lip ma)'or. La tarjeta contenta 20 preguntas que el interesado podra contestar S o :>:o al
un agujero. u informacin recuperada sir\'i para obtener lo> porcentajes de quienes contestaron
:>:o a las 20 preguntas. Por la m.$ma cantidad de dinero, la companta podra haber tomado una
tra aleatoria de la poblacin, tener sesiones personales con entrevistadores capacitado y reunir

CAPtn:LO 7 .\l\JESTREO Y DISTIUBUCIONE.S

Ml!EST1W..ES

223

macin de1allada <obre el procese en estudio, Al usar el dinero para una muestra, los inve tigadores podrtan pasar mucho ms tiempo con cada persona entrevistada y por tanto aumentra el potencial para
reunir informacin til.
Algunos procesos de invcs1igacin destruyen IO$ productos o articules en estudio. Por ejemplo. si
se prueban bombillas eletrieas para determinar cuanto tiempo encienden o si se prueba el sabor de
barras de dulce para determinar si el gusto es aceptable, el producto se destruye, S1 se realiza un censo
para este tipo de investigacin, no quedara ningn producto para venderse. Por 1an10. lomar una
muestra es la nica opcin realista para probar estos productos.
A veces es pracncamente imposible tener seceso a una poblacin para su investigacin. Por ejem
plo, algunas personas se niegan a contestar preguntas sensibles y algunos nmeros telefnicos no aparecen en las gulas. Algunos arttculos de inler6 (como un Chevrolet 1957) estn tan dispersos que
localizarlos seria sumamente diAcil. Cuando la poblacin es inaccesible por k1as u otras razones. el
muestreo es la nica opcin.

Razones para tomar un censo


A veces tornar un censo llene m.is sentido que usar una muestra, Una razn para lomar un censo es eliminar la posibilidad de que, por casualidad, una muestra seleccionada en forma alca1oria pudiera no
ser representativa de la poblacin. Incluso cuando se pongan en prctica todas las tcnicas apropiadas
de muestreo, una muestra que no es representativa para la poblacin puede seleccionarse por casualidad. Por ejemplo, si la poblacin de inters son los propietarios de camiones del estado de Colorado.
una muestra alca1oria de propietarios podran ser principalmente rancheros, cuando de hecho muchos
de los propietarics de camiones de Colorado son citadinos.
Una segunda razn para realizar un censo es que el cliente (persona que auloriza y/o suscribe el
estudio) no tiene una apreciacin para muestreo aleatorio y se siente ms cmodo al conducir un
censo. Estas dos razones para realizar un censo es1n basadas en la suposicin de que se dispone de
suficiente tiempo y dinero para llevar a cabo un censo.

Marco
Todo estudio de investigacin tiene una poblacin objetive que es1.i formada de individuos, insutuciones o entidades que son el objeto de investigacin. La mueslra se inicia con una lista, mapa, direaorio
u otra futntt tmplt,1dn para reprtstntar la poblaci6n que recibe el nombre de marco, el cual pueden ser
lisias escolares, de asociaciones de comercio o incluso lisias vendidas por corredores de lisias. En el
ideal, existe una correspondencia exacta entre las unidades del marco y las de la poblacin, por lo que
el marco y la poblacin objetivo suelen ser diferentes. Por ejemplo, suponga que la poblacin objetivo
son las familias que viven en Detroit. Un marco factible serian las pginas residenciales de las guas de
telfonos de Detrou, Cmo es que el marco podria ser diferente de la poblacin obje1i,o? Algunas fa.
milas no uenen 1el~fono. 01m familias 1ienen nmeros que no aparecen en las gulas. Incluso podrla
haber 01ras familias que desde que se imprimi el directorio se mudaron y/o cambiaron los nmeros
telefnicos, otras has1a tienen lisias mhiplcs bajo diferemes nombres.
Lo. marcos tienen rtgutro> tn exceso en las unidades de poblacin objetivo, mas algunas otras un
dades, Los marcos a los que le falta11 registros contienen menos unidades que la poblacin objetivo, El
muestreo se realiza desde el marco y no desde la poblacin objeuvo. En teorfa, la poblacin objetivo y
el marco son los mismos. En realidad, la mela de un investigador es minimizar las diferencias entre el
marco y la poblacin cbjetivo,

Muestreo aleatorio contra no aleatorio


Los dos npos pnncipales de muestreo son el aleatono y el no aleatorio. En el muestreo aleatorio cada
unidad dt la poblaci611 tiene la misma probabilidad dt ser $tltio11nda en la muestra. El muestreo alcatorio implica que la probabilidad entra en el proceso de seleccin. Por ejemplo, a casi iodos los t~ladounidenses lo gus1a creer que lo> ganadores de la apuesta nacional son seleccionados al sacar
mimtro> al azar. A finales de la dttada dt 1960, cuando se usaba ti sorteo mililar, casi rodas las persooas elegibles para el redutamientc confiaban que al azar se seleccionaba una fecha de nacimiento como
la primera fecha usada para reclutar personas. En estas dos shuaciones, los miembros de la poblacin
pensaban que las selecciones se hacan al azar.

224 ESTADISTICA[.'; LOS Nf.GOCIOS

En el muestreo no aleatorio no toda 1midad dt poblacin tiene la misma probablidad dt S6 sd


cionada en la muestra. Los miembros de muestras no aleatorio no son seleccionados al a.ur. Por ejemplo. podran seleccionarse porque cst~n en el lugar apropiado en el momento apropi.1do o porqut
conocen a las personas que conducen la investigacin.
A vece el muestreo aleatorio se denomina muestreo de probabilidad y el muestreo no aleatorio K
llama muestre dt no probabilidad. Debido a que no e:. igualmente probable que sea seleccionada cada
unidad de poblacin. asignar una probabilidad de que ocurra un suceso en muestreo no aleatorio a
imposible. los mtodo> estadstico> presentados y estudiados en este texto esn basado, en la >Upc:wcin de que los dat< provienen de muestras aleatorias. Los mttodos muestrale no aktlrorios no son rknicas apropiada.~ para reunir datos para ~r analizados por la mayor pan i los mttodos cstadmas
pr~ntados en est texto. No obstante, en esta seccin se describen varias tcnicas de muestreo no aleatorias, principalmente para alertar al estudiante de sus caractersticas y limitaciones,

Tcnicas de muestreo aleatorio


t....~-~;,_ lt'Cfli~ b.iscas de muestreo aleatorio pueden ser simples aleatorio> estratificado,, aleare
sistemrico y aleatorio de grupo (o rea). Cada una de estas tknica> ofrece ventaja) y de.ventau.
.AJgu~ tcnicas son ms fciles de usar, algunas con menor costo, y otras con mayor potencial pan
reducir error de muestreo.
Muestreo aleatorio simple
La tknica m.h elemental de muestreo aleatorio e> el muestreo aleatorio simple, el cual se puede ,;sm.
lizar como la base para I~ otras tcnicas de muestreo aleatorio. Con muestreo aleatorio simple,
unidad del marco se numera del 1 a N (donde N es el tamallo de la poblacin). En seguida.~ realiu
cuadro con nmeros aleatorios o un generador de nmero aleatorio se utiliza para seleccionar
artkulos en la muestra. Un generador de nmero aleatorio suele ser un programa de cmputo que pe
mhe que la salida calculada por la computadora d nmero. aleatorio" u tabla 7.1 contiene una bmc
lista de nmero. aleatorio . La tabla A.I, del Apndice A contiene una lista completa de nmeros ale>
torios en toda direcciones. Lo. espacios de la tabla A. I slo sirven para facilitar la lectura de valora.
Por cada nmero, cualquiera de los 10 dlgitO (0-9) es igualmente probable, de modo que es posiNt
obtener el mismo dgito dos veces o mas en una lila.
Como ejemplo, del marco de poblacin de compaas que aparecen en la fta de la tabla 7.2
un muestreo aleatorio simple para seleccionar una muestra de seis compaas,
Primero, numeramos cada miembro de la poblacin.
Seleccionamos tanto dgito para cada unidad mue treada como exlstan en el nmero
grande de la poblacin.
Por ejemplo, ii una poblacin tiene 2 mil miembro>, seleccionamos nmeros de cuatro dgi
Como la poblacin de la tabla 7.2 contiene 30 miembros, slo e. necesario seleccionar dos digtos
cada nmero. La poblacin est numerada de O 1 a 30, como se ve en la tabla 7.3.
El objeto es muestrear seis compaas, de modo que de la tabla con cuadro nmeros aleatorios
ben seleccionarse <ei' diferentes de dos dlgnos. Como e.ta poblacin contiene slo 30 compaflias
nmero. ma)"OfQ a 30 (3199) deben excluir-e. Si, por ejemplo. se selecciona el nmero 67, el p
se contina hasta obtener un valor entre 1 y 30. Si el mismo nmero se presenta ms de una va,
tinuamo con otro nmero. Para facilitar la comprensin, comenzamos con el primer par de dgitos
la tabla 7.1 y continuamos en sentido horizonral en la primera fila ha.ta que sean seleccionados n
TABLA 7.1
Breve tabla de
nmeros aleatorios

91567 mt5
1-.

,... .,,.
.., .,,.

27951

11145

ano

57f91 l67m
l9I05
7059

2'167
2m2

"900

97336

07119

""'

30134
8611
ll27e
f9J2J
1402

*29
71CMI

04024
02JM

""'

)M76

l'10J2

45021
J~
"'7S5
08171

51038

:mu
45799
25f99

rn.n

2'llO
Z0655
17'8
12544
22716
1"31
13916

997]0

'Stl127
aJ6
41CIS5
19792
35006
4756t

CAPtrulO 7 .ML'ESTRFOY 1>15TIUBUCIO:-ifSMllES'TltALES 225


lABlA 7.2
Marco poblacional
de 30 compa"1as

~.-.

Ocicirlm..a ......

Cllfllalip

llM

.....

DllllA/6Llllll

s._.
1.-

a..-

a..

Dlme7
UBLA 7.J
~in

=eradade
JO compaas

.......

AlllbAldinm
Akm
MbllDd
a..lr.olAamica
WSoadi

Dar.a
lllmaMaWI

o-.ao,-a

....

e;...!

w.

OI Allllm~
OI Akm

a.clric

lac8ll
Mad

JCf'eMq

.,...

s.n
,..

....

Cimllllt

11 Dafll.12 .........

21S22 .......

CISlllSOllll

IJ~o,.-lm
14 Gmall l!leclrk
IS<iamll ...

:HMlclola6
25 Ocdllealli.........

O..
., DlllaA/6U..
11 DimlJ

'' HAurtoll
17 llM
11 leloil
19 lmut
2IO 1-'t

'~
CM ...

ol.w.ka

06a..m ClliFlllP

-~
zs .....

27 PIOCllr. a..11

:za R,.icr
29 San
30 Time

w.rner

diferentes valores entre O 1 y 30. Si se requieren ms nmeros, continu.uno. en sentido horizontal a la


segunda fila y a~i sucesivamente. A veces un investigador comenuri en algn lugar seleccionado al az.ar
de la tabla y continuar en una direccin predetermlnada para seleccicnar nmeros.
En la primera 6Ja de dgito. de la ubla 7.1, el primer nmero es 91 y est fuera de rango, de modo
que se desecha, lo) siguientes dgitos son 56, 74 y 25, que es el primer nmero utilizable. De la tabla 7.3
vemos que 25 es el nmero asociado con Occdmtal Petroleum, por lo que Occidental Petroleum es la
primera compa.JUa seleccionada en la muestra, El siguiente nmero no utilizable es 95, segudo por 27,
que si es utilizable. A Procter & Gamble le corresponde el nmero 27, por lo que esta comparua se seleeeiona, Continuando con el proceso. pasarnos los nmero) 95 y 83. El siguiente nmero utilizable es
01, que es el valor para Alaska Airln~ despussiguen el 24, 04 y 02, ambo. utilizables. ~los nmero'
estn asociados con Bank of Arnerica y Alcoa, respectivamente. Si se contina a lo largo de la primera
fila. el siguiente nmero utilizable es 29, que est asociado con Scars. Como esta seleccin C) la sext.i, la
muestra esl. completa. Lis siguientes compaAlas constituyen la muestra final.

Alaska Airlines
Alcoa
Bank of America
Occidental Petroleum
Procter & Gamble
Sears
El muestreo alea1orio simple es ms fcil de ejecutar en pobl.iciones pequea que en grandes. El
procese para numerar a lo. miembros de la poblacin y seleccionar artculos se difkulta mucha para
poblaciones grandes.

Muestreo aleatorio estratificado


Un segundo upo de muestreo aleatorio es el muestreo aleatorio estntificado, en el que la poblacin
se divide en subpoblaciones que no K tl"l$lapan y se denominan estratos. El investigador extrae en ton
ces una muestra aleatoria simple de cada una de las subpoblaciones, La razn principal para usar mUC$
treo aleatorio C)tratificado es que sirve para reducir el error muestrsl, El error muestral se presenta

226 ESTADISTICA E.-.; LOS :"EGOCIOS

cuando. al azar, la muestra no representa la poblacin. Con muestreo aleatorio C$tratificado. el potmaa:
para comparar la muestra cerca de la poblacin es mayor de lo que es con muestreo aleatorio simple por
que se toman partes del muestreo total de lo) diferentes subgru~ poblacionales. No obstante, el rmntreo aleatorio estratificado es por lo general ms CO$tOSO que d aleatorio simple porque a cada u
de la poblacin se le debe asignar un estrato antC$ que se inicie d proceso de seleccin alcatoa.
La seleccin de estratos suele basarse en la informacin dispenibe que pudo recogerse en en
o censos previo). Los beneficies de la e)tratificacin aumentan entre ms difieran. lntemamentt.
estrato debe ser relativamente homogeneo y externamente, deben contrastar entre si. La estratifi
se hace a veces usando variables demogrficas. por ejemplo sexo, clase soeioeconmica, regin
fica, religin y grupo tnico. Por ejemplo, si una eleccin para presidente de Estados Unidos timt
realiz.arla una firma de investigacin de mercado. qu importantes variables deben ser estra
El sexo de la persona que conteste podria ser la diferencia porque en las pasadas elecciones observ
diferencia en la preferencia de los votantes ~
su gnero: es decir, los hombres y mujeres \'Otarc:
modo diferente en las elecciones nacionales. u regin geogrfica tambin proporciona una im
variable en elecciones nacionales porque los votantes son influenciados por valores culturales
que difieren de una regin a otra. Los votantes en el sur votaron ca.si exclusivamente por los
tas en el pasado, pero en fechas reciente) lo hicieron por candidatos republicano) en elecciones
nales, Los votantes de los estados de las Montallas Rocosas apoyaron a candidatos presid
republicanos: en el noreste industrial, se inclinaron mi) hacia candidatos democrticos.
En mercados de radio F.\.1, la edad de los oyentes C$ determinante pua el tipo de progr
empicada por una estacin. La figura 7.1 contiene una estratificacin por edad con tres estrato&.
base en la suposicin de que la edad hace la diferencia entre la preferencia de programacin. E.su
tificacin implica que lo~ radioescuchas entre 20 y 30 al'los prefieren el mismo tipo de progr
que es diferente de la que prefieren los radioescuchas entre 30 y 40 y entre 40 y SO allos de edad.
de cada subgrupo (estrato), la homogt11tidado semeja~ ts preseme: entre cada par des
existe una diferencia, o htttrogtntidad.
El muestree aleatorio estratificado puede ser proporcionado o desproporcionado. El
aleatorio estratificado proporcional se presenta n1ando ti porwrrajtdt la muestratomada tk
trato ts proporcionalal porcentajeq11t cada estratoest dtnrrodt toda la poblaci6n. Por ejemplo.
ga que se realiza una encuesta de votantes en Boston y la muestra es estratificada por religia
catlica, protestame, y juda, entre otras. Si la poblacin de Boston es 90% catlica y si se
muestra de mil ~'Otantes. la muestra requerirla la inclusin de 900 catlico) para alca.nz.ar estra
proporcional. Cualesquier otro nmero de catlico) $erla una estratificacin desproporci
proporcin muestral de otras religiones tambin tendra que seguir porcentajes poblacionales..
ben.sl consideramos a El Paso, Texas, donde la poblacin es aproximadamente 77% de origee
no y un in~tigador rnliu. una clccci6n en \a que \a estra\icacin es por grupo ttnico, una
aleatoria estratificada proporcional deberla contener 77% de personas de origen hispano. Par
una muestra estratificada proporcional tnicamente de 160 residentes de los 600 mil rC$iden:o

FIGUIA 7.1
Muestreo aleatorio
estratificado de
radioescuchas
deFM

Esuatifiaclo por edad

Hctcrogbleo
(difemne)

entre

Hnerogmeo
[diferente}

entre

CAPfTULO 7 MUESTREO Y DISTRIBUCIOSB MllE.STlW.E) 227

Paso debera contener 123 personas de origen hispano. Sitmprtqut las proporciona 1it los estnuos de la
muestra sean diferentesa las proporcionesdt los estratos dt la poblaci6n,se presenta un muestreo alta
torio estratificado desproporcionado.

Muestreo sistemtico
El muestreo sistemtico es una tercer tcnica muestra! aleatoria. A diferencia del muestreo aleatorio o
tratificado, el muestreo sistemtico no se realiz.a para reducir el error muestral, Ms bien, el muestreo
sistemtico se emplea por su comodidad y relativa facilidad de administracin. Con el muestreo sistem'tico, cada k-nmo elementose seltionapara producir11na muestra dt tamao n de una poblaci6n dt
tamao N. El valor de k, a veces llamado ciclo muestra! se puede determinar con la siguiente frmula.
Si k no es un valor entero, debe usarse el valor de nmero entero.
DETERMJNAOON
DEL VALOR DE le
donde:
n tamailo muestra!
N tamailo poblacional
k .. lama.do de intervalo para seleccin
Como ejemplo de muestreo sistemtico, un Investigador de sistemas de informacin de administracin deseaba muestrear fabricantes en Texas y tenla suficiente apoyo financiero para muestrear mil
compaas (n). El Direaoriode Fabricantts de Texastenla en sus llitas aproximadamente 17 mil fabricanto en totJ en Texas (N) en orden alfabttico. El valor de k era 17( 17 000/1 000) y el investigador seleccion una de cada 17 compai\las del directorio para su muestra.
Empez el investigador con la primera compai\fa de la lista, o con la nmero 17. o alguna otra intermedia? Al seleccionar cada valor k~imo,debe usarse una tabla con nmero. aleatorios simples para
seleccionar un valor entre 1 y k incluso como punto inicial. El segundo elemento para la muestra es el
punto inicial ms k. En el ejemplo, k 17, de modo que el investigador recurriria a una tabla de nmeros aleatorios para determinar un punto inicial entre 1 y 17. Suponga que seleccion el nmero 5,
entonces tendra que empezar con la compaflla nmero 5, luego seleccion la nmero 22: es decir, (5
+ 17) y luego la nmero 39, y asi sucesivamente.
El muestro sistemtico tiene otras ventajas ya que est distribuido de manera uniforme en el marco. una persona informada puede fcilmente determinar si en un estudio se sigue un plan de muestreo.
l'o obstante, puede presentarse un problema con muestreo sistemtico si los datos estn sujetos a cual
quier periodicidad y el intervalo est en sincopa (que se pueden suprimir dos o mh elementos) con el
muestreo. En e-e caso, el muestreo seria no aleatorio. Por ejemplo, si una lista de ISO estudiantes universitarios o en realidad una lista fusionada de cinco grupos. con 30 estudiantes cada uno y i cada una
de las listas de los cinco grupos se orden con los nombres de los mejores estudiantes primero y los de
menor nivel al final, entonces el muestreo sistemtico de cada 30 estudiantes podra provocar la seleccin de los mejora estudiantes, los estudiantes de menor nivel o los estudiantes mediocres; esto es. la
lista original es $Ujeta a una organiz.acin cclica o peridica. La metodologa del muestreo sisttmtko
C$t.i basada en la suposicin de que la fuente de elementos de poblacin C$ aleatoria.

Muestreo de grupo (o rea)


El muestreo de grupo (o rea) o un cuarto tipo de muestreo aleatorio. El muestreo de grupo (o &mal
comprende la divisin de la poblacin en reas o grupos que no se traslapan. So obstante, en con
traste con el muestreo aleatorio estratificado donde los estratos son homogneo>, el muestreo de grupo
identifica grupos que tienden a ser internamente heterogneos. En teora. cada grupo conuene una amplia variedad de elementos, y el grupo es una miniatura, o microco mos, de la poblacin. Ejemplos de
grupos son ciudades. compai\ias, colegios. reas de una ciudad y regiones geogrficas. A veces los gru
pos de la poblacin se presentan naturalmente y ya e>tn identificado,, por ejemplo C>tados o reas
Estadsticas Metropolitanas Estndar. Aun cuando el muestreo de rea suele referirse a grupos que son
reas de poblacin, por eemplo regiones geogrficas y ciudades, los trmino> mumrro dt gn.po mues
treo de drta se usan Indistntamente en este texto,

228

ESTADISTICA EN tos l"EGOCIOS

Dnpub de seleccionar lo. grupos, el investigador 5Clccdona al azar elementos individuales cn


muestra desde los grupos, Un ejemplo de investigacn de n(S<KO que hace uso de agrupacin
la prueba de mercado de: nuevos productos. Con frecuencia en ventas de prueba. htado. Unidos a
dividen en grupos de ciudades de prueba de mercado. y se hacen encuot.u a consumidores indiv
les demro de: las ciudades de: prucb.t de mercado. La figura 7.2 muestra algullll5 ciudades cstadou~
~ de prueba de mercado que se usan como grupo para probar productos. El artculo en
publicacin btadlstia en los negocios de hoy sobre ciudades de prueba de mercado analiu al
de las ciudades estadounidenses investigadas con m~ frecuencia,
A \TCCS los grupos son dmlasiado grandes.y se torna un segundo conjunl:O de grupos ck cada
original. ta tcnica se denomina muestreo de dos et1pas Por ejemplo, una investigadora
dividir Estados Unidos en grupos de ciudades. Ella podra ernonces dividir las ciudades en grupo&
manzanas y al aur seleccionar casa. individuales de lo grupos de manun.u. La primera etapa es
donar las ciudades de prueba y la segunda tl.tpa e seleccionar las manzanas,
El muestreo de gruposo rea\ ofrece vari~ ventaja.. Dos de las primera.' \mtaj;li son la
dad y el costo. Por lo general los grupos se obtienen con comodidad y el costo de muestrear dcsdc
da la poblacin se reduce porque el alcance del estudio K reduce a los grupo>. El costo por
sude: ser mmor en muestreo de grupo o rc:a que en muestreo e.tratificado por l.u llita> de de
mis bajas o IO$ costos Je: ubicacin mas bajo>. El tiempo y el costo de contactar elementos de la
dn se: pueden reducir, en especial si se trata de viajar, porque la agrupacin reduce la dhtan,u a
cimientos muestreados. Adems, Se puede 'implifiar 11 administracin de la encuesta muestral, A
ces d muestreo de grupo o rea es el nico mtodo factible, porque no se dispone de los rn.tf(OS
trales de los elementos individuales de la poblacin y por tanto no se pueden usar otras t&nicas
muestreo aleatcrio,
El muestreo de grupo o arca tambin tiene vari.u desvemajas, Si los elementos de un grupo loClll
mlares, el muestreo de grupo puede 5C'r estadsticamente meno. eficiente' que d muestreo ale
simple, En un caso extremo. cuando I~ elementos de un grupo son los mismos, d muestreo dndr
grupo puede no ser mejor que muestrear una rola unidad del grupo. Adrmas. los costos y prob
de anlisis estadstico son mayores con muestreo de grupo o rea que con muestreo aleatorio Wti;it

Muestreo no aleatorio
Las tttni.:as de muestreo empicadas para seleccionar elementos de la pobladn por cualquier m
mo que no comprende un proceso de seleccin aleatorUi se denominan tttniau de muestreo no
torio Como no se u~ la probabilidad para seleccionar elementos de las muestras, C'St.1> th"llicas
thTiicas de no probabilidad y no son dC>Cable para u,,;irlo. a fin de reunir datos a ser analiudos por
mtodos de c~tadisti"I inferencia) presentada en este tato. El error de muestreo no puede ser

HM'l;tQ..
Algunas ciudades
de ventas de
prueba

CAPITVLO 7 ~ll.''ESTilEO Y OISTRJBV<lO~'ES MU~l'lWLS

229

'ii''H!'Ul!Jiiif*Jl'':i.t--------------------audacia c1e prueba c1e mm:ac1o

Por varias l'UOOC$ lt acosen como prueba de merado


dda'minadas ciudades, incluymdo demogrificas. psicogr6
cu. f'arnilWidad,co!Mllimcia y otras. fl rn metrpolitana m mcuatada en Eatados Unidos es Odma-Midland,
Tau, donde los midentes recibfti m 11amadu por penona
que lo& dt cualquiera otra parte. Ockssa-Mdland es~
por Port1and. Maine, y Bouldtr-Longrnont, Colorado. resptivammtt. La tabb muestra las 10 4sns metropolitanas
m mcucmdas segun d Survq Sampling of Fairfidd,
Coruwcticut.
Las ciudades mis encuestadas no ton necesariammtt

las m rqnamtauvas en Estados Unidos. Tu1sa no es una


de las ciudades m encuestadas pero 1t cree que ts la cudad que m se acera al pafil dmlognfico nacional en thminos dt poblacin, edad. grupos Micos y valores de
v1V1mda. Le ligue Charlaton, West Virginia.
Los invcstigadorn de macado tienen difrttntcs crite
ros para seltcaonar ciudades para pruebas de mercado.
Una de las razones fund.umntalcs es la propiedad. Una
prueba de mercado se cscogt a vece porque la compailla ya
la utiliz6 en una prueba y el producto fue un xito, Otros
mercadoa son con-Uentts o cmodos parad 1nvntigador.
Citttos productos tsUn dtstimdos a segmentos demegrficos o psicogrficos de la poblacin en penicular. La seleccin de una ciudad de prueba de mercado podra estar
basada en quf ciudad tiene la proporcin o nmero m alto
de ptnonu en estos scgmenl06 objdivo. Incluso otros factores pueden entrar en la sdttcin de una dudad para

prueba de mm:ado. Existe entradl cuando dos o mis meraidos mm tan cercanos entre si que las pmonas de otros
lugares "tntnn a comprar. Existe "u.lida cuando una
prueba de mercado a influenciada por medios de comum
cadn de otro1 lupres. Ambo6 son problema que 5C.' toman
en considmicin al ldec:aonar una ciudad pera prueba de
mercado. Por ejemplo. aun cuando Baltimott CI b ciudad
nmero uno psicogrificammte, CI afectada por "entradas"
de Washington.
de moc1o que d mm:ac1o dt Baltimott
CI dificil de aislar y estudiar Sin tomar en cuenta a Wasbing
ton. Por ata razn y otras. Morlrning 1'kws clasific a Boue,
ldaho, como uno dt los mtjom lugares pera vmder productos de consumo en E.atados Unidos. Es un mic:roc:ounos
de la nacin pero ts repleto con publicidad aislada quc
pttmitt el control dd diltllo de invatipciona.

o.e..

AllEASMETROPOLITANASMS ENCUESfAIMS
Lupr Ana a.tropolltana
1

'
4

6
7
8
9
JO

Odeua Mu:lland, TX
Porthnd,Mll
Bouldn Longmont, CO
Gr-~nd Forb, ND MN

Phonux-Mn.a, 112.
Dmwr,CO
Fargo-Moorhad, ND-MN

Bo~.ID
T~.112.
Pimfield. MA

nado objetivamente para otas tcnicas de muestreo. Aqu se presentan cuatro tkruca. de muestreo no
aleatorio: muestreo de conwnicncia, muestreo de juicio, muestreo de cuota y muestreo de bola de nieve,

Muestreo de conveniencia
En el muestreo de conveniencla, los tltmttllospam In mu"" st stlcionan para comodidaddtl inwsrigador. Por lo general el inve tigador selecciona elemento de lo~ que se dispone con facili~d. cercanos o dispuestos a participar. La muestra tiende a -er menos variable que la poblacin porque en
mucho, entornos los elementos extremos de la poblacin no se encuentran fcilim.'Ilte. El invc.tigador
seleccionar mh elementos de la parte media de la poblacin. Por ejemplo, un muestreo de conveniencia en hogares para entrevistas de puerta en puerta podra incluir casa. donde I~ personas oteo en casa, ~s donde no haya perros, casas cerca de la calle. departamento) en primer piso, y cas.u con
personas amables, En contraste, una muestra aleatoria requerirla que d invatigador reuniera datos slo
de casas > departamento) que hayan sido seleccionado) al azar, sn importar qu incmodo o poco
amable $C3 la ubicacin. Si una firma de investigacin c.t. locali1.ada en una zona comercial peatonal.
una muestra de comenicncia podra ser seleccionada al entrevistar slo compradores que pasan por la
tienda y se ven amables.

Muestreo de juicio
Un muestreo de juicio se presenta cuando los tkmtntos stltcdonndos para la muesrm son mogidos por

ti 11licio del invt$tigador.A veces los imestigadorei. piensan que pueden obtener una muestra represen-

tativa al usar un juicio razonable, que resultar en ahorro de tiempo y dinero .. A veces ticos, los inves-

Potrebbero piacerti anche