Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
PARA LAS
CIENCIAS
ADMINISTRATIVAS
TERCER A EDICION
LINCOLN L. CHAO
Estadística para
las Ciencias
Administrativas
Tercera edición
LINCOLN L. CHAO
California State University
Long Beach, California
Traducción
JOSÉ MARÍA CASTAÑO
Exjefe del Departamento de Matemáticas
Universidad del Valle
Adaptación
GREGORIO A. CABALLERO SAUMETH
Matemático y estadístico, M.S.
Universidad Nacional de Colombia
Profesor, Universidad Distrital Francisco José de Caldas
Pontificia Universidad Javeriana
Revisión técnica
JESÚS MARÍA SIMBAOUEBA HERNÁNDEZ
Profesor titular de estadística
Universidad Distrital Francisco José de Caldas
McGRAW-HI LL
Santafé de Bogotá, Buenos Aires, Caracas, Guatemala, Lisboa, Madrid,
México, Nueva York, Panamá, San Juan, Santiago, Sao Paulo,
Auckland, Hamburgo, Londres, Milán, Montreal, Nueva Delhi, París,
San Francisco, San Luis, Sidney, Singapur, Tokio, Toronto.
Prohibida la reproducción total o parcial de esta obra, por cualquier medio, sin
autorización escrita del editor.
3 1 24567890 9012456783
Prólogo IX
Capítulo 1 Introducción 1
Capítulo
2
Distribuciones de frecuencias 15
Capítulo
3
Medidas deposición y de variabilidad 33
3.3
3.1
3.2
Medidas de posición
Otras medidas de posición
Medidas de variabilidad
V
3.4 Medidas que incluyen la media y la
desviación estándar 59
3.5 Otras medidas descriptivas 64
4.1 Introducción 68
4.2 Probabilidad clásica 69
4.3 Terminología de eventos y operaciones entre
conjuntos
74
4.4 Técnicas de conteo 77
4.5 Propiedades elementales de la probabilidad 83
4.6 Probabilidad condicional 88
4.7 Tres teoremas importantes 90
4.8 Independencia de eventos 94
1 1ntroducción 2
1.1
11 Componentes de una serie de tiempo 8
2
.2
11 Descomposición de una serie de tiempo 8
2
.3
11 Promedios móviles 9
3
.4
1 Números índices 1
J
1.5
11 Algunas aplicaciones importantes l
3
'Capítulo 12 .6
Las utilidades y la teoría bayesiana
2
328
VIII
Capítulo 1
I NTRODUC CIÓN
- RESEÑA HISTÓRICA
El término estadística es ampliamente escuchado y pronunciado a diario desde
diver sos sectores activos de la sociedad. Sin embargo, hay una gran diferencia
entre el sentido del término cuando se utiliza en el lenguaje corriente (generalmente
al ante ceder una citación de carácter numérico) y lo que la estadística significa
como ciencia.
Son diversos los vocablos que se citan como antecedentes del término
estadís tica. Sin pretender ser exhaustivos, pero sí buscando reseñar los de mayor
mención, podemos nombrar los siguientes:
- Status (latín), que significa situación, posición, estado.
- Statera (griego). que quiere decir balanza, ya que la estadística mide o pesa
hechos.
- Staat(alemán ), que se refiere a Estado como expresión de unidad política
superior.
La razón o razones que motivaron al hombre en un momento de su desarrollo
a tomar en cuenta datos con propósitos estadísticos, tal vez la hallemos si tenemos
en cuenta que es difícil imaginar un organismo social. sea cual fuere la época, sin la
necesidad, casi instintiva, de recoger aquellos hechos que aparecen como actos
esen ciales de la vida; y así, al situarnos en una etapa del desarrollo de la
estadística podemos pensar que se convirtió en una aritmética estatal para asistir al
gobernante que necesitaba conocer la riqueza y el número de los súbditos con
el objeto de recaudar impuestos o presupuestar la guerra. Es sabido que César
Augusto decretó que todos los súbditos tenían que tributar y por tanto exigió a
todas las personas que se presentaran al estadístico más cercano que era
entonces el recaudador de
impuestos. Guillermo el Conquistador ordenó un censo de las tierras de Inglaterra
con fines de tributación y del servicio militar. Este documento se llamó Domesday
Book.
Sin embargo, con mucha anterioridad a estos dos casos antes señalados de
recolección de datos hay evidencias del uso de la estadística a un nivel rudimentario
por organizaciones sociales antiguas. Así por ejemplo, en los monumentos
egipcios hay testimonios de que los movimientos de poblaciones eran seguidos por
medio de
1
2 Estadística para las ciencias administrativas
censos. La Biblia cita que Moisés hizo un censo de los israelitas en el desierto, como
también que David llevó un censo. En China, Confucio narra cómo un rey llamado
Yao, unos 3,000 años a. C., hizo levantar un recuento agrícola, industrial y comercial
del país.
Especial mención ameritan los estudios Renta Vitalicia, durante la época del
Imperio Romano, los cuales suponen el cálculo de la vida media a distintas edades;
y los documentos sobre los Itinerarios en los que se describen las distancias entre
las diversas localidades y el desarrolló de las vías de comunicación.
Hacia mediados del siglo XVII en Alemania comenzó a tomar fuerza una disciplina
orientada a la descripción de las cosas notables de Estado; esta disciplina gozaba de
una sistematización orgánica y respondía a principios doctrinales. Ajustada a esta
estructura, Hermann Conring 1 1 600- 1 681 l la introduce en un curso de ciencia política
con el propósito de describir y examinar los casos sobresalientes del Estado. Más
tarde Godofredo Achewald ( 1 719-1772 l entra a considerarla como disciplina indepen
diente y la introduce como una asignatura universitaria con el nombre de ESTADÍSTICA,
encargada de la descripción de las cosas del Estado.
Paralela y contemporánea con la escuela alemana, en Inglaterra se desarrolla la
escuela conocida con el nombre de los aritméticos políticos y en Francia la escuela
probabilística.
La escuela' de los "Aritméticos políticos" tuvo como propósito fijar en números
aquellos fenómenos sociales y políticos buscados por los empíricos. Tienen como
hecho meritorio sus creadores el intento de buscar leyes cuantitativas que regularan
los comportamientos sociales. Uno de sus miembros fue Graunt ( 1 620- 1 674). quien
realizó investigaciones estadísticas sobre población y por ello se le señala como el
iniciador de la tendencia conocida con el nombre de estadística investigadora, la cual
se oponía a la postura universitaria alemana que se conoce con el nombre de estadís
tica descriptiva.
La escuela probabilística, conocida también como encic/opedicotemática, basó
su desarrollo en el empleo de la matemática particularizada en el cálculo de probabi
lidades como instrumento de investigación. El cálculo de probabilidades nace con
Bias Pascal ( 1623- 1 662) y Pedro de Fermat ( 1 601- 1 665 l al tratar de dar soluciones
a problemas relacionados con juegos de azar propuestos por Antonio Gambaud,
más conocido con el título nobiliario de Caballero de Meré. A partir de Pascal fueron
muchos los matemáticos insignes que al apoyarse en la teoría de la probabilidad
formularon la teoría estadística y su aplicación práctica.
Sin pretender agotar los nombres de todos aquellos que han contribuido al
desarrollo de los métodos estadísticos, comencemos por señalar a Adolph Ouetelet
( 1 796- 1 874). quien fue el primero en aplicar métodos modernos al estudio de un
conjunto de datos. Quetelet se reconoce como el padre de la estadística moderna
por su persistencia en recalcar la importancia de aplicar métodos estadísticos. En este
punto es justo reconocer la labor desarrollada por Antonio Cournout ( 1801-18771.
tendiente a integrar las leyes de la teoría de la probabilidad al análisis estadístico;
esto le dio prestancia a la estadística al tiempo que la dotó de un rigorismo hasta
ese momento ausente en sus procedimientos.
Ahora bien, si tuviésemos que señalar un hecho que hubiera contribuido más
al desarrollo de la que pudiésemos llamar estadística moderna, tal vez la mayoría, por
no decir todos, estaríamos de acuerdo en señalar la aparición de la distribución normal.
La ecuación de la curva asociada a esta distribución fue publicada por vez primera
en 1733 por De Moivre, pero debido a su incapacidad para aplicar sus resultados a
observaciones experimentales su trabajo permaneció inédito hasta cuando Karl Pearson
Introducción 3
Unas cuantas citas acerca del mal empleo de la técnica estadística nos permitirá
comprender mejor el fondo del problema. Uno de los errores que se cometen con
mayor regularidad es hacer conclusiones basadas en datos muestrales no
representa tivos. Quizás el más sonado caso de este tipo de error fue el que
cometió el Literary Digest sobre los resultados de las elecciones presidenciales en
los Estados Unidos en 1936. El Digest envió papeletas de voto a una muestra de
votantes escogidos mediante los registros telefónicos de su propia lista de
suscriptores. Las papeletas devueltas hacían prever que Franklin D. Roosevelt
obtendría 161 votos electorales y
su contendor Alfred Landon lo aplastaría por 370 votos. La elección final arrojó
como resultado 523 votos electorales para Roosevelt y g para Landon. Roosevelt
ganó en 46 de los 48 estados, con victoria aplastante en muchos de ellos. Lo
erróneo estuvo en que la muestra no fue representativa, ya que durante el año de
la depresión de 1936 las personas que podían darse el lujo de tener teléfonos o
suscripciones de
revistas pertenecían a núcleos económicos superiores y éstos sí estaban en su mayoría
en favor de Landon, pero los votantes favorecieron a Roosevelt. Esta salida en falso
del Digest contribuyó a que dejara de existir.
Otro error que se comete es aquel en el cual las conclusiones están basadas en
datos insuficientes. Suponga que un vendedor de seguros hace llamadas de casa en
casa para vender cierta póliza de seguros. Afirma que el 25% de sus llamadas resultarán
en ventas efectivas porque hizo una venta el sábado por la tarde cuando realizó cuatro
llamadas, lo cual da la impresión de que el 25% de todas las llamadas tendrán éxito,
cosa que naturalmente no es así. Su información sería más confiable si dijera, por
ejemplo, que de 100 llamadas, 25 dieron fruto; y mejor aún, si dijera que de 1 ,000
llamadas, 250 terminaron en ventas. Así pues, cuando se utilice un porcentaje es
aconsejable tener en cuenta el total de casos u observaciones para garantizar la
fiabilidad.
Como aún no se han presentado los diversos métodos de la estadística, la
presentación y examen de los abusos de ésta quedan limitados. Finalmente diríase
que todo procedimiento estadístico puede emplearse de modo engañoso o con inter
pretaciones deficientes de los resultados. Sin embargo, no es difícil evitar tales
engaños o falsas interpretaciones; al lector se le recomienda el librito de Darrel
Huff: How to Líe with Statistics (editado por W.W. Norton & Company, lnc., en 1954)
1
si desea tener una mejor visión de los abusos de la estadística.
1. El término "estadística" que usted escucha en la calle, ¿tiene el mismo significado que cuando
se emplea como ciencia? ¿En qué difieren?
3. Señale las principales contribuciones que hicieron a la estadística los siguientes investigadores:
a/ Adolph Ouetelet el Karl Pearson
b/ Karl Friedrich Gauss f/ William S. Gosset
cJ Florence Nightingale gl Ronald A. Fisher
di Francis Galton
5. Explique por qué la estadistica inferencia! desempeña un papel de mucha importancia en las
investigaciones científicas modernas.
N. del T. Hay versión española: Cómo mentir en estadística. Editorial Sagitario, Barcelona. 1 965.
Introducción 7
1 O. Un periódico local informa que la tercera parte de las profesoras de una escuela están casadas
con sus estudiantes, ¿hay algo errado en semejante afirmación? Explique.
A = {x I x es suramericano}
A continuación reseñamos los conjuntos básicos y las operaciones elementales
entre conjuntos que se utilizan en el estudio de la probabilidad (estadística).
Conjunto universal. Es el conjunto formado por todos aquellos elementos que están
siendo considerados en un estudio particular. Es el marco de referencia del estudio
y cuando se investiga un problema, se debe tener claro cuál es dicho conjunto universal
que interviene. Así, por ejemplo, si nos proponemos estudiar la escala salarial de los
empleados del sector gubernamental. lo constituye todos y cada uno de los empleados
del mencionado sector. El conjunto universal usualmente se denota con la letra U.
Figura 1 .3 La unión de A y B.
Introducción 9
J. Enumere cada uno de Jos siguientes conjuntos por el método de extensión (enumeración).
al El que tiene por elementos las letras que forman la palabra "estadística"
bl El que tiene por elementos los dígitos que aparecen en el número 780000000000
e) El que tiene por elementos las letras que entran en la formación de la expresión
"inferencia estadística"
di El que tiene por elementos los nombres de los últimos cinco Papas
2. Escriba por el método de comprensión cada uno de los anteriores conjuntos.
4. Suponga que el conjunto U sea una muestra de 1 ,000 compradores de valores entrevistados
sobre sus costumbres para comprar. La distribución de los compradores por sexo y tipo de
valores adquiridos se indica en el cuadro:
Tipo devalores Hombres Muieres To
comprados tal
de especulación 300 500 8
de inversión 100 100 2000
Total 400 600 1,
00
Indique cada una de las ocho clases de compradores en notación de conjunto.
6. Dado el conjunto universal U = {p, q, r, 7, 9}, dé cuatro subconjuntos que sean partes de U.
7. Si C = {I, 2, 3, 4}, determine el conjunto de partes de C.
a} ¿Cuántos estudiantes hay que jamás han tomado ninguna de las tres materias?
bJ ¿Cuántos estudiantes han tomado sólo álgebra de matrices?, ¿sólo geometría analftlca?,
¿sólo matemática finita?
cJ ¿Cuántos estudiantes han tomado solamente álgebra de matrices y geometría analítica?
di ¿Cuántos estudiantes han tomado sólo álgebra de matrices y matemática finita?, ¿sólo
geometría analítica y matemática finita?
10. Sean el conjunto universal I = {l, 2, 3, 4, 5, 6}, A = {l, 2, 3}, 8 = {2, 3, 4}, C = {4, 5, 6}.
Halle:
a} Los conjuntos que tienen intersección no vacía
bJ Los conjuntos disyuntos
e} Los complementos de cada uno de ellos
12. Sean A = {0, 1 , 2, 3, 4, 5, 6, 7,8, 9}, 8 = {0, 2, 4, 6,8}, C = {3, 5, 7}, D = {3, 7}.
Halle:
a} A u 8 b} A u 8 u e el A n 8
dJ A n (8 u CI eJ A u ( 8 n f} A n 8 n C
CI
gJ A - h} A U 0 iJ 8 n 0
8'
13. Sea el conjunto universal el de los resultados posibles cuando se lanza un dado y sean A =
{x I x < 4}, 8 = {x I x < 5}, C = {x I x es par} y D = {x I x es Impar}. Describa por
extensión cada uno de los conjuntos siguientes:
aJ A n 8
bJ 8 n e cJ A n e
di (A u
eJ A n (8 u
Dl'
C)
Datos. Son números o medidas que han sido recopilados como resultados de obser
vaciones. Los datos pueden provenir de recuentos tales como el número de
personas que laboran en una empresa o de mediciones como el peso de una
persona.
Variable aleatoria. Cuando los valores que asume la variable han sido antecedidos
por una selección aleatoria de los objetos medidos o son resultados de algún
proceso al azar. A las variables aleatorias usualmente se les denota por letras X, Y,
Z; y a los valores por las respectivas minúsculas.
12 Estadística para las ciencias administrativas
Variable continua. Es aquella que teóricamente puede tomar cualquier valor dentro
de un intervalo. Por ejemplo, la estatura de las personas o el tiempo necesario para
realizar una transacción bancaria de parte del cliente.
Variable discreta. Es aquella que toma valores separados entre sí por alguna cantidad.
Por ejemplo, el número de personas que llegan en una hora a un banco a solicitar
un servicio.
Población. Es el conjunto formado por todos los valores posibles que puede asumir
la variable objeto de estudio.
Así por ejemplo, en un estudio sobre la preferencia de los votantes en una
elección presidencial, la población consiste en todas las respuestas de los votantes
registrados. Pero el término no sólo está asociado a la colección de seres humanos u
organismos vivos. Y tenemos así que, si se va a hacer una investigación de las ventas
anuales de los supermercados, entonces las ventas anuales de todos los supermerca
dos constituyen así mismo la población.
Es bueno tener en cuenta que el término población se interpreta de dos
maneras cuando se hace un estudio estadístico, a saber:
Segundo: Como el conjunto de objetos sobre los cuales actúa la variable considerada.
Por tanto, no es extraño escuchar expresiones tales como, "se hizo un estudio de los
niveles de ingreso de la población trabajadora norteamericana", entendiéndose con
ello que el elemento estadístico objeto de análisis fue el registro numérico de los
ingresos.
selección debe hacerse siguiendo ciertos procedimientos que son ampliamente trata
dos en la parte de la estadística llamada Teoría de muestreo.
El concepto de muestra tiene también las dos connotaciones que hemos señalado
para la población.
Las características de una población se resumen para su estudio generalmente
mediante lo que se denominan parámetros; éstos a su vez se toman o consideran
como valores verdaderos de la característica estudiada. Por ejemplo, la proporción
de todos los clientes que declaran cierta preferencia por una marca particular de un
producto dado, es un parámetro de la población de todos los clientes; es la
verdadera proporción de la población. Igualmente, la media aritmética de las
cuentas corrientes de los clientes de un banco determinado constituye un
parámetro de la población de las cuentas de los clientes de ese banco.
Cuando la característica de la población estudiada se reduce a una muestra el
resumen de esa característica se hace mediante una estadística (medida) o estadígra
fo. Así por ejemplo, si se toman 100 de todos los posibles clientes y se les entrevista
para ver si están a favor de una marca particular de un producto, estos 100 clientes
constituyen una muestra. Si hay 70 clientes que prefieren dicha marca entonces la
proporción muestra! será 0.70 y constituirá una estadística. De igual manera si se
escogen 1,000 cuentas del total de las cuentas corrientes; las 1,000 observaciones
conforman una muestra y el promedio aritmético de estas cuentas una estadística.
La inferencia estadística se orienta a sacar conclusiones acerca del parámetro
o parámetros poblacionales con base en el valor de una estadística obtenida a partir
de los datos muestrales extraídos de esa población. Para llegar a ese objetivo a
través de un proceso racional y eficaz, se aconse ja que se tengan en cuenta los
siguientes pasos:
Tercer paso. Recolección de datos. Esta parte, por lo general, es la que exige
más tiempo en la investigación. Esta recolección debe ajustarse a reglas estrictas
ya que de los datos esperamos extraer la información deseada.
Cuarto paso. Tabulación y descripción de los resultados. En esta etapa, los datos
muestrales se exponen de manera clara y se ilustran con representaciones tabulares
y gráficas ( diagramas, histogramas, etc.); además se calculan las medidas estadísticas
apropiadas al proceso inferencia! que haya sido escogido.