Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
TEXTO DE
ESTADSTICA I
Autores:
Ing. Mgr. Carlos Valdivieso T.
Maestra en Productividad y Calidad - UPB
Cochabamba Bolivia
Ao 2005
PRLOGO
La importancia de la Estadstica
La Estadstica, desde sus inicios ha permitido el desarrollo de diversas ciencias; es por esa
cualidad que ha sido llamada la sierva de las ciencias.
En el mundo globalizado, las empresas tienen la exigencia de ser competitivas o desaparecer.
Los temas como la planificacin estratgica y el desarrollo de ventajas competitivas son
fundamentales para afrontar este reto.
Por lo tanto el uso de la Estadstica como herramienta cobra una dimensin mayor, puesto
que tiene la potencialidad, mediante su ejercicio de lograr este objetivo.
Un poco de historia
Roberto Valdivieso Castelln, economista, a fines de la dcada del 70, realiz estudios de
postgrado en el CIENES, un centro dedicado a la enseanza de la Estadstica en Chile,
dependiente de las Naciones Unidas.
Regres a Bolivia y empez a desarrollar una metodologa para la enseanza de la
Estadstica en la UMSS, prctica, sencilla y enfocada a las distintas aplicaciones
empresariales e ingenieriles.
Durante estos ltimos 30 aos, ha dirigido grupos de enseanza en distintos mbitos
universitarios y de postgrado, obteniendo un valioso conocimiento y experiencia.
Desde 1997 sus hijos Oscar y Carlos, han continuado esta lnea, aportando nuevas ayudas
didcticas y metodologas de enseanza, que han enriquecido an ms el paquete educativo,
desde la enseanza en la UPB.
En los ltimos aos, la familia ha introducido a la metodologa de enseanza el uso de casos
reales, como fruto de su experiencia en asesora y consultora en distintos campos
empresariales, as como tambin en la tutora de prcticas de grupos estudiantiles.
Es de esta actividad continua, que nace la idea de desarrollar un texto para la enseanza de
la Estadstica.
Oportunidad para la realizacin de un texto de fcil aplicacin
La mayora de las empresas en nuestro mbito no aplican herramientas estadsticas en el
proceso de toma de decisiones. Por otro lado, existen pocos profesionales capacitados en el
rea de aplicacin de la Estadstica.
Para agravar la situacin, la formacin universitaria presenta deficiencias: conocimientos muy
bsicos, tericos y sin una metodologa adecuada de enseanza.
i
ltimas palabras
El texto que se ofrece nace como fruto de una larga experiencia en la labor docente
universitaria, ejercitada en medio de diversos ambientes estudiantiles, unas veces en
Economa, Administracin, Mercadotecnia, Sociologa y Comunicacin, otras veces en
Ingeniera Industrial, Civil, Produccin, Qumica y Biologa, y otras tantas en Derecho,
Sicologa y Pedagoga, en los cuales los autores han tenido la oportunidad de ofrecer el
conocimiento sobre la Estadstica existente en muchos libros, el elaborado por su propia
experiencia, su personalidad didctica y el valioso aporte estudiantil, con excelentes
resultados para los formados.
Esperamos que el texto de Estadstica I que presentamos pueda ser de gran ayuda a los
estudiosos que tengan inters de usar esta rama cientfica para el beneficio de su entorno
profesional.
Los autores:
Carlos, Oscar y Roberto Valdivieso.
Universidad Privada Boliviana (UPB)
Cochabamba Bolivia
Ao 2005
iv
NDICE
PRLOGO i
NDICE DEL CONTENIDO v
CAPTULO 1. CONCEPTOS EN ESTADSTICA 1
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Introduccin 1
Evolucin del Contenido 1
Nociones de Estadstica 2
Poblacin: Finita e Infinita y Muestra 2
Caractersticas de la Poblacin 2
Niveles de Medicin 4
Series Estadsticas 4
Utilidad de la Estadstica 5
Breve Resea Histrica 6
La Confiabilidad de la Estadstica 8
Control de Lectura 10
Introduccin 12
La Observacin 12
La Entrevista 14
El Cuestionario 20
El Diseo de Experimentos 26
Control de Lectura 32
Caso de Estudio 35
Introduccin 36
Formas y Tipos de Distribucin de Frecuencias 36
Distribucin de Frecuencias de Atributos 37
Distribucin de Frecuencias de Variables 49
Aplicaciones a los Negocios y el Control de Calidad 62
rbol de Decisiones para Distribuciones de Frecuencias 67
Ejercicios de Clase 69
Ejercicios Propuestos 72
Ejercicios para Examen 76
Caso de Estudio 80
v
Introduccin 84
Clases de Experimentos: Determinstico y Aleatorio 84
Experimento Aleatorio 84
Probabilidad 90
Variable Aleatoria 93
Distribucin de Probabilidades 94
Ejercicios de Clase 102
Ejercicios Propuestos 104
Ejercicios para Examen 106
Introduccin 108
Media Aritmtica 108
Moda 118
Mediana 123
Media Armnica 131
Media Geomtrica 133
Seleccin del Estadgrafo de Posicin Adecuado 135
Teora de la Decisin. Aplicaciones de la Esperanza Matemtica 136
Ejercicios de Clase 150
Ejercicios Propuestos 153
Ejercicios para Examen 159
Caso de Estudio 161
Introduccin 163
Recorrido 164
Varianza 164
Desviacin Estndar 165
Propiedades de la Varianza 167
Varianza Esperada 172
Otras Medidas de Dispersin 173
Teorema de Chevyshev 177
Ejercicios de Clase 178
Ejercicios Propuestos 180
Ejercicios para Examen 182
Introduccin 184
vi
2.
3.
Introduccin 190
Asimetra 190
Curtosis 191
Relacin Emprica entre Media, Mediana y Moda 193
rbol de Decisin para Estadgrafos 194
Ejercicios de Clase 196
Ejercicios Propuestos 197
Ejercicios para Examen 198
Caso de Estudio 200
Introduccin 201
Tipos de Distribuciones de Dos Variables, Atributos o Mixtas 201
Covarianza 188
Reglas de Composicin para el Clculo de Probabilidades 193
Clculo de Probabilidades Utilizando Diagrama de rbol 200
Generalizacin de las Reglas para el Clculo de Probabilidades 204
Distribuciones Bidimensionales de Probabilidades 207
Ejercicios de Clase 212
Ejercicios Propuestos 215
Ejercicios para Examen 218
CAPTULO 10.
Introduccin 220
Regresin y Correlacin Lineal 224
Regresin y Correlacin Lineal Mltiple 227
Regresin y Correlacin No Lineal 229
Ejercicios de Clase 232
Ejercicios Propuestos 234
Ejercicios para Examen 237
Caso de Estudio 239
1.
2.
3.
Introduccin 241
Componentes de las Series Temporales 242
Determinacin de los Componentes de una Series Cronolgica 243
Ejercicios de Clase 253
Ejercicios Propuestos 254
Ejercicios para Examen 255
Caso de Estudio 256
Introduccin 257
Nmeros ndices Simples 257
Nmeros ndices Complejos Sin Ponderar 258
Nmeros ndices Complejos Ponderados 260
Cambio del Periodo Base. Renovacin y Empalme 262
Nmeros ndices de Valor: Deflacin de Nmeros ndices Temporales
264
Otros Nmeros ndices y su Interpretacin 265
Ejercicios de Clase 266
Ejercicios Propuestos 268
Ejercicios para Examen 270
BIBLIOGRAFA 271
ANEXOS 273
Anexo 1:
Anexo 2:
Anexo 3:
Anexo 4:
NDICE DE TABLAS ix
Tabla 3.3.1. Distribucin de frecuencias sobre candidatos a la presidencia 38
Tabla 3.3.2. Valor del segmento circular para candidatos a la presidencia 41
Tabla 3.3.3. Distribucin de frecuencias sobre causas de accidentes industriales 43
Tabla 3.3.4. Distribucin de frecuencias de la ocupacin en una planta de produccin 45
Tabla 3.3.5. Distribucin de frecuencias sobre las calificaciones de Estadstica 47
Tabla 3.4.1. Distribucin de frecuencias del dinero en efectivo de 5 estudiantes 49
Tabla 3.4.2. Distribucin de frecuencias del nmero de mascotas 50
Tabla 3.4.3. Distribucin de frecuencias del nmero de hermanos 52
Tabla 3.4.4. Distribucin de frecuencias del ingreso familiar mensual (cientos de Bs.) 55
Tabla 3.4.5. Densidades de frecuencia del ingreso familiar mensual 56
Tabla 3.4.6. Distribucin de frecuencias de la produccin de oro (kg/turno) 57
Tabla 3.4.7. Distribucin de frecuencias del nmero de vacas por granja 58
Tabla 3.4.8. Distribucin de frecuencias de ventas anuales (miles de $us.) 61
Tabla 3.5.1. Distribucin de frecuencias de tipos de defectos de cajas de cartn 64
Tabla 3.5.2. Distribucin de frecuencias ordenada de tipos de defectos de cajas de cartn 64
Tabla 3.5.3. Distribucin de frecuencias de ingresos (centenas de Bs.) 65
Tabla 3.5.4. Clculo del ndice de Gini 67
Tabla 4.3.1. Espacio muestral de sacar dos billetes con reposicin 86
Tabla 4.3.2. Espacio muestral de sacar dos billetes con reposicin 87
Tabla 4.5.1. Valores de la variable aleatoria: nmero de hombres recin nacidos 94
Tabla 4.6.1. Distribucin de probabilidades del sexo del recin nacido 94
Tabla 4.6.2. Distribucin de cuanta de la funcin: P(x) =
2x + 1
(x = 0, 1, 2, 3) 96
16
2x + 1
para 0 x 3 100
12
1
(2x + 1)
16
x = 0, 1, 2, 3 172
NDICE DE GRFICOS x
Grfico 3.3.1. Diagrama de barras sobre candidatos a la presidencia 39
Grfico 3.3.2. Diagrama rectangular sobre candidatos a la presidencia 40
Grfico 3.3.3. Diagrama circular de candidatos a la presidencia 42
Grfico 3.3.4. Diagrama de barras sobre causas de accidentes industriales 44
Grfico 3.3.5. Ojiva de la ocupacin en una planta de produccin 46
Grfico 3.3.6. Diagrama de barras sobre las calificaciones de Estadstica 48
Grfico 3.3.7. Ojiva sobre las calificaciones de Estadstica 48
Grfico 3.4.1. Densidad del dinero en efectivo de 5 estudiantes 50
Grfico 3.4.2. Diagrama acumulado del nmero de mascotas 51
x
1
(2x + 1) para x = 0, 1, 2, 3. 96
16
1
(2x + 1) para 0 x 3 100
12
xi
CAPTULO 1
CONCEPTOS EN ESTADSTICA
1. INTRODUCCIN
La Estadstica es usada en la mayor parte de las ciencias sociales (sicologa, ciencias de la
educacin, economa, administracin, mercadotecnia, finanzas, sociologa, etc.) y la ingeniera
(en todas sus ramas, incluyendo el control de calidad, simulacin, direccin de operaciones,
etc.). Su propsito es responder a la necesidad de un manejo prctico de sus mtodos en la
produccin cientfica y facilitar la comprensin y lectura de investigaciones realizadas. La
Estadstica segn Cortada y Carro es "una manera de pensar y tratar la problemtica de la
realidad de forma elaborada, consistente y exacta, dando criterios de decisin.
3. NOCIONES DE ESTADSTICA
a) Concepto
1
5. CARACTERSTICAS DE LA POBLACIN
Son rasgos distintivos de los elementos de una poblacin. Pueden ser de carcter cualitativo o
cuantitativo, de ah la distincin en: variable o atributo.
a) Atributos. Son rasgos cualitativos de los elementos de una poblacin. Pueden ser:
Ordinales. Referente al sentido de jerarqua u organizacin de elementos. Ejemplo:
grados militares, cargos en una empresa, etc.
Nominales. Rasgos sin capacidad de ordenacin. Ejemplo: color de ojos, gusto, etc.
2
A las diferentes clasificaciones que pueden adoptar los atributos se les llaman modalidades o
categoras. Los atributos se designan con las primeras letras maysculas del abecedario (A, B,
C, etc.); a sus modalidades con las minsculas (a, b, c, etc.).
b) Variables. Son rasgos, caractersticas o propiedades cuantificables. Ejemplo: peso, edad,
altura, etc. Las variables pueden ser:
Discretas. Si entre dos valores consecutivos no puede introducirse otro. Ejemplo: el
nmero de mesas, sillas, casas, etc.
Continuas. Si entre dos valores consecutivos pueden introducirse infinitos valores.
Ejemplo: altura, peso, etc.
Las variables se designan con las ltimas letras maysculas del abecedario (X, Y, Z, etc.) y sus
valores con las minsculas (x, y, z, etc.).
Un resumen de la clasificacin de las caractersticas de la poblacin se muestra en la figura
1.5.1:
Figura 1.5.1. Clasificacin de las caractersticas de la poblacin
Discreta
Variables
(Valores)
Continua
Caractersticas
de la poblacin
Nominal
Atributos
(Modalidades)
Ordinal
6. NIVELES DE MEDICIN
Las distintas caractersticas de la poblacin a investigar, deben ser medidas adecuadamente,
atendiendo a los siguientes niveles de medicin.
a) Nivel Nominal
Es el nivel ms primitivo, bajo y limitado de medicin. Hace referencia a los datos que solo
pueden clasificarse en categoras, sin intervencin de mediciones o escalas, solo mediante
conteos. Para este nivel no existe orden particular para los grupos. Las categoras o
modalidades se consideran mutuamente excluyentes y exhaustivas. Es el nivel de medicin para
atributos nominales.
b) Nivel ordinal
Tiene las caractersticas del nivel anterior, pero difiere en que las categoras pueden ordenarse
en una relacin mayor que. Es el nivel de medicin para atributos ordinales.
c) Nivel de intervalo
Incluye todas las caractersticas de la escala ordinal, pero adems la distancia entre valores es
de tamao conocido y constante. Es el nivel de medicin para variables discretas o continuas.
Ejemplo: Medicin de temperatura en la escala centgrada. En esta escala el punto cero es
arbitrario: 0 C; no significa que haya ausencia de temperatura, sino solo un estado de fro. Si se
registraron las siguientes temperaturas: 30 C y 60 C, puede decirse que en la segunda
oportunidad hubo una temperatura 30 C ms clida, pero no se puede afirmar que hizo dos
veces ms calor.
d) Nivel de razn (o cociente)
Es el nivel de medicin ms alto y sirve para variables discretas y continuas. Las principales
diferencias entre el anterior nivel y ste son:
1. Los datos de nivel de razn tienen un punto cero significativo.
2. La razn o cociente de dos nmeros es significativa.
Ejemplo: El dinero. Tener cero pesos tiene un significado: no tengo nada de dinero. Si una
persona gana 1000 $us y otra 4000 $us, la segunda gana 4 veces ms que la primera.
7. SERIES ESTADSTICAS
Son una coleccin de datos numricos resultantes de una serie de observaciones, clasificados y
ordenados con un determinado criterio, que no siempre considera el tiempo. Consideramos las
siguientes series estadsticas.
Series
Estadsticas
Cualitativas
De Frecuencias
Atemporales
Cuantitativas
Espaciales
8. UTILIDAD DE LA ESTADSTICA
Es muy comn el empleo de mtodos estadsticos en todas las reas funcionales de los
negocios:
En contabilidad, para seleccionar muestras con fines de auditoria y para comprender los
determinantes del costo.
En finanzas, para elegir entre carteras alternativas de inversin y detectar tendencias en las
5
El astrnomo confecciona tablas numricas para determinar la posicin actual y futura de los
astros.
La semejanza entre los resultados observados y esperados en una experiencia gentica, se
determina estadsticamente.
El ingeniero Industrial, que no puede analizar cada ampolleta o fsforo fabricados, sin incurrir
en la destruccin del producto, controla su calidad mediante muestras tomadas al azar.
Los investigadores, determinan la significacin de ensayos agrcolas mediante
procedimientos estadsticos.
El bilogo aplica las leyes de Mendel, que son esencialmente estadsticas.
El gelogo usa mtodos estadsticos para determinar las edades de las rocas, o predecir las
reservas de petrleo y otros minerales.
El ingeniero civil determina la longevidad promedio de una construccin.
El ingeniero de sistemas determina la variabilidad del tiempo de procesamiento de unidades
computacionales.
A pesar de tratarse de campos y fines tan variados, gran parte de los mtodos utilizados son
bsicamente similares.
Inicios
Hay evidencias del uso de la Estadstica en organizaciones sociales antiguas. Por ejemplo, en
los monumentos egipcios hay testimonios de que las migraciones poblacionales eran seguidas
por medio de censos. La Biblia cita que Moiss hizo un censo de los israelitas en el desierto,
cuando se dirigan a la tierra prometida, despus de ser liberados por Dios de la esclavitud
egipcia (Nmeros 1:1-3; Nmeros 26:1-4). Tambin David realiz un censo (2 Samuel 24:1-2; 1
Crnicas 21:1-2), al igual que Esdras y Nehemas. En China, Confucio narra como un rey
llamado Yao, unos 3000 aos a.C. hizo levantar un recuento agrcola, industrial y comercial del
pas.
Especial mencin tienen los estudios Renta Vitalicia en el imperio romano, los cuales suponen
clculos de vida media a distintas edades; y los documentos sobre los Itinerarios, que describen
las distancias entre localidades y el desarrollo de vas de comunicacin. En los das del
nacimiento de Jesucristo, Augusto Csar (27 a.C. 14 d.C.) promulg un edicto de
empadronamiento, y debido al cual Jos y Mara subieron de Galilea a Judea, a la aldea de
Beln.
En la edad media se encuentran estadsticas ms sistematizadas. El clero se dedic a la
recopilacin, ordenacin y estudio de datos. Guillermo el Conquistador encarg la confeccin de
un registro de la propiedad inglesa para el cobro de impuestos, denominado irnicamente
Doomesday Book (Libro del juicio final), porque de l no se escapaba nadie.
Primera mencin
A mediados del siglo XVII en Alemania, se formaliz una disciplina para describir hechos
notables de estado. Ajustada a una estructura, Hermann Conrig (1600-1681) la introdujo en un
curso de ciencia poltica. Ms tarde Godofredo Achenwall (1719-1772) la consider como
disciplina independiente y la introdujo como una asignatura universitaria con el nombre de
ESTADSTICA.
Paralela y contempornea con la escuela alemana, en Inglaterra se desarroll la escuela de los
aritmticos polticos y en Francia la escuela probabilstica. Un miembro de los aritmticos
polticos fue Graunt (1620-1674) quien realiz investigaciones sobre poblaciones, surgiendo la
estadstica investigadora, la cual se opona a la corriente alemana, llamada estadstica
descriptiva.
La escuela probabilstica, nace con Blas Pascal (1623-1662) y Pedro de Fermat (1601-1665)
para resolver problemas en los juegos de azar propuestos por Antonio Gambaud, conocido
como el Caballero de Mer.
Estadstica moderna
Sealemos a Adolph Quetelet (1796-1874), quien fue el primero en aplicar mtodos modernos al
estudio de un conjunto de datos, y es considerado el padre de la Estadstica Moderna. Antonio
Cournout (1801-1877) integr las leyes de la teora de la probabilidad al anlisis estadstico.
La aparicin de la distribucin normal es un hecho muy importante en la Estadstica moderna. La
ecuacin de la curva de esta distribucin fue publicada por primera vez en 1733 por De Moivre,
pero debido a su incapacidad para aplicar sus resultados a observaciones experimentales su
trabajo permaneci indito hasta cuando Karl Pearson lo encontr en una biblioteca en 1924.
7
Sin embargo, Laplace (1749-1827) y Gauss (1777-1855) obtuvieron cada uno por su lado el
mismo resultado que haba obtenido De Moivre.
Florence Nightingale (1820-1910) y Francis Galton (1822-1911) aportaron con el desarrollo del
mtodo de regresin y correlacin.
Karl Pearson (1857-1936) fund el peridico Biomtrica, que influy profundamente en el
desarrollo de la Estadstica. Su obra cumbre fue la creacin de la distribucin Chi-Cuadrada.
Debido a que Pearson se ocup de muestras grandes, la teora no se ajustaba a muestras
pequeas. William Gosset (1876-1937), quien escriba con el seudnimo de Student dedujo la
distribucin t, solucionando el problema para el estudio de muestras pequeas.
Ronald Fisher (1890-1962) formul aplicaciones de la estadstica para la agricultura, biologa y
gentica. A l se debe el hallazgo de la distribucin F.
J. Neyman (1894) y E.S. Pearson (1895), presentaron una teora sobre la prueba de hiptesis
estadstica, entre 1936 y 1938. La teora estimul la investigacin y fueron varios los resultados
de uso prctico.
Finalmente mencionemos a Abraham Wald (1902-1950) quien present conquistas estadsticas
asociadas a la gentica, estadsticos escandinavos como Gram, Thiele, Charlier y Cramer; y
norteamericanos, entre los que sobresalen Hotelling, Wilks, Mood, etc.
escolares, alta correlacin entre la longitud del pie y la aptitud para escribir. Esto se debe a
que los escolares mayores pueden escribir mejor y tambin tienen los pies ms grandes.
CONTROL DE LECTURA
1. Cules son los pasos que sigue el proceso estadstico para estudiar los elementos de una
poblacin?
2. Qu es la Estadstica? (clasifquela en las dos divisiones importantes).
3. Qu diferencia hay entre una poblacin finita e infinita?
4. Clasifique las siguientes caractersticas de la poblacin como variables (discretas o
continuas) o atributos (nominales u ordinales). Luego clasifquelas de acuerdo a las series
estadsticas (temporales, atemporales o geogrficas). Tambin diga el nivel de medicin que
se usara en cada caso (nominal, ordinal, de intervalo o de razn).
a) Alumnos que aprobaron todas sus materias el anterior semestre en la UPB.
b) Nmero de kilmetros que una persona normal camina diariamente.
c) Grado de dificultad que los alumnos de la UPB tienen en Matemticas.
d) Preferencia en la vestimenta.
e) Calidad de grabacin de un CD.
f) Marcas de refrescos.
g) Tamao de una silla.
h) Nmero de personas matriculadas al final del perodo de inscripcin.
i) Flujo vehicular en la calle Heronas de Cochabamba.
j) Razas del mundo.
k) Grado de educacin.
l) Nmero de hijos promedio de las familias cochabambinas.
m) Consumo de agua diario.
n) Nmero de piezas producidas por una mquina industrial.
o) Peso promedio de una bolsa de cemento COBOCE.
p) Temperatura del horno de esmaltado de FABOCE.
q) Barriles por da de fuel oil producidos por una planta refinadora de petrleo.
r) Porcentaje de ausentismo en una fbrica.
5. En los siguientes incisos, haga un comentario sobre la veracidad de las oraciones. Sean
incorrectas o correctas, explique el por qu de su aseveracin.
a)
b)
c)
d)
6. Indique otra variable, adems de la temperatura, que pueda medirse con el nivel de intervalo.
7. Averige por qu William Gosset escriba usando el seudnimo de Student.
8. Un peridico local informa que la tercera parte de las profesoras de una escuela estn
casadas con sus estudiantes. Hay algo errado en semejante afirmacin? Explique.
9. Una ciudad de EUA se ufanaba de que era la nmero uno en calidad de vida de sus
habitantes, ya que entre sus ndices estadsticos se poda constatar que su tasa de
10
mortalidad era extremadamente baja. Cul puede haber sido la causa para esta falsa
interpretacin?
10. Las autoridades de un distrito dijeron que la profundidad media de un lago cercano era de
un metro, y por lo tanto, no haba peligro de que nadie pudiera morir ahogado. Es
adecuada esta interpretacin?
11. Para estudiar los patrones de gasto de las familias de un grupo de ingresos determinados,
se realiza una encuesta durante las primeras tres semanas de diciembre. Cree que se
lograr resultados confiables?
11
CAPTULO 2
TCNICAS DE RECOLECCIN DE DATOS
1. INTRODUCCIN
Hay varias razones para obtener datos. Son necesarios para:
Existen varias fuentes para la recopilacin de datos. Los recopiladores de datos son fuentes
primarias, los compiladores de datos se llaman fuentes secundarias.
1. Fuentes gubernamentales, industriales o individuales (fuente secundaria)
2. Diseo de experimentos (fuente primaria)
3. Estudio observacional (fuente primaria)
4. Entrevista (fuente primaria)
5. Cuestionario (fuente primaria)
Sin embargo, en la investigacin en ciencias sociales, existen tres mtodos principales
primarios de recoleccin de datos a partir de una muestra o poblacin: la observacin, la
entrevista y el cuestionario. Obtener datos por medio de experimentos no es muy usual en los
negocios, pero s en la ingeniera e industria. Cada uno de ellos se adapta a las exigencias de
las diferentes disciplinas, presentando ventajas y desventajas.
2. LA OBSERVACIN
2.1. Introduccin
Se ha dicho que la observacin es el procedimiento ms antiguo y moderno a la vez. Sirve a
un objeto ya formulado de investigacin, es planificada y controlada sistemticamente y
relacionada con proporciones ms generales.
Cualquier tcnica de observacin debe contar con los siguientes aspectos: precisin,
confiabilidad y validez de datos. Su control debe ser sistemtico. Una observacin no
estructurada sirve para comenzar los estudios y se requiere de una participacin natural o
espontnea, cuando se forma parte del grupo de observacin.
2.3. Modalidades
a) Segn medios utilizados:
No estructurada. Tambin llamada observacin simple o libre. Consiste en reconocer y
anotar hechos sin recurrir a la ayuda de medios tcnicos.
Estructurada o sistemtica. Apela a instrumentos para la recopilacin de datos o
hechos establecidos de antemano, para saber qu aspectos se van a estudiar (cuadros,
anotaciones, dispositivos mecnicos).
b) Por la participacin del observador:
Participante. La participacin es real, es decir el observador integra la comunidad o
grupo. Puede ser: natural o artificial.
No Participante. El observador toma contacto con la comunidad o grupo, pero
permaneciendo alejado.
c) Por el nmero de observadores:
Individual. Es la que realiza una sola persona.
Grupal. Se realiza de varias formas:
Todos observamos lo mismo para prevenir distorsiones.
Cada uno observa un aspecto diferente.
d) Por el lugar donde se lleva a cabo:
En la vida real. Las situaciones se captan a medida que se van presentando.
En laboratorio. Cuando los hechos se crean artificialmente.
d) Instrumentos mecnicos
Proveen una informacin objetiva de la realidad y adems exacta (la cmara fotogrfica,
filmadora y grabadora).
Grupo focal. Sirve para una investigacin de mercado. Se aplica para obtener respuestas
no estructuradas a travs de preguntas abiertas: un moderador conduce la discusin y
todos los participantes responden a las preguntas.
Estas herramientas se han popularizado en los ltimos aos debido al impacto de la filosofa
de administracin de la calidad total (TQM) en las empresas. TQM hace hincapi en la
importancia del trabajo en equipo y el empoderamiento (empowerment) de los empleados, en
un intento por mejorar cada producto o servicio.
3. LA ENTREVISTA
3.1. Introduccin
La entrevista, es uno de los procedimientos ms utilizados en la investigacin social y como
tcnica profesional en otras reas. La usan el psiquiatra, psicoterapeuta, psiclogo, trabajador
social, etc. Se la utiliza tambin para informar, educar, orientar y motivar.
En cualquiera de sus modalidades, la entrevista consiste en que una persona (encuestador),
solicita informacin a otra (informante o sujeto investigado), para obtener datos sobre un
problema determinado. Presupone la existencia de dos personas y la posibilidad de
14
3.2. Modalidades
Segn el propsito profesional, la entrevista puede asumir las siguientes modalidades:
a) Estructurada. Toma la forma de un interrogatorio, las preguntas se formulan siempre en el
mismo orden y con los mismos trminos. Se la realiza en base a un formulario previamente
preparado y estrictamente normalizado.
b) No estructurada. Deja una mayor libertad a la iniciativa de la persona interrogada y al
encuestador, tratndose de preguntas abiertas que son respondidas dentro de una
conversacin, teniendo como caracterstica principal la ausencia de una estandarizacin
formal. Puede adoptar tres modalidades:
Focalizada. El encuestador tiene una lista de cuestiones a investigar derivadas del
problema general que quiere estudiar. En torno a ese problema se establece una lista de
tpicos en los que se centra la entrevista.
Clnica. Es una modalidad semejante a la anterior; pero difiere de sta en el enfoque.
No se trata de analizar la experiencia que han tenido varias personas, sino de estudiar
las motivaciones y sentimientos de las mismas. La gua de entrevista tiene preguntas
relacionadas con los sentimientos y actitudes que se van a estudiar.
No dirigida. El informante tiene completa libertad para expresar sus sentimientos y
opiniones. El encuestador tiene que animar a hablar de un determinado tema y
orientarlo, teniendo significacin sus sentimientos y opiniones.
3.3. Preparacin
La entrevista requiere de ciertas medidas para ser usada como mtodo de investigacin:
a)
Por lo general, la nota o aviso anunciando la visita del encuestador es la nica medida previa
al primer contacto con el entrevistado. Tambin podra serlo la entrevista previa con los lderes
de la comunidad, cuando se la realiza.
Despus que el encuestador se presenta por primera vez, todo depende de las cualidades
personales. Es necesario que sea bien recibido en presencia de la persona que ha de ser
entrevistada. Ser el don de gentes su principal auxiliar, sin ser este el formalismo o la
amabilidad hipcrita.
Para iniciar la conversacin es aconsejable la charla amistosa sobre cualquier tema. Luego el
entrevistador deber explicar la finalidad y objeto de la encuesta, el nombre del organismo y
personas que lo patrocinan, la importancia para la comunidad y la necesidad e importancia de
la colaboracin personal del entrevistado. En este primer contacto se destacar el carcter
estrictamente confidencial y el anonimato de la informacin, si ese es el caso.
En este primer momento se debe crear un ambiente agradable para una comunicacin
positiva entre el entrevistador y el entrevistado.
b) Cmo formular las preguntas
Si se trata de una entrevista no estructurada, las preguntas sern planteadas dentro del
contexto general de una conversacin.
En una entrevista estructurada, la formulacin de las preguntas tendr un carcter ms
metdico, pero en ambos casos, deben ser formuladas de modo que cada una tenga
exactamente el mismo valor psicolgico para los interlocutores.
Pueden hacerse las siguientes recomendaciones para el modo de formular las preguntas:
Usar el cuestionario de manera informal. El encuestador no debe dar la impresin que la
entrevista es un interrogatorio o examen. Para esto, en sus palabras y gestos no debe
existir todo aquello que implique crtica, sorpresa, aprobacin o desaprobacin, tanto en las
preguntas formuladas como en las contestaciones del entrevistado.
Cada pregunta debe ser leda por el encuestador antes de formulada, en tono de voz
natural y de conversacin, evitando el tono de lectura o de interrogatorio. Por otra parte, la
mayor atencin estar centrada sobre el interrogado y no sobre el cuestionario.
Las preguntas deben ser formuladas exactamente como estn redactadas en el
cuestionario a todas las personas para evitar la influencia de las opiniones personales del
encuestador y la variacin de significaciones debido al cambio de palabras o giros (esta
recomendacin no vale para la entrevista no estructurada).
Las preguntas deben ser formuladas en el mismo orden del formulario para evitar el
contagio o contaminacin que puede producirse entre ellas.
Si el entrevistado responde a una respuesta que puede aplicarse ms adelante a otras
preguntas, el encuestador debe volver a formular la pregunta en su oportunidad,
16
y esenciales.
Para una entrevista estructurada, son tiles las siguientes recomendaciones:
Disponer la cdula sobre una mesa o superficie lisa que permita hacer las anotaciones sin
dificultad.
Situar en una misma lnea visual a la cdula y al entrevistado, con el objeto de poder mirar
a una y a otro sin hacer grandes movimientos, centrando la atencin en el informante.
Comenzar a anotar apenas el entrevistado empieza a contestar o usar un punto de
exclamacin (!) cuando el tono de la respuesta as lo pide.
Anotar algunos gestos y actitudes del entrevistado que posean alguna significacin til
(encogimiento de hombros, entrecejo fruncido, etc.).
Utilizar las mismas palabras del entrevistado y evitar resumir o parafrasear las respuestas.
Incluir todo lo que atae al objetivo de la pregunta y anotar en sntesis las digresiones,
aunque stas no se refieran directamente al asunto.
e) Conclusin de la entrevista
El interrogatorio debe terminar en un clima de cordialidad. Cuando la ndole de la investigacin
requiere posteriores entrevistas, debe dejarse la puerta abierta para los prximos
encuentros. Por otro lado conviene terminar la entrevista cuando el interrogado mantiene
deseos de seguir hablando sobre el asunto, con lo cual queda establecido un eslabn para la
prxima ocasin: Bueno se ha hecho un poco tarde...; Qu le parece si seguimos
hablando de esto la semana que viene...?.
entrevistado. Sobre esto hablamos anteriormente y todo lo dicho tiene valor con respecto a
la entrevista. En la prctica, resulta imposible una imparcialidad por parte del encuestador.
Con todo, resulta obvio que el encuestador debe hacer todo lo que est de su parte para
que sus ideas, opiniones o preferencias, no se transmitan o proyecten en la entrevista.
Finalmente cabe reconocer que, aparte de las limitaciones imputables a las personas que
intervienen en la entrevista, sta exige mayor cantidad de tiempo y por lo tanto, representa
mayores costos. Este inconveniente, por ser inherente a la propia tcnica, resulta insalvable.
A ello cabe agregar otros costos como los gastos de movilidad, viticos, etc.
4. EL CUESTIONARIO
4.1. Introduccin
En la entrevista, las respuestas son formuladas verbalmente y se necesita del entrevistador;
en cambio en el cuestionario, las respuestas son formuladas por escrito y no se requiere la
presencia del entrevistador.
4.2. Modalidades
La modalidad ms comn del cuestionario consiste en enviarlo por correo, de ah que se ha
propuesto llamar a esta tcnica encuesta postal. Otra modalidad tambin es la de los censos
que consisten en ir casa por casa preguntando a consumidores especficos.
q Comercial
q Industrial
Especificar
si
es
pblica
privada:
...............
2. Cargo que ocupa en la empresa:
q Dueo o Socio
q Gerente
q Jefe
q Supervisor
q Empleado
3. Edad:
q 20-25
q 26-30
q 31-35
q 36-40
q 41-45
q 46-50
q 51-55
q Ms
q 2001-2500
q Ms
4. Sexo:
q Masculino
q Femenino
q 501 - 1000
q 1001 - 1500
6. Profesin: ....................................................
q 1501 - 2000
Preferencias
7. Alguna vez ha comprado un terno?
q Si
q No
q No lo necesito
23
q Me regalan
q Me presto
q Otro: ...................................................................
q Uno por ao
q Ocasionalmente
q Para matrimonios
q Para bautizos
q Para cumpleaos
q Otros: ............................
q No
q Da del Padre
q Matrimonio
q Bautizo
q Otro: ............................................
q Calcetines
q Ropa interior
q Corbatas
q Reloj
q Billetera
q Cinturn
q Pretinas
q Zapatos
q Ropa casual
q Otros: ....................................
q No
q No tengo presupuesto
q Otro: .................................................
q Crdito
q Otro: ..............................................
17. La vitrinas, la disposicin y el decorado de la tienda, influyeron en sus compras?
q Si
q No
q No
19. De dnde compr sus ternos, cuntos ternos posee actualmente, de qu tipo son, son a
medida, cul es la caracterstica ms importante para usted y a qu precios? Llene por
favor la siguiente matriz.
24
25
Sastrera:
............................
............................
............................
Otro:
............................
............................
............................
Importado
Julios
El Corte Ingls
Almanza
Empresa
(Solo responder
en las empresas
que compr sus
ternos)
Imagen/
reputacin
de la
empresa
(Numerar por
orden de
importancia)
N de
ternos
26
1. ........................................... ..................
2. ........................................... ..................
3. ........................................... ..................
Caracterstica
(Colocar solo cuatro letras para
cada empresa por orden de
importancia: A=Calidad de la tela,
B=Excelente acabado,
C= Comodidad, D=Elegancia,
E=Colores de tela, F=Precio,
G=Entrega rpida,
H=Servicio adecuado, I=Liviano,
J=Otra-Especificar)
A medida?
(Responder
SI o NO)
..................
..................
..................
..................
..................
..................
..................
..................
..................
..................
..................
..................
..................
..................
..................
1. .........................................
2. .........................................
3. .........................................
4. .........................................
5. .........................................
6. .........................................
1. ...........................................
2. ...........................................
3. ...........................................
1. ...........................................
2. ...........................................
3. ...........................................
1. ...........................................
2. ...........................................
3. ...........................................
Tipo de terno
(Especificar si es A=Smoking,
B=Clsico con dos botones,
C=Clsico con tres botones,
D=Cruzado,
E=Otro-Especificar)
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
.............
Precio
aprox.
($us)
5. EL DISEO DE EXPERIMENTOS
5.1. Introduccin
En un experimento se ejerce un control estricto sobre los tratamientos. Ejemplo: en un estudio
para verificar la efectividad de un detergente para ropa, el investigador determinar qu
marcas son ms efectivas para limpiar ropa manchada al lavar las prendas bajo las mismas
condiciones, en lugar de realizar una encuesta a los consumidores sobre cul marca es la
mejor segn su opinin.
5.2. Conceptos
Un experimento es una prueba o ensayo. Un experimento diseado est constituido por una
serie de pruebas en las que se inducen cambios deliberados en las variables de entrada de
un sistema, para poder visualizar e identificar las causas de los cambios que se han producido
en la respuesta de salida.
El diseo de experimentos es un conjunto de tcnicas activas que manipulan el proceso
para inducirlo a proporcionar la informacin que se requiere para mejorarlo. Son tcnicas
estadsticas y de ingeniera o empresariales que permiten lograr la mxima eficacia de los
procesos de produccin o de servicios al menor costo.
Una unidad experimental es la muestra de artculos que es necesario producir en una
condicin de operacin del proceso para obtener, a partir de ellos, una medicin o dato
representativo de lo que all ocurre.
A continuacin presentamos en la figura 2.5.1, las distintas partes de las que se compone un
sistema que puede ser sujeto al diseo de experimentos.
Figura 2.5.1. Partes de un sistema sujeto al diseo de experimentos
Factores
controlables
x1
Entradas
x2
...
xp
Salida
Proceso
z1
z2
...
y
zq
Factores
incontrolables
27
5.3. Objetivos
Los objetivos de un experimento son:
1. Determinar las variables que influyen ms en la respuesta y.
2. Determinar los valores ptimos de las variables x, para lograr que y tenga los valores
deseados.
3. Determinar los mejores valores de las variables x, para lograr que la variabilidad de y
sea la menor.
4. Determinar los valores ptimos de las variables x, de forma de minimizar los efectos de
las variables incontrolables z. Cuando se logra esto, se dice que se tiene un proceso
consistente o robusto.
28
5.4. Proceso
Los mtodos de diseo experimental tienen su aplicacin en muchas disciplinas, ya que la
experimentacin es parte del mtodo cientfico.
El proceso que sigue un experimento es cclico, y es el siguiente:
Obtener una estimacin del error experimental y utilizar el anlisis estadstico. Esta
estimacin permite determinar si las diferencias observadas en los datos son
estadsticamente significativas.
Calcular de manera ms precisa el efecto de un factor, usando la media aritmtica de la
muestra como estimador del efecto.
2. Aleatorizacin
Es la piedra angular para fundamentar el uso de mtodos estadsticos en el diseo de
experimentos.
La aleatorizacin es la determinacin al azar que se realiza, tanto en la asignacin del
material experimental como en el orden en que se realizarn las pruebas.
Los mtodos estadsticos requieren que los datos muestrales hayan sido obtenidos
aleatoriamente. Por otra parte, al aleatorizar el experimento se cancelan los efectos de
variables extraas que pudieran presentarse, ya que se reparte de manera homognea en
todos los tratamientos.
3. Anlisis por bloques
Es una tcnica usada para aumentar la precisin del experimento. El bloqueo es nulificar o
tomar en cuenta en forma adecuada todos los factores que puedan afectar a la variable de
respuesta.
Un bloque es una parte del material experimental que es ms homogneo que todo el
material. Se realizan las comparaciones entre las comparaciones de inters del experimento
dentro de cada bloque, minimizando as el efecto de variables extraas.
30
Factores importantes.
Intervalos en los que variarn dichos factores.
Niveles especficos para cada factor.
Control de los factores en los valores deseados.
Medicin de los valores de cada factor.
Hay que tener en mente que el anlisis estadstico no puede aseverar nada, pero proporciona
los elementos para estimar parmetros con un grado de error o probabilidad.
7. Conclusiones y recomendaciones
Los datos extrados del experimento y evaluados mediante mtodos estadsticos deben ser
analizados e interpretados correctamente, para luego realizar decisiones acertadas. Para ello
son tiles los grficos.
5.8. Ventajas
La aplicacin del diseo de experimentos en el inicio del desarrollo de productos o procesos,
tiene las siguientes ventajas:
Mejora en el rendimiento
Variabilidad ms pequea y mejor estandarizacin.
Menor tiempo de desarrollo.
Menores costos a largo plazo.
32
CONTROL DE LECTURA
1. Indique qu modalidad se usara para la observacin de los siguientes hechos:
a) 15 alumnos de la UPB observaron la manera de resolver problemas de un gerente
experimentado usando para ello una cmara filmadora y para este fin fueron a la
empresa dnde trabajaba, que se encontraba en Chile y solo pudieron tener acceso por
un da.
b) Los alumnos de la UPB, quieren observar la vida cotidiana de un alumno x, como
representativo de su clase social.
c) Un alumno de la UPB observ el nivel de estrs de sus compaeros al dar un examen,
para lo cual us una cmara filmadora.
d) 5 promotores van al estadio Flix Capriles para ver a Wilsterman jugar, con el objetivo
de fichar algunos jugadores para clubes extranjeros.
e) Se film un documental del primer len nacido en cautiverio en Cochabamba. El
acontecimiento fue televisado por varios canales de televisin locales.
f) Como vendedor de productos farmacuticos, cuando estuve en un seminario sobre
ventas, pude observar en un experimento que realiz el disertante, que generalmente
los vendedores en el rubro no toman en cuenta el factor psicolgico del comprador, sino
solamente el aspecto tcnico del producto.
2. Indique cules son las ventajas y desventajas de la observacin.
3. Un periodista prestigioso de Bolivia, realiz una entrevista al Presidente de la Repblica. Su
primera pregunta fue la siguiente: No es verdad Sr. Presidente que usted fue cmplice de
asesinato del dirigente XX? Haga un comentario sobre la forma en que este periodista
est llevando la entrevista. Indique qu normas de la entrevista viol.
4. Diga qu mtodo de recopilacin de datos usara para las siguientes circunstancias:
a) Usted quiere conocer algunos datos sobre los productos que cierta compaa del Japn
est fabricando actualmente, como ser: tamao de empaque, mejora del diseo,
caractersticas fsicas, etc., adems de una apreciacin sobre el sector industrial en la
actualidad en este tipo de rubro.
b) Usted quiere contratar a un nuevo gerente de operaciones en su empresa.
c) Usted quiere conocer el gusto y preferencia de los alumnos de la UPB por las marcas de
cigarrillos que consumen.
33
o Ms de 15 aos
o POCO
o POCO
o POCO
o NADA
o NADA
o NADA
Sexo: masculino.
Dormitorio: Cuidados intensivos.
Ao que cursa: Segundo semestre.
Temperatura: 39.5 C.
Pulso: 70 latidos por minuto.
Presin sangunea: 130/80 mg/mm(g).
Tipo de sangre: B positivo.
Alergias a medicamentos: ninguna.
Diagnstico preliminar: herida de bala en el pecho.
Duracin estimada de estancia: un mes.
35
CASO DE ESTUDIO
ENCUESTA PARA EX ALUMNOS DE LA UPB
Suponga que ha sido contratado por la UPB para realizar una encuesta entre los ex alumnos
de las generaciones de 1998 a 2004 para determinar sus logros anteriores, actividades
actuales y aspiraciones futuras. Para esto, se necesita obtener informacin en las siguientes
reas: sexo del alumno, rea de especializacin, promedio general de licenciatura, metas
educativas adicionales (maestras, doctorados, diplomados, etc.), estado actual de empleo,
salario anual actual, nmero de puestos de tiempo completo que ha ocupado desde su
graduacin, salario anual esperado en 5 aos, afiliacin a un partido poltico, estado civil, etc.
Usted, como director de investigacin institucional debe escribir una propuesta que indique
cmo planea realizar la encuesta. Incluya en ella:
1. Objetivos (qu desea conocer y por qu) generales y especficos.
2. Una explicacin de cmo y cundo realizar la encuesta (sus planes de cmo obtener la
muestra de 100 ex alumnos de la lista de 500, considerando todas las generaciones).
3. El cuestionario (una secuencia organizada de preguntas), con instrucciones para quienes
respondan, que les ayuden a llenar el cuestionario.
4. Una explicacin de cmo planea probar la validez o ambigedad del cuestionario.
5. Una explicacin del tipo de muestreo que utilizar para la encuesta.
6. Una descripcin de los aspectos que consider para llevar a cabo la encuesta: costos de
realizacin de la encuesta, personal necesario y su capacitacin, tiempo requerido, etc.
36
CAPTULO 3
DISTRIBUCIN DE FRECUENCIAS
1. INTRODUCCIN
Los datos obtenidos mediante la aplicacin de las tcnicas de recoleccin conocidas deben ser
tabulados y luego organizados siguiendo un criterio determinado a fin de presentarlos en
cuadros de distribucin de frecuencias, de acuerdo a la caracterstica de la poblacin que est
siendo investigada, con el propsito de analizar la informacin, interpretarla y con base en ella
tomar mejores decisiones.
Atributos
(cualitativos)
Distribuciones
de
Frecuencias
Tipo I
Tipo II
Tipo III
Variables
(cuantificables)
Nmero de
observaciones
Pequeo
Grande
Grande
36
Nmero de valores
diferentes
Pequeo
Pequeo
Grande
=
=
=
=
Paz Jaime
Velis Alejo
Urioste Miguel
Kuljis Ivo
B
P
G
D
=
=
=
=
Bnzer Hugo
Palenque Carlos
Galindo Eudoro
Duran Juan Carlos
B
D
P
P
B
P
D
U
K
B
D
B
B
B
D
D
B
B
D
D
B
D
K
K
B
D
K
P
V
B
D
D
U
P
B
B
B
P
V
K
B
U
P
U
B
Tabla 3.3.1
Distribucin de frecuencias sobre candidatos a la presidencia
Atributo
Ai
a1 = P
a2 = B
*a3 = K
a4 = V
a5 = Pa
a6 = D
a7 = U
a8 = G
Frecuencia
absoluta
ni
n1 = 7
n2 = 17
n3 = 5
n4 = 3
n5 = 0
n6 = 12
n7 = 6
n8 = 0
n=ni = 50
Frecuencia
relativa
hi =
ni
(100)
n
h1 = 7/50*100 = 14%
h2 = 17/50*100 = 34%
h3 = 5/50*100 = 10%
h4 = 3/50*100 = 6%
h5 = 0/50*100 = 0%
h6 = 12/50*100 = 24%
h7 = 6/50*100 = 12%
h8 = 0/50*100 = 0%
hi = 100%
Razn de
comparacin
ri =
ni
n*
r1 = 7/5 = 1.4
r2 = 17/5 = 3.4
r3 = 5/5 = 1
r4 = 3/5 = 0.6
r5 = 0/5 = 0
r6 = 12/5 = 2.4
r7 = 6/5 = 1.2
r8 = 0/5 = 0
38
Presentacin grfica
Los paquetes de computacin brindan muchos formatos de grficos. El papel del investigador es
elegir el grfico que mejor se ajuste a sus objetivos o que muestre de manera adecuada la
informacin. Las grficas bien diseadas son ms sencillas y poderosas en mostrar los datos
comparadas a las tablas de distribucin de frecuencias. Por desgracia, la naturaleza impropia e
inadecuada de muchas presentaciones grficas, ms bien ha perjudicado la comprensin y
anlisis de las mismas.
Tufte, establece cinco principios para lograr la excelencia grfica:
Una presentacin bien diseada de los datos, que proporciona sustancia, estadsticas y
diseo.
Una grfica que comunica ideas complejas con claridad, precisin y eficiencia.
Una que proporciona al observador el mayor nmero de ideas en el menor tiempo y con el
mnimo de tinta.
Una grfica que casi siempre involucra varias dimensiones.
Una que dice la verdad acerca de los datos.
La informacin contenida en la presentacin de los datos organizados, correspondientes a las
modalidades de un atributo nominal, puede ser presentada en forma grfica, generalmente
utilizando diagrama de barras, diagrama rectangular y/o diagrama circular.
Diagrama de barras
Es un diagrama formado por barras, cuyo tamao est de acuerdo al valor de la frecuencia
absoluta o relativa de cada modalidad y cuyo ancho no interesa (ver grfico 3.3.1).
Grfico 3.3.1
Diagrama de barras sobre candidatos a la presidencia
17
18
16
14
12
12
ni
10
8
4
2
0
P
Pa
Candidatos
39
0
D
Su lectura:
Barra 3:
n3 = 5; expresa:
Existen 5 personas que prefieren a Kuljis para presidente del pas.
h3 = 10; expresa: El 10% de los estudiantes consultados prefieren a Kuljis como presidente del
pas".
Barra 2:
n2 = 17; expresa: Existen 17 personas que prefieren a Bnzer para presidente del pas.
h2 = 34; expresa: El 34% de los estudiantes consultados prefieren a Bnzer como presidente
del pas".
Diagrama rectangular
En una base cualquiera, la altura del rectngulo debe ser una dimensin igual al universo. En
ese cuadriltero, las distintas modalidades se representan por segmentos rectangulares cuya
altura corresponde al valor de la frecuencia absoluta o relativa (ver grfico 3.3.2).
Grfico 3.3.2
Diagrama rectangular sobre candidatos a la presidencia
12
P
Pa
24
6
10
34
14
40
El primer rectngulo:
n1 = 7; expresa:
Existen 7 ciudadanos que prefieren a Paz como presidente boliviano.
h1 = 14; expresa: El 14% de las personas encuestadas prefieren a Paz como presidente
boliviano".
Diagrama circular
Para obtener esta representacin grfica, se procede de la siguiente manera:
Se determina el nmero de grados de la circunferencia por unidad del universo, es decir se
divide (usando datos del ejemplo anterior) 360o entre n = 50, que es igual a 7.2o para la
frecuencia absoluta; y 360o entre 100 que es igual a 3.6o para la frecuencia relativa. En
trminos ms generales, tenemos:
o
o
G C Nmero de grados del crculo 360
=
=
n
Universo
n
o
o
G C Nmero de grados del crculo 360
=
=
h
Cien porciento
100
El segmento circular correspondiente a cada modalidad, se obtiene multiplicando los grados por
unidad del universo, por la frecuencia correspondiente (no es necesario diferenciar frecuencia
absoluta de la relativa).
Ejemplo: Segmento circular para las modalidades (tabla 3.3.2):
Tabla 3.3.2
Valor del segmento circular para candidatos a la presidencia
Atributo
P
B
K
V
Pa
D
U
G
Absoluto
(7.2) * 7
(7.2) * 17
(7.2) * 5
(7.2) * 3
(7.2) * 0
(7.2) * 12
(7.2) * 6
(7.2) * 0
Relativo
(3.6) * 14
(3.6) * 34
(3.6) * 10
(3.6) * 6
(3.6) * 0
(3.6) * 24
(3.6) * 12
(3.6) * 0
Valor
50.4
122.4
36
21.6
0
86.4
43.2
0
41
Grfico 3.3.3
Diagrama circular de candidatos a la presidencia
G
0%
U
12%
P
14%
D
24%
B
34%
Pa
0%
V
6%
K
10%
O
O
D
S
S
M
S
M
M
D
D
D
D
O
S
O
O
F
S
D
S
M
D
F
D
F
S
D
O
M
D
O
S
O
O
S
Donde:
F = Fallas en las mquinas
D = Descuido del operario
M = Falta de mantenimiento de mquinas
S = Falta de material de seguridad
O = Mala operacin de mquinas
El inspector quiere saber cules son las causas ms comunes, por orden de importancia, para
42
que ocurra un accidente, con el fin de elevar un informe y recomendaciones a las empresas en
estudio.
Resolucin.
Atributo nominal: A = Causas principales de accidentes industriales.
Existen 5 modalidades o categoras.
Luego se tabulan los datos en una distribucin de frecuencias adecuada (ver tabla 3.3.3).
Tabla 3.3.3
Distribucin de frecuencias sobre causas de accidentes industriales
Atributo
*a1 = F
a2 = O
a3 = D
a4 = S
a5 = M
Frecuencia
absoluta
n1 = 3
n2 = 9
n3 = 12
n4 = 10
n5 = 6
n = 40
Frecuencia relativa
Razn de
comparacin
h1 = (3/40)100 = 7.5%
r1 = 3/3 = 1.0
h2 = (9/40)100 = 22.5% r2 = 9/3 = 3.0
h3 = (12/40)100 = 30.0% r3 = 12/3 = 4.0
h4 = (10/40)100 = 25.0% r4 = 10/3 = 3.3
h5 = (6/40)100 = 15%
r5 = 6/3 = 2.0
hi = 100%
43
14
12
12
10
10
8
ni
6
3
4
2
0
Ai
I
O
O
T
O
G
A
A
A
I
T
O
T
O
O
T
G
T
O
I
A
O
G
O
O
T
O
T
O
A
I
A
A
O
A
A
a1
a2
a3
a4
a5
=
=
=
=
=
Gerente = G
Ingeniero = I
Tcnico de produccin = T
Operario = O
Ayudante = A
Las modalidades permiten agrupar los datos en grupos o categoras, que expresan relacin de
mayor, igual o menor, pero sin expresar distancias entre los grupos.
La presentacin de los datos del atributo considerado, utilizando la escala ordinal, se la presenta
de la siguiente manera, donde existen dos nuevas columnas con respecto a la distribucin de
atributo nominal:
En la columna 5 se tiene la frecuencia absoluta acumulada, que puede ser de forma
ascendente o descendente, segn la conveniencia del investigador y se calcula acumulando
o sumando las frecuencias absolutas.
En la columna 6 se presenta la frecuencia relativa acumulada, que se calcula sumando las
frecuencias relativas.
A continuacin se muestra en la tabla 3.3.4, la distribucin de frecuencias apropiada.
Tabla 3.3.4
Distribucin de frecuencias de la ocupacin en una planta de produccin
Atributo
Ai
ai = G
a2 = I
a3 = T*
a4 = O
a5 = A
Frecuencia
absoluta
ni
n1 = 3
n2 = 5
n3 = 8
n4 = 14
n5 = 10
ni=n=40
Frecuencia
relativa
hi =
ni
* 100
n
h1 = 7.5
h2 = 12.5
h3 = 20
h4 = 35
h5 = 25
hi=h=100
Razn de
comparacin
ri =
ni
n*
r1 = 3/8 = 0.375
r2 = 5/8 = 0.625
r3 = 8/8 = 1
r4 = 14/8 = 1.75
r5 = 10/8 = 1.25
Frec. absoluta
acumulada
i*
N i* = ni
i=1
N1 = 3
N2 = 8
N3 = 16
N4 = 30
N5 = 40
Frec. relativa
acumulada
i*
H i* = hi
i=1
H1 = 7.5
H2 = 20
H3 = 40
H4 = 75
H5 = 100
Representacin grfica
La representacin grfica de este tipo de distribucin de frecuencias, de manera que contenga la
45
40
35
Ni
30
30
25
20
16
15
10
0
G
Trabajadores
Ejemplo 2
Las calificaciones de los estudiantes de Estadstica en su control de lectura fue la siguiente:
E
M
D
M
M
B
M
S
B
M
B
M
E
S
B
D
M
B
M
D
E
M
E
B
M
B
B
M
46
M
S
M
D
E
B
B
S
B
M
M
D
M
B
M
B
E
S
B
S
M
S
B
D
Donde:
E = Excelente
M = Muy bien
B = Bien
S = Suficiente
D = Deficiente
Presente los datos en una distribucin de frecuencias adecuada y realice conclusiones.
Resolucin.
Se debe clasificar y definir la caracterstica de la poblacin que se desea estudiar. Se trata de
un atributo ordinal: A = Calificaciones de los estudiantes de Estadstica.
Se realiza la clasificacin de las modalidades del atributo de mayor a menor o viceversa y el
conteo (ni), en una tabla (ver tabla 3.3.5).
Tabla 3.3.5
Distribucin de frecuencias sobre las calificaciones de Estadstica
Atributo
Ai
ai = E
a2 = M
a3 = B*
a4 = S
a5 = D
Frecuencia
absoluta
ni
n1 = 6
n2 = 18
n3 = 15
n4 = 7
n5 = 6
ni=n=52
Frecuencia
relativa
hi =
ni
* 100
n
h1 = 11.54
h2 = 34.61
h3 = 28.85
h4 = 13.46
h5 = 11.54
hi=h=100
Razn de
comparacin
ri =
Frec. absoluta
acumulada
i*
ni
*
n
r1 = 6/15 = 0.40
r2 = 18/15 = 1.20
r3 = 15/15 = 1.00
r4 = 7/15 = 0.47
r5 = 6/15 = 0.40
N i = ni
*
i=1
N1 = 6
N2 = 24
N3 = 39
N4 = 46
N5 = 52
Frec. Relativa
acumulada
i*
H i = hi
*
i=1
H1 = 11.54
H2 = 46.15
H3 = 75
H4 = 88.46
H5 = 100
47
Grfico 3.3.6
Diagrama de barras sobre las calificaciones de Estadstica
20
18
16
14
ni
12
10
8
6
4
2
0
E
Ai = Calificaciones
100
Hi
80
60
40
20
0
E
Ai = Calificaciones
4.1. Tipo I
Las distribuciones de variable son de tipo I cuando el nmero de observaciones y los valores
diferentes de la variable son pocos. La organizacin de estos datos exige disponerlos en forma
ascendente o descendente. La presentacin de los datos se registra en una columna o en una
lnea, segn necesidades de su publicacin.
Ejemplo
El dinero en efectivo que llevan consigo 5 estudiantes de la carrera de Ingeniera Industrial, es
como sigue. Organice y presente los datos.
5
20
37
10
Resolucin
Se trata de una variable continua. X = Cantidad de dinero en efectivo.
Se dispone los datos en forma ascendente o descendente.
La presentacin de los datos anteriores se efecta en forma de una columna, como lo muestra
la tabla 3.4.1.
Tabla 3.4.1
Distribucin de frecuencias del dinero en efectivo de 5 estudiantes
xi
x1 = 3
x2 = 5
x3 = 10
x4 = 20
x5 = 37
Fuente: Elaboracin propia
La distribucin tipo I de una variable se denomina tambin, distribucin de frecuencia unitaria.
Representacin grfica
Las distribuciones tipo I no tienen representacin grfica, puesto que su frecuencia absoluta es
unitaria. Sin embargo, puede ser til el diagrama que muestra la densidad de las observaciones
en un rea especfica (ver grfico 3.4.1):
Grfico 3.4.1
Densidad del dinero en efectivo de 5 estudiantes
49
10
20
15
25
30
35
40
4.2. Tipo II
La distribucin de una variable, cuando son muchas las observaciones y pocos los valores
diferentes de la variable, forman la distribucin tipo II. La organizacin de los datos requiere de
la utilizacin de una escala de mediciones de intervalos o razn.
Ejemplo 1
Mediante una encuesta aplicada a los estudiantes de Ingeniera Industrial se pudo determinar el
nmero de animales domsticos que poseen cada uno. Con la informacin dada, se pide
organizar y presentar los datos.
3
3
3
1
2
0
2
3
7
2
0
2
4
4
5
6
4
2
2
3
1
4
0
5
2
2
1
4
1
1
4
3
3
3
2
2
4
2
3
0
Resolucin
Se trata de una variable. X = Nmero de animales domsticos, que es discreta.
Los grupos o categoras estn dados por los valores diferentes de la variable. Forman 8
grupos, desde 0 hasta 7, as que cumplen los requisitos de una distribucin tipo II.
La presentacin de datos se efecta de la siguiente manera (ver tabla 3.4.2):
Tabla 3.4.2
Distribucin de frecuencias del nmero de mascotas
Variable
x1 = 0
x2 = 1
x3 = 2
x4 = 3
x5 = 4
x6 = 5
x7 = 6
x8 = 7
Frecuencia
absoluta
n1 = 4
n2 = 5
n3 = 11
n4 = 9
n5 = 7
n6 = 2
n7 = 1
n8 = 1
n = 40
Frecuencia
relativa
h1 = 10.0
h2 = 12.5
h3 = 27.5
h4 = 22.5
h5 = 17.5
h6 = 5.0
h7 = 2.5
h8 = 2.5
h = 100
Frec. absoluta
acumulada
N1 = 4
N2 = 9
N3 = 20
N4 = 29
N5 = 36
N6 = 38
N7 = 39
N8 = 40 = n
50
Frec. relativa
acumulada
H1 = 10.0
H2 = 22.5
H3 = 50.0
H4 = 72.5
H5 = 90.0
H6 = 95.0
H7 = 97.5
H8 = 100 = h
Lectura:
n3 = 11; expresa:
h5 = 17.5; expresa:
N4 = 29; expresa:
H6 = 95; expresa:
100
90
90
80
100
95
72.5
70
Hi
60
50
50
40
30
22.5
20
10
10
0
0
Xi
51
Ejemplo 2
A los estudiantes de Estadstica se les hizo la siguiente pregunta: Cuntos hermanos tienes?
Los datos recogidos son los siguientes:
2
1
1
4
4
2
4
3
6
3
2
2
7
7
1
1
7
4
1
2
5
5
2
3
4
3
5
4
3
4
3
3
2
1
6
2
1
0
4
5
0
3
2
6
5
4
4
4
3
3
2
3
Frecuencia
relativa
h1 = 3.85
h2 = 13.46
h3 = 19.23
h4 = 21.15
h5 = 21.15
h6 = 9.62
h7 = 5.77
h8 = 5.77
h = 100
Frec. absoluta
acumulada
N1 = 2
N2 = 9
N3 = 19
N4 = 30
N5 = 41
N6 = 46
N7 = 49
N8 = 52 = n
Frec. Relativa
acumulada
H1 = 3.85
H2 = 17.31
H3 = 36.54
H4 = 57.69
H5 = 78.84
H6 = 88.46
H7 = 94.23
H8 = 100 = h
52
Representacin grfica
El diagrama de barras adecuado para representar la distribucin del nmero de hermanos est
dado en el grfico 3.4.3.
Grfico 3.4.3
Diagrama de barras del nmero de hermanos
12
11
10
10
8
ni
11
4
2
0
0
Xi = Nmero de hermanos
n , sin
ax =
R x VM x Vm x
Re corrido
=
=
nx
nx
Nmero de grupos
10
6
40.2
20.5
15
2
18
3.2
4
12.5
3.1
16.5
30
36.5
3.3
32.3
20
40
25
25.5
30
13.5
7.1
2.1
20
3.2
4.3
5.5
Tabla 3.4.4
Distribucin de frecuencias del ingreso familiar mensual (cientos de Bs.)
54
Intervalo de
clase
Li-1 - Li
2-4
4' - 10
10' - 26
26' - 40.2
Frecuencia
absoluta
ni
n1 = 8
n2 = 7
n3 = 11
n4 = 6
n = 32
Frecuencia
relativa
ni
hi = * 100
n
h1 = 25
h2 = 22
h3 = 34
h4 = 19
h = 100
Frec. absoluta
acumulada
Frec. relativa
acumulada
N i* = ni
i =1
N1 = 8
N2 = 8 + 7 = 15
N3 = 15 + 11 = 26
N4 = 26 + 6 = 36
Marcas de
clase
H i* = h i
xi=
i =1
H1 = 25
H2 = 47
H3 = 81
H4 = 100
L i + L i 1
2
3
7
18
33.1
de la siguiente manera:
n i Frecuencia absoluta
=
ai
Amplitud de clase
Df n i =
Df h i =
h i Frecuencia relativa
=
ai
Amplitud de clase
Df ni =
ni
ai
Df hi =
Dfn1 = 4.0
Dfn2 = 1.2
Dfn3 = 0.7
Dfn4 = 0.4
hi
ai
Dfh1 = 12.5
Dfh2 = 3.7
Dfh3 = 2.1
Dfh4 = 1.3
Dfni
3
0
0
10
20
30
40
Xi = Ingreso familiar
Fuente: Elaboracin propia
56
Ejemplo 2
Armando Reynolds, administrador minero de una Compaa, obtuvo informacin acerca de la
produccin de oro de la seccin de trabajo n 3 para los ltimos 35 turnos de trabajo. Los
valores estn dados en kilogramos de oro extrado por turno:
356
360
311
322
369
331
281
357
380
393
219
360
300
353
377
391
402
375
371
389
364
411
427
400
430
317
390
370
379
340
386
362
383
380
368
Si Reynolds considera que de 330 a 380 Kg. por turno es un buen intervalo esperado de
produccin,
a) Cuntos turnos de la seccin produjeron menos de lo esperado?
b) Cuntos lo superaron?
c) Cuntos cumplieron con la produccin esperada?
d) Si el porcentaje de turnos que cubren al menos la produccin esperada es como mnimo 80%,
Armando se sentir satisfecho de esta seccin y no tomar medidas para elevar la
produccin. Tomar medidas o no? Justifique su respuesta.
Resolucin
Se trata de una distribucin tipo III para variable continua con intervalos variables, ya que el
problema exige ciertos intervalos especficos. Se pueden obtener solo tres intervalos para
contestar las preguntas planteadas, como se muestra en la tabla 3.4.6.
Tabla 3.4.6
Distribucin de frecuencias de la produccin de oro (kg/turno)
Intervalo de Frecuencia
absoluta
clase
219 - 330
330' - 380
380' - 430
n1 = 6
n2 = 18
n3 = 11
n = 35
Frecuencia
relativa
h1 = 17.14
h2 = 51.43
h3 = 31.43
h = 100
Frecuencia Frecuencia
absoluta
relativa
acumulada acumulada
N1 = 35
H1 = 100
N2 = 29
H2 = 82.86
N3 = 11
H3 = 31.43
57
10
22
29
15
14
13
12
9
17
17
4
15
8
6
27
3
15
4
7
18
13
11
32
16
13
30
5
18
26
21
2
21
30
Resolucin
Se trata de una distribucin tipo III, porque existen muchas observaciones y muchos valores
diferentes de la variable. Adems se trata de una variable discreta. X = Nmero de vacas por
granja.
Se determina el recorrido de la variable: Rx = VMx - Vmx = 32 - 2 = 30
Por razones de estudio se agrupan las granjas en cinco grupos, determinando as la amplitud
o intervalo de clase:
ai =
R x 30
=
=6
nx
5
Con la informacin anterior se presenta la distribucin de variable discreta tipo III (ver tabla
3.4.7).
Tabla 3.4.7
Distribucin de frecuencias del nmero de vacas por granja
Intervalo de Frecuencia
clase
absoluta
Li-1 - Li
ni
2-8
8' - 14
14' - 20
20' - 26
26' - 32
n1 = 9
n2 = 8
n3 = 10
n4 = 4
n5 = 5
n = 36
Frecuencia
relativa
hi
h1 = 25
h2 = 22
h3 = 28
h4 = 11
h5 = 14
H = 100
Frecuencia
absoluta
acumulada
Ni
N1 = 9
N2 = 9 + 8 = 17
N3 = 17 + 10 = 27
N4 = 27 + 4 = 31
N5 = 31 + 5 = 36
Frecuencia
relativa
acumulada
Hi
H1 = 25
H2 = 47
H3 = 75
H4 = 86
H5 = 100
Representacin grfica
Se utilizan histogramas como grficos de dicha distribucin, cuando la informacin utilizada
corresponde a frecuencias relativas o absolutas. Si se utiliza los valores de frecuencias
acumuladas, el grfico correspondiente es una ojiva.
Cuando la distribucin es de tipo III y con intervalos constantes, la construccin de los
rectngulos que conforman el histograma de frecuencias, no requiere de la densidad de
frecuencia, sino de aplicar el siguiente convenio: Los intervalos constantes se consideran como
una unidad. Cada intervalo constante de clase representa la base del rectngulo y la altura es la
frecuencia absoluta o relativa correspondiente a cada grupo o clase (ver grfico 3.4.5)
Grfico 3.4.5
Histograma de frecuencias del nmero de vacas por granja
12
Forma de la
distribucin
10
ni
Polgono de
frecuencias
6
4
0
2
20
14
26
No. de vacas
32
59
36
35
31
30
27
Ni
25
20
17
15
10
5
0
0
2
12
17
22
27
32
N de vacas
Ni
40
30
20
10
0
100
120
140
160
180
Li-1 - Li
60
200
220
Frecuencia
Absoluta
n1 = 6
n2 = 12 - 6 = 6
n3 = 20 - 12 = 8
n4 = 38 - 20 = 18
n5 = 48 - 38 = 10
n6 = 50 - 48 = 2
n = 50
Frecuencia
relativa
h1 = 12
h2 = 12
h3 = 16
h4 = 36
h5 = 20
h6 = 4
h = 100
Frecuencia
absoluta
acumulada
N1 = 6
N2 = 12
N3 = 20
N4 = 38
N5 = 48
N6 = 50
Frecuencia
relativa
acumulada
H1 = 12
H2 = 24
H3 = 40
H4 = 76
H5 = 96
H6 = 100
Las ventas anuales de 8 tiendas estn entre 140 a 160 mil dlares.
El 12% de las tiendas venden anualmente entre 120 a 140 mil dlares de mercadera.
38 de las 50 tiendas tienen ventas anuales de por lo menos 180 mil dlares.
El 96% de las tiendas tienen ventas que oscilan entre 100 a 200 mil dlares al ao.
61
Grfico 3.4.8
Histograma de frecuencias de ventas anuales (miles de $us.)
20
18
16
14
ni
12
10
8
6
4
2
0
100 - 120
120' - 140
140' - 160
160' - 180
180 - 200
200 - 220
62
Mediante los diagramas de Pareto se pueden detectar los problemas que tienen ms relevancia.
Por lo general, el 80% de los resultados totales se origina en el 20% de los elementos. Ejemplos
de tales minoras vitales son:
La minora de clientes que representan la mayora de las ventas.
La minora de productos, procesos, o caractersticas de la calidad causantes del grueso de
desperdicio o de los costos de reelaboracin.
La minora de rechazos que representa la mayora de quejas de la clientela.
La minora de vendedores que est vinculada a la mayora de partes rechazadas.
La minora de problemas causante del grueso del retraso de un proceso.
La minora de productos que representan la mayora de ganancias obtenidas.
La minora de elementos que representan al grueso del costo de un inventario.
Ejemplo
El gerente de operaciones de una planta empacadora de cereales indic que, segn su
experiencia, casi siempre hay nueve razones que dan como resultado la produccin de cajas de
cartn no conformes al final del proceso de empaque:
R = Cartn roto
G = Cartn abultado
C = Cartn agrietado
D = Cartn sucio
H = Agujeros en el cartn
I = Peso de empaque inadecuado
P = Error de impresin
U = Etiqueta ilegible
S = Tapa superior sin sello
Los datos sin procesar que se muestran a continuacin, representan una muestra de 50 cajas
de cartn no conformes, las cuales se tomaron de la produccin de la semana pasada:
U
S
S
I
G
G
U
U
S
S
U
S
D
U
C
S
U
U
D
U
H
G
S
G
D
D
C
S
S
D
D
S
D
S
S
R
U
P
U
S
I
D
R
S
S
U
R
S
D
U
Primero se organizan los datos en una distribucin de frecuencias de atributo nominal, donde
el atributo es: A = Tipo de defecto en cajas de cartn.
63
Tabla 3.5.1
Distribucin de frecuencias de tipos de defectos de cajas de cartn
Modalidades
Ai
R
G
C
D
H
I
P
U
S
Frecuencia
absoluta
ni
3
4
2
9
1
2
1
12
16
n = 50
Frecuencia
relativa
hi
6
8
4
18
2
4
2
24
32
h = 100
Luego, se ordenan las modalidades de mayor a menor frecuencia. Una vez realizada esta
distribucin, se acumulan las frecuencias en forma descendente.
Tabla 3.5.2
Distribucin de frecuencias ordenada de tipos de defectos de cajas de cartn
Modalidades
Ai
Frecuencia
absoluta
ni
S
U
D
G
R
C
I
H
P
16
12
9
4
3
2
2
1
1
n = 50
Conclusiones: Se determina que las tapas sin sello (S), las etiquetas ilegibles (U) y los cartones
sucios (D), representan el 74% de las razones de no conformidad. Las otras 6 razones
representan el restante 26%. Por lo tanto, el ingeniero de esta planta deber tratar de minimizar
estos errores en las cajas de cartn, para obtener menor porcentaje de no conformidades.
Grfico 3.5.1
Diagrama de Pareto de los tipos de defectos de cajas de cartn
64
100
90
80
74
hi, Hi
70
60
56
50
40
88
82
100
98
96
92
32
30
32 24
18
20
10
0
S
Tipo de defecto
Fuente: Elaboracin propia
ni
9
13
12
4
2
40
xi
10.4
19.2
28.0
36.8
45.6
yi
93.6
249.6
3336.0
147.2
91.2
917.6
hyi
10.2
27.2
36.6
16.0
10.0
100.0
Hyi
10.2
37.2
74.0
90.0
100.0
hi
22.5
32.5
30.0
10.0
5.0
100
Hi
22.5
55.0
85.0
95.0
100.0
1.
2.
3.
4.
5.
6.
7.
Se calcula la marca de clase para definir un valor de la variable (por ejemplo ingresos).
Se determina el ingreso total por estratos, multiplicando la columna (2) por la (3): yi = x i * n i
Se calculan los valores porcentuales del ingreso total (hyi).
Se acumulan los valores del ingreso total (Hyi).
Se determina la frecuencia relativa (hi).
Se determina la frecuencia relativa acumulada (Hyi).
Se construye un cuadriltero (ver grfico 3.5.2). La base, o el eje x, registra los valores de las
frecuencias relativas acumuladas de la poblacin del nmero de familias (Hi).
8. La altura o el eje y, registra los valores acumulados del ingreso (Hyi). Se traza una diagonal en
el cuadriltero (diagonal principal), indicando que los ingresos estn distribuidos entre las
familias que conforman la poblacin de manera equitativa.
9. La lnea que resulta de representar los valores acumulados del ingreso de las familias,
respecto a la de los valores acumulados de la poblacin, es la curva de Lorenz.
10. La diferencia entre la diagonal principal del cuadriltero y la curva de Lorenz muestra la
forma desigual en que se distribuye el ingreso.
11. Se procede a realizar la grfica.
12. Se calcula el ndice de Gini.
Grfico 3.5.2
Curva de Lorenz para la distribucin de ingresos familiares
100
90
80
70
Hyi
60
50
40
30
20
10
0
0
10
20
30
40
50
60
70
80
90
100
Hi
Esto nos indica que no existe mucha desigualdad en la distribucin de los ingresos, y por lo
tanto no existe gran concentracin de los ingresos, es decir que estn repartidos ms o menos
equitativamente entre las familias encuestadas.
ndice de Gini
Para calcularlo se sigue el siguiente procedimiento, siguiendo el ejemplo anterior (ver tabla
3.5.4).
Tabla 3.5.4
Clculo del ndice de Gini
Li-1 - Li
6.0 14.8
14.8 23.6
23.6 32.4
32.4 41.2
41.2 50.0
Totales
Hyi
0.102
0.372
0.740
0.900
1.000
hi
0.225
0.325
0.300
0.100
0.050
100
Hi
0.22
0.55
0.85
0.95
1.00
Hyi-1 + Hyi
0.102
0.474
1.112
1.640
1.900
hi (Hyi-1 + Hyi)
0.02295
0.15405
0.33360
0.16400
0.09500
0.7696
IC = 1 h i ( H y i 1 + H y i )
i =1
IC = 1 0.7696 = 0.2304
Como el mximo valor que puede tener el ndice es de 1, el valor hallado indica que no existe
elevada concentracin de los ingresos.
67
Variable
Cuantitativa
Caracterstica de
la poblacin
Cualitativa
Atributo
Aleatorio
Tipo de
experimento?
Nominal
Tipo II
Decimales
Continua
Discreta
Constantes
Tipo de valores?
Enteros
Tipo III
Intervalos?
Variables
Muchos-Pocos
Pocos-Pocos
Tipo I
Ordinal
Existe jerarqua?
Muchos-Muchos
Determinstico
Valores? - variables?
Si
No
68
Circular
Si
Circular
Circular
Si
Si
Si
Diagrama de barras,
circular o rectangular
Si
Si
Pareto
Diagrama
acumulado
Si
Si
Densidad de
frecuencia
Si
Histograma
Si
Si
Si
Ojiva
EJERCICIOS DE CLASE
Atributo nominal
1. Realice la organizacin de datos recopilados mediante una encuesta informal al curso,
preguntando la carrera que estudian.
2. Una empresa posee un torno controlado por computadora cuyo desempeo estaba por debajo
del promedio. Segn el reporte de los operarios de la mquina, las causas para el bajo
desempeo eran las siguientes:
F = Fluctuaciones de corriente.
C = Controlador inestable.
E = Error del operador.
H = Herramienta gastada no cambiada a tiempo.
O = Otras causas menores.
Los datos recopilados son los siguientes:
F
C
O
C
O
C
F
C
H
C
H
F
E
C
E
C
O
F
E
C
F
O
E
C
E
E
C
C
E
O
C
C
C
C
E
E
E
C
C
C
C
C
C
E
F
E
C
E
Grupo 1
Moderado
Severo
Ligero
Moderado
Ligero
Moderado
Severo
Ligero
Ligero
Ninguno
Ligero
Severo
Moderado
Severo
Ligero
Moderado
Severo
Severo
Grupo 2
Ligero
Ninguno
Moderado
Ligero
Moderado
Ligero
Severo
Moderado
Moderado
Severo
Moderado
Moderado
2
0
4
5
2
1
5
1
0
0
3
6
0
3
2
1
0
5
1
0
4
3
4
0
4
0
1
6
2
3
1
2
2
4
5
3
0
1
4
2
1
0
2
3
0
0
1
0
1
1
4
2
2
4
Agrupe estos datos de forma que muestre qu tan a menudo ocurre cada uno de los valores
y dibuje un diagrama de barras.
Variable tipo III con intervalos variables
9. Realice la organizacin de datos recopilados mediante una encuesta informal a todo el curso,
preguntando cunto dinero llevan en el bolsillo.
10. Una supervisora de mantenimiento de aeronaves realiz una inspeccin a una entrega
reciente de pernos por parte de un nuevo proveedor. Para ello envi 25 de estos pernos a
un laboratorio de pruebas para determinar la fuerza necesaria para romper cada uno de los
pernos. A continuacin se presentan los resultados en miles de libras-fuerza.
147.8 137.4 125.2 141.1 145.7
119.9 133.3 142.3 138.7 125.7
142.0 130.8 129.8 141.2 134.9
125.0 128.9 142.0 118.6 133.0
151.1 125.7 126.3 140.9 138.2
a) Organice los datos en una distribucin de frecuencias adecuada para contestar las
siguientes preguntas:
b) Qu fraccin de los pernos soport al menos 120000 libras-fuerza? Qu fraccin de
los pernos soport al menos 150000 libras-fuerza?
c) Si la supervisora sabe que estos pernos, cuando se utilicen en un aeronave, se vern
sujetos a fuerzas de hasta 140000 libras-fuerza, qu fraccin de la muestra se romper
estando en uso? Qu debera recomendar la supervisora a la compaa con respecto al
70
23.6
24.4
23.9
24.2
24.8
24.1
24.7
24.1
24.7
24.7
25.0
23.9
24.4
24.9
24.1
22.9
25.1
24.5
25.0
22.8
24.7
24.6
25.7
24.8
23.1
23.8
23.3
23.6
24.5
25.3
25.2
24.3
24.0
23.4
24.6
71
EJERCICIOS PROPUESTOS
1. Supngase que despus de una encuesta sobre los sabores de los helados Dumbo se ha
establecido el siguiente orden de preferencia: granizado (G), dulce de leche (L), frutilla (F),
vainilla (V), chocolate (C), tumbo (T) y durazno (D). Entre 50 estudiantes de la UPB sobre
sabores de helado preferidos se dispone de la siguiente informacin:
D
F
G
T
L
C
G
D
D
C
G
T
V
C
G
L
C
C
F
F
C
G
F
L
G
G
V
G
T
T
T
D
G
C
L
V
T
C
G
G
G
C
L
F
F
L
L
V
C
C
Como administrador de la Heladera Dumbo, usted est muy interesado en este estudio,
puesto que con l, sabr qu sabores debe proveer a los consumidores de la UPB, pensando
en establecer una pequea heladera all.
a) Organice y presente los datos recogidos en una distribucin de frecuencias.
b) Determine el sabor ms frecuente y menos frecuente.
c) Represente grficamente. De lectura a los elementos diferentes del grfico.
2. En una empresa constructora, el departamento de obras est constituido por 40 trabajadores,
que cumplen las siguientes funciones: (I = Ingeniero, J = Jefe de obras, C = Capataz, O =
Obrero, A = Ayudante). La informacin elaborada permitir conocer la estructura de
ocupacin de dicha empresa. Usted es el gerente de personal de la empresa y est
queriendo hacer recortes de personal, pero para ello primero debe analizar la informacin:
O
J
A
J
A
O
O
C
C
C
O
A
O
C
I
O
O
O
J
A
A
I
O
A
I
O
A
O
O
A
A
J
A
J
C
O
C
C
O
A
4
5
6
6
3
5
2
2
4
4
6
2
5
3
2
3
3
3
2
4
2
4
4
5
5
5
3
6
3
6
2
5
2
5
3
4
2
3
2
2
3
3
5
2
6
5. Las lecturas de temperatura que dio una termocupla de un horno industrial en C., son:
16
25
34
43
52
61
ni
4
Ni
hi
Hi
0.15
38
63
0.80
5
Totales
100
Adems, el administrador de personal memoriz algunos datos de la tabla, cuando los
observ en la computadora de su oficina:
La amplitud de las categoras era constante y tena un valor de 10. (ai = 10).
a) Si usted fuera el administrador a cargo, podra reconstruir la tabla con los datos legibles y
la informacin memorizada? Es su nica alternativa, intntelo!
73
ni
4
4
7
5
7
Ni
hi
0.08
16
0.16
0.14
28
38
45
0.14
9. Los salarios mensuales (en cientos de bolivianos) de los 50 trabajadores de una empresa en
la que usted es el gerente tienen la siguiente distribucin de frecuencias:
19' - 25
10%
13' - 19
12%
1-5
32%
11' - 13
18%
5' - 11
28%
Porcentaje
de uso
1.4
53.4
8.5
10.2
4.8
21.7
100.0
75
ni
hi
Ni
Hi
50
ri
250
1
94
97
- 140
Totales
0.7
0.028
2. Se realiz una encuesta a un grupo de personas sobre el nmero de veces que acceden al
internet en un mes. Los resultados se muestran en la siguiente grfica:
1.8
1.33
1
0.6
0.75
0
0
10
20
30
40
50
60
ni
ai
Dfni
hi
76
Ni
Hi
ri
0.6
32
1
totales
b) Interprete cada columna con un ejemplo.
c) Qu porcentaje de personas acceden al internet a lo ms 20 veces? Cuntas personas
acceden a lo menos 10 veces?
3. Una compaa que vende computadoras realiz una encuesta sobre el tiempo en aos en
que las personas renuevan sus equipos. Los datos recopilados son los siguientes:
3
3
3
3
3
3
1
1
4
3
3
7
1
2
3
4
3
3
3
5
3
3
2
5
1
3
4
4
3
2
2
3
4
3
2
2
5
4
3
6
S
A
P
S
S
S
P
C
C
S
P
P
T
A
T
T
S
S
P
S
P
A
A
T
T
P
A
S
S
A
S
S
C
S
S
S
P
C
S
A
P
A
A
S
P
P
T
S
S
T
P
S
S
S
P
S
P
P
S
T
A
A
T
A
P = Poleras
C = Carteles
T = Toldos
A = Afiches
S = Stickers
armario con base en instrucciones numeradas. En la siguiente grfica se muestra los tiempos
que necesitaron cierto nmero de personas para ensamblar un armario.
45
42
40
40
35
35
30
26
Ni
25
20
15
12
10
5
0
Tiempo [min]
ni
hi
Ni
Hi
ri
Totales
6. Una compaa que distribuye energa elctrica est interesada en mejorar la eficiencia de uso
de este recurso en los hogares y lo contrata a usted para participar en la investigacin del
problema. Para comprender mejor el asunto, se decide investigar el consumo actual de
energa por familia. La siguiente distribucin de frecuencia representa el consumo promedio
de energa (en BTU) por hogar, durante un perodo de dos semanas, para una muestra
aleatoria de 90 hogares.
a) Reconstruya la tabla, sabiendo que la amplitud de los intervalos es constante.
b) La compaa considera que si lo ms frecuente es que en cada hogar se use como
mximo 8 BTU, el consumo de energa es aceptable, caso contrario se deber realizar
programas de concientizacin para el ahorro de este recurso. Que sugerira a la
compaa?.
Consumo de
energa
Nmero de
hogares
hi
78
Ni
Hi
2
8.89
27.78
68.89
78
8
98.89
19.2 - 21.6
Totales
90
ni
hi
10
Ni
10
12
6
17.6 -
12.5
Totales
79
Hi
ri
CASO DE ESTUDIO1
SPRINGVILLE HERALD
ANTECEDENTES
Springville representa una amplia rea suburbana de cerca de 50 millas fuera de una gran
ciudad en el oeste de Estados Unidos. En esencia, esta zona era de uso agrcola antes de la
Segunda Guerra Mundial y experiment una expansin considerable en poblacin e industria
entre los aos 1950 y 1980, con poco crecimiento a partir de 1980. El Herald, es un peridico
que en sus inicios fue administrado por una familia, se publica en forma diaria y dominical desde
1957. Su circulacin actual es de 250000 ejemplares entre semana (lunes a sbado) y 300000
ejemplares el domingo, con crecimiento moderado desde 1980. El estado financiero de la
compaa es sano, pero en la actualidad los miembros de la alta gerencia estn ms concientes
de los costos y de la necesidad de mejorar la eficiencia en las operaciones.
FASE 1
Se form un equipo de trabajo con jefes de nivel corporativo y de departamento para analizar las
acciones y esfuerzos que tienden a mejorar la calidad. Estuvieron de acuerdo en que el primer
paso era establecer una misin para el peridico que comunicara en forma concreta los
objetivos tanto a los clientes como a los empleados.
Una vez que se estableci la misin con la ayuda de clientes y empleados de todos los niveles
de la organizacin, el equipo de trabajo se dedic a analizar qu reas de operacin deban
estudiarse en busca de oportunidades de mejora. Despus de muchas discusiones y sesiones
de lluvia de ideas, el equipo decidi por consenso que un rea crtica para el mejoramiento
estaba representada por los errores que se cometieron durante el llenado de rdenes para
anuncios (que significaban una importante fuente de ingresos) desde el momento en que se
ordenaba un anuncio hasta que apareca en el peridico. Por desgracia en ciertas circunstancias
se haban cometido errores, y se haban publicado anuncios incorrectos o en el da equivocado.
Estos hechos exigan un esfuerzo inmediato para satisfacer al cliente mediante una variedad de
estrategias a veces costosas, que incluan reembolsos y nuevas inserciones de anuncios otros
das. Los miembros de equipo descubrieron que se tena los datos relacionados con la
ocurrencia de estos errores en los informes peridicos que se generaban (por rutina) en el
departamento de produccin de anuncios. La tabla SH2.1 muestra uno de esos informes, que
incluye la cantidad de ocurrencias para cada tipo de error durante el ltimo ao calendario.
Ejercicios
a) Ordene las categoras de la tabla de mayor a menor frecuencia absoluta, obteniendo las
columnas de frecuencia relativa, frecuencia absoluta acumulada y relativa.
b) Construya una representacin grfica que considere apropiada y til para visualizar los datos
de la tabla.
c) Escriba un informe a la administracin acerca de la frecuencia de los distintos tipos de error
en los anuncios, que deberan ser tratados con prioridad (El 80% acumulado de los tipos de
errores ms frecuentes).
Este caso de estudio ha sido extractado del libro: Berenson-Levine-Krehbiel. Estadstica para Administracin. Segunda Edicin,
2001. Prentice Hall, Mxico.
80
Tabla SH2.1
Tabla de los errores en la produccin, composicin, poltica y ventas de anuncios
Tipo de error
Error de copiado
Diseo
Omisiones
Pegado
Mala reproduccin
Insercin errnea
Error al determinar el precio
Espacio no ordenado
Conteo
54
7
13
11
8
30
13
7
Tipo de error
Formacin
Velox
Anuncio equivocado
Fecha equivocada
Posicin equivocada
Error en el pegado manual
Tamao equivocado
Total
Conteo
53
28
25
14
45
5
6
319
Cantidad
Miles de $
32.6
3.0
36.5
59.4
5.3
108.2
Tipo de error
13.0
Cantidad
Miles de $
Formacin
53.1
Velox
23.3
Anuncio equivocado
53.6
Fecha equivocada
35.9
Posicin equivocada
74.9
Error en el pegado
16.5
manual
Tamao equivocado
5.3
12.9
Total
533.5
Ejercicios
a)
b)
Ordene las categoras de la tabla de mayor a menor costo, obteniendo las columnas de
frecuencia relativa, frecuencia absoluta acumulada y relativa.
Construya una representacin grfica que considere apropiada y til para visualizar los
datos de la tabla.
81
c)
Frecuencia
rea
de
composicin
Polticas
Ventas
Totales
10
Cantidad
Miles de $
12.8
16
4
30
88.7
6.6
108.1
Ejercicios
a) Ordene las categoras de la tabla de mayor a menor costo y frecuencia, obteniendo las
columnas de frecuencia relativa, frecuencia absoluta acumulada y relativa para las dos
variables.
b) Construya representaciones grficas que considere apropiada y til para visualizar los datos
de la tabla.
c) Qu accin recomendara para reducir este tipo de errores en el futuro?
Nota: No siga adelante hasta terminar los ejercicios de la fase 3.
FASE 4
Una de las funciones del departamento de sistemas de cmputo del peridico incluye el informe
de las actividades del sistema de la computadora central. En general, durante un da cualquiera,
el sistema debe procesar ms de 100 tareas diferentes. Los requerimientos de estas tareas
varan, desde trabajos muy pequeos que requieren una cantidad mnima de accesos a los
dispositivos de almacenamiento de datos (cartuchos), hasta trabajos grandes y complejos que
requieren acceso a ms de 200 cartuchos diferentes de almacenamiento de datos. Los datos
que se presentan en la tabla SH2.4 incluyen un arreglo ordenado del nmero de cartuchos de
datos que deben utilizarse por 111 tareas, en un da reciente.
Ejercicios
a) Presente los datos en una distribucin de frecuencias adecuada.
82
1
4
9
20
37
100
1
5
10
20
40
111
1
5
10
20
40
126
1
5
10
20
42
127
1
5
10
21
43
131
2
5
10
22
50
137
2
5
11
23
52
140
2
5
12
24
55
144
2
6
12
28
56
147
2
6
13
28
59
164
3
6
14
29
60
166
3
7
14
30
60
170
3
7
15
30
67
182
83
3
7
17
30
74
212
4
7
18
30
80
237
4
8
18
31
86
4
8
18
32
91
4
8
18
33
94
CAPTULO 4
DISTRIBUCIN DE PROBABILIDADES
1. INTRODUCCIN
La teora de las probabilidades tuvo su origen en los problemas relacionados con los juegos
de azar (dados, barajas, etc.). Mas tarde el concepto de probabilidad, convenientemente
modificado, se ha aplicado a los seguros y a los problemas de inferencia estadstica. Estos
ltimos poseen numerosas aplicaciones en la fsica moderna, la biologa, la agricultura, la
industria, las ciencias sociales y la economa. De aqu que la teora de las probabilidades
tenga hoy gran inters prctico y terico y constituya una rama importante de la matemtica,
ingeniera y de las ciencias sociales.
3. EXPERIMENTO ALEATORIO
3.1. Caractersticas
Un experimento aleatorio, tiene las siguientes caractersticas.
Se puede repetir de manera indefinida, esto asegura que los resultados sean simtricos y
que el elemento del experimento sea homogneo.
Los resultados del experimento son numerables y registrables.
No es posible determinar el resultado exacto de un experimento aleatorio antes de que
ocurra, pero si obtener una lista de los posibles.
Por el principio de la regularidad estadstica (Ley de los grandes nmeros) es posible
estimar la probabilidad de un resultado cualquiera del experimento cuando este se haya
realizado muchas veces.
84
Por extensin
Por comprensin
Los espacios muestrales pueden ser finitos o infinitos. Es finito cuando se trata de un conjunto
numerable, como por ejemplo los resultados posibles que existen al elegir un nmero de la
lotera de entre 100000 boletos. Es infinito cuando es continuo no numerable, como por
ejemplo los resultados posibles que se pueden dar al elegir una persona de entre todas las
que hay en el mundo.
10
20
50
2a extraccin
10
10
20
50
20
10
20
50
50
10
20
50
1a
10
20
50
10
20
50
10 10
20 10
50 10
10 20
20 20
50 20
10 50
20 50
50 50
Aqu se realizan las mismas preguntas que en ejemplo anterior. Se observar que basta que
una condicin del experimento cambie, para que ste tenga otro espacio muestral.
Figura 4.3.2. Arboligrama de sacar 2 billetes sin reposicin
1a extraccin
2a extraccin
20
10
50
10
20
50
10
20
50
10
50
20
1a
10
20
50
10
20
50
X
20 10
50 - 10
10 20
X
50 - 20
10 50
20 50
X
Para configurar el diagrama, las preguntas son: Si el gerente escoge una bolsa
aleatoriamente, qu tipo de bolsa puede obtener? Luego, habiendo extrado alguna de algn
tipo, en la segunda y tercera extracciones, qu tipo de bolsas puede obtener?
Se acuerda las siglas para cada tipo de bolsa y se construye el arboligrama mostrado en la
figura 4.3.3.
B = Bolsa sin defectos
DL = Bolsa con defectos en el logotipo
DT = Bolsa con defectos en el tamao.
Figura 4.3.3. Arboligrama para tipos de bolsas extradas
B
DT
DL
B
B
DL
DT
DT
DT
DL
DL
DT
DL
B
DL
DT
B,B,B
B,B,DL
B,B,DT
B
DL
DT
B,DT,B
B,DT,DL
B,DT,DT
B
DL
DT
B,DL,B
B,DL,DL
B,DL,DT
B
DL
DT
DT,B,B
DT,B,DL
DT,B,DT
B
DL
DT
DT,DT,B
DT,DT,DL
DT,DT,DT
B
DL
DT
DT,DL,B
DT,DL,DL
DT,DL,DT
B
DL
DT
DL,B,B
DL,B,DL
DL,B,DT
B
DL
DT
B
DL
DT
DL,DT,B
DL,DT,DL
DL,DT,DT
DL,DL,B
DL,DL,DL
DL,DL,DT
89
4. PROBABILIDAD
4.1. Introduccin
La probabilidad es una medida del riesgo o de la incertidumbre. Se dice que existe riesgo
cuando se conoce el espacio muestral y la probabilidad de aparicin de los sucesos. La
situacin que indica incertidumbre, desconoce la presencia del espacio muestral, la
probabilidad de los sucesos o ambos.
Por medio de la probabilidad, podemos medir si un suceso es probable e improbable: el
resultado de una eleccin presidencial, los efectos colaterales de un nuevo medicamento, la
durabilidad de una pintura para exteriores, etc.
La probabilidad puede clasificarse en tres tipos.
P( A ) =
En la aplicacin de esta regla, los trminos favorable y xito se aplican a cualquier clase de
resultado que el investigador est interesado. As, favorable puede significar que un televisor
no funcione, ya que el inters es detectar los que estn defectuosos.
Algunas propiedades que presentan los sucesos, al hablar de sus probabilidades a priori son:
Ejemplo 1
Cul es la probabilidad de sacar un as de un paquete bien revuelto de 52 cartas?
Resolucin
Bien revuelto significa que cada carta tiene la misma probabilidad de salir, de modo que se
puede aplicar el concepto clsico de probabilidad.
Dado que hay 4 ases entre 52 cartas, la probabilidad de sacar un as sera de:
P(sacar un as) =
4
1
=
= 0.077
52 13
Existe una probabilidad de que en 13 extracciones, una sea un as, o existe una probabilidad
del 7.7% de sacar un as al elegir una carta.
Ejemplo 2
Supongamos 3 nacimientos. Cul es la probabilidad de que nazcan 2 varones?
Resolucin.
Determinar el sexo del recin nacido, es un experimento aleatorio (Suponiendo que no se
cuenta con un ecgrafo).
Los resultados del experimento cuando se observa el nacimiento uno tras otro, en la
determinacin del sexo se los determina por medio de un arboligrama (Ver figura 4.4.1):
Figura 4.4.1. Arboligrama del sexo de 3 nacimientos
P. conjunta = P. Marginal * P. condicional
1
2
1
2
P. marginal
1
2
1
2
1
2
1
2
1
2
1
2
1
2
M
1
2
1
2
M
M
1
2
P. condicional
1
2
1
2
H
M
P. condicional
1 1 1 1
P(H, H, M ) = P(H ) P(H / H ) P(M / H, H ) = =
2 2 2 8
1 1 1 3
P(E1 ) = + + =
8 8 8 8
92
P(A) =
20
*100 = 20% . Existe una probabilidad del 20% de que el taxi al que se subi sufra
100
un choque fuerte.
93
Ejemplo 2
Si los registros del Lloyd Areo Boliviano demuestran que (en los ltimos 6 meses) 468 de 600
de sus jets de Cochabamba a Santa Cruz llegaron a tiempo, cul es la probabilidad de que si
este fin de semana Ud. est yendo a Santa Cruz, llegue a la hora correcta?
Resolucin
Ya que en el pasado,
468
600
hay una probabilidad del 78% de que el avin de este fin de semana llegue a tiempo.
5. VARIABLE ALEATORIA
Es una funcin que permite transformar los diferentes resultados del espacio muestral en
puntos del conjunto de los nmeros naturales. Puede ser continua o discreta.
Ejemplo
Supngase el espacio muestral del sexo de 3 recin nacidos (Ver la figura 4.4.1).
S = S (HHH, HHM, HMH, MHH, HMM, MHM, MMH, MMM)
Corresponde a la situacin de observar 3 nacimientos uno tras otro.
Si interesa el nmero de hombres recin nacidos se puede observar la siguiente relacin entre
la variable definida y el espacio muestral.
La variable aleatoria es discreta y estara definida como: X = Nmero de hombres recin
nacidos, generando as los valores de la tabla 4.5.1.
94
Tabla 4.5.1
Valores de la variable aleatoria: nmero de hombres recin nacidos
Casos del espacio
muestral
MMM
MMH, MHM, HMM
MHH, HMH, HHM
HHH
6. DISTRIBUCIN DE PROBABILIDADES
6.1. Introduccin
Sea un experimento aleatorio que permite definir un espacio muestral, sea x la variable
aleatoria y P(x) las probabilidades respectivas. La funcin de probabilidad se obtiene cuando
determinada una variable aleatoria para el espacio muestral, se dispone de las probabilidades
correspondientes producidas en el experimento aleatorio.
En el ejemplo anterior, la distribucin de probabilidades es la que se muestra en la tabla 4.6.1.
Tabla 4.6.1
Distribucin de probabilidades del sexo del recin nacido
Variable
xi
x1 = 0
x2 = 1
x3 = 2
x4 = 3
P(xi)
1/8
3/8
3/8
1/8
P(x ) = 1
i
x =1
x = 0, 1, 2, ..., n.
Para determinar si una funcin es de cuanta debe cumplir con las condiciones anteriores.
Para evaluar la segunda condicin: La suma de la funcin de cuanta en el recorrido de la
variable debe sumar la unidad, es necesario incorporar una variable de trabajo k, tal que:
Ejemplo 1
Sea la siguiente funcin de cuanta: f ( x ) = 2x + 1
Para x = 0, 1, 2, 3.
k (1 + 3 + 5 + 7) = 1
k (16) = 1
k=
1
16
2x + 1
para x = 0, 1, 2, 3.
16
b) Se pide: P( x < 2) = P( x = 0) + P( x = 1) =
1
3
4
+
=
= 0.25
16 16 16
Respuesta: Que la variable x tome un valor menor que dos, ocurre en un 25% de los casos.
c) Se halla la funcin de distribucin y se verifica.
3
Se sabe que:
1
(2x + 1 )
i =0 16
P (x ) = P (x i ) =
i= 0
96
1
4
* (2x + 1 ) =
16
x = 0 16
P (x < 2 ) =
donde:
P(xi)
1/16
3/16
5/16
7/16
16/16
2x + 1
para x = 0, 1, 2, 3.
16
Pac(xi)
1/16
4/16
9/16
16/16
97
1
(2x + 1) para x = 0, 1, 2, 3.
16
50%
45%
40%
P(xi) [%]
35%
30%
25%
20%
15%
10%
5%
0%
0
2
xi
98
Ejemplo 2
Si la probabilidad de que cualquier elector registrado (seleccionado al azar de las listas
oficiales) vote en una eleccin determinada es de 0.70, cul es la probabilidad de que dos de
cinco electores registrados voten en la eleccin?
Se ha determinado que para resolver este problema se puede usar la siguiente funcin de
5
5!
. El
x = 0, 1, 2, 3, 4, 5 , donde: =
x x!(5 x )!
ser
hallado
por
la
siguiente
ecuacin:
Resolucin
verifica si cumple:
P(x ) = 1.
i
x =1
5
f ( x = 0) = (0.7)0 (1 0.7)5 0 = 0.0024
0
5
f ( x = 2) = (0.7) 2 (1 0.7)5 2 = 0.1323
2
5
f ( x = 1) = (0.7)1 (1 0.7)5 1 = 0.0284
1
5
f ( x = 3) = (0.7)3 (1 0.7)5 3 = 0.3087
3
5
f ( x = 4) = (0.7) 4 (1 0.7)5 4 = 0.3602
4
5
f ( x = 5) = (0.7)5 (1 0.7)5 5 = 0.1681
5
k =1
P(X)
0.0024
0.0284
0.1323
0.3087
0.3602
0.1681
1
99
Ahora si se puede calcular la probabilidad pedida, que no es otra cosa que la probabilidad
para x = 2: 0.1323
Existe una probabilidad de 13.23% de que de cinco personas elegidas al azar dos voten en la
eleccin.
La grfica de barras que corresponde a esta funcin de cuanta es observada en el grfico
4.6.2.
Grfico 4.6.2
Diagrama de barras de la binomial b(x, n = 5, p = 0.7)
0.40
0.35
0.30
P(X)
0.25
0.20
0.15
0.10
0.05
0.00
0
Numero de sucesos
f ( x ) dx = 1
f ( x ) = 2x + 1
Para 0 x 3
Entonces:
1 = k * (2x + 1 ) dx = k * ( x 2 + x ) | = 9k + 3k = 12k
k=
1
12
P(x) =
b) Se pide:
f (x < 2 ) =
1
12
2x + 1
para 0 x 3
12
(2x + 1 ) dx =
6
= 0.5
12
1
2
* (2x + 1 ) dx =
12 0
12
2
4
1
* (2x + 1 ) dx =
12
12 1
3
1
6
* (2x + 1 ) dx =
12 2
12
La distribucin de densidad resultante es mostrada en la tabla 4.6.4.
101
Tabla 4.6.4
Distribucin de densidad de la funcin: P(x) =
Li-1 - Li
0-1
1 - 2
2 - 3
2x + 1
para 0 x 3
12
f (x)
2/12
4/12
6/12
12/12=1
1
(2x + 1) para 0 x 3
12
60%
50%
P(xi) [%]
40%
30%
20%
10%
0%
0-1
1-2
2-3
Li-1 - Li
f ( x ) = x 2 6x + 10
para
102
0.25 x 1.5
f ( x ) dx = 1 .
k
1.5
0.25
( x 2 6 x + 10) dx = 1
1.5
x3
k 3x 2 + 10x
=1
3
0.25
192
1355
k=
k
=1
1355
192
Se verifica que la funcin no era de densidad, y haba que corregirla, del siguiente modo:
f (x) =
192( x 2 6 x + 10)
1355
para
0.25 x 1.5
192( x 2 6 x + 10)
192 x 3
3x 2 + 10 x
dx =
= 0.7107
a) P( x < 1) =
0.25
1355
1355 3
0.25
Existe una probabilidad de 71.07% de que una persona se conecte al internet en menos de un
minuto.
1.5
b) P( x 1) =
1.5
192( x 2 6x + 10)
192 x 3
3x 2 + 10x = 0.2893
=
dx
1355
1355 3
Existe una probabilidad de 28.93% de que una persona espere para conectarse al internet un
minuto o ms tiempo.
103
EJERCICIOS DE CLASE
Experimento aleatorio y determinstico
1. Determine cules de los siguientes experimentos son determinsticos o aleatorios.
a) Un alumno realiza un examen de opcin mltiple, en el cual cada pregunta consta de 3
respuestas, de las cuales slo una es correcta. Cada pregunta es elegida mediante
bolos. El examen consta de 2 preguntas. Se sabe que el alumno no estudi para este
examen. Cul es la probabilidad de que responda correctamente las dos preguntas?
b) Una empresa que fabrica cereales de distinto tipo, quiere probar si su nuevo cereal es
significativamente diferente en sabor que los anteriores que ha producido. Para ello,
realiza una prueba con varios clientes. A cada uno se les da a probar 5 cereales, de los
cules uno es el nuevo. De 7 clientes, 6 acertaron al nuevo cereal. Cul es la
probabilidad de que de 3 clientes, uno acierte al nuevo cereal?
c) Se sabe que una mquina para envasar cierto producto lquido, no llena el 100% de las
latas con la cantidad de lquido debida: de 20 latas (que constituyen la produccin
diaria), 4 estn mal llenadas. Si se escogieron 4 latas al azar de la produccin del da de
hoy, qu probabilidad hay que encuentren por lo menos una que est mal llenada?
Determinacin del espacio muestral
2. Determine el espacio muestral de los experimentos de la pregunta 1, que sean aleatorios.
Determinacin de una distribucin de variable aleatoria discreta
3. Halle la distribucin de probabilidades para los experimentos de la pregunta 1 que sean
aleatorios y determine las probabilidades que se piden.
Funcin de cuanta
4. Sea la siguiente funcin de cuanta: f (x) = e x x = 0,1, 2,3, 4,5 , que determina la
probabilidad de la demanda diaria de un artculo que se vende a 2 $us. por unidad.
a)
b)
c)
d)
e)
f)
g)
Corrija la funcin, de modo que cumpla las propiedades de una funcin de cuanta.
Halle la distribucin de probabilidad.
Realice el diagrama de barras de probabilidades.
Realice el diagrama acumulado de probabilidades.
Halle la probabilidad de que la demanda del artculo sea de 4 unidades.
Halle la probabilidad de que la demanda del artculo sea de a lo ms 3 unidades.
Halle la probabilidad de que la demanda del artculo sea de al menos 2 unidades.
104
Funcin de densidad
5. Sea la funcin de densidad: f (x) = e
precio unitario de un artculo (en $us.).
a)
b)
c)
d)
e)
x
2
0 x 4,
Corrija la funcin, de modo que cumpla las propiedades de una funcin de densidad.
Halle la distribucin de probabilidad.
Realice el histograma de probabilidades.
Realice la ojiva de probabilidades.
Halle la probabilidad de que el precio del artculo sea de al menos 3.5 $us.
105
EJERCICIOS PROPUESTOS
1. D una lista de los posibles resultados que se consiguen al lanzar dos dados uno tras otro.
Dibuje el arboligrama y un cuadro de doble entrada.
2. Cules de los siguientes resultados son mutuamente excluyentes en el lanzamiento de
dos dados?
a) Un total de 5 y un 5 en un dado.
b) Un total de 7 y un nmero par de puntos en ambos dados.
c) Un total de 10 puntos y un 4 en un dado.
3. Una pastelera ofrece pasteles con decoracin especial para cumpleaos, bodas y otras
ocasiones. Tambin tiene pasteles normales en su tienda. En la tabla que sigue se
proporciona el nmero total de pasteles vendidos al da y las probabilidades
correspondientes.
N de pasteles Probabilidad
vendidos/da
12
0.25
13
0.40
14
0.25
15
0.10
a) Complete la tabla y diga de qu tipo de distribucin se trata.
b) Realice una grfica de la distribucin.
c) Cuntos pasteles vender al da, si tomamos en cuenta la mayor probabilidad?
4. Como se sabe, la respuesta a una pregunta de verdadero o falso es correcta o incorrecta.
Considere que un examen est formado por 4 preguntas de este tipo y un estudiante no
sabe nada sobre el tema.
a) Construya la tabla de distribucin de cuanta.
b) Cul es la probabilidad de que el estudiante responda todas las preguntas mal?
c) Cul es la probabilidad de que el estudiante responda por lo menos una bien?
5. Dada la siguiente funcin:
f ( x ) = 3x 2 + 5 x + 4
Para 0 x 3
107
x x2
e
2
f ( x) =
10
+ x 4 + 8 x 2 5 . Generalmente el tiempo de fabricacin
x3
resolver este asunto, el docente elegir al azar de los 10 alumnos que no tienen excusa
para la transferencia. Sabe que en ese grupo existen 6 personas repitentes.
a) Presente la distribucin de probabilidades del nmero de repitentes.
b) Cul es la probabilidad de que el docente elija a por lo menos un repitente?.
6. Un estudiante se presenta a un examen oral, que consiste de 2 preguntas. El profesor
prepar el examen para que el alumno eligiera entre 5 preguntas de distribuciones
discretas de probabilidad, 3 preguntas de distribuciones de frecuencia y 4 de distribuciones
continuas de probabilidad.
a) Halle la probabilidad de que el alumno tenga que contestar al menos una pregunta
sobre distribuciones discretas de probabilidad.
b) Halle la probabilidad de que el alumno tenga que contestar 2 preguntas sobre
distribuciones de frecuencia.
109
CAPTULO 5
ESTADGRAFOS DE POSICIN
INDICADORES DE TENDENCIA CENTRAL
1. INTRODUCCIN
La informacin que contiene cualquiera de las distintas formas de distribucin de frecuencias o
probabilidades sobre los valores de una variable, es posible reducirla o condensarla utilizando
estadgrafos o indicadores de posicin central.
Ejemplo 1: Para describir la edad indicadora, en forma resumida, de los alumnos que hacen el
pre-universitario, se dice que tienen alrededor de 18 aos.
Ejemplo 2: Para describir la temperatura en Cochabamba se dice que el promedio es de 24oC,
es decir un clima templado.
Los principales indicadores de tendencia central son:
Media aritmtica
Moda
Mediana
Media armnica
Media geomtrica
2. MEDIA ARITMTICA
2.1. Definicin
Es un valor determinado en algn punto del recorrido de la variable. Este punto resulta ser el
centro de gravedad de la distribucin. En general se define como el valor que resulta de dividir
los valores registrados de la variable entre el nmero de ellos. Este valor llamado media
aritmtica se simboliza por:
n
x , M[ x ], =
x
i =1
108
x1 + x 2 + K + x n
n
65
75
80
71
x=
70 + 65 + 75 + 80 + 71 361
=
= 72.5
5
5
x=
ni
i =1
x = xi hi
i =1
Se multiplica la primera columna (xi) por la segunda columna (ni). Este producto se anota en
la tercera columna. La suma de dicho producto se divide entre el tamao de poblacin o
universo (ver tabla 5.2.1).
Tabla 5.2.1
Clculo de la media aritmtica en distribuciones tipo II
xi
x1
x2
:
xn
ni
n1
n2
:
nn
n
xi * ni
x1 * n 1
x2 * n 2
:
xn * n n
xi * ni
ni
c) Tipo III
La expresin de clculo de la media aritmtica en una distribucin de frecuencias tipo II se
aplica tambin al caso de hallar dicho estadgrafo en una distribucin tipo III, si acaso esta
distribucin se la convierte a tipo II.
La transformacin mencionada se efecta de la forma en la que se observa en la tabla 5.2.2.
Tabla 5.2.2
Transformacin de la tabla Tipo III a tipo II
tipo III
Li-1 - Li
Lo - L1
L1 - L2
:
Ln-1 - Ln
transformada a
tipo II
xi = (Li + Li-1)/2
x1
x2
:
xn
ni
n1
n2
:
nn
ni = n
ni
n1
n2
:
nn
ni = n
Tabla 5.2.3
Transformacin de la distribucin de gastos diarios de tipo III a tipo II
.Li-1 - Li
1 - 5
5' - 13
13' - 21
21' 31
xi = (Li + Li-1)/2
3
9
17
26
ni
11
9
12
8
40
ni
11
9
12
8
40
ni
11
9
12
8
40
xi*ni
33
81
204
208
526
x=
526
= 13.5 Bs.
40
Conclusin: Los alumnos de Estadstica en promedio tienen 13.15 Bs. para gastar diariamente.
Nota: La media aritmtica debe utilizarse cuando las distribuciones no tengan peso o
ponderacin en valores extremos.
M[k ] = k
111
Demostracin:
M[k ] =
k ni
n
n veces
k + k +K+ k n k
=
=k
n
n
M[x + k] = x + k
En smbolos:
Demostracin:
M[x + k] =
(x + k) n
ni
k n
= x+k
3ra Propiedad. La media aritmtica de la variable multiplicada por una constante es igual a la
media aritmtica de la variable, multiplicada por dicha constante.
M[x k] = x k
En smbolos:
Demostracin:
M [k x ] =
k n
n
=k
ni
=kx
Ejemplo
El Centro de Estudiantes ha decidido aplicar una poltica de carcter social: subvencionar a los
estudiantes en sus gastos diarios mediante alguna de las dos alternativas:
a) Ofrecer a todos los alumnos la suma de 2.5 Bs. por da.
b) Darles el 20% de lo que tiene cada uno como gasto diario.
Cul de las dos alternativas recomendara usted?
Resolucin
Para comprender la aplicacin de las propiedades, se resolver aplicando las propuestas a la
distribucin.
a) Si se aplica la 1ra alternativa.
Calcule (xi + 2,5) * ni en la tercera columna (ver tabla 5.2.5)
112
Tabla 5.2.5
Distribucin de gastos diarios con subvencin de 2.5 Bs/da
xi+2.5
5.5
11.5
19.5
28.5
ni
11
9
12
8
40
(xi+2.5)*ni
60.5
103.5
234.0
228.0
626.0
x + 2. 5 =
626
= 15.65 Bs.
40
x = 13.5
k = 2.5
ni
11
9
12
8
40
(xi*1.2)*ni
39.6
97.2
244.8
249.6
631.2
1. 2 x =
631.2
= 15.78 Bs.
40
Si se aplica la propiedad: M [ x * k ] = x * k
113
Siendo que:
x = 13.15
k = 1.2
Entonces:
z = xi x
En efecto:
M [ z] =
M [ z] = M [ x i x ] = 0
entonces:
ni
(x
x) n i
n
ni
x ni
n
= x
xn
= xx =0
n
Prueba
Sea la distribucin original donde x = 13.15 Bs.
Para verificar la propiedad se determina zi = xi - x en la cuarta columna.
Se calcula zi * ni en la quinta columna (ver tabla 5.2.7).
Tabla 5.2.7
Comprobacin de la cuarta propiedad de la media de la distribucin de gastos diarios
xi
3
9
17
26
ni
11
9
12
8
40
xi*ni
33
81
204
208
526
zi = x i - x
- 10.15
- 4.15
3.85
12.85
zi * ni
- 111.65
- 37.35
46.20
102.80
0
114
x n + x 2 n 2 + Kx k nk
=
x= 1 1
n1 + n 2 + K n k
ni
i =1
Ejemplo
Sea la distribucin de frecuencias, de la cantidad de dinero que manejan los estudiantes, dada
en la tabla 5.2.8.
Tabla 5.2.8
Distribucin de frecuencias de gastos diarios (Bs.)
xi
3
9
17
26
ni
11
9
12
8
40
n1i
11
9
20
x1i * n1i
33
81
144
x1 =
114
= 5.7 Bs.
20
b) Defina la distribucin de frecuencia del 2do grupo y determine la media aritmtica (ver tabla
5.2.10).
115
Tabla 5.2.10
Distribucin de gastos diarios 2o grupo
x1i
n1i
17
26
12
8
20
x1i * n1i
204
208
412
x2 =
412
= 20.6 Bs.
20
x=
x1 n1 + x 2 n 2 5.7(20) + 20.76(20)
=
= 13.15 Bs.
n1 + n 2
20 + 20
Conclusin: La media general calculada, indica que por trmino medio, cada estudiante tiene
13.15 Bs. por da.
Ejemplo
Sea la siguiente distribucin de probabilidad de variable discreta formada a partir del siguiente
experimento aleatorio:
En el curso existen 5 mujeres, 3 de las cuales tienen cabello largo y 2 de cabello corto. Se
quieren elegir al azar dos de ellas.
Halle la esperanza matemtica.
116
Tabla 5.2.11
Distribucin de cuanta del nmero de seoritas de cabello largo
xi
0
1
2
P(xi)
2/20
12/20
6/20
1
P(xi)
2/20
12/20
6/20
1
xi * P(xi)
0
12/20
12/20
24/20
E[x] =
24
= 1.2
20
E[x] =
x i f ( x i ) dx para x
Ejemplo
Sea la siguiente funcin de densidad: f ( x ) =
matemtica.
2x + 1
para 0 x 3 . Halle la esperanza
12
Resolucin
a) Se parte de la definicin de esperanza matemtica.
117
1
E [x ] = x (2x + 1 )
12
0
1 2 3
1 54
2
dx = 12 3 x + x = 12 3 + 9 = 2.15
0
3. MODA
3.1. Definicin
La moda es el valor de la variable que responde a la frecuencia ms alta. Se dice tambin que
es el valor de la variable ms frecuente. Este estadgrafo de tendencia central se usa para
resumir la informacin en el caso de distribuciones de atributo nominal, ordinal y en el caso de
las variables discretas o continuas.
ni
11
9
12
8
40
La moda de la cantidad de dinero es 17 Bs., por que es el valor de la variable que corresponde
a la frecuencia ms alta (n3 = 12).
Conclusin: Lo ms frecuente o usual es que los estudiantes tengan 17 Bs. para sus gastos
diarios.
118
c) Tipo III
La moda en distribuciones tipo III se halla de dos maneras:
1) Se transforma la distribucin tipo III en tipo II, cambiando la columna de intervalos con una
de marcas de clase y se aplica la definicin de la moda.
2) Se aplica una frmula emprica (Mo):
Si la distribucin tipo III es de intervalo no constante:
n i +1
a i +1
Mo = L i 1 +
(a )
n i +1 n i 1 i
+
a i +1 a i 1
donde:ai = Amplitud del intervalo de clase modal.
Li-1 = Frontera inferior de la clase modal.
El ndice "i" corresponde al orden de la frecuencia ms alta y Li-1 - Li al intervalo modal.
Si la distribucin tipo III es de intervalo constante, la moda se determina aplicando la
siguiente frmula emprica:
Mo = Li 1 +
n i +1
(a i )
n i +1 + n i 1
Ejemplo
Sea la distribucin tipo III sobre la cantidad de dinero que tienen los estudiantes por da (ver
tabla 5.2.8)
Fila i-1
Fila i
Fila i+1
Li-1 - Li
1 - 5
5' - 13
13' - 21
21' - 31
ni
11
9
12
8
40
Frecuencia ms alta
Halle la moda.
Resolucin
Se determina la frecuencia ms alta: n3 = 12, donde el intervalo modal es:
Li-1 - Li = 13 - 21
119
ai = 21-13 = 8
ai+1 = 21-13 = 10
ai-1 = 13-5 = 8
Mo = 13 +
8
10
8 9
+
10 8
(8) = 16.3
Conclusin: La cantidad de moda diaria es de 16.3 Bs. Lo ms usual es que los estudiantes
tengan 16.3 Bs. para sus gastos diarios.
P(xi)
2/20
12/20
6/20
1
120
b) Funcin de densidad
Si f(x) es una distribucin de densidad, se puede determinar la moda mediante tres
procedimientos:
1) Aplicando el mtodo para hallar un mximo absoluto en un intervalo.
Consiste de los siguientes pasos:
a) Halle las coordenadas de x de todos los puntos crticos de primer orden de la funcin en el
intervalo a x b (Un punto crtico es aquel que se obtiene igualando a cero o a no existe
la primera derivada de una funcin: f ' ( x ) = 0
b) Calcule f(x) en estos valores crticos y en los puntos extremos x = a y x = b.
c) Seleccione el valor mayor de f(x) obtenido en el paso 2. Este es el mximo absoluto, que
puede ser confirmado mediante el criterio de la segunda derivada: f ' ' ( x ) < 0 .
Ejemplo
Sea la siguiente funcin de densidad: f (x) =
3
( 2x 2 + 4x ) para 0 x 2 . Halle la moda.
8
Resolucin
a) Se determina la primera derivada y se iguala a cero para obtener los puntos crticos (se
toman en cuenta aquellos que se encuentran dentro el intervalo de la variable):
f '(x) = 4x + 4 = 0
x =1
x = 1 f ( x ) = 0.75
x = 0 f (x) = 0
x = 2 f (x ) = 0
c) Se elige el punto cuyo valor de su ordenada sea mayor. En este caso es el punto (1, 0.75).
Esa es la moda.
b) Se determina la segunda derivada para comprobar si el punto hallado es un mximo, mnimo
o punto de inflexin:
f ''(x) = 4
>0
Mximo
Conclusin: La moda es 1.
2) Aplicando la frmula emprica para intervalos constates o no constantes.
P i+1
a i+1
Mo = L i1 +
* ai
P i+1 + P i 1
a i+1 a i 1
Mo =
121
P i+1 * +
a i L i 1
P i+1 + P i1
Ejemplo
Sea la siguiente funcin de densidad: f (x ) =
1
(2 x + 1 )
12
para 0 x 3 . La distribucin
P(xi)
2/12
4/12
6/12
12/12
Resolucin
a) Se determina la fila de clase modal: Fila 3. (Porque esa fila es la que tiene la probabilidad
ms alta)
b) Se determinan los elementos de la frmula emprica para la moda de intervalos constantes:
Li-1 = 2
Pi-1 = 4/12
Pi+1 = 0
ai = 1
Mo =
0
(1) + 2 = 2
0 + 124
Conclusin: La moda es 2.
3) Transformando la distribucin tipo III en una tipo II mediante las marcas de clase y
aplicando la definicin de la moda.
Ejemplo
Sea la siguiente funcin de densidad: f (x ) =
1
(2 x + 1 )
12
tabla es la 4.6.4.
Li-1 - Li
01
12
23
xi =
Li 1 + L i
2
P(xi)
0.5
1.5
2.5
2/12
4/12
6/12
12/12
Resolucin.
a) Se transforma la distribucin tipo III en tipo II como se ve en la tabla en la columna 2,
mediante marcas de clase.
122
ni
12
9
12
7
40
4. MEDIANA
4.1. Definicin
Es un valor de la variable que permite distribuir en dos partes igualmente proporcionales a la
distribucin de frecuencias. De otra manera se dice que la mediana es un valor que supera a
no ms de 50% de los valores observados. La mediana es un estadgrafo de ubicacin y
permite determinar si un valor cualquiera de la variable forma parte del primer o del segundo
grupo.
123
a) Tipo I
Se distinguen 2 casos:
1) Si el nmero de trminos de la distribucin es impar
Se procede de la siguiente manera:
Se ordenan los datos de la distribucin en forma ascendente o descendente.
El valor de la mediana corresponde al trmino central, es decir:
Me = x n +1
2
Ejemplo
Sea la cantidad de dinero que gastan diariamente 5 alumnos en el caf:
8
10
12
10
12
Halle la mediana.
Resolucin
Se ordenan los datos en forma ascendente:
5
Me = x n +1 = x 5+1 = x 3 = 8
2
xn + xn
Me =
+1
Ejemplo
Sea la cantidad de dinero que gastan diariamente 6 alumnos en el caf. Halle la mediana.
124
10
12
17
Resolucin
Se ordenan los datos en forma descendente:
17
12
10
x n = x 6 = x 3 = 10
2
x n = x 6 = x4 = 8
2
+1
+1
Me =
10 + 8
=9
2
Conclusin: El valor 9 es la mediana, por que supera al 50% de los valores inferiores y es
superado por el 50% de los valores superiores o mayores.
Nota: En este caso puede observarse que cualquier valor en el intervalo 10 - 8, cumple con la
definicin de mediana.
b) Tipo II
El valor de la mediana en una distribucin tipo II, se determina tomando en cuenta el siguiente
procedimiento:
Se determinan los valores de la frecuencia absoluta acumulada (Ni).
Se calcula la mitad del universo (n/2) y se lo ubica entre dos valores de la frecuencia
absoluta acumulada, tal que en smbolos corresponde a la siguiente expresin:
N i 1
n
Ni
2
x i + x i+1
2
Ejemplo
Sea la cantidad de dinero que disponen diariamente los estudiantes de Ingeniera Industrial.
125
xi
3
9
17
26
ni
10
9
13
8
40
Halle la mediana.
Resolucin
Halle los valores de la frecuencia absoluta acumulada en la columna 3.
Fila i-1
Fila i
xi
3
9
17
26
ni
10
9
13
8
40
Ni
10
19
32
40
n
2
= 20
n 40
=
= 20
2 2
Ubique el valor anterior entre dos consecutivos de la frecuencia absoluta acumulada:
N i 1 = 19
n
= 20 Ni = 32
2
ni
11
9
12
8
40
126
Resolucin
Halle los valores de la frecuencia absoluta acumulada en columna (3).
xi
3
9
17
26
Fila i
Fila i+1
ni
11
9
12
8
40
Ni
11
20
32
40
n
2
= 20
n 40
= = 20
2 2
Ubique el valor anterior entre dos consecutivos de la frecuencia absoluta acumulada:
N i 1 = 11
n
= 20 N i = 20
2
9 + 17
= 13
2
Conclusin: El valor 13 es mediana por que supera al 50% de los valores inferiores y es
superado por el 50% de los valores superiores o mayores. El 50% de los estudiantes gasta
diariamente menos de 13 Bs. y el 50% restante ms de esa cantidad.
c) Tipo III
En este tipo de distribucin, la mediana se calcula utilizando una frmula emprica:
n
N i 1
2
Me = Li 1 +
(a i )
ni
donde: ai = Ancho del intervalo de clase mediana
Li-1 = Lmite inferior de la clase mediana.
Ejemplo
Sea la distribucin del dinero que manejan diariamente los estudiantes de Ingeniera Industrial.
127
Li-1 - Li
1 - 5
5' - 13
13' - 21
21' - 31
ni
11
9
12
8
40
Halle la mediana.
Resolucin
Halle los valores de la frecuencia absoluta acumulada en columna 3 y determine el valor n/2.
Fila i-1
Fila i
Li-1 - Li
1 - 5
5' - 13
13' - 21
21' - 31
ni
11
9
12
8
40
Ni
11
20
32
40
n
2
= 20
n 40
=
= 20
2 2
Conociendo Ni, defina el intervalo de la mediana como en los casos anteriores (Li-1 - Li) y
calcule la amplitud de clase.
Li-1 = 5
Ni = 11
ai = 8
ni = 9
n
N i 1
20 11
(a i ) = 5 +
( 8) = 13
Me = Li 1 + 2
9
ni
Conclusin: El valor 13 es mediana por que supera al 50% de los valores inferiores y es
superado por el 50% de los valores superiores o mayores.
entonces
Pac (x i ) = 0.5
entonces
Me = x i
x + x i +1
Me = i
2
Ejemplo
Sea la siguiente funcin de cuanta: f (x) =
1
(2x + 1)
16
x = 0, 1, 2, 3 . Halle la mediana
esperada.
Resolucin
Halle la distribucin y sus probabilidades acumuladas:
Fila i
xi
0
1
2
3
P(xi)
1/16 = 0.0625
3/16 = 0.1875
5/16 = 0.3125
7/16 = 0.4375
16/16
Pac (xi)
0.0625
0.2500
0.5625
1.0000
0.5
entonces
Me = x i = 2
Conclusin: La mediana esperada es 2. Hay una probabilidad del 50% de que el valor de la
variable adopte un valor menor a 2 y otro 50% que sea ms alto que 2.
b) Funcin de densidad
La mediana esperada de una funcin de densidad puede ser calculada por tres mtodos:
1) Mediante la siguiente integral:
Me
Me
f (x) dx = f (x) dx = 2
Ejemplo
Sea la siguiente funcin de densidad: f (x) =
1
(2x + 1)
12
129
0 x 3 . Halle su mediana
esperada
Resolucin
Se calcula la integral:
Me
Me
1
1 2
1
1
2
0 12 (2x + 1) dx = 12 (x + x) 0 = 12 (Me + Me) = 2
Me 2 + Me 6 = 0
Se resuelve la ecuacin resultante: Me = 2
Me = 3
Me = Li1 +
0.5 Pac (x i 1 )
(a i )
P(x i )
Ejemplo
Se usar el ejemplo anterior. Se procede de la siguiente manera:
Obtenga la tabla tipo III de distribucin de probabilidades y las probabilidades acumuladas:
Fila i
Fila i+1
Li-1 - Li
01
12
23
P(xi)
2/12 = 0.1667
4/12 = 0.3333
6/12 = 0.5000
12/12
Pac(xi)
0.1667
0. 5000
1
0.5
Ubique 0.5 entre dos valores de probabilidad acumulada: En este caso el valor coincide con
la de la fila 2, que se constituye en la fila de clase mediana.
Determine los valores de la frmula emprica:
Li-1 = 1
Pac(xi-1) = 2/12
P(xi) = 4/12
ai = 1
2
0.5
0.5 Pac (x i 1 )
12 (1) = 2
Me = Li 1 +
(a i ) = 1 +
4
P(x i )
12
130
xi
0.5
1.5
2.5
P(xi)
2/12 = 0.1667
4/12 = 0.3333
6/12 = 0.5000
12/12
Pac(xi)
0.1667
0. 5000
1
0.5
Se ubica 0.5 entre dos valores de probabilidad acumulada: En este caso coincide con el
valor de la fila 2 que es la fila de clase mediana. Por lo tanto la mediana se halla por medio
de la siguiente frmula:
Me =
x i + x i +1 1.5 + 2.5
=
=2
2
2
5. MEDIA ARMNICA
5.1. Definicin
Es un valor de la variable que se determina como el valor recproco medio de los valores
recprocos de la variable. Se la usa generalmente cuando se quiere determinar la tasa media
de uso de un producto.
H=
n
n
x
i=1
131
Ejemplo
Una empresa que produce jaboncillo de tocador, desea averiguar el tiempo medio de duracin,
sabiendo que los datos obtenidos de 3 consumidores (en das) que utilizan habitualmente dicho
jaboncillo, son:
30
20
25
Resolucin
Se trata de una tasa de uso del bien, en consecuencia no se resuelve mediante la media
aritmtica, sino mediante la media armnica, es decir:
H=
3
3
900
=
=
= 24.3 24
1
1
1 10 + 15 + 12 37
+
+
30 20 25
300
H=
n
n
x
i=1
* (n i )
Ejemplo 1
Hecha una encuesta preguntando a 100 estudiantes lo que les acostumbra durar una pastilla
de jabn de una determinada marca, se han obtenido los resultados mostrados en la tabla
5.5.1. Halle la media armnica.
Tabla 5.5.1
Distribucin de frecuencias de la duracin de jabones
Duracin en
das
Li-1 - Li
5 10
10 15
15 20
20 25
xi
7.5
12.5
17.5
22.5
Nmero de
contestaciones
ni
24
46
19
11
100
132
Resolucin
Se trasforma la distribucin tipo III en tipo II, mediante las marcas de clase, como se ve en la
tabla (columna 2).
Se calcula la media armnica mediante la frmula:
H=
100
= 11.83 12
1
1
1
1
(24) +
(46) +
(19) +
(11)
7.5
12.5
17.5
22.5
Conclusin: La duracin media de la pastilla de jabn que usan los estudiantes es de 12 das.
Ejemplo 2
Suponga que una persona ha viajado de Cochabamba a Santa Cruz a una velocidad de 80
km/h. Y que ha efectuado el regreso a una velocidad de 60 km/h. A qu velocidad media ha
realizado el trayecto total de ida y vuelta?
Resolucin
La media aritmtica dara como respuesta:
x=
80 + 60
= 70 km / h
2
D
D
y al regreso
. La velocidad media en la ida y vuelta ser:
80
60
Velocidad =
6. MEDIA GEOMTRICA
6.1. Definicin
La media geomtrica es la raz ensima del producto de los valores considerados de una
variable representada por:
n
G = x1 * x 2 * . . . * x n = n xi
n
i =1
133
Generalmente es una mejor medida que la media aritmtica cuando los datos estn en
porcentajes o unidades relativas.
12.5
9.3
11
13.5
Resolucin
Reemplazando los datos en la frmula se obtiene:
G = 5 14 *12.5*9.3*11*13.5 = 11.9
Conclusin: La tasa media de inters para los ahorros a plazo fijo es de 11.9 %.
b) Tipo II o III
En distribuciones tipo II y III, la media geomtrica se obtiene aplicando la siguiente definicin:
n
n1
1
n2
2
G = x * x *...* x
n
nk
k
= n x in i
i =1
Ejemplo
En la banca comercial de nuestra ciudad en los ltimos dos aos se han registrado los
siguientes tipos de inters (expresados en porcentaje) para los ahorros a plazo fijo observados
en una muestra de 40 libretas de familias (ver tabla 5.6.1). Halle el inters medio.
Tabla 5.6.1
Distribucin de frecuencias de tasas de inters
Inters
5-7
7 - 10
10 - 12
12 - 15
xi
5
8.5
11
13.5
Familias
2
5
25
8
Resolucin
Se transforma la distribucin tipo III en tipo II mediante marcas de clase (columna 2).
Se reemplazan los datos en la frmula:
Ejemplo
La poblacin de un lugar en 1980 fue de 2 personas y el nmero estimado para 1990 fue de 22.
Cul es el incremento porcentual promedio anual estimado de esta poblacin?
Resolucin
Se cuenta cuantos periodos se tienen entre los aos. En este caso n = 11.
Se aplica la frmula:
22
G = 111 1 = 0.27
2
Conclusin: La media geomtrica del incremento anual en esta poblacin es del 27%.
1 Esta porcin ha sido extractada totalmente del libro: Quantitative Analysis for Management. Render y
Stair, 1997.
136
supeditado a construir una gran planta y tener un mercado favorable. El valor condicional si el
mercado es desfavorable vendra a resultar en una prdida neta de 180000 $. Una pequea
planta entregara un beneficio neto de 100000 $ en un mercado favorable, pero una prdida
neta de 20000 $ si el mercado es desfavorable. Finalmente si no construye nada, en cualquier
mercado se obtendr un beneficio de cero.
La manera ms fcil de presentar estos valores es construyendo una tabla de decisin,
tambin llamada tabla de beneficios. La tabla de decisin para los valores condicionales de
Thompson es mostrado en la tabla 5.8.1.
Tabla 5.8.1
Tabla de decisin con valores condicionales
para la Empresa Maderera Thompson
Alternativa
Construir una
planta grande
Construir una
planta pequea
No construir
Estados de la naturaleza
Mercado
Mercado
Favorable ($) Desfavorable ($)
200000
-180000
100000
-20000
Todas las alternativas estn enlistadas en el lado izquierdo inferior de la tabla y todos los
posibles resultados o estados de la naturaleza a lo largo de la parte superior de la tabla. El
cuerpo de la tabla contiene los beneficios.
Pasos 5 y 6. Los ltimos dos pasos son seleccionar un modelo de la teora de decisiones y
aplicarlo a los datos para ayudar a realizar la decisin. La seleccin del modelo depende del
entorno en el cual se est operando y la cantidad de riesgo e incertidumbre involucrado.
138
Estados de la naturaleza
Mercado
Mercado
Favorable ($) Desfavorable ($)
200000
-180000
EMVs calculados
($)
10000
100000
-20000
40000
0
0.5
0
0.5
Volviendo a los datos de la tabla anterior (tabla 2), Thompson puede calcular lo mximo que
debera pagar por la informacin, que es, el valor esperado de informacin perfecta (EVPI).
Seguiremos para ello 2 pasos. Primero, se calcula el valor esperado con informacin perfecta.
Luego, usando este resultado, se calcula el EVPI:
1. El mejor resultado para el estado de la naturaleza mercado favorable es construir una
planta grande con un beneficio de 200000 $. El mejor resultado del estado de la naturaleza
mercado desfavorable es no hacer nada, con un beneficio de 0 $. El valor esperado con
informacin perfecta es: 200000(0.5) + 0(0.5) = 100000 $. Entonces, si tuviramos
informacin perfecta, podramos esperar, en promedio, 100000 $ si la decisin podra ser
repetida muchas veces.
2. El mximo EMV es 40000 $, que es el resultado esperado sin informacin perfecta. Por lo
tanto el EVPI ser:
Es importante notar que el mnimo EOL dar el mismo resultado que con el mximo EMV, y
que se cumplirn siempre las relacin siguiente: EVPI = Mnimo EOL .
Tabla 5.8.3
Tabla de prdida de oportunidad para la Empresa Thompson
Alternativa
Construir una
planta grande
Construir una
planta pequea
No construir
Probabilidades
Estados de la naturaleza
EMVs
calculados
Mercado Favorable ($)
Mercado
($)
Desfavorable ($)
200000-200000=0
0-(-180000)=180000
90000
200000-100000=100000
0-(-20000)=20000
60000
200000-0=200000
0.5
0-0=0
0.5
Anlisis de sensibilidad
Determinamos que la mejor decisin para la maderera Thompson es construir una planta
pequea, con un valor esperado de 40000 $. Esta conclusin depende de los valores de las
consecuencias econmicas y de los dos valores de probabilidad para los mercados favorable y
desfavorable. El anlisis de sensibilidad investiga como puede cambiar nuestra decisin si los
datos del problema cambian. Investigaremos el impacto que puede haber en la decisin de la
maderera Thompson, por ocurrir un cambio en los valores de las probabilidades. Definimos lo
siguiente:
Punto 2:
EMV
100000
50000
2
1
0
-50000 0
0.2
0.4
0.6
0.8
-100000
-150000
-200000
P
Rango de valores de P
Menos de 0.1667
0.1667 0.6154
Ms de 0.6154
4. Criterio de realismo
5. Minimax
Maximax
El criterio mximas encuentra la alternativa que maximiza el mximo resultado de cada
alternativa. Primero se debe localizar el mximo resultado entre cada alternativa, y entonces
escoger aquella alternativa con el valor mximo. Puesto que este criterio de decisin localiza la
alternativa con la ms alta ganancia posible, ha sido llamado un criterio de decisin optimista.
En la tabla 5.8.5 podemos observar que la eleccin maximax de Thompson es la primera
alternativa, construir una planta grande. Este es el mximo de los mximos valores dentro de
cada alternativa.
Tabla 5.8.5
Decisin maximax de Thompson
Alternativa
Construir una
planta grande
Construir una
planta pequea
No construir
Estados de la naturaleza
Mercado
Mercado
Favorable ($) Desfavorable ($)
200000
-180000
Mximo en la
fila ($)
100000
-20000
200000
(maximax)
100000
Maximin
El criterio maximin encuentra la alternativa que maximiza el mnimo resultado de cada
alternativa. Primero se localiza el mnimo resultado dentro de cada alternativa y luego se
escoge aquella alternativa con el mximo valor. Puesto que este criterio de decisin localiza la
alternativa que tiene la menor prdida posible, ha sido llamada el criterio pesimista de decisin.
La eleccin maximin de Thompson es no hacer nada y se muestra en la tabla 5.8.6. Es el
mximo de los mnimos valores entre cada alternativa.
Tabla 5.8.6
Decisin maximin de Thompson
Alternativa
Construir una
planta grande
Construir una
planta pequea
No construir
Estados de la naturaleza
Mercado
Mercado
Favorable ($) Desfavorable ($)
200000
-180000
Mnimo en la
fila ($)
-180000
100000
-20000
-20000
0
(maximin)
144
Estados de la naturaleza
Mercado
Mercado
Favorable ($) Desfavorable ($)
200000
-180000
100000
-20000
Promedio de
la fila
($)
10000
40000
(Igualmente
probable)
0
Alternativa
Construir una
planta grande
Construir una
planta pequea
No construir
Estados de la naturaleza
Mercado
Mercado
Favorable ($) Desfavorable ($)
200000
-180000
100000
-20000
Criterio de
realismo
( = 0. 8 )
($)
124000
(Realismo)
76000
145
Si asumimos que Thompson estableci su criterio de realismo en 0.8, la mejor decisin podra
ser construir una planta grande. Como se observa en la tabla 5.8.8, esta alternativa tiene el
ms alto promedio ponderado:
Estados de la naturaleza
Mximo en fila
Mercado
Mercado
($)
Favorable ($) Desfavorable ($)
0
180000
180000
100000
20000
200000
100000
(Minimax)
200000
P (MP) (1 P)(ML)
Con algunas manipulaciones matemticas bsicas, podemos determinar el nivel de P que nos
ayudar en la resolucin de problemas de anlisis marginal:
P(MP ) ML P( ML)
P(MP) + P (ML) ML
P(MP + ML) ML
ML
P
MP + ML
En otras palabras, si la probabilidad de vender una unidad ms es mayor o igual a
ML
,
MP + ML
3.
Elija la orden de inventario de manera que la probabilidad de vender al menos una unidad
adicional sea ms grande que P.
Ejemplo
Caf du Pont es un popular punto de encuentro nocturno de New Orleans en el barrio Francs.
Su especialidad es caf y donuts; compra los donuts frescos diariamente de una gran
panadera industrial. El caf paga 4 $ para cada paquete (que contiene 2 docenas de donuts)
entregado cada maana. Cualquier paquete no vendido hasta el final del da es desechado, ya
que ya no son lo suficientemente frescos para los estndares del caf. Si es vendido un
paquete de donuts, el ingreso total es de 6 $. Por lo tanto el beneficio por paquete de donuts
es:
La prdida marginal es de 4 $, puesto que los donuts no pueden ser salvados al final del da.
De ventas pasadas, el administrador del caf estima que las ventas diarias seguirn la
distribucin de probabilidad mostrada en la tabla 5.8.10. La administracin entonces sigue tres
pasos para encontrar el nmero ptimo de paquetes de donuts que deben ordenar cada da.
5.8.10
Distribucin de probabilidad de ventas diarias de donuts
Ventas diarias
(paquetes de donuts)
4
5
6
7
8
9
10
Probabilidad de
ventas
0.05
0.15
0.15
0.20
0.25
0.10
0.10
1.00
Probabilidad
acumulada
1.00
0.95
0.80
0.65
0.45
0.20
0.10
ML
4
=
= 0.66
ML + MP 4 + 2
Paso 2: Aadir una nueva columna a la tabla para reflejar la probabilidad de venta acumulada
de donuts
Paso 3: Elegir la orden de paquetes de tal modo que la probabilidad de vender al menos un
paquete adicional sea ms grande que P, que es la probabilidad de indiferencia o de equilibrio.
Si el Caf du Pont ordena 6 paquetes, los beneficios marginales sern ms grandes que sus
prdidas marginales.
0.8 0.66
148
149
EJERCICIOS DE CLASE
Media aritmtica
1. Halle la media aritmtica de los segundos ejemplos de ejercicios de clase, del captulo de
Distribucin de Frecuencias.
Propiedades de la media
2. El gerente de una empresa que fabrica papel desea analizar los sueldos que paga a sus
trabajadores. Para ello, los dividi en tres grupos. Los datos en $ para cada grupo se
muestran a continuacin:
Grupo 2:
Grupo 1:
Li-1 - Li
180-200
200-220
220-240
ni
3
4
8
15
Li-1 - Li
240-260
260-280
280-300
Grupo 3:
ni
11
15
10
36
Li-1 - Li
300-320
320-340
340-360
ni
9
6
4
19
150
Funcin de densidad
4. Sea la funcin de densidad: f (x) = e
precio unitario de un artculo (en $us.).
x
2
0 x 4,
a) Corrija la funcin, de modo que cumpla las propiedades de una funcin de densidad.
Halle la distribucin de probabilidad.
b) Determine la esperanza matemtica.
Moda
5. Halle la moda de los segundos ejemplos de los ejercicios de clase, del captulo de
Distribucin de Frecuencias.
Moda esperada
Funcin de cuanta
6. Determine la moda esperada del ejercicio 3 de este captulo, de los ejercicios de clase.
Funcin de densidad
7. Determine la moda esperada del ejercicio 4 de este captulo, de los ejercicios de clase.
Mediana
8. Halle la mediana de los segundos ejemplos de los ejercicios de clase, del captulo de
Distribucin de Frecuencias.
Mediana esperada
Funcin de cuanta
9. Determine la mediana esperada del ejercicio 3 de este captulo, de los ejercicios de clase.
Funcin de densidad.
10. Determine la mediana esperada del ejercicio 4 de este captulo, de los ejercicios de clase.
Media geomtrica
11. Los rendimientos anuales, en porcentaje de cuatro acciones de computadora son:
4.91
5.75
8.12
21.60
12. Los porcentajes de aumento de ventas de un periodo a otro, de un sector industrial son los
siguientes:
Porcentaje de
ventas
05
5 10
10 20
20 - 50
Nmero de
empresas
10
15
7
3
1
40
2
45
3
52
4
60
5
48
6
55
7
59
8
63
9
70
Un amigo suyo (persona Y) hizo tambin lo mismo. Los focos de su departamento, por
supuesto de otra marca, tenan una duracin media de 60 das. Le conviene cambiar de
marca de focos a la persona X?
15. Una encuesta sobre la duracin de cierta batera, en aos, arroj la siguiente informacin:
Duracin de la
batera
0 0.5
0.5 1
1 2
2 - 4
Halle la media armnica.
152
Nmero de
usuarios
40
100
250
35
EJERCICIOS PROPUESTOS
1. En una empresa constructora, el departamento de obras est constituido por 40
trabajadores, que cumplen las siguientes funciones: (I = Ingeniero, J =Jefe de obras, C =
Capataz, O = Obrero, A = Ayudante). La informacin elaborada permitir conocer la
estructura de ocupacin de dicha empresa.
O
J
A
J
A
O
O
C
C
C
O
A
O
C
I
O
O
O
J
A
A
I
O
A
I
O
A
O
O
A
A
J
A
J
C
O
C
C
O
A
67.7
69.3
70.1
71.1
72.1
74.5
68.0
69.3
70.2
71.2
72.2
75.3
68.0
69.5
70.3
71.3
72.3
68.3
69.5
70.3
71.3
72.4
68.4
69.6
70.4
71.5
72.6
68.6
69.7
70.5
71.6
72.7
68.8
69.8
70.6
71.6
72.9
68.9
69.8
70.6
71.7
73.1
69.0
69.9
70.8
71.8
73.3
69.1
70.0
70.9
71.8
73.5
4
5
6
6
3
5
2
2
4
4
6
2
5
3
2
3
3
3
2
4
2
4
4
5
5
5
3
6
3
6
2
5
2
5
3
4
2
3
2
2
3
3
5
2
6
25
34
43
52
61
N0 de
negocios
7
9
16
15
3
50
Compaa Doma
500
100
Compaa Betz
600
80
f(x) = 3 x2 + 5 x + 4.
Para 0 x 3
Probabilidad
0.25
0.40
0.25
0.10
ni
4
Ni
hi
Hi
xi
xi*ni
0.15
38
63
Totales
5
100
155
Li-1 - Li
4-6
6 - 10
10 - 16
16 - 20
20 - 30
ni
4
5
3
1
ni
Ni
xi
xi*ni
14
23
n = 65
a) Los datos se borraron. Puede reconstruir la distribucin? La informacin que se pudo
recolectar es:
37
5
38
6.5
40
9
39
10
40
7
42
4.5
43
8
44
7.5
40
40
41
50
40
6
a) Halle la media, mediana y moda para el nmero de zapato, y diga cul promedio es el
ms representativo.
b) Halle la media, mediana y moda para los gastos diarios, y diga cul promedio es el ms
representativo.
Ejercicios de teora de la utilidad
1.
156
2.
Una compaa de taxis est considerando disponer de tres marcas de autos A, B y C para
aadirlos a su flota. Los costos de operacin diarios para cada marca dependen de su
tasa de uso diario (demanda) como se muestra a continuacin.
Costos por da de
operacin ($)
Marca
A
B
C
a)
b)
c)
3.
Moderada
200
200
190
Alta
300
220
230
Moderado
Alto
Muy alto
100
175
250
100
0.25
200
300
300
300
0.35
300
400
350
400
0.20
600
500
425
450
0.20
b)
4.
Rick Miller acaba de abrir una nueva panadera en FRISCO, Colorado, llamada Morning
Fresh. Al desarrollar un anlisis econmico, Rick determin que el costo o prdida marginal
por cada docena de donuts vendidas es de 4 $. El beneficio marginal es aproximadamente
2.75 $ por docena. Por esta vez Rick est considerando tener en vitrinas 10, 15, 20, 25 o
30 docenas de donuts. La probabilidad de vender 10 docenas es del 10%., la de vender 15
docenas es de 20%. Hay una posibilidad del 30% de vender 20 o 25 docenas. Finalmente
hay una posibilidad del 10% de vender 30 docenas, que es la cantidad que Rick considera
como la ms alta que Morning Fresh es capaz de acomodar. Cul es su recomendacin
para Rick?
157
5.
Mara Rojas est considerando la posibilidad de abrir una pequea tienda de ropas sobre
la avenida Fairbanks, a pocas cuadras de la universidad. Est ubicada en un buen mall
que atrae a los estudiantes. Sus opciones son abrir una pequea tienda, una tienda de
tamao mediano, o no abrir nada. El mercado para una tienda para ropa puede ser bueno,
promedio o malo. Las probabilidades para las tres posibilidades son 0.2 para un mercado
bueno, 0.5 para un mercado promedio, y 0.3 para un mercado malo. La ganancia o prdida
neta para una tienda pequea y mediana para las varias condiciones del mercado estn
dadas en la siguiente tabla. Cul es su recomendacin para Mara Rojas?
6.
Cal Bender y Becky Addison se conocen desde la preparatoria. Hace dos aos entraron a
la misma universidad y ahora estn tomando cursos para graduados en el colegio de
negocios. Ambos esperan graduarse con un postgrado en finanzas. En un intento por
ganar un dinero extra y usar los conocimientos aprendidos de sus cursos de negocios, Cal
y Becky han decidido ver la posibilidad de iniciar una pequea compaa que proveer
servicios de dactilografa para estudiantes que necesitan artculos trimestrales u otros
reportes escritos de una manera profesional. Usando un enfoque de sistemas, Cal y Becky
han identificado tres estrategias. La estrategia 1 es invertir en un sistema de
microcomputadoras bastante caro con una impresora lser de alta calidad. En un mercado
favorable, podran obtener un beneficio neto de 10000 $ en los siguientes dos aos. Si el
mercado es desfavorable, pueden perder 8000 $. La estrategia 2 es comprar un sistema
menos caro. Con un mercado favorable, podran conseguir un beneficio de 8000 $. Con un
mercado desfavorable, incurriran en una prdida de 4000 $. Su estrategia final, la 3, es no
hacer nada. Cal es bsicamente un arriesgado, mientras Becky es adversa al riesgo.
a) Qu tipo de criterio de decisin debera usar Cal? Cul es la decisin de Cal?
b) Qu tipo de criterio de decisin debera usar Becky? Cul es la decisin de Becky?
c) Si Cal y Becky fueran indiferentes al riesgo, qu tipo de criterio de decisin deberan
usar? Cul debera ser su decisin?
158
x x2
e
2
f ( x) =
6
4
7
7
4
3
5
4
3
5
3
6
4
3
6
7
5
4
7
3
7
5
4
7
5
6
3
5
6
4
7
6
4
3
6
5
3
4
Si el Centro subvenciona a todos los la suma de 1.4 Bs. Esta es mejor cooperacin que un
aumento del 30%? Presente un informe estadstico para orientar a sus compaeros en
tomar una de las alternativas.
4. La secretaria de una empresa de envasado de alimentos olvid comprar el cartucho de tinta
para la impresora de su oficina y al imprimir la distribucin de frecuencias de los pesos del
contenido de un cierto nmero de latas (gr.) que fueron llenadas por una mquina
automtica que se crea que estaba descalibrada, muchos datos eran ilegibles. A
continuacin se muestra la distribucin:
Li-1 - Li
130 - 140
140 - 150
150 - 160
160 - 170
170 - 180
180 - 190
190 - 200
200 - 210
ni
hi
Ni
22.73
45
Hi
xi
xi*ni
270
81.82
96.97
159
585
a) El gerente a cargo deba tener esta informacin cuanto antes para tomar la decisin de
llamar a la compaa de mantenimiento para que realicen una recalibracin de la
mquina. Puede ayudarlo a reconstruir la tabla? Se sabe que la moda de la distribucin
es de 156.5217 gr. y la frecuencia absoluta ms alta est en el tercer intervalo.
b) Halle la media aritmtica y la mediana de la distribucin.
c) Qu medida usara para representar de manera adecuada a la distribucin? Si el
promedio elegido est entre 140 - 150 gramos o entre 160 - 170, el gerente llamar a la
compaa de mantenimiento. Por el contrario, si se encuentra entre 150 - 160, quiere
decir que la mquina est llenando correctamente. Cul es la decisin que debe tomar?.
d) Cul es el porcentaje de prdida que tendr la empresa en este lote, si cada lata llenada
incorrectamente se debe reprocesar antes de venderse, siendo el costo del reproceso de
1 $ y cada lata de alimento se vende a 5 $? Se considera que la lata ha sido llenada
correctamente si su peso est entre 150 - 170 gr.
160
CASO
SAFETY SIGHT COMPANY2
Safety Sight Company posee dos plantas que fabrican faros de bicicleta. La planta de
Edgewater ha estado trabajando con capacidad operacional plena en los aos recientes; La
planta en Garland ha estado cerrada en los 2 ltimos aos. La administracin anticip un gran
incremento para las luces de bicicleta, y han sido desarrollados ahora planes de produccin
futura. Los ingresos medios esperados por ventas de luces han sido estimados en 8 dlares
por unidad tomando en cuenta el periodo futuro previsible.
La planta de Edgewater ha estado operando un turno simple con costos fijos de 2.5 millones de
$ y con una capacidad de produccin de 500000 unidades al ao. Los costos variables
unitarios han sido de 1.60 $ para este rango de produccin. Se debera alcanzar un gran
volumen de produccin para arrancar con un segundo turno. Si aquello fuera logrado, se estim
que los costos variables unitarios deberan ser alguno de los tres: 6.3 $, 5.7 $ o 5.1 $ con
probabilidades de 0.09, 0.33 y 0.58, respectivamente. La capacidad de produccin en el
segundo turno debera alcanzar las 500000 unidades anuales.
Si se logran grandes volmenes de produccin, la planta en Garland podra ser reabierta. Los
costos fijos anuales exactos por la operacin de esta planta son desconocidos. Tres estimados
recientes son: 1.8 $, 1.65 $ y 1.55 $ millones con probabilidades de 0.4, 0.5 y 0.1,
respectivamente. El costo variable unitario esperado para la operacin del primer turno es de
1.60 $, que es el mismo que para la planta de Edgewater. La capacidad esperada del primer
turno de la planta de Garland es de 500000 luces por ao.
La administracin est considerando dos alternativas: operar la planta de Edgewater en dos
turnos, dejando cerrada la planta de Garland; u operar ambas plantas con un solo turno cada
una. La administracin est segura que cualquier alternativa proporcionar la capacidad para
obtener la nueva demanda esperada. Qu deber hacer?
2 Caso extractado del libro: Production and Operations Management (Concepts, Models and Behavior).
Everett E. Adam, Jr. & Ronald J. Ebert., 1989.
161
CASO
HARRYS HARDWARE CHRISTMAS TREE3
Harrys Hardware realiza negocios giles durante el ao, pero en la poca de navidad, Harrys
Hadware vende rboles de navidad para aumentar sus ganancias. Desafortunadamente no
todos los rboles se pueden vender al final de la temporada, y los que quedan son totalmente
desechados. Entonces, el nmero de rboles en inventario para una temporada dada es una
decisin muy importante. La siguiente tabla revela la demanda para rboles de navidad.
Demanda
50
75
100
125
150
175
200
Probabilidad
0.05
0.1
0.2
0.3
0.2
0.1
0.05
3 Extractado del libro: Quantitative Analysis for Management. Render y Stair, 1997.
162
CAPTULO 6
ESTADGRAFOS DE DISPERSIN
1. INTRODUCCIN
Los estadgrafos de tendencia central permiten resumir la informacin definiendo la posicin de
la distribucin de frecuencias, tanto para variables como para atributos. Sin embargo esta es
una caracterizacin parcial de dichas distribuciones. La caracterizacin se completa, cuando
adems de conocer la posicin tambin se conoce su forma.
Los estadgrafos que permiten conocer en forma resumida la forma de una distribucin se
denominan indicadores de dispersin. Adems de ello permiten evaluar la confiabilidad de un
estadgrafo de posicin.
An siendo la media aritmtica el promedio ms utilizado en la prctica, muchas veces puede
dar lugar a falsas interpretaciones. Esto ocurrir cuando no tenga suficiente grado de
representatividad, es decir, cuando los valores de la variable estn poco concentrados, o lo que
es lo mismo, muy dispersos a su alrededor. Entonces, poco podr decir la media sobre la
poblacin en estudio. Es necesario acompaar la media aritmtica con una medida del grado de
dispersin de los valores de la variable a su alrededor, de forma que, cuanto mayor sea esta
medida, menor ser el grado de representatividad de la media y viceversa.
Los principales son:
El recorrido.
La varianza y la desviacin estndar.
La amplitud y desviacin cuartlica.
La amplitud centlica.
Media aritmtica
Mediana
Desviacin estndar
Para comprender mejor qu es lo que involucra que exista una variacin en los datos de una
serie estadstica, se describen aqu algunos aspectos importantes:
1. Cunto ms dispersos estn los datos, ms aumentar el rango, la desviacin estndar o la
amplitud cuartlica, y viceversa.
2. Si las observaciones son todas iguales (de manera que no hay variacin en los datos) todos
163
2. RECORRIDO O RANGO
2.1. Definicin
Se determina por la diferencia entre el valor mximo y el valor mnimo observados de la variable.
R xi = VM xi Vm xi
Esta medida de dispersin simple es de clculo fcil, de uso comn y significacin concreta,
para expresar la variabilidad observada en la distribucin. Su uso es limitado cuando deben
efectuarse comparaciones debido a las unidades diferentes en que se expresan las variables.
Su desventaja es que solo toma en cuenta los valores extremos de la variable y no as todos
ellos.
Es eficaz y brinda un ayuda rpida para calcular la concentracin en distribuciones uniformes.
Por ejemplo, si una variable se distribuye uniformemente entre los lmites 5 y 12, presentar
mayor concentracin que otra que se distribuya tambin uniformemente entre los lmites 1 a 20.
Ejemplo
Halle el recorrido de la variable de los sueldos (Bs.) de 5 obreros de una fbrica:
850
700
900
750
950
Aplicando la frmula:
Rxi = VMxi - Vmxi = 950 - 700 = 250
Conclusin: El rango o campo de variacin de los sueldos de los 5 obreros es de 250 Bs.
3. VARIANZA
3.1. Definicin
La varianza de una distribucin de frecuencia se determina por el promedio del cuadrado de las
desviaciones de la variable.
n
(x x )
2
2
2
S = = V [x ] = M [z i ] =
i=1
3.2. Determinacin
a) Tipo I
La anterior frmula se aplica para el clculo de la varianza en las distribuciones tipo I. El clculo
de la varianza se facilita si se desarrolla convenientemente la expresin anterior:
164
(x
=
x )2
(x
=
2
i
2x i x + x )
n
x
=
2
i
x
=
2
i
x
2x
nx
+
=
n
xi
x
n
2
i
2x + x
Ejemplo
Nota: El ejemplo se desarrollar junto con el ejemplo para la desviacin estndar.
b) Tipo II y III
Si las distribuciones son de tipo II y III, la varianza se define de la siguiente manera:
n
2
2
2
S = = V [x ] = M [z i ] =
(x
x) * n i
i=1
x
=
2
i
ni
xi ni
Ejemplo
Nota: Se desarrollar junto con el ejemplo para la desviacin estndar.
4. DESVIACIN ESTNDAR
4.1. Definicin
Es la raz cuadrada positiva de la varianza.
4.2. Determinacin
a) Tipo I
Para distribucin tipo I, la frmula de clculo es:
n
( x x)
S = = V (x ) =
S=
i=1
Ejemplo
165
x
n
2
i
xi
x
=
n
2
i
Halle la varianza y la desviacin estndar de los sueldos (centenas de Bs.) de 5 obreros de una
fbrica, con respecto a la media aritmtica:
8.5
7.0
9.0
7.5
9.5
Resolucin.
Se tabulan los datos en una distribucin de frecuencias tipo I (ver tabla 6.4.1).
Se halla la sumatoria de los valores de la variable (columna 1).
Se halla la sumatoria de los valores de la variable elevados la cuadrado (columna 2).
Tabla 6.4.1
Distribucin de frecuencias de sueldos de obreros (Centenas de Bs.)
xi
7.0
7.5
8.5
9.0
9.5
41.5
x2i
49.00
56.25
72.25
81.00
90.25
348.75
S2 =
348.75 41.5
= 0.86
5
5
S = 0.86 = 0.93
x=
41.5
= 8.3
5
Conclusin: El sueldo promedio de los obreros es de 830 Bs. con una dispersin de 93 Bs.
b) Tipo II
Si se trata de distribuciones tipo II y III, se utilizan las siguientes expresiones:
n
( x x)
i
S = = V [x ] =
* ni
S=
i=1
2
i
ni
xi ni
Ejemplo
Sea la distribucin del dinero de los estudiantes de la carrera de Ingeniera Industrial, que gastan
diariamente (ver tabla 6.4.2). Halle la V[x] y :
Tabla 6.4.2
Clculo de la desviacin estndar de la distribucin de gastos diarios
166
xi
3
9
17
26
ni
11
9
12
8
40
xi*ni
33
81
204
208
526
xi2*ni
99
729
3468
5408
9704
x=
526
= 13.15 Bs.
40
S2 =
9704
(13.15) 2 = 69.6775 Bs.2
40
5. PROPIEDADES DE LA VARIANZA
Las propiedades de la varianza son las siguientes:
1ra Propiedad. La varianza de una constante es cero.
En smbolos:
V [k ] = 0
V[x + k ] = V[x ]
En smbolos:
Demostracin: V [ x + k ] = M [( x + k ) ( x + k )]2 = M [ x + k x k ]2 = M [ x x ]2 = V [ x ]
3ra Propiedad. La varianza de una variable por una constante es la varianza de la variable por la
constante al cuadrado.
V [k x ] = k 2 V [ x ]
En smbolos:
Demostracin: V [ k x ] = M [(kx k x ) 2 ] = M [ k 2 ( x x ) 2 ] = k 2 M [( x x ) 2 ] = k 2 V [ x ]
Ejemplo
Sea la distribucin de la cantidad de dinero que manejan los estudiantes de Ingeniera Industrial
y adems se sabe que el Centro de Estudiantes de esa carrera ha ofrecido:
a) Otorgar una subvencin de 2.5 Bs. a cada estudiante.
b) Ofrecer el 20% de su disponibilidad efectiva.
Cul de las dos polticas econmicas recomienda a sus compaeros y por qu?
Resolucin.
Es el mismo ejemplo desarrollado para hallar la media, varianza y desviacin estndar. Se
copian los valores hallados:
= 13.15 Bs.
S2 = 69.6775 Bs2
Empleando valores de la media y la varianza relativas a la variable ms una constante y a la
variable por una constante, se efecta un anlisis de las dos medidas de subvencin.
a) Aumentar a todos 2.50 Bs.
Se sabe que:
k = 1.2 = 1 + 0.2
M [k * x] = 1.2 * (13.15) = 15.78 Bs.
V [k * x] = k2 * V [x] = (1.2)2 * (69.6775) = 100.34 Bs2.
Para comparar los resultados de las dos distribuciones es conveniente usar una medida de
comparacin, que se llama coeficiente de variacin: CV, que mide la dispersin relativa
porcentual con respecto a la media (Se estudiar esta medida con ms detalle en el siguiente
168
captulo).
a) Aumentar a todos 2.5 Bs.
CV =
s
8.35
*100 =
*100 = 53.34%
x
15.65
CV =
s
10.02
*100 =
*100 = 63.48%
x
15.78
b) Aumentar el 20%.
Respuesta: Examinado el valor de las medias conviene el aumento del 20% aunque sea
pequea la diferencia. Observando el valor de la varianza se determina que conviene aumentar
a todos 2.5 por la gran diferencia que existe entre dichos valores. La varianza en la primera
medida, indica que el aumento beneficia a todos sin variar la diferencia de ingresos. En la
segunda medida para un aumento mas o menos semejante, la varianza indica que las
diferencias se hacen ms profundas (pobres se hacen ms pobres y los ricos se hacen ms
ricos). En consecuencia por un sentido de solidaridad y evitar mayores desigualdades, conviene
que el Centro de Estudiantes aplique la primera medida.
Otra forma de determinar la mejor poltica es observar los coeficientes de variacin. El menor
coeficiente de variacin es el que siempre conviene.
4ta Propiedad. Cuando una distribucin de frecuencias requiere ser connotada por la
importancia de sus grupos, se dice que la varianza total debe ser explicada por la variacin entre
grupos (intervarianza) y la variacin dentro los grupos (intravarianza), tal que:
(x
hi
x)2 n h i
Donde:
S2b =
Siendo:
i =1
S =
2
c
Siendo:
S
i =1
2
hi
nhi
(Media de las varianzas)
La utilidad que tiene la cuarta propiedad es muy grande. En general, se puede decir que si:
S2b > Sc2 , hay mayor variabilidad entre grupos que dentro de cada grupo. Por lo tanto los
grupos son distintos entre si, y constituyen estratos diferenciados de la poblacin.
169
S2c > S2b , hay mayor variacin dentro de cada grupo que entre grupos. Por lo tanto los grupos
son similares y pueden ser unidos en un solo grupo, que constituye la poblacin.
Esta propiedad constituye el fundamento del Anlisis de Varianza (ANOVA), que es muy
utilizada en el anlisis estadstico de experimentos.
Ejemplo
Sea la cantidad de dinero que disponen los estudiantes de Ingeniera Industrial por da:
xi
3
9
17
26
ni
11
9
12
8
40
x1i
3
9
x1i * n1i
33
81
114
S1 =
Se caracteriza as:
x1i2 * n1i
99
729
828
828 114
2
2
x 1 = 5.7 Bs.
170
2do Grupo:
n2i
12
8
20
x2i
17
26
x2i * n2i
204
208
412
x2i2 * n2i
3468
5408
8876
8876 412
2
2
S2 =
= 443.8 (20.6) = 443.8 424.36 = 19.44 Bs
20 20
2
Se caracteriza as:
xhi
5.7
20.6
xhi * nhi
114
412
526
xhi2 * nhi
649.8
8487.2
9137.0
9137 526
2
Sb =
= 55.5025 Bs
40 40
2
nhi
20
20
40
Shi2 * nhi
178.2
288.8
567.0
567
= 14.175 Bs 2
40
Por lo tanto:
S2 = Sb2 + Sc2 = 69.6775 Bs2.
171
El bajo valor de la intravarianza Sc2 = 14.175 Bs2., indica que la variacin distribuible de dinero
dentro de cada grupo es homognea.
El alto valor de la intervarianza Sb2 = 55.5025 Bs2., expresa que la variabilidad de dinero en
efectivo entre los grupos es fuerte. En consecuencia la alta variabilidad total del dinero en
efectivo en la distribucin depende de la variabilidad entre los grupos.
En consecuencia los dos grupos tienen caractersticas diferentes en cuanto a su disponibilidad
diaria de dinero. En consecuencia la media de los dos grupos diferenciados es ms
representativa que la media del grupo total.
6. VARIANZA ESPERADA
En toda distribucin de probabilidad, a fin de caracterizarla, adems de hallar la esperanza
matemtica, es necesario determinar o analizar la varianza esperada.
6.1. Determinacin
a) Funcin de cuanta
Si se tiene una funcin de cuanta, la varianza esperada se define de la siguiente manera:
2
i
siendo: x = 0, 1, 2, 3, ... n.
Ejemplo
Sea la siguiente funcin de cuanta: f ( x ) =
1
(2x + 1)
16
x = 0, 1, 2, 3
P(xi)
1/16
3/16
5/16
7/16
16/16
xi*P(xi)
0
3/16
10/16
21/16
34/16
1
(2x + 1)
16
xi2*P(xi)
0
3/16
40/16
63/16
106/16
106 34
V[x] =
= 2.11
16 16
S = 2.11 = 1.45
172
x = 0, 1, 2, 3
x=
34
= 2.125
16
b) Funcin de densidad
Si se tiene una funcin de densidad, la varianza esperada se define de la siguiente manera:
Ejemplo
Sea la siguiente funcin de densidad: f (x ) =
esperada.
1
(2x + 1 )
12
Resolucin
3 1
1
V [x ] = x (2x + 1 ) dx x (2x + 1 ) dx
12
0
0 12
3
3
1 2x 3 x 2 3
1 x4 x3
= +
+
12 2 3 0 12 3
2 0
1 81
9
1
= + 9 18 +
12 2
2
12
=
Luego:
1 99
2025 2376 2025 351
*( )
=
=
= 0.609
12
2
576
576
576
173
25%
25%
Q1
Q2 = Me
25%
Q3
AQ = Q3 Q1
donde el r - simo cuartil, se determina mediante:
rn
N i 1
Q r = L i 1 + 4
(a i )
ni
Esta ecuacin es una general de la que se ha deducido la ecuacin para el clculo de la
mediana.
D.Q. =
A.Q.
2
174
Figura 6.7.2
Disposicin de los centiles en una distribucin
10%
C10
A.Cn
.
40%
10%
40%
Q2 = C50 = Me
C90
rn
Ni1
100
Cr = Li1 +
(a i )
ni
7.4. Ejemplo
Una muestra de las cantidades quincenales invertidas en el plan de participacin de utilidades
de una compaa por parte de los empleados, se organiz en una distribucin de frecuencias
para su estudio (ver tabla 6.7.1).
Halle la amplitud cuartlica, la desviacin cuartlica y la amplitud centlica.
175
Tabla 6.7.1
Distribucin de frecuencias de inversin en un plan de participacin de utilidades
Li-1 - Li
30 35
35 40
40 45
45 50
50 55
55 60
60 65
65 70
ni
3
7
11
22
40
24
9
4
Ni
3
10
21
43
83
107
116
120
90 83
30 21
A.Q. = Q3 Q1 = 55 +
(5) 45 +
(5) = 56.46 47.04 = 9.42
24
22
Conclusin:
Cuartil 1: El 25% de los empleados invierten menos de 47.04 dlares en el plan, mientras que
el 75% restante aportan ms de ese valor.
Cuartil 3: El 75% de los empleados invierten menos de 56.46 dlares en el plan, mientras que
el 25% restante aportan ms de ese valor.
Amplitud cuartlica: El 50% central de los trabajadores aportan al plan entre 47.04 y 56.46
dlares.
Desviacin cuartlica:
D.Q. =
Q3 Q1 9.42
=
= 4.71
2
2
Amplitud centlica:
108 107
12 10
Conclusin:
Centil 10: El 10% de los empleados invierten menos de 40.91 dlares en el plan, mientras
que el 90% restante aportan ms de ese valor.
Centil 90: El 90% de los empleados invierten menos de 60.55 dlares en el plan, mientras
que el 10% restante aportan ms de ese valor.
Amplitud centlica: El 80% central de los trabajadores aportan al plan entre 40.91 y 60.55
dlares.
176
Valor menor
Q1
Me
Q3
Valor mayor
30
47.04
52.12
56.46
70
30
35
40
45
50
55
60
65
70
8. TEOREMA DE CHEVYSHEV
Se puede decir que si la desviacin estndar de un conjunto de datos es pequea, los valores
se concentran dentro de la media y si es amplia, los valores se acumulan en forma esparcida
alrededor de la media. Esta idea se expresa ms formalmente por medio del teorema de
Chevyshev, en honor a un matemtico ruso: Para cualquier conjunto de datos y cualquier
constante k mayor que 1, el porcentaje de los datos que debe caer dentro de k desviaciones
estndar de cualquier lado de la media es de por lo menos: 1
de que por ejemplo, como mnimo, 1
dentro de dos desviaciones estndar.
1
. As, se puede estar seguro
k2
1
= 75% de los valores de una distribucin debe caer
22
177
EJERCICIOS DE CLASE
Varianza y desviacin estndar
1. Halle la media aritmtica de los segundos ejemplos, del captulo de Distribucin de
Frecuencias.
Propiedades de la varianza
2. El gerente de una empresa que fabrica papel desea analizar los sueldos que paga a sus
trabajadores. Para ello, los dividi en tres grupos. Los datos en $ para cada grupo se
muestran a continuacin:
Grupo 1:
Li-1 - Li
180-200
200-220
220-240
Grupo 2:
ni
3
4
8
15
Grupo 3:
Li-1 - Li
240-260
260-280
280-300
ni
11
15
10
36
Li-1 - Li
300-320
320-340
340-360
ni
9
6
4
19
x
2
178
Numero de
personas
4
8
14
9
5
2
42
1-4
4-7
7-10
10-13
13-16
16-19
a) Halle la mediana.
b) Encuentre la amplitud y desviacin intercuartlica e interprtelas.
c) Determine la amplitud centlica.
d) Entre qu valores se encuentra el 80% central de la distribucin?.
e) Realice un diagrama de caja y bigotes e interprete su significado.
179
EJERCICIOS PROPUESTOS
1. Los sueldos en $us de 5 empleados de la Alcalda de Cochabamba son:
176
200
170
196
210
215
180
ni
8
16
24
48
22
14
11
7
13 - 19
12%
11 - 13
18%
5 - 11
28%
a) Halle la media y la varianza de la distribucin. Cul es el sueldo mximo del 75% de los
trabajadores?.
b) Considere dos grupos de trabajadores (el primer grupo formado por 30 trabajadores y el
segundo por 20) y determine si es la intra o la intervarianza la que influye ms en la
variabilidad total de la distribucin.
181
ni
hi
Ni
Hi
xi
xi*ni
30
60
8
- 28
Totales
a) Debido a la crisis energtica del petrleo, el ministerio de gobierno deba tener esta
informacin cuanto antes para tomar la decisin de incrementar la eficiencia de los autos
de alguna manera. Puede ayudarlo a reconstruir la tabla?.
Q1 = 7.4
Me = 11.04
A.Cn. = 17.34.
y C10 = 4.76:
y Mo = 9.4194:
C90:
Fila 2
Fila 3
Fila 6
b) Si los autos que tienen una eficiencia entre 0 - 4 km/lt y entre 4' - 8, constituyen el 25% del
total, el ministerio exigir que estos autos salgan de circulacin. Si no, quiere decir que el
problema de los autos no afecta sustancialmente a la poltica de ahorro energtico. Cul
es la decisin que debe tomar el ministerio?.
c) Cul es el porcentaje de prdida del gobierno en esta muestra, si por cada auto que saca
de circulacin debe pagar a los propietarios 2000 $us., pero el ahorro energtico se
traduce en una ganancia por auto del 40% de lo que paga?
3. La secretaria de una empresa de envasado de alimentos olvid comprar el cartucho de tinta
para la impresora de su oficina y al imprimir la distribucin de frecuencias de los pesos del
contenido de un cierto nmero de latas (gr.) que fueron llenadas por una mquina automtica
182
que se crea que estaba descalibrada, muchos datos eran ilegibles. A continuacin se
muestra la distribucin:
Li-1 - Li
ni
hi
Ni
Hi
xi
135
xi*ni
140 20
9
410
Totales
66
a) El gerente a cargo deba tener esta informacin cuanto antes para tomar la decisin de
llamar a la compaa de mantenimiento para que realicen una recalibracin de la mquina.
Puede ayudarlo a reconstruir la tabla?
Q1 = 153.25: Fila 3
A.Q. = 21.75
C10 = 145.75: Fila 2
C90 = 187.7143: Fila 6
183
CAPTULO 7
ESTADGRAFOS DE COMPARACIN
1. INTRODUCCIN
En muchos casos de distribuciones de frecuencias de una variable, stas no son comparables
utilizando la medias y la varianzas respectivas, por las distintas unidades en que estn
expresadas las variables. Entonces es necesario construir indicadores que no estn influidos por
dichas unidades. En este caso se construyen razones tales como el coeficiente de variacin y la
variable tipificada o estandarizada como instrumentos que permiten comparar entre
distribuciones de frecuencias de una variable.
2. COEFICIENTE DE VARIACIN
2.1. Definicin
El coeficiente de variacin permite expresar la dispersin de la distribucin de frecuencias por
unidad de media aritmtica. Este coeficiente se obtiene dividiendo la desviacin estndar entre
la media aritmtica. Se simboliza por el coeficiente CV y su expresin es:
CV =
s
x
En general este coeficiente se usa cuando los valores de las medias aritmticas y las varianzas
entre dos distribuciones no son iguales. Permite determinar la dispersin relativa porcentual o el
grado de homogeneidad de una distribucin. El mayor valor del coeficiente de variacin expresa
una mayor dispersin en la distribucin. Si se expresa en porcentaje sus valores van desde 0 al
100.
Ejemplo
Se va a comparar la variacin de los ingresos anuales de ejecutivos con la variacin en los
ingresos de trabajadores no calificados. Cmo procedera? Los resultados en miles de $, son:
Ejecutivos :
x = 500
s = 50
Trabajadores :
x = 12
s = 1.2
Resolucin
Se procede hallando los coeficientes de variacin de ambas distribuciones:
CVE =
50
*100 = 10%
500
CVT =
1.2
*100 = 10%
12
zi =
xi x
s
Se puede comprobar que el cambio de variable z, hace que la media sea 0 y la desviacin uno:
x M [ x i ] M [x ] x x 0
1) M [z i ] = M x i
=
=
= =0
s
s
s
s
2
x 1
s
2) V [z i ] = V x i
=
V
[
x
]
=
=1
x
i
2
2
s s
s
La variable tipificada se usa para determinar la posicin relativa entre los valores
correspondientes a distribuciones de frecuencias diferentes.
La variable tipificada o estandarizada es un cambio de variable fundamental en la inferencia
estadstica, porque constituye la base del muestreo a travs del teorema central del lmite.
Ejemplo
En fsica, la nota media es 63 con una desviacin estndar de 12. En matemticas, la nota
media es de 75 con una desviacin estndar de 15. Un estudiante obtuvo en ambas materias
55. En cul de las dos materias tiene una mejor posicin relativa como estudiante?
Se procede de la siguiente manera:
Se determina para cada distribucin la variable tipificada.
a) Fsica z Fi =
55 63 8 2
=
=
= 0.67 (mejor)
12
12 3
b) Matemticas z M i =
55 75 20 4
=
=
= 1.33
15
15
3
Conclusin: El estudiante tiene una mejor posicin relativa como alumno en la materia de fsica.
185
EJERCICIOS DE CLASE
Coeficiente de variacin
Distribucin de frecuencia
1. Halle los coeficientes de variacin de los segundos ejemplos, del captulo de Distribucin de
Frecuencias.
Funcin de cuanta
2. Sea la siguiente funcin de cuanta: f (x) = e x x = 0,1, 2,3, 4,5 , que determina la
probabilidad de la demanda diaria de un artculo que se vende a 2 $us. la unidad. Determine
el coeficiente de variacin.
Funcin de densidad
x
2
186
EJERCICIOS PROPUESTOS
1. Un conjunto de 20 valores tiene una media igual a 50; otro conjunto de 20 valores tiene una
media igual a 30; la desviacin estndar de los 40 valores considerados conjuntamente es
igual a 10. Calcule el coeficiente de variacin del conjunto de los 40 nmeros.
2. Multiplicando por 2 cada uno de los valores de la variable x: 3, 2, 0, 5, se obtiene la serie y: 6,
4, 0, 10. Compruebe que ambas series tienen el mismo coeficiente de variacin.
3. Se recopil informacin acerca de las ventas anuales de 50 pequeas tiendas de tornillos:
Ventas
(miles de $)
110
130
140
150
160
Total
N0 de
negocios
7
9
16
15
3
50
Distribucin B
Li-1 - Li
ni
4-8
10
8 - 12
12
12 - 16
14
16 - 20
20
20 - 24
21
5. Una distribucin A tiene una media aritmtica que es doble a la de una distribucin B, y una
desviacin estndar que es la mitad de la de B. Qu relacin existe entre sus grados de
dispersin?
6. Se ha determinado en un grupo de estudiantes que sus matrculas en decenas de Bs. es
como sigue:
8
9
7
4
12
Un segundo grupo tiene como gasto en matrcula los siguientes datos:
6
10
Qu posicin relativa tendr un gasto en matrcula del primer grupo de 90 Bs., frente a un
gasto de 70 Bs. del segundo grupo?
187
188
30
70
100
60
90
El segundo B grupo:
50
80
90
70
60
Cul de los grupos tiene menor dispersin por unidad de media aritmtica?
2. Antes de construir la presa de Misicuni, el cuerpo de ingenieros de la Empresa ICE realiz
una serie de pruebas para medir el flujo de agua que pasa por el lugar de la presa. Los
resultados de la prueba se utilizaron para construir la siguiente distribucin de frecuencias de
amplitudes constantes:
Flujo de
agua (lt/min)
ni
Ni
hi
Hi
xi
7
60
49
41
11
Totales
Reconstruya la tabla, teniendo la siguiente informacin adicional:
Amplitud = 50
Fila 5 = Clase mediana y modal.
Mediana = 1212.069
Moda = 1222.778
Centil 10 = 1091.9048
Fila 2 = Clase del centil 10.
n5 + n6 = n - 147
189
xi*ni
xi2*ni
CAPTULO 8
ESTADGRAFOS DE FORMA: GRADO DE CONCENTRACIN
ASIMETRA Y CURTOSIS
1. INTRODUCCIN
Las medidas de forma permiten conocer que forma tiene la curva que representa la serie de
datos de una distribucin de frecuencias. En concreto, podemos estudiar las siguientes
caractersticas de la curva:
a) Asimetra: mide si la curva tiene una forma simtrica, es decir, si respecto al centro de la
misma (centro de simetra) los segmentos de curva que quedan a derecha e izquierda son
similares.
b) Curtosis: mide si los valores de la distribucin estn ms o menos concentrados alrededor
de los valores medios de la muestra.
2. ASIMETRA
2.1. Definicin
La asimetra de una distribucin puede ser determinada mediante las siguientes reglas:
Si una distribucin de frecuencias es simtrica, se dice que no tiene sesgo o su sesgo es
nulo.
Se dice que una distribucin presenta sesgo positivo cuando la media es mayor que la
mediana o moda, debido a observaciones grandes.
Se dice que una distribucin presenta sesgo negativo cuando la media es la menor de los
tres promedios, por observaciones pequeas.
Un diagrama que muestra los diferentes grados de simetra es el representado en la figura 8.2.1.
Figura 8.2.1. Tipos de asimetra de una distribucin
Eje de simetra
Asimtrica Positiva
Eje de simetra
Curva simtrica
2.2. Determinacin
190
Eje de simetra
Asimtrica Negativa
C.A. =
3(x Me)
s
3 C.A. 3
C.A. =
3(28 25)
= 2.14
4.2
3. CURTOSIS
3.1. Definicin
La curtosis mide el grado de agudeza de una distribucin. Analiza el grado de concentracin que
presentan los valores alrededor de la zona central de la distribucin.
Se definen 3 tipos de distribuciones segn su grado de curtosis:
Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de los valores
centrales de la variable (el mismo que presenta una distribucin normal).
Distribucin leptocrtica: presenta un elevado grado de concentracin alrededor de los valores
centrales de la variable.
Distribucin platicrtica: presenta un reducido grado de concentracin alrededor de los valores
centrales de la variable.
Un diagrama muestra de manera objetiva los distintos grados de curtosis (ver la figura 8.3.1)
Eje de simetra
Eje de simetra
Eje de simetra
Leptocrtica
(Delgado)
Platicrtica
(Aplanado)
Mesocrtica
(Intermedio)
3.2. Determinacin
El Coeficiente de Curtosis viene definido por la siguiente frmula:
g2 =
1 n
(x x)4 ni
n i =1 i
1 n
2
n (x i x) n i
i =1
x=
37.6
= 1.253
30
1
(0.00004967)
30
g2 =
3 = 1.3947
2
1
30 (0.03046667)
192
x i n i (x i x) 2 n i (x i x) 4 n i
xi
1.2
ni
1
1.21
1.22
1.23
1.24
1.25
2.5
1.26
1.27
1.28
1.29
1.2
0.00284444 0.00000809
0.00002222 0.00000000
1.3
3 3.9 0.00653333 0.00001423
Totales 30 37.6 0.03046667 0.00004967
x Mo = 3(x Me)
Ejemplo
En Cochabamba existe una empresa que cra truchas en forma comercial. La gerencia est
interesada en la longitud y peso de las truchas y continuamente toma muestras de los
estanques. Una muestra del estanque n 42 revel que la longitud modal es 12 pulgadas y la
media de 12.9 pulgadas. Cul es la mediana aproximada de las longitudes?
Resolucin
Si se supone que la distribucin de la longitud de las truchas de ese estanque tiene forma
campanoide, es unimodal y moderadamente asimtrica, entonces la longitud mediana es:
A continuacin se presenta un rbol que resume toda la informacin vertida en los captulos 5
8, que ayudar al investigador a decidir los estadgrafos adecuados para el resumen de las
distribuciones en las que est trabajando (ver figura 8.5.1 de elaboracin propia).
194
Variable
Cuantitativa
Caracterstica de
la poblacin
Cualitativa
Atributo
Aleatorio
Tipo de
experimento?
Tipo I
Ordinal
Nominal
Decimales
Continua
Discreta
Variables
Tipo de valores?
Enteros
Tipo III
Intervalos?
Constantes
Valores? - variables?
Muchos-Pocos Tipo II
Muchos-Muchos
Determinstico
Pocos-Pocos
Si
Existe jerarqua?
No
i =1
i =1
Me
1 195
Mo
2
f( x i ) dx
x + x i+1
Me = i
2
f (x) dx =
E [x ] =
Me = x i
i=1
Mo
n i+1
a i+1
Mo = L i1 +
(a i)
n i+1 + n i 1
a i+1 a i 1
n
Ni 1
Me = Li 1 + 2
(a i )
ni
E [x ] = x i P (x i )
+1
x i + x i+1
2
G = n x ini
Me =
Mo
i =1
G = n xi
Me =
xn + xn
n i+1
Mo = L i 1 +
(a i )
n i+1 + n i 1
n
H= n
ni
i=1 x i
Me = x i
x=
n
1
i=1 x i
x n
H=
Me = x n +1
x=
i =1
Mediana
Moda
Moda
Posicin
x 2i x i
n
n
AQ = Q3 Q1
V [x ] = x 2 f(x) dx [ x ]
AQ = Q3 Q1
i =1
AQ = Q3 Q1
AQ = Q3 Q1
x i 2 n i xi ni
n
n
V[x] = x i2P(xi ) [ x ]
S=
AQ = Q3 Q1
S=
AQ = Q3 Q1
Dispersin
s
x
s
x
s
x
s
x
s
x
s
x
CV =
CV =
CV =
CV =
CV =
CV =
Comparacin
C.A. =
C.A. =
C.A. =
C.A. =
C.A. =
C.A. =
3(x Me)
s
2
n (x i x) n i
i=1
3(x Me) g 2 =
1
s
1 n
(x x)4 n i
n i=1 i
2
n (x i x) n i
i=1
1 n
(x x)4 n i
n i=1 i
2
n (x i x) n i
i=1
3(x Me) g =
2
1
s
3(x Me)
s
Curtosis
1 n
(x x)4 n i
n i=1 i
3(x Me) g =
2
1
s
3(x Me)
s
Asimetra
EJERCICIOS DE CLASE
Asimetra
1. Halle el coeficiente de asimetra de los segundos ejemplos, del captulo de Distribucin de
Frecuencias.
Curtosis
2. Halle el coeficiente de curtosis de los segundos ejemplos de las distribuciones tipo III, del
captulo de Distribucin de Frecuencias.
Ejercicio adicional
3. En muchos procesos de manufactura hay un trmino llamadotrabajo en proceso (abreviado
WIP, por sus siglas en ingls de work-in-process) En una planta manufacturera de libros esto
representa el tiempo que se necesita para doblar, unir, coser, proteger con guardas, y
encuadernar las hojas que salen de la prensa. Los siguientes datos representan muestras de
20 libros en dos plantas de produccin y el tiempo de procesamiento (definido como el tiempo
en das contado desde que el libro llega a las prensas hasta que se empaca en cajas) para
estas actividades.
Planta A
5.62
11.62
5.29
7.29
16.25
7.50
10.92
7.96
11.46
4.42
21.62
10.50
8.45
7.58
8.58
9.29
5.41
7.54
11.42
8.92
Planta B
9.54
5.75
11.46 16.62
12.46 9.17
12.62
13.21
25.75
6.00
196
15.41
2.33
EJERCICIOS PROPUESTOS
1. Una distribucin es moderadamente asimtrica. Calcule la moda sabiendo que su media es
igual a 3 y que la diferencia entre la media y la mediana es igual a -2.
2. Un estudio de las ventas netas de una muestra de pequeas empresas revel que las ventas
netas tienen una media de 2.1 millones de $, una mediana de 2.4 millones de $ y una moda
de 2.6 millones de $. La desviacin estndar de la distribucin es 500000 $.
La distribucin de las ventas netas es simtrica o asimtrica, de sesgo negativo o positivo?
3. En la distribucin que sigue se contaron los ingresos mensuales de empleados de tiempo
parcial.
Ingresos semanales
($us)
40 - 50
50 - 60
60 - 70
70 - 80
80 - 90
90 - 100
100 - 110
110 - 120
ni
8
16
24
48
22
14
11
7
197
Ao 1999:
ni
9
10
1
20
Ao 2000:
Li-1 - Li
70-80
80-90
90-100
Li-1 - Li
70-80
80-90
90-100
ni
1
15
9
25
ni
1
4
10
15
Lnea 1
238.1
240.0
241.5
3.0
1.9
Lnea 2
240.0
240.0
240.0
0.4
0.2
Lnea 3
242.9
240.0
239.1
3.9
2.2
1.0
100
0.1
150
1.7
250
Fabricante A
835.25
3135.14
891.25
Fabricante B
985.10
2063.44
970.33
Fabricante C
942.75
1878.56
949.00
Fabricante D
1097.72
2673.54
1087.00
Los fabricantes quieren formar una alianza. Han contratado a un asesor en Estadstica para
que les ayude en el tratamiento de los datos, su interpretacin y acciones a tomar. La
informacin que necesitan saber es:
a)
b)
c)
d)
ni
hi
Ni
Hi
xi
xi*ni
12.5
20
40
xi2*ni
Me = 18.75
Q1 = 15.625
Mo = 18.90625
Los tres en Fila 4
Q3 = 23 (Fila 5)
Amplitud = 5 (constante)
Media = 18.7
75
Totales
100
a) Complete la distribucin del tiempo de espera de los clientes del Banco BISA.
b) El gerente quiere tomar una decisin en base a los datos estadsticos. Por eso, ha decidido
que si el rango de tiempo de espera del 60% central de los clientes es mayor a 20 minutos, el
banco tendr que realizar un estudio de teora de colas para optimizar este proceso. Qu
decisin debe tomar el gerente?
CASO DE ESTUDIO
SPRINGVILLE HERALD
199
FASE 5
Walter Fairfax, jefe del departamento de servicios de cmputo, not que adems de la tabla y
grfica preparadas con base en la tabla SH2.4, con relacin a la cantidad de cartuchos que son
accesados, se necesitaran varias medidas descriptivas de resumen relativas a ubicacin,
variacin y sesgo para que los informes proporcionados a la administracin fueran ms tiles.
Ejercicios
a)
b)
c)
d)
200
CAPTULO 9
ESTADSTICA BIDIMENSIONAL
DISTRIBUCIN DE FRECUENCIAS DE DOS VARIABLES,
ATRIBUTOS O MIXTAS
1. INTRODUCCIN
Se ha estudiado hasta el momento los mtodos estadsticos que hacan referencia a
estadsticas de carcter cuantitativo de una sola variable o unidimensionales o de carcter
cualitativo, insistiendo particularmente en su representacin grfica y en la obtencin de
frmulas para el clculo de sus medidas ms representativas.
Determinada la poblacin correspondiente a un problema tcnico, econmico o social, los datos
correspondientes pueden ser organizados considerando dos o ms variables o atributos,
ampliando los conceptos hasta ahora utilizados para el caso de una sola variable o atributo.
Las parejas de valores, as obtenidas por observacin conjunta, podrn o no repetirse un
nmero determinado de veces.
La presentacin de los datos as elaborados, forman una distribucin bidimensional (si se trata
de atributos se denomina tabla de contingencia, y si se mezcla una variable con un atributo se
dice que es una bidimensional mixta) o ampliando el concepto a ms variables, forman una
distribucin multidimensional.
Variables o atributos
Nmero de
observaciones
Pequeo
Grande
Grande
Tipo I
Tipo II
Tipo III
Nmero de
valores diferentes
Pequeo
Pequeo
Grande
yi
y1
y2
y3
:
ys
El valor del universo, poblacin o colectivo, es la suma de los valores de frecuencia absoluta
bidimensional, tal que:
r
n = n ij
i=1 j=1
xi
x1
x2
:
xr
Total
y1
Y2
...
ys
n11
n21
:
nr1
n12
n22
:
nr2
...
...
:
...
n1s
n2s
:
nrs
Total
n =
n ij
i =1 j =1
n ij
n
relativas.
Nota 2: La distribucin bidimensional expresada en frecuencias absolutas conjuntas, puede ser
escrita en forma de frecuencias absolutas conjuntas acumuladas bidimensionales, cuando los
nij se sustituyen por:
i*
j*
N i* j* = n ij
i=1 j=1
j*
H i j = h ij
* *
i=1 j=1
203
Ejemplo
Frecuencias absolutas conjuntas:
Sea la siguiente distribucin bidimensional de frecuencias absolutas conjuntas (n ij) (ver tabla
9.2.4):
Tabla 9.2.4
Bidimensional horas de TV al da vs. edad de los nios (n ij)
yi
xi
5
7
9
Total
Total
8
1
4
13
4
3
5
12
2
6
7
15
14
10
16
40
Fila 1, columna 1: 8 de 40 nios tienen 5 aos de edad y ven 1 hora de televisin al da.
Fila 3, columna 2: 5 de 40 nios tienen 9 aos de edad y ven 3 horas de televisin al da.
Fila 2: 10 de 40 nios tienen 7 aos.
Columna 2: 12 de 40 nios ven 3 horas de televisin al da.
Frecuencias relativas:
De acuerdo a la nota 1, se determinar la distribucin bidimensional de frecuencias relativas
conjuntas (hij), expresadas en porcentaje (ver tabla 9.2.5):
Tabla 9.2.5
Bidimensional horas de TV al da vs. edad de los nios (h ij)
xi
yi
5
7
9
Total
Total
20.0
2.5
10.0
32.5
10.0
7.5
12.5
30.0
5.0
15.0
17.5
37.5
35.0
25.0
40.0
100.0
da.
Fila 3, columna 2: El 12.5% de los nios tienen 9 aos de edad y ven 3 horas de televisin al
da.
Fila 2: El 25% de los nios tienen 7 aos.
Columna 2: El 30% de los nios ven 3 horas de televisin al da.
Frecuencias absolutas acumuladas conjuntas:
De acuerdo a la nota 2, se determinar la distribucin bidimensional de frecuencias absolutas
acumuladas (Nij) (ver tabla 9.2.6):
Tabla 9.2.6
Bidimensional horas de TV al da vs. edad de los nios (Nij)
yi
xi
5
7
9
8
9
13
12
16
25
14
24
40
xi
5
7
9
20.0
22.5
32.5
30.0
40.0
62.5
35.0
60.0
100.0
Fila 3, columna 2: 62.5% de los nios tienen como mximo 9 aos de edad y ven a lo ms 3
horas de televisin al da.
xi
n x i = n ij
j=1
x1
x2
xr
n xr = n rj = n r1 + n r2 + . . . + n rs
j=1
s
j=1
s
j=1
r
n = n ij
i=1 j=1
yi
ny j = n ij
i=1
r
y1
n y1 = n i1 = n11 + n 21 + . . . + n r1
y2
n y2 = n i2 = n12 + n 22 + . . . + n r2
yr
n ys = n is = n1s + n2s + . . . + n rs
i=1
r
i=1
r
i=1
n = n ij
i=1 j=1
Nota
Determinadas las distribuciones marginales, mediante relaciones de clculo conocidas pueden
determinarse cualquiera de los estadgrafos si se est caracterizando una variable:
de posicin (moda)
Ejemplo
Sea la siguiente distribucin bidimensional de frecuencias absolutas (n ij):
yi
xi
5
7
9
Totales
donde:
Totales
8
1
4
13
4
3
5
12
2
6
7
15
14
10
16
40
Prescindiendo de la variable x:
ni
14
10
16
40
yi
1
3
7
ni
13
12
15
40
Su organizacin, si se trata de presentar una distribucin de frecuencias tipo III con intervalos
constantes para las dos variables, requiere:
Calcular el recorrido de ambas variables.
Establecer el nmero de clases para cada variable.
Determinar la amplitud de clase para cada variable dividiendo el recorrido entre el nmero
de clases fijado.
Si la presentacin es con intervalos no constantes, se requiere:
Definir el recorrido de ambas variables.
Establecer los intervalos de clase y su nmero segn las exigencias del estudio o la
resolucin del problema.
Su presentacin general se efecta de la siguiente manera (ver tabla 9.2.9).
Tabla 9.2.9
Distribucin bidimensional tipo III
yj -1 - yj
xi -1 - xi
xo - x1
x1 - x2
x2 - x3
:
xr-1 - xr
Total
yo - y1
y1 - y2
y2 - y3
...
ys-1 - ys
n11
n21
n31
:
nr1
n12
n22
n32
:
nr2
n13
n23
n33
:
nr3
...
...
...
:
...
n1s
n2s
n3s
:
nrs
Total
n = n ij
i =1 j=1
1
19
11
20
15
20
6
19
0
18
208
3
20
12
19
10
18
6
20
5
19
xi:
yi:
xi:
yi:
xi:
yi:
xi:
yi:
2
20
1
20
0
20
0
20
0
19
8
18
1
19
15
18
1
20
4
19
5
20
2
20
6
18
6
20
3
20
14
19
0
20
7
19
4
20
4
20
2
19
5
18
3
20
1
18
4
20
7
20
10
19
5
19
2
19
1
20
13
18
4
20
5
20
10
20
2
20
8
20
11
18
3
19
2
18
4
19
Organice los datos en un cuadro bidimensional de frecuencias acumuladas relativas H i,j (%), de
forma de poder contestar:
a) Qu porcentaje de los alumnos que tienen a lo ms 19 aos, consumen como mximo 10
cigarrillos?
b) Qu porcentaje de los alumnos, tienen como mximo 20 aos y consumen como mximo 5
cigarrillos?
Resolucin
Determine para cada variable si la distribucin es de intervalos constantes o no.
En este caso, como se debe contestar preguntas especficas, las dos variables son de
intervalos no constantes.
Defina el recorrido de ambas variables.
Rx = 15 - 0 = 15
Ry = 20 - 18 = 2
Establezca los intervalos de clase y su nmero segn las exigencias del estudio o la
resolucin del problema.
Para x:
Para y:
0-5
18
5 - 10
19
10 - 15
20
(Tipo III)
(Tipo II)
yi
0-5
5 - 10
10 - 15
Total
18
19
20
Total
4
3
3
10
10
3
2
15
18
5
2
25
32
11
7
50
xi
0-5
5 - 10
10 - 15
Total
18
19
20
Total
8
6
6
20
20
6
4
30
36
10
4
50
64
22
14
100
xi
0-5
5 - 10
10 - 15
18
19
20
8
14
20
28
40
50
64
86
100
0
B
2
N
2
B
3
M
1
N
2
M
0
B
3
M
3
N
0
N
1
N
1
M
0
B
3
M
1
N
1
N
2
N
1
B
1
B
2
N
3
N
2
N
Primero se debe tabular los datos en una distribucin de frecuencias absolutas conjuntas
(ver tabla 9.2.13). Se tiene un atributo ordinal: clasificacin del examen con tres
modalidades, y una variable discreta tipo II, con 4 valores diferentes de la variable; por lo
cual la bidimensional es mixta.
Tabla 9.2.13
Bidimensional clasificacin de examen vs. errores cometidos (n i,j)
Errores
cometidos
0
1
2
3
Totales
Totales
4
7
6
5
22
Luego se procede a determinar los cuadros faltantes y a responder a las preguntas (ver
tablas 9.2.14-16).
a) Con el cuadro ni,j, se puede saber que tres montadores de los 22, cometieron 3 errores y
obtuvieron una calificacin de malo.
Tabla 9.2.14
Bidimensional clasificacin de examen vs. errores cometidos (h i,j)
Errores
cometidos
0
1
2
3
Totales
Totales
18.18
31.82
27.27
22.73
100.00
211
Tabla 9.2.15
Bidimensional clasificacin de examen vs. errores cometidos (Ni,j)
Errores
cometidos
0
1
2
3
d) Con el cuadro Hi,j, se puede saber que el 68.18% de personas obtuvieron en su examen una
calificacin de por lo menos normal y cometieron como mximo 2 errores.
3. COVARIANZA
3.1. Definicin
El grado de dependencia o relacin entre las variables de una distribucin bidimensional, se
determina mediante la covarianza. Se define como la media del producto de las desviaciones
de los valores de cada variable respecto de su media aritmtica.
El signo de la covarianza define la naturaleza de la asociacin:
Si es positiva, se dice que existe relacin directa entre las variables (aumento o disminucin
en x implica aumento o disminucin en y).
Si es negativa, indica relacin inversa entre las variables.
Si es cero, no existe ninguna relacin entre las variables.
Cuanto ms alejado est el valor de la covarianza hallado de cero, la relacin entre las
variables ser ms intensa.
212
3.2. Determinacin
a) Tipo I
La covarianza se simboliza por el signo S xy y se define de la siguiente manera para
distribuciones tipo I:
n
(x
Sxy =
x )( yi y)
i =1
Sxy =
(x
x )( yi y)
n
Sxy =
x
n
yi
(x
yi y x i x yi + x y)
n
yx xy + xy =
Sxy =
x
n
n
yi
yi
yx =
yi
x
n
yi
x
n
y
n
nx y
n
x i yi
n
n
x i yi
n
n
Ejemplo
Sea una variable bidimensional tipo I que relaciona unidades vendidas (miles de artculos) con
utilidades (miles de $us.):
xi
yi
(unidades) (Utilidades)
1
20
2
40
3
70
4
80
5
100
Halle la relacin de asociacin entre las ventas y las utilidades de la empresa.
Resolucin
Con ayuda de la tabla bidimensional tipo I, se obtienen las sumatorias adecuadas, segn la
ecuacin para hallar la covarianza (ver tabla 9.3.1):
213
Tabla 9.3.1
Clculo de la covarianza en distribuciones tipo I: Utilidades vs unidades vendidas
xi
1
2
3
4
5
15
yi
20
40
70
80
100
310
xi*yi
20
80
210
320
500
1130
Sxy =
1130 15 310
= 40
5
5 5
Conclusin: Como el valor de la covarianza es positivo y est alejado del cero, se puede decir
que existe una relacin directa intensa entre las unidades vendidas y las utilidades de la
empresa.
b) Tipo II o III
La frmula de definicin para distribuciones tipo II es:
n
( x x) * ( y y ) * n
i
i =1
Sxy =
Para clculos:
Sxy =
yi n i
x i n i yi n i
n n
Ejemplo
Halle la covarianza de la siguiente distribucin bidimensional de frecuencias absolutas:
yi
Total
5
7
9
Total
8
1
4
13
4
3
5
12
2
6
7
15
14
10
16
40
xi
214
Donde:
x = edad de los nios
y = horas frente al televisor
Resolucin
Se unidimensionaliza la distribucin (ver tabla 9.3.2).
Tabla 9.3.2
Clculo de la covarianza en distribuciones tipo II: horas de TV vs edad
xi
5
5
5
7
7
7
9
9
9
yi
1
3
7
1
3
7
1
3
7
ni
8
4
2
1
3
6
4
5
7
40
xi * ni
40
20
10
7
21
42
36
45
63
284
yi * ni
8
12
14
1
9
42
4
15
49
154
xi * yi * ni
40
60
70
7
63
294
36
135
441
1146
Sxy =
= 1.315
40 40 40
Conclusin: Como la covarianza es positiva, pero el valor es cercano a cero, se puede decir
que existe una relacin directa dbil entre la edad de los nios y las horas que ven televisin al
da.
c) Bidimensionales de atributos o mixtos
Si se tiene una tabla de contingencia, tambin se puede determinar el grado de asociacin
entre atributos o series mixtas.
Cuando entre dos atributos no existe ninguna influencia mutua, se dice que son
independientes. En caso contrario se dice que hay asociacin o dependencia.
Para fundamentar, aunque sea de una forma simple el razonamiento que sigue, vamos a
suponer una distribucin de dos atributos cada uno de los cuales toma dos modalidades
distintas (ver tabla 9.3.3):
215
Tabla 9.3.3
Distribucin bidimensional de atributos o mixtas
A
a1
a2
Total
n11
n12
n1i
n21
n22
n2i
ni1
ni2
n
B
b1
b2
Total
n 11
n 21
=
n1i n 2i
i
n 21
=
n 2i
i
n 11 + n 21
=
n 1i + n 2i
i
i1
y finalmente que:
n n
2i
n 21 =
i1
De otra forma, diremos que existir independencia entre dos modalidades a y b cuando:
n ab =
na nb
n
siendo aqu n ab el nmero de elementos que poseen las dos modalidades a y b conjuntamente,
na el nmero de los que poseen la modalidad a y nb el de los que poseen la modalidad b.
Tngase en cuenta que no es necesario que dicha igualdad se cumpla estrictamente: desde el
punto de vista estadstico, basta con que la diferencia entre los dos miembros sea
relativamente pequea.
La asociacin entre dos modalidades ser, de tipo positivo si:
216
n ab
na nb
>0
n
n ab
na nb
<0
n
y negativo si:
>
atraccin
na nb
n ab =
: independen cia
n
<
repulsin
Ejemplo
Se realiz una encuesta a 30000 habitantes de una determinada ciudad. Se obtuvo la siguiente
distribucin en cuanto a su estado civil y sexo (ver tabla 9.3.4).
Tabla 9.3.4
Bidimensional de estado civil vs sexo
Estado civil
Sexo
Masculino
Femenino
Total
Soltero
Casado
Viudo
Total
8052
8384
16436
5815
5989
11804
542
1218
1760
14743
15257
30000
Se realizan los clculos correspondientes, para cada combinacin de modalidades entre los
dos atributos.
(14743)(16436)
= 8077 (independie nte)
30000
(14743)(11804)
n M C (5815) =
= 5801 (independie nte)
30000
(14743)(1760)
n M V (542) =
= 865 (repulsin )
30000
n M S (8052) =
217
(15257)(16436)
= 8359 (independie nte)
30000
(15257)(11804)
n F C (5989) =
= 6003 (independie nte)
30000
(15257)(1760)
n F V (1218) =
= 895 (atraccin)
30000
n F S (8384) =
y1
y2
...
ys
n11
n21
:
nr1
n12
n22
:
nr2
...
...
:
...
n1s
n2s
:
nrs
Total
xi
x1
x2
:
xr
Total
n = n ij
i=1 j=1
donde:
P ij =
n ij Casos favorables
=
n
Casos posibles
Pij se lee como probabilidad del evento (xi, yj), que es la probabilidad conjunta; es decir la
probabilidad de que los sucesos xi y yi ocurran al mismo tiempo.
Utilizando la informacin de la tabla de eventos o sucesos, dispuestos en forma de una
distribucin bidimensional, se pueden determinar las siguientes reglas de composicin.
218
P ( x i ) = P ( x i, y j ) =
j=1
n i1 n i2 n i3
n
+
+
+ . . . + is
n
n
n
n
P( x i ) = P ( x i , y 1 ) + P ( x i , y 2 ) + K + P( x i , y s )
Si se trata de la probabilidad marginal de yj, el clculo se efecta de la siguiente manera:
r
P ( y j ) = P ( x i, y j ) =
i=1
n1j n 2j n 3j
n
+
+
+ . . . + rj
n
n
n
n
P( y j ) = P ( x 1 , y j ) + P ( x 2 , y j ) + K + P ( x r , y j )
La distribucin marginal (o normal), es la probabilidad de ocurrencia de un evento simple.
P( x y ) = P ( x ) + P ( y )
donde x y y son sucesos mutuamente excluyentes y sus probabilidades son marginales.
b) Regla de adicin para dos sucesos cualquiera
P( x y ) = P ( x ) + P ( y ) P ( x , y )
siendo P(x, y) la probabilidad conjunta.
Nota: Para resolver problemas de adicin de eventos en general, debe utilizarse la regla
correspondiente a dos sucesos cualesquiera, salvo que se tenga como dato que los sucesos
sean mutuamente excluyentes.
Para entender mejor la regla de adicin de eventos se usan los diagramas de Venn
(investigador ingls, 1834-88), que son representaciones grficas de los resultados de un
experimento aleatorio. Para elaborar un diagrama de Venn, se representa al espacio muestral
por un rectngulo, mientras que los eventos aparecen como regiones dentro del rectngulo,
generalmente en forma de crculos.
219
Las regiones sombreadas de los cuatro diagramas de Venn de la figura 9.4.1, representan
respectivamente: el evento A, su complemento, la unin de los eventos A y B y la interseccin
de A y B (para sucesos que no son mutuamente excluyentes y para los que si son).
Figura 9.4.1. Diagramas de Venn
A
A
S
A
AB
AB
A y B no son mutuamente excluyentes
AB
AB
A y B son mutuamente excluyentes
Resolucin.
Primer diagrama: Representa el evento en que el estudiante asiste al curso de clculo.
Segundo diagrama: El evento en que el estudiante no asiste al curso de clculo (asiste al de
fsica).
Tercer diagrama: El estudiante est asistiendo al curso de clculo o al de fsica.
Cuarto diagrama: El evento en el que asiste a los dos cursos a la vez (algo que no puede
ocurrir).
No se utilizan los dos diagramas del medio, ya que los eventos son mutuamente excluyentes,
suponiendo que los dos cursos estn programados a la misma hora y en las mismas fechas.
y se lee:
y se lee:
P (x , y )
P (y )
P (x , y )
P (y /x ) =
P (x )
P (x /y ) =
Si P(y) > 0
Si P(x) > 0
o mejor:
P( x , y) = P( y) P(x / y)
(1)
P( y, x ) = P( x ) P( y / x )
P ( x , y ) = P ( y ) P( x / y ) = P( x ) P ( y / x )
(2)
(3)
221
b) Sucesos independientes
Si
y
P( y / x ) = P2 ( y)
P( x / y) = P1 ( x )
(4)
(5)
P( x , y) = P( x ) P2 ( y) = P1 ( x ) P( y)
que expresa la regla multiplicativa para dos sucesos independientes.
y i = y1 , y 2 , K , y s
La probabilidad total o completa se da cuando se desea averiguar la probabilidad del evento x i
en base a sus intersecciones con los eventos del atributo yj.
s
P (x ) = P ( y1) *P (x / y1) + P ( y 2) * P (x / y 2) + . . . + P ( y s ) *P (x / y s )
s
= P ( y j ) * P (x / y j )
j=1
P (y j / xi ) =
P (xi , y j )
P (xi )
P ( y j ) * P (x i / y j )
s
P (y ) * P (x
j
j=1
222
/y j )
4.8. Ejemplo
Mediante el siguiente ejemplo se mostrar el clculo de probabilidades usando todas las reglas
anteriores.
Sea Ai = estrato de votantes: joven, adulto y viejo; Bj = partidos que participan en elecciones:
MNR, MIR, MBL. Mediante encuesta se ha determinado la siguiente distribucin (ver tabla
9.4.1):
Tabla 9.4.1.
Bidimensional preferencia por partidos polticos vs. edad
Ai
Bj
J
A
V
Totales
MNR
MIR
MBL
Totales
2
7
6
15
6
3
7
16
4
5
0
9
12
15
13
40
13 9
0 22
+
=
= 0.55
40 40 40 40
P (x /y ) =
P (x , y )
P (y )
Si P(y) > 0
P (A /MNR ) =
P (A, MNR )
P (MNR )
P (A, MNR ) =
7
40
P(MNR) =
15
40
Reemplazando valores:
7
7
P (A /MNR ) = 40 = = 0.47
15 15
40
Conclusin: La probabilidad de ser adulto dado que es del MNR es del 47%.
3) Verifique si la probabilidad marginal de ser del MIR es de 15/40.
Se trata de aplicar la probabilidad completa, donde:
3
P (x ) = P (x, y j )
j=1
3
P (x ) = P ( y j ) * P (x / y j )
j=1
P (MIR ) = (
14 6
15 3
13 7
)( ) + ( )( ) + ( )( )
40 12
40 15
40 13
6
3
7 16
=
+
+
=
40 40 40 40
Conclusin: Por lo tanto se verifica que la probabilidad de ser del MIR no es 15/20 sino 16/40.
4) Verifique si la probabilidad de ser joven y del MIR es de 7/40.
Se trata de aplicar la regla multiplicativa:
P(x, y) = P(x) * P(y / x) = P(y) * P(x / y)
224
=[
6
3
7
6
16 6
6
+
+
] *[ ] =
* =
40 40 40
16
40 16 40
Conclusin: No es cierto que la probabilidad de ser joven y del MIR sea 7/40. Su resultado es
6/40.
5) Demuestre que la probabilidad de ser adulto dado que es del MBL es de 5/9.
Se trata del teorema de Bayes.
P (y j /x i ) =
P (x i y j )
P (x i )
P (y j ) * P (x i / y j )
s
P (y
) * P (x i / y j )
j=1
P (MBL, A )
P (MBL )
15 5
5
( )( )
5
P (A /MBL ) = 40 15 = 40 =
9
9 9
40
40
P (A /MBL ) =
Conclusin: Se verifica que la probabilidad de ser adulto dado que es del MBL es de 5/9.
Resolucin
En primer lugar se dar un instructivo de lo que significa cada rama de un diagrama de rbol y
cmo hallar las probabilidades.
Las primeras ramas del rbol presentan sucesos aleatorios que tienen probabilidades
marginales. Se puede comenzar por cualquier clasificacin. Para diagramarlas debe hacerse
esta pregunta: Si se selecciona al azar una persona de entre las 40, cul es la clasificacin
de su edad?
Las segundas ramas de rbol son sucesos dependientes que presentan probabilidades
condicionales. Para diagramarlas debe hacerse la siguiente pregunta: habiendo determinado
la edad de la persona elegida al azar, de qu partido es?
En otras palabras se est determinando el espacio muestral del experimento aleatorio, es
decir el conjunto de sus posibles resultados y sus probabilidades respectivas.
Para hallar las probabilidades conjuntas en un diagrama de rbol se utiliza la regla
multiplicativa. Si se quiere hallar una probabilidad marginal que no se encuentra en las
primeras ramas, se utiliza la probabilidad total, y para hallar una probabilidad condicional
que no se encuentra en las segundas ramas se utilizar el teorema de Bayes.
Algunas caractersticas del diagrama de rbol son:
La suma de probabilidades conjuntas es 1.
La suma de probabilidades para sucesos mutuamente excluyentes es 1.
Se muestra a continuacin el diagrama de rbol (ver figura 9.5.1)
Figura 9.5.1. Arboligrama preferencia por partidos polticos vs. edad
P. marginales
12/40
15/40
P. condicionales
13/40
V
2/12
6/12
4/12
7/15
3/15
5/15
6/13
7/13
0/13
P. conjuntas
MNR
MIR
MBL
MNR
MIR
MBL
MNR
MIR
MBL
P. totales
P(MNR) = P(MNR, J)+P(MNR, A)+P(MNR, V) = (2/40)+(7/40)+(6/40) = 15/40
P(MIR) = P(MIR, J)+P(MIR, A)+P(MIR, V) = (6/40)+(3/40)+(7/40) = 16/40
P(MBL) = P(MBL, J)+P(MBL, A)+P(MBL, V) = (4/40)+(5/40)+(0/40) = 9/40
P. condicionales (Teorema de Bayes)
P(J/MNR) = P(MNR, J)/P(MNR) = (2/40)/(15/40) = 2/15
P(J/MIR) = P(MIR, J)/P(MIR) = (6/40)/(16/40) = 6/16
P(J/MBL) = P(MBL, J)/P(MBL) = (4/40)/(9/40) = 4/9
P(A/MNR) = P(MNR, A)/P(MNR) = (7/40)/(15/40) = 7/15
P(A/MIR) = P(MIR, A)/P(MIR) = (3/40)/(16/40) = 3/16
P(A/MBL) = P(MBL, A)/P(MBL) = (5/40)/(9/40) = 5/9
P(V/MNR) = P(MNR, V)/P(MNR) = (6/40)/(15/40) = 6/15
P(V/MIR) = P(MIR, V)/P(MIR) = (7/40)/(16/40) = 7/16
P(V/MBL) = P(MBL, V)/P(MBL) = (0/40)/(9/40) = 0
Ejemplo 2
El administrador de la unidad operativa de trnsito realiz un estudio sobre el nmero de
accidentes que hay en la ciudad con respecto a la edad del conductor. El arboligrama con las
probabilidades porcentuales est mostrado en la figura 9.5.2:
Figura 9.5.2. Arboligrama del nmero de accidentes vs. edad
88.24
21-41
0
1
42.39
4.22
2
90.07
39.87
41-61
7.00
0
1
2
0
61-71
6.72
2.96
2
Fuente: Elaboracin propia
227
El administrador quiere estimar cuantas personas de cada categora existirn, si este ao hay
4194 nuevos conductores.
Resolucin
En primer lugar, se pueden determinar las probabilidades del arboligrama que faltan, sabiendo
que la suma de probabilidades de eventos mutuamente excluyentes debe ser de uno.
0
A
B
C
K
1
D
E
F
L
G
H
I
M
Total
N
O
P
4194
Haciendo uso de las reglas de clculo de probabilidades, se procede a hallar el valor de cada
variable.
N
4194
N = 0.4239(4194) = 1778
O = 0.3987(4194) = 1672
Restando del total se halla el valor de P:
A
A
=
N 1778
A = 0.8824(1778) = 1569
D = 0.0754(1778) = 134
Restando del total de personas de edad entre 21 a 41 aos, se obtiene G:
B = 0.9007(1672) = 1506
E = 0.007(1672) = 117
H = 1672 1506 117 = 49
C = 0.9032(744) = 672
F = 0.0672(744) = 50
I = 744 672 50 = 22
Por ltimo los totales de columna se obtienen sumando los valores de cada columna:
0
1569
1506
672
3747
1
134
117
50
301
2
75
49
22
146
Total
1778
1672
744
4194
229
6. GENERALIZACIN
PROBABILIDADES
DE
LAS
REGLAS
PARA
EL
CLCULO
DE
Se han mostrado las reglas para el clculo de probabilidades cuando se tiene una distribucin
bidimensional. Sin embargo se puede presentar el caso en el que existan ya no dos sino tres o
ms clasificaciones. Para este tipo de problemas, se debern generalizar las reglas para el
clculo de probabilidades, para lo cual se considera un rbol que tiene tres ramificaciones o
eventos dependientes, cada uno de los cuales tiene dos resultados posibles (ver figura 9.6.1):
Figura 9.6.1. Arboligrama con tres ramificaciones
P. condicional
P. condicional
P(C/A)
P. marginal
P. conjuntas
P(E/A,C)
C
P(F/A,C)
P(E/A,D)
P(F/A,D)
P(E/B,C)
P(F/B,C)
P(E/B,D)
P(F/B,D)
A
P(A)
P(D/A)
P(C/B)
P(B)
B
P(D/B)
230
Y
2
1
4
3
6
231
B
0.24
0.06
0.19
0.04
0.16
0.11
0.09
C
S
232
Tabla 9.7.1
Funcin de cuanta conjunta
yj
y1
y2
...
ys
Total
P11
P21
:
Pr1
Pi1
P12
P22
:
Pr2
Pi2
...
...
:
...
P1s
P2s
:
Prs
Pis
P1j
P2j
:
Prj
xi
x1
x2
:
xr
Total
ij
=1
i =1 j=1
Soltero
Casado
Viudo
Total
8052
8384
16436
5815
5989
11804
542
1218
1760
14743
15257
30000
Para hallar las probabilidades conjuntas, simplemente se divide cada frecuencia absoluta
conjunta entre el total de encuestados. Para hallar las probabilidades marginales, se suman
las probabilidades conjuntas halladas (ver tabla 9.7.2).
Tabla 9.7.2
Bidimensional de probabilidades de estado civil vs sexo (Pi, j)
Estado civil
Sexo
Masculino
Femenino
Total
Soltero
Casado
Viudo
Total
26.84
27.95
54.79
19.38
19.96
39.35
1.81
4.06
5.87
49.14
50.86
100.00
Interpretacin:
PM,S = 26.84, significa: Existe una probabilidad del 26.84% de que una persona elegida al azar
sea de sexo masculino y soltero.
PV = 5.87, significa: Hay una probabilidad del 5.87% de que la persona elegida al azar sea
viuda.
PF = 50.86, significa: La probabilidad de que una persona elegida al azar sea de sexo femenino
es de 50.86%.
f (x, y) dx dy = 1 ;
para:
Luego: 0 f (x, y) 1
La probabilidad que el par (x,y) sea para a1 x b1 ; y para a 2 y b 2 , se expresa de la
siguiente manera:
P(a1 x b1; a 2 y b 2 ) =
b1
a1
b2
a2
f (x, y) dx dy
f 1 (x ) =
f (x, y ) dy
f 2 (y ) =
f (x, y ) dx
F (x o, y o ) =
f (t , t
1
) dt1 dt 2
b2
(a1, b2)
(b1, b2)
(a1, a2)
(b1, a2)
a2
a1
b1
xi
b2
a1
a2
f (x, y) dx dy
f (x, y )
f 2 (y )
f (x, y )
(2 ) f (y /x ) =
f 1 (x )
(1 ) f (x /y ) =
si f 2 (x ) > 0
si f 1 (x ) > 0
Ejemplo 1
Suponga que la funcin de densidad de probabilidad conjunta para las variables no negativas x
e y es f (x, y) = xe x e y . Halle la probabilidad que 0 x 1 y 0 x 2 .
Resolucin
La integral a resolver es la siguiente:
235
P(0 x 1; 0 y 2) =
0 0
xe x e y dy dx
e y dy = e y 0 = e 2 + 1 =
1
e2 1
+
1
=
e2
e2
+
xe
dx
xe
e
dx
e2 0
e 2
0
0
0
e 2
e2 1
e 2 1 2 e 2 1 e 2
1
2e
1
+
=
2
e 2 e + 1 = e 2 e = 0.2285
1 30x 10y
f (x, y) =
e e
300
Halle la probabilidad de que la operacin requiera ms de media hora.
Resolucin.
Se quiere hallar: P(x + y > 30) = 1 P(x + y 30)
Regin:
30
y = 30 x
0 x 30
0 y 30 x
R
30
236
Se plantea la integral:
P(x + y 30) =
30
30 x
1 30x 10y
e e dy dx
300
Se resuelve:
10 30 30x 10y
=
e e
300 0
30 x
30
1 30 30x x10
dx = e e
1 dx
30 0
30
x
x
30
1 30 2x 90
1 30 2x 90
= e 30 dx e 30 dx = e 30 + 30 e 30
0
30 0
30 2
1
1 1
+ 3 + 1 = 0.4730
2e 2e e
237
EMV=10000 $
Mercado favorable (0.5)
200000 $
Nodo de decisin
1
Construir planta
grande
Construir planta
pequea
2
100000 $
Mercado desfavorable (0.5)
-20000 $
No hacer nada
EMV=40000 $
0$
Segunda
decisin
106400 $
190000 $
-190000 $
Planta
grande 63600 $
Planta
3
pequea
Primera
decisin
49200 $
Resultado 106400 $
favorable
(0.45)
90000 $
-30000 $
No hacer nada
-10000 $
-87400 $
190000 $
-190000 $
1
Resultado
desfavorable
(0.55)
Con estudio
Planta
grande 2400 $
Planta
5
pequea
2400 $
90000 $
-30000 $
No hacer nada
-10000 $
49200 $
Mercado favorable (0.78)
200000 $
-180000 $
10000 $
Sin
estudio
Planta
grande
6
40000 $
Planta
pequea
40000 $
100000 $
-20000 $
No hacer nada
0$
de la mejor
EVSI =
muestral asumiendo
decisin sin
En el caso de John, su EMV debera ser 59200 $ si no se hubiera sustrado los 10000 $ del
estudio de cada beneficio. El EMV de no obtener la informacin muestral es de 40000 $.
Entonces:
241
Estados de la naturaleza
Mercado favorable (MF) Mercado desfavorable (MD)
242
Recordemos que sin ninguna informacin de mercado, los mejores estimados de John de un
mercado favorable o desfavorable son:
P(MF) = 0.50
P(MD ) = 0.50
Estas son llamadas como probabilidades iniciales.
Con todo esto podemos realizar un diagrama de rbol de la siguiente manera:
0.70
Positivo
MF
0.5
0.30
0.20
Negativo
Positivo
0.5
MD
0.80
Negativo
Podemos ahora calcular las probabilidades posteriores o revisadas de Thompson. stas son
las inversas de las probabilidades de la tabla 9.8.1.
Primero se calculan las probabilidades totales de obtener un resultado positivo en la encuesta y
la de obtener un resultado negativo:
P(MF / positivo ) =
0.5(0.7)
= 0.78
0.5(0.7) + 0.5(0.3)
P(MD /positivo ) =
0.5(0.2)
= 0.22
0.5(0.7) + 0.5(0.3)
P(MF / negativo ) =
0.5(0.3)
= 0.27
0.5(0.3) + 0.5(0.8)
P(MD / negativo ) =
0.5(0.8)
= 0.73
0.5(0.3) + 0.5(0.8)
243
0.78
MF
Positivo
0.45
0.22
0.27
MD
MF
0.55
Negativo
0.73
MD
Las probabilidades posteriores ahora proveen a John Thompson estimados de cada estado de
la naturaleza si los resultados de la encuesta son positivos o negativos.
2000000 $
Cruz (0.5)
0$
Rechazar la
oferta
Cara (0.5)
5000000 $
EMV=2500000 $
Mejor resultado
Utilidad 1
Peor resultado
Utilidad 0
Otro resultado
Utilidad ?
Alternativa 2
races, Jane podra preferir tener su dinero en el banco, dnde est seguro. Lo que Jane hizo
aqu es asegurar su utilidad de 5000 $. Cuando hay un 80% de probabilidad (esto significa que
p es 0.8) de conseguir 10000 $, Jane es indiferente entre poner su dinero en bienes races y
ponerlo en el banco. La utilidad de Jane de 5000 $ es entonces igual a 0.8, que es la misma
que el valor para p. Esta valoracin de la utilidad est mostrada en la figura 9.8.5.
P = 0.8
Invertir en
Bienes races
10000 $
U=1
1-p = 0.2
0$
U=0
Invertir en el
banco
5000 $
U = p = 0.8
Utilidad
Otro valor de la utilidad puede ser valorado de la misma manera. Por ejemplo, cul es la
utilidad de Jane para 7000 $? Cul es el valor de p que hara que Jane sea indiferente entre
7000 $ y el riesgo que podra resultar de 10000 $ o 0 $? Para Jane, existe una probabilidad del
90% de conseguir los 10000 $. Por otro lado, ella preferira tener los 7000 $ asegurados.
Entonces, su utilidad para 7000 $ es 0.9. La utilidad de Jane para 3000 $ puede ser
determinada de la misma manera. Si haba un 50% de probabilidad de obtener los 10000 $,
Jane debera ser indiferente entre tener 3000 $ asegurados y tomar el riesgo de ganar 10000 $
o nada. Entonces la utilidad de 3000 $ para jane es 0.5. Por supuesto, este proceso puede
continuar hasta que Jane ha valorado su utilidad para tantos valores monetarios como ella
quiera. Sin embargo, estas valoraciones son suficientes para determinar una idea de los
sentimientos de Jane hacia el riesgo. De hecho, podemos graficar estos puntos en una curva
de utilidad, como se muestra en la grfico 9.8.1.
1
1
0.9
0.8
0.7
0.6
0.5
0.4
0.9
0.8
0.5
0.3
0.2
0.1
0
0
0
1000 2000
3000
4000
5000
6000
7000
Valor m onetario
246
Utilidad
El grfico 9.8.2 ilustra a una persona que es un buscador del riesgo, en oposicin a una que es
adversa al riesgo. Este tomador de decisiones consigue ms utilidad de un gran riesgo y ms
alto beneficio potencial. A medida que el valor monetario se incrementa en su curva de utilidad,
la utilidad incrementa a una tasa ascendente. Una persona que es indiferente al riesgo tiene
una curva de utilidad que es una lnea recta. La forma de la curva de utilidad de una persona
depende de la decisin especfica que est siendo considerada, el trasfondo psicolgico de la
persona, y los sentimientos acerca del futuro. Puede darse que tengas una curva de utilidad
para algunas situaciones y curvas muy diferentes para otras.
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
2000
4000
6000
8000
10000
Valor monetario
Adverso al riesgo
Indiferente al riesgo
anteriormente, Mark es capaz de construir una curva de utilidad mostrando su preferencia hacia
el dinero. Esta curva aparece en el grfico 9.8.3.
Tachuela con punto arriba (0.45)
Alternativa 1
Jugar
10000 $
-10000 $
Alternativa 2
No jugar
0$
Utilidad
0.5
0.4
0.3
0.3
0.2
0.15
0.1
0.05
0
0
-20000
-10000
10000
20000
Valor monetario
U (10000 $) = 0.05
U (0 $) = 0.15
U (10000 $) = 0.30
Paso 2. Reemplazar los valores monetarios con valores de utilidad. Refirindose a la figura
9.8.7, las utilidades para las alternativas 1 y 2 son:
248
Utilidad
Tachuela con punto arriba (0.45)
Alternativa 1
Jugar
0.30
0.05
E=0.1625
Alternativa 2
No jugar
0.15
249
EJERCICIOS DE CLASE
Distribuciones bidimensionales
Tipo I
1. Una investigacin de mercado revel que las ventas semanales de una nueva barra de
caramelo se relacionaron con su precio como sigue. Interprete la informacin contenida en la
tabla.
Precio
(centavos)
50
55
60
65
Ventas semanales
(miles de barras)
23.2
19.4
16.9
15.7
Tipo II y III
2. Se sabe que el consumo de las personas (yi ) depende de los ingresos que perciben (xi).
Para un grupo de 50 personas se tienen la siguiente informacin en cientos de bs.:
xi:
yi:
xi:
yi:
4 9 15 15 9 4 9 15 4
1 6 5 1 10 3 11
6 4
9 9 15 15 15 9 15
9 15
12 14 12 15 14 13 13 15 12
9 4 15 9 4 15 9 4 15
9 15 4 15
9
4 6 11 5 11 10 1 2 4
7 9 2 7
2
4 15 9 15 9 15 9 15 4 15 9 15 9 15
5 13 5 14 9 15 12 13 5
9 4 10 1 11
4 15
1 8
9 15
8 12
Errores cometidos
0 10: Muy pocos
10 20: Pocos
20 30: Muchos
Total
Total
153
117
50
320
M1
T1
M2
23.744
P( T1 , M 2 ) = 7.078 %
M3
M1
34.234
T2
M2
P ( T2 / M 1 ) = 26 .207 %
P( M 1 ) = 33.105 %
M3
M1
31.148
27.854
T3
M2
M3
M1
T4
M2
37.624
M3
251
P( M 3 ) = 33.790 %
P( T3 , M 3 ) = 9.361 %
f (x, y) =
1 10x 50y
e e
500
252
EJERCICIOS PROPUESTOS
1. Se sabe que el consumo de las personas (y), depende de los ingresos que perciben (x). Para
un grupo de 50 personas, se tiene la siguiente informacin (cientos de bs.):
Ingresos
4
8
2
0
1- 5
5 - 11
11 - 15
Consumo
9
7
6
5
15
3
9
10
59
3
2
1
2
Produccin
9 - 13
13 - 17
5
0
4
1
6
7
3
6
N de autos
3-4
6
2
6
1-2
4
3
8
5-6
15
4
2
c) Cunto vale la varianza del nmero de autos? Qu ocurrira con esta varianza si cada
familia se compra dos autos adicionales?
4. En un programa de entrenamiento para la gerencia de una empresa de cosmticos, 80% de
los asistentes son mujeres y 20% son hombres; 90% de las mujeres son egresadas de la
Universidad y 78% de los hombres Tambin.
a) Se selecciona al azar una de las personas en entrenamiento. Cul es la probabilidad de
que se trate de una mujer que no asisti a la universidad?
b) Trace un arboligrama que muestre todas las probabilidades normales o marginales,
condicionales y conjuntas.
5. Cada vendedor en una compaa se califica como abajo del promedio, promedio, o arriba
del promedio, con respecto a su habilidad para las ventas. Adems cada vendedor se
clasifica con respecto a sus posibilidades de promocin:
Habilidad en ventas
Abajo del promedio
Promedio
Encima del promedio
Posibilidad de promocin
Regular
Buena Excelente
16
12
22
45
60
45
93
72
135
2
3
2
6
5
6
4
6
5
13
5
3
4
15
5
9
4
3
4
3
5
6
5
12
2
5
4
4
4
7
2
7
5
11
5
7
5
8
4
5
2
5
5
4
4
4
4
8
5
15
2
3
4
5
5
8
4
9
4
4
2
9
4
6
5
10
4
9
5
12
5
7
4
10
2
4
5
5
5
4
254
8. Una profesora ha estado enseando Estadstica durante muchos aos. Sabe que 80% de
los estudiantes completan los problemas asignados. Determin que de los alumnos que
hacen las tareas 90% aprobarn el curso. De aquellos estudiantes que no realizan la tarea
completa solo 60% aprobarn. Miguel Snchez tom Estadstica el ltimo semestre con la
profesora y tuvo calificacin aprobatoria. Cul es la probabilidad de que s haya hecho las
tareas?
9. Tan solo el 20 % de las mujeres mayores de 40 aos egresadas de la universidad ejercen su
profesin, mientras que un 70% de las egresadas menores de 40 tambin lo hacen. La
relacin de mujeres profesionales mayores de 40 entre las menores de 40 es de 2 a 6.
a) Francis Morales es Ingeniero Qumico y no ejerce su profesin. Cul es la probabilidad
de que tenga menos de 40 aos?
b) Dibuje el arboligrama con todas las probabilidades marginales, condicionales y conjuntas.
c) Realice un cuadro de contingencias tomando en cuenta que n = 80 y verifique la
probabilidad anterior.
10. Una compaa que fabrica tornillos, tiene 3 fbricas: A, B, C. Las fbricas B y C producen
el mismo nmero de tornillos, mientras que A produce el doble de las de B. Por experiencia
pasada, se sabe que el 2% de los tornillos producidos por A y B respectivamente son
defectuosos, en tanto que el 4% de los fabricados por C son defectuosos. Los tornillos
producidos por las tres fbricas se guardan en un mismo lugar.
a) Dibuje un arboligrama, con todas las probabilidades.
b) Si se escoge aleatoriamente un tornillo del almacn, Cul es la probabilidad de que
sea defectuoso?.
c) Cul es la probabilidad de que el tornillo defectuoso escogido haya sido producido en
la fbrica A?
11. Suponga que x representa el tiempo en minutos durante el cual una persona hace cola en
cierto banco e y la duracin en minutos de una transaccin de rutina en la ventanilla del
cajero. Usted llega al banco a depositar un cheque. Si la funcin de densidad de
probabilidad conjunta de x e y es:
1 x4 y2
f (x, y) = e e
8
Halle la probabilidad de que realice su transaccin en el banco en menos de 8 minutos.
Ejercicios de teora de la utilidad
1. A Mnica Britt le gusta mucho pilotear botes pequeos a vela. Lo hace desde que tena 7
aos, cuando su madre comenz a hacerlo con ella. Hoy, Mnica est considerando la
posibilidad de iniciar una compaa para producir pequeos botes para el mercado
recreativo. A diferencia de otros botes a vela producidos en masa, los suyos sern hechos
especficamente para nios entre 10 y 15 aos. Sern de la ms alta calidad y
extremadamente estables y el tamao de la vela ser reducido para prevenir problemas de
vuelco.
255
Debido al gasto involucrado al desarrollar los moldes iniciales y adquirir el equipo necesario
para producir botes de vela de fibra de vidrio para nios, Mnica ha decidido llevar a cabo un
estudio piloto para asegurarse que el mercado ser adecuado. Ella estima que el estudio
piloto costar 10000 $. Adems el estudio piloto puede ser exitoso o no. Su decisin bsica
es construir una planta de manufactura grande, una pequea o no construir nada. Con un
mercado favorable, Mnica espera hacer 90000 $ con una planta grande, o 60000 $ con una
planta pequea. Si el mercado es desfavorable, Mnica estima perder 30000 $ con una
planta grande y perder 20000 $ con una planta pequea. Mnica estima que la probabilidad
de un mercado favorable dado un estudio piloto exitoso es de 0.8. La probabilidad de un
mercado desfavorable dado un resultado del estudio piloto no exitoso es del 0.9. Mnica
siente que hay una probabilidad de 50-50 que el estudio piloto ser exitoso. Por supuesto,
Mnica podra no realizar el estudio piloto y simplemente realizar la decisin de construccin
sin l. Si no hara un estudio piloto, ella estima que la probabilidad de un xito en el mercado
es del 0.6. Qu recomendara?
2. John Jenkins siempre ha deseado desarrollar una pequea lnea de carritos para golfistas
de todas las habilidades. Sin embargo, cree que la probabilidad de una lnea de autos
exitoso es del 40%. Un amigo le ha sugerido que lleve a cabo una encuesta en la comunidad
para obtener una mejor intuicin de la demanda para construir una planta. Hay una
probabilidad de 0.9 de que la investigacin sea favorable, si la planta ser exitosa. Adems,
se estima que hay una probabilidad de 0.8 de que la investigacin de mercado ser
desfavorable si la planta ser exitosa. John podra determinar las probabilidades de una
exitosa lnea de autos dado un resultado favorable del estudio de marketing.
3. Como muchos estudiantes, Anne Martin est enfrentando una difcil e importante decisin
acerca de su carrera profesional. Mientras estaba en colegio, Anne trabaj para una
empresa de contabilidad local. Hizo un buen trabajo y la empresa le ofreci un trabajo por
20000 $. Ella puede tomar todo el tiempo que quiera para tomar su decisin. Hay sin
embargo, otras dos compaas que estn interesadas en ella. Contabilidad Barnes le ha
ofertado un trabajo por 22000 $. Desafortunadamente Barnes, le ha dado un plazo de dos
semanas para que tome su decisin. La compaa en la cual Anne realmente le gustara
trabajar es Servicios de Contabilidad Ketchum. Esta compaa, ella siente, podra hacerle
una oferta de 28000 $. Desafortunadamente, Anne est bastante dudosa de que realmente
le ofrezcan el puesto. Entonces, Anne tiene una difcil decisin. Podra ella aceptar la oferta
de Barnes de 22000 $, o debera esperar para conseguir la oferta de Ketchum? Para Anne
ser indiferente entre tomar el trabajo con Barnes y el riesgo de esperar y tratar de conseguir
el trabajo con Ketchum, la probabilidad de obtener el trabajo con Ketchum debera ser 0.6.
Dada esta informacin, qu utilidad debera Anne tomar sobre los tres trabajos?
4. Jerry Young est pensando abrir una tienda de bicicletas en su ciudad natal. Jerry ama
tomar su bici y correr en un camino de 50 millas con sus amigos, pero cree que cualquier
negocio pequeo debera comenzar slo si hay una buena probabilidad de obtener
ganancias. Jerry puede abrir un pequeo negocio, una tienda grande o no hacer nada.
Debido a que tendr un alquiler por 5 aos en un edificio, l quiere asegurarse hacer una
decisin correcta. Tambin est pensando en contratar a su viejo profesor de marketing para
llevar a cabo un estudio de mercado. Si es llevado a cabo el estudio, los resultados pueden
ser favorables o desfavorables. Desarrollar un rbol de decisin para Jerry.
5. Jerry Young (del problema 4) ha realizado algunos anlisis acerca de la rentabilidad de la
tienda de bicicletas. Si Jerry construye una tienda grande, tendr una ganancia de 60000 $
256
257
Informacin adicional:
40-50
>50
111
225
P ( F < 20) = 0.494
P ( F / 20 40) =
0.134
< 20
20-40
0.222
0.427
F
0.1733
40-50
>50
< 20
0.1981
20-40
BA
40-50
>50
Edad\Deporte Voleibol
Hasta 20
26
20 40
40 50
96
Mayores a 50
Total
Ftbol
Bsquetbol
Total
150
f ( x , y )=
1 x/ 4 y /3
e e
12
Halle la probabilidad de que ambos pacientes sean dados de alta del hospital en menos de 3
das.
259
CASO
BLAKE ELECTRONICS2
En 1947, Steve Blake fund Blake Electronics en Long Beach, California, para manufacturar
resistors, capacitors, inductors y otros components electrnicos. Durante la Segunda Guerra
Mundial Steve fue un radio operador y fue durante ese tiempo que adquiri la habilidad para
reparar radios y otros equipos de comunicacin. Steve consider su experiencia de 4 aos con
la armada con sentimientos encontrados. Odi la vida en la armada, pero su experiencia le dio
la confianza y la iniciativa para iniciar su propia empresa de electrnicos.
En el transcurso del tiempo, Steve cuid su negocio sin realizar grandes cambios. En 1969, las
ventas totales anuales excedan los 2 millones de $. En 1964, el hijo de Steve, Jim, se uni a la
compaa despus de terminar la preparatoria y dos aos de cursos en electrnica en la
universidad de la comunidad de Long Beach. Jim fue siempre agresivo como atleta en la
preparatoria, y lleg a ser an ms agresivo gerente general de ventas de Blake Electronics.
Esta agresividad preocupaba a Steve, que era ms conservador. Jim haca tratos para proveer
a las compaas con componentes electrnicos sin antes preocuparse de saber si Blake
Electronics tena la habilidad o capacidad para producir los componentes. En varias ocasiones
este comportamiento caus a la compaa momentos embarazosos, ya que Blake Electronics
era incapaz de producir los componentes electrnicos para compaas con las cuales Jim hizo
tratos.
En 1968, Jim comenz a ir tras los contratos del gobierno para componentes electrnicos. En
1970, las ventas totales anuales ascendieron a ms de 10 millones de $ y el nmero de
empleados exceda los 200. La mayora de esos empleados eran especialistas en electrnica y
graduados de programas de ingeniera elctrica de universidades prestigiosas. Pero la
tendencia de Jim de exagerar para obtener contratos continu, hasta que por 1975, Blake
Electronics se gan una reputacin con las agencias del gobierno como de una compaa que
no poda entregar lo que prometa. De la noche a la maana, los contratos con el gobierno se
detuvieron, y Blake Electronics se qued con una fuerza de trabajo parada y equipo de
manufactura sin utilizar. Estos grandes gastos generales comenzaron a derretir el beneficio, y
en 1977, Blake Electronics se enfrent con la posibilidad de tener una prdida por primera vez
en su historia.
En 1978, Steve decidi ver la posibilidad de producir componentes electrnicos para uso del
hogar. Si bien era un mercado totalmente nuevo para Blake Electrnicos, Steve estaba
convencido de que esta era la nica forma de mantener a la empresa fura de la lnea roja. Al
equipo de investigacin le fue dada la tarea de desarrollar nuevos dispositivos electrnicos para
el hogar. La primera idea del equipo fue el Centro de Control Maestro. Los componentes
bsicos para este sistema se muestran en la figura 1.
El corazn del sistema es la caja de control maestro. Esta unidad, que debera tener un precio
al por menor de 250 $, tena dos filas de 5 botones. Cada botn controla una luz o dispositivo y
puede ser dispuesto como un interruptor o un restato. Cuando se dispone como un interruptor,
un toque de dedo al botn enciende o apaga la luz. Cuando se dispone como un restato, un
2 Este caso ha sido extractado del libro: Quantitative Analysis for Management. Render y Stair, 1997.
260
toque de dedo del botn controla la intensidad de la luz. Si se deja el dedo en el botn, la luz
realiza un ciclo completo desde apagado hasta una luz muy brillante, regresando a apagado.
Adaptador de
salida
Adaptador de
interruptor de luz
Disco de
bombilla
el dispositivo sea controlado desde la caja de control maestro el desde el adaptador de salida.
El precio del adaptador de salida debera ser 25 $.
El equipo de investigacin estim que debera costar 500000 $ desarrollar el equipo y los
procedimientos necesarios para fabricar la caja de control maestro y los accesorios. Si es
exitosa, esta aventura podra incrementar las ventas en 2 millones de $ aproximadamente.
Pero ser que la caja de control maestro ser exitosa? Con un 60% de probabilidad de xito
estimado por el equipo de investigacin, Steve tiene serias dudas acerca de tratar de vender
las cajas de control maestro, an cuando le gusta la idea bsica.. Debido a sus reservas, Steve
decidi mandar solicitudes de propuestas (RFPs) para investigaciones adicionales de mercado
a 30 compaas de investigacin en el sur de California.
El primer RFP vino de una pequea compaa llamada Marketing Associates, Inc. (MAI) que
quera cobrar 100000 $ por el estudio. De acuerdo a su propuesta, MAI ha estado en el negocio
por tres aos y ha llevado a cabo cerca de 100 proyectos de investigacin de mercados. Las
mayores fortalezas de MAI parecen ser la atencin individual de cada informe, personal
experimentado y trabajo rpido. Steve se interes particularmente en una parte de la
propuesta, que revelaba el record xito de MAI con informes previos. Esto est mostrado en la
figura 12.
Resultados
Operacin exitosa
Operacin no exitosa
Resultados de la encuesta
Favorable Desfavorable
35
20
15
30
Total
55
45
La otra propuesta que regres fue de una oficina sucursal de Iverstine y Kinard, una de las ms
grandes empresas de investigacin de mercados en el pas. El costo para un estudio completo
es de 300000 $. Si bien la propuesta no contiene el mismo registro de xito de MAI, contiene
alguna informacin interesante. La probabilidad de obtener un resultado favorable del estudio,
dada una operacin exitosa, es de 90%. Por el otro lado, la probabilidad de conseguir un
resultado desfavorable de la encuesta, dada una operacin no exitosa, es de 80%. Entonces, a
Steve le parece que Iverstine y Kinard es capaz de predecir el xito o fracaso de la caja de
control maestro con una gran certidumbre.
Steve ponder la situacin. Desafortunadamente, ambos equipos de investigacin de mercados
dieron otorgaron diferentes tipos de informacin en sus propuestas. Steve concluy que no
haba forma que las dos propuestas puedan ser comparadas a menos que consiguiera
informacin adicional de Iverstine y Kinard. Adems, Steve no estaba seguro de lo que debera
hacer con la informacin y si vala la pena el gasto de contratar a una de las empresas de
investigacin de mercado.
Preguntas
1. Necesita Steve informacin adicional de Iverstine y Kinard?
2. Qu recomendara?
262
CAPTULO 10
REGRESIN Y CORRELACIN
1. INTRODUCCIN
En muchas investigaciones de tipo estadstico, el objetivo es determinar a partir de informacin
histrica o experimental, relaciones o funciones mediante las cuales se puedan realizar
pronsticos, lo ms exactamente posible, entre dos o ms variables relacionadas entre s.
Los anlisis de regresin y correlacin brindan al investigador las herramientas necesarias para
cumplir este objetivo.
Minimizar : z = (yi ye ) 2
i =1
donde:
yi = Ordenadas de los valores observados (datos).
ye = Ordenadas estimadas a partir de la ecuacin de regresin.
El diagrama de dispersin de la figura 10.1.1, aclara todos los conceptos arriba mencionados.
263
Recta de regresin
ye
yi
ye
Nube de puntos
yi
ye
yi
xi
y = a + bx
y = a + bx
No hay correlacin
Dependencia parablica
y = ax 2 + bx + c
y
264
x
Dependencia lineal
Dependencia no lineal
z = ax + by
z = ax 2 + by 2
Fuente: Elaboracin propia
existe en la relacin de dependencia de las variables consideradas. Dicho de otro modo mide la
intensidad de la relacin entre las variables consideradas, mediante la siguiente expresin:
r=
S2y
S
2
y
= 1
S2y
S
2
y
donde:
Varianza total:
k
S2y =
(y
Varianza Explicada:
y) 2
Varianza no explicada:
i =1
S2y =
( y e y) 2
S2y =
i =1
(y
ye ) 2
i =1
y = f (x)
yi
Varianza Total
y = f (x)
y
y
e
y = f (x)
Varianza Explicada
yi
y
e
Varianza No Explicada
266
Figura 10.1.5
Intensidad del coeficiente de correlacin
Negativa
perfecta
intensa
-1
Ninguna
correlacin
moderada
dbil
dbil
-0.5
moderada
Positiva
perfecta
intensa
0.5
r =
2
S2y
S
2
y
yi = consumo en unidades
xi = ingreso en decenas de Bs.
267
Tabla 10.2.1
Bidimensional consumo vs. ingresos
xi
15
20
25
32
38
yi
18
21
24
27
35
Consumo
35
30
25
20
15
15
20
25
32
38
Ingreso
(y
y e )2 , siendo
i =1
(y
i =1
y = na + b x
x y = a x + b x
i
2
i
b=
n xy x y
n x 2 ( x )
a=
y b x = y bx
n
y n = na + b x n
x y n = a x n + b x n
i
2
i
yi
xi * y i
xi2
ye
( yi y )
( ye y )
15
20
25
32
38
130
18
21
24
27
35
125
270
420
600
864
1330
3484
225
400
625
1024
1444
3718
17
21
24
29
33
49
16
1
4
100
170
64
16
1
16
64
161
b=
5(3848) 130(125)
= 0.69
5(3718) (130) 2
a=
125
130
(0.69)
= 25 (0.69)(26) = 7
5
5
y = 7 + (0.69)(42) = 36
y = 7 + (0.69)(50) = 42
y = 7 + (0.69)(87) = 67
La familia gastara 36, 42 y 67 decenas de Bs. si su ingreso es de 42, 50 y 87 decenas de Bs.,
respectivamente.
Sin embargo, no se puede saber an si el pronstico realizado es confiable. Para ello, se debe
realizar el anlisis de correlacin.
La correlacin se determina mediante los siguientes clculos:
y i 125
=
= 25
n
5
2) Calcule (yi y) 2 en columna (6).
1) Halle y : y =
Sy =
( yi y ) 170
=
= 34
n
5
r=
S2ye =
( y e y ) 2 161
=
= 32.2
n
5
32.2
1.8
= 1
= 0.973
34
34
Conclusin: Como r = 0.97, se puede decir que existe alta correlacin positiva entre "x" y "y" o
una relacin intensa directa entre el ingreso y el consumo.
El coeficiente de determinacin ser el siguiente:
r 2 = 0.947
Conclusin: Se puede concluir que el 94.7% de la variacin en el consumo se explica por la
variacin en el ingreso y un 5.3% se explica o se debe a otras variables no consideradas.
Por lo tanto, se puede decir que la estimacin realizada a partir de la ecuacin de regresin
hallada es bastante confiable.
Nota: Una frmula alternativa para hallar la correlacin, slo en el caso lineal, es:
r=
Covarianza
Sxy
=
Sx *Sy Desviacin estndarx * Desviacin estndary
270
r=
n xy x y
n x 2 ( x )2 n y 2 ( y )2
y = a + b x1 + c x 2
donde: a, b, c, son parmetros a calcular mediante el anlisis de regresin.
x1 y x2, son las variables independientes
y, es la variable dependiente.
Segn mnimos cuadrados, se tendr que minimizar la siguiente expresin:
Min : Z = (Y a bx1 cx 2 ) 2
Las ecuaciones que resultan son las siguientes:
na + b x1 + c x 2 y = 0
2
a x1 + b x1 + c x1x 2 x1 y = 0
2
a x 2 + b x1x 2 + c x 2 x 2 y = 0
Ejemplo
Una compaa desea estimar el monto a pagar a sus ejecutivos en base a su edad y al nmero
de aos que estudiaron en la universidad. Para ello obtuvo la siguiente informacin histrica (ver
tabla 10.3.1):
x = Edad de los ejecutivos de una compaa
1
x = No. de aos que estuvieron en la Universidad
2
y = Ingresos anuales (miles de $).
271
Tabla 10.3.1
Ingresos vs edad y aos de estudio de ejecutivos
x1
37
45
38
42
31
x2
4
0
5
2
4
y
51.2
46.8
55.0
50.3
45.4
x2
37 4 51.2
45 0 46.8
38 5 55.0
42 2 50.3
31 4 45.4
193 15 248.7
x12
x1*x2
x1*y
x22
x2*y
1369
2025
1444
1764
961
7563
148
0
190
84
124
546
1894.4
2106.0
2090.0
2112.6
1407.4
9610.4
16
0
25
4
16
61
204.8
0
275.0
100.6
181.6
762.0
ye
( y i y )2
( y e y )2
51.1770 2.1316
46.9618 8.6436
55.1135 27.6676
50.0303 0.3136
45.4116 18.8356
57.5920
2.0650
7.7184
28.8745
0.0843
18.7350
57.4772
5 a + 193 b + 15 c = 248.7
193 a + 7563 b + 546 c = 9610.4
15 a + 546 b + 61 c = 762
a = 3.7213
b = 0.9609
c = 2.9756
S 2ye = 11.4954
S 2y = 11.5184
272
r 2 = 0.9980
r = 0.9990
Conclusin.
Se puede concluir que existe una relacin intensa (casi perfecta) entre la edad de los ejecutivos,
el nmero de aos que estudiaron en la universidad y sus ingresos anuales.
Adems que el 99.8% de la variacin en sus ingresos est explicada por la variacin de su edad
y su formacin acadmica.
Por lo tanto la estimacin que realizar la compaa de los ingresos del nuevo ejecutivo es muy
confiable:
y = na + b x
x y = a x + b x
i
2
i
Este hecho servir para hallar las ecuaciones para modelos no lineales sencillos.
Si la funcin es:
y = a bx
(funcin exponencial)
ln y = n ln a + ln b x
x ln y = ln a x + ln b x
i
Si la funcin es:
y = a xb
2
i
(funcin potencial)
ln y = n ln a + b ln x
ln x ln y = ln a ln x + b ( ln x )
i
y i = a n + b x i + c x i2
3
2
x i y i = a x i + b x i + c x i
2
2
3
4
x i y i = a x i + b x i + c x i
Nota: El lector, a travs de los mnimos cuadrados puede determinar las ecuaciones de
regresin para cualquier funcin que sea ms adecuada a los datos experimentales.
Ejemplo
Las cifras de la tabla 10.4.1 son datos sobre el porcentaje de las llantas radiales producidas por
cierto fabricante que aun pueden usarse despus de recorrer cierto nmero de millas:
Tabla 10.4.1
Porcentaje til de llantas vs. millas recorridas
Millas
Porcentaje
recorridas
til
(miles)
1
98.2
2
91.7
5
81.3
10
64.0
20
36.4
30
32.6
40
17.1
50
11.3
Fuente: Mason y Lind. Estadstica para Administracin y Economa, 1995.
Ajuste a una curva exponencial y estime qu porcentaje til tendrn las llantas radiales del
fabricante si recorrieron 25000 millas.
Resolucin
Primero se verifica si la nube de puntos sugiere una regresin exponencial (ver grfico 10.4.1).
Grfico 10.4.1
Diagrama de dispersin del Porcentaje til de llantas vs. millas recorridas
274
120
100
% til
80
60
40
20
0
0
10
20
30
40
50
60
Millas recoridas
ln y
x2
x*ln y
ye
( y i y )2
( y e y )2
1
2
5
10
20
30
40
50
158
98
92
81
64
36
33
17
11
433
4.587
4.519
4.398
4.159
3.595
3.484
2.839
2.425
30.005
1
4
25
100
400
900
1600
2500
5530
4.59
9.04
21.99
41.59
71.89
104.53
113.56
121.24
488.43
96.024
91.946
80.721
64.975
42.098
27.276
17.672
11.450
1947.02
1415.64
741.20
98.51
312.41
461.18
1367.15
1829.70
8172.80
1759.73
1434.20
710.01
118.81
143.45
718.20
1325.15
1816.88
8026.44
8 A + 158 B = 30.005
158 A + 5530 B = 488
A = 4.608
B = 0.043
y = 100.28 (0.9575)x
La ecuacin resultante es:
Realizando el anlisis de correlacin:
S 2ye = 1003.3
S 2y = 1021.6
275
a = 100.28
b = 0.9575
r 2 = 0.9821
r = 0.9910
Conclusin.
Se concluye que existe una relacin intensa entre las millas recorridas y el porcentaje til que
aun tienen las llantas.
El 98.21% de la variacin en el porcentaje til se debe a la variacin en las millas recorridas por
las llantas.
Por lo tanto, la estimacin que se realizar mediante la ecuacin de regresin hallada es
confiable.
276
EJERCICIOS DE CLASE
Regresin lineal
1. La tabla siguiente suministra las cifras aproximadas del censo de los Estados Unidos (en
millones) para los 48 estados adyacentes en la primera mitad del siglo XX :
Ao
Poblacin
1900
75
1910
91.97
1920
105.7
1930
122.78
1940
131.7
1950
178.5
Use esta recta para "predecir" la poblacin en 1970. (La poblacin real de los 48 estados
adyacentes era aproximadamente 200 millones en 1970. Encuentre los coeficientes de
correlacin y de determinacin y exprese su significado.
Regresin lineal mltiple
2. Usted como gerente de marketing est intentando predecir la demanda anual de su producto
estrella Tapun, utilizando las siguientes variables: Precio = Precio del producto [$], Ingreso =
Ingreso del consumidor [cientos de $]. Usted recopil datos correspondientes al perodo 1982
- 1992:
Ao
1982
1983
1984
1985
1986
Demanda
60
70
65
65
75
Precio
7
6
6
8
5
Ingreso
8
9
10
11
12
a) Encuentre la ecuacin de regresin que mejor se ajuste a los datos, los coeficientes de
determinacin y correlacin, e interprtelos.
b) Qu valor de demanda predecira si el precio de los productos fue de 6 $ y el ingreso del
consumidor de 1200 $?.
Regresin no lineal
3. Los datos siguientes son los beneficios netos de una compaa durante los primeros seis
aos que ha operado.
Ao
1
2
3
4
5
6
Beneficio
(miles de $)
112
149
238
354
580
867
4. Los siguientes son datos relacionados con el volumen de un gas (en pulgadas cbicas) y su
presin (en libras por pulgada cuadrada), cuando el gas est comprimido a una temperatura
constante.
Volumen
50
30
20
10
5
Presin
16.0
40.1
78.0
190.5
532.2
Ajuste a una funcin potencial y estime la presin de este gas cuando est comprimido a un
volumen de 15 pulgadas cbicas.
278
EJERCICIOS PROPUESTOS
1. Se llev a cabo un proyecto de investigacin para determinar si existe alguna relacin entre
los aos de servicio y las puntuaciones de eficiencia de empleados. El objetivo del estudio es
pronosticar la puntuacin de eficiencia de un empleado con base en su tiempo de servicio.
Los resultados muestrales son:
Empleado
Jones
Orlando
Ireland
Smith
Kordel
Harper
Lopez
Sobecki
Aos de
servicio
1
20
6
8
2
1
15
8
Tasa de
eficiencia
6
5
3
5
2
2
4
3
Produccin en una
hora (unidades)
15
25
10
40
30
279
Lluvia
(litros por m2)
14.1
10.2
8.3
30.3
32.5
21.4
34.0
18.6
19.0
22.7
4. Los valores de x e y son los siguientes:
X:
Y:
2
1
3
2
4
3
5
3
6
6
N calzado
39
40
41
42
43
44
6. Dados los valores observados de las tres variables Y, X1, X2, halle la ecuacin de regresin y
el coeficiente de determinacin correspondiente.
Y
X1
X2
2
2
7
3
3
6
4
4
8
3
4
7
1
1
5
Demanda
22
280
16
10
11
14
41
120
89
56
Ajuste mediante una curva potencial y emplee para estimar la demanda, el precio del
producto de 12 centavos.
8. Los datos siguientes se refieren a las dosis de rayos csmicos medidas a varias altitudes:
Altitud (pies)
50
450
780
1200
4400
4800
5300
Razn de dosis
(mrem/ao)
28
30
32
36
51
58
69
281
qB
5
2
4
1
pB
20
19
17
22
Tasa de nacimiento
(por millar de hab.)
15.7
18.4
13.5
13.9
12.5
35.3
19.0
17.0
17.2
15.3
Tasa de suicidios
(por millar de habitantes)
11.1
12.9
25.1
30.5
5.8
2.1
12.1
11.3
4.0
12.7
4.5
1.0
3.5
0.8
4.0
1.0
5.0
1.5
Tiempo de secado
(horas)
7.2
6.7
4.7
3.7
4.7
4.2
5.2
5.7
a) Realice el diagrama de dispersin y ajuste los datos a la curva que mejor crea
conveniente.
b) Pronostique el tiempo de secado del barniz, cuando se agregan 6.5 gramos del qumico.
283
CASO DE ESTUDIO
SPRINGVILLE HERALD
FASE 7
En la implantacin de la estrategia corporativa de aumentar las ventas de entrega a domicilio, el
departamento de mercadotecnia debe trabajar de cerca con el de distribucin para lograr que
funcione el proceso inicial de entrega para los clientes de prueba. Esto es importante para
asegurar que el mayor nmero posible de clientes de prueba se conviertan en clientes
permanentes, ya que se crear una impresin negativa fuerte si ocurren problemas durante la
primera semana de reparto.
Como parte de su responsabilidad en el proceso, es esencial para el departamento de
mercadotecnia poder pronosticar el nmero de suscriptores en los prximos meses. Un equipo
formado por administradores de los departamentos de mercadotecnia y distribucin, convino en
desarrollar un mtodo mejor para pronosticar las nuevas suscripciones. Melissa Hogue, jefa de
mercadotecnia, pidi a Lauren may, especialista en pronsticos de mercado, que propusiera
algunas ideas acerca de los mtodos de pronsticos que se podan usar. Lauren, recin
contratada en la compaa por sus habilidades especiales en mtodos de pronstico
cuantitativos, pregunt al equipo cmo se haban hecho los pronsticos de las nuevas
suscripciones en el pasado. Al Baum, un miembro del equipo, respondi que por lo comn,
despus de examinar las nuevas suscripciones de los dos o tres meses anteriores, un grupo de
administradores desarrollaba un pronstico por consenso. Lauren pregunt si alguien haba
intentado determinar qu factores podan ser tiles para predecir las nuevas suscripciones cada
mes. Todos contestaron que los pronsticos en el ltimo ao haban sido bastante inexactos,
porque unos meses se realizaba un gran esfuerzo de ventas por telfono y otros la dedicacin
era menor.
Lauren sugiri que se obtuvieran los datos de los dos ltimos aos de los registros de la
compaa. En particular estaba interesada en conocer el nmero de nuevas suscripciones y el
nmero de horas dedicadas a ventas por telfono cada mes. La siguiente tabla indica el nmero
de nuevas suscripciones para el mes y el nmero de horas dedicadas a ventas por telfono.
Ejercicios
a) Qu crtica puede hacer al mtodo de pronsticos que consista en examinar las nuevas
suscripciones de los ltimos 3 meses como base para las proyecciones futuras?
b) Qu factores, adems del nmero de horas de venta por telfono pueden ser tiles para
predecir el nmero de suscripciones?
c) Analice los datos y desarrolle un modelo estadstico para predecir el nmero de nuevas
suscripciones para un mes, con base en el nmero de horas dedicadas a la venta por
telfono para lograrlas. Escriba un informe con todos los detalles de lo que encontr respecto
al modelo que se ajust a los datos.
d) Si se espera que se dediquen 1000 horas de ventas por telfono en el siguiente mes,
pronostique el nmero de nuevas suscripciones esperadas para el mes. Indique la suposicin
en la que se basa este pronstico. Piensa que estas suposiciones son vlidas?
e) Cul sera el peligro de predecir el nmero promedio de nuevas suscripciones para un mes
en que se dedican 2000 horas a las ventas por telfono? Explique.
Tabla SH2.5
284
Nmero de nuevas suscripciones y nmero de horas dedicadas a ventas por telfono por mes para
un periodo de dos aos
Periodo
1
2
3
4
5
6
7
8
9
10
11
12
Horas de
ventas por
telfono
1224
1458
1006
1395
1131
921
704
1154
1168
803
830
981
Nuevas
Periodo
suscripciones
5357
6177
4795
5692
4312
3421
2624
4087
4934
2546
3591
4271
13
14
15
16
17
18
19
20
21
22
23
24
Horas de
ventas por
telfono
1435
1349
965
985
1117
840
1412
940
1090
1498
1240
1055
285
Nuevas
suscripciones
5836
5201
3775
3592
4566
2974
5673
3554
4399
6143
4827
5418
CAPTULO 11
SERIES CRONOLGICAS
1. INTRODUCCIN
Una serie temporal es un conjunto de valores correspondientes a una variable, observados en
el tiempo. La serie cronolgica se considera como una estadstica de dos variables donde una
de ellas es el tiempo (variable independiente) y la otra los valores de la variable observada
(variable dependiente).
Debido a que las condiciones econmicas y comerciales varan con el tiempo, los
administradores deben encontrar formas para mantenerse al da respecto a los efectos que
esos cambios tendrn en sus negocios. Una tcnica muy til en la planeacin de las
necesidades operativas es el pronstico, que tiene como objetivo predecir los eventos futuros
de manera que las proyecciones se puedan incorporar en el proceso de toma de decisiones.
Como ejemplos, se citan algunos:
y = T x E xCx A
y = T+E+C+A
Hiptesis multiplicativa:
Hiptesis aditiva:
Grficamente (ver grfico 11.2.1):
Grfico 11.2.1
Serie cronolgica con sus 4 componentes
t
287
C
(Sistemtico)
A
(No
sistemtico)
Definicin
Razn de la influencia
Duracin
Cambios
en
tecnologa, Varios aos
poblacin, riqueza, valores.
Condiciones
de
clima, Dentro
de
12
costumbres sociales o religiosas. meses (O datos
mensuales
o
trimestrales).
Interaccin
de
numerosas De 2 a 10 aos,
diferente
combinaciones de factores que con
intensidad en un
influyen en la economa.
ciclo completo.
Oscilacin
o
movimiento
repetitivo arriba o abajo en 4
etapas: Pico (prosperidad),
contraccin (recesin), fondo
(depresin)
y
expansin
(recuperacin o crecimiento)
Fluctuacin errtica o residual Variaciones aleatorias en los Corta duracin y
presente despus de tomar en datos o debidas a eventos no sin repeticin.
cuenta los efectos sistemticos. previstos
como
huelgas,
huracanes,
inundaciones,
asesinatos polticos, etc.
t
Fuente: Casa Aruta, Ernesto. Doscientos Problemas de Estadstica Descriptiva, 1965
donde:
Serie observada:
Mximos y mnimos:
Tendencia:
b) Mtodo de las medias mviles
Este mtodo busca diluir la importancia individual de cada observacin, promedindola
mediante una media aritmtica, considerando las observaciones. Cada valor observado de y,
es sustituido por una media aritmtica, que se obtiene por valores componentes de y, en
grupos de un nmero determinado de valores y aplicados mecnicamente. Se presentan dos
casos, segn el nmero de observaciones elegidas para calcular el promedio sea par o impar.
Ejemplo
a) Sea la siguiente serie temporal. En caso de considerar un grupo impar de valores (ver tabla
11.3.1).
289
Tabla 11.3.1
Mtodo de la media mvil considerando grupo impar
t
0
1
2
3
4
5
6
7
yo
y1
y2
y3
y4
y5
y6
y7
y
y1
y2
y3
y4
y5
y
~
y2
~
y3
~
y4
~
y5
y6
y o + y1 + y 2
3
y +y +y
y2 = 1 2 3
3
y1 =
y + y2 + y3
~
y2 = 1
3
y6 =
y5 + y6 + y7
3
y + y5 + y6
~
y5 = 4
3
El mtodo se vuelve a usar tantas veces como sea posible, hasta suavizar la tendencia
secular de manera adecuada o que satisfaga los objetivos de la investigacin realizada.
b) En caso de considerar un grupo par (ver tabla 11.3.2.).
En este caso es necesario volver a calcular otra nueva serie de medias mviles de tamao
dos sobre la hallada primeramente, con el objeto de centrar los datos en los momentos
originales, ya que al calcularse la primera serie, dichos momentos quedaron desplazados con
respecto al tiempo.
y2 =
y o + y1 + y 2 + y 3
4
y + y3
~
y( 2 = 2
2
y3 =
y1 + y 2 + y 3 + y 4
4
y + y4
~
y3 = 3
2
y6 =
y4 + y5 + y 6 + y7
4
290
Tabla 11.3.2
Mtodo de la media mvil considerando grupo par
t
yo
y1
Y2
y2
y3
Y3
y4
Y4
Y5
Y6
Y7
y5
~
y2
~
y3
~
y4
~
y5
y6
y=
y 2 y1
(x x1 ) + y1
x 2 x1
d) Mtodo analtico
Una tendencia secular puede hallarse mediante un anlisis de regresin, pudiendo
comportarse bajo cualquier modelo visto en el captulo anterior, con la particularidad de que la
variable independiente es siempre el tiempo.
Aplicando mnimos cuadrados a: y = a + bt
(funcin lineal)
291
yi = n a + b t i
2
yi t i = a t i + b t i
que es un sistema de 2 ecuaciones con las incgnitas a y b.
Si la funcin es:
y = a bt
(funcin exponencial)
Aplicando logaritmos: ln y = ln a + t ln b
Las ecuaciones normales son:
ln yi = n ln a + ln b t i
2
ln yi t i = ln a t i + ln b t i
Si la funcin es:
y = a tb
(funcin potencial)
Aplicando logaritmos: ln y = ln a + b ln t
ln y i = n ln a + b ln t i
2
ln y i ln t i = ln a ln t i + b (ln t i )
Nota: La tendencia secular puede seguir la forma de cualquier funcin. En todo caso, el
investigador deber determinar la curva que mejor se ajuste a los datos temporales.
Ejemplo
La tabla 11.3.3 presenta las ventas mundiales anuales de una fbrica (en millones de
unidades) de automviles, camiones y autobuses hechos por la General Motors para un
periodo de 24 aos, de 1975 a 1998.
a) Halle la tendencia secular por medio del mtodo de medias mviles, usando un valor de
n=7.
b) Determine la tendencia secular por el mtodo analtico.
292
Tabla 11.3.3
Ventas mundiales anuales de la General Motors
Ao
Ventas
1975
6.6
1976
8.6
1977
9.1
1978
9.5
1979
9.0
1980
7.1
1981
6.8
1982
6.2
Ao
Ventas
1983
7.8
1984
8.3
1985
9.3
1986
8.6
1987
7.8
1988
8.1
1989
7.9
1990
7.5
Ao
Ventas
1991
7.4
1992
7.7
1993
7.8
1994
8.4
1995
8.3
1996
8.4
1997
8.8
1998
8.1
y1 =
La siguiente es determinada, dejando el valor de venta del primer ao, y tomando en cuenta
las ventas de los aos 2 al 8:
y2 =
Se sigue el mismo procedimiento hasta cubrir las ventas de los ltimos 7 aos.
Para determinar la tendencia por medio del anlisis de regresin, se elegir el modelo lineal.
Luego de todo el procedimiento, la recta de las ventas en funcin de los aos es:
V = 7.9593 + 0.0075 t
Los resultados se muestran en la tabla 11.3.4.
Tabla 11.3.4
Promedios mviles de las ventas mundiales anuales de la General Motors
Ao
Ao
Ventas
Medias
mviles
Regresin
0
1
2
1975
1976
1977
6.6
8.6
9.1
7.96
7.97
7.97
293
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
9.5
9
7.1
6.8
6.2
7.8
8.3
9.3
8.6
7.8
8.1
7.9
7.5
7.4
7.7
7.8
8.4
8.3
8.4
8.8
8.1
8.10
8.04
7.93
7.81
7.79
7.73
7.83
8.01
8.26
8.21
8.09
7.86
7.74
7.83
7.86
7.93
8.11
8.21
-
7.98
7.99
8.00
8.00
8.01
8.02
8.03
8.03
8.04
8.05
8.06
8.06
8.07
8.08
8.09
8.09
8.10
8.11
8.12
8.12
8.13
Ventas
Grfico 11.3.2
Comparacin de 2 mtodos de clculo de la tendencia secular de las ventas mundiales
anuales de la General Motors
10.00
9.50
9.00
8.50
8.00
7.50
7.00
6.50
6.00
1970
1975
1980
1985
1990
Tiem po
Recta de regresin
Media Mvil
Serie de Ventas
1995
2000
y=T xC
Se elimina la tendencia y la variacin cclica en ella incluida, dividiendo los datos de la serie
original por los valores de la tendencia en cada instante de tiempo.
y=
TxExCxA
=ExA
TxC
Se eliminan las variaciones accidentales hallando las medias aritmticas de los valores
observados en cada perodo de repeticin anual.
y=
ExA
=E
A
Sobre estos ltimos valores se calculan los ndices de variacin estacional, uno para cada
momento de repeticin anual, en forma de porcentajes.
y=
TxExCxA
=T xCxA
E
Ejemplo
Sea los siguientes datos observados durante cuatro aos sobre las ventas en miles, en cada
295
ao 1
2.0
2.2
2.4
2.8
ao 2
2.4
2.8
3.0
3.4
ao 3
2.6
3.0
3.4
3.8
ao 4
3.0
3.6
3.8
4.0
1 Paso. Se halla la tendencia secular por el mtodo de las medias mviles, tomando un ao
de perodo (n=4) (ver tabla 11.3.6).
Tabla 11.3.6
Primer paso. Desestacionalizacin serie temporal de ventas
Estacin
Primavera
ao 1
-
ao 2
ao 3
ao 4
2.75
3.10
3.55
Verano
2.35
2.90
3.20
3.60
2.45
2.95
3.30
2.60
3.00
3.45
Otoo
Invierno
ao 1
2.400
2.525
ao 2
2.675
2.825
2.925
2.975
ao 3
3.050
3.150
3.250
3.375
ao 4
3.500
3.575
-
3er Paso. Los datos corresponden a un corto plazo, por lo tanto la tendencia secular y la
variacin cclica se eliminan juntas.
Se elimina la tendencia y la variacin cclica, dividiendo los datos originales por los valores de
la tendencia en cada intervalo de tiempo (ver tabla 11.3.8).
Tabla 11.3.8
Tercer paso. Desestacionalizacin serie temporal de ventas
Estacin
Primavera
Verano
Otoo
Invierno
ao 1
1.000
1.109
ao 2
0.897
0.991
1.026
1.143
ao 3
0.852
0.952
1.046
1.126
ao 4
0.857
1.007
-
M.A.
(promedio)
0.8687
0.9833
1.0240
1.1260
4.0020
Primavera
Verano
Otoo
Invierno
IVE p =
0.8687(4)
= 0.8683
4.002
297
0.9833(4)
= 0.9828
4.002
1.024(4)
IVE O =
= 1.0235
4.002
1.126(4)
IVE I =
= 1.1254
4.002
IVE V =
Tabla 11.3.10
Quinto paso. Desestacionalizacin serie temporal de ventas
Estacin
Primavera
Verano
Otoo
Invierno
IVE
0.8683
0.9828
1.0235
1.1254
4.0000
ao 1
2.30
2.24
2.34
2.49
ao 2
2.76
2.85
2.93
3.02
ao 3
2.99
3.05
3.32
3.38
ao 4
3.46
3.66
3.71
3.55
298
Ventas
Grfico 11.3.3
Serie temporal de ventas desestacionalizada
4
3.8
3.6
3.4
3.2
3
2.8
2.6
2.4
2.2
2
0
9 10 11 12 13 14 15 16
Tiempo
Serie Cronolgica
Tendencia Secular
Serie Desestacionalizada
299
EJERCICIOS DE CLASE
Tendencia secular
Promedios mviles
1. El nmero de miembros de la planta docente de una universidad que son dueos de
computadoras personales ha aumentado drsticamente en los ltimos 6 aos:
Ao
N
1987
50
1988
110
1989
350
1990
1020
1991
1950
1992
3710
Obtenga la tendencia secular por medio del mtodo de medias mviles, tomando como
periodo n = 2 y n = 3.
Mtodo analtico
2. Desarrolle una ecuacin de estimacin, que mejor describa a los datos de la pregunta 1 y
estime el nmero de computadoras que habr en uso en la universidad en 1996.
Desestacionalizacin
3. La administracin de un albergue para esquiadores tiene los siguientes datos acerca de la
ocupacin trimestral correspondientes a un periodo de 5 aos.
Trimestre
1 Trimestre
2 Trimestre
3 Trimestre
4 trimestre
1988
1861
2203
2415
1908
1989
1921
2343
2514
1986
1990
1834
2154
2098
1799
1991
1837
2025
2304
1965
1992
2073
2414
2339
1967
300
EJERCICIOS PROPUESTOS
1. Las ventas de una determinada entidad comercial presentan el siguiente desarrollo:
Ao
1980
1981
1982
1983
1984
1985
1986
Ventas
(miles $us)
240
340
370
410
520
530
560
Ao
1987
1988
1989
1990
1991
1992
1993
Ventas
(miles $us)
600
620
510
490
520
580
690
yi
19
21
17
15
14
ti
1996
1997
1998
1999
2000
yi
15
14
12
14
13
1997
196.3
156.9
195.9
183.9
1998
197.3
175.2
205.6
191.7
1999
209.5
169.5
204.9
188.9
301
Ao 1
2.0
3.1
2.6
1.8
Ao 2
2.2
3.0
2.8
2.0
Ao 3
2.2
3.5
4.3
2.1
1999
294
383
422
362
2000
309
419
444
398
2001
341
445
478
414
302
CASO DE ESTUDIO
SPRINGVILLE HERALD
FASE 8
Un incremento en las ventas con entrega a domicilio se ha convertido en una parte importante
de la iniciativa estratgica corporativa para aumentar la circulacin del peridico. Se asign al
departamento de mercadotecnia el papel de lder en la supervisin de esta parte de la
circulacin del peridico, y tiene la responsabilidad de proporcionar las predicciones futuras de
las suscripciones que incluyen el anlisis de cualquier tendencia que pueda surgir. Para lograr
estas metas se recolectaron datos que se presentan en la tabla SH11.1, que indica el nmero
de suscripciones con entrega a domicilio para los dos ltimos aos (24 meses).
Tabla SH11.1
Suscripciones con entrega a domicilio para un periodo de 24 meses
Mes
1
2
3
4
5
6
7
8
9
10
11
12
Suscripciones
75327
77116
79341
80983
82326
82879
84006
85119
86182
87418
88063
89444
Mes
13
14
15
16
17
18
19
20
21
22
23
24
Suscripciones
90507
91927
93878
94784
96109
97189
97899
99208
100537
102028
103977
106375
Ejercicios
a) Analice estos datos y desarrolle un modelo estadstico para pronosticar las suscripciones
con entrega a domicilio en lo futuro. Cercirese de indicar las suposiciones del modelo y
sus limitaciones.
b) Pronostique las suscripciones con entrega a domicilio para los prximos cuatro meses.
c) Estara dispuesto a usar el modelo desarrollado para pronosticar las suscripciones para un
ao futuro? Explique.
d) Compare la tendencia de las suscripciones de la Fase 7 para los meses previstos. Qu
explicacin puede proporcionar acerca de las diferencias?
Nota: No siga adelante hasta terminar los ejercicios de la fase 8.
303
CAPTULO 12
NMEROS NDICES
1. INTRODUCCIN
Un nmero ndice es una medida estadstica que permite patentizar o afirmar los cambios,
cuando estos se producen en una variable o grupo de variables observadas afines en el tiempo,
localizacin geogrfica u otra caracterstica. Se presenta en forma de porcentaje, resultante de
la comparacin por cociente de los valores que toma la variable en perodos de tiempo distintos,
con respecto a otro valor fijo, que se toma como base de comparacin o de referencia. Su
aplicacin principal se halla en el campo de la economa, pudiendo expresar valores, precios,
produccin, salarios, comercio exterior, coste de la vida, etc.
Para una mayor facilidad, a continuacin se resume en un esquema los nmeros ndices que se
desarrollarn (figura 12.1.1).
Figura 12.1.1. Clases de nmero ndices
Simples
Nmeros
ndices
Sin Ponderar
Media Agregativa Simple
Complejos
Laspeyres
Ponderados
Paasche
Fisher
Tiempo
(meses)
Precio
(Bs./kg.)
E=0
F=1
M=2
A=3
M=4
J=5
p0 = 1.2
p1 = 1.5
p2 = 1.8
p3 = 2.0
p4 = 2.7
p5 = 3.5
Ii =
pi
* 100
po
Io = 100
I1 = 125
I2 = 150
I3 = 167
I4 = 225
I5 = 292
Ventas
(millones de
$.)
12
14
18
18
19
15
12
16
20
24
33
Ii =
Vi
x 100
V0
100
116.7
150
150
158.3
125
100
133.3
166.7
200
275
Para precios:
pit
100
i =1 p io
p
St =
n
Para cantidades:
q
t
S =
q it
q
i =1
100
io
Ejemplo
Sean un conjunto de verduras: tomates, cebollas y brcolis, cuyos precios se observan en el
tiempo, dados en la tabla 12.3.1 Halle el ndice complejo sin ponderar.
Tabla 12.3.1
Precios de un conjunto de verduras
T
Tomate
T
1.0
1.5
2.0
2.5
0
1
2
3
Cebolla
C
0.5
0.8
1.0
1.0
Brcoli
B
1.0
1.2
1.5
1.8
T
100
150
200
250
C
100
160
200
200
B
100
120
150
180
IS
Io = 300 / 3 = 100
I1 = 430 / 3 = 143
I2 = 550 / 3 = 183
I3 = 630 / 3 = 210
S =
pit
p
i =1
100
io
Respuesta: El precio del conjunto de verduras formado por tomates, cebollas y brcolis, al cabo
306
pit
p
t
Para precios:
i =1
n
B =
Para cantidades:
100
q
t
B =
i0
i =1
it
i =1
n
100
i0
i =1
Ejemplo
Sean los precios de un conjunto de legumbres, dados en la tabla 12.3.3. Halle el ndice complejo
sin ponderar.
Se procede de la siguiente manera:
Agregar los precios de cada pedido.
Elegir un perodo de tiempo y determinar los ndices correspondientes.
Sea el ao 0 el perodo base.
Tabla 12.3.3
ndice de precios de un conjunto de verduras (media agregativa simple)
t
Pt
0
1
2
3
1.0
1.5
2.0
2.5
0.5
0.8
1.0
1.0
1.0
1.2
1.5
1.8
2.5
3.5
4.5
5.3
p it
* 100
p io
Bo = (2.5/2.5)*100 = 100
B1 = (3.5/2.5)*100 = 140
B2 = (4.5/2.5)*100 = 180
B3 = (5.3/2.5)*100 = 212
BP =
p
p
t
Precios: L =
it
i =1
n
qi0
100
i0
q
t
Cantidades: L =
qi0
i =1
i =1
307
it
pi 0
i =1
n
100
i0
pi 0
pit qit
p
t
Precios: P =
i =1
n
q
q
t
Cantidades: P =
100
i0
q it
i =1
it
pit
i =1
n
100
i0
pit
i =1
Precios: Ft =
Lpt Ptp
Cantidades: Ft =
Lqt Ptq
Ejemplo
Sea el conjunto de verduras, tomates, cebollas y brcolis, observadas en el tiempo, con sus
valores de precio y cantidad (tabla 12.4.1). Halle el ndice de precios de Laspeyres, y el ndice de
cantidad de Paasche.
Tabla 12.4.1
Precios y cantidades de un conjunto de verduras
T
t
0
1
2
3
p
1.0
1.5
2.0
2.5
C
q
4
4
3
2
p
0.5
0.8
1.0
1.0
B
q
5
4
3
3
p
1.0
1.2
1.5
1.8
q
3
2
2
1
Lo=
L1=
Lp2 =
L3=
Po=
P1q =
P2=
q
P3=
12.0
* 100 = 69
17.5
9.8
* 100 = 48
20.4
Respuesta: Al cabo de 4 meses se encuentra una disminucin de las cantidades del 52%.
Ventajas y desventajas de los tres ndices
Laspeyres:
Es el ms fcil de calcular, ya que se necesita menos informacin y su denominador permanece
fijo. Eso ahorra tiempo y costos.
Al presentar ponderaciones fijas, stas pueden dejar de ser representativas cuando la serie se
aleja mucho del periodo base.
Paasche:
Sus coeficientes de ponderacin estn siempre actualizados y siempre son representativos.
Es difcil de calcular, porque se necesita mayor informacin y el clculo de cada vez un
denominador distinto. Eso dificulta su elaboracin y aumenta los costos.
309
Fisher:
Es considerado como el ndice ideal o el ms perfecto.
Sin embargo, es el ms difcil de determinar y el mas costoso.
Ao 0
100
108
115
126
Ao 3
100
112
120
132
x4 =
Extendiendo la regla:
126 * 112
= 141
100
126 * 120
= 151
100
126 * 132
o
= 166
x6 =
100
x 05 =
115 * 100
= 91
126
x2 =
Extendiendo la regla:
108
* 100 = 86
126
100
3
* 100 = 71
xo =
126
3
x1 =
Nota: El cambio de base tambin puede producirse cuando existen cambios en la composicin
de los bienes o artculos que conforman el conjunto o canasta.
6. NMEROS NDICES
TEMPORALES
DE
VALOR.
DEFLACIN
DE
NMEROS
NDICES
El producto del precio de un artculo por su cantidad (producida, consumida, en existencia, etc)
da lugar a una cifra, que tiene carcter de valor. Por lo tanto, el valor de un conjunto de distintos
artculos, i, en el ao o periodo t, puede representarse por:
Vit = pit q it
i
Se pude verificar que el producto del ndice de precios de Laspeyres, por el ndice de cantidades
de Paasche, da lugar al ndice de valor:
v
t
p
t
q
t
I =L P
p
=
p
it
qi0
i0
q
q
tt
pit
qi0
i0
311
q
=
p
tt
pit
i0
qi0
pit
Asimismo, el ndice de valor es igual al producto del ndice de precios de Paasche, por el ndice
de cantidades de Laspeyres. Tambin, el ndice de Fisher de precios por el ndice de Fisher de
cantidades da tambin el ndice de valor.
Los valores de las variables cambian en el tiempo. Particularmente los valores expresados en
cifras monetarias estn influidos por fluctuaciones intrnsecas del valor de la moneda.
Estas series cronolgicas de valor, que se refieren a las variaciones en el tiempo de cifras
monetarias, estn sujetas evidentemente a las fluctuaciones del poder adquisitivo de la moneda,
de forma que se debe distinguir entre el valor nominal y el valor real de esas cifras monetarias
obtenidas por observacin sucesiva en el tiempo. El valor nominal viene dado por la cifra
monetaria observada, mientras que el real es este mismo, una vez efectuada la correccin
conveniente para eliminar la influencia de la depreciacin monetaria. En definitiva, la serie de
valores nominales vendr expresada en moneda de cada ao, mientras que la serie de valores
reales vendr expresada en moneda constante, es decir, en moneda correspondiente siempre a
un determinado ao, que se toma como base.
Es posible en esta situacin, que los valores de las variables expresados en dinero crezcan. Sin
embargo, los valores reales disminuyan o viceversa. Para eliminar esta influencia de la
fluctuacin del valor de la moneda en los valores de una variable, se aplica la deflacin, que
consiste en dividir los valores normales de una variable entre un nmero ndice (Puede ser el
ndice de Laspeyres, Paasche, o cualquier otro, como el ndice del costo de vida), el cociente
permite expresar valores reales de la variable.
Ejemplo
Se quiere saber los precios reales de un auto, observados en el tiempo:
Tabla 12.6.1
Deflacin del precio de un auto
t
Precio
N ndice
0
1
2
3
7000
7500
8100
10000
100
120
150
180
Pr ecio real =
Pr ecio
* 100
N Indice
7000
6200
5400
5556
312
313
EJERCICIOS DE CLASE
ndice simple
1. La oficina de trabajo tiene que indican el nmero de nuevos negocios que han sido abiertos
en los aos de 1977 a 1992. Si 1977 es el ao base, calcule los nmeros ndice del volumen
de cambios.
Ao
1977
1982
1987
1992
Nmero de nuevos
negocios (miles)
9.3
6.5
9.6
10.1
1990
48
32
19
16
24
10
27
11
1991
53
37
15
20
18
26
26
8
1992
50
35
22
21
26
32
30
15
Hamburguesa
p
q
0.58
2.1
0.62
2.5
0.69
2.0
0.79
1.8
Emparedado de pollo
p
q
1.89
1.5
2.09
1.2
2.18
1.8
2.25
2.1
Papas fritas
p
q
0.84
2.9
0.89
2.7
0.99
2.3
0.99
2.4
Aros de cebolla
p
q
0.91
3.1
0.99
2.4
1.14
2.0
1.19
1.6
Ventas
1982
1988
1989
1482000
1491000
1502000
315
ndice de precios al
consumidor
(Base: 1982)
100
108.5
112.1
EJERCICIOS PROPUESTOS
1. Las cifras de ventas en millones de $us. de una cadena comercial, desde el ao 1980 hasta
el 1960, son las siguientes:
Ao
1980
1981
1982
1983
1984
1985
Ventas
10
13
17
18
19
17
Ao
1986
1987
1988
1989
1990
Ventas
10
15
25
27
40
Precios
2
6
8
21
Cantidades
3
2
10
34
4. Durante el perodo 1995 - 1999 las primas recaudadas por las compaas de seguros en su
conjunto, han sido las siguientes (en miles de $us):
Item
Accidentes individuales
Accidentes de trabajo
Incendios
Responsabilidad civil
Transportes
Vida
1995
219
2196
746
838
707
804
1996
261
2548
870
1335
822
891
1997
317
2745
960
1534
927
947
1998
356
2806
1051
1765
1084
1025
1999
411
2986
1139
2151
1247
1140
Ao
1994
1995
1996
1997
1998
Artculo A
Precios Cantidades
2
8
3
7
3
10
3
12
4
11
Artculo B
Precios Cantidades
3
5
4
6
5
6
7
7
8
8
Artculo C
Precios Cantidades
1
3
2
3
2
5
4
8
5
10
6. De un cierto producto tenemos los siguientes nmeros ndices simples de precios y de valor:
Ao
1980
1981
1982
1983
1984
ndice de precios
(base: 1980)
100
120
130
160
180
ndice de valor
(Base: 1960)
210
250
280
320
350
Siniestros
(miles de Bs.)
318511
523926
670718
905661
317
318
BIBLIOGRAFA
Ander-Egg, Ezequiel. Introduccin a las Tcnicas de Investigacin Social. Sexta Edicin,
1977. Editorial Humanitas, Buenos Aires-Argentina.
Benavente Nez del Prado, Arturo. Estadstica Bsica para Planificacin. Cuarta Edicin,
1975. Siglo XXI Editores S.A., Mxico.
Berenson-Levine-Krehbiel. Estadstica para Administracin. Segunda Edicin, 2001.
Prentice Hall, Mxico.
Blalock M., Hubert. Estadstica Social. Segunda Edicin, 1981. Fondo de Cultura
Econmica, Mxico.
Cansado, Enrique. Curso de Estadstica General. Segunda Edicin, 1970. Centro
Interamericano de Enseanza Estadstica (CIENES), Santiago-Chile.
Casa Aruta, Ernesto. Doscientos Problemas de Estadstica Descriptiva. Primera Edicin,
1965. Editorial Vicens-Vives, Barcelona-Espaa.
Chao L., Lincoln. Estadstica para las Ciencias Administrativas. Tercera Edicin. 1993.
McGraw Hill. Colombia.
Chevry R., Gabriel. Prctica de las Encuestas Estadsticas. 1967. Ediciones Ariel,
Barcelona-Espaa.
Cortada y Carro. Estadstica Aplicada. Segunda Edicin, 1968. Editorial Universitaria de
Buenos Aires, Buenos Aires-Argentina.
Dottone, R. Horacio. Estadstica Elemental. 1982. Coopecultura. Santiago-Chile.
Everett E. Adam, Jr. & Ronald J. Ebert. Production and Operations Management (Concepts,
Models and Behavior). Cuarta Edicin, 1989. Prentice-Hall International Editions, United
States of America.
Ferrando Garca, Manuel. Introduccin a la Estadstica Sociolgica. 1985. Editorial Alianza,
Madrid-Espaa.
Freund y Simon. Estadstica Elemental. Octava Edicin, 1994. Prentice Hall, Mxico.
Giardina, Basilio. Manual de Estadstica. Primera Edicin, 1968. Compaa Editorial
Continental, S.A., Mxico.
Gonick, Larry y Smith Woollcott. La Estadstica en Cmic. Primera Edicin, 1999. Editorial
Zendrera Zariquiey, Barcelona-Espaa.
319
Guenther G., William. Introduccin a la Inferencia Estadstica. 1977. Editorial Mc Graw Hill,
Mxico.
Levin I., Richard y Rubin S., David. Estadstica para Administradores. Sexta Edicin, 1996.
Prentice Hall Hispanoamericana S.A., Mxico.
Mason y Lind. Estadstica para Administracin y Economa. Sptima Edicin, 1995.
Alfaomega, Mxico.
Mendenhal, William. Estadstica para Administradores. Segunda Edicin, 1990. Grupo
Editorial Iberoamrica, Mxico.
Miller, Freund y Jonson. Probabilidad y Estadstica para Ingenieros. Cuarta Edicin, 1992.
Editorial Prentice Hall Hispanoamericana S.A.
Mood/Graybill. Introduccin a la Teora Estadstica. Cuarta Edicin, 1976. Editorial Aguilar,
Madrid-Espaa.
Montgomery Douglas C. Diseo y Anlisis de Experimentos. Grupo Editorial Iberoamrica,
1991.
Mora y Araujo, Manuel y Otros. Estadstica y Sociologa. 1973. Ediciones Nueva Visin,
Buenos Aires-Argentina.
Murray R. Spiegel. Estadstica. Serie Schaums. Segunda Edicin, 1995. Edit. Mc. Graw Hill.
Piatier, Andr. Estadstica y Observacin Econmica. 1967. Editorial Ariel, BarcelonaEspaa.
Render, Barry y Stair, Ralph M. Jr. Quantitative Analysis for Management. Sexta Edicin,
1997. Prentice Hall, New Jersey USA.
Zuwaylif H., Fadil. Estadstica General Aplicada. 1985. Fondo Educativo Interamericano.
Yamane, Taro. Estadstica. Tercera Edicin, 1974. Editorial Harla, S.A. e C.V, Mxico.
320
ANEXO 1
GUA PARA EL TRABAJO FINAL
OBJETIVOS DEL TRABAJO
El estudiante podr aplicar los conocimientos adquiridos en la materia de Estadstica I a un
caso real, usando algn mtodo de recopilacin de informacin, ordenar los datos mediante
distribuciones de frecuencias adecuadas, presentar los datos con grficos apropiados,
analizar la informacin, podr sacar conclusiones y tomar decisiones.
El caso real deber ser un tema de inters de los alumnos, tomando en cuenta sus hobbies,
vida social, familiar, acadmica, cultural, de negocios o relaciones profesionales,
acontecimientos nacionales de inters general, etc.
FECHA DE ENTREGA
Da del examen final, sin excepciones.
CARTULA
Deber ir especificado el nombre de la Universidad, la carrera de los miembros del grupo, la
materia que cursan, el ttulo del trabajo, los nombres de los componentes del grupo, el nombre
del catedrtico de la materia, y la fecha de realizacin.
CONTENIDO
El trabajo deber contar con los siguientes puntos:
1. Introduccin.
2. Justificacin.
3. Planteamiento del problema: Descripcin del problema, clara y explcitamente o el
planteamiento de la hiptesis a probar.
4. Objetivos: generales y especficos.
5. Marco terico.
6. Recopilacin y generacin de datos: Se deber generar la informacin en base a algn
mtodo de recopilacin de datos (el que mejor se adecue al problema): observacin,
321
BIBLIOGRAFA
Si el grupo us alguna bibliografa o fuente para recopilar datos o realizar algn
procedimiento, deber estar detallada en esta seccin del trabajo.
BANCO DE TEMAS
A continuacin se muestran algunos temas que pueden ser interesantes:
1.
2.
3.
4.
5.
6.
7.
8.
Anlisis de las causas de eficiencia o ineficiencia de los estudiantes de la UPB. Ej: Segn
sexo, edad, estado civil, clase social o nivel de ingreso familiar, etc.
Bsqueda de soluciones para un mejor desempeo docente en la UPB. Ej: conocimientos
de la materia, presentacin, mtodo de estudio, uso adecuado de materiales de
enseanza, grado de educacin y moral, relacionamiento con los estudiantes, grado de
preparacin de clases, ltimas novedades y actualizacin de conocimientos, pedagoga,
inters por los alumnos, etc.
Anlisis de la carrera de diseo grfico de la UPB. Ej: anlisis de la malla curricular,
anlisis de contenidos de las materias, importancia de las materias curriculares, buena
infraestructura de apoyo a la carrera, etc.
Anlisis de factibilidad de abrir otro caf universitario en la UPB. Ej: demanda
insatisfecha, mal servicio del actual, no cubre expectativas y necesidades, etc.
Anlisis de alguna pelcula. Ej: anlisis de personajes, acciones, escenas, efectos, etc.
Anlisis de la etapa de la juventud, desde el punto de vista de los padres o de los hijos, o
por un experto en comportamiento humano.
Anlisis del servicio de limpieza en la UPB. Ej: Baos, reas verdes, pasillos, oficinas, etc.
Estudio de los deportes que practican los estudiantes de la UPB. Ej: Segn sexo, edad,
incentivos de la Universidad, lugares apropiados en la U, etc.
322
EVALUACIN
Este trabajo tiene el valor del 30% del examen final. Se evaluar el trabajo escrito, tomando
en cuenta los aspectos que se mencionan abajo.
..........................................................................................................
..........................................................................................................
Trabajo Escrito:
Presentacin del trabajo y originalidad del tema
Observaciones:
..........................................................................................................
.........................................................................................................................................
323
ANEXO 2
TABLA DE TAMAOS MUESTRALES
Tamao
poblacional
0.5
0.55
0.6
0.65
0.7
0.75
0.8
0.85
0.9
0.95
50
44
44
44
44
43
43
42
40
37
30
0.98
19
100
80
79
79
78
77
74
71
66
58
42
23
150
108
108
107
105
103
99
93
85
72
49
25
200
132
131
130
127
124
118
111
99
82
54
26
250
152
151
149
146
141
134
124
110
89
57
27
300
169
168
166
162
156
147
135
119
95
59
27
350
183
183
180
175
168
158
145
126
99
61
28
400
196
195
192
187
179
168
153
132
103
62
28
450
207
206
203
197
188
176
159
137
106
63
28
500
217
216
212
206
196
183
165
141
109
64
28
550
226
225
221
214
204
189
170
145
111
65
29
600
234
233
229
221
210
195
175
148
113
65
29
650
242
240
236
228
216
200
179
151
114
66
29
700
248
247
242
233
221
204
182
153
116
66
29
750
254
253
247
239
226
208
185
156
117
67
29
800
260
258
253
243
230
212
188
158
118
67
29
850
265
263
257
248
234
215
191
159
119
67
29
900
269
268
262
252
238
218
193
161
120
68
29
950
274
272
266
256
241
221
195
163
121
68
29
1000
278
276
270
259
244
224
198
164
122
68
29
2000
322
320
312
298
278
252
219
179
129
70
30
3000
341
338
329
313
291
263
227
184
132
71
30
30
5000
357
354
344
327
303
272
234
189
135
72
10000
370
366
356
338
313
280
240
192
136
72
30
Infinito
384
380
369
350
323
288
246
196
138
73
30
324
ANEXO 3
EJEMPLO DE TRABAJO DE APLICACIN FINAL
ESTUDIO SOBRE TATUAJES Y PERFORACIONES
EN LA JUVENTUD ESTUDIANTIL COCHABAMBINA
I. INTRODUCCIN
Los distintos gustos que los jvenes de nuestra poca tienen, los lleva a la imperiosa
necesidad de distinguirse de los dems, y por ello, generalmente optan por hacerse
perforaciones o tatuajes; que segn ellos adems de distinguirlos, les transfieren una
identidad personal.
III. OBJETIVOS
Principales:
Secundarios:
325
Los guerreros Potok, portan en su boca un disco labial y se atraviesan el tabique nasal con
una hoja de rbol.
Las mujeres de Nueva Guinea atraviesan con una espina de pez las aletas nasales y el
tabique, mientras que los hombres llevan en el tabique dientes de pez.
Los Tinglits. Las mujeres de esta tribu agujerean su cuerpo como constatacin del paso de la
pubertad a una madurez en todos los sentidos, pero sobre todo sexual.
Las tribus Sioux, sometan a los jvenes a una prueba que consista en perforarse el pecho
con garfios colgndose con cuerdas a un rbol hasta lacerar la piel; de esta forma
demostraban que estaban preparados para ser guerreros.
Los antiguos Mayas practicaban el piercing perforando el labio, nariz y orejas con las joyas
mas caras que podan permitirse. Los indios Cashinawa se perforaban la nariz para insertarse
plumas de colores que indicaban su rango.
Por Zonas: Origen de las diferentes formas de perforacin
Boca:
Labios: Este piercing ya es uno de lo favoritos de la gente joven. En las tribus del amazonas,
las mujeres se agujereaban el labio inferior en el centro. Era una de las condiciones marcadas
por la tribu como sea de identidad de la poblacin femenina.
Lengua: Es uno de lo piercings en auge, aunque es uno de los ms difciles para que el
cuerpo se acostumbre. Adems es el que corre mayor riesgo de infeccin al estar en zona
hmeda. Parte de la cultura Maya y suele hacerse en el centro de la lengua y cerca de la
punta.
Nariz:
Aletas: Es de los piercings ms sencillos de realizar. Se origin en las Indias, donde es
habitual encontrarse con este tipo de decoracin facial. Poco despus los hippies de los 60 y
70 copiaron esta tendencia y hoy en da es uno de los ms extendidos.
Tabique: Este piercing esta presente en diversas culturas de todo el mundo. Su origen se
remota a la prehistoria. Se practica en la fina tira de la piel ubicada debajo del cartlago nasal,
hundiendo los 2 orificios de la nariz.
Cara:
Ceja: Es de las ms occidentales y aunque es dolorosa de hacer y mantener, lo cierto es que
cada vez ms gente opta por este tipo de piercing. Se realiza en la parte externa de la ceja.
Mejillas: Nace de la movida de los punks que se ponan clavos. En la actualidad no es uno de
los ms comunes.
327
Iluminacin: El rea debe estar bien iluminada para que el pintor pueda realizar su trabajo
adecuadamente.
Decoracin: Las superficies deben estar coloreadas con blanco u otra tonalidad muy clara,
para que pueda mantenerse el lugar bien limpio.
Desinfeccin: La botella de spray debe desinfectarse cada vez que se usa, o llevar algn
tipo de pelcula protectora. Asimismo las agujas deben ser desechables.
Esterilizacin: Las agujas, una vez fuera de su envoltura sanitaria no deben asentarse
sobre ninguna superficie sucia.
Guantes: El pintor debe lavarse las manos antes de ponerse los guante, preferentemente
con una solucin antibacteriana y antisptica. Una vez puestos los guantes, no debe tocar
otra cosa, como recibos, telfono, etc.
Fregadero: Debe existir un fregadero separado del que hay en el bao.
Esterilizador: Debe ser inspeccionado regularmente.
Despus de haber llevado a cabo el tatuaje, deben desecharse los recipientes de tinta.
Consecuencias subliminales de tatuajes y perforaciones
En un estudio publicado por investigadores de Texas, se encontr que entre 8 y 13% de los
adolescentes de entre 12 y 18 aos de edad tenan un tatuaje, y los que no lo tenan, entre 30
y 50% estaban considerando practicarse uno.
Otro estudio reciente publicado en la revista Pediatrics sobre el tatuaje y perforacin corporal
para aplicacin de joyera y el comportamiento en los adolescentes, demostr que los que
tenan algn tatuaje o perforacin fueron ms propensos al uso de drogas de escape, drogas
duras como anfetaminas o cocana, actividad sexual, suicidio, trastornos de alimentacin
como bulimia y anorexia, consumo de alcohol, hbito de fumar y al uso de marihuana.
Los autores recomiendan que los padres, maestros, mdicos y pediatras estn alertas para
vigilar de cerca el comportamiento de los adolescentes, en el momento en que aparecen con
tatuajes y/o perforaciones.
V. RECOPILACIN DE DATOS
Los datos fueron recogidos mediante una encuesta con preguntas de opcin mltiple. La
poblacin est constituida por jvenes que estudian en las siguientes universidades de
Cochabamba: UMSS, Catlica, UPB y UNIVALE. Se estimo que el nmero de la poblacin
universitaria a la cual se diriga nuestra investigacin era de 30000. La muestra fue de 100
328
encuestas, con probabilidad de 0.5, y con z = 1.96, con estos datos se constat que el error
de nuestra investigacin asciende a 10%
La encuesta que se realiz es la siguiente:
ENCUESTA
Esta investigacin tiene como objetivo recopilar informacin sobre la higiene y sanidad de los
lugares donde los jvenes se hacen piercings (perforaciones) o tatuajes en nuestra cuidad y
ver la relacin con el precio y la zona del cuerpo en la que se realizan la perforacin o tatuaje.
Te agradecemos de antemano contestar siguiendo las instrucciones.
Marque con una cruz la repuesta verdadera o responda a las preguntas en desarrollo
Datos generales
1. Edad
q 17-19
q 19-21
q 21 mas
2. Sexo
q Femenino
q Masculino
q Tatuaje
q Perforacin
q Ninguno
q Oreja(s)
q Lengua
q Ceja(s)
q Labio
q Ombligo
q Otros. Dnde?_____________
q Espalda
q Pecho
q Cuello
q Tobillo
q Brazos(s)
q Vientre
Tatuajes:
Dnde?_________
329
Otros.
q Si
q No
8. Sufriste alguna infeccin por hacerte la perforacin o tatuaje?
Perforacin: q Si
q No
Tatuaje:
q Si
q No
Tatuaje______________
10. Crees que haya alguna relacin entre el precio del tatuaje o perforacin y las
condiciones de sanidad del lugar donde se realizan?
q Si
q No
VI. ORGANIZACIN
La organizacin de los datos, sus respectivas grficas y la interpretacin de stas, se
muestran a continuacin. Por cada hoja se presenta su tabla, grfica y anlisis.
Edad
Li-1 - Li ni
17-19 45
19-21 29
21-25 26
Total 100
hi
45
29
26
100
Ni
45
74
100
Hi
45
74
100
xi
18
20
23
xi*ni
810
580
598
1988
Interpretacin:
45 de los 100 estudiantes tienen entre 17 y 19 aos.
El 29% de los estudiantes tienen entre 19 a 21 aos.
74 de los 100 estudiantes tienen como mximo 21 aos.
El 74% de los estudiantes tienen como mximo 21 aos.
Estadgrafos:
Media = 19.88.
Mediana = 19.34.
Moda = 19.
21-25
26%
17-19
45%
19-21
29%
Sexo
Ai
Femenino
Masculino
Total
ni
53
47
100
hi
53
47
100
Masculino
47%
Femenino
53%
Nmero de Perforaciones
xi
1
2
3
4
5
6
7
11
Total
ni
17
12
5
9
4
2
2
1
52
hi
32.69
23.08
9.62
17.31
7.69
3.85
3.85
1.92
100.00
Ni
17
29
34
43
47
49
51
52
Hi
32.69
55.77
65.38
82.69
90.38
94.23
98.08
100.00
xi*ni
17
24
15
36
20
12
14
11
149
xi2*ni
17
48
45
144
100
72
98
121
645
(xi- x )2*ni
59.15
8.99
0.09
11.59
18.23
19.65
34.19
66.17
218.06
(xi- x )4*ni
205.84
6.73
0.00
14.92
83.05
193.09
584.48
4378.73
5466.84
Interpretacin:
El 32% de los estudiantes tienen una perforacin.
El 83% de los estudiantes encuestados tienen a lo sumo 4 perforaciones.
331
Estadgrafos:
Media = 2.87.
Mediana = 2.
32.69
30
23.08
25
20
hi
17.31
15
9.62
10
7.69
3.85
3.85
1.92
0
1
11
xi
Nmero de Tatuajes
xi
1
2
3
4
5
6
Total
ni
hi
Ni
Hi
18 54.55 18 54.55
9 27.27 27 81.82
2 6.06 29 87.88
2 6.06 31 93.94
1 3.03 32 96.97
1 3.03 33 100.00
33 100.00
xi*ni
18
18
6
8
5
6
61
xi *ni
18
36
18
32
25
36
165
(xi- x ) *ni
12.96
0.21
2.65
9.26
9.93
17.24
52.24
(xi- x ) *ni
9.33
0.00
3.52
42.86
98.65
297.05
451.40
Interpretacin:
El 55% de los estudiantes tienen un tatuaje.
El 94% de los estudiantes tienen como mximo 4 tatuajes.
Estadgrafos:
Media = 1.85.
Mediana = 1.
Moda = 1.
54.55
50
hi
40
27.27
30
20
10
6.06
6.06
3.03
3.03
0
1
xi
Lugar de Perforacin
Ai
Oreja
Ombligo
Ceja
Otros
Lengua
Labio
Total
ni
41
15
12
10
9
6
93
hi
44.09
16.13
12.90
10.75
9.68
6.45
100
Hi
44.09
60.22
73.12
83.87
93.55
100.00
120
100
93.55
83.87
hi, Hi
80
60
40
100.00
73.12
60.22
44.09
44.09
16.13
20
12.90
10.75
9.68
6.45
Ceja
Otros
Lengua
Labio
0
Oreja
Ombligo
Ai
Interpretacin:
333
Lo ms usual es que los estudiantes se hagan una perforacin en la oreja (44% lo hacen).
Los lugares ms escogidos son: Oreja, Ombligo, Ceja. El 73% de los estudiantes eligen estos
lugares de su cuerpo. La lengua y los labios son los lugares menos elegidos.
Lugar del tatuaje
Ai
Espalda
Brazo(s)
Tobillo
Vientre
Pecho
Cuello
Otros
Total
ni
18
10
7
7
4
2
2
50
hi
36.00
20.00
14.00
14.00
8.00
4.00
4.00
100
Hi
36.00
56.00
70.00
84.00
92.00
96.00
100.00
120
100
84.00
80
hi, Hi
100.00
96.00
92.00
70.00
60
40
20
56.00
36.00
36.00
20.00
14.00
14.00
8.00
4.00
4.00
Cuello
Otro s
0
Espalda B razo (s) Tobillo
Vientre
P echo
Ai
Interpretacin:
Lo ms usual es que los estudiantes se hagan un tatuaje en la espalda (36% lo hacen).
Los lugares ms escogidos son: Espalda, Brazo(s), Tobillo y vientre. El 84% de los
estudiantes eligen estos lugares de su cuerpo. El pecho y el cuello son los lugares menos
elegidos.
Precio del Tatuaje
Li-1- Li
0-5
5'-35
35'-60
60'-120
120'-220
220'-300
300'-400
ni
hi
Ni
Hi
xi
1 3.23 1 3.23 2.5
2 6.45 3 9.68 20
3 9.68 6 19.35 47.5
10 32.26 16 51.61 90
3 9.68 19 61.29 170
7 22.58 26 83.87 260
2 6.45 28 90.32 350
xi*ni
xi2*ni
(xi- x ) *ni
2.5
6.25
31334.71
40
800
50890.79
142.5 6768.75 52284.77
900 81000 80131.37
510 86700
271.67
1820 473200 45343.57
700 245000 58129.50
334
(xi- x ) *ni
981864046.87
1294936296.31
911232564.69
642103703.01
24601.55
293719962.79
1689519415.37
Estadgrafos:
Media = 179.52
Mediana = 117.00
100.00
96.77
90
90.32
83.87
80
hi, Hi
70
61.29
60
51.61
50
40
32.26
30
22.58
20
10
3.23
6.45 9.68
9.68
19.35
9.68
6.45
6.45
300'-400
400'-500
3.23
0-5
5'-35
35'-60
60'-120
120'-220
220'-300
3.23
500'-600
Li-1 - Li
Interpretacin:
El 32.26% de los estudiantes pagan entre 60 y 120 Bs. Es lo ms frecuente.
El 83.87% de los estudiantes pagan por un tatuaje como mximo 300 Bs.
Precio de la perforacin
Li-1- Li
0-10
10'-15
15'-25
25'-50
50'-100
100'-130
130'-150
ni
10
2
6
3
5
6
5
hi
19.61
3.92
11.76
5.88
9.80
11.76
9.80
Ni
10
12
18
21
26
32
37
Hi
19.61
23.53
35.29
41.18
50.98
62.75
72.55
xi
xi*ni
5
50
12.5
25
20
120
37.5 112.5
75
375
115 690
140 700
335
xi *ni
250
312.5
2400
4218.75
28125
79350
98000
(xi- x )2*ni
87936.59
14886.58
37232.54
11263.70
2826.14
1579.60
8497.71
(xi- x )4*ni
773284331.38
110805163.07
231043677.06
42290287.45
1597409.60
415855.60
14442198.77
150'-200
200'-250
250'-330
Total
5
8
1
51
29051.63
127463.00
36567.19
357304.66
168799403.69
2030851886.86
1337159245.59
4710689459.06
Estadgrafos:
Media = 98.77
100.00
98.04
90
82.35
80
72.55
70
62.75
50.98
50
41.18
40
30
20
Hi
hi
60
35.29
19.61
19.61
10
23.53
11.76
5.88
3.92
9.80
11.76
15.69
9.80
9.80
1.96
0
0-10
10'-15
15'-25
25'-50
50'-100
100'-130
130'-150
150'-200
200'-250
250'-330
Li-1 - Li
Interpretacin:
El 19.61% de los estudiantes pagan entre 0 y 10 Bs. por una perforacin. Es lo ms frecuente.
El 82.35% de los estudiantes pagan por una perforacin como mximo 200 Bs.
Relacin entre la Edad y Caractersticas en Tatuajes y Perforaciones
Edad
Caracteres
17-19 19'-21 21'-25 Total
Tatuaje
4
5
4
13
Perforacin
19
11
4
34
336
Ambos
Ninguno
Total
6
16
45
4
9
29
9
9
26
19
34
100
40
34
35
34
hi,j (%)
30
25
19
20
19
16
15
10
5
13
11
4
9 9
4 4
0
17-19
19'-21
21'-25
Total
Edad
Tatuaje
Perforacin
Ambos
Ninguno
Interpretacin:
Lo ms frecuente es que los estudiantes se realicen perforaciones (34%) o ninguna (34%).
Lo ms usual de los estudiantes entre 17 y 19 aos es que se realicen perforaciones (19%).
Lo ms usual de los estudiantes entre 19 y 21 aos es que se realicen perforaciones (11%).
Lo ms usual de los estudiantes entre 21 y 25 aos es que se realicen perforaciones y
tatuajes (9%) o ninguno de ellos (9%).
Los que se hacen ms perforaciones son estudiantes de 17 a 19 aos.
Los que se hacen ms tatuajes son estudiantes de 19 a 21 aos.
Los que se hacen ms tatuajes y perforaciones a la vez son estudiantes de 21 a 25 aos.
Los que se no se han hecho ni tatuajes o perforaciones son estudiantes de 17 a 19 aos.
Relacin entre el Sexo y Caractersticas en Tatuajes y Perforaciones
Sexo
Caracter
Femenino Masculino
Tatuaje
4
9
Perforacin
22
12
Ambos
11
8
Ninguno
16
18
Total
53
47
337
Total
13
34
19
34
100
40
34
35
34
hi,j (%)
30
22
25
20
15
10
5
11
19
18
16
9
13
12
8
0
Femenino
Masculino
Total
Sexo
Tatuaje
Perforacin
Ambos
Ninguno
Interpretacin:
Lo ms frecuente es que las estudiantes mujeres se realicen ms perforaciones (22%) que los
hombres (12%).
Ocurre los contrario con los tatuajes. Los hombres se practican ms tatuajes (9%) que las
mujeres (4%).
Las mujeres se hacen ms perforaciones y tatuajes (11%) que los hombres (8%).
Las mujeres se abstienen ms de hacerse tatuar o perforar (16%) que los hombres (18%).
Sin embargo estas diferencias pueden no ser significativas.
Relacin entre Precio y Sanidad
Ai
Si
No
No respondi
Total
ni
58
4
4
66
hi
87.88
6.06
6.06
100
ri
14.5
1.0
1.0
Interpretacin:
Lo mas frecuente es que los estudiantes crean que existe relacin entre el precio del tatuaje o
perforacin y las condiciones de sanidad. El 88% manifest esta opinin.
Por cada persona que dijo que no cree que exista relacin entre el precio y la sanidad,
hubieron 15 que dijeron que si.
338
No
6%
No
respondi
6%
Si
88%
VII. CONCLUSIONES
La mayora de los jvenes encuestados tienen por lo menos un tatuaje o una perforacin, este
ltimo se hace ms frecuente en chicas.
Aquellas personas que se hicieron un tatuaje o una perforacin estn de acuerdo en que si
hay relacin entre los precios y la higiene y sanidad que presenta el lugar donde se los
hicieron.
Se comprob que la poblacin universitaria tiene en mayor cantidad perforaciones que
tatuajes; con ello no se descarta que no tienen o prefieran tatuajes, pero excepcionalmente la
proporcin de estudiantes que tienen perforaciones es mayor que la que tiene tatuajes.
Al comparar hombres con mujeres (estudiantes de las distintas universidades) en relacin a lo
que tienen ms, en ambos casos se comprob que tienen ms perforaciones.
No existe relacin entre la edad y el nmero de tatuajes o perforaciones.
Se prob que el nmero promedio mximo de tatuajes era 3 y de perforaciones 4.
Se comprob que tanto hombres como mujeres tienen una edad promedio significativamente
igual, en lo que se refiere a tener tatuajes o perforaciones. Es decir no es verdad que las
mujeres presenten tatuajes a una edad mayor que la de los varones. Como tampoco es
verdad (descartando las perforaciones que tienen las mujeres en las orejas) que stas ultimas
presenten perforaciones a una edad ms temprana que la de los varones.
La mayora de los jvenes prev infecciones hacindose tanto las perforaciones como los
tatuajes en lugares higinicos.
VIII. RECOMENDACIONES
Despus de haber realizado el estudio, surge una gran preocupacin, porque tanto las
perforaciones como los tatuajes son dainos para la salud y pueden llevar a infecciones
muy severas y en muchos casos a generar cncer. No obstante de que se comprob que
la mayora de los jvenes se hacen los tatuajes o perforaciones en lugares higinicos,
339
tambin se constat que el nmero promedio en ambos casos tiende a ser regular con una
propensin a alto.
340
ANEXO 4
UTILIZACIN DE LAS HERRAMIENTAS ESTADSTICAS
DEL EXCEL
El propsito de este anexo es el mostrar que existe una herramienta de software que puede
resolver muchos tipos de problemas estadsticos y que no tenemos que buscarla, ni bajarla,
etc., pues ya la tenemos en la mayora de las computadoras, en el paquete MICROSOFT
OFFICE, el Microsoft Excel.
Este desarrollo de la herramienta EXCEL, no pretende ser exhaustiva, sino solo indicativa y
ejemplificadora, para que el estudiante vea la conveniencia de usarla posteriormente en su
trabajo final, materias posteriores o en su vida profesional.
GRFICOS
El EXCEL tiene la siguiente presentacin.
340
Para la confeccin de los diferentes tipos de grficos que nos facilita el EXCEL, en una hoja
de clculo, a partir de nuestros datos procedemos de la siguiente manera:
Se localiza en la barra de herramientas la palabra Insertar, y en el men posterior la palabra
Grfico.
Posteriormente aparece la siguiente pantalla para la seleccin del tipo de grfico deseado.
341
oprimimos la flecha
En la casilla para introducir Rango de datos
de la derecha y a continuacin marcamos las filas y columnas en la hoja de clculo con la
informacin que deseamos procesar. Como los datos que presentamos estn recogidos por
alumno en cada columna, seleccionamos la palabra columna en Series en:
342
En el asistente para grficos ahora seleccionamos Serie para introducir los nombres de las
series y los rtulos de las categoras.
La forma de proceder es la misma que hemos explicado anteriormente. Para colocar el
nombre de la serie se selecciona la serie y en la cuadrcula de nombre se identifica la
cuadrcula que tiene el nombre de nuestra serie, en nuestro primer caso Alumno I.
343
Luego de completar todos los datos sealados anteriormente obtenemos el siguiente grfico
en la hoja clculo de Excel.
344
ESTADGRAFOS
Para calcular los diferentes estadgrafos seleccionamos del men principal la opcin
Insertar, en el submen la palabra Funcin, y en Categora la palabra Estadsticas como
se muestra en las siguientes pantallas.
345
346
347
348
Para el coeficiente de correlacin con los mismos datos se elige la siguiente funcin.
349
Existen otras funciones que nos permiten realizar clculos estadsticos con ms detalle. Se
selecciona la opcin herramientas del men principal y luego anlisis de datos. En el
cuadro que aparece a continuacin se elige la opcin de anlisis deseada, por ejemplo
regresin.
350
Luego de introducir los datos en el cuadro anterior se obtienen los siguientes resultados.
351