Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Tomo I (cap. 1, 2 y 3)
Coordinacin Acadmica
Secretara de Asuntos Acadmicos
Mgter. Gerardo Heckmann
Coordinacin Organizativa de Divisiones a Distancia
Lic. David Taborda
AUTORES
Norma Patricia Caro
Rosana Beatriz Casini
Margarita Daz
Fernando Garca
Mariana Gonzlez
Martn Saino
Mara Ins Stmolo
Maquetacin de materiales
Lic. Vctor R. Cacciagi y Lic. Ismael Rodrguez
Captulo 1:
Los mtodos estadsticos en la investigacin cientfica
1. Introduccin 1
2. Por qu estudiar estadstica? 1
3. Breve historia de la estadstica 2
4. Qu es la Estadstica? 3
4.1. Poblacin y muestra 4
4.2 Estadstica descriptiva e inferencial 5
5. Etapas del mtodo estadstico 6
5.1. Planteamiento del Problema 7
5.2. Recopilacin de datos 10
5.3. Tipos de variables 13
5.4 Organizacin y presentacin de datos estadsticos 16
5.4.1 Distribuciones Unidimensionales 17
5.4.2 Distribuciones Bidimensionales 33
5.4.3. Otro tipo de Grfico: Grfico logartmico. 42
5.5. Algunos lineamientos a considerar en la presentacin de informes 45
6. Actividades de aprendizaje 46
7. Casos de discusin y anlisis 53
8. Referencias Bibliogrficas 56
Soluciones y respuestas al Captulo 1 57
Captulo 1
Los mtodos estadsticos
en la investigacin cientfica
Captulo 1: Los mtodos estadsticos en la investigacin cientfica
1. Introduccin
En el rea contable:
Analizar determinadas variables en el tiempo, tales como nivel de factu-
racin, de gastos, ndices de endeudamiento, etc.
Seleccionar muestras de comprobantes y realizar tareas de control.
Realizar control de calidad sobre los artculos fabricados por una em-
presa.
Estudiar los factores que inciden en la rentabilidad de las empresas.
En el rea de economa:
Cuantificar el impacto de ciertos factores en el desempleo.
Medir la distribucin del ingreso.
Modelar el comportamiento del Producto Bruto Geogrfico a travs del
tiempo.
En el rea de administracin:
Identificar el perfil requerido de los empleados de una empresa.
Mejorar la calidad de los servicios.
Estimar la proporcin de clientes que prefieren determinados produc-
tos.
4. Qu es la Estadstica?
Como hemos hecho referencia en el punto anterior, los mtodos estads-
ticos constituyen una herramienta indispensable para llegar a conclusiones
confiables a partir de resultados empricos que surgen del anlisis de datos.
En un sentido amplio, la estadstica es el arte y la ciencia de reunir, anali-
zar, presentar e interpretar datos. Mood y Graybill expresan que la estadstica
es la tecnologa del mtodo cientfico. La estadstica proporciona instrumentos
para la toma de decisiones cuando prevalecen condiciones de incertidumbre
(1978; pag 3). Otros autores consideran que es la ciencia desarrollada para re-
solver problemas en presencia de variabilidad. La esencia de la estadstica con- 3
siste en el desarrollo y uso de modelos de pensamiento que se dirigen hacia la
comprensin del mundo real y a la prediccin del futuro ya que tiene en cuenta
la incertidumbre.
Podr leer el Informe del An- La Unin Industrial de Crdoba, durante el ao 2006, realiz un estudio para
lisis de las industrias de Crdo- analizar distintos aspectos de la actividad industrial. Para ello, de la poblacin
ba en la seccin Enlaces de de 2000 industrias radicadas en la provincia (N=2000), se tom una muestra
Inters del aula virtual. aleatoria de 150 empresas (n=150).
En este ejemplo, para una muestra aleatoria simple, cada una de las 2000 in-
dustrias tiene igual probabilidad de ser seleccionada (0,005=1/2000). Una
forma de conformar la muestra de 150 empresas es elegir al azar 150 nmeros
de un listado de 2000 nmeros que se han asignado a las empresas. El listado
4 de las 2000 industrias se denomina en estadstica marco muestral.
Parmetro y Estadstico
Toda medida resumen que se calcula para describir caractersticas poblaciona-
les se llama parmetro, el cual es una cantidad fija que generalmente no se co-
noce y debe ser estimada. Un estadstico es una medida calculada con las ob-
servaciones muestrales.
5
En esta asignatura aprenderemos los mtodos englobados en estadstica
descriptiva, as como la teora de probabilidad y variables aleatorias. En el lti-
mo captulo introduciremos al estudio de las distribuciones en el muestreo, que
constituye el fundamento terico para el estudio de los mtodos inferenciales.
Ejemplo Anlisis Industrias de Crdoba
7
Estudios Exploratorios: estos estudios se basan en casos seleccionados discre-
cionalmente (no aleatoriamente) y suelen ser el paso inicial de estudios poste-
riores, porque ayudan a familiarizarnos con la situacin o el problema, a identi-
ficar las variables importantes y a utilizar estas ltimas para plantear hiptesis
que puedan ponerse a prueba en una investigacin posterior.
clusiones vlidas se deben controlar algunos factores como pueden ser la cali-
dad del suelo y la cantidad de riego.
- En investigacin de mercado, cuando se desarrolla un nuevo empaque para un
producto y se desea conocer si el mismo va a tener xito en cuanto al aumento
de las ventas. El producto se vende en 10 supermercados de la ciudad. El inves-
tigador de mercado dividir a los supermercados en dos grupos de 5. A un gru-
po de 5 supermercados enviar el producto envasado en el empaque tradicional
y al otro grupo de 5 supermercados enviar el producto con su nuevo envase. La
aleatorizacin ser contemplada por el investigador si la asignacin de los su-
per- mercados a los distintos empaques se hace estrictamente al azar. Si se ha
respetado esta aleatorizacin, se puede aplicar una metodologa estadstica
conveniente que le permitir tomar decisiones en cuanto a la eficacia del nuevo
empaque.
Algunos de los numerosos ejemplos que podemos plantear son los siguientes:
Diseo de cuestionarios
19. Necesita financiacin para exportar? 22.El monto total de las exportaciones en el 2005 comparadas con las del 2004
1. DNI (tres ultimos dgitos): 2.. SEXO: 2.1. Masculino 2.2. Femenino
19. Cunto tiempo (en horas) dedica en promedio para preparar un examen de:
Hbitos de vida
21. Fuma:
1.Si 2. No
1. Todos los das 2. Todos los fines de semana 3.Eventualmente en algunas ocasiones
4. Nunca
11
En ambos modelos de cuestionarios pueden observarse dos tipos de pre-
guntas:
1) aquellas que se completan con la informacin solicitada, las que se de-
nominan preguntas abiertas -por ejemplo la pregunta 24 del primer cuestiona-
rio- y
2) preguntas en la que el entrevistado debe seleccionar una o ms de las
opciones presentadas, las que se denominan preguntas cerradas. Tambin es
conveniente sealar que el cuestionario no debe ser demasiado largo y que las
preguntas deben ser concisas, no ambiguas y preferentemente de tipo cerradas.
Las preguntas abiertas condicionan menos al entrevistado y permite explorar
significados pero la desventaja es que reciben mayor influencia del encuesta-
Algunos organismos importan- dor, hay ms dificultad para codificar las respuestas y se recaban ms respues-
tes con informacin estadstica tas inapropiadas.
disponible son:
Los datos de fuentes secundarias son aquellos que han sido reunidos y
- Instituto Nacional de Estads- publicados por otras instituciones.
ticas y Censos.
- Direccin Nacional de Esta- En general se trabaja con datos provenientes de organismos pblicos o
dsticas y Censos de la Provin- privados tales como INDEC, BCRA, AFIP, Cmaras empresariales, ONU, FMI,
cia.
slo para mencionar algunos, muchos de los cuales, desde hace algunos aos
- Comisin Econmica para
Amrica Latina y el Caribe. estn disponibles en internet.
Los datos de fuentes primarias son los que recopila el propio investigador
Podr acceder a los sitios ofi- para resolver un problema particular. Un instrumento habitual para recoger
ciales desde la seccin Enlaces datos primarios es el cuestionario, en el que se formulan preguntas respecto a
de Inters del aula virtual. datos personales, opiniones, actitudes, comportamiento y otras caractersticas.
Actividad 1
En cada uno de los siguientes casos defina la poblacin y clasifique el tipo de
estudio de acuerdo a sus objetivos.
De la Encuesta Permanente de Caso 1.- La Encuesta Permanente de Hogares se realiza dos veces al ao
Hogares se han extrado algu- en base a una muestra representativa de hogares de las principales ciudades
nas variables para 100 casos de del pas. El objetivo de la misma consiste en describir la situacin del empleo y
1 onda. la comparacin de situaciones de desempleo entre ciudades y entre perodos en
Podr acceder a ella desde la los cuales se realiza la encuesta.
seccin Enlaces de Inters ->
Bases de Datos -> EPH.XLS del
aula virtual. Caso 2.- El Departamento de Compras de una fbrica de tractores ha en-
carado el estudio de la duracin de las bateras que compra a 3 proveedores con
el fin de mejorar la calidad de sus productos en base a un plan de calidad total.
Para ello solicita una muestra de 10 bateras a cada uno de los proveedores,
cuidando que todas las bateras tengan exactamente las mismas caractersticas
de funcionamiento.
Las bateras son llevadas al Departamento de Investigacin y Desarrollo
de la fbrica donde se han implementado una serie de tests de durabilidad
apropiada. Todas las bateras son sometidas a los mismos tests bajo las mismas
condiciones (calor, humedad, personal encargado de efectuar las mediciones,
etc.). Al finalizar se anota una cierta medida de durabilidad que luego ser
comparada entre los 3 proveedores para ver si hay alguno de ellos que se dife-
rencia realmente en cuanto a la calidad de las bateras.
12
Caso 3.- Una Oficina de Salud desea efectuar un estudio de la tasa de
mortalidad asociada a la causa del fallecimiento. Para ello utiliza los certificados
de defuncin otorgados en distintas municipalidades. El objetivo del estudio
consiste en tomar acciones preventivas para disminuir el riesgo de determina-
das enfermedades.
Captulo 1: Los mtodos estadsticos en la investigacin cientfica
Sexo: Mujer
Cantidad de materias aprobadas: 3
Gasto en libros: $147
Por ejemplo:
1. Muy Fcil
2. Fcil
3. Regular
4. Difcil
14 5. Muy Difcil
Por ejemplo, el nivel de ingresos de los jefes de hogar puede obtenerse Esta limitacin puede ser defi-
en una escala numrica (escala de razn) como Ingresos obtenidos en nida en pos a una respuesta
ms confiable, sabiendo que la
pesos en el ltimo mes.
informacin sobre ingresos no
siempre es dada en forma fide-
Sin embargo, puede el nivel de ingresos organizarse como categoras, definien- digna por prejuicios de ndole
do por ejemplo tres categoras, a saber: ingresos bajos (de 0 a 5000$), ingre- social o impositivo, los que se
sos medios (de 5000 a 15000$) e ingresos altos (ms de 15000$). En este l- evitan definiendo intervalos de
timo caso hemos modificado la escala pasando de una escala de razn a una ingresos en la pregunta.
escala ordinal, limitando las posibilidades de anlisis de los datos.
Actividad 2:
1- Determine si cada una de las siguientes variables es categrica (cualitativa)
15
o numrica (cuantitativa), ysi es numrica indique si es discreta o continua.
Una vez que disponemos de los datos los organizamos en una tabla don-
de en las columnas definimos las variables y en las filas cada individuo A esta
tabla la denominamos base de datos
Actualmente la disponibilidad de datos en soporte electrnico, permite
trabajar los mismos desde programas informticos orientados especialmente
Infostat para la organizacin y anlisis de datos. Existe una gran oferta de estos progra-
Este software ha sido diseado mas dentro de los cuales hemos seleccionado Infostat. El diseo de Infostat es
en la Universidad de Crdoba similar al de otros softwares estadsticos, lo que brinda al usuario la posibilidad
desde la Facultad de Ciencias de adaptarse de manera relativamente fcil, y adems cuenta con un manual
Agropecuarias. de ayuda al que se puede acceder seleccionando la opcin MANUAL en el me-
Existe una versin libre dispo- n AYUDA.
nible su pgina web. Usted
puede solicitar una clave gra- Aspectos generales del software
tuita ingresando por Clave Al abrir InfoStat, se visualizar una barra de herramientas localizada en la
gratuita para versin estudiantil.
parte superior de la ventana del programa, la que contiene los siguientes me-
Para una introduccin ms ns: Archivo, Edicin, Datos, Resultados, Estadsticas, Grficos, Ventanas, Apli-
detallada del uso del software caciones y Ayuda. Los softwares estadsticos en general permiten crear una
puede consultar la Gua de base de datos o leer una base de datos generada por otro programa (excel, ac-
introduccin al uso del softwa- ces, o algn programa estadstico). En Infostat podemos abrir una base de datos
re estadstico InfoStat dispo- en formato del programa (extensin idb) o desde otros formtos comoo Excel,
nible en la seccin Enlaces de veamos a continuacin como abrimos la base alumnos.xls (disponible en la
Inters del Aula Virtual. seccin Materiales y Recursos del aula virtual).
Cada fila
representa
un caso u
observacin
con todas las
variables
Para abrir una base de datos elaborada con otro aplicativo seleccione men
ARCHIVO -> ABRIR y en el recuadro que se despliega busque el archivo y marque la
opcin ABRIR.
El programa permite tener abiertas varias bases de datos (tablas) simultneamente, las
que pueden desactivarse con la opcin ARCHIVO -> CERRAR.
Captulo 1: Los mtodos estadsticos en la investigacin cientfica
Las bases pueden guardarse en formato InfoStat (con extensin .idb - InfoStat Data
Base) correspondiente al Infostat con Men ARCHIVO -> GUARDAR TABLA. Otra
posibilidad es guardar la tabla con otro formato (EXCEL, texto, DBASE, Paradox) usando
la opcin GUARDAR TABLA COMO.
Una vez que disponemos de una base de datos es posible realizar modificaciones en la
misma.
El men DATOS tiene una serie de opciones para definir el tipo de datos y realizar algu-
nas acciones sobre las filas (datos) o columnas (variables) de la tabla.
Variables Categricas
Para armar una tabla resumen de este tipo de variables, contamos la cantidad
Los ejemplos se ilustrarn con
de casos que pertenecen a cada clase o categora, lo que se denomina frecuen-
las variables de la base de in-
cia absoluta y calculamos la proporcin de casos en cada una de ellas, lo que se dustrias cordobesas (indus-
denomina frecuencia relativa, las que pueden expresarse en porcentajes. Con trias.xls) y se indicarn los
estas frecuencias, se puede construir una tabla de tres columnas, donde en la comandos del programa esta-
primera se anotarn las categoras y en las otras dos, la cantidad y el porcentaje dstico Infostat. Podr acceder
de observaciones. a este archivo en la seccin
Para la variable Sector de la Economa al que pertenecen 148 industrias, Enlaces de Inters del aula
cuyas categoras estn expresadas en escala nominal, las frecuencias se pre- virtual.
sentan en la Tabla 1.1.
Tablas de frecuencias
Variable Clase FA FR
Cat_sector 1 49 0,33
Cat_sector 2 36 0,24
Cat_sector 3 50 0,34
Cat_sector 4 13 0,09
Grfico 1.1.
Sector de la economa
18
Captulo 1: Los mtodos estadsticos en la investigacin cientfica
Grfico 1.2.
Sector de la economa
Sector de la Economa
51,9
Caso: frecuencia absoluta
41,7
31,5
21,3
11,2
Agropecuario No metlicos Metlicos Otras
Cat_sector
Del anlisis de la tabla y los grficos podemos decir que en esta muestra, las
empresas del sector industrial de productos metlicos y del sector de origen
agropecuario poseen participacin similar en el total, siendo los dos grupos ms
representativos, le siguen en importancia las industrias de productos no metli-
cos. Otra variable categrica relevada en escala ordinal fue la opinin de las
empresas acerca de la suficiencia de la oferta de mano de obra calificada. Las
respuestas se agruparon en cuatro categoras, segn se presenta en la Tabla 1.2.
FRECUENCIA
SUFICIENCIA DE LA OFERTA DE FRECUENCIA PORCENTAJE
PORCENTAJE ABSOLUTA
MANO DE OBRA CALIFICADA ABSOLUTA ACUM.
ACUM.
Suficiente 50 33,8 50 33,8
Medianamente suficiente 42 28,4 92 62,2
Escasamente suficiente 39 26,4 131 88,5
Insuficiente 17 11,5 148 100,0
Total 148 100,0
131/148 x100
Actividad 3
El gerente de una empresa desea conocer la distribucin de empleados de
acuerdo a su nivel de instruccin mximo alcanzado. Una vez recolectada la
informacin realiz un resumen de los datos, obteniendo la siguiente tabla de
distribucin de frecuencias:
Variables numricas
En smbolos:
k
Frecuencias absolutas n
i =1
i =n kn N xmax = n
ni
Frecuencias relativas hi =
n
h
i
i =1 H xmax = 1
En Variables a graficar
van los casos
En criterio de clasificacin
va la variable que se quiere
graficar
22
Captulo 1: Los mtodos estadsticos en la investigacin cientfica
Grfico 1.4.
Cantidad de empleados rea Diseo e Ingeniera Industrial
(frecuencias absolutas)
14 Grfico de bastones
13
13
12
11
Caso: frecuencia absoluta
10
9
8
7
7
6
5
4
3
3
2
2
1 1
1
0
2 1 3 6 4 5
personal_diseo
Grfico 1.5.
Cantidad de empleados rea Diseo e Ingeniera Industrial
(frecuencias absolutas acumuladas)
Diagrama escalonado
30
25
frec. abs. acumulada
20
15
23
10
0
1 1 2 3 4 5 6 6
personal_diseo
Dada la naturaleza discreta de la variable, entre los valores 3 y 4, por
ejemplo, no asume ningn otro valor; por lo tanto dentro de ese intervalo la
frecuencia ser constante (igual a 23) y recin en 4 aumenta a 25 que se man-
tendr hasta el valor 5, y as sucesivamente.
Actividad 4:
La siguiente tabla muestra la cantidad de kioscos que tienen una
Cierta cantidad de cospeles
Actividad 5:
El gerente de ventas de La Favorita, desea lanzar una campaa de promocio-
nes para lograr que los compradores acudan con mayor frecuencia a su negocio.
Para obtener informacin pregunt a 25 consumidores mientras esperaban en
la caja para abonar: Cuntas veces concurri a este negocio en el ltimo mes?
Para un da particular obtuvo las siguientes respuestas:
4 5 3 3 1
4 6 5 4 2
6 6 7 1 5
1 2 4 3 2
2 4 7 7 6
50 45 30 7 10 50 30 30 50 39
40 50 8 25 49 25 50 38 50 10
30 25 5 7 40 26 20 30 25 40
40 40 25 40 66 25 38 21 40 33
33 30 78 15 5 10 38 40 10 66
8 30 18 20 50 35 7 20 36 30
30 20 30 20 40 15 25 35 26
25 60 40 10 25 38 32 30 40
28 40 40 22 52 40 40 8 6
25 50 50 30 35 19 25 47 15
25 60 35 10 18 25 23 29 20
20 50 50 3 10 20 15,3 20 55
45 20 17 30 30 35 17 45 40
13 15 20 30 35 40 20 50 20
40 35 50 10 25 25 50 35 35
Grfico 1.6.
Diagrama de Tallo y hoja de Porcentaje de Costo Laboral
25
Actividad 6:
El siguiente ejemplo muestra la distribucin de edades de 100 personas. El dia-
grama de tallo y hojas fue realizado empleando el programa SPSS (10.0).
2) Obtener la amplitud de los intervalos de clase (c): una opcin que se usa
frecuentemente es que todos los intervalos sean de igual amplitud, lo
cual facilita la interpretacin. Ese valor c se obtiene calculando la dife-
26 rencia entre el valor ms grande del conjunto de datos (valor mxi-
mo) y el ms pequeo (valor mnimo) dividiendo luego esta diferen-
cia entre el nmero de clases elegido. El desvo del numerador es lo
que se conoce como Recorrido o Rango (R).
Donde:
c: amplitud de cada intervalo.
R: recorrido o rango de variacin de la variable.
k: cantidad de intervalos elegidos.
Para el ejemplo:
78 3
c= = 10, 714 11
7
c= 11 donde: c es la amplitud definida
1 por defecto
R- R = 77 - 75 = 2
1 por exceso
R- R = 3 -1 =2
3) Establecer una regla general para definir los lmites del intervalo de cada
clase: para evitar el doble conteo de las observaciones. Los intervalos
sern semiabiertos, pueden ser abiertos por derecha o por izquierda.
Por ejemplo, en la primera alternativa los intervalos son: [ ) cerra-
dos por la izquierda y abiertos por la derecha, lo que significa que se
incluir dentro del intervalo un valor que sea igual al lmite inferior;
mientras que un valor exactamente igual al lmite superior del inter-
valo, ser incluido en el intervalo siguiente. As el valor 35, para este
caso, se computar dentro del cuarto intervalo.
y0' + y1' 2 + 13
y1= = = 7,5
2 2
PORCENTAJE DE FREC.
FREC. PORCENTAJE
COSTO LABORAL PORCENTAJE ABSOLUTA
ABSOLUTA ACUM.
y 'i-1 - y 'i HI ACUM.
NI HI
NI
2 13 18 12,8 18 12,8
13 24 27 19,1 45 31,9
24 35 37 26,2 82 58,2
35 46 36 25,5 118 83,7
46 57 18 12,8 136 96,5
57 68 4 2,8 140 99,3
68 79 1 0,7 141 100,0
141 100,0
Para lograr una tabla de distribucin por intervalos en Infostat debe tildarse
la siguiente informacin: lmites inferiores (LI) y superiores (LS) de los in-
tervalos de clase, marca de clase (MC), frecuencias absolutas (FA), fre-
cuencias relativas (FR), frecuencias absolutas acumuladas (FAA) y frecuen-
cias relativas acumuladas (FRA). El nmero de clases, puede ser obtenido en forma
automtica o definido por el usuario (PERSONALIZADO). Para la forma automtica
InfoStat obtiene el nmero de clases tomando el log2(n+1) que da igual a 7 tal como lo
hemos construido.
Para ilustrar la posibilidad que da Infostat de calcular los intervalos en forma personali-
zada, construiremos una tabla de frecuencia para la variable de cinco intervalos. Para
ello, tildando la opcin Personalizado, debe indicarse 5 intervalos, definiendo el mnimo
y mximo valor de la variable. Por defecto, Infostat construye los intervalos cerrados a
la derecha, lo que se puede cambiar destildando la opcin en el cuadro de dialogo.
28
Captulo 1: Los mtodos estadsticos en la investigacin cientfica
Grfico 1.7.
Porcentaje de Costo Laboral
Polgono de
frecuencias
(a)
POLIGONO DE FRECUENCIAS
0,26
30
frecuencia relativa
0,17
0,09
0,00
-8 3 14 24 35 46 57 67 78 89
costos lab/costo totAL
(b)
Captulo 1: Los mtodos estadsticos en la investigacin cientfica
Grfico 1.8.
Ojiva de base menor para el de frecuencias acumuladas en porcentaje de Costo
Laboral
OJIVA
1,00
0,75
frec. rel. acumulada
0,50
0,25
0,00
-8 3 14 24 35 46 57 67 78 89
costos lab/costo totAL
Grfico 1.9.
Anlisis de la forma de la distribucin de los datos
Distribucin simtrica
31
Actividad 7:
Las ventas diarias (en $) para los ltimos 120 das de una compaa de servicios
de transporte se organizaron en la siguiente distribucin de frecuencias:
FRECUENCIA FRECUENCIA
FRECUENCIA FRECUENCIA
ABSOLUTA RELATIVA
INTERVALO ABSOLUTA RELATIVA
ACUMULADA ACUMULADA
yi 1 yi ni I hi Ni Hi
530 - 730 3
730 - 930 7
930 1130 11
1130 1330 22
1330 1530 40
1530 1730 24
1730 1930 9
1930 2130 4
32
Total 120
Captulo 1: Los mtodos estadsticos en la investigacin cientfica
Determine:
Actividad 8:
Los precios de venta (en miles de $) de 40 casas de una zona residencial de la
ciudad de Crdoba son los siguientes:
EXPORTA
SECTOR DE LA ECONOMA
Si No TOTAL
De Origen Agropecuario 10 39 49
Productos no metlicos 6 30 36
Productos metlicos 13 37 50
Otras Industrias 6 7 13
Totales 35 113 148
Y
Y1 Y2 YJ TOTAL
X
X1 n11 n12 n1J n1
X2 n21 n22 n2J n2
. . . . .
. . . . .
. . . . .
XI nI1 nI1 nIJ nJ
TOTAL n.1 n.2 n.J n
n
J
igual a la frecuencia mar-
ginal de la categora re- nij = ni .
j =1 j =1
3j = n3.
presentada en la fila.
n3. = 50
La suma de cada columna Para nuestro ejemplo j =2
I
34 es igual a la frecuencia
n
I
marginal de la categora n ij = n. j
i =1
i2 = n.2
representada en la co- i =1
lumna. n.2 = 113
La suma de las frecuen- I J I J
cias marginales por fila y
por columnas son iguales ni . = n
i =1
n. j = n
j =1
ni . = n
i =1
n
j =1
.j =n
al total de datos.
Captulo 1: Los mtodos estadsticos en la investigacin cientfica
nij
hij =
n
Tablas de contingencia
Frecuencias absolutas
En columnas:Cat_exporta
Cat_sector NO SI Total
De Origen Agropecuario 39 10 49
Productos no metlicos 30 6 36
Productos metlicos 37 13 50
Otras Industrias 7 6 13
Total 113 35 148
Grfico 1.10.
Anlisis conjunto de Sector de la economa y Exporta.
30
25 26
25
20 20
15 Exporta
10 No Exporta
9
5 7
4 4 5
0
De Origen Productos no Productos Otras
Agropecuario metlicos metlicos Industrias
En
cambio en un grfico de barras componentes, cada barra representa cada cate-
gora de una variable y se divide en tantas partes como categoras de la otra. A
continuacin veremos cmo construir con Infostat un grfico de barras compo-
nentes.
36
Para graficar ingrese a GRFICOS -> GRFICO DE BARRAS APILADAS. Como Varia-
bles seleccione SI y NO y como Criterio de Clasificacin, seleccione Cat_sector. El grfi-
co obtenido se muestra a continuacin:
Captulo 1: Los mtodos estadsticos en la investigacin cientfica
Grfico 1.11.
Cantidad de empresas que exportan en cada sector
39
Valores acumulados
26
13
0
De Origen AgropecuarioProductos no metlicos Productos metlicos Otras Industrias
Cat_sector
Grfico 1.12.
Proporcin de empresas que exportan dentro de cada sector
1,00
0,75
0,50
0,25
0,00
De Origen AgropecuarioProductos no metlicos Productos metlicos Otras Industrias
Cat_sector
Frecuencias condicionadas
X Y1 Y2 YJ TOTAL
X1 n11 / n1. n12 / n1. n1J / n1. 1
X2 n21 / n2. n22 / n2. n2J / n2. 1
. . . . .
. . . . .
. . . . .
XI nI1 / nI. nI1/ nI. nIJ / nI. 1
Tablas de contingencia
Frecuencias relativas por filas
En columnas:Cat_exporta
Cat_sector NO SI Total Frecuencias relativas
De Origen Agropecuario 0,80 0,20 1,00 exporta condicionadas
Productos no metlicos 0,83 0,17 1,00 al sector
Productos metlicos 0,74 0,26 1,00
Otras Industrias 0,54 0,46 1,00
Total 0,76 0,24 1,00
Las frecuencias condicionadas por columna, indican que del total de em-
presas exportadoras el 0,37 corresponden a Productos metlicos, el 0,29 co-
rresponden al sector agropecuario, el 0,17 a Productos No Metlicos y la misma
proporcin a otras industrias. Mientras que las no exportadoras el 0,35 son
38 empresas de origen agropecuario y el 0,33 de productos metlicos.
Captulo 1: Los mtodos estadsticos en la investigacin cientfica
Tabla 1.9. Localizacin de otras empresas con las que han participado en em-
prendimientos
LOCALIZACIN DE
FRECUENCIA ABSOLUTA PORCENTAJE
OTRAS EMPRESAS
Locales (100 km) 10 62,5
De la provincia 3 18,75
Nacionales 3 18,75
TOTAL 16 100,00
Grfico 1.13.
Grfico para frecuencias condicionadas
3 No participa
39
LOCALIZACIN FRECUENCIA
FRECUENCIA PORCENTAJE
DE OTRAS PORCENTAJE ABSOLUTA
ABSOLUTA ACUMULADO
EMPRESAS ACUMULADA
Locales (100 km) 10 62,5 10 62,50
De la provincia 3 18,75 13 81,25
Nacionales 3 18,75 16 100,00
TOTAL 16 100,00
Actividad 9:
Los establecimientos agropecuarios de la Provincia de Crdoba han sido clasifi-
cados de acuerdo a sus niveles de produccin, en altos, medianos y bajos y de
acuerdo a la zona geogrfica donde se encuentran ubicados. Los resultados se
muestran en la siguiente tabla:
NIVEL DE
ZONA A ZONA B ZONA C TOTAL
PRODUCCIN
Alto 69 47 23 139
Mediano 40 25 80 145
Bajo 38 32 36 106
TOTAL 147 104 139 390
Se pide:
a) En qu direccin sera preferible calcular los porcentajes? Por qu?
b) Calcule dichos porcentajes y obtener algunas conclusiones.
c) Obtenga la razn entre el nmero de establecimientos con nivel de pro-
duccin alto y el nmero de establecimientos con nivel de produccin
bajo en cada una de las tres zonas. Comente sus resultados.
Grfico 1.14.
Diagrama de Dispersin
150
120
90
60
30
0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85
Costos lab/costo total
Actividad 10
La tasa de desempleo (x) y la tasa de renuncia (y) para 13 regiones se relevaron
en un momento determinado del tiempo. Los datos obtenidos se presentan en
la siguiente tabla:
41
Construya un diagrama de dispersin y analice el tipo de relacin entre las va-
riables.
5.4.3. Otro tipo de Grfico: Grfico logartmico.
En primer lugar veamos la relacin que existe entre una progresin nu-
mrica aritmtica y una logartmica.
La siguiente secuencia de nmeros 1, 2, 4, 8, 16, 32, 64, 128, ... sigue una
progresin geomtrica y representa las potencias de 2 : 20, 21, 22, 23, 24, 25, 26,
27,... Examinando los exponentes observamos que los mismos siguen una pro-
gresin aritmtica 0, 1, 2, 3, 4, 5, 6, 7, donde la base de estas potencias es un
valor fijo.
Recordemos que un logaritmo est definido como la potencia a la cual se
eleva una base comn a fin de obtener un cierto valor prefijado. Utilizando esta
definicin en el ejemplo dado:
20 = 1 log 2 1 =0
21 = 2 log 2 2 =1
22 = 4 log 2 4 =2
23 = 8 log 2 8 =3
24 = 16 log 216 =4
25 = 32 log 232 =5
26 = 64 log 264 =6
.
.
42 .
tambin forman una serie aritmtica. La relacin entre las series permite tratar
a una serie geomtrica como aritmtica mediante el uso de los correspondien-
tes logaritmos de base comn y fija.
Volviendo a las series econmicas y comerciales, stas presentan un
comportamiento que podra ser asimilado a una serie geomtrica y que puede
ser analizado a travs de los logaritmos. Podemos transformar los datos en sus
correspondientes logaritmos, y por simple comparacin de los mismos es posi-
ble descubrir rpidamente cualquier variacin en los cambios.
Representacin grfica
Grfico 1.15.
Escala Aritmtica
43
Para analizar las variaciones porcentuales o las tasas de cambio de un
ao a otro necesitamos trabajar con logaritmos, en este ejemplo como una va-
riable es el tiempo ste se representa en el eje de las abscisas a escala aritmti-
ca. En el Grfico 1.16.a, la escala del eje de las ordenadas es logartmica y en el
Grfico 1.16.b se utiliz en el eje de las ordenadas una escala aritmtica pero se
graficaron los logaritmos de los valores de la variable.
Grfico 1.16.
(a) Escala Logartmica
Produccin Anual (en miles de pesos)
1000
100
EMPRESA A
EMPRESA B
10
1
2000 2001 2002 2003 2004 2005 2006 2007
Aos
Esta ltima grfica es posible construirla con Infostat, para ello trans-
formamos primero la variable con DATOS TRANSFORMAR, se-
leccionar la variable y en la ventana de dialogo siguiente la transfor-
macin que se quiere realizar. Para graficar seleccionar GRFICOS
GRFICO DE LA DISTRIBUCIN EMPRICA.
- Las tablas deben ser autoexplicativas, para que el lector no tenga nece-
sidad de acudir al texto para conocer de qu trata determinada tabla.
Las partes de una tabla son:
Nmero de orden: para facilitar la referencia a la tabla en
el texto.
Ttulo completo, claro y conciso: es decir, debe reflejar
claramente en qu consiste el contenido.
Cuadro propiamente dicho o cuerpo de la tabla.
Notas explicativas o calce (tambin se le llama pie). Sir-
ven para indicar la fuente de donde se obtuvieron los da-
tos y, de ser pertinente, la significacin estadstica o al-
guna breve nota aclaratoria del contenido.
7. Actividades de aprendizaje
Actividad 11:
Describa en cada uno de los casos mencionados ms abajo:
a) Cul es la poblacin?
b) Cul es la muestra?
c) Cul es la unidad estadstica?
d) Cul es la variable o caracterstica principal de cada estudio y de qu tipo es?
Actividad 12:
La empresa Nielsen efecta encuestas semanales a los televidentes residentes
en la ciudad de Crdoba. Sus calificaciones estadsticas indican el tamao de la
audiencia para cada uno de los principales programas de la televisin local. Las
calificaciones de los programas y la parte del mercado para cada canal se publi-
can semanalmente.
a) Qu trata de medir la empresa Nielsen?
b) Cul es la poblacin?
c) Usted cree que se utilizar una muestra?
d) Qu tipos de decisiones o acciones cree usted que se basan en las me-
diciones de Nielsen?
Actividad 13:
Una consultora encargada de efectuar estudios de mercado en Crdoba, pidi
a 800 consumidores que probaran un plato de pastas denominado ZIA MA-
RIA, que es de elaboracin reciente de un fabricante. De los 800 consumidores
consultados 600 dijeron que compraran el plato si se pusiera a la venta.
Actividad 14:
Un diario de Crdoba inform acerca del tipo de medios de comunicacin exis-
tentes en la ciudad. Los datos son los siguientes:
MEDIOS DE COMUNICACIN CANTIDAD
Diarios 3
Radios A.M. 4
Radios F.M. 49
Canales T.V. por aire 3
Canales T.V. por cable 5
Revistas 27
Actividad 15:
Determine si cada una de las variables es categrica o numrica. Si es numrica
indique si es discreta o continua, y cul es la escala de medicin.
A los estudiantes de la Facultad de Ciencias Econmicas se les pregunt:
Actividad 17:
Un peridico realiz una encuesta telefnica a 480 habitantes seleccionados
aleatoriamente de distintas reas de la capital cordobesa. La siguiente tabla
muestra las respuestas acerca de la opinin de los servicios de seguridad. La
pregunta realizada fue: En su barrio, son adecuados los servicios de polica y
de bomberos? Las respuestas obtenidas fueron:
Actividad 18:
Los siguientes datos se encuentran disponibles en archivos de una empresa.
Explicite el tipo de variable y la escala de medicin.
ARCHIVO DE PERSONAL
Variable Tipo de variable Escala de medicin
Barrio donde vive el empleado
Salario
Das de vacaciones
Das de ausencia por enfermedad
Edad
Adelantos de sueldo en un mes determinado
REGISTRO DE LA PRODUCCIN
Variable Tipo de variable Escala de medicin
Tipo de producto
Cantidad mensual producida por producto
Costo de la mano de obra
Costo de materiales
48 REGISTROS DE INVENTARIO
Variable Tipo de variable Escala de medicin
Existencia diaria por producto
Existencia diaria por insumo
Descuentos por producto
Captulo 1: Los mtodos estadsticos en la investigacin cientfica
REGISTROS DE VENTAS
Variable Tipo de variable Escala de medicin
Ventas mensuales por producto
Ventas mensuales por regin geogrfica
Ventas mensuales por tipo de cliente
Canales de venta
Actividad 19:
El rea de mercadotecnia de una empresa ha propuesto una nueva bebida die-
ttica que, piensa, captar una gran parte del mercado de adultos jvenes.
Actividad 20:
Las cotizaciones de un tipo de acciones en la bolsa para los ltimos 22 das fue-
ron las siguientes:
8.4 9.2 11.3 7.8 10.9 10.2 8.0 9.0 10.4 9.7 8.9
11.7 9.7 9.6 10.5 8.5 9.9 8.2 10.3 11.3 8.0 3.0
Actividad 21:
La siguiente tabla muestra datos correspondientes a la enegia anual generada
en el pas en Gigawatts/hora.
Para elegir el tipo de grfico, tenga en cuenta que cada uno de ellos debe permi-
tir discutir las siguientes opiniones:
Actividad 23:
Para 15 empresas se relev el precio y el margen de utilidad de un producto. Los
datos obtenidos (en miles de pesos) se presentan en la siguiente tabla:
Actividad 24:
Una heladera cuenta con dos sucursales en la Ciudad de Crdoba, una ubicada
en la zona Norte y otra ubicada en la zona Sur. A continuacin se presenta in-
50 formacin sobre el nmero de pedidos telefnicos recibidos por da, para una
muestra aleatoria de 20 das:
Zona
4 6 7 5 5 6 7 4 8 6 8 5 7 6 7 5 6 6 7 4
Norte
Zona
4 6 5 3 6 3 5 6 5 6 4 4 5 6 6 2 3 4 5 6
Sur
Captulo 1: Los mtodos estadsticos en la investigacin cientfica
Actividad 25:
A continuacin se presentan los precios de venta (en miles de $) de 30 casas de
dos zonas residenciales de la Ciudad de Crdoba.
100 148 130 118 135 125 110 132 125 115
Zona B 134 116 131 109 126 112 126 105 150 119
121 145 128 117 136 122 119 130 125 133
2. Efecte comparaciones.
Actividad 26:
La tabla siguiente presenta la poblacin total segn el ingreso medio individual
de los aglomerados urbanos para el segundo trimestre de 2016.
Del anlisis de los grficos siguientes se pide un informe sobre la variacin rela-
tiva del ingreso medio entre deciles. (Indique el grfico que utiliza en el anlisis
justificando su eleccin).
51
Actividad 27:
Las ventas diarias (en $) para los ltimos 120 das de una empresa de servicios
de transporte se organizaron en la una distribucin de frecuencias por interva-
los que ser muestra en la siguiente tabla:
yi-1 - yi ni
530 -730 3
730 - 930 7
930 - 1130 11
1130 - 1330 22
1330 - 1530 40
1530 - 1730 24
1730- 1930 9
1930 - 2130 4
Total 120
Determine:
a) Cuntos das se vendieron entre $ 1130 y $ 1330?
b) Qu porcentaje de das se registraron ventas de entre $ 1130 y $ 1330?
c) Represente mediante un histograma y un polgono de frecuencias, la in-
formacin dispuesta en la tabla.
d) Aproximadamente cul es el porcentaje de das que tienen como in-
greso $ 1730 o ms?
e) Podra describir la forma de la distribucin?
52
8. Casos de discusin y anlisis
A continuacin se presentan casos de investigacin reales.
En cada uno determinar:
Objetivo de la investigacin
Poblacin
Unidad estadstica
Captulo 1: Los mtodos estadsticos en la investigacin cientfica
Marco muestral
Muestra
Parmetro
Estadstico
Variables de inters (clasificarlas por tipo)
Fuente de recoleccin de datos
Caso 1
Caso 2
Caso 3
Caso 4
Caso 5
Captulo 1: Los mtodos estadsticos en la investigacin cientfica
Cmo averiguar qu piensan los nios? Este fue el problema que afront la *Extrado de Investigacin de
vicepresidenta de investigacin de Nickelodeon. Los programadores y el perso- mercados contempornea de
nal de mercadotecnia de la red de cablevisin para nios deseaban informacin Carl Mc Daniel y Roger Gates.
sobre los jvenes televidentes, la cual tradicionalmente se haba obtenido me-
diante sesiones de grupo que consumen mucho tiempo, y entrevistas persona- Sesiones de grupo: grupo de 8
a 10 participantes conducidos
les.
por un moderador en una dis-
Gracias al advenimiento del e-mail, la vicepresidenta de investigacin tu- cusin profunda sobre un de-
vo la idea de conectarse con los televidentes en lnea. Nickelodeon coloc 70 terminado tema o concepto.
anuncios en lnea mediante Compu Serve. Los nios utilizan sus computadoras Entrevista: entrevistadores
personales y mdems para hablar con Nickelodeon y entre ellos, acerca de di- personales que efectan son-
versos temas. Pueden escribir avisos de la computadora y tres veces por sema- deos y obtienen respuestas
na pueden conectarse en juntas programadas con anterioridad. Durante esas detalladas para las preguntas, a
juntas, los investigadores de la red dirigen sus discusiones sobre diversos te- menudo emplean tcnicas no
mas, una tercera parte del tiempo se dedica a ciertos programas de la cadena. directivas para descubrir moti-
Es obvio que los nios participantes son usuarios de CompuServe. Su vaciones ocultas
edad va de los ocho a doce aos y representan hogares con ingresos desde U$S
30.000 a U$S 100.000 anuales. Se estima que el mantenimiento anual del sis-
tema cuesta 80.000 dlares, lo que constituye tan slo una fraccin del costo
de los mtodos de investigacin tradicionales.
De este modo, Nickelodeon obtiene datos ms detallados, con ms rapi-
dez y econmicos, que con los mtodos de investigacin tradicionales (sesiones
de grupo y entrevistas). Los nios dan retroalimentacin instantnea sobre los
programas. Otros datos provienen de respuestas a preguntas tipo encuesta.
Algunos consideran este mtodo con escepticismo y sealan que probablemen-
te est sesgado a favor de nios locuaces. La vicepresidenta de investigacin
entiende que este sistema es una herramienta cualitativa y que, al igual que
cualquier investigacin de este tipo, los resultados no pueden proyectarse a
nivel nacional.
55
9. Referencias Bibliogrficas
- Daz Margarita .[et.al.] (2004) Estadstica I: Gua de Estudio. -1ra Ed. Crdoba
Asociacin Cooperadora de la Fac. de Cs. de la U.N.C., 2009.338 pginas 27x21
cm ISBN 978-987-1436-21-7.
- Naciones Unidas Comisin Econmica para Europa (2009) Cmo hacer com-
prensibles los datos Parte 2 Una gua para presentar estadsticas. Ginebra. Recupe-
rado de
http://www.unece.org/fileadmin/DAM/stats/documents/writing/MDM_Part
2_Spanish.pdf
56
Tablas de frecuencias
Variable Clase Categoras FA FR FAA FRA
NIVEL DE INSTRUCCIN 1 1Primario 48 0,45 48 0,45
NIVEL DE INSTRUCCIN 2 2Secundario 36 0,34 84 0,79
NIVEL DE INSTRUCCIN 3 3Terciario 15 0,14 99 0,93
NIVEL DE INSTRUCCIN 4 4Universitario 5 0,05 104 0,98
NIVEL DE INSTRUCCIN 5 5NS/NC 2 0,02 106 1,00
a) Tablas de frecuencias
Tablas de frecuencias
Coordinacin Acadmica
Secretara de Asuntos Acadmicos
Mgter. Gerardo Heckmann
Coordinacin Organizativa de Divisiones a Distancia
Lic. David Taborda
AUTORES
Norma Patricia Caro
Rosana Beatriz Casini
Margarita Daz
Fernando Garca
Mariana Gonzlez
Martn Saino
Mara Ins Stmolo
Maquetacin de materiales
Lic. Vctor R. Cacciagi y Lic. Ismael Rodrguez
Captulo 2:
Parmetros y estadsticos de las distribuciones de frecuencias
Introduccin 75
1. Medidas de posicin 75
1.1 Media aritmtica 76
1.1.1 Propiedades de la media aritmtica 80
1.2 Mediana 87
1.2.1 Propiedad de la Mediana 88
1.3 Modo 90
1.4 Medida Geomtrica 93
1.4.1 Propiedades de la Medida Geomtrica 94
1.5 Medidas de posicin no central 94
1.5.1 Cuartiles 95
2. Medidas de dispersin 97
2.1 Varianza 97
2.1.1 Frmula de clculo 98
2.1.2 Varianza de la muestra 99
2.1.3 Propiedades de la varianza 101
2.2 Desviacin estndar 102
2.3 Coeficiente de variacin 103
2.4 Recorrido y Recorrido Intercuartil 104
3. Diagrama de caja y brazos 105
4. Otras medidas 109
4.1 Momentos naturales 109
4.2 Momentos centrados 109
5. Medidas de forma 109
5.1 Coeficientes de asimetra 111
5.2 Coeficientes de curtosis 112
6. Distribuciones bidimensionales 116
6.1 Covarianza y Coeficiente de Correlacin de Pearson 116
7. Actividades de aprendizaje 121
8. Referencias Bibliogrficas 123
Soluciones y respuestas al Captulo 2 124
Captulo 2
Parmetros y estadsticos
de las distribuciones de frecuencias
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias
Introduccin
La importancia de marcar la
diferencia radica en el signifi- Para aclarar la idea observe la siguiente tabla.
cado de la medida y su aplica-
cin para describir el compor- A modo de ejemplo, si se cuenta con la estatura de 11 personas y, se pre-
tamiento de la variable. tende caracterizar al grupo por la estatura media, se aplicar la definicin con lo
que concluiremos que en promedio estas personas miden 1,62 m. Es decir, una
Cuando se utilizan las medidas
de posicin central se analiza el altura intermedia entre los ms altos y los ms bajos.
punto de equilibrio entre los
valores y se busca representar ESTATURA
el conjunto por la medida, 1,6
mientras que cuando nos refe- 1,52
rimos a cuartiles por ejemplo, 1,66 Media 1,62
se pretende destacar cuatro 1,68 17,82/11
partes de la distribucin mar- 1,69
cadas por el 25% de las obser- 1,66
vaciones. 1,64
1,48
1,61
1,66
1,62
N
xi
Parmetro i 1
Oprimiendo el
men
Estadsticas
1.Alimentos y Bebidas
2.Textiles, Con-
fecc.Calzado
3.Madera y Muebles
4.Papel e Impresiones
5.Qumica, Caucho y Pls-
ticos
8.Maquinaria y Equipos
6. Vidrio y Minerales. no
Metlicos
7.Productos Metlicos
77
Tabla 1. Medias por rama de variable porcentaje de costo laboral.
Actividad 1
Trabaje con la base industrias.idb y consultando el punto 3.21 del instructivo
de infostat, asigne el nombre de cada rama en la base de datos
Ejemplo 1
Los datos siguientes representan los valores del porcentaje del costo labo-
ral /costo total para las 11 empresas de rama 4, papel e impresiones.
Grfico1:
Histograma de porcentaje de costos laboral
La media 18,36
Otro aspecto de la Media Aritmtica es que, al igual que todas las me-
didas de posicin, se expresa en la misma unidad de medida que la va-
riable. En este ejemplo tanto la variable x como la M(x) se expresan en
porcentaje.
k
xi ni
i 1
x
n
M c c
n
M x c c
n
M c.x c.M x
80
Aplicando la definicin de media aritmtica:
k k
c xi ni xi ni
i 1
M c.x c. i 1
c.M x
n n
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias
Verificacin: x asume los valores: 10, 20, 30, 40, su media es: x 25
Si multiplicamos x por 2, surge x con los valores: 20, 40, 60, 80; siendo su me-
dia: x = 50, pero al aplicar la propiedad no ser necesario recalcular todos los
valores de x, slo haremos:
M x c M x c
k
xi c ni
i 1
M x c
n
Distribuyendo el sumatorio:
k k
xi ni c ni
i 1 i 1
M x c
n n
k
c es constante por lo que puede extraerse del sumatorio y ni n , con lo
i 1
cual se arriba a:
k
xi ni
i 1 n
M x c c M x c
n n
Verificacin: x asume los valores: 10, 20, 30, 40, su media es: x = 25
k
xi ni
Dado que ni n y que M x i 1 , tenemos que:
i 1 n
nM x nM x 0
Por lo tanto:
0 0
(xi - x ) = (2-4) + (4 - 4) + (6 - 4) = 0
82 f w 0
Despejamos w:
k
2 xi w 1 ni 0
i 1
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias
Extraemos (2) del sumatorio, dividimos ambos miembros por (-2) y distribui-
mos el sumatorio de forma tal que:
k k
xi ni w ni 0
i 1 i 1
k
Dado que ni n y como w es constante con respecto al sumatorio:
i 1
k
xi ni wn 0
i 1
n1.M x1 n2 .M x2 ... nh .M xh
M x
n
83
Donde, n1, n2,..., nh son los tamaos de las h submuestras en las que se divide la
muestra de tamao n.
n n1 n2 nh
xi x1i x2 i ... xhi
i 1 i 1 i 1 i 1
Despejando M(x):
n1.M x1 n2 .M x2 ... nh .M xh
M x
n
Ejemplo 2
El ingreso medio de 500 varones es igual a $ 3200 y el ingreso medio de
385 mujeres es de $ 2250, ambos pertenecientes a la misma poblacin,
la media general ser.
(3200.500) (2250.385)
X = 2786.72
885
El promedio es de $ 2786.72.
n
Rama ni xi nixi
de actividad i 1
1 17 32,18 547,06 La media aritmtica de la mues-
2 15 34,2 513 tra ser:
3 14 33,21 464,94
n
4 11 18,36 201,96
5 14 32,86 460,04 ni xi
6 10 27,1 271 i 1 4309,17
x 30,56
7 15 29,33 439,95 n 141
8 17 28,9 491,3
9 16 32,31 516,96
10 12 33,58 402,96
Suma 4309,17
Actividad 2
Se ha seleccionado una muestra de pedidos de clientes, realizados en febre-
ro/2015, a una empresa que fabrica un bien X y se ha registrado la cantidad
de unidades solicitadas de dicho bien:
12 10 14 25 16 25 16 27 18 30 20 30 50 35
85
a) Determinar el valor de la media aritmtica (M) y de la mediana (Me) y
escriba una interpretacin de sus resultados (sin decimales).
c) Si para el mes de marzo se espera que todos los clientes soliciten 4 uni-
dades ms del bien X con respecto a los pedidos de febrero, cul se-
ra el valor de la media aritmtica en el mes de marzo?
d) En otra situacin, si para el mes de marzo se espera que todos los clien-
tes reduzcan en un 15 % el nmero de unidades del bien X solicitadas
con respecto a febrero, cul sera el valor de la media aritmtica en el
mes de marzo?
Actividad 3
La Encuesta Permanente de Hogares, ha permitido relevar informacin respecto
de mltiples aspectos econmicos y sociales de los habitantes del pas.
Tomando las categoras patrn o empleador y cuenta propia, los valores regis-
trados para una muestra de individuos en categora patrn o empleador y cuen-
ta propia. Recordemos que en la EPH se registra el sueldo de cada jefe de hogar,
considerando como tal el ingreso mensual y por otra parte se consulta al indivi-
duo, la categora ocupacional a la que pertenece, es decir patrn o empleador,
empleado en relacin de dependencia, cuenta propia, etc. En la Tabla 3 se pre-
sentan los sueldos de los entrevistados con categoras patrn y cuenta propia.
SUELDO
SUELDO
Patrn o
Cuenta propia
empleador
1200 780 890
480 870 240
1300 760 650
2200 1200 900
2100 650 850
1500 1800 650
370 240 300
1400 2100 780
970 380 560
240 320
320
86
Se le solicita a UD, que:
1,48 1,52 1,6 1,61 1,62 1,64 1,66 1,66 1,66 1,68 1,69
La suma del valor absoluto de las diferencias entre los valores de la variable y su
Mediana, es mnima.
89
Tabla 4. Mediana por rama de variable porcentaje del costo laboral.
MATERIAS
ni Ni
APROBADAS
0 22 22
1 32 54
2 48 102
3 37 139
4 21 160
5 6 166
Total 166
1.3 Modo
tiene un solo valor modal, las bimodales tienen dos valores que se repiten ms
veces que los dems y las multimodales tienen ms de dos valores modales.
Frecuencias absolutas
rama Total Porcentaje
1,00 19 12,84
2,00 16 10,81
3,00 14 9,46
4,00 11 7,43
5,00 15 10,14
6,00 10 6,76
7,00 17 11,49
8,00 17 11,49
9,00 16 10,81
10,00 13 8,78
Total 148 100,00
91
Actividad 4
Con los datos de la Tabla 7, correspondientes a la produccin en unidades de 7
mquinas de una empresa observadas en dos turnos:
Tabla 7. Unidades Producidas Por Mquina
Turno 1 12 14 16 16 18 20 50
Turno 2 10 25 25 27 30 30 35
Actividad 5
Examinando los registros de cuentas mensuales de una empresa que vende
libros por correo, el auditor toma una muestra de 12 de esas cuentas no paga-
das. Los montos de deudas registradas se muestran en tabla 8:
Grfico 2
Variable valor de cuentas no pagas
0,44
0,33
frecuencia relativa
0,22
0,11
0,00
7 15 22 30 37
92
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias
Mg( x ) n ( x1 )( x2 )...( xn )
Mg( y ) n
y1n1 .y 2n2 ...y knk
Ejemplo 4
Los rendimientos anuales, en porcentaje, de cuatro acciones de empre-
sas multinacionales son: 4.91, 5.75, 9.13, 20.86.
Ejemplo 5
Se quiere calcular la tasa promedio de crecimiento del PBI contando con
informacin de los ltimos 5 aos:
Valor final 93
r n
valor inicial
1
1.4.1 Propiedades de la Medida Geomtrica
n
Log Mg(x) log(n (x 1 )(x 2 )...(x n ) ) 1 log x i M(log x)
n
i 1
cuartiles
deciles
percentiles
1.5.1 Cuartiles
o1 = 1/4 (n + 1) -> Q1 = x o1
o3 = 3/4 (n + 1) -> Q3 = x o 3
Q1, ser el valor de la variable que supera a no ms del 25% de las obser-
vaciones y es superado por no ms del 75% de las observaciones de la variable.
De igual modo con los otros dos cuartiles.
Ejemplo 6
Para obtener los cuartiles se ordenan de menor a mayor los valores de
la variable porcentaje del costo laboral para la rama 4:
96
Actividad 6
Retomando la actividad 2, en la que se ha seleccionado una muestra de pedidos
de clientes, realizados en febrero/2015, a una empresa que fabrica un bien X
y se ha registrado la cantidad de unidades solicitadas de dicho bien.
Actividad 7
En relacin a la Actividad 5, referida a montos de 12 cuentas no pagadas por
venta de libros. Se le solicita que:
2. Medidas de dispersin
97
2.1 Varianza
Media aritmtica del cuadrado de los desvos entre los valores de la variable y
su media.
N
2
Parmetro (x i
2 i 1
N
N N N 2
2
xi xi2 xi
2 i 1 i 1 i 1
N N N
N N
2 i 1 i 1
N N
2 2
x2
( x)
Su frmula es:
n n
Estadstico (x i x) 2 x i2 nx 2
s2 i 1 i 1
n 1 n 1
Para la variable porcentaje del costo laboral que fue utilizada en ejemplos
anteriores utilizando el software Infostat, se calcularon las medidas de
dispersin.
Nuevamente con el men estadsticas se abre una ventana en la que se
debe asignar la variable y se solicita el clculo de las medidas necesarias.
99
Medidas de
dispersin
Ejemplo 7
Consideremos una rama de actividad, papel e impresiones, para el
clculo de la varianza mediante hoja de clculo Excel, de la variable por-
centaje del costo laboral:
n
(x i x) 2
1182.55
s2 i 1
118,25
n 1 10
V(x) 0
V(c) = 0
c: constante
Si xi = c y M(x) = c, entonces:
k
2
c c ni
i 1
V( x ) 0
n
Verificacin:
Si x: 4, 4. 4
La media es 4 y la varianza:
3
(x i x)2
i 1 (4 4) 2 (4 4) 2 (4 4) 2
0
2 2
V(c . x) = c2 V(x)
c: constante
n
k
2 2
c xi M x ni
i 1
n
k
2
xi M x ni
2 i 1
c .
n
Verificacin 101
Si x: 4, 5.6
La media es 5 y la varianza:
3
(x i x)2
i 1 (4 5) 2 (5 5) 2 (6 5) 2
1
2 2
Pero si a x la multiplicamos por 2
X: 8,10,12 La media es 10 y la varianza:
3
(x i x)2
i 1 (8 10) 2 (10 10) 2 (12 10) 2
4
2 2
Lo que equivale a:
V(c. x) = c2 V(x) 22 .1 = 4
V(c + x) = V(x)
c: constante
Actividad 8
Verifique la propiedad para un aumento constante de 3 unidades en una varia-
ble x con valores 4,5 y 6.
N n
2
(xi (xi x)2
DS(x) i 1 i 1
DS(x) s
N n 1
Para la variable porcentaje del costo laboral de las 141 empresas la des-
viacin estndar es:
2
213.98 14.63 %
DS( x )
CV( x )
M( x )
s 14,63
CV= 0.4786
y 30,56
El valor del coeficiente de variacin puede multiplicarse por 100 para ex-
presarlo en porcentajes e interpretar que la dispersin relativa del porcentaje
del costo laboral en torno a la media es 47.86%, lo que refleja una dispersin
inferior al 100%. Adems de este anlisis, la relevancia de la medida radica en
que es abstracta lo que la hace prescindir de unidad de medicin, permite com-
parar variables expresadas en distintas unidades de medicin, indicando cul es
la variable que presenta datos ms homogneos para el caso en el CV sea me- 103
nor.
Actividad 9
Retomando la actividad 2, en la que se ha seleccionado una muestra de pedidos
de clientes, realizados en febrero/2015, a una empresa que fabrica un bien X
y se ha registrado la cantidad de unidades solicitadas de dicho bien.
d) En otra situacin, si para el mes de marzo se espera que todos los clien-
tes reduzcan en un 15 % el nmero de unidades del bien X solicitadas
con respecto a febrero, cul sera el valor de la varianza en el mes de
marzo?
Actividad 10
En relacin a la actividad 3, en la que se ha relevado el sueldo del entrevistado
de la encuesta permanente de hogares para las categoras patrn y cuenta pro-
pia, se le solicita a Ud. que:
R = VM - Vm
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias
Cuando existen valores de la variable que estn fuera de las barreras in-
ternas significa que esos valores son alejados de los ms homogneos y se pue-
den considerar como atpicos, comnmente identificados en las salidas de los
software con una letra O, por su designacin en ingls, Outliers.
105
Cuando esos valores estn muy alejados son considerados extremos, los
que se identifican calculando los llamados lmites externos.
Los Lmites Externos se calculan a una distancia de 3 veces el recorrido
intercuartil respecto a los cuartiles primero y tercero.
Los valores de la variable que quedan entre los lmites internos y externos
se consideran valores atpicos. Cuando existen valores de la variable que estn
fuera de las barreras externas significa que esos valores son muy alejados de
los ms homogneos y se pueden considerar como extremadamente atpicos.
Generalmente en las salidas de computacin estos valores son marcados con
un asterico o con la letra E.
107
Actividad 11
Actividad 12
En relacin a la actividad 3, en la que se ha relevado el sueldo de dos muestras
de la encuesta permanente de hogares referidas a categoras, patrn y cuenta
propia. Se le solicita a Ud. Que:
Actividad 13
El siguiente Grfico muestra los resultados del procesamiento con Infostat, de
la variable peso expresado en kg. de 100 personas adultas:
MEDIDAS DESCRIPTIVAS
---!---------!---------!---------!---------!---------! peso
50 60 70 80 90 100
108 c) Considera que hay personas con peso atpico en la serie analizada. Jus-
tifique su respuesta.
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias
4. Otras medidas
Bajo esta denominacin se incluyen los momentos, medidas de posicin
tiles para calcular las dems medidas de posicin, dispersin y forma antes
mencionadas.
'
r (x) M( x r )
'
0 (x) M( x 0 ) 1
'
1 (x) M( x1 ) M( x )
' 2
2 ( x ) M( x )
' ' 2 2
2 ( 1)
r (x) M( x )r
0 (x) M( x )0 1
1 (x) M( x )1 0 por propiedad de Media Aritmtica
(x) M( x )2 2
Varianza 109
2
5. Medidas de forma
Las medidas de forma, al igual que las medidas de posicin y dispersin,
determinan el comportamiento general de la variable.
Se pueden dividir en anlisis de comportamiento horizontal o asimetra, o
bien vertical llamado curtosis.
a. ASIMETRA b. CURTOSIS
0,24
Frecuencia Relativa
0,09
0,18
Frecuencia Relativa
0,07
0,12
0,05
0,06
0,02
0,00
0,00 3,81 7,62 11,44 15,25 0,00
Variable 3,00 12,25 21,50 30,75 40,00
Variable
0,09
2,46
Frecuencia Relativa
f recuencia relativa
0,07
1,85
0,05
1,23
0,02
0,62
0,00 0,00
0,00 0,25 0,50 0,75 1,00 3,00 12,25 21,50 30,75 40,00
Variable
Variable
0,09
0,16
Frecuencia Relativa
Frecuencia Relativa
0,07
0,12
0,08 0,05
0,04
110 0,02
0,00
-2,25 3,88 10,00 16,12 22,25
0,00
Variable 3,00 12,25 21,50 30,75 40,00
Variable
En lo atinente a la curtosis, se define como el grado de concentracin de Para una mejor comprensin
los valores de la variable en torno al modo, mientras mayor concentracin ms del significado del trmino
puntiaguda se muestra la distribucin tal como se ve en la imagen b1, llamndo- dispersin en el entorno de las
se en este caso Leptocrtica, es Mesocrtica cuando est menos concentrada medidas descriptivas, se su-
giere a ingresar a la seccin
alcanzando una altura media como muestra la imagen b2 y es Platicrtica en el
Materiales Recursos del aula
caso en que los valores de la variable se dispersan hasta alcanzar una forma virtual para ver la produccin
aplanada en la distribucin como se observa en b3 . audiovisual llamada Medidas
de Simetra y Curtosis que
explican el trmino.
5.1 Coeficientes de asimetra
x Mo 3( x Me )
Ca
s s
Ca g1 N 3
3 2
( 2 )3
Ca g1 n
s3
111
El coeficiente de asimetra puede asumir valores mayores, iguales o me-
nores que cero. Si es cero la distribucin es perfectamente simtrica pero si es
positivo es asimtrica positiva o si es negativo asimtrica negativa.
>0 (Asimetra derecha o positiva)
Ca =0 (Simtrica)
< 0 (Asimetra izquierda o negativa)
N
( xi )4
i 1
Ck N 3 4
3
4 2
( 2 )4
Ck n 3
s4
Estos coeficientes pueden asumir valor mayor, igual o menor que cero,
indicando que la distribucin es alta (leptocrtica), media (mesocrtica) y baja
(platicrtica), respectivamente.
112
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias
3(189.91 135 )
Ca 0, 67
245.25
Grfico 3
Histograma de la variable gasto en movilidad mensual
113
La distancia entre las medidas de posicin central media, mediana y mo-
do permite establecer si la distribucin es simtrica o asimtrica. En las simtri-
cas las tres medidas coinciden aproximadamente, mientras que en distribucio-
nes asimtricas son diferentes. Estas relaciones se ilustran en las siguientes
imgenes.
Distribucin asimtrica derecha
0,24
Frecuencia Relativa
0,18
0,12
0,06
0,00
0,00 3,81 7,62 11,44 15,25
Variable
1,73
1,15
0,58
0,00
0,00 0,25 0,50 0,75 1,00
Variable
Distribucin simtrica
0,10
Frecuencia Relativa
0,08
0,05
0,03
0,00
0,64 10,32 20,00 29,68 39,37
Variable
M(X) = Me = Mo
Actividad 14
Es importante para diagramar actividades, los gastos que las mismas pueden
ocasionar en los bolsillos de los estudiantes, es por eso que se analiza el gasto
en libros y movilidad, utilizando informacin de la base de datos de alumnos.
Idb. Relacione las medidas descriptivas de cada variable y los grficos de caja y
brazos e histogramas para responder lo que se solicita:
Medidas descriptivas
115
Histogrmas
6. Distribuciones bidimensionales
En las secciones anteriores presentamos el clculo de medidas para des-
cribir una variable. Ahora introducimos medidas que permiten describir num-
ricamente la relacin lineal entre dos variables cuantitativas.
116
Es una medida de dispersin conjunta entre dos variables cuantitativas que
indica la presencia de asociacin lineal directa o inversa entre las mismas.
Se define como:
n
( xi M( x ))( y i M( y ))
i 1
Cov( x,y )
n
n n n
xi y i xi yi
i 1 i 1 i 1
Cov( x,y ) M( xy ) M( x )M( y )
n n n
COV ( X ,Y )
r
DS( x ).DS( y )
Cuando el valor del coeficiente de Pearson (r) es 0, indica que no hay
asociacin lineal entre las variables analizadas, si su valor es negativo y prximo
a 1, indica asociacin lineal directa o positiva e intensa en la medida que ms se
aproxima a 1, similarmente si su valor es negativo indica asociacin inversa o
negativa y mientras ms se acerca a 1 ms intensa ser la asociacin lineal.
118
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias
Covarianza (x,y)
Coeficiente de
correlacin (x,y)
Distribuyendo el sumatorio y n:
n n n
2 2
xi M x yi M y xi M x yi M( y )
i 1 i 1 i 1
V( x y) 2.
n n n
Por lo que:
V( x y) V x V y 2.Cov x,y
V( x y) = V(x) + V(y)
Actividad 15
Considerando los datos de la base EPH.idb, un aspecto importante es la relacin
entre las horas trabajadas y la antigedad en el empleo del jefe de hogar. A par-
tir de los siguientes resultados, responda:
120
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias
7. Actividades de aprendizaje
Actividad 16
Con los datos de la base EPH, se ha analizado la variable sueldo, que representa
el ingreso de las personas consultadas en la muestra. Se ha considerado para el
anlisis descriptivo el ingreso de Empleadores y trabajadores por su cuenta, las
medidas descriptivas para el ingreso de cada una de esas categoras, se mues-
tra en tabla 12:
Medidas
Cuenta
variable Empleador
propista
ingreso
n 9 21
Media 1280 737,14
Var(n-1) 394075 237401,43
Mn 370 240
Mx 2200 2100
Mediana 1300 650
Q1 970 320
Q3 1500 870
Asimetra 0,03 1,53
Actividad 17
Retomando la actividad 20 de la Unidad 1, se le solicita que analice la variable
mediante un anlisis descriptivo: medidas de posicin, dispersin y forma, in-
terpretando el significado que le atribuye a cada una.
Actividad 18
Conforme a la actividad 23 de la Unidad 1, en la que para 15 empresas se relev
el precio y el margen de utilidad de un producto.
Actividad 19
Conforme a la actividad 24 de Unidad 1, referida a una heladera que cuenta con
dos sucursales en la Ciudad de Crdoba, una ubicada en la zona Norte y otra
ubicada en la zona Sur. A continuacin se presenta informacin sobre el nmero
de pedidos telefnicos recibidos por da, para una muestra aleatoria de 20 das:
Zona
4 6 7 5 5 6 7 4 8 6 8 5 7 6 7 5 6 6 7 4
Norte
Zona
4 6 5 3 6 3 5 6 5 6 4 4 5 6 6 2 3 4 5 6
Sur
b) Efecte comparaciones
Actividad 20
A continuacin se presentan los precios de venta (en miles de $) de 30 casas de
dos zonas residenciales de la Ciudad de Crdoba que fueron utilizados en la
actividad 25 de la Unidad 1.
100 148 130 118 135 125 110 132 125 115
Zona
134 116 131 109 126 112 126 105 150 119
B
121 145 128 117 136 122 119 130 125 133
Actividad 21
Un aspecto relevante para las empresas es la cantidad de personal que ocupan,
con el propsito de incentivar a incorporar ms empleo en las empresas, es de
inters oficial analizar esa variable por sector de la economa. Los datos proce-
sados con las medidas descriptivas se muestran en tabla 13.
PRODUCTOS
DE ORIGEN PRODUCTOS OTRAS IN-
MEDIDA NO METLI-
AGROPECUARIO METLICOS DUSTRIAS
COS
n 49 36 50 13
Media 33,63 27,67 35,36 58,38
D.E. 40,81 41,19 47,61 83,7
CV 121,33 148,88 134,65 143,35
122 Mn 3 3 4 6
Mx 191 168 214 280
Q1 10 6 11 17
Asimetra 2,35 2,62 2,56 2,2
Kurtosis 4,78 5,23 5,5 2,23
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias
Analice la informacin y emita una opinin sobre la relacin lineal que puede
existir entre las variables.
8. Referencias Bibliogrficas
- Daz Margarita .[et.al.] (2004) Estadstica I: Gua de Estudio. -1ra Ed. Crdo-
ba Asociacin Cooperadora de la Fac. de Cs. de la U.N.C., 2009.338 pginas
27x21 cm ISBN 978-987-1436-21-7.
123
Soluciones y respuestas al Captulo 2
Gua de Estadstica
Actividad 1:
Actividad 2:
Interpretacin:
El promedio de unidades solicitadas de l bien analizado es de 23 unidades,
para la muestra de 14 clientes.
Hay 7 clientes (50%) que solicitaron menos de 23 unidades.
Hay dos valores modales, correspondientes a los valores ms frecuentes que
son de 16 y 25 unidades, respectivamente.
xi M(x ) 0
b)
xi (xi- promedio)
10 -13,43
12 -11,43
14 -9,43
16 -7,43
16 -7,43
18 -5,43
20 -3,43
25 1,57
25 1,57
27 3,57
30 6,57
30 6,57
35 11,57
124
50 26,57
Total 0,00
Soluciones y respuestas al Captulo 2 Gua de Estadstica
Y=x+4
M(y) = M( x +4 )
= M(x) + M(4)
= 23,43 + 4
M(y) = 27,43
M(y) = 19,92
Actividad 3
a)
Muestra tamao: 9 personas (patrones).
Muestra tamao: 21 personas (Cuenta propia).
b) Monto total
Monto total de sueldo de los 9 patrones analizados es de $11520.
Monto total de sueldo de los 21 cuentapropistas analizados es de $15480.
c) Promedios
Entonces para cada muestra los nuevos valores de promedio bajo el efecto in-
flacionario sern:
W= 50+ 1,18 x
M(W) = M ( 50 + 1,18 . x)
= M(50) + M( 1,18 . x)
= 50 + 1,18. M( x)
Reemplazando ahora por las medias de cada grupo analizado tendremos
Actividad 4
Interpretaciones:
Turno 1 una distribucin levemente asimtrica derecha; mientras que los datos
del Turno 2 presentan una forma asimtrica izquierda.
Turno 1 Turno 2
Asimetra 2,43 -1,55
Turno 1 Turno 2
CV 62,84 30,28
Como puede verse el CV del turno 2 es ms pequeo por lo tanto podemos con-
cluir que para este turno los datos son ms homogneos, estn menos disper-
sos y por lo tanto el promedio para este Turno es ms representativo.
c) Para verificar estas igualdades realizaremos una tabla en Excel con los datos
del Turno 1
Actividad 5
Media 19,1
Mediana 17,5
Modo 10
127
HISTOGRAMA VALOR DE CUENTAS NO PAGAS
0,44
0,33
frecuencia relativa
0,22
0,11
0,00
7 15 22 30 37
Actividad 6
Q1 15,5
Mediana = Q2 22,5
Q3 28,5
Q1: la cantidad mxima de pedidos del 25% de los clientes que menos deman-
dan es de 15,5 pedidos (aproximadamente 16 pedidos).
Q3: la cantidad mnima demandada del 25% de los clientes que ms cantidad
demandan es de 28,5 pedidos (aproximadamente 29 pedidos).
Medidas resumen
Resumen Xi
n 14,00
Media 23,43
Mn 10,00
Mx 50,00
Mediana 22,50
Q1 16,00
Q3 30,00
Actividad 7
a)
Medidas resumen
b)
HISTOGRAMA VALOR DE CUENTAS NO PAGAS
0,44
0,33
frecuencia relativa
0,22
0,11
0,00
7 15 22 30 37
Q2=17,
Q1=105 Q3=26
Actividad 8
Aplicando propiedad.
129
Actividad 9
Y = x +4
V (y) = V(x + 4)
= V(x) + V (4)
= 115 + 0
V (y) = 115 unidades2.
Por lo tanto la desviacin estndar para el mes de marzo ser DS (y) = 11 unida-
des, la misma que para febrero porque el incremento es constante (Vza de una
constante es igual a 0).
V (w) = V( 0,85 . x )
= (0,85)2. V(x)
V (w) = 0,7225. 115
V (w ) = 83 unidades2..
Actividad 10
El grupo de los Patrones muestra un menor CV con lo que puede concluirse que
en este conjunto de datos los valores son ms homogneos, menos dispersos y
por tanto el promedio para este grupo es ms representativo.
Y aplicamos propiedades:
Con lo que podemos concluir que si el incremento es de $50 los valores de va-
rianza y de desvo estndar no se modificaran.
W= x + 0,18 x
W= x.(1+0,18)
W= 1,18 x
V (w) = V (1,18. X)
= (1,18)2 V(x)
Entonces los nuevos valores de varianza y de desvo estndar para cada una de
las muestras ser de:
f) Volvemos a calcular los CV% para los supuestos de los puntos d) y e) pero
para ello deberemos calcular la nueva media en cada caso.
Actividad 11
Medidas resumen
38,50
30,25
VALOR MON CNP
22,00
13,75
5,50
132 Actividad 12
Medidas resumen
Variable n Mn Mx Mediana Q1 Q3
SUELDO P 9 370 2200 1300 970 1500
SUELDO CP 21 240 2100 650 320 870
Soluciones y respuestas al Captulo 2 Gua de Estadstica
2291,50
1788,25
SUELDO P
1285,00
781,75
278,50
2193,00
1681,50
SUELDO CP
1170,00
658,50
147,00
Actividad 13 133
Me 65,35
Q1 57
Q3 72
RI 15
LIO 34,5
LSO 94,5
LIE 12
LSE 117
VMIN 47
VMAX 100
Como puede observarse que el valor mnimo caen dentro de las barreras inter-
nas (Izquierda) pero el valor mximo supera a la BID y est ubicado antes de la
BED por lo tanto podemos concluir que hay presencia de valores outliers (atpi-
cos) dentro de la distribucin.
134 Actividad 14
a) Analizando las medidas de posicin para cada variable podemos concluir que
ambas variables presentan una forma asimtrica derecha, pero que para el caso
de la variable gasto de movilidad esta asimetra es ms marcada. Esto puede
verse tambin analizando ambos coeficientes de asimetra, que como se obser-
va para el caso de la segunda variable es mayor su valor.
Soluciones y respuestas al Captulo 2 Gua de Estadstica
El mayor valor obtenido para la variable gasto de movilidad nos permite con-
cluir que para esta variable los datos estn ms dispersos , son menos homog-
neos y que la media es menos representativa.
Actividad 15
a) Covarianza = 19,09 indica una asociacin directa o positiva entre las horas
trabajadas y la antigedad
MEDIDAS VARIABLE
EMPLEADOR CUENTA PROPISTA
INGRESO
n 9 21
Media 1280 737,14
Var(n-1) 394075 237401,43
Mn 370 240
Mx 2200 2100
Mediana 1300 650
Q1 970 320
Q3 1500 870
Asimetra 0,03 1,53
a) Media general
c) Coeficiente de variacin.
CV % 49,04 66,10
d) Recorrido Intercuartlico.
RI 530,00 550,00
f) Para calcular la media y la varianza si hay una disminucin del 20% definimos
136 una nueva variable ( que ser nuestra variable original menos el descuento)
Ahora:
M(W) = M( 0,80 . X)
= 0,80. M(X)
= 0,80 . 1280
Actividad 17
Medidas resumen
Resumen cotizacin de acciones
n 22,00
Media 9,30
D.E. 1,82
Var(n-1) 3,32
CV 19,61
Mn 3,00
Mx 11,70
Mediana 9,65
Q1 8,40
Q3 10,40
Asimetra -1,91
Kurtosis 4,51
Actividad 18
Covarianza 0,37
Coef. Correlacin 0,546
Se puede concluir que existe una correlacin lineal positiva (o directa) entre el
Precio y la Utilidad, lo cual tambin se observa en el diagrama de dispersin
cierta tendencia ascendente en la nube de puntos
Actividad 19
Por otro lado comparando ambos CV podemos ver que como para la muestra
de la Zona Norte el coeficiente de variacin es menor, entonces se puede con-
Soluciones y respuestas al Captulo 2 Gua de Estadstica
cluir que para estos los datos son ms homogneos, estn menos dispersos y la
media es ms representativa (lo cual ya se afirm por otra va de anlisis)
Los rangos son iguales para ambas distribuciones.
Actividad 20
Variable analizada: precio de venta (en miles de $)
Zona A Zona B
Promedio 105,03 124,73
Mediana 103,00 125,00
Modo 100,00 125,00
Varianza 114,10 142,41
Desv Est 10,68 11,93
N 30 30
Q1 96,00 116,75
Q3 113,25 132,25
Rango Intercuartilico 17,25 15,50
Vmin 90,00 100,00
Vmax 129,00 150,00
Coef. Asim 0,58 0,15
Rango 39,00 50,00
CV% 10,17 9,57
Por otro lado comparando ambos CV podemos ver que como para la muestra
de la Zona A el coeficiente de variacin es mayor, entonces se puede concluir
que para estos los datos son menos homogneos (mas heterogneos), estn
ms dispersos y la media es menos representativa que los de la zona B (lo
cual ya se afirm por otra va de anlisis).
Actividad 21:
A cargo del alumno
139
Estadstica I
Tomo I (cap. 1, 2 y 3)
Coordinacin Acadmica
Secretara de Asuntos Acadmicos
Mgter. Gerardo Heckmann
Coordinacin Organizativa de Divisiones a Distancia
Lic. David Taborda
AUTORES
Norma Patricia Caro
Rosana Beatriz Casini
Margarita Daz
Fernando Garca
Mariana Gonzlez
Martn Saino
Mara Ins Stmolo
Maquetacin de materiales
Lic. Vctor R. Cacciagi y Lic. Ismael Rodrguez
Captulo 3:
Introduccin a las probabilidades
1. Introduccin 143
2. Fenmenos aleatorios versus determinsticos 143
3. Conceptos bsicos de probabilidad 144
4. Enfoques para asignar probabilidades 148
5. Axiomas y teoremas de probabilidad 152
6. Probabilidad conjunta y condicional 153
7. Independencia de eventos 156
8. Ley de Probabilidad total 159
9. Teorema de Bayes 160
10. Referencias Bibliogrficas 163
Anexo 1: Repaso de lgebra de Conjuntos 164
Soluciones y respuestas al Captulo 3 166
Captulo 3
Introduccin a las probabilidades
Captulo 3: Introduccin a las probabilidades
1. Introduccin
De acuerdo a lo estudiado en el Captulo I, la Inferencia Estadstica
comprende los mtodos que permiten extrapolar los resultados de una mues-
tra aleatoria hacia la poblacin de la cual fue extrada. Cuando se observa slo
una muestra, aun cuando la misma sea adecuadamente representativa de la
poblacin por cuanto reproduce sus caractersticas esenciales, el intento de
extraer conclusiones acerca de la poblacin se realiza, no en un marco de cer-
teza sino de incertidumbre cuantificable.
La Teora de Probabilidad, rama de la matemtica que modela fenme-
nos aleatorios, cuantifica esa incertidumbre en el proceso de estimacin de
parmetros, permitiendo hacer afirmaciones en cuanto a precisin y confiabi-
lidad de los resultados. Tambin permite probar hiptesis en relacin con los
parmetros, fijando la magnitud del error que puede cometerse al tomar la
decisin y constituye la base terica de mtodos estadsticos tales como Re-
gresin, Anlisis de Varianza, Control de Calidad, etc. Si bien dichas metodo-
logas, tanto la estimacin de parmetros como la prueba de hiptesis las es-
tudiaremos en Estadstica II, a partir de este Captulo introduciremos los con-
ceptos fundamentales y el lenguaje bsico de Probabilidad.
En las explicaciones que se desarrollan en este captulo se vislumbrar
de qu manera la Teora de Probabilidad es en la actualidad la base de la ma-
yor parte de las decisiones que adoptan tanto los gobernantes como adminis-
tradores de empresa.
Ejemplo 1
En el experimento de tirar una moneda una vez, slo hay dos resulta-
dos posibles:
= {c,s}
= {(cc),(cs),(sc),(ss)} # = 22=4
= {(ccc),(ccs),(csc),(css),(scc),(scs),(ssc),(sss)} # = 23=8
Actividad 1:
A partir de los siguientes ejemplos describa el espacio muestral y clasifquelo.
Actividad 2:
Piense en otros experimentos aleatorios, intente describir el espacio muestral
asociado y clasifquelo segn lo expresado ms arriba.
Por ejemplo:
Actividad 3:
a) Defina eventos simples y compuestos a partir de los experimentos
aleatorios que pens en la Actividad 2.
b) Podra dar una definicin de eventos mutuamente excluyentes? Y
de colectivamente exhaustivos?
c) Se anima a plantear ejemplos de eventos ciertos, imposibles, mu-
tuamente excluyentes y colectivamente exhaustivos en los experi-
mentos de la Actividad 2?
Actividad 4:
En la siguiente tabla se presentan los datos de produccin de parcelas clasifi-
cadas en tres niveles y cruzadas por zonas geogrficas de la Provincia de Cr-
doba, que se transcriben a continuacin
ZONA GEOGRFICA DE LA
TOTAL
NIVEL DE PRODUCCIN PROVINCIA
ZONA "A" ZONA "B" ZONA "C"
Alto 69 47 23 139
Mediano 40 25 80 145
Bajo 38 32 36 106
Total 147 104 139 390
1
Cuando es continuo, no es posible definir de esa manera. (Hoel, cap. 1).
En nuestro ejemplo:
Cada uno de estos eventos tendr asociada una probabilidad que simbo-
lizaremos con P, y al conjunto formado por el espacio muestral, la familia de
eventos y la probabilidad asociada a cada elemento de dicha familia lo llama-
remos Espacio de Probabilidad. Lo simbolizaremos con E.
E = {, , P}
Enfoque clsico
= {1, 2, 3, 4, 5, 6}
P(A) = 1/6
Ejemplos:
m
P(A)=
n
Actividad 5:
Si el 60% de 10 alumnos consultados de Estadstica I est de acuerdo con las
condiciones de regularidad de la materia, podra ese valor utilizarse como
una medida de probabilidad? Por qu?
Ejemplo 2
V = {alumno varn}
C = {alumno que procede de Crdoba}
Mtodo subjetivo
Actividad 6:
Para cada uno de los casos que se plantean indique cul es el enfoque de pro-
babilidad conveniente para determinar el valor de la probabilidad que se quie-
re obtener, o el enfoque utilizado en los casos de probabilidades que han sido
calculadas.
P() = 1
P(AC) = 1 P(A)
Demostracin:
Por definicin A AC =
Como A AC = (son disjuntos)
Por Axioma 3 P(A AC)= P(A) + P(AC) = P() = 1
P(AC) = 1 P(A)
Teorema 2:
La probabilidad del evento imposible (complemento de ) es igual a cero.
P() = 0
Demostracin:
Por aplicacin del Teorema 1 (Recordemos que = C)
152
Teorema 3:
Sean A y B, eventos que pertenecen a , entonces:
Teorema 4:
Sean A y B, eventos no disjuntos, que pertenecen a , entonces:
V = {alumno varn}
C = {alumno que procede de Crdoba},
es decir, buscamos calcular P(V C). En este caso nos interesa calcular la
probabilidad de la ocurrencia simultnea de los dos eventos, es decir que se
presenten resultados comunes a ambos eventos. Esta probabilidad se deno-
mina probabilidad conjunta.
Actividad 7:
Se conoce que, de cada 100 estudiantes de 3 ao de la Facultad que han
optado por una sola carrera de las tres que se pueden cursar, 66 eligen Con-
tador Pblico mientras que el resto elige una de las Licenciaturas (en Admi-
nistracin de Empresas o en Economa). Tambin se sabe que el 46% son
varones (el resto mujeres) y que en las Licenciaturas hay 13 mujeres.
A = {alumno varn}
B = {alumno de la carrera de Contador Pblico}
Le recomendamos armar una tabla de contingencia con los datos del enunciado.
154
Captulo 3: Introduccin a las probabilidades
Actividad 8:
Teniendo en cuenta los siguientes datos referidos a las ventas diarias (en $)
para una compaa de servicios de transporte.
Actividad 9:
Los datos sobre las ventas diarias de un producto en los ltimos 2 meses (60
das) para LUZ S.A. se exponen en la tabla siguiente:
Nmero de Cantidad
productos vendidos de das
0 15
1 20
2 13
3 9
4 o ms 3
Actividad 10:
Dados los eventos A y B que pertenecen al mismo espacio probabilstico
sobre los cuales se sabe que P(A) = 0.3, P(B) = 0.6 y P(A U B) = 0.8, calcu-
le:
a) P(AC) 155
b) P(BC)
c) P(A B)
d) P(AC BC)
e) P(AC B)
f) P(A BC)
g) P(AC BC)
Cuando los eventos pueden presentarse simultneamente la probabili-
dad conjunta es distinta de cero. La expresin para cuantificarla depende de si
los eventos considerados son dependientes o independientes.
7. Independencia de eventos
P ( A B ) P ( A ) .P ( B )
P ( A/B ) = = =P ( A )
P ( B) P ( B)
Nota: Esta verificacin se puede realizar con cualquiera de las cuatro probabi-
lidades conjuntas de la tabla de contingencia.
Actividad 11:
Defina eventos a partir del ejemplo de la tirada de una moneda tres veces y
trate de concluir si los mismos son independientes o no.
Actividad 12:
Un lote de produccin tiene 15 artculos buenos, 6 tienen defectos poco sig-
nificativos y 3 con defectos graves.
157
Actividad 13:
La empresa MICA S.A., tiene un directorio conformado por 6 varones y 3
mujeres. Dicha empresa debe elegir en el mes prximo al nuevo presidente,
para lo cual se armar un Comit con 3 de los miembros del directorio, para
que efecte recomendaciones sobre quin deber ser el nuevo presidente.
Determine:
a) Cul es la probabilidad de que los 3 integrantes del comit evaluador
sean mujeres?
b) Cul es la probabilidad de que los 3 integrantes sean varones?
c) Cul es la probabilidad de que los tres integrantes sean todos varo-
nes o todas mujeres?
d) Cul es la probabilidad de que se seleccionen una mujer y dos varo-
nes?
e) Si se decide ampliar el Comit a cuatro personas, cul es la probabilidad
de que todas sean mujeres? Cmo se denomina este tipo de evento?
Actividad 14:
Una compaa produce y vende dos tipos de productos (producto A y pro-
ducto B). Se estima que la probabilidad de que el producto A tenga una ga-
nancia superior al 15% es 0,25, que el producto B tenga el mismo margen de
ganancia es 0,30 y que ambos productos superen el 15% de ganancia es
0,08. En base a estas estimaciones que realiz el gerente se pide:
Actividad 15:
Dados los eventos A y B, que pertenecen al mismo espacio probabilstico,
sabiendo adems que P(A) = 0.40; P (B) = 0.30 y P (A/B) = 0, entonces:
Indique en cada uno de los casos si son Verdaderas o Falsas cada una de las
afirmaciones, y justifique su respuesta.
158
Captulo 3: Introduccin a las probabilidades
Actividad 16:
Dados los eventos A y B, mutuamente excluyentes, que pertenecen al mismo
espacio probabilstico y sabiendo que:
Actividad 17:
Cundo dos eventos estadsticamente independientes son tambin mutua-
mente excluyentes? Marque la alternativa correcta y pruebe por qu.
A1 A2 A3 .......... An = con Ai Aj = ; i j
La Ley de probabilidad total indica que dada una particin aleatoria de , para
cualquier evento B se cumple que:
n
P(B)= P(A1).P(B/A1)+P(A2).P(B/A2)++ P(An).P(B/An)= P(A ).P(B/A )
i=1
i i
159
Demostracin:
Consideremos el evento B y la particin aleatoria de {A1 A2 A3 ... An}
B=B
B = B [A1 A2 ... An]
B = (B A1) (B A2) (B An)
Por axioma 3 P(B) = P(B A1)+P(B A2)+ +P(B An)
P(B) = P(A1).P(B/A1)+ P(A2).P(B/A2)++ P(An).P(B/An)
A1 = {empresa nacional}
A2 = {empresa extranjera}
eventos que constituyen una particin aleatoria de
B = {operaciones de exportacin}
P(B/A1) = 0,11 y P(B/A2) = 0,23
P(B)=P(A1).P(B/A1)+P(A2).P(B/A2)=0,93.0,11+0,07.0,23=0,1184
Actividad 18:
Cuatro mquinas, X20, X21, X22 y X23, producen 30%, 25%, 15% y 30% res-
pectivamente del total de productos de una industria, siendo la proporcin de
productos defectuosos de 0,02; 0,03; 0,05 y 0,07 para cada mquina respec-
tivamente.
Si se selecciona un producto al azar, cul es la probabilidad de que sea defec-
tuoso?
9. Teorema de Bayes
NIVEL DE
NIVEL DE EDUCACIN TRABAJA
EDUCACIN
Primario 30% 40%
Secundario 40% 60%
Universitario 25% 90%
Postgrado 5% 95%
Evento Ai
P(Ai) P(T/Ai) P(Ai T)= P(Ai). P(T/Ai)
Nivel de educacin
A1 = Primario 0,30 0,40 (0,30 x 0,40) = 0,12
A2 = Secundario 0,40 0,60 (0,40 x 0,60) = 0,24
A3 = Universitario 0,25 0,90 (0,25 x 0,90) = 0,225
A4 = Postgrado 0,05 0,95 (0,05 x 0,95) = 0,0475
0,24
= = 0,379
0,6325
Con este ejemplo vemos cmo la probabilidad inicial (a priori) del nivel
educativo secundario (0,40) queda revisada despus de que se obtuvo la
informacin de que la persona seleccionada trabaja.
Actividad 19:
Si a partir de los datos de la Actividad 18 se selecciona un artculo y es de-
fectuoso, cul es la probabilidad que haya sido producido por la mquina
X21?
Actividad 20:
En un curso de capacitacin para administrativos de una compaa, 60% de
los asistentes son mujeres; el 75% de los hombres son egresados de la uni-
versidad y el 50% de las mujeres tambin.
Actividad 21:
En el ltimo ao Talleres jug al ftbol con Belgrano el 7% de los partidos, el
93% restante con otros equipos. Talleres gan el 95% de los clsicos, mien-
tras que slo gan el 10% de los partidos que jug con otros equipos.
Actividad 22:
En una empresa hay dos mquinas con las que se enlata una nueva gaseosa,
la mquina A produce el 40% del total de la produccin y la mquina B el
resto. Adems, se sabe que la mquina A produce un 20% de artculos con
defectos en su envasado y mientras que la B slo un 15%.
162
Captulo 3: Introduccin a las probabilidades
- Daz Margarita .[et.al.] (2004) Estadstica I: Gua de Estudio. -1ra Ed. Cr-
doba Asociacin Cooperadora de la Fac. de Cs. de la U.N.C., 2009.338 pginas
27x21 cm ISBN 978-987-1436-21-7.
163
Anexo 1:
Lectura complementaria
que es el producto de un entero positivo (n) por todos los que le pre-
ceden; expresin que se denota por n! y se lee n factorial. Dos per-
mutaciones cualesquiera slo difieren en el orden de sus elementos.
Variaciones
Combinaciones
165
Soluciones y respuestas al Captulo 3
Gua de Estadstica
Actividad 1
Actividad 2
Actividad 3
a) Ejemplo 1:
A={varn que vive con sus padres}={(varn, si)} es un evento simple
B={varn}={(varn, si),(varn, no)} es un evento compuesto
c) Ejemplo 1:
B={varn}={(varn, si),(varn, no)}
C={mujer}={(mujer, si),(mujer, no)}
D={vive o no con sus padres}= {(varn, si),(mujer, si),(varn, no),(mujer,
no)}
166 Actividad 4
Actividad 5
Ese valor podra utilizarse como una medida de probabilidad slo si el experi-
mento se realiza un nmero grande de veces, es decir se consultan ms alum-
nos.
Actividad 6
a) Subjetivo
b) Clsico
c) Clsico
d) Subjetivo
e) Frecuencial
f) Subjetivo
g) Subjetivo
h) Frecuencial
i) Subjetivo
j) Clsico
Actividad 7
Actividad 8
Actividad 9
167
a) Los resultados posibles son 5: = {(0),(1),(2),(3),(4 o ms)}
b) P(no vender productos) = 15/60 = 0.25
c) P(vender 1 producto) = 20/60 = 0.333
d) P(vender 3 o ms productos) = (9+3)/60 = 12/60 = 0.20
Actividad 10
a) P(AC) = 0.70
b) P(BC) = 0.40
c) P(A B) = 0.10
d) P(AC BC) = 0.20
e) P(AC B) = 0.50
f) P(A BC) = 0.20
g) P(AC BC) = 0.90
Actividad 11
Actividad 12
Actividad 13
Actividad 14
a) Subjetiva
168 b) Sean A = {el producto A deja un margen de utilidad superior al 15%} y B =
{el producto B deja un margen de utilidad superior al 15%}
P(B/A) = P(B A)/P(A) = 0.08/0.25 = 0.32
c) A y B son independientes si P(B A) = P(B)*P(A)
P(B A) = 0.08 P(B)*P(A) = 0.30*0.25 = 0.075
Como no se cumple la condicin de independencia concluimos que A y B son
estadsticamente dependientes.
Captulo 3: Introduccin a las probabilidades
Actividad 15
Actividad 16
Actividad 17
Actividad 18
Actividad 19
P(A2/D) = 0,1786
Actividad 20
P(M)=0.60
P(UC/M) = 0.50
Curso
P(U/V) = 0.75
P(V)=0.40
P(UC/V) = 0.25
b) P(M U) = 0.30
c) P(M/U)= 0.50
Actividad 21
a) P(GC/B) = 0.05
b) P(B/G) = 0.417
Actividad 22
P(B/D) = 0.529
170