Sei sulla pagina 1di 186

Estadstica I

Tomo I (cap. 1, 2 y 3)

Ciclo Bsico a Distancia


FACULTAD DE CIENCIAS ECONMICAS
AUTORIDADES

Mgter. JHON BORETTO


Decano

Dra. MARA LUISA RECALDE


Vicedecana

Cr. FACUNDO QUIROGA MARTNEZ


Secretario Tcnico

Cr. DIEGO CRIADO DEL RO


Secretario de Administracin

Mgter. GERARDO HECKMANN


Secretaria de Asuntos Acadmicos

Lic. JUAN SAFFE


Secretario de Extensin

Cr. MATAS LINGUA


Secretario de Asuntos Estudiantiles

Dr. ANDRS MATTA


Secretaria de Ciencia, Tcnica y Relaciones Internacionales

Mgter. CLAUDIA CARIGNANO


Prosecretaria de Evaluacin Institucional y Acreditacin de Carreras

Cr. HUGO PRIOTTO


Director de la Carrera Contador Pblico

Mgter. MARCELO CAPELLO


Director de la Carrera de Licenciatura en Economa

Lic. TOMS GASTN


Director de la Carrera de Licenciatura en Administracin
CICLO BSICO A DISTANCIA
REAS QUE PARTICIPAN

Coordinacin Acadmica
Secretara de Asuntos Acadmicos
Mgter. Gerardo Heckmann
Coordinacin Organizativa de Divisiones a Distancia
Lic. David Taborda

rea de Formacin Docente y Produccin Educativa


Coordinador General
Oscar Margara
Asesora pedaggica
Dra. Adela Coria
Equipo de produccin en tecnologa educativa y comunicacin
Mgter. Gabriela Sabulsky
Lic. Cecilia Botino
Lic. Vctor R. Cacciagi
Lic. Laura Delmonte
Lic. Vanesa Guajardo
Esp. Vernica Pacheco
Lic. Mara Florencia Scid
Administracin
Lic. Nora Ceballos
Proyecto Elaboracin de material didctico en formato digi-
tal para Estadstica I en el marco del Programa de Apoyo y
Mejoramiento a la enseanza de grado de la UNC aprobado
por Res. HCS N583-2015.

Coordinadora del Proyecto:


Margarita Daz

AUTORES
Norma Patricia Caro
Rosana Beatriz Casini
Margarita Daz
Fernando Garca
Mariana Gonzlez
Martn Saino
Mara Ins Stmolo

Los autores agradecen especialmente a los Profesores Asistentes por la


colaboracin prestada en la resolucin y revisin de las actividades.
Mara Ins Ahumada
Lorena Anaya
Vernica Arias
Mariana Guardiola
Roberto Infante
Adrian Moneta Pizarro
Olga Padro
Andrea Righetti
Julio Rosales
Proyecto Fortalecimiento del Ciclo Bsico a Distancia en el
marco del Programa de Apoyo y Mejoramiento a la enseanza
de grado de la UNC aprobado por Res. HCS N 604-2014.

Coordinadora del Proyecto:


Dra. Adela Coria

Maquetacin de materiales
Lic. Vctor R. Cacciagi y Lic. Ismael Rodrguez

Diseo grfico y audiovisual


Lic. Laura Delmonte

Asesoramiento y diseo pedaggico - didctico


Esp. Vernica Pacheco y Lic. Vanesa Partepilo

Asesoramiento y diseo comunicacional


Lic. Cecilia Botino y Lic. Mara Florencia Scid
NDICE

Captulo 1:
Los mtodos estadsticos en la investigacin cientfica
1. Introduccin 1
2. Por qu estudiar estadstica? 1
3. Breve historia de la estadstica 2
4. Qu es la Estadstica? 3
4.1. Poblacin y muestra 4
4.2 Estadstica descriptiva e inferencial 5
5. Etapas del mtodo estadstico 6
5.1. Planteamiento del Problema 7
5.2. Recopilacin de datos 10
5.3. Tipos de variables 13
5.4 Organizacin y presentacin de datos estadsticos 16
5.4.1 Distribuciones Unidimensionales 17
5.4.2 Distribuciones Bidimensionales 33
5.4.3. Otro tipo de Grfico: Grfico logartmico. 42
5.5. Algunos lineamientos a considerar en la presentacin de informes 45
6. Actividades de aprendizaje 46
7. Casos de discusin y anlisis 53
8. Referencias Bibliogrficas 56
Soluciones y respuestas al Captulo 1 57
Captulo 1
Los mtodos estadsticos
en la investigacin cientfica
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

Captulo 1: Los mtodos estadsticos en la


investigacin cientfica

1. Introduccin

En esta unidad, a partir de la base de conceptos adquiridos en los cursos


de matemtica, damos inicio a este primer curso de estadstica que nos permiti-
r conocer la utilidad de estas herramientas en nuestra rea del conocimiento y
las etapas que debemos seguir para realizar un anlisis estadstico de los datos.
Adems veremos cmo obtener una primera aproximacin a un conjunto de
datos, a travs de su organizacin en tablas y grficos.

En resumen en esta unidad vamos a:


Visualizar los aportes de la estadstica en el proceso de produccin de
conocimientos en distintos campos cientficos.
Comprender la lgica de las etapas del mtodo estadstico.
Distinguir entre los distintos tipos de investigacin de acuerdo a la ma-
nera en que se recolectan los datos y a los fines que persiguen.
Identificar los distintos tipos de variables y las correspondientes escalas
de medicin.
Organizar los datos en tablas y grficos para encontrar una primera
descripcin de los mismos.

2. Por qu estudiar estadstica?


En la actualidad, la estadstica y sus aplicaciones forman parte de la vida
cotidiana, en mbitos tan diversos como la poltica, la medicina, la educacin,
los negocios, entre otros. Las posibilidades de acceso a la informacin y el au-
mento de capacidad de clculo de las computadoras, han hecho posible en las
ltimas dcadas importantes avances en el almacenamiento de grandes bases
de datos en los ms diversos campos de la Ciencias. Como afirma Pea, el
reto ms importante de la estadstica en este Siglo XXI es cmo extraer la in-
formacin de estas grandes masas de datos y utilizarla de manera efectiva para
aumentar nuestro conocimiento, orientar la toma de decisiones y dirigir la me-
jora de procesos y servicios (2001: pg.42)
En el rea de las Ciencias Econmicas la estadstica es una herramienta
muy importante y de gran utilidad. A menudo escuchamos acerca de las esta-
dsticas en las bajas y alzas en la Bolsa de Valores, las estadsticas sobre los
precios vigentes de un cierto producto o bien de relaciones estadsticas puntua-
les, como por ejemplo: 1) el comportamiento de las familias que como agente
econmico en el mercado genera estadsticas de ventas que, a su vez, ayudan a
las empresas a tomar decisiones sobre los productos que deben mantenerse,
descartarse o modificarse; 2) las empresas aseguradoras de autos recopilan
datos acerca de la edad de los conductores, el tipo de vehculo, accidentes ms 1
comunes y tales estadsticas guan a las empresas para fijar las primas de segu-
ro a cobrar.
Como la informacin permite generar conocimiento, se plantean de esta
manera modelos estadsticos para simplificar la realidad incorporando un cierto
grado de confianza a los resultados, dando una medida a la incertidumbre y
obteniendo, de esta manera, informacin til que contribuya a las decisiones.
Un modelo conocido, es por ejemplo, el que establece una relacin lineal
inversa entre el precio de un bien y la cantidad demandada. La estadstica apor-
ta mtodos que permiten evaluar la compatibilidad entre ese modelo terico
planteado y la informacin emprica que surge de los valores observados de
precios y cantidades, incorporando el concepto de aleatoriedad, para conside-
rar los distintos resultados posibles que se puedan presentar. Dentro de las
Ciencias Econmicas, la Estadstica puede aplicarse a diversas reas, razn por
la cual es una herramienta necesaria para los profesionales en esta rea. Como
ejemplos podemos enumerar:

En el rea contable:
Analizar determinadas variables en el tiempo, tales como nivel de factu-
racin, de gastos, ndices de endeudamiento, etc.
Seleccionar muestras de comprobantes y realizar tareas de control.
Realizar control de calidad sobre los artculos fabricados por una em-
presa.
Estudiar los factores que inciden en la rentabilidad de las empresas.

En el rea de economa:
Cuantificar el impacto de ciertos factores en el desempleo.
Medir la distribucin del ingreso.
Modelar el comportamiento del Producto Bruto Geogrfico a travs del
tiempo.

En el rea de administracin:
Identificar el perfil requerido de los empleados de una empresa.
Mejorar la calidad de los servicios.
Estimar la proporcin de clientes que prefieren determinados produc-
tos.

Llegar a informar cada una de las situaciones precedentes, exige todo un


proceso anterior que abarca desde el planteo de un objetivo, la recoleccin de
los datos pertinentes, el anlisis estadstico de los mismos y, por ltimo, la ob-
tencin y presentacin de los resultados. Esta es la razn por la cual necesita-
mos una formacin estadstica, ya que un profesional de Ciencias Econmicas
debe ser capaz de leer e interpretar datos de manera crtica, definir cules dan
respuestas claras a cuestiones importantes y conocer las metodologas que nos
permitirn extraer conclusiones objetivas basadas en anlisis de dichos datos.

Lo invitamos ahora a ingresar a 3. Breve historia de la estadstica


la seccin Materiales Recursos
del aula virtual para mirar la
produccin audiovisual Serie El origen de la estadstica se remonta a la edad antigua. Los estados ya
Horizontes de Canal Encuen- recogan datos en Egipto, hacia el ao 3050 A.C. bajo el reinado de Ramss II,
tro para acercarnos al surgi- en Israel, bajo el reinado del rey David, en China hace ms de cuarenta siglos,
miento de la Estadstica y sus como as tambin en la Grecia antigua. La informacin recogida tena como
categoras conceptuales bsi- propsito, entre otros, recaudar impuestos, repartir tierras, tener registros de
cas. nacimientos y muertes, etc. No obstante su origen antiguo, fueron los romanos
quienes hicieron censos con mayor sistematicidad y con una periodicidad de 5
aos; cuenta la historia que durante el nacimiento de Cristo se llev a cabo uno
2 de ellos. Luego de la cada del imperio romano vino un largo perodo de pobres
registros, resurgiendo recin en el ao 762 en Francia con Carlomagno y casi
trescientos aos despus, en Inglaterra, bajo el reinado de Guillermo El Con-
quistador, cuando se logra un gran compendio estadstico conocido como el
Domesday Book, para el ao 1086.

Ya en la edad moderna, especficamente a mediados del S. XVII, en Ale-


mania y de la mano de Conring, se afianza la visin de la estadstica cuyo objeti-
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

vo se defina como la descripcin cuantitativa de los hechos notables de un es-


tado, tendencia que fue proyectada y consolidada por Achenwall, quien utiliz
el trmino alemn statistik para referirse a esta disciplina, y posteriormente
por Von Scholer, a quien se le atribuye haber separado el estudio de la teora
estadstica de su aplicacin prctica. Todos ellos formaron parte de la Estadsti-
ca Universitaria Alemana, lo que constituye el antecedente ms formal de la
estadstica descriptiva actual.
A su vez, en Inglaterra, Graunt y posteriormente Petty encabezan otra l- La investigacin cientfica es
nea denominada Estadstica Investigadora. Esta escuela centr la atencin en la un proceso guiado y el objetivo
bsqueda de leyes empricas que explicaran los fenmenos sociales y polticos de los mtodos estadsticos es
de la poca. En base a sus ideas se comienzan a realizar los primeros censos hacer este proceso tan eficien-
oficiales en el sentido moderno del trmino. Como antecedente a ello, se cono- te como sea posible mediante
ce que el primero fue realizado por Espaa en Per, en 1548, mientras que, en la la formulacin de hiptesis y la
propia Europa el primero fue en Irlanda en el ao 1703. Y ya a comienzos del confrontacin con los hechos.
Siglo XIX casi todos los pases de Europa recogen informacin mediante censos
oficiales. En nuestro pas, bajo la presidencia de Sarmiento se llev a cabo el El mtodo cientfico permite
llevar a cabo el proceso de
primer censo nacional de poblacin en 1869, aunque el ms lejano antecedente investigacin cientfica, es la
estadstico argentino de que se tiene noticia est constituido por los primitivos aplicacin de la lgica y la obje-
recuentos de soldados y familias dispuestos por Don Juan de Garay al fundar la tividad a la comprensin de los
ciudad de Santa F. Una experiencia similar se registra en 1577, cuando Don fenmenos. De las sucesivas
Lorenzo Jurez de Figueroa encar el reparto de los solares de la Ciudad de confrontaciones entre hiptesis
Crdoba INDEC (1983). y datos se va avanzando en el
Paralelamente y con muy pocos puntos de contacto, durante el Siglo XVII conocimiento.
se desarrolla una rama de la matemtica conocida como Teora de Probabilidad,
que surge para resolver problemas de juegos de azar, modelando fenmenos
aleatorios. Entre los precursores se encuentran Pascal y Fermat. En el Siglo
XVIII, matemticos como Bernoulli, Laplace y Gauss desarrollan importantes
tcnicas estadsticas como la estimacin de un parmetro, el desarrollo de la
ley normal para describir la variabilidad de los errores de medida y el planteo
del problema de mnimos cuadrados. Posteriormente se aplic para el trata-
miento de los errores de medicin en el campo de la fsica y la astronoma, y en
el Siglo XIX se extendi a aplicaciones biolgicas y a otras reas, como las Cien-
cias Sociales. En este sentido, podemos mencionar a Quetelet, quien introduce
la aplicacin de la estadstica a las Ciencias Sociales y a Galton que introdujo el
trmino regresin para explicar el comportamiento de la estatura entre padres
e hijos. A su vez, debemos mencionar a sus discpulos Pearson, Goset (Student)
y Fisher que desarrollaron metodologas que constituyen el ncleo de la estads-
tica actual.

4. Qu es la Estadstica?
Como hemos hecho referencia en el punto anterior, los mtodos estads-
ticos constituyen una herramienta indispensable para llegar a conclusiones
confiables a partir de resultados empricos que surgen del anlisis de datos.
En un sentido amplio, la estadstica es el arte y la ciencia de reunir, anali-
zar, presentar e interpretar datos. Mood y Graybill expresan que la estadstica
es la tecnologa del mtodo cientfico. La estadstica proporciona instrumentos
para la toma de decisiones cuando prevalecen condiciones de incertidumbre
(1978; pag 3). Otros autores consideran que es la ciencia desarrollada para re-
solver problemas en presencia de variabilidad. La esencia de la estadstica con- 3
siste en el desarrollo y uso de modelos de pensamiento que se dirigen hacia la
comprensin del mundo real y a la prediccin del futuro ya que tiene en cuenta
la incertidumbre.

Qu se entiende en estadstica por variabilidad e incertidumbre? Habla-


mos de variabilidad porque una serie de datos estadsticos surge de mediciones
efectuadas a ciertos elementos y los resultados varan de una unidad a otra.
Adems, muy a menudo se trabaja con una parte de la totalidad de los
elementos o individuos que estn bajo consideracin en una investigacin, lo
cual genera incertidumbre. En estadstica, a esa totalidad de elementos se de-
nomina Poblacin. Como las poblaciones a menudo son muy grandes, es impo-
sible o muy costoso recoger informacin de toda la poblacin, lo que obliga a
trabajar con una parte representativa de esa poblacin, denominada Muestra
Aleatoria.

4.1. Poblacin y muestra


Ahora, lo invitamos a ingresar a
la seccin Materiales Recursos Una poblacin es el conjunto completo de elementos o individuos que interesa
del aula virtual a ver la produc- en una investigacin, cada elemento se designa como unidad estadstica y su
cin audiovisual Serie Hori- tamao se representa por la letra N. Una muestra es una parte de la poblacin
zontes de Canal Encuentro, en que se selecciona para realizar una determinada investigacin y su tamao se
relacin al tema poblacin y indica con n.
muestra.

Necesitamos una muestra que sea representativa de la poblacin, a fin de


extender las conclusiones hacia la poblacin de donde la misma ha sido selec-
cionada. Para ello los elementos de la muestra deben ser seleccionados aleato-
riamente.

Una Muestra Aleatoria es aquella en la que todos los elementos de la poblacin


Un generador de nmeros tienen una probabilidad conocida de ser seleccionados. Si la probabilidad es
aleatorios es un dispositivo igual para todas las unidades estadsticas, el mtodo se conoce como Muestra
informtico o fsico diseado Aleatoria Simple.
para producir secuencias de El listado de los elementos a partir del cual se selecciona la muestra en estads-
nmeros sin un orden aparente. tica es denominado Marco muestral.
Por ejemplo el uso de los boli-
lleros en los sorteos, o en Excel
Las caractersticas de la unidad estadstica relacionada con el tema sobre el
las funciones aleatorio o cual estamos investigando que deben relevarse se denominan variables en
aleatorio.entre. estadstica.

Ejemplo Anlisis Industrias de Crdoba

Para ilustrar los conceptos de poblacin y muestra, utilizaremos el si-


guiente ejemplo:

Podr leer el Informe del An- La Unin Industrial de Crdoba, durante el ao 2006, realiz un estudio para
lisis de las industrias de Crdo- analizar distintos aspectos de la actividad industrial. Para ello, de la poblacin
ba en la seccin Enlaces de de 2000 industrias radicadas en la provincia (N=2000), se tom una muestra
Inters del aula virtual. aleatoria de 150 empresas (n=150).

En este ejemplo, para una muestra aleatoria simple, cada una de las 2000 in-
dustrias tiene igual probabilidad de ser seleccionada (0,005=1/2000). Una
forma de conformar la muestra de 150 empresas es elegir al azar 150 nmeros
de un listado de 2000 nmeros que se han asignado a las empresas. El listado
4 de las 2000 industrias se denomina en estadstica marco muestral.

Toda medida resumen que se calcula para describir caractersticas del


estudio a partir de la muestra se denomina Estadstico, el que podr ser utiliza-
do para inferir conclusiones sobre la poblacin.
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

Parmetro y Estadstico
Toda medida resumen que se calcula para describir caractersticas poblaciona-
les se llama parmetro, el cual es una cantidad fija que generalmente no se co-
noce y debe ser estimada. Un estadstico es una medida calculada con las ob-
servaciones muestrales.

4.2 Estadstica descriptiva e inferencial

Dada la base de datos, y despus de una primera organizacin de los da-


tos, es posible avanzar en el descriptivo de los datos y aplicar tcnicas que per-
miten la resolucin de problemas bajo condiciones de incertidumbre. Teniendo
en cuenta ello, podemos dividir los mtodos estadsticos en dos grandes ramas:

La Estadstica Descriptiva est formada por aquellos mtodos grficos y num-


ricos que se utilizan para resumir y procesar los datos, con el fin de describir
apropiadamente sus principales caractersticas. La Inferencia Estadstica inclu-
ye los mtodos que permiten hacer generalizaciones con respecto a la pobla-
cin con base en informacin proporcionada por una muestra aleatoria, con un
grado de incertidumbre cuantificable.

La Estadstica Descriptiva, desde la dcada del 60, incorpor nuevas me-


didas y grficos al anlisis descriptivo tradicional que se presentaron bajo el
nombre Anlisis exploratorio de datos. Los mtodos de la Estadstica Inferencial
se basan en la teora de probabilidad, y permiten construir intervalos de estima-
cin para los parmetros desconocidos y realizar pruebas de hiptesis.

El siguiente esquema ilustra los conceptos definidos en esta seccin.

5
En esta asignatura aprenderemos los mtodos englobados en estadstica
descriptiva, as como la teora de probabilidad y variables aleatorias. En el lti-
mo captulo introduciremos al estudio de las distribuciones en el muestreo, que
constituye el fundamento terico para el estudio de los mtodos inferenciales.
Ejemplo Anlisis Industrias de Crdoba

Con los datos de la muestra se realiz un anlisis descriptivo de cada


una de las caractersticas relevadas y de algunas relaciones entre varia-
bles (estadstica descriptiva).
Adems, otro objetivo del estudio consisti en estimar el porcentaje de empre-
sas de la poblacin que usan Internet, para lo cual se utilizaron mtodos infe-
renciales como la estimacin de parmetros por intervalos (estadstica inferen-
cial).

No obstante las diferencias en cuanto a los objetivos que pueden tener


los estudios, siempre debe seguirse un razonamiento lgico que puede resumir-
se en las etapas del mtodo estadstico.

5. Etapas del mtodo estadstico


Las etapas a seguir para realizar un estudio estadstico que permitir la
toma racional de decisiones, se pueden organizar de la siguiente manera:

Estos mtodos de inferencia


estadstica sern estudiados en
Estadstica II. De manera intui- En resumen cada etapa consiste en:
tiva un intervalo de confianza
es un rango de valores (calcu- Planteamiento del Problema: en primer lugar se deben definir los obje-
lado en una muestra) en el cual
tivos del estudio, la poblacin objetivo, a partir de la cual se construir
se encuentra el verdadero valor
del parmetro, con una proba-
el marco muestral y las variables de inters y sus relaciones. Cuando se
bilidad determinada. Una prue- trabaja con una muestra, en el planteamiento del problema, se debe de-
ba estadstica es un procedi- cidir el mtodo de muestreo ms conveniente, determinar el tamao de
miento para, a partir de una la muestra y la precisin esperada, temas que escapan al alcance de es-
muestra aleatoria, extraer ta materia
conclusiones que permitan
aceptar o rechazar una hipte- Diseo y recopilacin: Formulacin estadstica de la cuestin: definir la
sis previamente formulada poblacin de estudio a partir del marco muestral, el tipo de estudio a
sobre el valor de un parmetro realizar y las variables de inters. Disear cmo se obtienen los datos,
desconocido de una poblacin.
una vez recolectados se realiza un anlisis de consistencia, elaborando
de esta manera la base de datos para su anlisis.
6
Organizacin y presentacin de datos: se refiere a la presentacin de
los datos en tablas y grficos, que muestran su comportamiento y de es-
te modo nos ayudan a comprender la informacin recabada.

Anlisis: consiste en el clculo de medidas descriptivas y la interpreta-


cin de la informacin obtenida (estadstica descriptiva), lo que, de ma-
nera conjunta, nos permitir responder los objetivos del estudio. Cuan-
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

do se est trabajando con una muestra, los resultados se proyectan a la


poblacin, estableciendo un error, esto forma parte de la estadstica in-
ferencial que bsicamente consiste realizar estimaciones por intervalos,
contrastar hiptesis y validar los supuestos en que se basa los modelos
planteados.

Resultados: Finalmente se informan los resultados ms relevantes res-


pondiendo a los objetivos iniciales planteados en la formulacin del
problema. Es necesario presentar los resultados de manera adecuada,
de forma tal que contribuya a una mejor comprensin y exposicin de
los mismos, en funcin de los objetivos del trabajo.

En este captulo y en el siguiente se introducen los conceptos de las dos


primeras etapas sealadas y se ilustran las tcnicas para la organizacin, clcu-
lo de medidas descriptivas y su interpretacin. A continuacin analizamos en
detalle cada etapa.

5.1. Planteamiento del Problema

Como se seal precedentemente, lo primero que se debe hacer en una


investigacin es definir el problema que se quiere abordar, para lo cual debe
tenerse muy en claro la poblacin objetivo, los parmetros a estimar y/o prue-
bas de hiptesis que se plantean. Para ello se deber definir:

Ejemplo Anlisis Industrias de Crdoba

El marco muestral fue confeccionado a partir del listado de aproxima-


damente 2000 empresas provisto por el Registro Industrial de la Pro-
vincia. De ese padrn se seleccion una muestra aleatoria de 150 empresas y
un grupo adicional de 53 firmas, elegidas conforme a criterios predeterminados Explore el contenido del In-
forme sobre Anlisis de las indus-
por la Unin Industrial. Una de las dimensiones del estudio fue la insercin in-
trias de Crdoba. Observe el
ternacional de la firma, para lo cual se definieron, entre otras, las siguientes ttulo, los diferentes apartados,
caractersticas variables- a relevar: Si la empresa es exportadora; si lo es, si el ndice, etc.
tiene necesidad de financiacin y asesoramiento para exportar, como as tam-
bin la evolucin de las exportaciones en relacin al ao anterior.

De acuerdo a los objetivos que persiguen, los estudios se clasifican como


se muestra en el siguiente esquema.

7
Estudios Exploratorios: estos estudios se basan en casos seleccionados discre-
cionalmente (no aleatoriamente) y suelen ser el paso inicial de estudios poste-
riores, porque ayudan a familiarizarnos con la situacin o el problema, a identi-
ficar las variables importantes y a utilizar estas ltimas para plantear hiptesis
que puedan ponerse a prueba en una investigacin posterior.

La falta de aleatorizacin es una limitacin bsica de los estudios obser-


vacionales. Esta limitacin se ve reflejada en el anlisis de los datos donde se
debe tener mucho cuidado en el momento de obtener conclusiones y en la ge-
neralizacin de las mismas.
Validez es la comprobacin de La validez de las conclusiones obtenidas depende en gran medida de los
lo que se deseaba medir es conocimientos del experto sobre el tema que investiga y de la incorporacin de
medido realmente. informacin externa proveniente de otros estudios.

Algunos ejemplos de estudios exploratorios:

- La Unin Industrial solicita un estudio sobre un conjunto especfico de


empresas, seleccionadas por ciertas caractersticas particulares para
analizar las formas de gerenciamiento de las mismas a travs de entrevistas a
personas claves dentro de la empresa.

- Frecuentemente en marketing es necesario probar la eficacia de diversas


campaas publicitarias. En tcnicas conocidas como grupos focales, se analiza
la reaccin de un grupo seleccionado de clientes potenciales ante distintas pro-
puestas de presentacin del producto.

- Existen estudios observacionales denominados paneles de basura que estu-


dian la basura humana para analizar los patrones de consumo domstico. Ac-
tualmente el uso de los escneres electrnicos permiten hacer estudios obser-
vacionales (en reemplazo a la observacin humana) sobre el consumo de pro-
ductos y cambio de comportamientos de consumo.

Estudios descriptivos/confirmatorios: en estos estudios el objetivo es hacer


inferencia respecto a la poblacin, para lo que se trabaja con una muestra alea-
toria. En los relevamientos muestrales se estiman parmetros desconocidos de
la poblacin. En los experimentos el diseo es ms exigente ya que se quieren
probar relaciones de causalidad. A continuacin se explican algunas caracters-
ticas de estos estudios.

Diseos de experimentos: tienen como objetivo determinar si algunas varia-


bles, generalmente llamadas tratamientos, afectan a otra conocida como varia-
ble respuesta. Para obtener conclusiones vlidas sobre causalidad, se debe
ejercer control sobre uno o ms factores que afectan la respuesta. Los experi-
mentos son investigaciones que se caracterizan por ser estudios organizados y
controlados por el investigador. Adems de utilizar tcnicas apropiadas de di-
seo experimental, se efecta una buena planificacin estadstica que permite
establecer una relacin entre los tratamientos en estudio y las respuestas ob-
servadas. Para realizar un experimento se asignan aleatoriamente las unidades
muestrales a cada uno de los tratamientos, observando posteriormente los re-
sultados obtenidos.
Estudios de este tipo se llevan a cabo frecuentemente en agronoma y
8 medicina, aunque ha tenido un importante desarrollo en administracin.

Ejemplos de diseos de experimentos:

- Un ejemplo en agronoma, consiste en seleccionar parcelas, a las cua-


les se les aplican diferentes fertilizantes (tratamientos) y se quiere sa-
ber cul es el que produce mayor rendimiento (respuesta). Para obtener con-
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

clusiones vlidas se deben controlar algunos factores como pueden ser la cali-
dad del suelo y la cantidad de riego.
- En investigacin de mercado, cuando se desarrolla un nuevo empaque para un
producto y se desea conocer si el mismo va a tener xito en cuanto al aumento
de las ventas. El producto se vende en 10 supermercados de la ciudad. El inves-
tigador de mercado dividir a los supermercados en dos grupos de 5. A un gru-
po de 5 supermercados enviar el producto envasado en el empaque tradicional
y al otro grupo de 5 supermercados enviar el producto con su nuevo envase. La
aleatorizacin ser contemplada por el investigador si la asignacin de los su-
per- mercados a los distintos empaques se hace estrictamente al azar. Si se ha
respetado esta aleatorizacin, se puede aplicar una metodologa estadstica
conveniente que le permitir tomar decisiones en cuanto a la eficacia del nuevo
empaque.

A pesar de la garanta en cuanto a la validez de sus conclusiones, los ex-


perimentos no siempre son posibles de realizar debido a la existencia de res-
tricciones lgicas o ticas que limitan la aplicacin de las tcnicas de aleatori-
zacin. Por ejemplo, un investigador mdico no puede dejar a un grupo de pa-
cientes sin darle una cierta droga para el tratamiento de una enfermedad sim-
plemente para comparar la eficacia de una droga en el tratamiento de la enfer-
medad. Se enfrentar as a un problema tico, aparentemente contrapuesto al
avance de la ciencia.

Relevamientos muestrales: En el relevamiento muestral el investigador estudia


una poblacin bien definida extrayendo de ella un subconjunto de unidades de
observacin denominado muestra. Si la muestra se obtiene al azar se dice que
se tiene una muestra aleatoria. Slo las muestras aleatorias permiten obtener
conclusiones respecto de las poblaciones de las cuales se extraen, adems de
informar el error estadstico de tales conclusiones.

Es evidente que para que las conclusiones obtenidas a partir de una


muestra reflejen verdaderamente lo que est ocurriendo en la poblacin, el in-
vestigador debe tener en cuenta el proceso de aleatorizacin al disear su plan
de muestreo y al obtener la informacin pertinente. Para seleccionar una mues-
tra aleatoria se debe contar con un marco de muestreo adecuado que es el lis-
tado de todos los elementos que componen la poblacin.

La mayora de los estudios que se realizan en el rea de las Ciencias Eco-


nmicas se hacen a travs de encuestas por muestreo, razn por la cual nos
detenemos en este tipo de estudio.

Algunos de los numerosos ejemplos que podemos plantear son los siguientes:

- Si se quiere seleccionar una muestra de alumnos de la Facultad de


Ciencias Econmicas, un marco de muestreo adecuado estara dado por
el registro de alumnos que se encuentra en el despacho de Alumnos de la Facul-
tad donde se los tiene ordenados por nmero de legajo. Una manera de selec-
cionar los alumnos al azar podra ser seleccionar sistemticamente 1 de cada
100 alumnos. A estos alumnos seleccionados al azar se les har la entrevista
correspondiente. Tambin se podran generar nmeros aleatorios utilizando un 9
programa de computacin adecuado y los alumnos que se corresponden con los
nmeros seleccionados, sern luego entrevistados. La seleccin aleatoria de la
muestra asegura la representatividad de la misma y la buena generalizacin de
los resultados obtenidos en la muestra a la poblacin de alumnos de la Facultad.
- En el estudio realizado por la Unin Industrial, se seleccion aleatoriamente
una muestra de 150 empresas, a las que se les administr un cuestionario. Revi-
se la introduccin del informe de del Anlisis de las industrias de Crdoba.
- Para determinar la eficacia de una campaa publicitaria en una ciudad, se se-
lecciona una muestra aleatoria de personas a entrevistar.
- En una auditora contable, se selecciona una muestra aleatoria de comproban-
tes para estimar el porcentaje que tienen errores.

5.2. Recopilacin de datos

Los datos pueden provenir de fuentes primarias o secundarias. Una de


las principales fuentes primarias es la encuesta por muestreo (survey), en los
que los datos son recolectados aplicando un cuestionario a los elementos de la
poblacin o muestra seleccionada.
En el punto siguiente trataremos algunos aspectos a tener en cuenta en la
elaboracin de este instrumento.

Diseo de cuestionarios

El diseo del instrumento para recolectar datos es vital a la hora de reali-


zar la encuesta, ya que nos permite recabar informacin significativa que ayude
al proceso de toma de decisiones. El procedimiento general para disear un
cuestionario involucra:

- la eleccin de preguntas que deben responder a los objetivos del estudio


- determinar la forma de administrar el cuestionario (personal, telefnico o por
correo)
- la redaccin de las preguntas
- determinar el formato de respuestas: preguntas cerradas o abiertas
- prueba y evaluacin del cuestionario

Podr acceder al formulario A continuacin se presentan como ejemplos de cuestionarios un bloque


completo del estudio realizado del cuestionario administrado a la muestra de empresas seleccionadas en el
por la Unin Industrial en la estudio realizado por la Unin Industrial y un cuestionario que se aplica a los
seccin Recursos y Materiales alumnos de Estadstica con fines educativos.
del aula virtual.
C. INSERCION INTERNACIONAL DE LA FIRMA
16. Exporta?
17. Si no exporta, quisiera exportar alguno de sus productos?
1.Si 2.No 1.Si 2.No Pasar a la pregunta 25

18. Necesita asesoramiento para exportar?


21. Las exportaciones directas de la empresa durante 2005 constituyeron el
1.Si 2.No % del total de las ventas de igual perodo.

19. Necesita financiacin para exportar? 22.El monto total de las exportaciones en el 2005 comparadas con las del 2004

1.Si 2.No 1.Aumentaron 2.Disminuyeron 3.Sin cambios 4.NO export en el ao 2004

23. En su operatoria normal de exportacin, tiene alguna dificultad especial


20. Seale el motivo
que le signifique una prdida competitiva?
1.Capital de trabajo
1.Si 2.No
2.Adquisicin de maquinaria
3.Post-financiamiento de exportaciones 24. Podra identificarla/s en orden de importancia?
4.Otras (especificar) 1
(Si respondi No en la pregunta 16 2
pasar a la pregunta 25) 3
10 4
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

Encuesta Estadstica I - Ao 2006 - Ctedra: ................


El objetivo de esta encuesta es obtener una base de datos para el anlisis de los mismos durante el dictado de la mate-
ria.
Datos Personales

1. DNI (tres ultimos dgitos): 2.. SEXO: 2.1. Masculino 2.2. Femenino

3. EDAD aos. 4.Peso (en kg) 5.Estatura cm


6.Ud. vive en: 7.1Vivienda Propia 8.1Vive con Padres 9.Lugar de procedencia :
8.2 Amigos 9.1 Ciudad de Crdoba
7.2Alquila
6.1.Casa 8.3Solo 9.2 Interior de la Pcia de Crdoba
7.3.Vivienda Prestada 9.3 Otras Provincias
6.2.Departament 8.4Otro. Quien?................ 9.4Otros pases
o

10. Cuantas Horas diaria trabaja?


1. No trabaja Trabaja hs.
Desempeo acadmico
11. Su primer ao universitario puede calificarse como:

1. Muy Fcil 2.Fcil 3. Regular 4.Difcil 5. Muy Difcil

12. Cantidad de materias aprobadas 13. Cantidad de aplazos en examen

14 .En general las matemticas son para Ud. :

1. Muy Fciles 2.Fciles 3.Regulares 4. Difciles 5. Muy Difciles

Nota obtenida en el examen final de:


15. Matemtica I : 1 2 3 4 5 6 7 8 9 10 No Rindi Marcar con un crculo la respuesta
16. Matemtica II : 1 2 3 4 5 6 7 8 9 10 No Rindi
17. Cuntas veces al ao solicita libros en la biblioteca?

18. Indique el gasto promedio (en pesos) que realiza en:

1.Libros y apuntes $ anual 2.Movilidad $ .. mensual

19. Cunto tiempo (en horas) dedica en promedio para preparar un examen de:

1. rea matemtica hs. 2. rea administrativa contable.


20. Cmo se autocalificara como estudiante universitario?

1.Distinguido 2.Muy Bueno 3.Bueno 4.Regular 5.Malo

Hbitos de vida
21. Fuma:
1.Si 2. No

22. Que actividad fsica realiza:


1. No hace activ. Fsica
2. Camina y/o corre , cuantas veces por semana: 1 2 3 4 5 6 7 Marcar con un crculo
3. Gimnasia, cuantas veces por semana: 1 2 3 4 5 6 7 la respuesta
4. .Deportes ,cuantas veces por semana: 1 2 3 4 5 6 7

23. Consume bebidas alcohlicas

1. Todos los das 2. Todos los fines de semana 3.Eventualmente en algunas ocasiones
4. Nunca
11
En ambos modelos de cuestionarios pueden observarse dos tipos de pre-
guntas:
1) aquellas que se completan con la informacin solicitada, las que se de-
nominan preguntas abiertas -por ejemplo la pregunta 24 del primer cuestiona-
rio- y
2) preguntas en la que el entrevistado debe seleccionar una o ms de las
opciones presentadas, las que se denominan preguntas cerradas. Tambin es
conveniente sealar que el cuestionario no debe ser demasiado largo y que las
preguntas deben ser concisas, no ambiguas y preferentemente de tipo cerradas.
Las preguntas abiertas condicionan menos al entrevistado y permite explorar
significados pero la desventaja es que reciben mayor influencia del encuesta-
Algunos organismos importan- dor, hay ms dificultad para codificar las respuestas y se recaban ms respues-
tes con informacin estadstica tas inapropiadas.
disponible son:
Los datos de fuentes secundarias son aquellos que han sido reunidos y
- Instituto Nacional de Estads- publicados por otras instituciones.
ticas y Censos.
- Direccin Nacional de Esta- En general se trabaja con datos provenientes de organismos pblicos o
dsticas y Censos de la Provin- privados tales como INDEC, BCRA, AFIP, Cmaras empresariales, ONU, FMI,
cia.
slo para mencionar algunos, muchos de los cuales, desde hace algunos aos
- Comisin Econmica para
Amrica Latina y el Caribe. estn disponibles en internet.
Los datos de fuentes primarias son los que recopila el propio investigador
Podr acceder a los sitios ofi- para resolver un problema particular. Un instrumento habitual para recoger
ciales desde la seccin Enlaces datos primarios es el cuestionario, en el que se formulan preguntas respecto a
de Inters del aula virtual. datos personales, opiniones, actitudes, comportamiento y otras caractersticas.

Actividad 1
En cada uno de los siguientes casos defina la poblacin y clasifique el tipo de
estudio de acuerdo a sus objetivos.

De la Encuesta Permanente de Caso 1.- La Encuesta Permanente de Hogares se realiza dos veces al ao
Hogares se han extrado algu- en base a una muestra representativa de hogares de las principales ciudades
nas variables para 100 casos de del pas. El objetivo de la misma consiste en describir la situacin del empleo y
1 onda. la comparacin de situaciones de desempleo entre ciudades y entre perodos en
Podr acceder a ella desde la los cuales se realiza la encuesta.
seccin Enlaces de Inters ->
Bases de Datos -> EPH.XLS del
aula virtual. Caso 2.- El Departamento de Compras de una fbrica de tractores ha en-
carado el estudio de la duracin de las bateras que compra a 3 proveedores con
el fin de mejorar la calidad de sus productos en base a un plan de calidad total.
Para ello solicita una muestra de 10 bateras a cada uno de los proveedores,
cuidando que todas las bateras tengan exactamente las mismas caractersticas
de funcionamiento.
Las bateras son llevadas al Departamento de Investigacin y Desarrollo
de la fbrica donde se han implementado una serie de tests de durabilidad
apropiada. Todas las bateras son sometidas a los mismos tests bajo las mismas
condiciones (calor, humedad, personal encargado de efectuar las mediciones,
etc.). Al finalizar se anota una cierta medida de durabilidad que luego ser
comparada entre los 3 proveedores para ver si hay alguno de ellos que se dife-
rencia realmente en cuanto a la calidad de las bateras.
12
Caso 3.- Una Oficina de Salud desea efectuar un estudio de la tasa de
mortalidad asociada a la causa del fallecimiento. Para ello utiliza los certificados
de defuncin otorgados en distintas municipalidades. El objetivo del estudio
consiste en tomar acciones preventivas para disminuir el riesgo de determina-
das enfermedades.
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

Caso 4.- La encuesta industrial se realiza en forma trimestral en el Institu-


to de Estadstica de la Facultad con el objetivo de evaluar la marcha de la indus-
tria cordobesa a travs de la opinin de los empresarios. Para ellos se toma una
muestra de firmas seleccionadas al azar, teniendo en cuenta el tamao de las
mismas medido por la cantidad de empleados. Luego de analizar los datos se
publican tablas mostrando los porcentajes correspondientes a las opiniones de
las empresas encuestadas.

Caso 5.- A los efectos de indagar el sistema de evaluacin de los emplea-


dos de las empresas familiares de la Ciudad de Crdoba un investigador selec-
cionar discrecionalmente 10 empresas que difieren en tamao y tipo de activi-
dad de un total de 300 empresas. En las que realizara entrevistas en profundi-
dad a directivos y empleados.

5.3. Tipos de variables

En estadstica, cada una de las caractersticas a estudiar se denomina va-


riable, la cual admite diversas respuestas para las unidades estadsticas. A su
vez, la realizacin de una respuesta particular constituye un dato.

En el ejemplo Encuesta a alumnos, para las variables sexo, cantidad de


materias aprobadas y gastos en libros, los datos de un alumno en parti-
cular son:

Sexo: Mujer
Cantidad de materias aprobadas: 3
Gasto en libros: $147

En el estudio de las industrias, donde se miden las variables actividad,


cantidad de personal, monto de ventas anuales y si es exportadora, para una
empresa particular se obtuvieron los siguientes datos:

Actividad: Industria Alimenticia


Cantidad de personal: 50
Monto de ventas anuales: $8.000.000
Exporta: S

Clasificacin de las variables


Las variables se clasifican en:

Cuando la pregunta admite como respuesta un nmero, se trata de una 13


variable cuantitativa o numrica. A su vez, si los valores que asume la variable
surgen de un conteo o de una enumeracin, la variable es numrica discreta,
como por ejemplo cantidad de materias aprobadas (nmeros enteros). En
cambio si se obtienen datos a travs de un sistema de medicin, la variable es
continua ya que asumira valores en un intervalo (nmeros reales). En el rele-
vamiento a los alumnos, el gasto en libros y la estatura constituyen ejem-
plos de este tipo de variables.
Cuando la variable no admite una respuesta numrica, sino que la unidad
de anlisis se asigna a una clase o categora la variable es cualitativa o categ-
rica. Ejemplos de variables cualitativas son: sexo, lugar de procedencia, nivel de
educacin de los padres, el motivo por el cual necesita financiacin para expor-
tar.

Cmo se miden las variables

La medicin de una variable (o caracterstica de estudio) es el proceso de


asignar nmeros u otros smbolos a los elementos. La regla por la cual se asig-
nan los nmeros o smbolos constituye una escala de medicin, y cada escala
cuenta con propiedades que las distinguen.
La escala de medicin es nominal cuando los elementos se asignan a ca-
tegoras preestablecidas. La propiedad que la caracteriza es categorizar o dar
categoras, por ejemplo en la variable procedencia se definieron las categoras:
Ciudad de Crdoba, Interior de la Pcia de Crdoba, Otras provincias, Otros
pases; a las que se les asignaron nmeros de 1 a 4. Estos nmeros slo tienen el
valor de dar un cdigo a cada categora, la eleccin es arbitraria ya que po-
dramos haberle dado cualquier otro valor o cambiar el orden de la codificacin.

Por ejemplo:

1- Otros pases 10- Otros pases


2- Interior de la Provincia de Cba. 20- Interior de la Provincia de Cba.
3- Otras Provincias 30- Otras Provincias
4- Ciudad de Crdoba 40- Ciudad de Crdoba

Las categoras a las que se asignan las unidades de observacin se expre-


san por palabras y son mutuamente excluyentes y exhaustivas. El concepto
mutuamente excluyente significa que si un elemento pertenece a una categora
no puede pertenecer a la vez a otra categora de la variable. Exhaustiva significa
que todos los elementos de la poblacin o muestra deben ser clasificados en
una categora. Las variables sexo y el motivo por el cual necesita financiacin
para exportar, son tambin ejemplos de variables categricas medidas en esca-
la nominal. En el caso particular en el que las variables presentan slo dos cate-
goras se denominan variables dicotmicas.

La escala es ordinal cuando las respuestas estn dispuestas en un cierto


orden, al asignarle nmeros se utiliza la propiedad de orden, como por ejemplo
el nivel de educacin de los padres. Tambin aqu las categoras deben ser mu-
tuamente excluyentes y exhaustivas.

Otro ejemplo es la variable Su primer ao universitario puede calificarse como:

1. Muy Fcil
2. Fcil
3. Regular
4. Difcil
14 5. Muy Difcil

Las escalas de intervalo y de razn que veremos a continuacin slo pue-


den ser utilizadas con variables numricas.

La Escala de Intervalo, agrega a la propiedad de orden, la de igualdad de


diferencias dada por distancias o intervalos iguales. No slo permite conocer
cul es el valor ms grande sino cuantificar en cunto es ms grande, por lo que
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

representa, matemticamente hablando, un nivel de medicin ms preciso que


las anteriores. En esta clase de medida, la proporcin de dos intervalos cuales-
quiera es independiente de la unidad de medida y del punto cero. Un ejemplo
tpico es la medicin de la temperatura en la que se utilizan bsicamente dos
escalas, Celsius y Fahrenheit, en ambas el valor cero es diferente, es un valor
arbitrario definido por una convencin determinada. Cuando medimos la tem-
peratura en grados Celsius podemos afirmar que entre 40 y 20 hay 20 grados
de diferencia pero no podemos decir que 40 es el doble de calor que 20 por-
que el punto cero de referencia tiene distinto significado en cada escala.
Sin embargo en la mayora de las mediciones con escala numrica, se de-
fine un punto cero real en su origen, lo que define una escala de razn. Los
ejemplos de variables numricas planteados estn dados en escala de razn:
cantidad de materias aprobadas, gastos en libros y estatura. Son variables don-
de el cero indica nulidad o ausencia de los que se estudia. Para las materias
aprobadas, 0 indica que no ha aprobado ninguna.
Esta escala adems de la distincin de orden y distancia, permite estable-
cer en qu proporcin es mayor un valor de la variable que otro.

La distincin entre escalas de


Por ejemplo, si los alumnos A y B tienen 4 y 6 materias aprobadas res- intervalos y razn es muy sutil,
pectivamente, podemos afirmar que B tiene dos materias aprobadas incluso pocas veces nos encon-
ms que A, o que tiene el 50% ms de materias aprobadas. tramos con ejemplos de esca-
las de intervalos, por lo que
En el cuadro siguiente se resumen los tipos de variable y sus posibles ni- este material se trabajar con
escalas de razn.
veles de medicin, en el que se observa que las variables numricas son las que
permiten elegir distintos niveles de medicin.

Por ejemplo, el nivel de ingresos de los jefes de hogar puede obtenerse Esta limitacin puede ser defi-
en una escala numrica (escala de razn) como Ingresos obtenidos en nida en pos a una respuesta
ms confiable, sabiendo que la
pesos en el ltimo mes.
informacin sobre ingresos no
siempre es dada en forma fide-
Sin embargo, puede el nivel de ingresos organizarse como categoras, definien- digna por prejuicios de ndole
do por ejemplo tres categoras, a saber: ingresos bajos (de 0 a 5000$), ingre- social o impositivo, los que se
sos medios (de 5000 a 15000$) e ingresos altos (ms de 15000$). En este l- evitan definiendo intervalos de
timo caso hemos modificado la escala pasando de una escala de razn a una ingresos en la pregunta.
escala ordinal, limitando las posibilidades de anlisis de los datos.

SENTIDO EN QUE SE PUE-


TIPO DE VARIABLE NIVEL DE MEDICIN DEN MODIFICAR LAS ES-
CALAS
Nominal
Categrica
Ordinal
Numrica De intervalos
(discreta y continua) De razn

Es muy importante la eleccin de la escala porque el anlisis estadstico


difiere segn el tipo de variable y la escala utilizada.

Actividad 2:
1- Determine si cada una de las siguientes variables es categrica (cualitativa)
15
o numrica (cuantitativa), ysi es numrica indique si es discreta o continua.

a) Cantidad de personas que habitan por vivienda.


b) Tipo de vivienda.
c) Cantidad de habitaciones.
d) Cantidad de dormitorios.
e) Ingreso total de las personas que habitan la vivienda.
f) Gasto en bienes duraderos por semestre.
g) Si tiene lnea telefnica
h) Gasto en bienes de consumo por mes.

2- De la clasificacin anterior identifique una variable dicotmica y una varia-


ble con escala nominal.
3- Modifique una variable con escala numrica a una escala ordinal.

5.4 Organizacin y presentacin de datos estadsticos

Una vez que disponemos de los datos los organizamos en una tabla don-
de en las columnas definimos las variables y en las filas cada individuo A esta
tabla la denominamos base de datos
Actualmente la disponibilidad de datos en soporte electrnico, permite
trabajar los mismos desde programas informticos orientados especialmente
Infostat para la organizacin y anlisis de datos. Existe una gran oferta de estos progra-
Este software ha sido diseado mas dentro de los cuales hemos seleccionado Infostat. El diseo de Infostat es
en la Universidad de Crdoba similar al de otros softwares estadsticos, lo que brinda al usuario la posibilidad
desde la Facultad de Ciencias de adaptarse de manera relativamente fcil, y adems cuenta con un manual
Agropecuarias. de ayuda al que se puede acceder seleccionando la opcin MANUAL en el me-
Existe una versin libre dispo- n AYUDA.
nible su pgina web. Usted
puede solicitar una clave gra- Aspectos generales del software
tuita ingresando por Clave Al abrir InfoStat, se visualizar una barra de herramientas localizada en la
gratuita para versin estudiantil.
parte superior de la ventana del programa, la que contiene los siguientes me-
Para una introduccin ms ns: Archivo, Edicin, Datos, Resultados, Estadsticas, Grficos, Ventanas, Apli-
detallada del uso del software caciones y Ayuda. Los softwares estadsticos en general permiten crear una
puede consultar la Gua de base de datos o leer una base de datos generada por otro programa (excel, ac-
introduccin al uso del softwa- ces, o algn programa estadstico). En Infostat podemos abrir una base de datos
re estadstico InfoStat dispo- en formato del programa (extensin idb) o desde otros formtos comoo Excel,
nible en la seccin Enlaces de veamos a continuacin como abrimos la base alumnos.xls (disponible en la
Inters del Aula Virtual. seccin Materiales y Recursos del aula virtual).

Veamos cmo hacemos con Infostat


Al ingresar al programa Infostat, seleccione del men ARCHIVO -> NUEVA
TABLA y se presentar una Nueva Tabla en blanco donde podr cargar
los datos relevados a los efectos de conformar la base de datos deseada.
A continuacin se muestra la tabla de Infostat con la informacin de las respuestas de
los siete primeros alumnos de la encuesta.

Cada fila
representa
un caso u
observacin
con todas las
variables

16 Cada columna representa una variable


o caracterstica de estudio

Para abrir una base de datos elaborada con otro aplicativo seleccione men
ARCHIVO -> ABRIR y en el recuadro que se despliega busque el archivo y marque la
opcin ABRIR.
El programa permite tener abiertas varias bases de datos (tablas) simultneamente, las
que pueden desactivarse con la opcin ARCHIVO -> CERRAR.
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

Las bases pueden guardarse en formato InfoStat (con extensin .idb - InfoStat Data
Base) correspondiente al Infostat con Men ARCHIVO -> GUARDAR TABLA. Otra
posibilidad es guardar la tabla con otro formato (EXCEL, texto, DBASE, Paradox) usando
la opcin GUARDAR TABLA COMO.
Una vez que disponemos de una base de datos es posible realizar modificaciones en la
misma.
El men DATOS tiene una serie de opciones para definir el tipo de datos y realizar algu-
nas acciones sobre las filas (datos) o columnas (variables) de la tabla.

Una vez construida la base debemos realizar un anlisis de consistencia


de los datos y depurarla, para lo cual podemos ayudarnos con la representacin
de las variables en tablas y grficos. Este resumen o representacin depende
del tipo de variable considerada, y permite realizar un primer anlisis de stas.
En las secciones siguientes trabajaremos con cada tipo de variable en particu-
lar, a fin de poder organizar y presentar los datos.
El resumen y la presentacin de datos a travs de tablas y grficos, permi-
te mostrar la informacin de un conjunto de datos a una forma ms simple, de
tal manera que facilita a quien los lee tener una idea general de su comporta-
miento, es decir de la forma en que estn distribuidos.
Otro aspecto que consideraremos es si el anlisis es para una variable, lo
que en estadstica se denomina anlisis unidimensional o si se analizan dos o
ms variables conjuntamente (anlisis bidimensional o multidimensional. En
esta asignatura, veremos los dos primeros tipos (unidimensional y bidimensio-
nal), apuntando en este captulo, a la forma en que habitualmente se presentan
los datos.

5.4.1 Distribuciones Unidimensionales

Comenzaremos con el anlisis de las variables categricas, para conti-


nuar luego con numricas discretas y continuas.
En la seccin anterior mostramos que en una base de datos cada fila co-
rresponde a una unidad de anlisis y cada columna a una variable. Si tomamos
una columna en particular, la misma constituye lo que en estadstica se llama
una serie simple, la que muestra cada una de las observaciones en el orden en
que fueron recopiladas. A partir de esos datos elaboraremos distribuciones de
frecuencias.

Variables Categricas
Para armar una tabla resumen de este tipo de variables, contamos la cantidad
Los ejemplos se ilustrarn con
de casos que pertenecen a cada clase o categora, lo que se denomina frecuen-
las variables de la base de in-
cia absoluta y calculamos la proporcin de casos en cada una de ellas, lo que se dustrias cordobesas (indus-
denomina frecuencia relativa, las que pueden expresarse en porcentajes. Con trias.xls) y se indicarn los
estas frecuencias, se puede construir una tabla de tres columnas, donde en la comandos del programa esta-
primera se anotarn las categoras y en las otras dos, la cantidad y el porcentaje dstico Infostat. Podr acceder
de observaciones. a este archivo en la seccin
Para la variable Sector de la Economa al que pertenecen 148 industrias, Enlaces de Inters del aula
cuyas categoras estn expresadas en escala nominal, las frecuencias se pre- virtual.
sentan en la Tabla 1.1.

Posicionados al inicio de la variabla Sector, para categorizarla: 17


DATOS -> CATEGORIZAR -> ASIGNAR CATEGORIAS SEGN CODIGO DE
VALORES Frecuencia absoluta: es el n-
Asignamos los cdigos segn las referencias, se genera una nueva variable mero de casos que se repite
Cat_sector con los nombres de las categoras. cada categora de la variable.
Para construir la tabla de frecuencias ESTADISTICAS -> TABLA DE FRECUENCIA. Frecuencia relativa: es la pro-
En la solapa VARIABLES seleccionar la variable Cat_sector (para seleccionar una varia- porcin de casos que se repite
ble marcar la variable y con la flecha pasarla al cuadro de la derecha). cada categora de la variable.
En la ventana TABLA DE FRECUENCIAS marcar FA y FR para obtener una tabla con las
frecuencias absolutas y relativas, que se presenta en una nueva ventana de Resultados

Tablas de frecuencias
Variable Clase FA FR
Cat_sector 1 49 0,33
Cat_sector 2 36 0,24
Cat_sector 3 50 0,34
Cat_sector 4 13 0,09

Los resultados obtenidos son presentados en la tabla1.1

Tabla 1.1 Sector de la economa

SECTOR DE LA ECONOMA FRECUENCIA ABSOLUTA PORCENTAJE


De Origen Agropecuario 49 33,1
49/148 x100
Productos no metlicos 36 24,3
Productos metlicos 50 33,8
Otras Industrias 13 8,8
Total 148 100,0

Observando las frecuencias absolutas y porcentajes, podemos concluir


que de 148 empresas encuestadas, 49 pertenecen al sector industrial de origen
agropecuario, lo que representa el 33,1% del total; 36 al sector de productos no
metlicos (24,3%), 50 industrias que fabrican productos metlicos (33,8%) y el
resto a Otras actividades industriales (8,8%).
Esta informacin puede representarse grficamente. Los grficos no
agregan informacin pero se emplean para tener una representacin visual de
la totalidad de la misma, presentando los datos de tal modo que se pueda per-
cibir fcilmente los hechos esenciales y compararlos con otros. En el caso de
variables categricas, utilizamos el Diagrama Circular y el Grfico de Barras.
En el Diagrama Circular (Grfico 1.1) se representa en el crculo el 100%
de las empresas encuestadas y las porciones o divisiones se hacen en funcin a
los tipos de empresas segn las frecuencias ya indicadas. Puede utilizarse tam-
bin el grfico de barras (Grfico 1.2), donde cada una de ellas representa una
categora (en el ejemplo, un sector de la economa) y la altura de cada barra, la
frecuencia correspondiente.

Para graficar la variable Cat_sector


GRAFICOS GRAFICOS DE SECTORES

Para realizar un grfico de sectores, por ejemplo, indicar la variable que va a


graficar y especificar que las categoras estn en filas. Luego, junto con el grfico emer-
ge la ventana HERRAMIENTAS GRAFICAS que permite modificar el color, ttulo, etc.

Grfico 1.1.
Sector de la economa

18
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

Es vlido tambin representar la distribucin de frecuencias de la variable Sexo con un


grfico de barras
Grficos -> Grfico de barras.
A continuacin se elige en variable a graficar: "Caso" y en variable de clasificacin:
Cat_Sector. Luego de aceptar se elige Frecuencias absolutas o Frecuencias relativas
segn lo que se desee graficar.

Grfico 1.2.
Sector de la economa

Sector de la Economa

51,9
Caso: frecuencia absoluta

41,7

31,5

21,3

11,2
Agropecuario No metlicos Metlicos Otras
Cat_sector

Del anlisis de la tabla y los grficos podemos decir que en esta muestra, las
empresas del sector industrial de productos metlicos y del sector de origen
agropecuario poseen participacin similar en el total, siendo los dos grupos ms
representativos, le siguen en importancia las industrias de productos no metli-
cos. Otra variable categrica relevada en escala ordinal fue la opinin de las
empresas acerca de la suficiencia de la oferta de mano de obra calificada. Las
respuestas se agruparon en cuatro categoras, segn se presenta en la Tabla 1.2.

Tabla 1.2. Suficiencia de la Oferta de Mano de Obra Calificada

FRECUENCIA
SUFICIENCIA DE LA OFERTA DE FRECUENCIA PORCENTAJE
PORCENTAJE ABSOLUTA
MANO DE OBRA CALIFICADA ABSOLUTA ACUM.
ACUM.
Suficiente 50 33,8 50 33,8
Medianamente suficiente 42 28,4 92 62,2
Escasamente suficiente 39 26,4 131 88,5
Insuficiente 17 11,5 148 100,0
Total 148 100,0
131/148 x100

La escala es ordinal, ya que las categoras indican un cierto orden en rela-


cin al nivel de suficiencia manifestado por las empresas. Cuando la variable es
categrica ordinal se pueden obtener las frecuencias absolutas o relativas
acumuladas, si lo que queremos saber es la cantidad o proporcin de elementos
hasta cierta categora en particular. En el grfico 1.3 se representa a la variable
categrica analizada. 19
Grfico 1.3.
Oferta de Mano de Obra Calificada

El Grfico 1.3, fue realizado


con la planilla de clculo MS
Excel. La tabla que se obtiene
como resultado en Infostat
se puede copiar a una plani-
lla Excel y desde el men
INSERTAR -> GRFICOS,
seleccionar el grfico que se
quiera utilizar.

Actividad 3
El gerente de una empresa desea conocer la distribucin de empleados de
acuerdo a su nivel de instruccin mximo alcanzado. Una vez recolectada la
informacin realiz un resumen de los datos, obteniendo la siguiente tabla de
distribucin de frecuencias:

NIVEL DE INSTRUCCIN FRECUENCIA ABSOLUTA FRECUENCIA RELATIVA


Primario 48
Secundario 36
Terciario 15
Universitario 5
No sabe / no contesta 2
Total 106

a) Identifique la variable de estudio y a qu tipo pertenece.


b) Complete el cuadro calculando las frecuencias relativas para cada categora.
c) Represente las frecuencias por medio de un grfico.

Variables numricas

En primer lugar analizaremos las variables numricas discretas, que son


aquellas que provienen de un proceso de conteo y que estarn representadas
con nmeros enteros. Los valores que asume la variable en las n mediciones, a
los que hemos llamado serie simple, pueden denotarse x1, x2,..., xn, en general xi
para i=1,2,...,n donde el subndice i indica el orden en que se efectuaron las me-
diciones.
Para reflexionar
Para resumir la informacin, construiremos la tabla de distribucin de
En qu situacin la cantidad de frecuencias de manera anloga a como lo hicimos para las variables categri-
valores distintos de la variable es cas. En la primera columna de la tabla se enumerarn los k valores distintos de
igual al nmero de observaciones? la variable, que se denotan con xi para i= 1,2,...,k, donde x1 es el mnimo y xk es el
mximo valor que asume. Observe que el nmero de distintos valores (k) que
asume la variable es siempre menor o a lo sumo igual al nmero de observacio-
20
nes (n).
Para una mejor comprensin de la tabla de frecuencias consideremos el
siguiente ejemplo referido al bloque de indicadores de innovacin tecnolgica.
En el mismo se relev la cantidad de empleados que realizan actividad de dise-
o e ingeniera industrial en cada una de las firmas de la muestra que tienen
desarrollada esta rea de innovacin tecnolgica y se obtuvo una variable que
asume valores entre 1 y 6. En las columnas 2 y 3 de la Tabla 2.3 se presentan las
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

frecuencias absolutas y relativas simples denotadas como ni y hi, respectiva-


mente y en las dos restantes las acumuladas: absoluta (Ni) y relativa (Hi). Como
se seal antes, las frecuencias relativas simples y acumuladas, pueden expre-
sarse porcentualmente.

Para la variable personal_diseo definirla como un valor entero desde


DATOS -> TIPO DE DATOS -> Entero
Luego pedir una tabla de frecuencia
ESTADISTICAS -> TABLA DE FRECUENCIA
En la solapa VARIABLES elegir personal_diseo, en la ventana TABLA DE FRECUEN-
CIAS y marcar, FA, FR, FAA y FRA.

Tabla 1.3. Cantidad de empleados rea Diseo e Ingeniera Industrial

EMPLEADOS FRECUENCIA FRECUENCIA


QUE REALIZAN FRECUENCIA FRECUENCIA ABSOLUTA RELATIVA
LA ACTIVIDAD (NI) RELATIVA (HI) ACUM. ACUM.
Xi (Ni) (Hi)
1 13 0.46 17 0.46
2 7 0.25 20 0.71
3 3 0.11 23 0.82
4 2 0.07 25 0.89
5 2 0.07 27 0.96
6 1 0.04 28 1.00
Total 28 1.00

Observemos que la suma de las frecuencias absolutas es igual al tamao


de la muestra, en tanto que la suma de las frecuencias relativas es igual a uno.

En smbolos:

k
Frecuencias absolutas n
i =1
i =n kn N xmax = n

ni
Frecuencias relativas hi =
n
h
i
i =1 H xmax = 1

El total de empresas que cuentan con un departamento de diseo e inge-


niera industrial son 28 (n=28). De la lectura de la Tabla 1.3 surge que las em-
presas que cuentan con un solo empleado afectado al departamento de diseo
e ingeniera industrial (x1 =1) son 13 (n1=13), las que representan un 46%
(h1=0,46) del total, mientras que las que tienen 5 empleados o menos son 27
(N5=27) lo que representa una proporcin de 0,96 del total (H5=0.96). Podemos
hacer otra lectura diciendo que las empresas con ms de 4 empleados en el 21
departamento de diseo son 3, lo cual equivale en porcentaje al 11%.

Para representar grficamente las frecuencias calculadas en la tabla, uti-


lizamos grficos cartesianos; en el eje de las abscisas se marcan los distintos
valores que puede asumir la variable y en el eje de las ordenadas se va a repre-
sentar la cantidad o porcentaje de observaciones. Las frecuencias simples (ab-
solutas o relativas) se representan en un grfico de bastones (Grfico 1.4.),
donde para los distintos valores que puede asumir la variable se levanta una
ordenada que representa la cantidad o porcentaje de observaciones.

Infostat al igual que muchos software estadsticos no poseen un co-


mando para la construccin de los grficos de bastones y escalona-
dos directamente . Veamos una manera de simular estos grficos con
Infostat. Para graficar las frecuencias absolutas o relativas simple seleccionar
GRFICOS GRFICOS DE BARRAS

En Variables a graficar
van los casos

En criterio de clasificacin
va la variable que se quiere
graficar

En la ventana siguiente seleccionar

Seleccionar las frecuencias


a graficar

Luego se puede mejorar la edicin del grafico cambiando la solapa series


el tamao y en el eje Y los lmites de la escala.

22
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

Grfico 1.4.
Cantidad de empleados rea Diseo e Ingeniera Industrial
(frecuencias absolutas)

14 Grfico de bastones
13
13
12
11
Caso: frecuencia absoluta

10
9
8
7
7
6
5
4
3
3
2
2
1 1
1
0
2 1 3 6 4 5
personal_diseo

Observamos en la tabla y en el grfico de bastones, que la mayor canti-


dad de empresas poseen un empleado en el rea de diseo e ingeniera indus-
trial. La mxima cantidad de empleados que se posee en esa rea es de seis.
Para las frecuencias acumuladas (absolutas y relativas) se utiliza un grfico
escalonado (Grfico 1.5.), donde para cada valor xi se marca la frecuencia acu-
mulada, valor que se mantiene constante hasta el siguiente donde se produce el
prximo escaln.

En Infostat se puede hacer este grfico DESDE GRFICOS


HISTOGRAMA, seleccionar la variable y desde la solapa series de la
ventana de Herramientas grficas:

- cambiar la cantidad de clases a los distintos valores de la variable


- cambiar a frecuencias acumuladas (puede ser absolutas o relativas)
- destildar cuerpo

Grfico 1.5.
Cantidad de empleados rea Diseo e Ingeniera Industrial
(frecuencias absolutas acumuladas)
Diagrama escalonado

30

25
frec. abs. acumulada

20

15

23
10

0
1 1 2 3 4 5 6 6
personal_diseo
Dada la naturaleza discreta de la variable, entre los valores 3 y 4, por
ejemplo, no asume ningn otro valor; por lo tanto dentro de ese intervalo la
frecuencia ser constante (igual a 23) y recin en 4 aumenta a 25 que se man-
tendr hasta el valor 5, y as sucesivamente.

Actividad 4:
La siguiente tabla muestra la cantidad de kioscos que tienen una
Cierta cantidad de cospeles

STOCK DE COSPELES CANTIDAD DE KIOSCOS


300 3
400 5
500 7
600 6
700 5
800 4

a) Represente grficamente la distribucin de frecuencias relativas


(simple y acumuladas).
b) Obtenga todas las conclusiones posibles y responda:
b1) Cuntos kioscos tienen 500 cospeles?
b2) Cuntos kioscos tienen como mximo 500 cospeles?
b3) Qu porcentaje de kioscos tienen 800 cospeles?
b4) Qu porcentaje de kioscos tienen ms de 500 cospeles?

Actividad 5:
El gerente de ventas de La Favorita, desea lanzar una campaa de promocio-
nes para lograr que los compradores acudan con mayor frecuencia a su negocio.
Para obtener informacin pregunt a 25 consumidores mientras esperaban en
la caja para abonar: Cuntas veces concurri a este negocio en el ltimo mes?
Para un da particular obtuvo las siguientes respuestas:

4 5 3 3 1
4 6 5 4 2
6 6 7 1 5
1 2 4 3 2
2 4 7 7 6

Sobre la base de esta informacin:


a) Organice los datos en una tabla de frecuencias.
b) Grafique convenientemente esta informacin.
c) Calcule y grafique las frecuencias absolutas acumuladas. Cmo se denomi-
na este grfico?

En el caso de variables numricas continuas donde es necesario agrupar


24 los datos en intervalos. Cabe aclarar que cuando la variable es discreta pero
asume muchos valores distintos puede tambin presentarse por una distribu-
cin por intervalos. Como ejemplo de este tipo de variables analizaremos el
porcentaje que representan los costos laborales en los costos totales de la
empresa, incluida en la seccin Personal Ocupado del cuestionario.
Previo a la confeccin de la tabla por intervalos, podemos realizar una
primera exploracin de este tipo de datos, utilizando el diagrama de tallo y ho-
jas, que constituye una variante de la distribucin de frecuencias. Este diagra-
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

ma divide a las observaciones en dgitos primarios y dgitos derivados. Por


ejemplo, si las observaciones de los datos tuvieran a lo sumo dos dgitos, la co-
lumna de las decenas sera el dgito primario y la columna restante sera el dgi-
to derivado. Si las observaciones fueran de tres dgitos, el dgito primario estara
formado por las centenas y las decenas, y el dgito derivado por las unidades.
Cuando los datos estn formados por ms de tres dgitos lo conveniente es
cambiar la escala de medida. Los dgitos primarios de los datos se denominan
tallo; y los dgitos derivados (unidades) se denominan hojas. La unidad de
hoja se refiere a la escala que se utiliza para presentar los datos en el diagrama.

Para una mejor comprensin de este diagrama veremos cmo se repre-


senta en ste la variable a analizar.

Los valores de la variable Porcentaje de Costo Laboral son los siguientes:

50 45 30 7 10 50 30 30 50 39
40 50 8 25 49 25 50 38 50 10
30 25 5 7 40 26 20 30 25 40
40 40 25 40 66 25 38 21 40 33
33 30 78 15 5 10 38 40 10 66
8 30 18 20 50 35 7 20 36 30
30 20 30 20 40 15 25 35 26
25 60 40 10 25 38 32 30 40
28 40 40 22 52 40 40 8 6
25 50 50 30 35 19 25 47 15
25 60 35 10 18 25 23 29 20
20 50 50 3 10 20 15,3 20 55
45 20 17 30 30 35 17 45 40
13 15 20 30 35 40 20 50 20
40 35 50 10 25 25 50 35 35

Representaremos la variable costos laborales en este tipo de diagrama


(Grfico 1.6.). El grfico ha sido construido con el software estadstico SPSS ya
que INFOSTAT no lo hace.

Grfico 1.6.
Diagrama de Tallo y hoja de Porcentaje de Costo Laboral

25

A travs de ste grfico podemos observar el comportamiento de la va-


riable, donde representamos en el tallo el primer dgito del valor observado y en
las hojas o ramificaciones el segundo dgito, lo cual nos da una idea de la con-
centracin de los valores ms frecuentes, los valores menores y los ms gran-
des.
En este conjunto de datos los valores ms frecuentes (35 en total) estn com-
prendidos entre el 20% y el 29% de los costos laborales, siendo los valores
mnimo y mximo el 3% y el 78%, respectivamente.

Actividad 6:
El siguiente ejemplo muestra la distribucin de edades de 100 personas. El dia-
grama de tallo y hojas fue realizado empleando el programa SPSS (10.0).

EDAD- Diagrama de tallo y hojas (Stem-and-Leaf Plot).

Frecuencia Tallo y hojas


7.00 1 - 8889999
16.00 2 - 0001111222334444
12.00 2 - 56666678999
10.00 3 - 0122223344
12.00 3 - 555677888899
15.00 4 - 001112223333344
10.00 4 - 5667778899
6.00 5 - 011224
8.00 5 - 55578889
1.00 6 - 4
3.00 6 - 789

Analice la distribucin de edades

Tabla de frecuencias por intervalos

Para construir una tabla de distribucin de frecuencias por intervalos, de-


bemos seguir los siguientes pasos:
1) decidir la cantidad de intervalos de clase apropiados;
2) obtener la amplitud de los mismos;
3) establecer una regla general para definir los lmites del intervalo de cada
clase.

1) Decidir la cantidad de intervalos de clase apropiados (k): si bien depende


de la cantidad de observaciones con las que se cuenta, se recomienda
establecer no menos de 5 intervalos y no ms de 20. Si fueran muy
pocas clases, los intervalos podran ser muy grandes, es decir cada in-
tervalo abarcara demasiada cantidad de observaciones para permitir
detectar la tendencia de los datos. Por otra parte, tener demasiados
intervalos se contradice con el propsito que se persigue que es re-
sumir un conjunto grande de datos, para facilitar el anlisis o la toma
de decisiones. Continuando con el tratamiento de la variable porcen-
taje de costo laboral y dado que posee 141 observaciones, 7 interva-
los sern ms que suficientes (con la la frmula automtica de Infos-
tat resulta 7,21, por esta razn tomamos 7 intervalos).

2) Obtener la amplitud de los intervalos de clase (c): una opcin que se usa
frecuentemente es que todos los intervalos sean de igual amplitud, lo
cual facilita la interpretacin. Ese valor c se obtiene calculando la dife-
26 rencia entre el valor ms grande del conjunto de datos (valor mxi-
mo) y el ms pequeo (valor mnimo) dividiendo luego esta diferen-
cia entre el nmero de clases elegido. El desvo del numerador es lo
que se conoce como Recorrido o Rango (R).

R Valor mximo Valor mnimo


c= =
k k
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

Donde:
c: amplitud de cada intervalo.
R: recorrido o rango de variacin de la variable.
k: cantidad de intervalos elegidos.

Para el ejemplo:

78 3
c= = 10, 714 11
7
c= 11 donde: c es la amplitud definida

Por conveniencia y facilidad de lectura se deber siempre redondear el


valor c por exceso, ya que al multiplicar la amplitud definida (c= 11) por la can-
tidad de intervalos, da como resultado un nuevo recorrido (R) ligeramente
superior al original, de tal manera que aquel incluya los dos extremos de este
ltimo. Se repartir para finalizarla diferencia entre el Nuevo Recorrido y el ori-
ginal (R- R) por defecto y exceso.

1 por defecto
R- R = 77 - 75 = 2
1 por exceso

Entonces el valor mnimo definido ser:

R- R = 3 -1 =2

Para construir los intervalos de clase al valor mnimo definido se le suma-


r la amplitud definida (c) hasta conformar los 7 intervalos, de la siguiente
forma:
Para reflexionar
y 'i-1 - y 'i Si el recorrido terico y origi-
2 ; 13 nal coinciden la diferencia
13 ; 24 entre ellos es cero. Para que
24 ; 35 todos los valores de la varia-
35 ; 46 ble queden representados en
46 ; 57 un intervalo el primero o el
57 ; 68 ltimo, debe ser cerrado.
68 ; 79

3) Establecer una regla general para definir los lmites del intervalo de cada
clase: para evitar el doble conteo de las observaciones. Los intervalos
sern semiabiertos, pueden ser abiertos por derecha o por izquierda.
Por ejemplo, en la primera alternativa los intervalos son: [ ) cerra-
dos por la izquierda y abiertos por la derecha, lo que significa que se
incluir dentro del intervalo un valor que sea igual al lmite inferior;
mientras que un valor exactamente igual al lmite superior del inter-
valo, ser incluido en el intervalo siguiente. As el valor 35, para este
caso, se computar dentro del cuarto intervalo.

La principal desventaja de este tipo de tabla resumen es que no se puede 27


saber cmo se distribuyen los valores individuales dentro de cada intervalo de
clase ya que cada uno puede representarse por un punto medio o marca de
clase que se obtiene como el promedio simple entre los lmites de cada interva-
lo de clase.
y i' 1 + y i'
yi =
2
Para el ejemplo, la primera marca de clase se obtiene como:

y0' + y1' 2 + 13
y1= = = 7,5
2 2

Si se desea obtener una distribucin de frecuencias absolutas, una vez


construidos los intervalos se deber contar la cantidad de valores que se inclu-
yen dentro de cada uno y as quedar conformada. Para obtener el resto de las
distribuciones se debe proceder de manera similar a cuando se trabaj con da-
tos discretos. Seguidamente en la Tabla 1.4 se presentan las distribuciones de
frecuencias vistas hasta aqu.

Tabla 1.4. Porcentaje de costo laboral

PORCENTAJE DE FREC.
FREC. PORCENTAJE
COSTO LABORAL PORCENTAJE ABSOLUTA
ABSOLUTA ACUM.
y 'i-1 - y 'i HI ACUM.
NI HI
NI
2 13 18 12,8 18 12,8
13 24 27 19,1 45 31,9
24 35 37 26,2 82 58,2
35 46 36 25,5 118 83,7
46 57 18 12,8 136 96,5
57 68 4 2,8 140 99,3
68 79 1 0,7 141 100,0
141 100,0

Para lograr una tabla de distribucin por intervalos en Infostat debe tildarse
la siguiente informacin: lmites inferiores (LI) y superiores (LS) de los in-
tervalos de clase, marca de clase (MC), frecuencias absolutas (FA), fre-
cuencias relativas (FR), frecuencias absolutas acumuladas (FAA) y frecuen-
cias relativas acumuladas (FRA). El nmero de clases, puede ser obtenido en forma
automtica o definido por el usuario (PERSONALIZADO). Para la forma automtica
InfoStat obtiene el nmero de clases tomando el log2(n+1) que da igual a 7 tal como lo
hemos construido.
Para ilustrar la posibilidad que da Infostat de calcular los intervalos en forma personali-
zada, construiremos una tabla de frecuencia para la variable de cinco intervalos. Para
ello, tildando la opcin Personalizado, debe indicarse 5 intervalos, definiendo el mnimo
y mximo valor de la variable. Por defecto, Infostat construye los intervalos cerrados a
la derecha, lo que se puede cambiar destildando la opcin en el cuadro de dialogo.

ESTADISTICAS -> TABLA DE FRECUENCIA


En la solapa VARIABLES elegir costos lab/costo total, en la ventana TABLA DE FRE-
CUENCIAS marcar, LI, LS, MC, FA, FR, FAA y FRA. Adems indicar NUMERO DE CLA-
SES PERSONALIZADO; en nuestro caso considerar 5 clases

28
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

Y se obtiene una tabla como la siguiente:


Tablas de frecuencias
Variable Clase LI LS MC FA FR
costos lab/costo totAL 1 [ 3,00 18,00 ] 10,50 28 0,20
costos lab/costo totAL 2 ( 18,00 33,00 ] 25,50 54 0,38
costos lab/costo totAL 3 ( 33,00 48,00 ] 40,50 37 0,26
costos lab/costo totAL 4 ( 48,00 63,00 ] 55,50 19 0,13
costos lab/costo totAL 5 ( 63,00 78,00 ] 70,50 3 0,02

Los grficos de las frecuencias absolutas o relativas simples para distri-


buciones por intervalos son grficos de superficie llamados histogramas. El his-
tograma (Grfico 1.7.a), es uno de los medios grficos de ms fcil interpreta-
cin, est formado por rectngulos o barras que se levantan desde el eje de las
abscisas donde se han marcado previamente, en una escala numrica, los lmi-
tes de cada intervalo de clase. La altura de cada una de las barras, que se regis-
tra en el eje de las ordenadas, se determina de manera tal que su rea sea pro-
porcional a la frecuencia de cada clase, pudiendo representarse tanto las fre-
cuencias absolutas como las relativas o porcentajes cuando los intervalos son
de la misma amplitud.

Cuando los intervalos son de distinta amplitud, la altura de cada barra se


obtendr como la proporcin entre las frecuencias absolutas y la amplitud del
intervalo ni / ci , fraccin que se denomina densidad de frecuencia y ser el Densidad de frecuencia es el
cociente entre las frecuencias
resultado de esta fraccin lo que se marcar sobre el eje de las ordenadas para
absolutas y la amplitud del
cada intervalo.
ni / ci
Es importante sealar dos cuestiones a tener en cuenta: intervalo
a) Nunca deben quedar el primer intervalo y el ltimo con frecuencia nula.
b) Generalmente es ms til presentar los datos en funcin de las frecuen-
cias relativas, ya que los trminos absolutos pueden variar entre distin-
tas mediciones dependiendo esta variacin fundamentalmente de la
cantidad de observaciones, es decir, la proporcin entre los intervalos
tiene mayor permanencia.

Si suavizamos los extremos de cada intervalo, el histograma se transfor-


ma en un polgono de frecuencias (Grfico 1.7.b), que representa la forma tra- 29
dicional de graficar un conjunto de datos de escalas medibles.
El histograma y el polgono de frecuencias tienen la misma superficie, ya
que cada porcin de la superficie (tringulo) del histograma que se pierde en un
extremo del intervalo de clase, se gana en el otro extremo del mismo, lo que se
puede visualizar en el Grfico 1.7 c en el que se ha superpuesto un polgono al
histograma. En ambos grficos el rea total para la distribucin de frecuencia
relativa es 1 y para la frecuencia en porcentaje es 100%.
Para construir un polgono de Igual que la tabla de distribucin de frecuencias, estos grficos nos permi-
frecuencias se marcan los puntos ten observar que entre 24 y 35 % se encuentra la mayor cantidad de empresas.
medios o marcas de clase de cada
intervalo sobre el eje de las absci-
La representacin grfica de las frecuencias acumuladas cuando la varia
sas, agregando en los extremos ble en cuestin es numrica continua, es la Ojiva (Grfico 1.8), que es un grfico
(por defecto y por exceso) dos lineal y se utiliza cuando se desea aproximar cuntas o qu porcentaje de las
nuevos intervalos con frecuencia observaciones estn por encima o por debajo de ciertos valores clave.
cero. La frecuencia de cada clase Una distribucin de frecuencias acumuladas en base menor (mayor) indi-
se representa en el eje de las
ordenadas. ca cuntas observaciones de la distribucin tienen un valor menor (mayor o
Uniendo luego los puntos de igual) que el lmite superior (inferior) de cada clase.
coordenadas que surgen de la Mediante la ojiva en base menor se puede aproximar por ejemplo que el
interseccin de la frecuencia de 50% de las empresas poseen porcentajes de costos laborales menores al 32%,
clase y el punto medio obtendre-
mos el polgono de frecuencias.
o bien interpolando en sentido inverso: el porcentaje de empresas que tienen un
Los dos nuevos intervalos agre- porcentaje de costo laboral menor al 40% es aproximadamente el 70%. Este
gados en los extremos son para tipo de grfico resulta interesante al querer comparar dos ms distribuciones.
cerrar el grfico en el eje horizon-
tal. GRFICOS -> HISTOGRAMA
Al construir un histograma, la ventana HERRAMIENTAS GRFICAS mues-
Para construir una ojiva, la varia-
tra un cuadro de dilogo que permite modificar los atributos del histograma
ble se marca sobre el eje de las
abscisas y las frecuencias acumu- obtenido. En la solapa SERIES de esta ventana hay un men de opciones de
ladas sobre el eje de las ordena- histograma que permite cambiar el nmero de clases (Clases) que por defecto son
das. Los puntos de coordenadas calculadas como Log2(n+1). Adems la ventana permite elegir la frecuencia represen-
estarn dados por el lmite infe- tada en el histograma (Frec.). Las frecuencias a graficar pueden ser: frecuencia relativa
rior de cada intervalo de clase y la (Frec. rel) que es la opcin por defecto, frecuencia absoluta (Frec. abs.), frecuencia
frecuencia acumulada hasta el absoluta acumulada (Frec.abs. acum.) y frecuencia relativa acumulada (Frec.
intervalo anterior. Para el ltimo rel.acum.). El campo Bordes permite eliminar los contornos de las barras que forman el
intervalo se marcar tambin el histograma. Se puede construir el polgono de frecuencia activando el campo Polgono.
lmite superior del mismo y la
El campo Cuerpo permite eliminar el histograma de fondo a partir del cual se dibuj el
frecuencia acumulada total. Lue-
go, para obtener la curva de ojiva polgono. Los campos LIPC y LSUC permiten ingresar los lmites inferior y superior para
se conectan estos puntos por la primera y ltima clase respectivamente. Para lograr que los ticks se correspondan
lneas rectas. con las marcas de clase de cada intervalo activar M. clases en la solapa Series.
En el siguiente grfico se eligieron frecuencias absolutas, 7 clases y polgono de fre-
cuencias.

Grfico 1.7.
Porcentaje de Costo Laboral

Polgono de
frecuencias

(a)
POLIGONO DE FRECUENCIAS

0,34 Polgono de frecuencias

0,26
30
frecuencia relativa

0,17

0,09

0,00
-8 3 14 24 35 46 57 67 78 89
costos lab/costo totAL

(b)
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

Para graficar las frecuencias acumuladas se debe elegir GRAFICOS ->


HISTOGRAMA. En la solapa SERIES de la ventana HERRAMIENTAS GR-
FICAS, destildar Bordes y Cuerpo, tildar Marca de clases y Pol-
gono y seleccionar Frecuencias acumuladas (relativas o absolutas). El
grfico que resulta es la OJIVA.

Grfico 1.8.
Ojiva de base menor para el de frecuencias acumuladas en porcentaje de Costo
Laboral

OJIVA

1,00

0,75
frec. rel. acumulada

0,50

0,25

0,00
-8 3 14 24 35 46 57 67 78 89
costos lab/costo totAL

Interpretacin de la forma de los grficos de frecuencias

Los grficos de frecuencias pueden presentar distintas formas. Si se ana-


liza cmo se distribuyen las observaciones entre todos los valores que asume la
variable, advertimos que pueden hacerlo de forma simtrica o asimtrica. En
una distribucin simtrica (Grfico 1.9) los datos estn concentrados en los
valores centrales, disminuyendo de manera similar hacia ambos lados de la
frecuencia mxima, lo que se ve representada en una Ojiva con forma de S.
En una distribucin asimtrica los datos pueden estar ms concentrados
en los valores menores de la variables (asimetra derecha o positiva) o en los
valores mayores (asimetra izquierda o negativa) (Grafico 1.9 b y c respectiva-
mente). En la asimetra derecha la ojiva presenta una fuerte acumulacin de las
observaciones al inicio, y en la izquierda esta acumulacin ser presenta al final
de la distribucin.

Grfico 1.9.
Anlisis de la forma de la distribucin de los datos

Distribucin simtrica

31

Distribucin de frecuencias simples Distribucin de frecuencias acumuladas


Distribucin asimtrica derecha o positiva

Distribucin de frecuencias simples Distribucin de frecuencias acumuladas

Distribucin asimtrica izquierda o negativa

Distribucin de frecuencias simples Distribucin de frecuencias acumuladas

Actividad 7:
Las ventas diarias (en $) para los ltimos 120 das de una compaa de servicios
de transporte se organizaron en la siguiente distribucin de frecuencias:

FRECUENCIA FRECUENCIA
FRECUENCIA FRECUENCIA
ABSOLUTA RELATIVA
INTERVALO ABSOLUTA RELATIVA
ACUMULADA ACUMULADA
yi 1 yi ni I hi Ni Hi

530 - 730 3
730 - 930 7
930 1130 11
1130 1330 22
1330 1530 40
1530 1730 24
1730 1930 9
1930 2130 4
32
Total 120
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

Determine:

a) Cuntos das se vendieron entre $1130 y $ 1330?


b) Qu porcentaje de das se registraron ventas de entre $ 1130 y $ 1330?
c) Represente mediante un histograma y un polgono de frecuencias, la in-
formacin dispuesta en la tabla.
d) Aproximadamente cul es el porcentaje de das que tienen como in-
greso $ 1730 o ms?
e) Podra describir la forma de la distribucin?

Actividad 8:
Los precios de venta (en miles de $) de 40 casas de una zona residencial de la
ciudad de Crdoba son los siguientes:

90 99 78 84 45 124 113 52 49 109


101 107 111 90 105 80 123 125 100 42
56 47 69 50 81 96 73 93 62 57
113 82 115 86 85 104 73 130 84 129

a) Organice los datos en una distribucin de frecuencias tomando cinco In-


tervalos de clase de una amplitud de $ 18, comenzando con el valor 41.
b) Confeccione los grficos que correspondan.
c) Cuntas casas cuestan entre $ 77.000 y $ 95.000?
d) Qu porcentaje de casas con un valor entre $ 77.000 y $ 95.000 se
venden?
e) Aproximadamente cul es el porcentaje de las viviendas que se venden
en $ 77.000 o ms?

5.4.2 Distribuciones Bidimensionales

Para estudiar el comportamiento de dos variables en forma conjunta, co-


mo una primera inspeccin de los datos, podemos resumir la informacin en
tablas o grficos segn el tipo de variable que estemos considerando.

Dos variables categricas

Cuando se analizan dos variables categricas, se construye una tabla de


frecuencias conjunta denominada tabla de contingencia. En una tabla de con-
tingencia una variable se representa en las filas y otra en las columnas, por lo
tanto la tabla tendr tantas filas y columnas como las categoras de las varia-
bles.
En cada celda de la tabla se representa la frecuencia (absoluta o relativa)
asociada al par de categoras que se intersecan entre la fila y la columna.

Consideremos que queremos analizar conjuntamente si la empresa es


exportadora y el Sector de la Economa al que pertenece. Construiremos una 33
tabla de contingencia (Tabla 1.5.) con las variables Sector de la economa con
tres categoras representadas en las filas, y la variable Exporta, con dos posibi-
lidades Si o No en las columnas.
Tabla 1.5. Tabla de contingencia Sector de la economa y Exporta

EXPORTA
SECTOR DE LA ECONOMA
Si No TOTAL
De Origen Agropecuario 10 39 49
Productos no metlicos 6 30 36
Productos metlicos 13 37 50
Otras Industrias 6 7 13
Totales 35 113 148

Frecuencias conjuntas Frecuencias marginales

Las empresas de Productos no metlicos y que exportan, es decir que


presentan estas dos caractersticas conjuntamente son 6, este valor se denomi-
na frecuencia conjunta. Observemos que el total de cada fila es la cantidad de
empresas que pertenecen a cada categora del sector de la economa y el total
de cada columna, es el total de empresas que exportan o no. Los totales por
filas y por columnas son las frecuencias marginales y corresponden a las fre-
cuencias de cada variable individualmente.
Generalizando, para las variables categricas X con I categoras e Y, con J
categoras, simbolizaremos con nij a la frecuencia correspondiente a categora i
de X conjuntamente con j de Y, los totales por fila se denotan ni. y los totales
por columna n.j.
Podemos representar en forma general una tabla de contingencia con I fi-
las y J columnas donde I y J son las categoras de las distintas variables (Tabla
1.6.).

Tabla 1.6. Tabla de contingencia

Y
Y1 Y2 YJ TOTAL
X
X1 n11 n12 n1J n1
X2 n21 n22 n2J n2
. . . . .
. . . . .
. . . . .
XI nI1 nI1 nIJ nJ
TOTAL n.1 n.2 n.J n

En la Tabla de Contingencia se cumplen las siguientes relaciones:

La suma de todas las I J


Para nuestro ejemplo:
frecuencias conjuntas
n
3 2
=n
debe ser igual al total de i =1 j =1
ij
n ij = 148
observaciones. i =1 j =1
Para nuestro ejemplo i =3
La suma de cada fila es J

n
J
igual a la frecuencia mar-
ginal de la categora re- nij = ni .
j =1 j =1
3j = n3.
presentada en la fila.
n3. = 50
La suma de cada columna Para nuestro ejemplo j =2
I
34 es igual a la frecuencia
n
I
marginal de la categora n ij = n. j
i =1
i2 = n.2
representada en la co- i =1
lumna. n.2 = 113
La suma de las frecuen- I J I J
cias marginales por fila y
por columnas son iguales ni . = n
i =1
n. j = n
j =1
ni . = n
i =1
n
j =1
.j =n
al total de datos.
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

Si dividimos todos los valores de la tabla por el total de observaciones, se obtie-


nen las frecuencias relativas conjuntas, que denotaremos como hij y se calcu-
lan como:

nij
hij =
n

Para nuestro ejemplo:


La suma de todas las I J
frecuencias relativas h ij =1
conjuntas es igual a uno. i =1 j =1

Para nuestro ejemplo i =3


La suma de cada fila es
igual a la frecuencia rela- J
tiva marginal de la varia- h ij = hi .
ble representada en la j =1
fila.

Para nuestro ejemplo j =2


La suma de cada columna
es igual a la frecuencia I
relativa marginal de la h ij = h. j
categora representada i =1
en la columna.

La suma de las frecuen-


cias marginales por fila y
por columnas son iguales
uno.

Para construir una tabla de contingencia en Infostat, acceder desde el men


ESTADISTICAS -> DATOS CATEGORIZADOS -> TABLAS DE CONTIN-
GENCIAS
Aparece una ventana en la que se deben desplazar las variables
Cat_exporta y Cat_sector a la ventana CRITERIOS DE CLASIFICACION de la solapa
VARIABLES. Luego al aceptar aparecer la ventana TABLA DE CONTINGENCIA; en la
solapa SELECCIN DE FILAS Y COLUMNAS se debe indicar cul de las variables se
corresponder con las filas de la tabla y cul con las columnas y destildar presentacin
en orden alfabtico. En la solapa OPCIONES se pueden elegir los tipos de frecuencias,
dejamos tildado slo Frecuencias absolutas y Frecuencias relativas al total, y destilda-
mos las pruebas (chi cuadrado y otras que se estudiarn en la asignatura Estadstica II).
En la ventana resultados se muestran las tablas siguientes.

Tablas de contingencia
Frecuencias absolutas
En columnas:Cat_exporta
Cat_sector NO SI Total
De Origen Agropecuario 39 10 49
Productos no metlicos 30 6 36
Productos metlicos 37 13 50
Otras Industrias 7 6 13
Total 113 35 148

Frecuencias relativas al total 35


En columnas:Cat_exporta
Cat_sector NO SI Total
De Origen Agropecuario 0,26 0,07 0,33
Productos no metlicos 0,20 0,04 0,24
Productos metlicos 0,25 0,09 0,34
Otras Industrias 0,05 0,04 0,09
Total 0,76 0,24 1,00
Las frecuencias relativas pueden ser ms tiles que las absolutas en algu-
nas interpretaciones. Por ejemplo el 9% de las empresas (frecuencia relativa al
total igual 0,09), fabrican productos metlicos y exportan. Considerando sola-
mente la variable exporta, leemos la frecuencia marginal por columna y pode-
mos observar que el 76 % de las empresas no exportan. Las industrias de origen
agropecuario que no exportan son las ms frecuentes, con el 26%.
Para graficar las frecuencias absolutas o relativas conjuntas se pueden
utilizar los grficos de barras mltiples o los de barras componentes.
En un grfico de barras mltiples, se representa para cada categora de
una variable (en este caso los tipos de industria) tantas barras como categoras
de la otra (si exporta o no) y la altura de cada barra es el porcentaje de frecuen-
cia conjunta entre las dos categoras analizadas. A continuacin se presenta un
grfico de barras mltiples construido con Excel.

Grfico 1.10.
Anlisis conjunto de Sector de la economa y Exporta.

Industrias clasificadas segn el Sector de la Economia y si


exportan

30
25 26
25
20 20
15 Exporta
10 No Exporta
9
5 7
4 4 5
0
De Origen Productos no Productos Otras
Agropecuario metlicos metlicos Industrias

En
cambio en un grfico de barras componentes, cada barra representa cada cate-
gora de una variable y se divide en tantas partes como categoras de la otra. A
continuacin veremos cmo construir con Infostat un grfico de barras compo-
nentes.

Para construir un grfico de barras apiladas en Infostat, desde la ventana


de resultados debe capturarse la tabla de contingencia como una tabla de
datos para lo cual debe seleccionarse la tabla que se quiera considerar y
hacer clic en el icono

36

Para graficar ingrese a GRFICOS -> GRFICO DE BARRAS APILADAS. Como Varia-
bles seleccione SI y NO y como Criterio de Clasificacin, seleccione Cat_sector. El grfi-
co obtenido se muestra a continuacin:
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

- Seleccionando apilar valores observados

Grfico 1.11.
Cantidad de empresas que exportan en cada sector

53 CANTIDAD DE EMPRESAS QUE EXPORTAN EN CADA SECTOR

39
Valores acumulados

26

13

0
De Origen AgropecuarioProductos no metlicos Productos metlicos Otras Industrias
Cat_sector

- Seleccionando apilar proporciones

Grfico 1.12.
Proporcin de empresas que exportan dentro de cada sector

Empresas que exportan dentro de cada sector

1,00

0,75

0,50

0,25

0,00
De Origen AgropecuarioProductos no metlicos Productos metlicos Otras Industrias
Cat_sector

A partir del anlisis grfico qu conclusin puede obtener respecto a la


exportacin en el sector industrial?

Frecuencias condicionadas

Cuando analizamos una tabla de contingencia muchas veces interesa co-


nocer la proporcin que representa una variable sobre una determinada catego-
ra de la otra. Esto es calcular proporciones sobre los totales fila o columna se-
gn la variable que estamos considerando.
37
Si queremos analizar qu proporcin representa la variable Y sobre cada
categora de la variable X se calculan las proporciones filas, como se muestra en
la Tabla 1.7., donde podemos observar que el total de cada fila es 1.
Tabla 1.7. Frecuencias Condicionales por Fila

X Y1 Y2 YJ TOTAL
X1 n11 / n1. n12 / n1. n1J / n1. 1
X2 n21 / n2. n22 / n2. n2J / n2. 1
. . . . .
. . . . .
. . . . .
XI nI1 / nI. nI1/ nI. nIJ / nI. 1

Las proporciones de cada fila se denominan frecuencias condicionadas,


en este caso, por filas. Las frecuencias condicionadas por filas indican la pro-
porcin de la categora j de la variable Y sobre el total de la categora i de la
variable X.

De la misma forma se calculan las frecuencias condicionadas por colum-


nas. Las frecuencias condicionadas por columnas indican la proporcin de la
categora i de la variable X sobre el total de cada categora j de la variable Y.

ESTADISTICAS -> DATOS CATEGORIZADOS -> TABLAS DE CONTIN-


GENCIAS
En la solapa OPCIONES se pueden elegir los tipos de frecuencias, dejamos
tildado slo Frecuencias relativas por filas y Frecuencias relativas por
columnas. En la ventana resultados se muestran las tablas siguientes.

Tablas de contingencia
Frecuencias relativas por filas
En columnas:Cat_exporta
Cat_sector NO SI Total Frecuencias relativas
De Origen Agropecuario 0,80 0,20 1,00 exporta condicionadas
Productos no metlicos 0,83 0,17 1,00 al sector
Productos metlicos 0,74 0,26 1,00
Otras Industrias 0,54 0,46 1,00
Total 0,76 0,24 1,00

Frecuencias relativas por columnas


En columnas:Cat_exporta
Cat_sector NO SI Total Frecuencias relativas
De Origen Agropecuario 0,35 0,29 0,33 sector condicionadas a si
Productos no metlicos 0,27 0,17 0,24 exporta.
Productos metlicos 0,33 0,37 0,34
Otras Industrias 0,06 0,17 0,09
Total 1,00 1,00 1,00

De las Frecuencias relativas por filas (condicionadas a la fila) se observa


que del total de empresas que pertenecen al sector agropecuario, el 0,20 expor-
ta y el 0,80 no.

Las frecuencias condicionadas por columna, indican que del total de em-
presas exportadoras el 0,37 corresponden a Productos metlicos, el 0,29 co-
rresponden al sector agropecuario, el 0,17 a Productos No Metlicos y la misma
proporcin a otras industrias. Mientras que las no exportadoras el 0,35 son
38 empresas de origen agropecuario y el 0,33 de productos metlicos.
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

Otros grficos de frecuencias condicionadas

En muchas situaciones es til calcular frecuencias de una variable dado


una valor particular de otra variable analizada, que denominamos frecuencias
condicionadas.
Las empresas analizadas fueron tambin consultadas respecto a su parti-
cipacin en emprendimientos conjuntos con otras empresas, en los ltimos
cinco aos.

Tabla 1.8. Participa o ha participado en emprendimientos conjuntos con otras


empresas?

PARTICIPA FRECUENCIA ABSOLUTA PORCENTAJE


SI 16 10,8
NO 132 89,2
TOTAL 148 100,0

A las 16 empresas que contestaron afirmativamente, se les pidi que in-


dique la localizacin de las empresas con las que se asociaron.

Tabla 1.9. Localizacin de otras empresas con las que han participado en em-
prendimientos

LOCALIZACIN DE
FRECUENCIA ABSOLUTA PORCENTAJE
OTRAS EMPRESAS
Locales (100 km) 10 62,5
De la provincia 3 18,75
Nacionales 3 18,75
TOTAL 16 100,00

Para representar estas variables puede utilizarse un grfico circular com-


binado (Grfico 1.13). Este grfico est construido con Excel.

Grfico 1.13.
Grfico para frecuencias condicionadas

Participacin en emprendimientos conjuntos con otras


empresas y su localizacin

3 No participa

Locales (100 Km)


3
132 16 De la provincia
10 Nacionales

39

La respuesta a la localizacin de las empresas con las que participa o par-


ticip del algn tipo de emprendimiento es de naturaleza ordinal, ya que indica
un cierto orden en relacin a la jurisdiccin a la que pertenece la empresa socia.
Tabla 1.10. Localizacin de otras empresas

LOCALIZACIN FRECUENCIA
FRECUENCIA PORCENTAJE
DE OTRAS PORCENTAJE ABSOLUTA
ABSOLUTA ACUMULADO
EMPRESAS ACUMULADA
Locales (100 km) 10 62,5 10 62,50
De la provincia 3 18,75 13 81,25
Nacionales 3 18,75 16 100,00
TOTAL 16 100,00

Interpretemos los siguientes valores de las frecuencias acumuladas:


- Un 62,50% se asoci con empresas radicadas a una distancia de hasta 100
Km.
- 13 empresas se asociaron con empresas locales o radicadas en la provincia, lo
que constituye el 81,25 %.

Actividad 9:
Los establecimientos agropecuarios de la Provincia de Crdoba han sido clasifi-
cados de acuerdo a sus niveles de produccin, en altos, medianos y bajos y de
acuerdo a la zona geogrfica donde se encuentran ubicados. Los resultados se
muestran en la siguiente tabla:

Zona geogrfica de la Provincia

NIVEL DE
ZONA A ZONA B ZONA C TOTAL
PRODUCCIN
Alto 69 47 23 139
Mediano 40 25 80 145
Bajo 38 32 36 106
TOTAL 147 104 139 390

Se pide:
a) En qu direccin sera preferible calcular los porcentajes? Por qu?
b) Calcule dichos porcentajes y obtener algunas conclusiones.
c) Obtenga la razn entre el nmero de establecimientos con nivel de pro-
duccin alto y el nmero de establecimientos con nivel de produccin
bajo en cada una de las tres zonas. Comente sus resultados.

Dos variables numricas

Ahora veremos el caso de dos variables numricas; por ejemplo se cono-


ce la cantidad de personal ocupado y el porcentaje del costo laboral en el costo
total de las empresas.

No es conveniente representar estos datos en una tabla de frecuencias


debido a que se trata de variables continuas o discretas numerosas y la combi-
nacin de ambas variables pueden estar repetidas muy pocas veces o ninguna.
40 Para visualizar su comportamiento conjunto es conveniente realizar un grfico
de dispersin.

En este grfico, representamos en el eje de las abscisas el porcentaje del


costo laboral y en el eje de las ordenadas el personal ocupado; podemos obser-
var que menores niveles de costo laboral se corresponden con menor cantidad
de personal ocupado. (Grfico 1.14).
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

Se puede realizar un grfico de dispersin como el siguiente desde el men


de GRAFICOS > DIAGRAMA DE DISPERSION

Grfico 1.14.
Diagrama de Dispersin

Relacin entre personal y participacin del costo laboral


300
270
240
210
180
Personal

150
120
90
60
30
0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85
Costos lab/costo total

Para construir esta grfica con Infostat transformamos primero la variable


desde el men Datos Transformar, seleccionar la variable y en la ventana de
dialogo siguiente la transformacin que se quiere realizar.
Para graficar seleccionar Grficos Grfico de la distribucin emprica.

Actividad 10
La tasa de desempleo (x) y la tasa de renuncia (y) para 13 regiones se relevaron
en un momento determinado del tiempo. Los datos obtenidos se presentan en
la siguiente tabla:

41
Construya un diagrama de dispersin y analice el tipo de relacin entre las va-
riables.
5.4.3. Otro tipo de Grfico: Grfico logartmico.

Los grficos logartmicos o a escala logartmica son utilizados para re-


presentar series econmicas, comerciales o en general de cualquier tipo. La
diferencia entre una escala aritmtica y una escala logartmica es que en la
escala aritmtica una diferencia numrica se representa siempre por la misma
distancia vertical, por ejemplo la diferencia entre 200 y 100 o entre 1300 y 1200
es la misma distancia. En cambio en la escala logartmica la misma diferencia
porcentual se representa siempre por la misma distancia, por ejemplo la dife-
rencia entre 200 y 100 o entre 40000 y 20000 es la misma distancia, por esta
causa los grficos con esta escala suelen llamarse grficos de razones o pro-
porciones.

Cundo usamos un grfico a escala aritmtica y cundo uno a escala loga-


rtmica?

Si se quiere representar grficamente magnitudes y compararlas entre


s, el grfico que se debe utilizar debe estar a escala aritmtica o natu-
ral, y las diferencias estarn expresadas en trminos de cantidades
reales.
Si lo que se quiere mostrar son variaciones en porcentajes, o la relacin
porcentual en el cambio de cierto conjunto de datos con respecto a
otros, es necesario utilizar una escala logartmica.

Considerar el comportamiento de una serie econmica o comercial en es-


cala logartmica, implica la comparacin de tasas de cambio, es decir, la razn
entre un par de valores sucesivos de la serie analizada o el clculo de nmeros
ndices. Un grfico logartmico evita realizar este clculo de proporciones suce-
sivas.

Herramientas matemticas en los que se fundamenta su confeccin

En primer lugar veamos la relacin que existe entre una progresin nu-
mrica aritmtica y una logartmica.
La siguiente secuencia de nmeros 1, 2, 4, 8, 16, 32, 64, 128, ... sigue una
progresin geomtrica y representa las potencias de 2 : 20, 21, 22, 23, 24, 25, 26,
27,... Examinando los exponentes observamos que los mismos siguen una pro-
gresin aritmtica 0, 1, 2, 3, 4, 5, 6, 7, donde la base de estas potencias es un
valor fijo.
Recordemos que un logaritmo est definido como la potencia a la cual se
eleva una base comn a fin de obtener un cierto valor prefijado. Utilizando esta
definicin en el ejemplo dado:

20 = 1 log 2 1 =0
21 = 2 log 2 2 =1
22 = 4 log 2 4 =2
23 = 8 log 2 8 =3
24 = 16 log 216 =4
25 = 32 log 232 =5
26 = 64 log 264 =6
.
.
42 .

Realizando cambio de base en los logaritmos se puede formar otra serie


con potencias de cualquier otra base comn, normalmente los logaritmos se
toman sobre la base 10.
De esta manera podemos reescribir la serie geomtrica 1, 2, 4, 8, 16, 32,
64, ... de la siguiente manera 100, 100,3010, 100,6020, 100,9030, 101,2040, 101,5050, nue-
vamente los exponentes forman una serie aritmtica, entonces los logaritmos
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

tambin forman una serie aritmtica. La relacin entre las series permite tratar
a una serie geomtrica como aritmtica mediante el uso de los correspondien-
tes logaritmos de base comn y fija.
Volviendo a las series econmicas y comerciales, stas presentan un
comportamiento que podra ser asimilado a una serie geomtrica y que puede
ser analizado a travs de los logaritmos. Podemos transformar los datos en sus
correspondientes logaritmos, y por simple comparacin de los mismos es posi-
ble descubrir rpidamente cualquier variacin en los cambios.

Representacin grfica

Como se mencion en el ltimo prrafo del punto anterior un camino es


calcular el logaritmo de la variable y representar grficamente este ltimo en
coordenadas aritmticas.
Otra forma no necesita transformar los datos originales, lo que se trans-
forma es la escala de los grficos en escala logartmica antes de la representa-
cin de los datos.
A continuacin se presenta un ejemplo, donde los datos son la produc-
cin de dos empresas entre los aos 2000 y 2007 expresados en miles de pe-
sos y los logaritmos de los datos.

Tabla 1.11. Tabla de frecuencias

PRODUCCIN (en miles de pesos)


AOS EMPRESA A EMPRESA B LOG. EMP. A LOG. EMP. B
2000 40 2 3,69 0,69
2001 80 4 4,38 1,39
2002 120 8 4,79 2,08
2003 160 16 5,08 2,77
2004 200 32 5,30 3,47
2005 240 64 5,48 4,16
2006 280 128 5,63 4,85
2007 320 256 5,77 5,55

En el Grfico 1.15 se muestran los valores de la variable en escala aritm-


tica, donde se pueden analizar los cambios en los niveles de produccin de un
ao a otro en trminos absolutos.

Grfico 1.15.
Escala Aritmtica

43
Para analizar las variaciones porcentuales o las tasas de cambio de un
ao a otro necesitamos trabajar con logaritmos, en este ejemplo como una va-
riable es el tiempo ste se representa en el eje de las abscisas a escala aritmti-
ca. En el Grfico 1.16.a, la escala del eje de las ordenadas es logartmica y en el
Grfico 1.16.b se utiliz en el eje de las ordenadas una escala aritmtica pero se
graficaron los logaritmos de los valores de la variable.

Grfico 1.16.
(a) Escala Logartmica
Produccin Anual (en miles de pesos)
1000

100

EMPRESA A
EMPRESA B
10

1
2000 2001 2002 2003 2004 2005 2006 2007
Aos

(b) Variables transformadas con el logaritmo

Esta ltima grfica es posible construirla con Infostat, para ello trans-
formamos primero la variable con DATOS TRANSFORMAR, se-
leccionar la variable y en la ventana de dialogo siguiente la transfor-
macin que se quiere realizar. Para graficar seleccionar GRFICOS
GRFICO DE LA DISTRIBUCIN EMPRICA.

Observamos que la representacin grfica que se obtiene es la misma en


los dos casos y diferente de la grfica a valores aritmticos. En estos dos lti-
mos grficos es posible analizar la variacin en la tasa de crecimiento de la pro-
duccin a travs de los aos.
44
Te animas a realizar un informe con las conclusiones que surgen de estos grficos?
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

5.5. Algunos lineamientos a considerar en la presentacin de informes

Los resultados de un estudio estadstico deben ser informados a los in-


teresados. Es necesario presentar los resultados de manera adecuada, de forma
tal que contribuya a una mejor comprensin y exposicin de dichos resultados,
en funcin de los objetivos del trabajo. Para organizar una presentacin es ne-
cesario conocer con precisin la audiencia para buscar y seleccionar correcta-
mente los relatos y el lenguaje adecuado, as como los recursos visuales y grfi-
cos que puedan captar su atencin. Esto puede resultar ms complejo cuando la
informacin es abierta utilizando Internet donde hay un pblico muy diverso y
no siempre se conoce las caractersticas de quienes reciben la informacin de
los resultados.

Existen tres tipos fundamentales de presentacin: en forma escrita, con


cuadros estadsticos y grficas.

- La presentacin escrita es la forma ms habitual de presentar un infor-


me de resultados y conclusiones y/o recomendaciones. Debe limitar-
se a lo estrictamente necesario, cuidando de mantener una secuencia
lgica en la exposicin sin incurrir en repeticiones, citando todas las
tablas y figuras a que se haga referencia.

- Los cuadros estadsticos resultan de gran ayuda ya que permiten mos-


trar frecuencias, relaciones, contrastes, variaciones y tendencias en
una forma sintetizada, ms comprensible y ordenada de la informa-
cin.

- Las tablas deben ser autoexplicativas, para que el lector no tenga nece-
sidad de acudir al texto para conocer de qu trata determinada tabla.
Las partes de una tabla son:
Nmero de orden: para facilitar la referencia a la tabla en
el texto.
Ttulo completo, claro y conciso: es decir, debe reflejar
claramente en qu consiste el contenido.
Cuadro propiamente dicho o cuerpo de la tabla.
Notas explicativas o calce (tambin se le llama pie). Sir-
ven para indicar la fuente de donde se obtuvieron los da-
tos y, de ser pertinente, la significacin estadstica o al-
guna breve nota aclaratoria del contenido.

- Los grficos constituyen un complemento importante para la presenta-


cin de los resultados. Generalmente se elaboran a partir de tablas
estadsticas, pero al presentar los resultados. Es un error acompaar
a cada tabla por un grfico, ello origina repeticiones en la informacin
y prdida de espacio. El grfico debe agregar informacin, no dupli-
carla, por lo que el grfico debe utilizarse cuando se quiera mostrar
algn patrn especial en los resultados, destacar tendencias o ilustrar
comparaciones de forma clara y exacta. El grfico, tambin debe ser
autoexplicativo, sencillo y de fcil comprensin.

Las partes del grfico son: 45


Nmero de orden.
Ttulo.
Cuerpo o grfico propiamente dicho.
Leyenda permite identificar claramente los diferentes
elementos del cuerpo del grfico.
Las Naciones Unidas en su documento Cmo hacer comprensibles los
datos dice: Un relato estadstico debe basarse en un conocimiento suficiente de los
datos y del fenmeno en estudio, de lo contrario, podra ser interesante, pero total-
mente errneo. Cuando se est preparando un relato estadstico, tambin debes
recordar los Principios Fundamentales de las Estadsticas Oficiales: 1. Imparcialidad;
2. Profesionalidad; 3. Metadatos; 4. Formular observaciones sobre interpretaciones
Las ltimas tres caractersti-
errneas; 5. Diversidad de fuentes; 6. Confidencialidad; 7. Transparencia.
cas: 8. Coordinacin a nivel The International Statistic Institute define una serie de principios ticos a
nacional; 9. Estndares inter- considerar por los estadsticos. Como expresa Blacona (2011), la tica no se
nacionales; 10.Cooperacin incluye formalmente en los planes de estudios. Sin embargo es un tpico fundamen-
internacional, estn referidas tal para el desempeo profesional, si bien se refiere especficamente a los esta-
especficamente a las estads- dsticos, podemos extenderlo a todos aquellos profesionales que utilizan estas
ticas de organismos oficiales. herramientas en el ejercicio de su profesin.

7. Actividades de aprendizaje
Actividad 11:
Describa en cada uno de los casos mencionados ms abajo:
a) Cul es la poblacin?
b) Cul es la muestra?
c) Cul es la unidad estadstica?
d) Cul es la variable o caracterstica principal de cada estudio y de qu tipo es?

Caso A: Mientras un camin espera para descargar en un silo de granos la pro-


duccin de trigo de un campo, se toma una muestra de semillas de trigo. Sobre
la base de los resultados se clasifica a la semilla en excelente, muy buena, bue-
na o mala, y se establece el precio de toda la carga del camin.

Caso B: El Ministerio de Trabajo de la Provincia de Crdoba vigila constante-


mente las cifras sobre empleo, salario, movimiento laboral, etc. En base a una
muestra de 100 trabajadores, el Ministerio presenta las siguientes cifras co-
rrespondientes a un mes en particular: "2 de cada 100 empleados cambiaron de
trabajo el ltimo mes; el sueldo mensual de los obreros metalrgicos fue de
$ 12480; el nmero promedio de horas de trabajo en las empresas alimenticias
fue de 40,2".

Caso C: El departamento de contabilidad de una empresa toma 50 facturas del


ltimo mes para analizar si estn correctamente confeccionadas, en base a ello
tratar de determinar el porcentaje de facturas "mal confeccionadas" que tendr
el prximo mes.

Caso D: Un fabricante de cosmticos desea estudiar el grado de satisfaccin de


sus clientes a los que les ha regalado su nuevo producto. Est planeando para
ello entrevistar a 400 de esos clientes. Adems de lo que se le pide en el enca-
bezado del ejercicio, elaborar un primer borrador de cuestionario, anotando tres
preguntas que generen variables cualitativas y tres preguntas que generen va-
riables cuantitativas, que sean apropiadas para esta encuesta.

Caso E: El gerente del departamento de atencin al cliente de la N.V.C., est


46 interesado en determinar si los clientes que compraron electrodomsticos en el
ltimo ao estn satisfechos con sus productos. Utilizando las tarjetas de ga-
ranta que envan los clientes despus de la compra, el gerente est planeando
encuestar a 600 de esos clientes.

Caso F: En una encuesta poltica para tratar de pronosticar el resultado de una


eleccin de la Capital Federal, se seleccionan 1000 personas en condiciones de
votar.
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

Actividad 12:
La empresa Nielsen efecta encuestas semanales a los televidentes residentes
en la ciudad de Crdoba. Sus calificaciones estadsticas indican el tamao de la
audiencia para cada uno de los principales programas de la televisin local. Las
calificaciones de los programas y la parte del mercado para cada canal se publi-
can semanalmente.
a) Qu trata de medir la empresa Nielsen?
b) Cul es la poblacin?
c) Usted cree que se utilizar una muestra?
d) Qu tipos de decisiones o acciones cree usted que se basan en las me-
diciones de Nielsen?

Actividad 13:
Una consultora encargada de efectuar estudios de mercado en Crdoba, pidi
a 800 consumidores que probaran un plato de pastas denominado ZIA MA-
RIA, que es de elaboracin reciente de un fabricante. De los 800 consumidores
consultados 600 dijeron que compraran el plato si se pusiera a la venta.

a) Qu informar la consultora al fabricante, respecto a la aceptacin del


ZIA MARIA?
b) Es ste un ejemplo de estadstica descriptiva o inferencial? Justifique
la respuesta.
c) Cul es la poblacin, cul es la muestra y cul es la unidad estadstica?
d) Identifique el parmetro de inters y el estadstico. Se conoce el valor
de alguno de ellos?

Actividad 14:
Un diario de Crdoba inform acerca del tipo de medios de comunicacin exis-
tentes en la ciudad. Los datos son los siguientes:
MEDIOS DE COMUNICACIN CANTIDAD
Diarios 3
Radios A.M. 4
Radios F.M. 49
Canales T.V. por aire 3
Canales T.V. por cable 5
Revistas 27

A qu escala de medicin responden estos datos? Por qu?

Actividad 15:
Determine si cada una de las variables es categrica o numrica. Si es numrica
indique si es discreta o continua, y cul es la escala de medicin.
A los estudiantes de la Facultad de Ciencias Econmicas se les pregunt:

a) Si posee automvil o no.


b) La cantidad de dinero que gast en transporte el mes anterior.
c) Si tiene computadora o utiliza el gabinete de computacin de la facultad. 47
d) El tiempo que utiliza una computadora por semana.
e) La cantidad de libros que compr en los ltimos 12 meses.
f) La cantidad de dinero que gast en libros en los ltimos 12 meses.
g) Las editoriales preferidas.
h) El nmero de suscripciones a revistas econmicas.
Actividad 16:
Para controlar el valor de un inventario, el administrador de una ferretera quie-
re limitar la cantidad de cada artculo en el depsito; al mismo tiempo, evitar
perder ventas por falta de stock. Para lograr esto, el administrador desea saber
cules son las caractersticas de la demanda para cada artculo.

a) Describa la poblacin de inters para el administrador.


b) Proporcione un ejemplo de muestra representativa de esta pobla-
cin.Qu preguntas tendra que hacer el administrador? Elabore por lo
menos tres.

Actividad 17:
Un peridico realiz una encuesta telefnica a 480 habitantes seleccionados
aleatoriamente de distintas reas de la capital cordobesa. La siguiente tabla
muestra las respuestas acerca de la opinin de los servicios de seguridad. La
pregunta realizada fue: En su barrio, son adecuados los servicios de polica y
de bomberos? Las respuestas obtenidas fueron:

OPININ NMERO DE CASOS


SI 336
NO 96
NS / NC 48
TOTAL 480

a) Obtenga la distribucin de frecuencias relativas.


b) Construya un grfico de barras y un diagrama de pastel con esta informacin.
c) Cul de estos grficos le parece ms informativo y por qu?

Actividad 18:
Los siguientes datos se encuentran disponibles en archivos de una empresa.
Explicite el tipo de variable y la escala de medicin.

ARCHIVO DE PERSONAL
Variable Tipo de variable Escala de medicin
Barrio donde vive el empleado
Salario
Das de vacaciones
Das de ausencia por enfermedad
Edad
Adelantos de sueldo en un mes determinado

REGISTRO DE LA PRODUCCIN
Variable Tipo de variable Escala de medicin
Tipo de producto
Cantidad mensual producida por producto
Costo de la mano de obra
Costo de materiales

48 REGISTROS DE INVENTARIO
Variable Tipo de variable Escala de medicin
Existencia diaria por producto
Existencia diaria por insumo
Descuentos por producto
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

REGISTROS DE VENTAS
Variable Tipo de variable Escala de medicin
Ventas mensuales por producto
Ventas mensuales por regin geogrfica
Ventas mensuales por tipo de cliente
Canales de venta

PERFIL DEL CLIENTE


Variable Tipo de variable Escala de medicin
Edad
Sexo
Nivel de ingresos (alto, medio,bajo)
Zona donde vive

Actividad 19:
El rea de mercadotecnia de una empresa ha propuesto una nueva bebida die-
ttica que, piensa, captar una gran parte del mercado de adultos jvenes.

Qu informacin se debera tener en cuenta al momento de invertir en


la incorporacin de un nuevo producto en el mercado?Proponga una
forma de recoleccin de los datos para obtener esa informacin.

Actividad 20:
Las cotizaciones de un tipo de acciones en la bolsa para los ltimos 22 das fue-
ron las siguientes:

8.4 9.2 11.3 7.8 10.9 10.2 8.0 9.0 10.4 9.7 8.9
11.7 9.7 9.6 10.5 8.5 9.9 8.2 10.3 11.3 8.0 3.0

Elabore una representacin de tallo y hoja e interprtela. (Ayuda: los enteros


formarn el tallo y los decimales las hojas).

Actividad 21:
La siguiente tabla muestra datos correspondientes a la enegia anual generada
en el pas en Gigawatts/hora.

Aos Total de energa generada Hidrulica Nuclear


2008 114724 31456 7330
2009 114337 35093 8162
2010 120011 33300 7171
2011 124802 31309 6371
2012 129007 29308 6395
2013 133705 33333 6207
2014 137181 33345 5514

a) Represente grficamente la informacin de manera tal que permita ana-


lizar la evolucin porcentual de la energa total generada , y comarar la
variacin interanual de la energa hidrulica y nuclearIndique la varia- 49
cin promedio anual de la energa generada total, hidrulica y nuclear.
Actividad 22:
Represente grficamente la siguiente informacin:

Precio 3 3.9 6 10 4.5


Cantidad
1 1.3 2 3.33 1.5
ofrecida
Precio 10 8 7 6 4
Cantidad
2 4 5 6 8
demandada

Para elegir el tipo de grfico, tenga en cuenta que cada uno de ellos debe permi-
tir discutir las siguientes opiniones:

a) La elasticidad precio de la oferta es constante.


b) La pendiente de la curva de demanda es constante.

Actividad 23:
Para 15 empresas se relev el precio y el margen de utilidad de un producto. Los
datos obtenidos (en miles de pesos) se presentan en la siguiente tabla:

PRECIO (x) UTILIDAD (y)


15 5,3
15 6,0
14,8 5,2
13 3,9
16 4,8
14 4,2
14,5 4,4
15,5 4,7
13 3,9
15 4,5
13,5 4,7
14,6 5,1
15,5 5,4
14,8 5,9
13,8 4,8

Construya un diagrama de dispersin y analice el tipo de relacin entre las variables.

Actividad 24:
Una heladera cuenta con dos sucursales en la Ciudad de Crdoba, una ubicada
en la zona Norte y otra ubicada en la zona Sur. A continuacin se presenta in-
50 formacin sobre el nmero de pedidos telefnicos recibidos por da, para una
muestra aleatoria de 20 das:

Zona
4 6 7 5 5 6 7 4 8 6 8 5 7 6 7 5 6 6 7 4
Norte
Zona
4 6 5 3 6 3 5 6 5 6 4 4 5 6 6 2 3 4 5 6
Sur
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

1. Para cada sucursal:


a) Construya la tabla de distribucin de frecuencias.
b) Represente grficamente las frecuencias absolutas y las frecuencias re-
lativas acumuladas.
c) Analice la distribucin
2. Efecte comparaciones

Actividad 25:
A continuacin se presentan los precios de venta (en miles de $) de 30 casas de
dos zonas residenciales de la Ciudad de Crdoba.

90 116 120 95 114 97 121 108 102 91


Zona A 107 99 92 118 100 96 98 110 104 125
100 93 105 112 96 113 100 95 105 129

100 148 130 118 135 125 110 132 125 115
Zona B 134 116 131 109 126 112 126 105 150 119
121 145 128 117 136 122 119 130 125 133

1. Para cada zona:


a) Organice los datos en una distribucin de frecuencias tomando 5 inter-
valos de clase (cerrados por derecha).
b) Realice los grficos que correspondan.
c) Analice la distribucin

2. Efecte comparaciones.

Actividad 26:
La tabla siguiente presenta la poblacin total segn el ingreso medio individual
de los aglomerados urbanos para el segundo trimestre de 2016.

Nmero de decil Ingreso medio por decil Variaciones entre deciles


1 1.311
2 3.301 252
3 4.477 136
4 5.111 114
5 6.468 127
6 8.150 126
7 9.749 120
8 12.110 124
9 16.114 133
10 30.374 188

Del anlisis de los grficos siguientes se pide un informe sobre la variacin rela-
tiva del ingreso medio entre deciles. (Indique el grfico que utiliza en el anlisis
justificando su eleccin).

51
Actividad 27:
Las ventas diarias (en $) para los ltimos 120 das de una empresa de servicios
de transporte se organizaron en la una distribucin de frecuencias por interva-
los que ser muestra en la siguiente tabla:

yi-1 - yi ni
530 -730 3
730 - 930 7
930 - 1130 11
1130 - 1330 22
1330 - 1530 40
1530 - 1730 24
1730- 1930 9
1930 - 2130 4
Total 120

Determine:
a) Cuntos das se vendieron entre $ 1130 y $ 1330?
b) Qu porcentaje de das se registraron ventas de entre $ 1130 y $ 1330?
c) Represente mediante un histograma y un polgono de frecuencias, la in-
formacin dispuesta en la tabla.
d) Aproximadamente cul es el porcentaje de das que tienen como in-
greso $ 1730 o ms?
e) Podra describir la forma de la distribucin?

52
8. Casos de discusin y anlisis
A continuacin se presentan casos de investigacin reales.
En cada uno determinar:
Objetivo de la investigacin
Poblacin
Unidad estadstica
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

Marco muestral
Muestra
Parmetro
Estadstico
Variables de inters (clasificarlas por tipo)
Fuente de recoleccin de datos

Caso 1

Un equipo de investigacin de nuestra Facultad realiz un estudio sobre


el desempeo acadmico de los estudiantes que ingresaron en los aos 2000 y
2003 a las tres carreras de la Facultad de Ciencias Econmicas (UNC), con el
objetivo de identificar las principales variables que contribuyen a explicar tanto
el rendimiento como el abandono observados hasta fin del ao 2005.
El anlisis comprende una descripcin general de las caractersticas de
los estudiantes de ambas cohortes incluidos en cada muestra, teniendo en
cuenta factores como carrera, sexo, lugar de procedencia, modalidad del esta-
blecimiento de nivel secundario del que egres (pblico o privado), cantidad de
materias aprobadas en la carrera y nota promedio del secundario.
Los datos utilizados para el estudio fueron extrados del sistema SIU-
Guaran (Sistema de Informacin Universitario Guaran) y de los legajos indivi-
duales de los estudiantes, que obran en la unidad acadmica.
Para llevar a cabo el estudio se seleccion un grupo de estudiantes de ca-
da cohorte segn el siguiente detalle:

Nmero de estudiantes por carrera seleccionados

CARRERA COHORTE 2000 COHORE 2003


Contador 2154 1928
Lic. en Economa 275 252
Lic. en Administracin 1157 789
TOTAL 3586 2969
Fuente: Elaboracin propia a partir de datos obtenidos del SIU - Guaran

Caso 2

En nuestra Facultad se realiz un anlisis del trabajo informal (tambin


denominado no registrado, o en negro) en Argentina, utilizando los datos de la
Encuesta Permanente de Hogares de INDEC y aplicando los criterios bsicos de
las definiciones existentes a nivel internacional. Mediante un enfoque descripti-
vo se realizan estimaciones de la cantidad de trabajadores informales durante
los ltimos 8 aos, tanto en el pas como en sus regiones, y se presentan los
resultados en aperturas que comprenden principalmente aspectos como sexo,
edad, categora ocupacional, nivel de estudios, ramas de actividad y nmero de
horas trabajadas, entre otros.

Nota: La Encuesta Permanente de Hogares es un programa de programa


de investigacin de la realidad social del pas. Se nutre de informacin a travs
de una encuesta realizada a un grupo de hogares seleccionados, que permite 53
conocer las caractersticas demogrficas y sociodemogrficas de la poblacin,
vinculadas a las fuerza de trabajo.

Caso 3

Un equipo de investigacin de nuestra Facultad realiz un trabajo para


analizar los niveles de pobreza en la poblacin de Malvinas Argentinas, Crdo-
ba, y determinar la incidencia de cada atributo en la misma, con la finalidad de
definir una metodologa pertinente y actual capaz de ser aplicada en otras co-
munidades.
Se determin, en la localidad de Malvinas Argentinas:
La tasa de pobreza de cada hogar.
La tasa de pobreza de la poblacin de hogares.
La tasa de pobreza en la poblacin por atributo considerado.

Para aplicar est metodologa, se utiliz una encuesta realizada en el ao 2004


en la poblacin de Malvinas Argentinas donde se entrevistaron aproximada-
mente 700 hogares.
Los atributos que se consideraron son:
1. Ingreso de las familias.
2. Tamao de la vivienda (en m2).
3. Aos de escolaridad del jefe de familia.
5. Tipo de vivienda.
8. Material de las paredes.
9. Cantidad de personas por cuarto.
10. Situacin laboral del jefe de familia.

Caso 4

La Universidad de Lomas de Zamora realiz un trabajo para describir al-


gunas caractersticas de los estudiantes universitarios que trabajan y analizar
su actitud frente a algunas herramientas tecnolgicas, tales como la compu-
tadora personal (PC) e Internet.
Durante ao 2003, se realiz una encuesta con el fin de estudiar la pene-
tracin de las Tecnologas de la Informacin y la Comunicacin (TICs) en los
estudiantes universitarios, especialmente la incidencia del uso de Internet. Di-
cho estudio volvi a realizarse en 2005 y 2007.
El inters est centrado en detectar si los estudiantes trabajadores han
percibido algn cambio, durante el perodo comprendido entre los aos 2003,
2005 y 2007, en su lugar de trabajo, en cuanto a dos indicadores: nivel de co-
municacin personal y a cantidad de encuentros cara a cara.
Tanto en al ao 2003 como en el 2005 y 2007 se trabaj con un grupo de
alumnos seleccionados al azar entre los inscriptos durante el segundo cuatri-
mestre del ciclo lectivo de dichos aos, en distintas Facultades de la Universi-
dad Nacional de Lomas de Zamora, sita en la Provincia de Buenos Aires y de la
Universidad de Buenos Aires, sita en la Ciudad Autnoma de Buenos Aires.
La recopilacin de los datos se realiz mediante una encuesta directa, es-
tructurada y precodificada que se entreg a los alumnos seleccionados en di-
chas oportunidades.

En este estudio se indag, entre otros, sobre los siguientes aspectos:


Edad
Sexo
Universidad y Facultad
Nivel de satisfaccin que obtiene al realizar actividades con la compu-
tadora personal y satisfaccin por el uso de Internet (con las siguientes
categoras: nulo, muy bajo, bajo, moderado, alto, muy alto).
54 Nivel de uso de Internet (con las siguientes categoras: nulo, muy bajo,
bajo, moderado, alto, muy alto).
Grado de comunicacin personal con compaeros de trabajo (aument,
disminuy, no vari).
Cantidad de encuentros personales, cara a cara con compaeros de tra-
bajo, por semana.

Caso 5
Captulo 1: Los mtodos estadsticos en la investigacin cientfica

Nickelodeon se conecta en la red para recabar datos*

Cmo averiguar qu piensan los nios? Este fue el problema que afront la *Extrado de Investigacin de
vicepresidenta de investigacin de Nickelodeon. Los programadores y el perso- mercados contempornea de
nal de mercadotecnia de la red de cablevisin para nios deseaban informacin Carl Mc Daniel y Roger Gates.
sobre los jvenes televidentes, la cual tradicionalmente se haba obtenido me-
diante sesiones de grupo que consumen mucho tiempo, y entrevistas persona- Sesiones de grupo: grupo de 8
a 10 participantes conducidos
les.
por un moderador en una dis-
Gracias al advenimiento del e-mail, la vicepresidenta de investigacin tu- cusin profunda sobre un de-
vo la idea de conectarse con los televidentes en lnea. Nickelodeon coloc 70 terminado tema o concepto.
anuncios en lnea mediante Compu Serve. Los nios utilizan sus computadoras Entrevista: entrevistadores
personales y mdems para hablar con Nickelodeon y entre ellos, acerca de di- personales que efectan son-
versos temas. Pueden escribir avisos de la computadora y tres veces por sema- deos y obtienen respuestas
na pueden conectarse en juntas programadas con anterioridad. Durante esas detalladas para las preguntas, a
juntas, los investigadores de la red dirigen sus discusiones sobre diversos te- menudo emplean tcnicas no
mas, una tercera parte del tiempo se dedica a ciertos programas de la cadena. directivas para descubrir moti-
Es obvio que los nios participantes son usuarios de CompuServe. Su vaciones ocultas
edad va de los ocho a doce aos y representan hogares con ingresos desde U$S
30.000 a U$S 100.000 anuales. Se estima que el mantenimiento anual del sis-
tema cuesta 80.000 dlares, lo que constituye tan slo una fraccin del costo
de los mtodos de investigacin tradicionales.
De este modo, Nickelodeon obtiene datos ms detallados, con ms rapi-
dez y econmicos, que con los mtodos de investigacin tradicionales (sesiones
de grupo y entrevistas). Los nios dan retroalimentacin instantnea sobre los
programas. Otros datos provienen de respuestas a preguntas tipo encuesta.
Algunos consideran este mtodo con escepticismo y sealan que probablemen-
te est sesgado a favor de nios locuaces. La vicepresidenta de investigacin
entiende que este sistema es una herramienta cualitativa y que, al igual que
cualquier investigacin de este tipo, los resultados no pueden proyectarse a
nivel nacional.

55
9. Referencias Bibliogrficas

- Blacon Teresa (2001) tica en Estadstica: responsabilidad de las universi-


dades en la formacin del profesional Recuperado de
http://www.saberes.fcecon.unr.edu.ar/index.php/revista/article/view/50/99
revisado el 20/06/2015

- Berenson, M y Levine, D (2003) Estadstica Bsica en Administracin. Conceptos


y Aplicaciones. 6 Edicin Prentice Hall.

- International Statistic Institute (ISI) (2010) Declaration on professional ethics.


Recuperado de http://www.isi-web.org/index.php/activities/professional-
ethics/isi-declaration

- Daz Margarita .[et.al.] (2004) Estadstica I: Gua de Estudio. -1ra Ed. Crdoba
Asociacin Cooperadora de la Fac. de Cs. de la U.N.C., 2009.338 pginas 27x21
cm ISBN 978-987-1436-21-7.

- Naciones Unidas Comisin Econmica para Europa (2009) Cmo hacer com-
prensibles los datos Parte 2 Una gua para presentar estadsticas. Ginebra. Recupe-
rado de
http://www.unece.org/fileadmin/DAM/stats/documents/writing/MDM_Part
2_Spanish.pdf

- Saino Martin (2009). Estadstica Descriptiva. Material de estudio y aplicacio-


nes prcticas correspondiente a los Captulos I, II del programa de Estadstica I.
Asoc Coop F.C.E. (U.N.C.). ISBN: 978-987-1436-20-0

- Pea, Daniel (2001) Fundamentos de Estadstica. Editorial Alianza.

56
Tablas de frecuencias
Variable Clase Categoras FA FR FAA FRA
NIVEL DE INSTRUCCIN 1 1Primario 48 0,45 48 0,45
NIVEL DE INSTRUCCIN 2 2Secundario 36 0,34 84 0,79
NIVEL DE INSTRUCCIN 3 3Terciario 15 0,14 99 0,93
NIVEL DE INSTRUCCIN 4 4Universitario 5 0,05 104 0,98
NIVEL DE INSTRUCCIN 5 5NS/NC 2 0,02 106 1,00

a) Tablas de frecuencias

Variable Clase Stock FA FR FRA


stock 1 300 3 0,10 0,10
stock 2 400 5 0,17 0,27
stock 3 500 7 0,23 0,50
stock 4 600 6 0,20 0,70
stock 5 700 5 0,17 0,87
stock 6 800 4 0,13 1,00
Tablas de frecuencias
Variable Clase MC FA FR FAA FRA
Cantidad de veces 1 1 3 0,12 3 0,12
Cantidad de veces 2 2 4 0,16 7 0,28
Cantidad de veces 3 3 3 0,12 10 0,40
Cantidad de veces 4 4 5 0,20 15 0,60
Cantidad de veces 5 5 3 0,12 18 0,72
Cantidad de veces 6 6 4 0,16 22 0,88
Cantidad de veces 7 7 3 0,12 25 1,00
Tablas de frecuencias

Variable Clase LI LS MC FA FR FAA FRA


ventas 1 [ 530,00 730,00 ) 630,00 3 0,03 3 0,03
ventas 2 [ 730,00 930,00 ) 830,00 7 0,06 10 0,08
ventas 3 [ 930,00 1130,00 )1030,00 11 0,09 21 0,18
ventas 4 [ 1130,00 1330,00 )1230,00 22 0,18 43 0,36
ventas 5 [ 1330,00 1530,00 )1430,00 40 0,33 83 0,69
ventas 6 [ 1530,00 1730,00 )1630,00 24 0,20 107 0,89
ventas 7 [ 1730,00 1930,00 )1830,00 9 0,08 116 0,97
ventas 8 [ 1930,00 2130,00 ]2030,00 4 0,03 120 1,00

Tablas de frecuencias

Variable Clase LI LS MC FA FR FAA FRA


Precios 1 [ 41,00 59,00 ] 50,00 8 0,20 8 0,20
Precios 2 ( 59,00 77,00 ] 68,00 4 0,10 12 0,30
Precios 3 ( 77,00 95,00 ] 86,00 11 0,28 23 0,58
Precios 4 ( 95,00 113,00 ] 104,00 11 0,28 34 0,85
Precios 5 ( 113,00 131,00 ] 122,00 6 0,15 40 1,00
3 0
4
5
6
7 8
8 0 0 2 4 5 9
9 0 2 6 7 7 9
10 2 3 4 5 9
11 3 3 7
Tablas de frecuencias

Variable Clase MC FA FR FAA FRA


Zona Norte 1 4 3 0,15 3 0,15
Zona Norte 2 5 4 0,20 7 0,35
Zona Norte 3 6 6 0,30 13 0,65
Zona Norte 4 7 5 0,25 18 0,90
Zona Norte 5 8 2 0,10 20 1,00

Variable Clase MC FA FR FAA FRA


Zona Sur 1 2 1 0,05 1 0,05
Zona Sur 2 3 3 0,15 4 0,20
Zona Sur 3 4 4 0,20 8 0,40
Zona Sur 4 5 5 0,25 13 0,65
Zona Sur 5 6 7 0,35 20 1,00
Tablas de frecuencias

Variable Clase LI LS MC FA FR FAA FRA


Precio Zona A 1 [ 90,00 98,00 ] 94,00 10 0,33 10 0,33
Precio Zona A 2 ( 98,00 106,00 ] 102,00 8 0,27 18 0,60
Precio Zona A 3 ( 106,00 114,00 ] 110,00 6 0,20 24 0,80
Precio Zona A 4 ( 114,00 122,00 ] 118,00 4 0,13 28 0,93
Precio Zona A 5 ( 122,00 130,00 ] 126,00 2 0,07 30 1,00
Tablas de frecuencias

Variable Clase LI LS MC FA FR FAA FRA


Precio Zona B 1 [ 100,00 110,00 ] 105,00 4 0,13 4 0,13
Precio Zona B 2 ( 110,00 120,00 ] 115,00 7 0,23 11 0,37
Precio Zona B 3 ( 120,00 130,00 ] 125,00 10 0,33 21 0,70
Precio Zona B 4 ( 130,00 140,00 ] 135,00 6 0,20 27 0,90
Precio Zona B 5 ( 140,00 150,00 ] 145,00 3 0,10 30 1,00
Estadstica I
Tomo I (cap. 1, 2 y 3)

Ciclo Bsico a Distancia


FACULTAD DE CIENCIAS ECONMICAS
AUTORIDADES

Mgter. JHON BORETTO


Decano

Dra. MARA LUISA RECALDE


Vicedecana

Cr. FACUNDO QUIROGA MARTNEZ


Secretario Tcnico

Cr. DIEGO CRIADO DEL RO


Secretario de Administracin

Mgter. GERARDO HECKMANN


Secretaria de Asuntos Acadmicos

Lic. JUAN SAFFE


Secretario de Extensin

Cr. MATAS LINGUA


Secretario de Asuntos Estudiantiles

Dr. ANDRS MATTA


Secretaria de Ciencia, Tcnica y Relaciones Internacionales

Mgter. CLAUDIA CARIGNANO


Prosecretaria de Evaluacin Institucional y Acreditacin de Carreras

Cr. HUGO PRIOTTO


Director de la Carrera Contador Pblico

Mgter. MARCELO CAPELLO


Director de la Carrera de Licenciatura en Economa

Lic. TOMS GASTN


Director de la Carrera de Licenciatura en Administracin
CICLO BSICO A DISTANCIA
REAS QUE PARTICIPAN

Coordinacin Acadmica
Secretara de Asuntos Acadmicos
Mgter. Gerardo Heckmann
Coordinacin Organizativa de Divisiones a Distancia
Lic. David Taborda

rea de Formacin Docente y Produccin Educativa


Coordinador General
Oscar Margara
Asesora pedaggica
Dra. Adela Coria
Equipo de produccin en tecnologa educativa y comunicacin
Mgter. Gabriela Sabulsky
Lic. Cecilia Botino
Lic. Vctor R. Cacciagi
Lic. Laura Delmonte
Lic. Vanesa Guajardo
Esp. Vernica Pacheco
Lic. Mara Florencia Scid
Administracin
Lic. Nora Ceballos
Proyecto Elaboracin de material didctico en formato digi-
tal para Estadstica I en el marco del Programa de Apoyo y
Mejoramiento a la enseanza de grado de la UNC aprobado
por Res. HCS N583-2015.

Coordinadora del Proyecto:


Margarita Daz

AUTORES
Norma Patricia Caro
Rosana Beatriz Casini
Margarita Daz
Fernando Garca
Mariana Gonzlez
Martn Saino
Mara Ins Stmolo

Los autores agradecen especialmente a los Profesores Asistentes por la


colaboracin prestada en la resolucin y revisin de las actividades.
Mara Ins Ahumada
Lorena Anaya
Vernica Arias
Mariana Guardiola
Roberto Infante
Adrian Moneta Pizarro
Olga Padro
Andrea Righetti
Julio Rosales
Proyecto Fortalecimiento del Ciclo Bsico a Distancia en el
marco del Programa de Apoyo y Mejoramiento a la enseanza
de grado de la UNC aprobado por Res. HCS N 604-2014.

Coordinadora del Proyecto:


Dra. Adela Coria

Maquetacin de materiales
Lic. Vctor R. Cacciagi y Lic. Ismael Rodrguez

Diseo grfico y audiovisual


Lic. Laura Delmonte

Asesoramiento y diseo pedaggico - didctico


Esp. Vernica Pacheco y Lic. Vanesa Partepilo

Asesoramiento y diseo comunicacional


Lic. Cecilia Botino y Lic. Mara Florencia Scid
NDICE

Captulo 2:
Parmetros y estadsticos de las distribuciones de frecuencias
Introduccin 75
1. Medidas de posicin 75
1.1 Media aritmtica 76
1.1.1 Propiedades de la media aritmtica 80
1.2 Mediana 87
1.2.1 Propiedad de la Mediana 88
1.3 Modo 90
1.4 Medida Geomtrica 93
1.4.1 Propiedades de la Medida Geomtrica 94
1.5 Medidas de posicin no central 94
1.5.1 Cuartiles 95
2. Medidas de dispersin 97
2.1 Varianza 97
2.1.1 Frmula de clculo 98
2.1.2 Varianza de la muestra 99
2.1.3 Propiedades de la varianza 101
2.2 Desviacin estndar 102
2.3 Coeficiente de variacin 103
2.4 Recorrido y Recorrido Intercuartil 104
3. Diagrama de caja y brazos 105
4. Otras medidas 109
4.1 Momentos naturales 109
4.2 Momentos centrados 109
5. Medidas de forma 109
5.1 Coeficientes de asimetra 111
5.2 Coeficientes de curtosis 112
6. Distribuciones bidimensionales 116
6.1 Covarianza y Coeficiente de Correlacin de Pearson 116
7. Actividades de aprendizaje 121
8. Referencias Bibliogrficas 123
Soluciones y respuestas al Captulo 2 124
Captulo 2
Parmetros y estadsticos
de las distribuciones de frecuencias
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

Captulo 2: Parmetros y estadsticos de las


distribuciones de frecuencias

Introduccin

En la unidad anterior se hizo mencin a las etapas del mtodo cientfico y


su aplicacin mediante el uso de herramientas estadsticas.
Se explicaron aspectos vinculados con las tres primeras etapas: plantea-
miento del problema, diseo, recopilacin y organizacin de datos; se aborda-
ron conceptos y aplicaciones inherentes al tema y se desarrollaron actividades
mediante las cuales se ordenan los valores de una variable y se describe su
comportamiento de una manera visual en grficos o bien de una forma ordena-
da en tablas.
Ahora veremos la cuarta etapa, la de anlisis, donde tambin se descri-
ben las variables calculando medidas que permiten resumir los valores de stas
y explicar su comportamiento en un aspecto o caracterstica de la distribucin.
Cuando hablamos de aspecto o caracterstica de la distribucin nos estamos
refiriendo a posicin, dispersin y forma, criterio de clasificacin utilizado para
definir las medidas descriptivas.
De esta manera tendremos algunos valores que describen la posicin,
unos la dispersin y otros la forma del conjunto de valores de la variable.
Adems, explicaremos mtodos de clculo para obtener esas medidas
como as tambin las ventajas y desventajas de su aplicacin en cada caso.
Utilizaremos bases de datos procesadas con el software Infostat para
conectarnos con esta forma rpida de procesar y analizar informacin, lo que en
virtud de la tecnologa existente nos permite obviar clculos e interpretar resul-
tados estableciendo relaciones importantes entre las medidas.
Luego, estudiaremos distribuciones bidimensionales, esto es distribucio-
nes en las que intervienen dos variables y aplicaremos medidas que permitan
indagar sobre la asociacin entre esas variables describiendo aspectos relevan-
tes de la presentacin conjunta y condicional de las mismas.

1. Medidas de posicin Para una mejor comprensin


del significado del trmino
posicin en el entorno de las
Las Medidas de posicin son aquellas que permiten describir los datos de medidas descriptivas, se sugie-
una serie en cuanto a su ubicacin en el eje de las abscisas. Se clasifican como re a ingresar a la seccin Mate-
de tendencia central y no central. Las medidas de tendencia central se localizan riales Recursos del aula virtual
para ver la produccin audiovi-
en el centro de la distribucin, mientras que las que no lo son se localizan en
sual Serie Horizontes de
otras partes de la distribucin. Las medidas de tendencia central que estudia- Canal Encuentro llamada Esta-
remos son: media aritmtica, media geomtrica, mediana y modo. dstica.

Las medidas de posicin que no son de tendencia central, denominadas


cuartiles, deciles y percentiles, se localizan en cualquier otra parte de la distri- 75
bucin, es decir en extremos o en un sector cercano al centro indicando puntos
especficos de la distribucin como fracciones que permiten establecer porcen-
taje de observaciones ubicadas a la izquierda y derecha de la medida.
1.1 Media aritmtica

Esta medida es un promedio que se utiliza como medida resumen del


conjunto de datos cuando la variable es numrica. Puede aplicarse sobre una
serie simple o sobre una distribucin de frecuencias.

La Media Aritmtica se define como la suma de los valores de la variable divi-


dida por el total de datos.

La importancia de marcar la
diferencia radica en el signifi- Para aclarar la idea observe la siguiente tabla.
cado de la medida y su aplica-
cin para describir el compor- A modo de ejemplo, si se cuenta con la estatura de 11 personas y, se pre-
tamiento de la variable. tende caracterizar al grupo por la estatura media, se aplicar la definicin con lo
que concluiremos que en promedio estas personas miden 1,62 m. Es decir, una
Cuando se utilizan las medidas
de posicin central se analiza el altura intermedia entre los ms altos y los ms bajos.
punto de equilibrio entre los
valores y se busca representar ESTATURA
el conjunto por la medida, 1,6
mientras que cuando nos refe- 1,52
rimos a cuartiles por ejemplo, 1,66 Media 1,62
se pretende destacar cuatro 1,68 17,82/11
partes de la distribucin mar- 1,69
cadas por el 25% de las obser- 1,66
vaciones. 1,64
1,48
1,61
1,66
1,62

En la poblacin, el parmetro se simboliza con la letra griega , mientras


que en la muestra (el estadstico) ser M(x) o x , si la variable se simboliza con
x, M(y) y , si la variable se simboliza con y.

N
xi
Parmetro i 1

Tamao de la poblacin: N; Parmetro: Variable: x


n
xi
Estadstico x i 1

Tamao de la muestra: n; media muestral x ; Variable x

Retomando el ejemplo Anlisis Industrias de Crdoba (base de datos in-


dustrias.idb) que fue utilizado en los ejemplos de la unidad 1, se considerar la
variable cuantitativa porcentaje del costo laboral en el costo total para aclarar
los conceptos aqu abordados. Vamos a tomar en cuenta la rama de actividad a
la que pertenece la empresa como factor de clasificacin y calcularemos, utili-
76 zando Infostat, la media aritmtica de la variable para cada rama de actividad.
Consideraremos una situacin en que el municipio est interesado en la
repercusin que puede tener el costo laboral considerando la rama de actividad
con el propsito de otorgar beneficios impositivos a los sectores de la actividad
industrial que requieran de mayor cantidad de personal para su normal funcio-
namiento. En consecuencia lo primero que necesitar el municipio es el prome-
dio de la variable mencionada por rama de actividad.
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

En la imagen siguiente observamos la base de datos para las variables


porcentaje de costo laboral/costo total y rama de actividad. Recordemos que se
codificaron 10 ramas cuyo detalle se encuentra anexado a la base.

Utilizando el software Infostat, abriendo la base de datos "indus-


trias.idb, siguiendo el procedimiento que se detalla a continuacin.
Se obtendr una tabla resumen con la media para cada rama de acti-
vidad, de la variable seleccionada (Tabla 1). De igual forma se pueden calcular
todas las medidas descriptivas por rama de actividad. (Ver instrucciones en
apoyo Infostat).

Oprimiendo el
men
Estadsticas

1.Alimentos y Bebidas
2.Textiles, Con-
fecc.Calzado
3.Madera y Muebles
4.Papel e Impresiones
5.Qumica, Caucho y Pls-
ticos

8.Maquinaria y Equipos
6. Vidrio y Minerales. no
Metlicos
7.Productos Metlicos

El cuadro de dialogo ser el que se muestra a continua-


cin, vemos que incorporando la variable rama de acti-
vidad como criterio de clasificacin, se obtiene la media
de la variable para cada categora.

77
Tabla 1. Medias por rama de variable porcentaje de costo laboral.

Actividad 1
Trabaje con la base industrias.idb y consultando el punto 3.21 del instructivo
de infostat, asigne el nombre de cada rama en la base de datos

En la Tabla 1 se puede observar que la rama 2 (textil) es la que tiene mayor


promedio de la variable porcentaje de costo laboral sobre total. Sin embargo las
dems ramas que le siguen en orden de magnitud, no difieren demasiado, pre-
sentando el menor valor la rama 4 (papel e impresiones)

Con el fin de ejemplificar de manera sencilla el clculo de la media aritmtica, a


continuacin se obtendr la media aritmtica para la variable analizada prece-
dentemente, tomando la rama de actividad 4 que tiene 11 observaciones

Ejemplo 1
Los datos siguientes representan los valores del porcentaje del costo labo-
ral /costo total para las 11 empresas de rama 4, papel e impresiones.

Costos laboral / Costo total


Rama 4
25
Aplicando la frmula de media
7
aritmtica de la muestra, el valor del
40 promedio, ser:
15 n
20 xi
20 i 1 202
x 18,36
10 n 11
22
30
78 10
3
Suma: 202

En el histograma del Grfico 1 se puede observar la ubicacin de la media


aritmtica como medida de posicin central.
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

Grfico1:
Histograma de porcentaje de costos laboral

La media 18,36

El porcentaje promedio de los costos laborales en esta rama es 18,36%.


Observando los datos vemos que hay valores del porcentaje del costo laboral
inferiores y superiores a este valor. En un punto de equilibrio se puede repre-
sentar a todos los valores, en cuanto a su posicin, mediante la cifra llamada
media aritmtica que en el ejemplo se refiere al porcentaje medio del costo
laboral por empresa y cuyo valor es 18,36.

Aclaraciones importantes respecto de la media aritmtica:


Es interesante destacar que la Media Aritmtica es un valor que des-
cribe a los datos en cuanto a su posicin pero, por su frmula de clculo, est
afectada por valores atpicos de la variable, lo que en ciertos casos le hace per-
der representatividad. Si en el ejemplo 1, el valor 40 fuere 98; la media ser:

Costos laboral / Costo total


Rama 4
25
7 La media aritmtica de la mues-
98 tra ser:
15
n
20
xi
20 i 1 260
10 x 23,64
n 11
22
30
10 79
3
Suma: 260

Se observa que la media aritmtica de 18,36 pasa a 23,64. Esa diferencia


en el valor promedio del porcentaje del costo laboral en relacin al costo total se
debe a la influencia que este valor 98 tiene en la suma total de la variable, valor
que en realidad es muy diferente a los dems, generando un promedio mayor y
que no representa fielmente al resto de los valores de la variable.

Para solucionar este inconveniente, en estas distribuciones se utiliza otra


medida de posicin que es la Mediana.

Otro aspecto de la Media Aritmtica es que, al igual que todas las me-
didas de posicin, se expresa en la misma unidad de medida que la va-
riable. En este ejemplo tanto la variable x como la M(x) se expresan en
porcentaje.

Cuando los datos estn agrupados en una tabla de distribucin de fre-


cuencias, el valor xi de la variable se repite ni veces. En el clculo de la
media aritmtica, cada valor distinto de la variable debe ponderarse por
la cantidad de veces que el mismo se repite, de la siguiente forma:

k
xi ni
i 1
x
n

1.1.1 Propiedades de la media aritmtica

A continuacin se desarrollan las propiedades de la media aritmtica, y


se incluye un ejemplo numrico de serie simple, para verificar la propiedad en
cada caso.

La Media Aritmtica de una constante, es igual a la constante.

Dada xi = c, donde c es una constante.

M c c

Aplicando la definicin de media aritmtica:

n
M x c c
n

Verificacin: la variable asume el valor 3 en forma constante, para una muestra


3 3 3 3
de 4 datos. La media de x, ser: x 3 por lo que el valor 3, que es
3
constante, ser el resultado de la media aritmtica de la variable x.

La Media Aritmtica del producto de una constante por una variable;


es igual a la constante por la media de la variable.

M c.x c.M x
80
Aplicando la definicin de media aritmtica:
k k
c xi ni xi ni
i 1
M c.x c. i 1
c.M x
n n
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

Verificacin: x asume los valores: 10, 20, 30, 40, su media es: x 25

Si multiplicamos x por 2, surge x con los valores: 20, 40, 60, 80; siendo su me-
dia: x = 50, pero al aplicar la propiedad no ser necesario recalcular todos los
valores de x, slo haremos:

M( x`) 2.M( x ) 2.25 50

La Media Aritmtica de la suma de una constante ms una variable es


la constante ms la media de la variable.

M x c M x c

Aplicando la definicin de media aritmtica:

k
xi c ni
i 1
M x c
n
Distribuyendo el sumatorio:
k k
xi ni c ni
i 1 i 1
M x c
n n
k
c es constante por lo que puede extraerse del sumatorio y ni n , con lo
i 1

cual se arriba a:
k
xi ni
i 1 n
M x c c M x c
n n

Verificacin: x asume los valores: 10, 20, 30, 40, su media es: x = 25

Si a x le sumamos la constante 3, sus nuevos valores sern: x: 13, 23, 33,


43 y su media es x ' = 28. Al aplicar la propiedad no deberemos recalcular los
valores de x sino que simplemente haremos:

M(x) = M(3+x) = 3 + M(x) = 3 + 25 = 28

La suma de las diferencias entre los valores de la variable y su Me-


dia Aritmtica es siempre nula.
k
xi M x ni 0
i 1

Para demostrarlo distribuimos el sumatorio: 81


k k
xi ni M x ni 0
i 1 i 1
Extraemos M x del segundo sumatorio, ya que es constante para el mismo:
k k
xi ni M x ni 0
i 1 i 1

k
xi ni
Dado que ni n y que M x i 1 , tenemos que:
i 1 n

nM x nM x 0

Por lo tanto:
0 0

Al verificarse la igualdad, queda demostrada la propiedad.

Verificacin: x asume los valores: 2, 4, 6 resultando la media: x =4

Al realizar la suma de cada valor respecto de su media obtendremos:

(xi - x ) = (2-4) + (4 - 4) + (6 - 4) = 0

Esto que matemticamente puede demostrarse de manera muy


sencilla, significa que al ser la media un promedio centralizado, las dife-
rencias entre los valores ubicados a su izquierda se compensan con las
diferencias de los valores ubicados a su derecha de modo que la suma de
todas esas diferencias arroja resultado cero.

La suma de cuadrados respecto de la Media Aritmtica es un valor


mnimo.

SCx = (xi M(x))2 mnimo

Vamos a demostrar que el mnimo se da cuando los desvos estn calculados


con respecto a M(x). Para ello, planteamos una funcin a minimizar que contie-
ne una variable w cuyo valor queremos averiguar:
k
2
f w xi w ni Mnimo
i 1

Para encontrar el mnimo de la funcin, obtenemos la derivada primera con


respecto a w y la igualamos a cero:
k
f w 2 xi w 1 ni
i 1

82 f w 0

Despejamos w:
k
2 xi w 1 ni 0
i 1
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

Extraemos (2) del sumatorio, dividimos ambos miembros por (-2) y distribui-
mos el sumatorio de forma tal que:
k k
xi ni w ni 0
i 1 i 1

k
Dado que ni n y como w es constante con respecto al sumatorio:
i 1

k
xi ni wn 0
i 1

Por lo que, w es:


k
xi ni
i 1
w M x
n
Este es un punto crtico de la funcin. Para determinar si ese punto es un mni-
mo debemos verificar si la derivada segunda es positiva. La derivada segunda es
igual a:
k
f w 2 1 ni
i 1

Como f w 2n 0 para cualquier n, la funcin se hace mnima en w M x .

Verificacin: La variable x asume los valores: 20, 30 y 40; su media es: x = 30

Si consideramos las diferencias al cuadrado con respecto a la media que


es 30, y las sumamos, obtenemos:
Scx = (20 - 30)2 + (30 - 30)2 + (40 - 30)2 = 200

Si consideramos las diferencias al cuadrado respecto de un valor cual-


quiera de la variable, por ejemplo 20, y las sumamos obtenemos:
( x - 20)2 = (20 - 20)2 + (30 - 20)2 + (40 - 20)2 = 500

Si esto se repite para cualquier valor distinto de la media que se halle


ubicado dentro del recorrido de la variable (entre 20 y 40), la suma ser
mayor que 200; ya que la Media Aritmtica minimiza la suma de cua-
drados: SCx

Esta propiedad permite medir la dispersin, considerando los desvos respecto


de la media aritmtica, como se ver ms adelante.

La Media Aritmtica de las medias de k submuestras, se obtiene como


la Media Aritmtica ponderada de las medias de las submuestras,
siendo sus ponderaciones los tamaos de las respectivas submues-
tras.

n1.M x1 n2 .M x2 ... nh .M xh
M x
n
83
Donde, n1, n2,..., nh son los tamaos de las h submuestras en las que se divide la
muestra de tamao n.

Esto significa que, al considerar una muestra dividida en submuestras y cono-


cer la media de la variable en estudio para cada una de ellas, la media total ser
la media ponderada de las medias de las submuestras.
Para demostrarlo:

Consideremos que la suma de todas las observaciones de la muestra de n ele-


mentos deber coincidir con la suma de los elementos de las submuestras:

n n1 n2 nh
xi x1i x2 i ... xhi
i 1 i 1 i 1 i 1

Multiplicamos y dividimos el primer trmino por n y multiplicamos y dividi-


mos cada trmino del segundo miembro por los respectivos tamaos n1, n2, . . . ,
nh:
n n1 n2 nh
xi x1i x2 i xhi
i 1 i 1 i 1 i 1
n n1 n2 ... nh
n n1 n2 nh
n n1
xi x1i
Dado que M x i 1 y que M x1 i 1 y as sucesivamente, reemplazando
n n1
en (4) por sus iguales:

n.M x n1.M x1 n2 .M x2 ... nh .M xh

Despejando M(x):
n1.M x1 n2 .M x2 ... nh .M xh
M x
n

Ejemplo 2
El ingreso medio de 500 varones es igual a $ 3200 y el ingreso medio de
385 mujeres es de $ 2250, ambos pertenecientes a la misma poblacin,
la media general ser.

(3200.500) (2250.385)
X = 2786.72
885

El promedio es de $ 2786.72.

En estos promedios no debe aplicarse promedio simple a menos que la


cantidad de observaciones de cada submuestra sea la misma.

Si calculamos la media de todas las empresas de la base indus-


84 trias.idb para la variable porcentaje del costo laboral, el resultado
ser 30,56%, segn lo que observamos en el procesamiento de
Infostat.
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

Aplicando la propiedad f de la media de las k sub muestras, a los resulta-


dos presentados en Tabla 1 para cada rama de actividad se llegar al mismo
resultado: 30,56%

Comprobemos este resultado y observemos que si se calcula la media


aritmtica sin considerar los tamaos de cada muestra, el resultado obviamente
no coincide pero adems no es correcto debido a que no se est tomando como
suma de los valores del costo, el que corresponde a las 141 industrias de la
muestra. El clculo correcto se muestra en la siguiente tabla.

Tabla 2. Media de variable porcentaje de costo laboral (propiedad f).

n
Rama ni xi nixi
de actividad i 1
1 17 32,18 547,06 La media aritmtica de la mues-
2 15 34,2 513 tra ser:
3 14 33,21 464,94
n
4 11 18,36 201,96
5 14 32,86 460,04 ni xi
6 10 27,1 271 i 1 4309,17
x 30,56
7 15 29,33 439,95 n 141
8 17 28,9 491,3
9 16 32,31 516,96
10 12 33,58 402,96
Suma 4309,17

Actividad 2
Se ha seleccionado una muestra de pedidos de clientes, realizados en febre-
ro/2015, a una empresa que fabrica un bien X y se ha registrado la cantidad
de unidades solicitadas de dicho bien:

12 10 14 25 16 25 16 27 18 30 20 30 50 35
85
a) Determinar el valor de la media aritmtica (M) y de la mediana (Me) y
escriba una interpretacin de sus resultados (sin decimales).

b) El encargado de compras de la empresa considera muy importante el


promedio de la demanda para planificar los pedidos de insumo para fa-
bricacin, sin embargo la media es un punto de equilibrio en relacin al
cual habr valores de la demanda inferiores y mayores a l.
Para comprender una mejor comprensin de la idea de equilibrio a que
nos referimos, verifique la propiedad de media aritmtica:
xi M(x ) 0

c) Si para el mes de marzo se espera que todos los clientes soliciten 4 uni-
dades ms del bien X con respecto a los pedidos de febrero, cul se-
ra el valor de la media aritmtica en el mes de marzo?

d) En otra situacin, si para el mes de marzo se espera que todos los clien-
tes reduzcan en un 15 % el nmero de unidades del bien X solicitadas
con respecto a febrero, cul sera el valor de la media aritmtica en el
mes de marzo?

Actividad 3
La Encuesta Permanente de Hogares, ha permitido relevar informacin respecto
de mltiples aspectos econmicos y sociales de los habitantes del pas.

Considerando una porcin reducida de esa informacin para fines meramente


didcticos, supongamos que Afip pretende analizar los salarios de trabajado-
res por tipo de actividad.

Tomando las categoras patrn o empleador y cuenta propia, los valores regis-
trados para una muestra de individuos en categora patrn o empleador y cuen-
ta propia. Recordemos que en la EPH se registra el sueldo de cada jefe de hogar,
considerando como tal el ingreso mensual y por otra parte se consulta al indivi-
duo, la categora ocupacional a la que pertenece, es decir patrn o empleador,
empleado en relacin de dependencia, cuenta propia, etc. En la Tabla 3 se pre-
sentan los sueldos de los entrevistados con categoras patrn y cuenta propia.

Tabla 3. Datos sueldo de categoras patrn y cuenta propia.

SUELDO
SUELDO
Patrn o
Cuenta propia
empleador
1200 780 890
480 870 240
1300 760 650
2200 1200 900
2100 650 850
1500 1800 650
370 240 300
1400 2100 780
970 380 560
240 320
320

86
Se le solicita a UD, que:

a) Indique la cantidad de personas que forman cada categora.


b) Calcule el monto total de sueldo para cada categora e interprete el va-
lor.
c) Calcule el promedio de cada categora, interprete y compare ambas ca-
tegoras.
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

d) Se conoce que el ndice de inflacin para el ltimo trimestre es de 0,20,


calcule el sueldo promedio con efecto inflacionario. (Aplique propieda-
des).
e) Suponga que se incrementa el sueldo en 50$ para cada persona en ca-
da categora, calcule el sueldo promedio de cada categora despus del
incremento. (Aplique propiedades).
f) Considere que en lugar de incrementar el sueldo en 50$, se incremente
un 18%. Calcule el sueldo promedio de cada categora despus del in-
cremento. (Aplique propiedades).
g) Calcule el sueldo promedio total, es decir el de ambas categoras e indi-
que si es muy diferente de los valores calculados en el tem c. (Aplique
propiedades).

1.2 Mediana Para obtener la mediana:

- Se ordenan los valores.


- Se determina el punto central
La Mediana es el valor central de los valores de una variable ordenada de u orden de la serie al que lla-
acuerdo a su magnitud, por lo tanto ser el valor de la variable que supera a no mamos o y se calcula como:
ms de la mitad de las observaciones de la variable, y es superada por no ms (n + 1) / 2.
de la mitad de las observaciones de la variable. - Se ubica dicho punto y el
valor de la variable correspon-
diente al mismo, que simboli-
zamos como xo, es la Mediana,
Visualizando en la siguiente imagen los datos de la estatura de 11 personas es decir: xo = Me(x).
comprenders mejor el significado de la definicin.
Adems debemos considerar
las siguientes situaciones:
ESTATURA
1,6 - Si la cantidad de datos de la
1,52 serie es par, este valor se de-
1,66 Los valores de la variable estatura se encuentran des-
termina como el promedio
1,68 ordenados. Si los ordenas de menor a mayor, los valo-
simple de los dos valores cen-
1,69 res de la variable se ubicarn como se muestra a conti-
trales.
nuacin, por lo que el valor central es de 1,64. La me-
1,66 - Si la cantidad de datos de la
diana, el valor que supera a los 5 valores de la variable
1,64 serie es impar, el valor de la
ubicados a la izquierda y que es superado por los otros
1,48 Mediana es directamente el
5 valores ubicados a su derecha.
1,61 valor central.
1,66
1,62

1,48 1,52 1,6 1,61 1,62 1,64 1,66 1,66 1,66 1,68 1,69

Por qu la media es de 1,62 y la mediana es de 1,64? A qu se debe esta dife-


rencia?

Esta medida se calcula despus de ordenar los datos de la variable y ubi-


car el centro de esa serie ordenada, razn por la cual su clculo no involucra los
valores individuales en una operacin, sino que se determina localizando el va-
lor central en la serie ordenada. 87
Esto hace que sea una medida especialmente til en distribuciones con
valores extremos o atpicos debido a que la Media Aritmtica en este tipo de
distribuciones pierde representatividad, tal como se vio previamente.
1.2.1 Propiedad de la Mediana

La suma del valor absoluto de las diferencias entre los valores de la variable y su
Mediana, es mnima.

Al igual que la media aritmti- n


ca, la mediana, es una medida xi Me (x) mnimo
que minimiza la suma de dis- i 1
tancias calculadas entre los
valores de la variable y la me- Como veremos ms adelante, esta propiedad es utilizada para determinar
diana, lo que responde a resol- una medida de distancia entre los valores de la variable y su valor central, de
ver el mnimo relativo de la
funcin suma del valor absolu-
modo que podamos analizar la dispersin de esos valores en situaciones donde
to de los desvos, que se detalla la media aritmtica no es representativa.
a continuacin y cuya demos-
tracin obviaremos.
Ejemplo 3
En columna se observan los valores de la variable porcentaje del costo
laboral ordenados de menor a mayor.

El orden o = (n + 1) / 2 = 12 / 2 = 6, (orden 6).


La mediana es el valor de la variable ubicado en el orden 6
Me(x)= 20

Costos laboral / Costo total


Rama 4
3
7
10
10
15
20
20
22
25
30
40

Cabe mencionar que en el caso del ejemplo 2, el tamao de la muestra es


un nmero impar, por lo que la ubicacin de la mediana corresponde a un n-
mero entero, (o = (n + 1) / 2 = 12 / 2 = 6, (orden 6)). No obstante si el tamao
de la muestra es un nmero par, el orden ser decimal con 5 dcimas, en con-
secuencia la mediana ser el promedio de los valores centrales.

Utilizando Infostat, se procesaron los datos de la variable porcentaje


del costo laboral /costo total para las 10 ramas de actividad, calcu-
lando la mediana.
88
A continuacin se muestra el cuadro de dilogo utilizando Infostat y los resulta-
dos se presentan en la Tabla 4 (Ver instrucciones de Infostat).
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

89
Tabla 4. Mediana por rama de variable porcentaje del costo laboral.

Consideremos ahora el clculo de la Mediana a partir de una tabla de fre-


cuencias. Volviendo a nuestro ejemplo Encuesta a alumnos (base alumnos.idb)
en la tabla siguiente se presentan las frecuencias de la variable materias aproba-
das. La mediana ser el valor que ocupe el lugar 83,5, es decir el promedio sim-
ple entre los valores que ocupan el lugar 83 y 84. Para determinar qu valores
son, necesitamos las frecuencias absolutas acumuladas.

Tabla 5. Frecuencias de variable materias aprobadas.

MATERIAS
ni Ni
APROBADAS
0 22 22
1 32 54
2 48 102
3 37 139
4 21 160
5 6 166
Total 166

La frecuencia absoluta igual a 102, indica que desde el valor de la variable


que ocupa el lugar 55 hasta el 102 corresponde a 2. Como los lugares que
buscamos estn en ese rango, concluimos diciendo que la Me = 2 materias
aprobadas.

1.3 Modo

El Modo o Moda es el valor de la variable que se presenta ms frecuentemente.

Esto significa que debemos observar los valores de la variable y determi-


nar el valor que ms veces se repite, para lo cual podemos trabajar con serie
90 simple si tenemos pocos valores de la variable o con distribucin de frecuencias
si la cantidad de observaciones es grande, en cuyo caso la mayor frecuencia
absoluta indicar cul es el valor modal o modo.

Las distribuciones pueden ser: uniformes, unimodales, bimodales o mul-


timodales. Las distribuciones uniformes son aquellas que no tienen valor modal,
es decir ningn valor de la variable se repite ms veces que los dems, todos se
repiten con igual frecuencia; las unimodales son aquellas distribuciones que
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

tiene un solo valor modal, las bimodales tienen dos valores que se repiten ms
veces que los dems y las multimodales tienen ms de dos valores modales.

En la siguiente ilustracin se puede observar la caracterizacin de cada


medida de posicin.

Otro criterio para calcular el modo en distribuciones de intervalos


se basa en definir el intervalo que corresponde a la mayor frecuencia,
llamado intervalo modal, y considerar que la marca de clase representa
el valor de la variable que se presenta ms veces.

Por ltimo, podemos determinar el modo grficamente con el his-


tograma de frecuencias, marcando en el rectngulo ms alto el valor
modal por interpolacin.

Ahora le proponemos observar en el archivo industria.idb la va-


riable rama de actividad codificada de uno a diez. El valor modal ser el
cdigo de variable uno, al que le corresponde una frecuencia de 19 ob-
servaciones, la mayor de las frecuencias que se presentan en Tabla 6.

Tabla 6. Frecuencias de variable rama de actividad.

Frecuencias absolutas
rama Total Porcentaje
1,00 19 12,84
2,00 16 10,81
3,00 14 9,46
4,00 11 7,43
5,00 15 10,14
6,00 10 6,76
7,00 17 11,49
8,00 17 11,49
9,00 16 10,81
10,00 13 8,78
Total 148 100,00

Cabe aclarar que en Infostat no est la posibilidad de calcular el modo


como medida descriptiva en el resumen de medidas. Es por esa razn que se
analiza la tabla de frecuencias para determinar el valor modal.

91
Actividad 4
Con los datos de la Tabla 7, correspondientes a la produccin en unidades de 7
mquinas de una empresa observadas en dos turnos:
Tabla 7. Unidades Producidas Por Mquina

Turno 1 12 14 16 16 18 20 50
Turno 2 10 25 25 27 30 30 35

a) Calcule media, mediana y modo e interprete cada medida.

b) Compare resultados indicando en que turno la media aritmtica es ms


representativa.
n
c) Compruebe las propiedades: (xi x )2 min imo y
i 1
n
xi Me( x ) min imo para ambos turnos, compare
i 1

Actividad 5
Examinando los registros de cuentas mensuales de una empresa que vende
libros por correo, el auditor toma una muestra de 12 de esas cuentas no paga-
das. Los montos de deudas registradas se muestran en tabla 8:

Tabla 8. Valor monetario de cuentas no pagadas

$7 $7 $10 $10 $10 $15


$20 $25 $26 $30 $32 $37

a) Cul es la naturaleza de la variable que estamos analizando?

b) Calcule la media, mediana y modo.

c) Marque las medidas de posicin en el grfico 2, e indique que otros gr-


ficos puede realizar para mostrar el comportamiento de la variable.

Grfico 2
Variable valor de cuentas no pagas

HISTOGRAMA VALOR DE CUENTAS NO PAGAS

0,44

0,33
frecuencia relativa

0,22

0,11

0,00
7 15 22 30 37
92
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

1.4 Medida Geomtrica

La Media Geomtrica de un conjunto de n valores positivos de una variable, es la raz


ensima del producto de los n valores.

Mg( x ) n ( x1 )( x2 )...( xn )

Esta medida de posicin es til para encontrar el promedio de porcentajes, razo-


nes, ndices o tasas de crecimiento.
En distribucin de frecuencias es:

Mg( y ) n
y1n1 .y 2n2 ...y knk

Ejemplo 4
Los rendimientos anuales, en porcentaje, de cuatro acciones de empre-
sas multinacionales son: 4.91, 5.75, 9.13, 20.86.

La media geomtrica es:

Mg(x) 4 (4.91)(5.7 5)(9.13)(20.86) 8.56

Esta medida de posicin tambin es til para calcular tasas de crecimien-


to promedio a partir de los valores de la variable. Un ejemplo de esto es:

Ejemplo 5
Se quiere calcular la tasa promedio de crecimiento del PBI contando con
informacin de los ltimos 5 aos:

PBI : 200 245 279 300 326

Llamemos r a la tasa que buscamos

La media geomtrica es:

Mg( x ) n ( x1 )( x2 )...( xn ) 4 ( 200


245
)( 279
245
)( 300
279
)( 300
326
) 4 326
200
1.129

Lo que obtuvimos es el relativo promedio es decir (1 + r), si necesitamos la tasa


de variacin promedio ser: (1+r) 1, para el ejemplo 0.129, que en trminos porcentua-
les es el 12,9%

En conclusin para calcular tasa promedio de crecimiento:

Valor final 93
r n
valor inicial
1
1.4.1 Propiedades de la Medida Geomtrica

a) La Media Geomtrica no se podr aplicar cuando algn valor de la va-


riable asuma el valor cero, debido a que el producto ser cero.

b) La Media Geomtrica no se podr aplicar cuando el producto de los va-


lores de la variable sea negativo y la cantidad de observaciones sea un
nmero par, dado que el resultado de esta operacin ser un nmero
imaginario.

c) El logaritmo de la Media Geomtrica es igual a la Media Aritmtica de


los logaritmos de los valores de la variable.

Log Mg(x) = M(logx)

Aplicando la propiedad que establece que el logaritmo de un producto de


nmeros, es igual a la suma de los logaritmos de los nmeros, queda:

n
Log Mg(x) log(n (x 1 )(x 2 )...(x n ) ) 1 log x i M(log x)
n
i 1

1.5 Medidas de posicin no central

Las medidas de posicin no central son llamadas fractiles o cuantiles dentro de


los que encontramos, como los ms utilizados:

cuartiles
deciles
percentiles

La r-sima fractila o cuantil de orden s, se define como el valor de la


variable que supera a no ms de una fraccin de r/s observaciones y es
superado por no ms de 1-r/s observaciones y se simboliza como P(r/s).

Se determinan dividiendo la distribucin en partes simbolizadas como


r/s, donde s es el total de partes, tales como cuartos, decenas o centenas y
r representa el numerador de la fraccin e indica el orden de la fractila o cuan-
til. Su concepto es similar al de la Mediana pero trasladado a fracciones diferen-
tes.
Por ejemplo la fractila de orden tres en un total de diez partes, es el valor
de la variable que supera a no ms del 3/10 del total de las observaciones y es
superado por no ms del 7/10 del total de las observaciones y la simbolizamos
como P(3/10). No obstante lo mencionado, para los casos en que la distribucin
se divide en cuatro, diez y/o cien partes, las fractilas se denominan cuartiles,
deciles y/o percentiles respectivamente, en consecuencia para el ejemplo dado
el valor P(3/10) equivale al Decil de orden 3 que se simboliza como: D3.
94
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

1.5.1 Cuartiles

Si consideramos la variable x representada en el eje numrico, se tiene

25% 25% 25 % 25%


Variable x
Vm Q1 Q2 Q3 VM

Donde las expresiones Vm y VM indican el mnimo y el mximo valor que


asume x, respectivamente.

Considerando sobre un eje los valores de la variable, podemos subdividir


su recorrido en cuatro partes y obtener los cuartiles.

Por lo tanto, su determinacin se har como sigue:

a) ordenando los valores de la variable de acuerdo a su magnitud.


b) determinando el orden de cada cuartil:

o1 = 1/4 (n + 1) -> Q1 = x o1

o2 = 2/4 (n + 1) -> Q2 = xo2 Me

o3 = 3/4 (n + 1) -> Q3 = x o 3

Q1, ser el valor de la variable que supera a no ms del 25% de las obser-
vaciones y es superado por no ms del 75% de las observaciones de la variable.
De igual modo con los otros dos cuartiles.

Los deciles y percentiles se calculan de la misma forma, pero teniendo en


cuenta la fraccin r/s. Estas medidas se utilizan para estudiar el comportamien-
to de la variable cuando la misma contiene valores atpicos que afectan la re-
presentatividad de la media aritmtica.

Ejemplo 6
Para obtener los cuartiles se ordenan de menor a mayor los valores de
la variable porcentaje del costo laboral para la rama 4:

Costos laboral / Costo total


Rama 4
3 o1 = 1/4 (n + 1) = 1/4 (11) = 2.75 -> Q1 = x 3 = 10
7
10 o2 = 2/4 (n +1) = 2/4 (11) = 6 -> Q2 = 20 -> Me
10
15 o3 = 3/4 (n + 1) = 3/4 (11) = 8.25 -> Q3 = x 8 = 22
20
20 95
22
25
30
40

Aqu estamos redondeando el orden a 8, otra forma puede ser tomar el


promedio de los valores correspondientes al orden 8 y 9.
La interpretacin de estos resultados tiene que ver con su definicin, el
cuartil uno ser el valor de la variable (porcentaje del costo laboral) para el cual
habr un 25% de empresas cuyo porcentaje es hasta 10, en tanto que en el 75%
restante el porcentaje es superior. De igual forma se interpretan los cuartiles
dos y tres. Ms adelante veremos que con estas medidas podemos confeccio-
nar un diagrama llamado diagrama de caja y brazos que nos permitir visualizar
el comportamiento de la variable y determinar su asimetra.

Hasta este punto se ha desarrollado el clculo e interpretacin de todas


las medidas de posicin para la variable porcentaje del costo laboral para las
141 empresas de la muestra

Utilizando Infostat, se procesaron los datos de la variable porcentaje


del costo laboral/costo total obteniendo las medidas de posicin y
los cuartiles.

96

Se observa que el porcentaje promedio es de 30%, es decir que en pro-


medio el costo laboral por empresa representa el 30% del costo total y que
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

coincide con la mediana, lo que anticipa que la distribucin est centrada en la


media y que es simtrica.
Los cuartiles uno y tres concentran el 50% de los valores de la variable,
quedando un 25% de observaciones por debajo del cuartil 1 y otro 25% de ob-
servaciones por encima del cuartil 3.

Actividad 6
Retomando la actividad 2, en la que se ha seleccionado una muestra de pedidos
de clientes, realizados en febrero/2015, a una empresa que fabrica un bien X
y se ha registrado la cantidad de unidades solicitadas de dicho bien.

a) Calcule la mediana y compare el valor de esa medida con el valor calcu-


lado de la media aritmtica, de haber diferencia explique brevemente
cual puede ser la causa de la misma.

b) Se pretende adems determinar la cantidad mxima de pedidos del


25% de los clientes que menos demandan y la cantidad mnima deman-
dada del 25% de los clientes que ms cantidad de pedidos realizaron en
la muestra. Interprete cada valor calculado

c) Qu porcentaje de clientes se encuentran entre los dos valores calcu-


lados en b?.

Actividad 7
En relacin a la Actividad 5, referida a montos de 12 cuentas no pagadas por
venta de libros. Se le solicita que:

a) Calcule los cuartiles y marque en el histograma del grfico 2 los valores


calculados sobre el eje que corresponda.

b) Analice las medidas marcadas en el grfico indicando las caractersticas


observadas respecto del comportamiento de la variable. Considere el
concepto de cada medida para interpretar adecuadamente.

2. Medidas de dispersin

La dispersin es una medida de distancia entre los valores individuales de la


variable y una medida de posicin central o entre medidas de posicin no cen-
tral. Es por ello que hay medidas de dispersin que estudian la concentracin en
torno a un punto y otras que estudian rango o recorrido.

97
2.1 Varianza

Dentro de las medidas de dispersin la ms importante es la Varianza,


dado que mide en el numerador de la frmula, la distancia total mnima entre
los valores de la variable y su media aritmtica, considerada al cuadrado.
Al hablar de distancia mnima estamos refirindonos a la suma del cua-
drado de las diferencias entre los valores de la variable y su media, mnima por
la propiedad de la media aritmtica que se refiere a la suma del cuadrado de los
desvos respecto de la media. Esto indica que a mayor distancia total, habr
mayor dispersin o heterogeneidad en los valores de la variable. La medida se
calcula mediante el promedio o media de la suma de los desvos al cuadrado
respecto de la media aritmtica.
Digamos entonces que es una medida adecuada de dispersin, en distri-
buciones de variables cuantitativas en las que la media aritmtica es represen-
tativa.

En sntesis, la definicin es:

Media aritmtica del cuadrado de los desvos entre los valores de la variable y
su media.
N
2
Parmetro (x i
2 i 1
N

2.1.1 Frmula de clculo

Si el numerador del segundo miembro de la igualdad anterior es resuelto


mediante el desarrollo del cuadrado del binomio que el mismo representa, se
tiene la siguiente frmula con la que tambin se puede calcular la Varianza.

N N N 2
2
xi xi2 xi
2 i 1 i 1 i 1

N N N

Si desarrollamos el cuadrado del binomio:


N N
2
xi (xi2 2 xi 2
)
2 i 1 i 1 i 1

N N

Considerando slo el trmino:


2
2 x i 2N 2N N
xi
i 1
N xi
N

Introduciendo sumatorio en cada trmino del desarrollo del cuadrado del


binomio queda:
N N
2
xi x i2 2N 2
N 2

2 i 1 i 1

N N

98 Llegamos a la frmula alternativa del clculo de la varianza:

2 2
x2
( x)

Esta frmula suele ser ms simple para el clculo manual.


Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

2.1.2 Varianza de la muestra

En el caso de muestras, la Varianza se calcula con una correccin cuyo


significado tiene que ver con conceptos ms avanzados de muestreo que no se
abordan en esta asignatura.

Su frmula es:
n n

Estadstico (x i x) 2 x i2 nx 2
s2 i 1 i 1
n 1 n 1

Para la variable porcentaje del costo laboral que fue utilizada en ejemplos
anteriores utilizando el software Infostat, se calcularon las medidas de
dispersin.
Nuevamente con el men estadsticas se abre una ventana en la que se
debe asignar la variable y se solicita el clculo de las medidas necesarias.

99
Medidas de
dispersin

Ejemplo 7
Consideremos una rama de actividad, papel e impresiones, para el
clculo de la varianza mediante hoja de clculo Excel, de la variable por-
centaje del costo laboral:

Para una mejor comprensin X (x-M(x)) (x-M(x))^2


del significado del trmino
25 6,64 44,04
dispersin en el entorno de las
medidas descriptivas, se sugie- 7 -11,36 129,13
re a ingresar a la seccin Mate- 40 21,64 468,13
riales Recursos del aula virtual
15 -3,36 11,31
para ver dos audiovisuales que
explican el trmino. 20 1,64 2,68
20 1,64 2,68
10 -8,36 69,95
22 3,64 13,22
30 11,64 135,40
10 -8,36 69,95
3 -15,36 236,04
202 1182,55

n
(x i x) 2
1182.55
s2 i 1
118,25
n 1 10

La varianza de la muestra de empresas de la rama papel e impresiones es


118.25 %2 del costo laboral. La medida representa la distancia promedio al cua-
100 drado calculada respecto de la media, es por ello una medida de valores de dis-
tancia al cuadrado.
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

2.1.3 Propiedades de la varianza

La varianza de una variable es una cantidad no negativa.

V(x) 0

Esto se debe a que en su clculo se toman los valores de la variable al cuadrado.

La varianza de una constante es cero

V(c) = 0
c: constante
Si xi = c y M(x) = c, entonces:
k
2
c c ni
i 1
V( x ) 0
n

lo que indica que no hay variabilidad alguna.

Verificacin:
Si x: 4, 4. 4
La media es 4 y la varianza:
3
(x i x)2
i 1 (4 4) 2 (4 4) 2 (4 4) 2
0
2 2

La varianza una constante por una variable es la constante al cuadrado


por la varianza de la variable

V(c . x) = c2 V(x)
c: constante

Si la variable es ahora cx y la media es la constante por la media de la variable,


entonces:
k
2
c.xi c.M x ni
i 1
V( c.x )
n
k 2
c xi M x ni
i 1

n
k
2 2
c xi M x ni
i 1

n
k
2
xi M x ni
2 i 1
c .
n

Verificacin 101
Si x: 4, 5.6
La media es 5 y la varianza:
3
(x i x)2
i 1 (4 5) 2 (5 5) 2 (6 5) 2
1
2 2
Pero si a x la multiplicamos por 2
X: 8,10,12 La media es 10 y la varianza:
3
(x i x)2
i 1 (8 10) 2 (10 10) 2 (12 10) 2
4
2 2

Lo que equivale a:
V(c. x) = c2 V(x) 22 .1 = 4

La varianza de la suma de una constante ms una variable es la varian-


za de la variable.

V(c + x) = V(x)
c: constante

Es decir la variabilidad de los datos no se modifica cuando se suma un es-


calar a la variable.

Demostrando para el caso en que sumo la constante (igualmente vlido


en caso de restarla):
k
2
xi c M( x ) c ni
i 1
V( x c)
n

Eliminando parntesis en la base de la potencia del numerador del segun-


do trmino:
k
2
xi c M( x ) c ni
i 1
V( x c)
n
k
2
xi M( x ) ni
i 1
V( x c)
n
V( x c ) V x

Actividad 8
Verifique la propiedad para un aumento constante de 3 unidades en una varia-
ble x con valores 4,5 y 6.

102 2.2 Desviacin estndar

Esta medida de dispersin est asociada totalmente a la Varianza.


Se define como: la raz cuadrada positiva de la Varianza.
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

N n
2
(xi (xi x)2
DS(x) i 1 i 1
DS(x) s
N n 1

Esta operacin algebraica nos permite expresar el resultado en las mis-


mas unidades que la variable por lo tanto su interpretacin es ms fcil de reali-
zar.

Para la variable porcentaje del costo laboral de las 141 empresas la des-
viacin estndar es:

2
213.98 14.63 %

Considerando a la Media Aritmtica con un valor de 30,56 %, podemos


concluir que en este caso y atendiendo a la naturaleza del problema hay baja
dispersin o, en otros trminos, los datos estn concentrados en torno a la me-
dia, se hallan a poca distancia de sta, lo que indicara que son homogneos.

2.3 Coeficiente de variacin

Es una medida relativa de dispersin que se calcula como el cociente en-


tre la Desviacin Estndar y la Media Aritmtica.

Se utiliza fundamentalmente cuando se pretende comparar, en cuanto a


su dispersin, distribuciones expresadas en diferentes unidades de medida,
mostrando cul de ellas presenta menor dispersin mayor concentracin o
bien, datos ms homogneos respecto de su media, lo que en definitiva confir-
ma la representatividad del promedio calculado para esos datos.

DS( x )
CV( x )
M( x )

Si se multiplica por 100 se expresa como porcentaje e indica obviamente


el porcentaje de dispersin de la variable en torno a su media.

En el ejemplo de porcentaje de costo laboral, el coeficiente de variacin


ser

s 14,63
CV= 0.4786
y 30,56

El valor del coeficiente de variacin puede multiplicarse por 100 para ex-
presarlo en porcentajes e interpretar que la dispersin relativa del porcentaje
del costo laboral en torno a la media es 47.86%, lo que refleja una dispersin
inferior al 100%. Adems de este anlisis, la relevancia de la medida radica en
que es abstracta lo que la hace prescindir de unidad de medicin, permite com-
parar variables expresadas en distintas unidades de medicin, indicando cul es
la variable que presenta datos ms homogneos para el caso en el CV sea me- 103
nor.
Actividad 9
Retomando la actividad 2, en la que se ha seleccionado una muestra de pedidos
de clientes, realizados en febrero/2015, a una empresa que fabrica un bien X
y se ha registrado la cantidad de unidades solicitadas de dicho bien.

a) Calcule el recorrido. Emita una opinin respecto del valor calculado.

b) Calcule la varianza y desviacin estndar de la variable. Emita una opi-


nin sobre cada medida en relacin al comportamiento de la variable.

c) Calcule la desviacin estndar si para el mes de marzo se espera que


todos los clientes soliciten 4 unidades ms del bien X con respecto a
los pedidos de febrero.

d) En otra situacin, si para el mes de marzo se espera que todos los clien-
tes reduzcan en un 15 % el nmero de unidades del bien X solicitadas
con respecto a febrero, cul sera el valor de la varianza en el mes de
marzo?

Actividad 10
En relacin a la actividad 3, en la que se ha relevado el sueldo del entrevistado
de la encuesta permanente de hogares para las categoras patrn y cuenta pro-
pia, se le solicita a Ud. que:

a) Calcule el rango para cada categora y analice el significado del valor.

b) Calcule la varianza, desviacin estndar de cada categora y emita una


opinin en relacin al significado de estos valores.

c) Calcule el coeficiente de variacin de cada categora interprete cada va-


lor comparando las distribuciones.

d) Suponga que se incrementa el sueldo en 50$ para cada persona en ca-


da categora, calcule la varianza del sueldo de cada categora despus
del incremento. (Aplique propiedades).

e) Considere que en lugar de incrementar el sueldo en 50$, se incremente


un 18%. Calcule la desviacin estndar del sueldo de cada categora
despus del incremento. (Aplique propiedades).

f) Para los tem d y e, explique el efecto que produce el cambio en la varia-


ble, sobre el coeficiente de variacin.

2.4 Recorrido y Recorrido Intercuartil

El recorrido es la diferencia entre el valor mximo y el mnimo de la variable.

104 Se basa en la distancia o rango de los valores y no en una concentracin


en torno a un punto. Permite interpretar que la dispersin es alta en la medida
que los valores de la variable tengan amplio rango de variacin, en consecuen-
cia, al no considerar en el clculo todos los valores de la variable, es afectada
por valores extremos y, de este modo, menos precisa que la varianza.

R = VM - Vm
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

El Recorrido Intercuartlico es una medida de dispersin til para determinar la


concentracin del 50% central de los datos.

Se calcula mediante la diferencia entre el tercer y primer cuartil. Se aplica especialmente en


control de calidad estadstico,
para confeccionar cartas de
RI = Q3 Q1
control de variables cuantitati-
vas en procesos productivos
Es una de las medidas que analizan la dispersin en base al rango de los como por ejemplo cuando se
valores considerados en el clculo, por lo que no tiene en cuenta a todos los analiza si la produccin de una
valores de la variable. pieza, en cuanto a sus dimen-
siones, cuenta con una variabi-
lidad que responde a los estn-
dares de variabilidad del pro-
3. Diagrama de caja y brazos ducto y no est en riesgo de
producir defectuosos.
Esta representacin es confeccionada con la mediana y los cuartiles. Con-
siste en marcar sobre un eje real los valores de la variable, el que puede ser po- Es el caso donde mediante una
sicionado en forma horizontal o vertical (Infostat hace diagramas de caja y bra- muestra de 5 unidades, en las
zos verticales). que tomamos el dimetro de
cada pieza, la diferencia entre
el mayor y menor dimetro
Con los cuartiles se forma una caja cuyos lados son el cuartil 1 y 3 y la
ser el rango, tomando una
mediana se marca en el interior de la caja, la que representa la distribucin del determinada cantidad de
50 % central de los datos. A ambos lados de la caja quedan los brazos, los que muestras podremos ver en qu
determinan en definitiva si hay deformaciones horizontales. forma se modifica el rango y
Para construir los brazos se utiliza una regla emprica utilizando el Reco- habr un indicio de la variabili-
rrido Intercuartlico, definiendo dos lmites: lmites internos y externos. Estas dad del proceso, obviamente
barreras permiten establecer un criterio para decidir si los valores extremos de mientras mayor valor asume el
una variable son atpicos o extremadamente atpicos en relacin a los dems. rango, ms riesgo habr de
producir fuera de los estnda-
Los Lmites Internos, al interior del cual se consideran valores normales res establecidos.
de la variable, son determinados a una distancia de 1.5 veces el recorrido inter-
cuartil, respecto a los cuartiles primero y tercero respectivamente.

[ Q1 - 1,5 RI ; Q1 + 1,5RI ] = [LIO ; LSO]

Cuando existen valores de la variable que estn fuera de las barreras in-
ternas significa que esos valores son alejados de los ms homogneos y se pue-
den considerar como atpicos, comnmente identificados en las salidas de los
software con una letra O, por su designacin en ingls, Outliers.

105

Cuando esos valores estn muy alejados son considerados extremos, los
que se identifican calculando los llamados lmites externos.
Los Lmites Externos se calculan a una distancia de 3 veces el recorrido
intercuartil respecto a los cuartiles primero y tercero.

[ Q1 - 3 RI ; Q1 + 3RI ]= [LIE ; LSE]

Los valores de la variable que quedan entre los lmites internos y externos
se consideran valores atpicos. Cuando existen valores de la variable que estn
fuera de las barreras externas significa que esos valores son muy alejados de
los ms homogneos y se pueden considerar como extremadamente atpicos.
Generalmente en las salidas de computacin estos valores son marcados con
un asterico o con la letra E.

La siguiente ilustracin muestra el diagrama de caja y brazos para dife-


rentes tipos de distribuciones.

Observamos que en la distribucin N 1 ambos brazos son iguales y la


mediana se ubica en el centro de la caja. Veremos ms adelante que estas dis-
tribuciones son llamadas simtricas respecto de su forma, mientras que en la
distribucin N 2 el brazo derecho es mayor que el izquierdo y, opuestamente
106 en la distribucin N 3 el brazo izquierdo es ms largo que el derecho. Estas dos
ltimas distribuciones se definen respecto de la forma como asimtricas dere-
cha e izquierda respectivamente.

Tambin podemos analizar la dispersin, ya que el tamao de la caja re-


presenta la amplitud intercuartil y por ende determina la concentracin o dis-
persin del 50% central de los valores de la variable.
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

Por lo tanto, si la caja es ms ancha indicar que ese conjunto central de


observaciones de la variable es ms disperso. La lnea que se ubica dentro de la
caja indica la posicin de la Mediana.

En los siguientes grficos se presenta el diagrama de cajas y brazos


de la variable Porcentaje del costo laboral obtenidos con Infostat
para la muestra total y para empresas de las ramas 4 y 6 (ver
instructivo de Infostat).

107
Actividad 11

a) Con los datos de la actividad 5, confeccione el diagrama de caja y bra-


zos y emita una opinin sobre el comportamiento de la variable, anali-
zando el diagrama.

b) Explique cmo analiza la existencia de valores atpicos, que significa eso


para la distribucin y determine si para la variable cantidad de pedidos
hay valores extremos o atpicos de demanda.

Actividad 12
En relacin a la actividad 3, en la que se ha relevado el sueldo de dos muestras
de la encuesta permanente de hogares referidas a categoras, patrn y cuenta
propia. Se le solicita a Ud. Que:

a) Confeccione el diagrama de caja y brazos para la variable sueldo en ca-


da muestra y analice el comportamiento de la variable, comparando
ambas situaciones.

b) Explique cmo analiza la existencia de valores atpicos, que significa eso


para la distribucin y determine si para la variable cantidad de pedidos
hay valores extremos o atpicos de la variable sueldo en cada muestra.

Actividad 13
El siguiente Grfico muestra los resultados del procesamiento con Infostat, de
la variable peso expresado en kg. de 100 personas adultas:

MEDIDAS DESCRIPTIVAS

n Media Mediana Desv. Est. Min. Max. Q1 Q3


100 65.35 63.50 11.21 47 100 57 72

DIAGRAMA DE CAJA Y BRAZOS

---!---------!---------!---------!---------!---------! peso
50 60 70 80 90 100

a) Marque en el diagrama de caja y brazos: la mediana y los cuartiles e in-


terprete cada medida. Analice.

b) Determine el recorrido intercuartil y emita una opinin respecto del sig-


nificado de este valor en la serie.

108 c) Considera que hay personas con peso atpico en la serie analizada. Jus-
tifique su respuesta.
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

4. Otras medidas
Bajo esta denominacin se incluyen los momentos, medidas de posicin
tiles para calcular las dems medidas de posicin, dispersin y forma antes
mencionadas.

Los momentos pueden ser naturales o centrados.

4.1 Momentos naturales

Los llamados momentos naturales se definen como:

La media aritmtica de la potencia e-rsima de la variable.

'
r (x) M( x r )

Los momentos naturales de orden 0,1,2 son los siguientes:

'
0 (x) M( x 0 ) 1
'
1 (x) M( x1 ) M( x )
' 2
2 ( x ) M( x )

Por lo tanto relacionando el momento natural de orden uno y el de orden


dos obtenemos la varianza de la siguiente forma:

' ' 2 2
2 ( 1)

4.2 Momentos centrados

Los momentos centrados, estn definidos como:

La media de la diferencia entre los valores de la variable y la media aritmtica,


elevada a la potencia e-rsima.

r (x) M( x )r

Los momentos centrados de orden 0,1,2 son entonces los siguientes:

0 (x) M( x )0 1
1 (x) M( x )1 0 por propiedad de Media Aritmtica

(x) M( x )2 2
Varianza 109
2

5. Medidas de forma
Las medidas de forma, al igual que las medidas de posicin y dispersin,
determinan el comportamiento general de la variable.
Se pueden dividir en anlisis de comportamiento horizontal o asimetra, o
bien vertical llamado curtosis.

En cuanto a la asimetra, las distribuciones pueden ser:


Asimtrica derecha
Asimtrica izquierda
Simtrica.

Y en cuanto a la curtosis o puntiagudez:


Leptocrtica
Mesocrtica
Platicrtica

La siguiente imagen muestra la forma para diferentes distribuciones:

a. ASIMETRA b. CURTOSIS

a1. Asimtrica positiva b1 . Leptocrtica

0,24
Frecuencia Relativa

0,09
0,18

Frecuencia Relativa
0,07
0,12
0,05
0,06
0,02
0,00
0,00 3,81 7,62 11,44 15,25 0,00
Variable 3,00 12,25 21,50 30,75 40,00
Variable

a2. Asimtrica negativa. b2. Mesocrtica

0,09
2,46
Frecuencia Relativa
f recuencia relativa

0,07
1,85
0,05
1,23
0,02
0,62

0,00 0,00
0,00 0,25 0,50 0,75 1,00 3,00 12,25 21,50 30,75 40,00
Variable
Variable

a3. Simtrica b3. Platicrtica

0,09
0,16
Frecuencia Relativa
Frecuencia Relativa

0,07
0,12

0,08 0,05

0,04
110 0,02
0,00
-2,25 3,88 10,00 16,12 22,25
0,00
Variable 3,00 12,25 21,50 30,75 40,00
Variable

En la imagen a1 observamos una distribucin asimtrica derecha dado


que la deformacin se produce a la derecha de la misma, tambin observamos
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

que los datos se concentran a la izquierda. En la imagen a2 la distribucin es


asimtrica izquierda con una situacin totalmente opuesta a la de la imagen a1.
En la imagen a3 la distribucin es simtrica lo que significa que los datos se
encuentran distribuidos de manera equitativa a ambos lados de la Media Arit-
mtica.

En lo atinente a la curtosis, se define como el grado de concentracin de Para una mejor comprensin
los valores de la variable en torno al modo, mientras mayor concentracin ms del significado del trmino
puntiaguda se muestra la distribucin tal como se ve en la imagen b1, llamndo- dispersin en el entorno de las
se en este caso Leptocrtica, es Mesocrtica cuando est menos concentrada medidas descriptivas, se su-
giere a ingresar a la seccin
alcanzando una altura media como muestra la imagen b2 y es Platicrtica en el
Materiales Recursos del aula
caso en que los valores de la variable se dispersan hasta alcanzar una forma virtual para ver la produccin
aplanada en la distribucin como se observa en b3 . audiovisual llamada Medidas
de Simetra y Curtosis que
explican el trmino.
5.1 Coeficientes de asimetra

El coeficiente de asimetra se calcula por diversos procedimientos y se


simboliza como CA.

Coeficiente de asimetra de PEARSON, basado en la relacin emprica


entre las medidas de posicin central, permite determinar una medida
relativa de la distancia que se presenta entre ellas cuando la distribu-
cin es asimtrica. Su valor es cero cuando la distribucin es simtrica
en virtud de que las tres medidas son idnticas en este tipo de distribu-
ciones.

Para la poblacin es:


Mo 3( Me )
Ca

Y en caso de ser una muestra es:

x Mo 3( x Me )
Ca
s s

Coeficiente basado en momentos centrados


N
( xi )3
i 1

Ca g1 N 3
3 2
( 2 )3

El coeficiente de asimetra muestral es:


n
( xi x )3
i 1

Ca g1 n
s3
111
El coeficiente de asimetra puede asumir valores mayores, iguales o me-
nores que cero. Si es cero la distribucin es perfectamente simtrica pero si es
positivo es asimtrica positiva o si es negativo asimtrica negativa.
>0 (Asimetra derecha o positiva)
Ca =0 (Simtrica)
< 0 (Asimetra izquierda o negativa)

5.2 Coeficientes de curtosis

Las frmulas ms conocidas para el clculo del coeficiente de curtosis,


simbolizado como Ck son:

Coeficiente basado en los momentos centrados

N
( xi )4
i 1

Ck N 3 4
3
4 2
( 2 )4

El coeficiente de curtosis muestral es:


n
( xi x )4
i 1

Ck n 3
s4

Estos coeficientes pueden asumir valor mayor, igual o menor que cero,
indicando que la distribucin es alta (leptocrtica), media (mesocrtica) y baja
(platicrtica), respectivamente.

Utilizaremos la variable gasto en movilidad mensual de la base


alumnos.idb para realizar los clculos de las medidas de asimetra y
curtosis utilizando Infostat. VER INSTRUCTIVO DE INFOSTAT
Se observa que el coeficiente de asimetra obtenido con la frmula de los
momentos asume el valor 3.6, lo cual significa que la variable tiene asimetra
derecha, esto es porque el valor est por encima del valor 0 que indica un
comportamiento simtrico para la variable. Por otra parte observamos tambin
que la media es mayor que la mediana, y eso se debe a que la media se ve
afectada por los valores de la variable ubicados en el extremo derecho de la
distribucin, que es precisamente donde se produce la cada o deformacin
horizontal.

112
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

Utilizando la frmula de Pearson para calcular el coeficiente de asimetra


se obtiene:

3(189.91 135 )
Ca 0, 67
245.25

El valor 0,67 del coeficiente de asimetra de Pearson indica tambin asi-


metra derecha para la variable. No obstante, cada coeficiente de asimetra cal-
culado segn la frmula que corresponda dar numricamente un valor diferen-
te, pero el sentido de la asimetra como derecha o izquierda ser igual cualquie-
ra sea el coeficiente que utilicemos.

En cuanto a la curtosis, se puede observar que la variable en estudio pre-


senta una distribucin leptocurtica, es decir alta. Debe tenerse en cuenta que
esta medida de forma slo refleja una alteracin en la distribucin debido a la
altura, lo cual en trminos de la variable, estara indicando que la mayor con-
centracin de los valores de la variable tiene una alta frecuencia o en otros tr-
minos un alto porcentaje de valores de la variable estn concentrados en ese
tramo.

Grficamente las dos medidas de forma pueden verse reflejadas en el


histograma de la Grfico 3, donde la ubicacin de las medidas de posicin res-
ponde a la marcada asimetra que la variable presenta. Esto nos lleva a relacio-
nar las medidas de posicin central y las de forma.

Grfico 3
Histograma de la variable gasto en movilidad mensual

113
La distancia entre las medidas de posicin central media, mediana y mo-
do permite establecer si la distribucin es simtrica o asimtrica. En las simtri-
cas las tres medidas coinciden aproximadamente, mientras que en distribucio-
nes asimtricas son diferentes. Estas relaciones se ilustran en las siguientes
imgenes.
Distribucin asimtrica derecha
0,24

Frecuencia Relativa
0,18

0,12

0,06

0,00
0,00 3,81 7,62 11,44 15,25
Variable

Mo < Me < M(x)

Distribucin asimtrica izquierda


2,30
Frecuencia Relativa

1,73

1,15

0,58

0,00
0,00 0,25 0,50 0,75 1,00
Variable

M(X) < Me < Mo

Distribucin simtrica
0,10
Frecuencia Relativa

0,08

0,05

0,03

0,00
0,64 10,32 20,00 29,68 39,37
Variable

M(X) = Me = Mo

Considerando las definiciones de cada medida, vemos que en una distri-


bucin asimtrica derecha el modo est ms cerca del origen del sistema de
coordenadas debido a que es el valor de mayor frecuencia, la mediana estar en
el centro por ser el valor central del conjunto ordenado de valores de la variable,
114 y la media aritmtica se ver afectada por los valores que se encuentran en el
extremo derecho de la distribucin. Igual razonamiento podemos aplicar en
distribuciones asimtricas negativas y simtricas.
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

Actividad 14
Es importante para diagramar actividades, los gastos que las mismas pueden
ocasionar en los bolsillos de los estudiantes, es por eso que se analiza el gasto
en libros y movilidad, utilizando informacin de la base de datos de alumnos.
Idb. Relacione las medidas descriptivas de cada variable y los grficos de caja y
brazos e histogramas para responder lo que se solicita:

a) Analice el valor de las medidas de forma para cada variable y compare


emitiendo una opinin respecto en tal sentido respecto de cada varia-
ble.

b) Relacione su opinin con el diagrama de caja y brazo e indique qu ob-


serva en ese grfico en relacin a la opinin emitida.

c) Analice los histogramas y vincule su anlisis a los tems a y b.

Medidas descriptivas

115
Histogrmas

6. Distribuciones bidimensionales
En las secciones anteriores presentamos el clculo de medidas para des-
cribir una variable. Ahora introducimos medidas que permiten describir num-
ricamente la relacin lineal entre dos variables cuantitativas.

Las distribuciones bidimensionales son las que se refieren al tratamiento


simultneo de dos variables, por ejemplo, estatura y peso de un conjunto de
personas, ingresos mensual y gastos mensuales por familia en un grupo de fa-
milias, rendimiento por hectrea e inversin en fertilizantes, etc.

En estos ejemplos y en todos los que se puedan presentar, lo importante


es saber si esas variables se relacionan o vinculan matemticamente mediante
una funcin lineal, en otros trminos si es factible que logremos una funcin
Para introducirnos en el tema, mediante la cual dando valores a una de las variables estamos generando valo-
se sugiere a ingresar a la sec-
res de la otra estimativamente parecidos a los verdaderos valores que la varia-
cin Materiales Recursos del
aula virtual para ver la produc- ble asume.
cin audiovisual llamada Co-
varianza y Correlacin. Para cumplir ese objetivo utilizaremos la covarianza, que indica si hay
asociacin lineal entre las variables y el coeficiente de correlacin lineal de
Pearson que indica la intensidad o grado de asociacin.

6.1 Covarianza y Coeficiente de Correlacin de Pearson

116
Es una medida de dispersin conjunta entre dos variables cuantitativas que
indica la presencia de asociacin lineal directa o inversa entre las mismas.

La siguiente imagen permite observar la medida vinculada al diagrama de dis-


persin.
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

Se define como:

Cov( x,y ) M (x M( x ))( y M( y ))

n
( xi M( x ))( y i M( y ))
i 1
Cov( x,y )
n

Realizando el producto de los binomios y operando se llega finalmente a


que:

n n n
xi y i xi yi
i 1 i 1 i 1
Cov( x,y ) M( xy ) M( x )M( y )
n n n

Si las variables son independientes entonces la Cov(x,y) es cero. Su rango


de variacin oscila entre infinito negativo y positivo y su significado depende del
signo: si es positivo, la asociacin entre las variables es directa y de lo contrario
es inversa.

Si x,y son independientes Cov (x,y) = 0

Si x,y estn asociados en forma directa Cov (x,y) 0

Si x,y estn asociados en forma inversa

La Covarianza slo nos indica el sentido de la relacin. Para medir el gra-


do de relacin, es necesario calcular una medida estandarizada denominada
Coeficiente de correlacin lineal de Pearson
117
El Coeficiente de correlacin lineal de Pearson mide la intensidad de
asociacin lineal entre las variables. Puede asumir valores entre -1 y 1 y se calcu-
la dividiendo la covarianza por el producto de las desviaciones estndar.

COV ( X ,Y )
r
DS( x ).DS( y )
Cuando el valor del coeficiente de Pearson (r) es 0, indica que no hay
asociacin lineal entre las variables analizadas, si su valor es negativo y prximo
a 1, indica asociacin lineal directa o positiva e intensa en la medida que ms se
aproxima a 1, similarmente si su valor es negativo indica asociacin inversa o
negativa y mientras ms se acerca a 1 ms intensa ser la asociacin lineal.

En la siguiente imagen se puede observar cuatro situaciones extremas de


aplicacin del coeficiente r de Pearson.

Para aclarar este concepto, consideraremos la tasa de desempleo (x) y la


tasa de renuncia (y) para 13 regiones en un momento determinado del tiempo.
Se calcular la covarianza y el coeficiente de correlacin de Pearson y se inter-
pretar su resultado.

Procesando los datos con Infostat se obtienen los resultados de la


matriz de covarianza y la matriz de correlacin.

118
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

Covarianza (x,y)

Coeficiente de
correlacin (x,y)

En base a los resultados obtenidos puede concluirse que hay asociacin


inversa entre las variables analizadas. Esto, en otros trminos, significa que a
medida que la tasa de desempleo aumenta, la tasa de renuncia disminuye. Por
otra parte ante un coeficiente de correlacin de Pearson de -0,82, se interpreta
que la asociacin lineal es intensa. 119
Cuando las variables son dependientes y se aplica la propiedad de una
suma o diferencia de variables, al calcular la varianza aparece la cova-
rianza, tal como se puede apreciar en la siguiente relacin:

V( x y) = V(x) + V(y) 2 Cov (x,y)


Por definicin de varianza:
n 2
xi yi M x M( y )
i 1
V( x y)
n
n 2
xi M x yi M( y )
i 1

Resolviendo el cuadrado del binomio del numerador del segundo trmino:


n
2 2
xi M x 2 xi M x yi M( y ) yi M( y )
i 1
V( x y)
n

Distribuyendo el sumatorio y n:

n n n
2 2
xi M x yi M y xi M x yi M( y )
i 1 i 1 i 1
V( x y) 2.
n n n

Por lo que:

V( x y) V x V y 2.Cov x,y

Observemos que, si la covarianza es cero, indica que hay indepen-


dencia entre las variables "x" e "y" con lo que la varianza de la suma o
diferencia de las variables "x" e "y" ser igual a la suma de las varianzas
de cada una de ellas.

V( x y) = V(x) + V(y)

Actividad 15
Considerando los datos de la base EPH.idb, un aspecto importante es la relacin
entre las horas trabajadas y la antigedad en el empleo del jefe de hogar. A par-
tir de los siguientes resultados, responda:

a) La covarianza, interprete e indique el significado del valor.


b) Indique a qu medida corresponde cada valor de la diagonal principal.
c) La matriz de correlacin, interprete cada valor e indique el significado
del valor.

120
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

7. Actividades de aprendizaje
Actividad 16
Con los datos de la base EPH, se ha analizado la variable sueldo, que representa
el ingreso de las personas consultadas en la muestra. Se ha considerado para el
anlisis descriptivo el ingreso de Empleadores y trabajadores por su cuenta, las
medidas descriptivas para el ingreso de cada una de esas categoras, se mues-
tra en tabla 12:

Tabla 12. Medidas Resumen

Medidas
Cuenta
variable Empleador
propista
ingreso
n 9 21
Media 1280 737,14
Var(n-1) 394075 237401,43
Mn 370 240
Mx 2200 2100
Mediana 1300 650
Q1 970 320
Q3 1500 870
Asimetra 0,03 1,53

a) Calcule la media general (varones y mujeres) del ingreso de ambas ca-


tegoras.
b) Calcule la desviacin estndar del ingreso de cada categora.
c) Calcule el coeficiente de variacin, para cada grupo, interprete y com-
pare.
d) Calcule el recorrido intercuartil para cada categora y compare interpre-
tando adecuadamente la medida.
e) Indique observando la tabla de medidas resumen, qu distribucin
presenta mayor asimetra y cul es el sentido de la misma?
f) Calcule media y varianza del ingreso para la categora empleadores,
luego de una disminucin del 20% debido a devaluaciones monetarias.
(Aplique propiedades).

Actividad 17
Retomando la actividad 20 de la Unidad 1, se le solicita que analice la variable
mediante un anlisis descriptivo: medidas de posicin, dispersin y forma, in-
terpretando el significado que le atribuye a cada una.

Actividad 18
Conforme a la actividad 23 de la Unidad 1, en la que para 15 empresas se relev
el precio y el margen de utilidad de un producto.

Calcule con Infostat la matriz de covarianza y correlacin e interprete cada


valor estableciendo un vnculo con el grfico a que hace referencia la actividad 121
en la unidad 1.

Actividad 19
Conforme a la actividad 24 de Unidad 1, referida a una heladera que cuenta con
dos sucursales en la Ciudad de Crdoba, una ubicada en la zona Norte y otra
ubicada en la zona Sur. A continuacin se presenta informacin sobre el nmero
de pedidos telefnicos recibidos por da, para una muestra aleatoria de 20 das:

Zona
4 6 7 5 5 6 7 4 8 6 8 5 7 6 7 5 6 6 7 4
Norte
Zona
4 6 5 3 6 3 5 6 5 6 4 4 5 6 6 2 3 4 5 6
Sur

a) Para cada sucursal:


Calcule las medidas descriptivas y analice cada variable

b) Efecte comparaciones

Actividad 20
A continuacin se presentan los precios de venta (en miles de $) de 30 casas de
dos zonas residenciales de la Ciudad de Crdoba que fueron utilizados en la
actividad 25 de la Unidad 1.

90 116 120 95 114 97 121 108 102 91


Zona
A 107 99 92 118 100 96 98 110 104 125
100 93 105 112 96 113 100 95 105 129

100 148 130 118 135 125 110 132 125 115
Zona
134 116 131 109 126 112 126 105 150 119
B
121 145 128 117 136 122 119 130 125 133

Para cada zona:


Calcule las medidas de posicin dispersin y forma y analice cada distribucin
emitiendo una opinin en relacin a las caractersticas estadsticas de los pre-
cios de venta de las viviendas en cada zona, es decir, los precios ms altos, los
ms variables, la zona que presenta valores muy diferentes al promedio, etc.
Relacione las interpretaciones que Ud. Realiza en esta actividad con las que
realiz en la unidad 1.

Actividad 21
Un aspecto relevante para las empresas es la cantidad de personal que ocupan,
con el propsito de incentivar a incorporar ms empleo en las empresas, es de
inters oficial analizar esa variable por sector de la economa. Los datos proce-
sados con las medidas descriptivas se muestran en tabla 13.

Tabla 13. Medidas descriptivas de variable cantidad de personal

PRODUCTOS
DE ORIGEN PRODUCTOS OTRAS IN-
MEDIDA NO METLI-
AGROPECUARIO METLICOS DUSTRIAS
COS
n 49 36 50 13
Media 33,63 27,67 35,36 58,38
D.E. 40,81 41,19 47,61 83,7
CV 121,33 148,88 134,65 143,35
122 Mn 3 3 4 6
Mx 191 168 214 280
Q1 10 6 11 17
Asimetra 2,35 2,62 2,56 2,2
Kurtosis 4,78 5,23 5,5 2,23
Captulo 2: Parmetros y estadsticos de las distribuciones de frecuencias

a) Analice la variable en cada sector e indique en que sector el promedio


es ms representativo.
b) Indique si en algn sector hay cantidad de personal muy diferente para
algunas empresas, es decir valores atpicos. Fundamente
c) En qu sector considera Ud. que se debera promover ms contrata-
cin de personal?
d) Se ha efectuado el anlisis conjunto de las variables cantidad de perso-
nal y costo laboral sobre costo total. Los datos se transcriben en tablas
14 y 15.

Tabla 14. Matriz de covarianzas

personal costos lab/costo total


personal 2306,03 -82,87
costos lab/costo total -82,87 201,06

Tabla 15. Matriz de correlacin

personal costos lab/costo total


personal 1 -0,12
costos lab/costo total -0,12 1

Analice la informacin y emita una opinin sobre la relacin lineal que puede
existir entre las variables.

8. Referencias Bibliogrficas

- Berenson, M y Levine, D (2003) Estadstica Bsica en Administracin. Con-


ceptos y Aplicaciones. 6 Edicin Prentice Hall.

- Daz Margarita .[et.al.] (2004) Estadstica I: Gua de Estudio. -1ra Ed. Crdo-
ba Asociacin Cooperadora de la Fac. de Cs. de la U.N.C., 2009.338 pginas
27x21 cm ISBN 978-987-1436-21-7.

- Pea, Daniel (2001) Fundamentos de Estadstica. Editorial Alianza.

- Saino Martin (2009). Estadstica Descriptiva. Material de estudio y aplicacio-


nes prcticas correspondiente a los Captulos I, II del programa de Estadstica I.
Asoc Coop F.C.E. (U.N.C.). ISBN: 978-987-1436-20-0.

123
Soluciones y respuestas al Captulo 2
Gua de Estadstica

Actividad 1:

A cargo del alumno.

Actividad 2:

a) Medidas resumen con Infostat

Variable n Media Mediana


xi 14 23,43 22,50

Interpretacin:
El promedio de unidades solicitadas de l bien analizado es de 23 unidades,
para la muestra de 14 clientes.
Hay 7 clientes (50%) que solicitaron menos de 23 unidades.
Hay dos valores modales, correspondientes a los valores ms frecuentes que
son de 16 y 25 unidades, respectivamente.

xi M(x ) 0
b)

Para ello se utiliz el Excel.

xi (xi- promedio)
10 -13,43
12 -11,43
14 -9,43
16 -7,43
16 -7,43
18 -5,43
20 -3,43
25 1,57
25 1,57
27 3,57
30 6,57
30 6,57
35 11,57
124
50 26,57
Total 0,00
Soluciones y respuestas al Captulo 2 Gua de Estadstica

c) Aplicando propiedades de la Media aritmtica.

Y=x+4

M(y) = M( x +4 )
= M(x) + M(4)
= 23,43 + 4

M(y) = 27,43

d) Aplicando propiedades de la Media aritmtica.


Y= X 0,15 X
= X (1 0,15) (extraemos factor comn)
Y = x. 0,85
M( Y) = M( x. 0,85 )
= 0,85. M( x)
= 0,85 . 23,43

M(y) = 19,92

Actividad 3
a)
Muestra tamao: 9 personas (patrones).
Muestra tamao: 21 personas (Cuenta propia).

b) Monto total
Monto total de sueldo de los 9 patrones analizados es de $11520.
Monto total de sueldo de los 21 cuentapropistas analizados es de $15480.

c) Promedios

Patrn Cuenta Propia


Promedio 1280 737,14

El promedio de sueldo de los 9 patrones es de $1280, mientras que de los 21


cuentapropistas es de $ 737,14, la diferencia (a pesar de que los montos totales
no difieren tanto) se debe a que las muestras son considerablemente diferen-
tes.

d) Se define la nueva variables Y = x - 0,20.x = x. (1-0,20) = 0,80. X


M (Y) = M (0,80. x)
=0,80. M(x)

Entonces para cada muestra los nuevos valores de promedio bajo el efecto in-
flacionario sern:

Patrn Cuenta Propia


Promedio 1280 737,14
Nueva media 1024 589,71 125

e) Se define la nueva variable.


Y = x + 50
M(y) = M( x +50)
= M(x) + 50
Entonces para cada muestra los nuevos valores de promedio sern:

Patrn Cuenta Propia


Promedio 1280 737,14
Nueva media 1330 787

f) Definimos entonces una nueva variable que refleje ambos incrementos

W= 50+ 1,18 x

M(W) = M ( 50 + 1,18 . x)
= M(50) + M( 1,18 . x)
= 50 + 1,18. M( x)
Reemplazando ahora por las medias de cada grupo analizado tendremos

Patrn Cuenta Propia


Promedio 1280 737,14
Nueva media 1560 919,83

g) Promedio total = (Media grupo 1) . n1 + (media grupo 2).n2


n1 +n2

Patrn Cuenta Propia


Promedio 1280 737,14
Muestra 9 21
Media total 900,00

Actividad 4

a) Variable: unidades producidas (se trata de una variable cuantitativa discreta


que esta presentada en forma de una Serie Simple)

Medidas de Posicin Turno 1 Turno 2


Media 21 26
Mediana 16 27
Modo 16 25
Modo ---------- 30

Interpretaciones:

Media: El promedio de unidades producidas es de 21 unidades para el Turno 1 y


de 26 unidades para el Turno 2

Mediana: Para el Turno 1 el 50% de los das analizados se produjeron menos de


16 unidades
126 Para el Turno 2 el 50% de los das analizados se produjeron menos de 27 uni-
dades

Modo: Para el Turno 1 el valor ms frecuente es de 16 unidades producidas,


mientras que para el Turno 2 se registraron dos valores frecuentes 25 y 30
unidades respectivamente (bimodal).
Adems podemos analizar las formas de ambas distribuciones comparando las
medidas de posicin, y en referencia a esto podemos concluir que los datos del
Soluciones y respuestas al Captulo 2 Gua de Estadstica

Turno 1 una distribucin levemente asimtrica derecha; mientras que los datos
del Turno 2 presentan una forma asimtrica izquierda.

Los coeficientes de asimetra son:

Turno 1 Turno 2
Asimetra 2,43 -1,55

b) Para los datos correspondientes al Turno 2, la media es ms representativa.


Esto podra verificarse calculando los CV, que para este caso dan los siguientes
valores:

Turno 1 Turno 2
CV 62,84 30,28

Como puede verse el CV del turno 2 es ms pequeo por lo tanto podemos con-
cluir que para este turno los datos son ms homogneos, estn menos disper-
sos y por lo tanto el promedio para este Turno es ms representativo.

c) Para verificar estas igualdades realizaremos una tabla en Excel con los datos
del Turno 1

Turno 1 ( xi - media ) ( xi-media)2 ( xi-mediana)2 (xi- modo)2


12 -9 78,45 16 16
14 -7 47,02 4 4
16 -5 23,59 0 0
16 -5 23,59 0 0
18 -3 8,16 4 4
20 -1 0,73 16 16
50 29 849,31 1156 1156
Total 0 1030,86 1196 1196

Como puede verse el cuadrado de los desvos respecto de la media es el mni-


mo.

Actividad 5

a) Variable: monto de deudas no pagadas (variable cuantitativa continua).


b) Medidas de posicin

Media 19,1
Mediana 17,5
Modo 10

127
HISTOGRAMA VALOR DE CUENTAS NO PAGAS

0,44

0,33

frecuencia relativa
0,22

0,11

0,00
7 15 22 30 37

Mo=10 Me = 17,5 M(x)= 19,1

Actividad 6

La diferencia muestra la asimetra en la forma de la distribucin.


a) Para analizar esto debemos calcular los cuartiles:

Q1 15,5
Mediana = Q2 22,5
Q3 28,5

Q1: la cantidad mxima de pedidos del 25% de los clientes que menos deman-
dan es de 15,5 pedidos (aproximadamente 16 pedidos).

Q3: la cantidad mnima demandada del 25% de los clientes que ms cantidad
demandan es de 28,5 pedidos (aproximadamente 29 pedidos).

Si realizamos estos clculos usando Infostat los valores serian:

Medidas resumen
Resumen Xi
n 14,00
Media 23,43
Mn 10,00
Mx 50,00
Mediana 22,50
Q1 16,00
Q3 30,00

b) El 50 % de las observaciones quedan comprendidas entre los dos cuartiles


128 (Q1 y Q3).
Soluciones y respuestas al Captulo 2 Gua de Estadstica

Actividad 7

a)
Medidas resumen

Resumen VALOR MON CNP


n 12,00
Mn 7,00
Mx 37,00
Mediana 17,50
Q1 10,00
Q3 26,00

b)
HISTOGRAMA VALOR DE CUENTAS NO PAGAS

0,44

0,33
frecuencia relativa

0,22

0,11

0,00
7 15 22 30 37

Q2=17,
Q1=105 Q3=26

Se observa una asimetra derecha.

Actividad 8

Para una variable x con valores 4, 5 y 6 la varianza ser igual a:


Var = V(x)= 1

Aplicando propiedad.

Definimos una nueva variable Y = x + 3


V (y) = V (x + 3)
= V(x) + V (3)
= 1 + 0
V (y) = 1

129
Actividad 9

a) Recorrido = 50-10= 40 unidades.


La diferencia entre el valor mximo y el valor mnimo de la variable analizada es
de 40 unidades
b) Varianza = 115 unidades2

La varianza de la muestra de empresas de pedidos de clientes es 115 unidades2.


La medida representa la distancia promedio al cuadrado calculada respecto de
la media, es por ello una medida de valores de distancia al cuadrado.

Desvo estndar = 11 unidades

c) Calculamos aplicando propiedades de la varianza en primer lugar, definiendo


una nueva variable.

Y = x +4
V (y) = V(x + 4)
= V(x) + V (4)
= 115 + 0
V (y) = 115 unidades2.

Por lo tanto la desviacin estndar para el mes de marzo ser DS (y) = 11 unida-
des, la misma que para febrero porque el incremento es constante (Vza de una
constante es igual a 0).

d) Definimos entonces una nueva variable w= x 0,15. x


w =x (1 0,15)
w = 0,85. X

Ahora aplicamos propiedades de la varianza

V (w) = V( 0,85 . x )
= (0,85)2. V(x)
V (w) = 0,7225. 115

V (w ) = 83 unidades2..

La varianza para el mes de marzo ser de 83 unidades2

Actividad 10

a) Los valores de Rango son:

Patrn Cuenta propia


Rango 1830 1860

Es decir que la diferencia entre el valor mximo y el minino de la variable anali-


zada es de 1830 $ para la muestra de Patrones y de 1860 $ para la muestra
de Cuentapropistas

b) Las varianzas y desvos estndar para cada grupo son:

Patrn Cuenta propia


130
Varianza 394075 237401
Desv. Est. 628 487

Se observa una menor variabilidad respecto de la media en el grupo de los tra-


bajadores por cuenta propia.
Soluciones y respuestas al Captulo 2 Gua de Estadstica

c) Los coeficientes de variacin para ambos grupos son:

Patrn Cuenta propia


CV% 49,04 66,1

El grupo de los Patrones muestra un menor CV con lo que puede concluirse que
en este conjunto de datos los valores son ms homogneos, menos dispersos y
por tanto el promedio para este grupo es ms representativo.

d) Si hay un incremento de $50 definimos la nueva variable Y = x + 50.

Y aplicamos propiedades:

V (y) = V(x + 50)


= V(x) + V (50)
V (y) = V(x) + 0
V (y) = V(x).

Con lo que podemos concluir que si el incremento es de $50 los valores de va-
rianza y de desvo estndar no se modificaran.

Patrn Cuenta propia


Varianza 394075 237401
Desv. Est. 628 487

e) Si ahora se produce un incremento del 18% definimos una nueva variable:

W= x + 0,18 x
W= x.(1+0,18)
W= 1,18 x

V (w) = V (1,18. X)
= (1,18)2 V(x)

(V (w) = 1,3924. V(x)

Entonces los nuevos valores de varianza y de desvo estndar para cada una de
las muestras ser de:

Patrn Cuenta propia


Varianza 548710 330557
Desv. Est. 741 575

f) Volvemos a calcular los CV% para los supuestos de los puntos d) y e) pero
para ello deberemos calcular la nueva media en cada caso.

Si el incremento es de $50 (inciso d)


131
Patrn Cuenta propia
Media 1330 787
Desv. Est. 628 487
CV% 47,20 61,90
Si hay un incremento (fijo) de $50 se producir una disminucin en los CV%
aunque la conclusin es la misma en relacin a que el grupo de Patrones mues-
tra un menor CV con lo que puede concluirse que en este conjunto de datos los
valores son ms homogneos, menos dispersos y por tanto el promedio para
este grupo es ms representativo.

Si hay un incremento porcentual (inciso e)

Patrn Cuenta propia


Media 1510 870
Desv. Est. 741 575
CV% 49,04 66,10

Si hay un incremento (porcentual) del 18% observamos que el CV% no variara.

Actividad 11

Medidas resumen

Resumen VALOR MON CNP


n 12,00
Mn 7,00
Mx 37,00
Mediana 17,50
Q1 10,00
Q3 26,00

DIAGRAMA DE CAJA Y BRAZOS

38,50

30,25
VALOR MON CNP

22,00

13,75

5,50

Como puede observarse la distribucin presenta una asimetra derecha muy


leve, adems los valores mximo y mnimo caen dentro de las barreras internas
(Izquierda y derecha, respectivamente) con lo cual podemos concluir que no
hay valores outliers ni extremos dentro de la distribucin.

132 Actividad 12

Medidas resumen

Variable n Mn Mx Mediana Q1 Q3
SUELDO P 9 370 2200 1300 970 1500
SUELDO CP 21 240 2100 650 320 870
Soluciones y respuestas al Captulo 2 Gua de Estadstica

DIAGRAMA DE CAJA Y BRAZOS

2291,50

1788,25
SUELDO P

1285,00

781,75

278,50

Como puede observarse la distribucin de la variable sueldo para patrn pre-


senta una asimetra derecha muy leve, adems los valores mximo y mnimo
caen dentro de las barreras internas (Izquierda y derecha, respectivamente)
con lo cual podemos concluir que no hay valores outliers ni extremos dentro de
la distribucin (son los valores 1800 y 2100 respectivamente).

DIAGRAMA DE CAJA Y BRAZOS

2193,00

1681,50
SUELDO CP

1170,00

658,50

147,00

Como puede observarse la distribucin presenta una asimetra izquierda muy


leve, adems el valor mnimo caen dentro de las barreras internas (Izquierda)
pero el valor mximo supera al LSO y est ubicado antes del LSE por lo tanto
podemos concluir que hay presencia de valores outliers dentro de la distribu-
cin.

Actividad 13 133

Variable analizada: PESO (Kg.)

Muestra: 100 personas adultas


Se observa una leva asimetra derecha

Calculamos el rango intercuartilico, y los 4 Lmites (internos y externos Infe-


riores y Superiores)

Me 65,35
Q1 57
Q3 72
RI 15
LIO 34,5
LSO 94,5
LIE 12
LSE 117
VMIN 47
VMAX 100

Como puede observarse que el valor mnimo caen dentro de las barreras inter-
nas (Izquierda) pero el valor mximo supera a la BID y est ubicado antes de la
BED por lo tanto podemos concluir que hay presencia de valores outliers (atpi-
cos) dentro de la distribucin.

134 Actividad 14

a) Analizando las medidas de posicin para cada variable podemos concluir que
ambas variables presentan una forma asimtrica derecha, pero que para el caso
de la variable gasto de movilidad esta asimetra es ms marcada. Esto puede
verse tambin analizando ambos coeficientes de asimetra, que como se obser-
va para el caso de la segunda variable es mayor su valor.
Soluciones y respuestas al Captulo 2 Gua de Estadstica

Podramos calcular ambos coeficientes de variacin, sus valores son:

Para gastos en libros (anual) = 44.32%

Para gastos en movilidad (mensual) = 115.53%

El mayor valor obtenido para la variable gasto de movilidad nos permite con-
cluir que para esta variable los datos estn ms dispersos , son menos homog-
neos y que la media es menos representativa.

b) Analizando los diagramas de caja brazos podemos adems de analizar las


formas asimtricas derechas de ambas distribuciones, podemos ver adems
que en ambas hay valores atpicos, pero que en la segunda variable es mayor la
cantidad de estos valores que se presentan.

c) Por ltimo si observamos la forma de los histogramas y de los polgonos de


frecuencias, observamos nuevamente la forma asimtrica derecha de ambas
distribuciones, pero veos claramente que la variable gastos de movilidad pre-
senta una asimetra ms acentuada, y en particular aproximadamente un 90%
de las observaciones se encuentran concentradas en el primer intervalo.

Actividad 15

a) Covarianza = 19,09 indica una asociacin directa o positiva entre las horas
trabajadas y la antigedad

b) La diagonal principal contiene ambas varianzas, en este caso :

Varianza (de la variable horas trabajadas) es 136,91 hs2


Varianza (de la variable antigedad) es de 95,22 aos2

c) Observando la matriz de correlacin podemos ver que el coefiente de corre-


lacin es igual a 0,17 podemos entonces concluir que existe una asociacin
135
directa (bastante dbil porque es cercano a 0) entre las dos variables que se
estn analizando, es decir que cuando aumenta la antigedad en el empleo del
jefe del hogar, la cantidad de horas trabajadas es de esperar que aumente
Actividad 16

MEDIDAS VARIABLE
EMPLEADOR CUENTA PROPISTA
INGRESO

n 9 21
Media 1280 737,14
Var(n-1) 394075 237401,43
Mn 370 240
Mx 2200 2100
Mediana 1300 650
Q1 970 320
Q3 1500 870
Asimetra 0,03 1,53

a) Media general

Media General 900,00

El promedio de ingreso para ambas categoras es de $900.

b) Desvo estndar para cada una de las categoras.

Empleador Cuenta propista

desvo estndar 627,75 487,24

c) Coeficiente de variacin.

Empleador Cuenta propista

CV % 49,04 66,10

Se observa que los datos para el grupo de Empleadores son ms homogneos,


es decir estn menos dispersos y por ende su media es ms representativa,
que la del grupo de los trabajadores por Cuenta Propia.

d) Recorrido Intercuartlico.

Empleador Cuenta propista

RI 530,00 550,00

e) En el grupo Cuentapropista se observa asimetra derecha.

f) Para calcular la media y la varianza si hay una disminucin del 20% definimos
136 una nueva variable ( que ser nuestra variable original menos el descuento)

Le llamamos: W= X 0.20* X =X (1-0.20) = 0,80.X


Soluciones y respuestas al Captulo 2 Gua de Estadstica

Ahora:
M(W) = M( 0,80 . X)
= 0,80. M(X)
= 0,80 . 1280

M(W) = 1024 $. Para los Empleadores.


M(W) = 589, 71 $ Para los Cuenta Propistas

Para la varianza aplicamos el mismo razonamiento pero aplicando ahora las


propiedades de la varianza.

V(W) = V( 0,80 .X)


= 0,802 V(X)
= 0,64 . 394075
V(W) = 252208 $2 Para los Empleadores.
V (W) = 151936,92 $2 Para los Cuenta Propistas

Actividad 17

Variable: cotizaciones de acciones en la Bolsa de Comercio n=22 das


Utilizando Infostat obtenemos la siguiente tabla de resumen de medidas

Medidas resumen
Resumen cotizacin de acciones
n 22,00
Media 9,30
D.E. 1,82
Var(n-1) 3,32
CV 19,61
Mn 3,00
Mx 11,70
Mediana 9,65
Q1 8,40
Q3 10,40
Asimetra -1,91
Kurtosis 4,51

Analizando las medidas de posicin en forma conjunta con los coeficientes de


asimetra, podemos concluir que el conjunto de datos analizados, presenta una
forma asimtrica izquierda, vemos que la media es menor a la mediana y que
presenta 3 valores modales = 8 , 9,7 y 11,3 (miles de $) y esto puede verificar-
se analizando el coeficiente de asimetra que es negativo. Esto hace que poda-
mos concluir que para este conjunto de datos la mediana es la medida ms re-
presentativa.
137

Actividad 18

Covarianza 0,37
Coef. Correlacin 0,546
Se puede concluir que existe una correlacin lineal positiva (o directa) entre el
Precio y la Utilidad, lo cual tambin se observa en el diagrama de dispersin
cierta tendencia ascendente en la nube de puntos

Actividad 19

Variable analizada: nmero de pedidos recibidos por da.

Zona Norte Zona Sur


Promedio 6 5
Mediana 6 5
Modo 6 6
Varianza 1,52 1,59
Desv Est 1,23 1,26
n 20 20
Q1 5 4
Q3 7 6
Rango Intercuartilico 2 2
Vmin 4 2
Vmax 8 6
Coef. Asim -0,08 -0,59
Rango 4 4

CV% 20,75 26,82

Analizando las medidas de posicin en forma conjunta con los coeficientes de


asimetra, podemos concluir que la Zona Norte presenta una forma prctica-
mente simtrica, vemos que las tres medidas de posicin (media, mediana y
138 modo) son iguales y el coeficiente de asimetra es levemente distinta de 0 (en
este caso levemente negativa pero muy cercana a 0); mientras que en el caso
de la Zona Sur podemos ver que hay una asimetra izquierda. Con lo que para
los datos de la Zona Norte la media es ms representativa del conjunto de da-
tos.

Por otro lado comparando ambos CV podemos ver que como para la muestra
de la Zona Norte el coeficiente de variacin es menor, entonces se puede con-
Soluciones y respuestas al Captulo 2 Gua de Estadstica

cluir que para estos los datos son ms homogneos, estn menos dispersos y la
media es ms representativa (lo cual ya se afirm por otra va de anlisis)
Los rangos son iguales para ambas distribuciones.

Actividad 20
Variable analizada: precio de venta (en miles de $)

Zona A Zona B
Promedio 105,03 124,73
Mediana 103,00 125,00
Modo 100,00 125,00
Varianza 114,10 142,41
Desv Est 10,68 11,93
N 30 30
Q1 96,00 116,75
Q3 113,25 132,25
Rango Intercuartilico 17,25 15,50
Vmin 90,00 100,00
Vmax 129,00 150,00
Coef. Asim 0,58 0,15
Rango 39,00 50,00
CV% 10,17 9,57

Analizando las medidas de posicin en forma conjunta con los coeficientes de


asimetra, podemos concluir que la Zona A presenta una forma asimtrica de-
recha (modo < mediana < promedio), vemos el coeficiente de asimetra es po-
sitivo, lo que re afirma la conclusin de la forma asimtrica derecha (en la que
la mediana es la medida de posicin ms representativa); mientras que en el
caso de la Zona B podemos ver que hay una asimetra derecha pero mucho me-
nos marcada, puede verse que la mediana y el modo coinciden, y esto se puede
corroborar con el valor del coeficiente de asimetra que es positivo pero cercano
a 0.

Por otro lado comparando ambos CV podemos ver que como para la muestra
de la Zona A el coeficiente de variacin es mayor, entonces se puede concluir
que para estos los datos son menos homogneos (mas heterogneos), estn
ms dispersos y la media es menos representativa que los de la zona B (lo
cual ya se afirm por otra va de anlisis).

Actividad 21:
A cargo del alumno

139
Estadstica I
Tomo I (cap. 1, 2 y 3)

Ciclo Bsico a Distancia


FACULTAD DE CIENCIAS ECONMICAS
AUTORIDADES

Mgter. JHON BORETTO


Decano

Dra. MARA LUISA RECALDE


Vicedecana

Cr. FACUNDO QUIROGA MARTNEZ


Secretario Tcnico

Cr. DIEGO CRIADO DEL RO


Secretario de Administracin

Mgter. GERARDO HECKMANN


Secretaria de Asuntos Acadmicos

Lic. JUAN SAFFE


Secretario de Extensin

Cr. MATAS LINGUA


Secretario de Asuntos Estudiantiles

Dr. ANDRS MATTA


Secretaria de Ciencia, Tcnica y Relaciones Internacionales

Mgter. CLAUDIA CARIGNANO


Prosecretaria de Evaluacin Institucional y Acreditacin de Carreras

Cr. HUGO PRIOTTO


Director de la Carrera Contador Pblico

Mgter. MARCELO CAPELLO


Director de la Carrera de Licenciatura en Economa

Lic. TOMS GASTN


Director de la Carrera de Licenciatura en Administracin
CICLO BSICO A DISTANCIA
REAS QUE PARTICIPAN

Coordinacin Acadmica
Secretara de Asuntos Acadmicos
Mgter. Gerardo Heckmann
Coordinacin Organizativa de Divisiones a Distancia
Lic. David Taborda

rea de Formacin Docente y Produccin Educativa


Coordinador General
Oscar Margara
Asesora pedaggica
Dra. Adela Coria
Equipo de produccin en tecnologa educativa y comunicacin
Mgter. Gabriela Sabulsky
Lic. Cecilia Botino
Lic. Vctor R. Cacciagi
Lic. Laura Delmonte
Lic. Vanesa Guajardo
Esp. Vernica Pacheco
Lic. Mara Florencia Scid
Administracin
Lic. Nora Ceballos
Proyecto Elaboracin de material didctico en formato digi-
tal para Estadstica I en el marco del Programa de Apoyo y
Mejoramiento a la enseanza de grado de la UNC aprobado
por Res. HCS N583-2015.

Coordinadora del Proyecto:


Margarita Daz

AUTORES
Norma Patricia Caro
Rosana Beatriz Casini
Margarita Daz
Fernando Garca
Mariana Gonzlez
Martn Saino
Mara Ins Stmolo

Los autores agradecen especialmente a los Profesores Asistentes por la


colaboracin prestada en la resolucin y revisin de las actividades.
Mara Ins Ahumada
Lorena Anaya
Vernica Arias
Mariana Guardiola
Roberto Infante
Adrian Moneta Pizarro
Olga Padro
Andrea Righetti
Julio Rosales
Proyecto Fortalecimiento del Ciclo Bsico a Distancia en el
marco del Programa de Apoyo y Mejoramiento a la enseanza
de grado de la UNC aprobado por Res. HCS N 604-2014.

Coordinadora del Proyecto:


Dra. Adela Coria

Maquetacin de materiales
Lic. Vctor R. Cacciagi y Lic. Ismael Rodrguez

Diseo grfico y audiovisual


Lic. Laura Delmonte

Asesoramiento y diseo pedaggico - didctico


Esp. Vernica Pacheco y Lic. Vanesa Partepilo

Asesoramiento y diseo comunicacional


Lic. Cecilia Botino y Lic. Mara Florencia Scid
NDICE

Captulo 3:
Introduccin a las probabilidades
1. Introduccin 143
2. Fenmenos aleatorios versus determinsticos 143
3. Conceptos bsicos de probabilidad 144
4. Enfoques para asignar probabilidades 148
5. Axiomas y teoremas de probabilidad 152
6. Probabilidad conjunta y condicional 153
7. Independencia de eventos 156
8. Ley de Probabilidad total 159
9. Teorema de Bayes 160
10. Referencias Bibliogrficas 163
Anexo 1: Repaso de lgebra de Conjuntos 164
Soluciones y respuestas al Captulo 3 166
Captulo 3
Introduccin a las probabilidades
Captulo 3: Introduccin a las probabilidades

Captulo 3: Introduccin a las probabilidades

1. Introduccin
De acuerdo a lo estudiado en el Captulo I, la Inferencia Estadstica
comprende los mtodos que permiten extrapolar los resultados de una mues-
tra aleatoria hacia la poblacin de la cual fue extrada. Cuando se observa slo
una muestra, aun cuando la misma sea adecuadamente representativa de la
poblacin por cuanto reproduce sus caractersticas esenciales, el intento de
extraer conclusiones acerca de la poblacin se realiza, no en un marco de cer-
teza sino de incertidumbre cuantificable.
La Teora de Probabilidad, rama de la matemtica que modela fenme-
nos aleatorios, cuantifica esa incertidumbre en el proceso de estimacin de
parmetros, permitiendo hacer afirmaciones en cuanto a precisin y confiabi-
lidad de los resultados. Tambin permite probar hiptesis en relacin con los
parmetros, fijando la magnitud del error que puede cometerse al tomar la
decisin y constituye la base terica de mtodos estadsticos tales como Re-
gresin, Anlisis de Varianza, Control de Calidad, etc. Si bien dichas metodo-
logas, tanto la estimacin de parmetros como la prueba de hiptesis las es-
tudiaremos en Estadstica II, a partir de este Captulo introduciremos los con-
ceptos fundamentales y el lenguaje bsico de Probabilidad.
En las explicaciones que se desarrollan en este captulo se vislumbrar
de qu manera la Teora de Probabilidad es en la actualidad la base de la ma-
yor parte de las decisiones que adoptan tanto los gobernantes como adminis-
tradores de empresa.

2. Fenmenos aleatorios versus determinsticos


En cualquier campo de la ciencia (fsica, biologa, ingeniera, economa,
etc.) se necesitan describir, modelar y predecir fenmenos del mundo real,
para lo cual se construyen modelos matemticos. Cuando se quiere elaborar
un modelo matemtico para explicar hechos reales, se distinguen dos tipos de
fenmenos o experimentos:

Fenmeno determinstico: es aquel fenmeno o experimento cuyo resultado


conocemos de antemano o podemos calcular con certeza, o sea que se trata-
ra de situaciones en las que se trabaja con certidumbre completa.

Pensemos en los siguientes ejemplos:

a) Arrojamos un vaso de vidrio desde el 5 piso de un edificio. El resulta-


do es: el vaso se rompe.
b) Colocamos a 100 C una pava con agua. El resultado es: el agua hierve. 143
c) Colocamos un capital de $ 8.000 a una tasa de inters mensual del
1,8%. El resultado es: al cabo de 1 mes el monto final ser $ 8.144
Fenmeno aleatorio: es aquel fenmeno o experimento que, repetido bajo las
mismas condiciones, puede arrojar resultados diferentes y no es posible pre-
decir con certeza cul de ellos ha de darse; es decir, estamos frente a fenme-
nos cuyo resultado es incierto.

Ejemplos de este tipo de fenmenos seran:

a) Lanzar un dado y observar el nmero que aparece en su cara superior.


b) Lanzar una moneda 3 veces y observar la salida de cara o sello.
c) Seleccionar al azar una familia de la ciudad y registrar su ingreso men-
sual.
d) Seleccionar al azar un elector y determinar su candidato favorito.
e) Observar una casilla de peaje y computar la cantidad de vehculos que
pasan por hora.

Como podemos ver, en todos los ejemplos anteriores no es posible pre-


decir con certeza el resultado que observaremos. A modo de resumen, los
experimentos aleatorios renen las siguientes caractersticas:

Consideramos nicamente aquellos experimentos que sean concebi-


bles bajo condiciones semejantes. Cada vez que realizamos el acto te-
nemos una prueba.
Aunque no podemos indicar cul ser el resultado particular de una
prueba, podemos describir el conjunto de todos los resultados posi-
bles del experimento.
Cuando el experimento se repite una gran cantidad de veces, los resul-
tados presentan regularidad estadstica. En otras palabras, la frecuen-
cia relativa de aparicin de los resultados, se aproxima a un valor fijo
constante al aumentar el nmero de pruebas.

La realidad casi nunca es totalmente predecible, por lo que la mayora


de las situaciones a las que nos enfrentamos tienen resultados imprevistos y
nos llevan a trabajar bajo incertidumbre. Pero podemos predecir el resultado
particular que se producir y medir el riesgo asociado a esta prediccin, es
decir determinar qu posibilidades hay de que dicho resultado no sea el que se
produce realmente como fruto del experimento.

3. Conceptos bsicos de probabilidad


Repaso de Algebra de Con- La Teora de Probabilidad utiliza la Teora de Conjuntos para definir mu-
juntos est en el Anexo 1 de chos de sus conceptos bsicos, por lo que le sugerimos leer el anexo que est
esta Unidad. al final de este captulo, que propone un repaso que consideramos ser de
utilidad.

Recordemos que en los fenmenos o experimentos aleatorios, si bien no


144 sabemos el resultado que ocurrir en una prueba individual, s podemos des-
cribir todos los posibles resultados del mismo.

El conjunto formado por todos los resultados posibles de un experi-


mento aleatorio es llamado espacio muestral y lo representaremos
con la letra .
Captulo 3: Introduccin a las probabilidades

Cada uno de los resultados elementales e indivisibles del experimento,


llamados puntos muestrales, se denota por . La cardinalidad de es la can-
tidad de puntos muestrales y se denota #. Suponiendo que la experiencia
arroja s resultados:
= { i} i = 1,2,,s # = s

Consideremos el siguiente ejemplo:

Ejemplo 1
En el experimento de tirar una moneda una vez, slo hay dos resulta-
dos posibles:
= {c,s}

Si se realizan dos tiradas, el espacio muestral es un conjunto formado


por cuatro duplas ordenadas. Cada dupla indica el orden en el que aparecieron
los lados de la moneda:

= {(cc),(cs),(sc),(ss)} # = 22=4

Si se realizan tres tiradas, se obtendrn ocho ternas ordenadas:

= {(ccc),(ccs),(csc),(css),(scc),(scs),(ssc),(sss)} # = 23=8

Como se advierte, el espacio muestral representa el conjunto de todos


los resultados de la experiencia. Si la moneda se arrojara 5 veces, el mismo
estar conformado por 25 puntos muestrales [# = 32]; por ejemplo, uno de
esos puntos sera la secuencia (cccss) que indica que en las primeras tres
tiradas aparecieron caras y en las restantes sellos.

Los espacios muestrales se pueden clasificar en discretos o continuos.


En los discretos, los resultados pueden ser enumerados, por lo que estarn en
correspondencia con los nmeros enteros. A su vez, se pueden clasificar en
finitos o infinitos. En los espacios muestrales continuos, en cambio, los resulta-
dos no pueden ser enumerados, es decir son infinitos no numerables; por lo
que estar conformado por un intervalo de nmeros reales.

A continuacin tenemos ejemplos de espacios muestrales y su respec-


tiva clasificacin:

a) Lanzar un dado y observar el nmero que aparece en su cara superior.


= {1, 2, 3, 4, 5, 6}
Clasificacin: Discreto (finito numerable).

b) b) Seleccionar al azar una familia de la ciudad y registrar su ingreso


mensual.
= {I / I 0}
Clasificacin: Continuo

c) Seleccionar al azar un elector y determinar su candidato favorito. 145

= {candidato A, candidato B,..., candidato N}


Clasificacin: Discreto (finito numerable).
d) Observar una casilla de peaje y computar la cantidad de vehculos que
pasan por hora.
= {0, 1, 2,........}
Clasificacin: Discreto (infinito numerable).

Actividad 1:
A partir de los siguientes ejemplos describa el espacio muestral y clasifquelo.

a) Mezclar un mazo de cartas espaolas y seleccionar una para observar


su palo.
b) Mezclar un mazo de cartas espaolas y seleccionar una para observar
su nmero.
c) Observar el nmero de automviles que entran por da al estaciona-
miento de un shopping.
d) Observar el gasto mensual en libros de los alumnos de Estadstica I.
e) Arrojar simultneamente un dado y una moneda, y se observa el resul-
tado que aparece.

Actividad 2:
Piense en otros experimentos aleatorios, intente describir el espacio muestral
asociado y clasifquelo segn lo expresado ms arriba.

Llamamos evento a cada subconjunto de resultados de un experimento alea-


torio. Lo designaremos con letras maysculas y tiene asociado una medida de
probabilidad.

Se trata de un concepto fundamental ya que es el que tiene asociado de


manera directa la nocin de probabilidad. Los eventos son simples o elemen-
tales cuando estn constituidos por un solo elemento de y se refieren a un
punto muestral; mientras que son compuestos cuando se definen como la
combinacin de dos o ms resultados del experimento aleatorio.
Diremos que un evento ocurri si al realizar el experimento se presenta
cualquiera de los puntos muestrales que lo componen.
Retomando el ejemplo de la tirada de una moneda dos veces, en el que
se observa cara o sello, determinamos que haba cuatro resultados posibles,
pero podemos definir muchos eventos simples y compuestos a partir de esos
resultados.

Por ejemplo:

A = {aparecen 2 caras} = {(cc)}


Es un evento simple

146 B = {aparece slo 1 cara} = {(cs), (sc)}


Es un evento compuesto

C = {aparece el mismo resultado en ambas tiradas} = {(cc),(ss)}


Es un evento compuesto

D = {aparece cara o sello en cualquiera de las dos tiradas}


D = {(cc),(cs),(sc),(ss)} = es un evento compuesto
Captulo 3: Introduccin a las probabilidades

E = {no aparece cara ni sello} =


Es un evento que no posee ningn elemento

Los sucesos D y E son casos particulares de eventos, el primero se de-


nomina evento cierto o seguro ya que seguramente sucede, mientras que el
segundo se denomina evento imposible (conjunto vaco) ya que no puede
suceder.
Los eventos A y B se denominan mutuamente excluyentes, porque la
ocurrencia de cualquiera de ellos elimina la ocurrencia del otro; es decir, slo
uno de ellos puede ocurrir. En notacin: A B =
Los eventos B y C se denominan colectivamente exhaustivos, ya que
entre ellos forman el espacio muestral. En notacin: B C =

Actividad 3:
a) Defina eventos simples y compuestos a partir de los experimentos
aleatorios que pens en la Actividad 2.
b) Podra dar una definicin de eventos mutuamente excluyentes? Y
de colectivamente exhaustivos?
c) Se anima a plantear ejemplos de eventos ciertos, imposibles, mu-
tuamente excluyentes y colectivamente exhaustivos en los experi-
mentos de la Actividad 2?

Actividad 4:
En la siguiente tabla se presentan los datos de produccin de parcelas clasifi-
cadas en tres niveles y cruzadas por zonas geogrficas de la Provincia de Cr-
doba, que se transcriben a continuacin

ZONA GEOGRFICA DE LA
TOTAL
NIVEL DE PRODUCCIN PROVINCIA
ZONA "A" ZONA "B" ZONA "C"
Alto 69 47 23 139
Mediano 40 25 80 145
Bajo 38 32 36 106
Total 147 104 139 390

Considerando que se elige una parcela al azar, le proponemos que:


a) De un ejemplo de evento simple
b) De un ejemplo de evento compuesto
c) Cul es el complemento de la Zona A?
d) De un ejemplo de eventos mutuamente excluyentes

Si recordamos el ltimo punto del repaso de lgebra de conjuntos po-


dramos, en este experimento aleatorio, armar el lgebra de Sucesos o Fami-
lia de Eventos, que ser la coleccin completa de subconjuntos que puedan
definirse a partir del espacio muestral , siendo el nmero total de subconjun-
tos 2s donde s = #. 1 Lo simbolizaremos con e incluir el conjunto vaco,
todos los subconjuntos unitarios, los binarios, etc. y el propio .
147

1
Cuando es continuo, no es posible definir de esa manera. (Hoel, cap. 1).
En nuestro ejemplo:

Donde = {(cc),(cs),(sc),(ss)} y # = 4, algunos de los 16 elementos de


son: {}, {(cc)}, {(cs)}, {(sc)}, {(ss)}, {(cc),(cs)}, {(cc),(sc)}, {(cc),(ss)},

Cada uno de estos eventos tendr asociada una probabilidad que simbo-
lizaremos con P, y al conjunto formado por el espacio muestral, la familia de
eventos y la probabilidad asociada a cada elemento de dicha familia lo llama-
remos Espacio de Probabilidad. Lo simbolizaremos con E.

E = {, , P}

4. Enfoques para asignar probabilidades


Luego de haber trabajado los conceptos principales vinculados a expe-
rimentos aleatorios, llegamos a lo que seguramente es de mayor inters.
Cmo podemos determinar la probabilidad de que un resultado particular
ocurra, o de que ocurra una combinacin de dos o ms resultados?
Seguramente estamos algo familiarizados con el tema, porque en ms
de una oportunidad escuchamos o leemos en los diarios expresiones como:

Si bien no conocemos con exactitud la definicin de probabilidad, po-


dramos decir que una idea intuitiva indicara que se trata de un nmero entre
0 y 1 (aunque con frecuencia se la exprese en porcentajes) que mide la posibi-
lidad de que ocurra un suceso, siendo 0 cuando estamos seguros de que no va
a ocurrir y 1 cuando estamos seguros de que s va a ocurrir.
Entre estos valores extremos, existe una gama de valores que debera-
mos asignar cuando estamos frente a situaciones de incertidumbre respecto
148
del resultado que va a ocurrir.
A fin de resolver estas situaciones, vamos a introducirnos en los distin-
tos enfoques o mtodos desarrollados para calcular la probabilidad de un
evento particular. La medicin de probabilidad surgi con el enfoque clsico,
exclusivamente aplicado a los juegos de azar. Dada las limitaciones que tiene
este enfoque, con posterioridad se desarroll el frecuentista.
Captulo 3: Introduccin a las probabilidades

Enfoque clsico

El experimento tpico, y no por ello menos til, para introducir este m-


todo es el lanzamiento de un dado. En este caso los resultados posibles que
forman el espacio muestral, son:

= {1, 2, 3, 4, 5, 6}

Si el dado est balanceado, la probabilidad de cada uno de estos resul-


tados es 1/6, es decir todos los resultados son equiprobables (espacio mues-
tral simtrico). Supongamos que definimos el evento:

A = {aparece el nmero 3},

este evento tiene una probabilidad asociada de 1/6, lo que se simboliza:

P(A) = 1/6

Si expresamos este resultado mediante una frmula, tendremos:

Casos favorables al evento A


P (A) =
Casos posibles de

Para poder aplicar este mtodo son necesarias dos condiciones:


Conocer todos los resultados de , para poder identificar los que son
favorables al evento definido.
Que todos esos resultados sean igualmente posibles.

Con este enfoque podemos tambin calcular probabilidades de eventos


compuestos.

Ejemplos:

B = {aparece un nmero par} ; B = {2, 4, 6} P(B) = 3/6


C = {aparece un nmero 2} ; C = {2, 3, 4, 5, 6} P(C) = 5/6
D = {aparece un nmero < 8} ; D = {1, 2, 3, 4, 5, 6} P(D) = 1
E = {aparece un nmero 10} ; E = P(E) = 0

Este enfoque tiene una aplicacin restringida a experimentos en los que


todos los resultados posibles son igualmente probables, tales como los rela-
cionados con los juegos de azar. Pero en numerosas situaciones no es vlido
suponer la simetra de los resultados, por lo que deberemos utilizar el enfoque
frecuentista, que presentaremos a continuacin.

Enfoque frecuentista 149


Este enfoque asigna probabilidades estimndola a travs de la frecuen-
cia relativa.
Por ejemplo, si una gran empresa desea conocer la probabilidad de
que una computadora adquirida a su proveedor venga con falla, no
podra utilizar el mtodo clsico ya que los dos resultados posibles (falla y no
falla) no son igualmente probables. Lo que podra hacer es consultar el regis-
tro de las ltimas compras realizadas; si de las ltimas 100 han tenido falla 2,
la frecuencia relativa 2/100 se aproximar a esa probabilidad.

Es decir, si un experimento se repite un nmero grande veces (n) y de-


notamos con la letra m el nmero de veces que ocurri el evento A, una esti-
macin de la probabilidad de A es:

m
P(A)=
n

Si en el lanzamiento del dado supiramos que el mismo est cargado


(no todas las caras son igualmente probables) y deseramos conocer la pro-
babilidad de que salga el nmero 3, podramos hacer lanzamientos seguidos y
anotar cuntas veces aparece el nmero 3. Si repetimos esta accin un nme-
ro grande de veces, la frecuencia relativa de dicho resultado se estabilizar
alrededor de un valor que es una medida estimativa de su probabilidad.

Actividad 5:
Si el 60% de 10 alumnos consultados de Estadstica I est de acuerdo con las
condiciones de regularidad de la materia, podra ese valor utilizarse como
una medida de probabilidad? Por qu?

Ejemplo 2

Si contamos con la informacin de los alumnos de Estadstica I clasificados


segn sexo y procedencia, podramos confeccionar una tabla de doble entra-
da, o tabla de contingencia, como la que sigue:

PROCEDENCIA CRDOBA OTRA PROVINCIA TOTAL


SEXO
Varn 182 65 247
Mujer 290 55 345
Total 472 120 592

Si seleccionamos al alzar un alumno de Estadstica I, cul ser la pro-


babilidad de los siguientes eventos?

V = {alumno varn}
C = {alumno que procede de Crdoba}

En este ejemplo no corresponde utilizar el enfoque clsico para calcular


150 probabilidades porque los resultados no son igualmente probables, utilizando
el enfoque frecuentista, esas probabilidades son:

P (V) = 247/592 = 0,417


P (C) = 472/592 = 0,797

Estas probabilidades se denominan simples o marginales porque se ob-


tienen de los mrgenes de la tabla de contingencia.
Captulo 3: Introduccin a las probabilidades

Mtodo subjetivo

Si no es posible aplicar el mtodo clsico, ni tampoco el mtodo fre-


cuentista porque no resulta factible repetir el experimento un cierto nmero
de veces, se puede obtener la probabilidad de manera subjetiva. Se trata de
asignar un valor entre 0 y 1 como chance de ocurrencia de un evento particu-
lar. Como su nombre lo indica, la estimacin que utilicemos como medida de
probabilidad depende del criterio de quien asigna, vara segn la persona y no
tiene ningn rigor cientfico; slo involucra algo de sentido comn y la infor-
macin disponible para definir ese valor.

Ejemplos de probabilidad subjetiva:

La probabilidad que la empresa XX entre en concurso preventivo este


ao es de 0,15
La probabilidad que Juan promocione esta materia es de 0,60
La probabilidad que nuestro pas acuerde con los acreedores externos
es de 0,50

En los ejemplos que veremos a continuacin no utilizaremos este mto-


do por las limitaciones que posee, lo cual no significa que no sea importante y
til en campos como el de la Teora de la Decisin.

Actividad 6:
Para cada uno de los casos que se plantean indique cul es el enfoque de pro-
babilidad conveniente para determinar el valor de la probabilidad que se quie-
re obtener, o el enfoque utilizado en los casos de probabilidades que han sido
calculadas.

Tenga en cuenta que el orden de preferencia para aplicar alguna Teora, es el


que se utiliz en la presentacin de las mismas.

a) Cul es la probabilidad que haya mayor desempleo el prximo ao?


b) Se lanza al aire un dado balanceado. Cul es la probabilidad que salga
un dos o un seis?
c) Se elige un punto al azar en un crculo. Cul es la probabilidad que es-
t ms cerca del centro que de la circunferencia?
d) De las personas que entran a un comercio, se elige al azar una de ellas.
Cul es la probabilidad que realice una compra?
e) De una muestra aleatoria de 400 empleados de una empresa, se ob-
tuvo que 80 de ellos haban pedido licencia por enfermedad por lo
menos una vez en el ltimo ao. Si se selecciona un empleado al azar
Cul es la probabilidad que haya pedido licencia por enfermedad en
el ltimo ao?
f) Para el prximo ao, cul es la probabilidad que el P.B.I. per cpita
aumente un 100%?
g) Se estima que la probabilidad de que un nuevo producto tenga xito es
de . 151
h) De un embarque de 100 artculos, donde hay 20 defectuosos, se se-
lecciona uno al azar. Cul es la probabilidad que resulte ser defectuo-
so?
i) El gerente de compras de una empresa estima que la probabilidad que
un pedido llegue a tiempo es de 0,80.
j) La probabilidad de seleccionar un oro en un mazo de cartas espao-
las es 12/50.
5. Axiomas y teoremas de probabilidad
Segn mencionamos en el apartado 3, a partir del espacio muestral y
la familia de eventos , se define la medida de probabilidad como una funcin
real que hace corresponder a cada elemento de un nmero comprendido
entre 0 y 1.

P: [0,1] y satisface los siguientes axiomas:

1) Sea A un evento que pertenece a , la probabilidad de A es una cantidad


mayor o igual a cero
P(A) 0

2) La probabilidad del espacio muestral, o evento cierto, es uno

P() = 1

3) Sean A y B, eventos mutuamente excluyentes o disjuntos que pertenecen a


, la probabilidad de su unin es igual a la suma de las probabilidades de cada
uno de ellos.

P(A B) = P(A) + P(B) siendo A B =

Este ltimo axioma, conocido como Regla Especial de Adicin se ex-


Para una mejor comprensin tiende a un nmero n de eventos. A partir de estos axiomas, se deducen teo-
de este axioma, se sugiere a remas que sern de utilidad para el clculo de probabilidades. Algunos de
ingresar a la seccin Materia- esos teoremas enunciamos a continuacin:
les Recursos del aula virtual
para ver la produccin audio-
Teorema 1:
visual Regla de la adicin.
Sea A un evento perteneciente a , a probabilidad del complemento de A es
igual a uno menos la probabilidad de A.

P(AC) = 1 P(A)
Demostracin:
Por definicin A AC =
Como A AC = (son disjuntos)
Por Axioma 3 P(A AC)= P(A) + P(AC) = P() = 1
P(AC) = 1 P(A)

Teorema 2:
La probabilidad del evento imposible (complemento de ) es igual a cero.

P() = 0
Demostracin:
Por aplicacin del Teorema 1 (Recordemos que = C)
152
Teorema 3:
Sean A y B, eventos que pertenecen a , entonces:

P(B A) = P(B) P(A B)


Demostracin:
Por definicin B = (A B) (B A)
Captulo 3: Introduccin a las probabilidades

Como (A B) (B A)= (son disjuntos)


Por Axioma 3 P(B) = P(A B)+ P(B A)
P(B A) = P(B) - P(A B)

Teorema 4:
Sean A y B, eventos no disjuntos, que pertenecen a , entonces:

P(A B) = P(A) + P(B) - P(A B)


Demostracin:
Por definicin A B = A (B A)
Como A (B A)= (son disjuntos)
Por Axioma 3 P(A B) = P(A) + P(B A)
P(A B) = P(A) + P(B) - P(A B)

Este teorema se conoce tambin como Regla General de Adicin.

6. Probabilidad conjunta y condicional


En esta seccin, estudiaremos los conceptos de probabilidad conjunta y
condicional. Retomemos el ejemplo trabajado anteriormente, donde se pre-
sent el concepto de probabilidad marginal.

Seleccionamos al azar un alumno de Estadstica I y deseamos calcular la


probabilidad de que sea varn y proceda de Crdoba,

V = {alumno varn}
C = {alumno que procede de Crdoba},

es decir, buscamos calcular P(V C). En este caso nos interesa calcular la
probabilidad de la ocurrencia simultnea de los dos eventos, es decir que se
presenten resultados comunes a ambos eventos. Esta probabilidad se deno-
mina probabilidad conjunta.

De acuerdo a los datos, si se aplica el enfoque frecuencial, se tiene:

P(V C) = 182/592 = 0,307

Supongamos ahora, que se selecciona un alumno al azar y se conoce


que es varn, y estamos interesados en conocer la probabilidad de que proce-
da de Crdoba. En este caso, deseamos conocer la probabilidad de que ocurra
un evento dado que otro ya ha ocurrido. Esta probabilidad se denomina pro-
babilidad condicional.

Sean los eventos A y B, tal que P(B)>0, la probabilidad condicional A


dado B, que se simboliza P(A/B), se define:
P ( A B)
P ( A/B ) =
P ( B) 153

De acuerdo a los datos, si se aplica el enfoque frecuencial, se tiene:

P ( C V ) 182 592 0,307


P ( C/V ) = = = =0,737
P (V) 247 592 0,417
Al calcular probabilidades condicionales, trabajamos en un espacio
muestral reducido. La probabilidad de un hecho (que proceda de Crdoba) en
el subconjunto considerado (varones) puede ser mayor, menor o igual que en
el espacio muestral original.
Cuando analizamos la procedencia en el subconjunto de varones, arri-
bamos a que el 73,7% de los mismos resida en Crdoba. Este valor indica que,
si se sabe que es Varn, la probabilidad de que el alumno haya residido en
Crdoba es levemente inferior a 0,797, que es la P(C) para el total de alum-
nos.
A partir de la frmula de la probabilidad condicional, podemos derivar
el clculo de la probabilidad conjunta, conocida como Regla General Multipli-
cativa:

P(A B) = P(A/B).P(B) = P(B/A). P(A)

Para ejercitar los temas desarrollados en la esta unidad les proponemos


las siguientes actividades. Recuerden que en el aula virtual cuentan con el
espacio del foro para consultar las dudas que tengan o intercambiar solucio-
nes o posibles respuestas con sus compaeros.

Actividad 7:
Se conoce que, de cada 100 estudiantes de 3 ao de la Facultad que han
optado por una sola carrera de las tres que se pueden cursar, 66 eligen Con-
tador Pblico mientras que el resto elige una de las Licenciaturas (en Admi-
nistracin de Empresas o en Economa). Tambin se sabe que el 46% son
varones (el resto mujeres) y que en las Licenciaturas hay 13 mujeres.

Seleccionamos al azar un alumno de 3 ao y, a partir de definir los eventos:

A = {alumno varn}
B = {alumno de la carrera de Contador Pblico}

Deseamos predecir las siguientes probabilidades:


a) Que sea varn
b) Que haya elegido una Licenciatura
c) Que sea mujer o haya elegido la carrera de Contador Pblico (recor-
dar la Regla General de Adicin)
d) Que sea varn dado que es un alumno que elige una Licenciatura
e) Que sea varn y haya elegido una Licenciatura
f) Que sea varn o mujer
g) Que haya elegido la carrera de Contador y una Licenciatura
h) Cmo se llaman los eventos del punto g)?

Le recomendamos armar una tabla de contingencia con los datos del enunciado.

154
Captulo 3: Introduccin a las probabilidades

Actividad 8:
Teniendo en cuenta los siguientes datos referidos a las ventas diarias (en $)
para una compaa de servicios de transporte.

Ventas Nro. das


530 730 3
730 930 7
930 1130 11
1130 1330 22
1330 1530 40
1530 1730 24
1730 1930 9
1930 2130 4
Total 120

Calcule la probabilidad de que un da particular:


a) venda entre $ 1330 y $ 1530.
b) venda $ 1530 o ms.
c) En base a qu teora asign probabilidades a los eventos?

Actividad 9:
Los datos sobre las ventas diarias de un producto en los ltimos 2 meses (60
das) para LUZ S.A. se exponen en la tabla siguiente:

Nmero de Cantidad
productos vendidos de das
0 15
1 20
2 13
3 9
4 o ms 3

Si se elige un da al azar, se pide:


a) Cuntos son los resultados posibles?
b) Cul es la probabilidad de que no venda productos?
c) Cul es la probabilidad de que venda 1 producto?
d) Cul es la probabilidad de que venda 3 o ms productos?

Actividad 10:
Dados los eventos A y B que pertenecen al mismo espacio probabilstico
sobre los cuales se sabe que P(A) = 0.3, P(B) = 0.6 y P(A U B) = 0.8, calcu-
le:

a) P(AC) 155
b) P(BC)
c) P(A B)
d) P(AC BC)
e) P(AC B)
f) P(A BC)
g) P(AC BC)
Cuando los eventos pueden presentarse simultneamente la probabili-
dad conjunta es distinta de cero. La expresin para cuantificarla depende de si
los eventos considerados son dependientes o independientes.

7. Independencia de eventos

Decimos que dos eventos son independientes si la ocurrencia de uno de ellos


no modifica la probabilidad de aparicin del otro; es decir que su ocurrencia
no produce efecto en la probabilidad simple del otro. Caso contrario los even-
tos son dependientes.

Para ilustrar la independencia de eventos, veamos el siguiente ejemplo.


Supongamos que tiramos dos monedas al aire, el resultado de una de
ellas (cara o sello) no est afectado por el resultado de la otra (cara o sello);
decimos entonces que el resultado de la segunda moneda no depende del
resultado de la primera.

Si estamos frente a dos eventos independientes A y B, la probabilidad de


que ocurran A y B se obtiene multiplicando las probabilidades simples de cada
uno de ellos. Esto se conoce como Regla Especial de Multiplicacin.

En frmulas se expresa: P(A B) = P(A).P(B)

En el ejemplo anterior de la moneda cul es la probabilidad de que en


ambas tiradas el resultado sea cara?

P (cara y cara) = P(cara) . P(cara) = 0,50 . 0,50 = 0,25

Si estamos frente a eventos independientes, podemos calcular una


probabilidad condicional?

Si relacionamos las frmulas de probabilidad condicional y probabilidad


conjunta de eventos independientes tenemos que:

P ( A B ) P ( A ) .P ( B )
P ( A/B ) = = =P ( A )
P ( B) P ( B)

Es decir, la probabilidad del evento A no vara ante la aparicin del even-


to B (su probabilidad condicional es igual a su probabilidad simple), por lo que
podramos expresar la independencia de eventos de la siguiente manera:

Si P(A/B) = P(A) entonces A y B son eventos independientes

156 Veamos un ejemplo para ilustrar lo que acabamos de expresar. Supon-


gamos que en un lote de 100 productos hay 8 que son defectuosos. Si selec-
cionamos un producto al azar la probabilidad de que sea defectuoso es 8/100.
Si seleccionamos otro ms, la probabilidad de que el segundo tambin lo sea
(si reponemos el primero de ellos al lote) ser 8/100 por lo que la probabili-
dad simple de defectuoso no cambi en esta segunda extraccin. Esto lleva a
concluir que la probabilidad de que ambos sean defectuosos es:
8 8
P ( D1 D2 ) = P ( D1 ) .P ( D2 / D1 ) = . = 0, 0064
100 100
Captulo 3: Introduccin a las probabilidades

Si no reponemos el primer producto antes de seleccionar el segundo


(Muestreo sin reemplazo), la probabilidad es:
8 7
P ( D1 D2 ) = P ( D1 ) .P ( D2 / D1 ) = . = 0, 0056
100 99

En relacin al ejemplo que trabajamos en la seccin anterior podemos


decir que el sexo es probabilsticamente independiente del lugar de proceden-
cia?

Utilizando los datos de la Tabla de Contingencia, tenemos que:

P (V C) = 182/592 = 0,307 y P(V) . P(C) = 247/592 x 472/592 = 0,332

Observamos que: P (V C) P(V) . P(C) ; por lo que concluimos que el


sexo no es independiente del lugar de procedencia.

Nota: Esta verificacin se puede realizar con cualquiera de las cuatro probabi-
lidades conjuntas de la tabla de contingencia.

Actividad 11:
Defina eventos a partir del ejemplo de la tirada de una moneda tres veces y
trate de concluir si los mismos son independientes o no.

Actividad 12:
Un lote de produccin tiene 15 artculos buenos, 6 tienen defectos poco sig-
nificativos y 3 con defectos graves.

1) Si se elige un artculo al azar, encuentre la probabilidad que:


a) No tenga defectos.
b) Tenga un defecto grave.
c) Que sea bueno o que tenga un defecto poco significativo.

2) Si del mismo lote se toman dos artculos sin reposicin, encuentre la


probabilidad que:
a) Ambos tengan defectos poco significativos.
b) Ninguno sea bueno.
c) Exactamente uno sea bueno.
d) Ninguno tenga defectos graves.
e) Por lo menos uno sea bueno.

157
Actividad 13:
La empresa MICA S.A., tiene un directorio conformado por 6 varones y 3
mujeres. Dicha empresa debe elegir en el mes prximo al nuevo presidente,
para lo cual se armar un Comit con 3 de los miembros del directorio, para
que efecte recomendaciones sobre quin deber ser el nuevo presidente.

Determine:
a) Cul es la probabilidad de que los 3 integrantes del comit evaluador
sean mujeres?
b) Cul es la probabilidad de que los 3 integrantes sean varones?
c) Cul es la probabilidad de que los tres integrantes sean todos varo-
nes o todas mujeres?
d) Cul es la probabilidad de que se seleccionen una mujer y dos varo-
nes?
e) Si se decide ampliar el Comit a cuatro personas, cul es la probabilidad
de que todas sean mujeres? Cmo se denomina este tipo de evento?

Actividad 14:
Una compaa produce y vende dos tipos de productos (producto A y pro-
ducto B). Se estima que la probabilidad de que el producto A tenga una ga-
nancia superior al 15% es 0,25, que el producto B tenga el mismo margen de
ganancia es 0,30 y que ambos productos superen el 15% de ganancia es
0,08. En base a estas estimaciones que realiz el gerente se pide:

a) Qu teora se aplic para asignarle probabilidades a los eventos?


b) Cul es la probabilidad que el producto B tenga un margen de utili-
dad superior al 15% dado que el producto A alcanza el mismo mar-
gen de utilidad?
c) Determine si el evento A deja una utilidad superior al 15% y B de-
ja una utilidad superior al 15% son estadsticamente independien-
tes.

Actividad 15:
Dados los eventos A y B, que pertenecen al mismo espacio probabilstico,
sabiendo adems que P(A) = 0.40; P (B) = 0.30 y P (A/B) = 0, entonces:

a) A y B son estadsticamente independientes. V-F


b) A y B son mutuamente excluyentes. V-F
c) P (AC/ B) = 1. V-F

Indique en cada uno de los casos si son Verdaderas o Falsas cada una de las
afirmaciones, y justifique su respuesta.

158
Captulo 3: Introduccin a las probabilidades

Actividad 16:
Dados los eventos A y B, mutuamente excluyentes, que pertenecen al mismo
espacio probabilstico y sabiendo que:

P(A) = 0,20 y P(B) = 0,40

Determine si son Verdaderas o Falsas cada una de las siguientes afirmaciones


y justifique su respuesta.

a) Si los eventos son mutuamente excluyentes (A B = ), entonces los


eventos son estadsticamente independientes. V-F
b) P (A) + P (B) P(A B) = 0,52. V-F
c) P(A/B) = 0,20. V-F

Actividad 17:
Cundo dos eventos estadsticamente independientes son tambin mutua-
mente excluyentes? Marque la alternativa correcta y pruebe por qu.

a) Cuando el producto de las probabilidades de dos eventos no vacos es


distinto a la probabilidad de la interseccin de los mismos.
b) Cuando el producto de las probabilidades de dos eventos no vacos es
igual a la probabilidad de la interseccin de dichos eventos.
c) Cuando uno de los dos eventos es vaco y el producto de las probabili-
dades es igual a la probabilidad de la interseccin de dichos eventos.
d) Cuando uno de los dos eventos es vaco y el producto de las probabili-
dades es distinto a la probabilidad de la interseccin de los mismos.
e) Cuando la probabilidad condicional de un evento no vaco dado otro
evento no vaco es igual a la probabilidad del primero.

8. Ley de Probabilidad total


A efectos de derivar la Ley de Probabilidad total, introduciremos un
nuevo concepto. Llamaremos particin aleatoria de al conjunto de eventos
Ai tales que:

A1 A2 A3 .......... An = con Ai Aj = ; i j

Como vemos, se trata del conjunto de eventos mutuamente excluyentes


y colectivamente exhaustivos (sin interseccin y que cubren todo el espacio
muestral).

La Ley de probabilidad total indica que dada una particin aleatoria de , para
cualquier evento B se cumple que:

n
P(B)= P(A1).P(B/A1)+P(A2).P(B/A2)++ P(An).P(B/An)= P(A ).P(B/A )
i=1
i i

159
Demostracin:
Consideremos el evento B y la particin aleatoria de {A1 A2 A3 ... An}

B=B
B = B [A1 A2 ... An]
B = (B A1) (B A2) (B An)
Por axioma 3 P(B) = P(B A1)+P(B A2)+ +P(B An)
P(B) = P(A1).P(B/A1)+ P(A2).P(B/A2)++ P(An).P(B/An)

Veamos un ejemplo, se conoce que en la industria alimenticia la preva-


lencia de operaciones de exportacin es del 11% en empresas de capi-
tal nacional y 23% en empresas de capital extranjero; y adems que 7% de las
empresas de dicha rama son extranjeras, cul es la probabilidad de opera-
ciones de exportacin en la industria alimenticia de nuestro pas?

A1 = {empresa nacional}
A2 = {empresa extranjera}
eventos que constituyen una particin aleatoria de

P(A1) = 0,93 ; P(A2) = 0,07

B = {operaciones de exportacin}
P(B/A1) = 0,11 y P(B/A2) = 0,23

P(B)=P(A1).P(B/A1)+P(A2).P(B/A2)=0,93.0,11+0,07.0,23=0,1184

Actividad 18:
Cuatro mquinas, X20, X21, X22 y X23, producen 30%, 25%, 15% y 30% res-
pectivamente del total de productos de una industria, siendo la proporcin de
productos defectuosos de 0,02; 0,03; 0,05 y 0,07 para cada mquina respec-
tivamente.
Si se selecciona un producto al azar, cul es la probabilidad de que sea defec-
tuoso?

Una aplicacin importante vinculada a la ley de Probabilidad Total, es lo


que se conoce como Teorema de Bayes que, como veremos a continuacin se
utiliza para calcular una probabilidad condicional.

9. Teorema de Bayes

El anlisis bayesiano consiste en hacer inferencias sobre causas posibles a


partir de los efectos o resultados conocidos de los eventos. En este caso se
aplica la idea de probabilidad condicional que vimos en su momento.

Se trata de calcular una probabilidad a posteriori despus que se ha ob-


servado un efecto determinado, es decir; se revisa o ajusta una probabilidad a
priori de un evento hacia una probabilidad a posteriori ms confiable ya que
se basa en los resultados que ofrece la evidencia de una muestra o un estudio
adicional.
160
Veamos un ejemplo. En un estudio sobre el mercado laboral se tienen
los siguientes datos referidos al nivel educacional y empleo:
Captulo 3: Introduccin a las probabilidades

NIVEL DE
NIVEL DE EDUCACIN TRABAJA
EDUCACIN
Primario 30% 40%
Secundario 40% 60%
Universitario 25% 90%
Postgrado 5% 95%

Si se selecciona una persona al azar y observamos que est trabajando


cul es la probabilidad de que esta persona tenga ttulo secundario?

Con los datos anteriores podemos construir la siguiente tabla:

Evento Ai
P(Ai) P(T/Ai) P(Ai T)= P(Ai). P(T/Ai)
Nivel de educacin
A1 = Primario 0,30 0,40 (0,30 x 0,40) = 0,12
A2 = Secundario 0,40 0,60 (0,40 x 0,60) = 0,24
A3 = Universitario 0,25 0,90 (0,25 x 0,90) = 0,225
A4 = Postgrado 0,05 0,95 (0,05 x 0,95) = 0,0475

Las probabilidades P(Ai) se denominan probabilidades a priori debido a


que la probabilidad se asigna antes de haber obtenido datos empricos. Refle-
jan el nivel actual de informacin.

Por ejemplo, la probabilidad de que la persona seleccionada al azar


tenga nivel Secundario es:
P(A2) = 0,40

Las probabilidades P(T/Ai) son probabilidades condicionales que sur-


gen de considerar datos empricos (evidencia), los cuales se observan, en
nuestro caso para cada nivel educacional.

Por ejemplo, la probabilidad de que la persona trabaje, dado que tiene


nivel secundario es:
P(T/A2) = 0,60

Estas probabilidades permiten calcular probabilidades condicionales


P(Ai/T), conocidas como probabilidades a posteriori debido a que se deter-
minan una vez obtenidos los datos empricos, mediante el empleo de Teorema
de Bayes. Se trata por lo tanto de una probabilidad revisada con base en in- Para una mejor comprensin
formacin adicional. del Teorema de Bayes, se
sugiere ingresar a la seccin
Dados el evento B y la particin aleatoria de {A1 A2 A3 ... An}, el Teo- Materiales Recursos del aula
rema de Bayes establece: virtual para ver las produccio-
nes audiovisuales llamadas
P ( AJ B ) P ( AJ ) .P ( B / AJ ) Teorema de Bayes: Introduc-
P ( AJ / B ) = = n J = 1, 2,..., n cin y Teorema de Bayes.
P ( B)
P( Ai ).P( B / Ai )
i =1

Es decir que, la probabilidad de que la persona elegida tenga nivel se-


cundario sabiendo que trabaja es:
161
P(A2) . P(T/A2)
P(A2/T) =
P(A1).P(T/A1) + P(A2).P(T/A2) + P(A3).P(T/A3) + P(A4).P(T/A4)

0,24
= = 0,379
0,6325
Con este ejemplo vemos cmo la probabilidad inicial (a priori) del nivel
educativo secundario (0,40) queda revisada despus de que se obtuvo la
informacin de que la persona seleccionada trabaja.

Actividad 19:
Si a partir de los datos de la Actividad 18 se selecciona un artculo y es de-
fectuoso, cul es la probabilidad que haya sido producido por la mquina
X21?

Actividad 20:
En un curso de capacitacin para administrativos de una compaa, 60% de
los asistentes son mujeres; el 75% de los hombres son egresados de la uni-
versidad y el 50% de las mujeres tambin.

a) Elabore un diagrama de rbol que muestre todas las probabilidades


e indique cmo se llaman cada una de ellas.
b) Si se selecciona al azar una persona del curso para hacerle una en-
trevista, cul es la probabilidad de que se trate de una mujer uni-
versitaria?
c) Si se selecciona un egresado universitario al azar, cul es la probabi-
lidad de que sea mujer?

Actividad 21:
En el ltimo ao Talleres jug al ftbol con Belgrano el 7% de los partidos, el
93% restante con otros equipos. Talleres gan el 95% de los clsicos, mien-
tras que slo gan el 10% de los partidos que jug con otros equipos.

a) Estos dos equipos de Crdoba estn por jugar prximamente, cul


es la probabilidad que no gane Talleres?
b) En el diario del da de hoy se informa que Talleres gan ayer, cul
es la probabilidad que haya jugado con Belgrano?

Actividad 22:
En una empresa hay dos mquinas con las que se enlata una nueva gaseosa,
la mquina A produce el 40% del total de la produccin y la mquina B el
resto. Adems, se sabe que la mquina A produce un 20% de artculos con
defectos en su envasado y mientras que la B slo un 15%.

Calcule la probabilidad que, seleccionada una lata defectuosa en su envasado,


sta haya sido producida por la mquina B.

162
Captulo 3: Introduccin a las probabilidades

10. Referencias Bibliogrficas

- Berenson, M y Levine, D (2003) Estadstica Bsica en Administracin. Con-


ceptos y Aplicaciones. 6 Edicin Prentice Hall.

Daz Margarita (2003). Notas de Probabilidad y Variable Aleatoria . Asocia-


cin Cooperadora de la Fac. Cs. Econmicas de la U.N.C.

- Daz Margarita .[et.al.] (2004) Estadstica I: Gua de Estudio. -1ra Ed. Cr-
doba Asociacin Cooperadora de la Fac. de Cs. de la U.N.C., 2009.338 pginas
27x21 cm ISBN 978-987-1436-21-7.

- Hoel .[et.al.] (1971). Introduction to Probability Theory. Hougton Mifflin


Company. Boston

- Pea, Daniel (2001) Fundamentos de Estadstica. Editorial Alianza.

- Saino Martin (2009). Clculo de Probabilidades. Gua de aplicaciones prc-


ticas correspondiente a los Captulos III a VI del programa de Estadstica I.
Asoc Coop F.C.E. (U.N.C.).

163
Anexo 1:
Lectura complementaria

Repaso de lgebra de Conjuntos

Dado un conjunto A = {a, b, c}, la relacin de pertenencia de sus ele-


mentos se simboliza con a A.

Se llama cardinal de un conjunto al nmero de elementos que contie-


ne, y se simboliza con # (A).

Se llama conjunto vaco a aqul que no contiene ningn elemento, y se


simboliza con .

Se llama conjunto universal a aqul formado por todos los elementos


que se estn considerando, y se simboliza con .

Se llama complemento de A al conjunto formado por todos los ele-


mentos del conjunto universal que no pertenecen al conjunto A, y se
simboliza con A .

Se dice que B es un subconjunto de A si todos sus elementos pertene-


cen a A. Se simboliza con B A y se dice que B est incluido en A.

Dados dos conjuntos A y B se llama unin de ambos al conjunto for-


mado por los elementos que pertenecen slo a A, slo a B a ambos, y
se simboliza con A B.

Dados dos conjuntos A y B se llama interseccin de ambos al conjunto


formado por los elementos comunes que pertenecen a A y B, y se sim-
boliza con A B.

Dos conjuntos A y B se llaman disjuntos si no poseen elementos en


comn, por lo que su interseccin es el conjunto vaco, y se simboliza
A B = .

El conjunto formado por todos los subconjuntos posibles de un univer-


so dado se denomina lgebra de Sucesos o Familia de Conjuntos, y se
simboliza con .

Repaso de Tcnicas de Conteo

Para el clculo de probabilidades es necesario contar el nmero de resultados


posibles de un experimento como tambin el nmero de resultados que son
favorables a un evento dado. Este proceso de conteo puede simplificarse me-
diante el empleo de las denominadas tcnicas de conteo. En este apartado
slo revisaremos las Permutaciones, Variaciones y Combinaciones.
164
Permutaciones

Una Permutacin es un arreglo en un orden particular de los objetos


que forman un conjunto. Dado un conjunto de n elementos, el nmero
de permutaciones de esos n objetos es:
Pn = n. ( n 1) . ( n 2 ) ... ( 2 ) . (1) = n !
Captulo 3: Introduccin a las probabilidades

que es el producto de un entero positivo (n) por todos los que le pre-
ceden; expresin que se denota por n! y se lee n factorial. Dos per-
mutaciones cualesquiera slo difieren en el orden de sus elementos.

Variaciones

Una Variacin es un arreglo en un orden particular de r objetos selec-


cionados a partir de un conjunto de n elementos. Dado un conjunto de
n elementos, el nmero de variaciones de r elementos de esos n obje-
tos es:
n!
Vnr =
( n r )!
Dos variaciones cualesquiera pueden diferir en algn elemento o bien
teniendo los mismos elementos en el orden de los mismos.

Combinaciones

Una Combinacin es un arreglo de r objetos seleccionados a partir de


un conjunto de n elementos sin importar el orden de los mismos. Dado
un conjunto de n elementos, el nmero de combinaciones de r elemen-
tos de esos n objetos es:
n!
Cnr =
r !( n r ) !

Dos combinaciones cualesquiera slo difieren en algn elemento

165
Soluciones y respuestas al Captulo 3
Gua de Estadstica

Actividad 1

a) = {oro, basto, espada, copa} Discreto (finito numerable)


b) = {N / 1 N 12 } Discreto (finito numerable)
c) = {1, 2, 3,..} Discreto (finito no numerable)
d) = {1, 2, 3,..} Continuo
e) = {c1,c2,c3,c4,c5,c6,s1,s2,s3,s4,s5,s6} Discreto (finito numerable)

Actividad 2

Ejemplo 1: Elegir al azar un estudiante de la Facultad de Ciencias Econmicas e


indagar sobre el sexo y si vive con sus padres.
= {(varn, si),(mujer, si),(varn, no),(mujer, no)} Discreto ( finito numera-
ble)

Resto: a cargo del alumno

Actividad 3

a) Ejemplo 1:
A={varn que vive con sus padres}={(varn, si)} es un evento simple
B={varn}={(varn, si),(varn, no)} es un evento compuesto

Resto: a cargo del alumno

b) A cargo del alumno.

c) Ejemplo 1:
B={varn}={(varn, si),(varn, no)}
C={mujer}={(mujer, si),(mujer, no)}
D={vive o no con sus padres}= {(varn, si),(mujer, si),(varn, no),(mujer,
no)}

B y C son mutuamente excluyentes y colectivamente exhaustivos.


D es evento cierto

Resto: a cargo del alumno

166 Actividad 4

a) Que se trate de una parcela de nivel de produccin alto.


b) Que se trate de una parcela de la Zona C y que tenga un nivel bajo de pro-
duccin.
c) Que No pertenezca a la zona A (es decir que puede pertenecer a la zona B
o C).
Captulo 3: Introduccin a las probabilidades

d) Que pertenezca a la zona A y B.

Actividad 5

Ese valor podra utilizarse como una medida de probabilidad slo si el experi-
mento se realiza un nmero grande de veces, es decir se consultan ms alum-
nos.

Actividad 6

a) Subjetivo
b) Clsico
c) Clsico
d) Subjetivo
e) Frecuencial
f) Subjetivo
g) Subjetivo
h) Frecuencial
i) Subjetivo
j) Clsico

Actividad 7

A = varn C = mujer Total


B = Contador Pblico 25 41 66
D = Licenciaturas
21 13 34
(Administracin o Economa)
Total 46 54 100

a) P(A)= 46/100= 0.46


b) P(D) = 34/100 = 0.34
c) P( C U B) = P( C) + P(B) P( C 41/100=
B) = 54/10 0 + 66/10 0
79/100=0,79
d) P(A/D) = P( A D) / P( D) = (21/10 0 )/(34/10 0 ) = 0 .6176
e) P(A D) = 21/10 0 = 0 .21
f) P( A U C) = P(A) + P( C) = 46/100+54/100= 1 (Evento CIERTO)
g) P( B D) = P( ) = 0 (Evento IM POSIBLE)
h) Son mutuamente excluyentes.

Actividad 8

a) P( venda entre $1330 y $1530) = 40/120 = 0.333


b) P( venda $1530 o ms ) = (24+9+4 ) /120 = 37/120 = 0.308
c) Frecuencial

Actividad 9
167
a) Los resultados posibles son 5: = {(0),(1),(2),(3),(4 o ms)}
b) P(no vender productos) = 15/60 = 0.25
c) P(vender 1 producto) = 20/60 = 0.333
d) P(vender 3 o ms productos) = (9+3)/60 = 12/60 = 0.20
Actividad 10

a) P(AC) = 0.70
b) P(BC) = 0.40
c) P(A B) = 0.10
d) P(AC BC) = 0.20
e) P(AC B) = 0.50
f) P(A BC) = 0.20
g) P(AC BC) = 0.90

Actividad 11

A cargo del alumno

Actividad 12

1) Denotamos B ={bueno}, D ={defecto poco significativo} y G ={defecto


grave}
a) P(B) = 15/24
b) P(G) = 3/24
c) P(B U D) = P( B) + P( D) = 15/24 +6/24 = 21/24

2) Se toman dos artculos sin reposicin


a) P(D D) =6/24*5/23 = 0.0543
b) P(BC BC) = 9/24*8/23 = 0.1304
c) P{(B BC) (BC B) } = 15/24*9/23 + 9/24*15/23 = 0.4891
d) P(GC GC) = 21/24*20/23 = 0.7609
e) P(uno bueno) + P(los dos buenos) = P{(B BC) (BC B) }+ P(B B) =
0.4891 + 0.3804 = 0.8695

Actividad 13

a) P( M M M ) = 3/9* 2/8* 1/7 = 1/84 = 0.0119


b) P( V V V ) = 6/9* 5/8 * 4/7 = 5/21 = 0.2381
c) P{(V V V) U (M M M)} = 0.25
d) P(una mujer y dos varones) = P(M V V) + P(V M V) + P(V V
M) =3/9*6/8*5/7+6/9*3/8*5/7+6/9*5/8*3/7 = 0.5357
e) La probabilidad es igual a 0. El evento es imposible porque solo hay 3 mu-
jeres en el directorio.

Actividad 14

a) Subjetiva
168 b) Sean A = {el producto A deja un margen de utilidad superior al 15%} y B =
{el producto B deja un margen de utilidad superior al 15%}
P(B/A) = P(B A)/P(A) = 0.08/0.25 = 0.32
c) A y B son independientes si P(B A) = P(B)*P(A)
P(B A) = 0.08 P(B)*P(A) = 0.30*0.25 = 0.075
Como no se cumple la condicin de independencia concluimos que A y B son
estadsticamente dependientes.
Captulo 3: Introduccin a las probabilidades

Actividad 15

a) Falso porque si A y B son estadsticamente independientes entonces


P(A/B)=P(A) y en este caso no se cumple: 0 0.40
b) Verdadero porque P(A B) = P(A/B)*P(B) = 0*0.30 = 0
c) Verdadero porque P (AC/ B) = P(AC B)/P(B) = 0.30/0.30 = 1.

Actividad 16

a) Falso porque no se cumple la condicin de independencia P(A B) =


P(A).P(B): 0 0,20.0,40
b) Falso porque P (A) + P (B) P(A B) = 0,20 +0,40 0 = 0.
c) Falso porque P(A/B) = 0/0,40 = 0.

Actividad 17

La alternativa correcta es la c) Cuando uno de los dos eventos es vaco y el


producto de las probabilidades es igual a la probabilidad de la interseccin de
los mismos.
Sean A = tal que P(A) = 0 y B no vaco, entonces A y B son mutuamente
excluyentes, es decir P(A B) = 0 y se cumple la condicin de independencia
P(A B) = P(A).P(B) ya que P(A).P(B) = 0.P(B) = 0

Actividad 18

Sean A1 = {artculo producido por mquina X20}, A2 = {artculo producido por


mquina X21}, A3 = {artculo producido por mquina X22} y A4 = {artculo
producido por mquina X23} tales que:

P(A1) = 0.30, P(A2) = 0.25, P(A3) = 0.15 y P(A4) = 0.30


D = {artculo defectuoso}
P(D/A1) = 0.02, P(D/A2) = 0.03, P(D/A3) = 0.05 y P(D/A4) = 0.07
P(D) = P(A1).P(D/A1)+P(A2).P(D/A2)+P(A3).P(D/A3)+ P(A4).P(D/A4)=
P(D) = 0,30.0,02 + 0,25.0,03 + 0,15.0,05 + 0,30.0,07 = 0,042

Actividad 19
P(A2/D) = 0,1786

Actividad 20

a) Sean M = {mujer}, V = {varn}, U = {egresado de la Universidad},

P(U/M) = 0.50 169

P(M)=0.60
P(UC/M) = 0.50
Curso
P(U/V) = 0.75
P(V)=0.40
P(UC/V) = 0.25
b) P(M U) = 0.30
c) P(M/U)= 0.50

Actividad 21

Sean B = {Talleres juega con Belgrano} y G = {Talleres gana el partido} tales


que P(B) = 0.07 , P(G/B) = 0.95 y P(G/BC) = 0.10.

a) P(GC/B) = 0.05
b) P(B/G) = 0.417

Actividad 22

Sean A = {artculo producido por la mquina A}, B = {artculo producido por la


mquina B} y D= {artculo defectuoso}, tales que P(A) = 0.40, P(B) =0.60,
P(D/A) = 0.20 y P(D/B)= 0.15.

P(B/D) = 0.529

170

Potrebbero piacerti anche