Sei sulla pagina 1di 83

GUIA DE ESTADSTICA I

PRESENTACION
Espero que esta gua constituya un material de apoyo sencillo y til para los alumnos y
profesores de todos los Programas de Formacin de Grado en la Universidad Bolivariana de
Venezuela.

La gua est estructurada en cinco mdulos:


Mdulo I. Conceptos Bsicos, Clasificacin de la Estadstica, La Estadstica y El Mtodo
Cientfico, Datos, Variables, Series Cronolgicas, Variables Univariantes y
Multivariantes , Estadstico y Parmetro.
Mdulo II. Organizacin y Presentacin de Datos en Cuadros y Grficos.
Mdulo III. Medidas de Localizacin y Dispersin.
Mdulo IV. Medidas de Forma.
Mdulo V. Demografa.

Notacin de suma con sigma (sumatoria)


Antes de comenzar la siguiente seccin, se introducir un tipo de notacin matemtica que
sirve para expresar muchas de las frmulas que se utilizan en los procedimientos estadsticos
que se estudiarn ms adelante. En muchas ocasiones ser necesario obtener la suma de un
conjunto de nmeros.
Supngase que alguna variable X toma los siguientes valores: 9

Ntese que puede considerarse 9 como el primer valor de X, 4 como el segundo valor de X, 3
como el tercer valor de X, 1 como el cuarto valor de X, y 6 como el quinto valor de X. Una
manera sencilla de expresar esto consiste en utilizar subndices que representen la posicin del
valor en la lista. De este modo, el 9 que es el primer valor de X ser representado por x ; de
1

manera similar, debido a que 4 es el segundo valor de X, estar representado por x . Es decir:
2

x =9

x =4

x =3
3

x =1
4

x =6
5

Cuando se desee referir a un valor de X de forma general sin hacer especificaciones, se


utilizar el subndice i y al valor se le llamar x (lase "equis sub i")
i

La
letra griega (sigma mayscula) se utiliza para denotar una suma. Entonces
El smbolo en la expresin anterior indica que se deben sumar los valores de X. Adems, la
expresin "i = 1" que se encuentra debajo de sigma comienza con el valor de X que tiene el
subndice i = 1 (x ). De esta manera, se suman sucesivamente los valores de X, uno cada vez,
1

y la operacin es finalizada cuando se alcanza el valor de X cuyo subndice es igual al nmero


entero que se encuentra encima de sigma, 5 (x ). Por consiguiente en la suma anterior se tiene
5

paso por paso:

Si slo se desea sumar algunos valores, se utilizan los subndices anotados por debajo y por
encima de . Por ejemplo:

Al invertir este proceso, se puede utilizar este mtodo para abreviar la expresin de los datos
que se quiere sumar, por ejemplo:

La notacin sigma puede tambin utilizarse con expresiones ms complicadas, como se


demuestra en los siguientes ejemplos:

Propiedades de
Teorema 1 Si a es una constante y cada uno de los n valores diferentes de i es igual a a,
entonces:

Prueba
Como cada una de las x es igual a una cantidad constante a:

Teorema 2
Sea a una constante cualesquiera de todos los valores individuales que intervienen en la suma,
4

Prueba

Teorema 3
La notacin sigma se puede distribuir respecto de la suma (o de la diferencia):

Prueba
Lo anterior se cumple porque:

Introduccin y Estadstica Descriptiva

Estadstica: conceptos bsicos y utilidad


Los conceptos y Mtodos que proporciona la estadstica son de invaluable utilidad en la toma
de decisiones ante situaciones de incertidumbre.
La estadstica provee potentes herramientas analticas que se emplean en una gran variedad de
situaciones: en el gobierno, en la empresa privada, en los negocios, en la industria, en
investigaciones: mdicas, econmicas, sociolgicas, biolgicas, agrcolas, genticas, fsicas,
entre otras.
Definicin de Estadstica
La estadstica es un conjunto de conocimientos y mtodos que se utilizan en la recoleccin,
organizacin, presentacin y anlisis de la informacin relativa a un fenmeno o hecho
determinado y que le permite al investigador tomar decisiones en situaciones donde est
presente la incertidumbre.
Como procedimiento para la toma de decisiones, la estadstica se emplea hoy en da en toda
clase de estudios cientficos, siendo efectiva no solamente en los experimentos de laboratorio
sino tambin lo es en estudios fuera de l.
La estadstica es de mucha utilidad para dar respuesta, con justificacin cientfica, a
interrogantes como las siguientes:
Cmo puede probar un gran laboratorio la eficiencia de un nuevo frmaco.
Cmo el gobierno puede pronosticar la poblacin para el ao 2010 con fines de planificacin
en cuanto a seguridad social de los trabajadores.
Los cambios (disminucin o crecimiento) en el ndice de desempleo se deben a las polticas
gubernamentales o a fluctuaciones estacionales?
Para controlar la calidad de cierto artculo producido por una empresa, cuntos de estos
deben examinarse?
Cmo es posible predecir el resultado de unas elecciones si solamente se entrevistan unos
pocos votantes.
Existe relacin entre el fumar y el cncer del pulmn?
Cmo medir y determinar los cambios (aumentos o disminuciones) en: los precios de los
alquileres de viviendas, la inflacin, el nivel de desempleo, el consumo de cierto producto,
las muertes registradas los fines de semana, etc.
Nota:
1. La nocin de estadstica se deriv originalmente del vocablo estado, porque ha sido
funcin tradicional de los gobiernos centrales llevar registros de poblacin, nacimientos,
defunciones, votaciones, cosechas, impuestos y muchas otras clases de cosas y actividades.
1

Estos apuntes estn basados principalmente en el libro: Armas Gonzlez, J. Manuel (1998).
Estadstica Sencilla: Descriptiva.
Facultad de Ciencias Econmicas y Sociales. Escuela de Estadstica. Mrida. ULA.
.
6

2. Es importante en este momento hacer la siguiente aclaratoria, debido a la confusin de


muchas personas en cuanto al significado de las palabras estadstico y estadista. Segn el
diccionario Larousse:
Estadista: Poltico, persona que ejerce un alto cargo en la administracin del estado.
Estadstico: Persona que se ocupa de investigaciones estadsticas.

Universo Estadstico
Generalmente, existe un conjunto de elementos claramente definidos en el que el
investigador est interesado. Este conjunto se llama universo. Es un conjunto, finito o
infinito de seres vivos, elementos o cosas, sobre las cuales estn definidas caractersticas o
variables que interesa analizar.
Los elementos individuales que conforman el universo se llaman Unidades Elementales
(tambin se conocen como unidades individuales o unidades de observacin) Las unidades
elementales poseen las caractersticas de inters, las cuales pueden ser de naturaleza
cuantitativa o cualitativa.
Ejemplos:
Los ros de Venezuela
Los hogares del Estado Barinas
Las aves de un parque nacional
Los estudiantes de la UBV
Los rboles de un bosque
Las familias de una ciudad

Poblacin Estadstica
La poblacin, es un conjunto de valores asociados con los elementos del universo. Es la
coleccin de todas las posibles mediciones que pueden hacerse de la caracterstica en
estudio. Obsrvese que una poblacin estadstica es una coleccin de valores no una
coleccin de personas.
Entonces, la poblacin va a estar constituida por datos o valores y puede ser finita o
infinita. Una poblacin finita es aquella en la cual el nmero de elementos puede ser
contado y es limitado. Una poblacin es infinita si la cantidad de elementos que la
componen es ilimitada o su composicin es tal, que dichos elementos no pueden ser
contados. En la prctica, este concepto de infinito tambin expresa la idea de indeterminado
o indefinido e incluso poblaciones finitas excesivamente grandes se les considera como
infinitas.
Al nmero de elementos en la poblacin se le denomina tamao de la poblacin y, en el
caso finito, este tamao se denota con la letra N.
7

Ejemplo:
Grado de contaminacin de ros
Ingreso mensual de los hogares
Nmero de placa de los vehculos
Edades de los alumnos que cursan la unidad curricular estadstica en la UBV
Volmenes de madera de cada uno de los rboles que integran el bosque.
Nota:
De un mismo universo puede derivarse ms de una poblacin. Por ejemplo, del universo de
estudiantes de la UBV podemos estar interesados en estudiar caractersticas tales como:
Edad, sexo, ingresos, estado civil, rendimiento acadmico, grado de instruccin, peso, tipo
de sangre y religin. De cada una de estas diez caractersticas (variables) se origina una
poblacin, es decir, del universo estudiantes de la UBV obtenemos las poblaciones de
edades, las poblaciones de sexo, la poblacin de ingresos, la poblacin de estados civiles,
la poblacin de rendimientos acadmicos, la poblacin de grado de instruccin, la
poblacin de pesos, la poblacin de tipos de sangre y la poblacin de religiones de los
estudiantes de la UBV.
Ntese que en este ejemplo el universo est compuesto por personas (estudiantes) que son
los que poseen las caractersticas de inters y las mediciones que se obtienen para cada una
de estas caractersticas (edad, sexo, ingreso, estado civil, rendimiento acadmico, grado de
instruccin, peso, tipo de sangre y religin) constituyen las poblaciones. As, una de estas
poblaciones va a estar constituida por N nmeros que representan cada una de las N edades
de los estudiantes de la UBV.

Muestra
Frecuentemente es imposible obtener o medir todos los valores en una poblacin. Un
subconjunto de valores de la poblacin se conoce como una muestra. Es decir, una muestra
es una parte de una poblacin. De esta manera, como la poblacin es un conjunto de
mediciones de la caracterstica bajo estudio, y la muestra es un subconjunto de la poblacin,
sta va a estar constituida tambin por mediciones de la caracterstica.
As, una muestra esta compuesta por n mediciones sobre las unidades elementales. En otras
palabras, n representa el tamao de la muestra y por lo tanto n N. Fcilmente se puede
deducir que de una misma poblacin pueden seleccionarse diferentes muestras.
Ejemplo:
En el siguiente ejemplo determinar:
a. Unidades elementales
b. Universo
c. Poblacin
d. Tipo de poblacin (finita o infinita)
e. Muestra
8

Mediante un estudio se quiere conocer la opinin de los estudiantes de la UBV sobre el


servicio de trasporte que presta esta universidad. Con este fin, se piensa entrevistar a 600
estudiantes seleccionados al azar para conocer su opinin al respecto:
Caracterstica en estudio: Opinin sobre el servicio de trasporte
Unidad elemental: Estudiante de la UBV
Universo: Todos los estudiantes de la UBV que utilizan el trasporte regularmente
Poblacin: La opinin de cada uno de los estudiantes de la universidad que utilizan
regularmente el servicio de trasporte
Tipo de poblacin: finita
Muestra: Las opiniones de los 600 estudiantes seleccionados al azar.

Censo
Se dice que se ha realizado un censo y se habla de enumeracin completa, cuando una
investigacin es exhaustiva en el sentido de analizar toda la poblacin.

Muestreo
Cuando el estudio se hace sobre la base de una muestra de la poblacin, se habla de una
investigacin por muestreo o enumeracin parcial.

Razones del uso del muestreo


Las razones que determinan la conveniencia de tomar muestras son entre otras las
siguientes:
1. Menor costo que un censo
2. Mayor control en la recoleccin de la informacin y en consecuencia mejor calidad de la
misma.
En una muestra se puede dedicar ms atencin a la calidad de los datos, al entrenar al
personal y realizar un seguimiento de quienes no contestan la encuesta. Es mucho mejor
tener buenas mediciones en una muestra representativa que mediciones poco confiables
sobre toda la poblacin.
3. Mayor rapidez en los resultados.
Una estimacin de la tasa de desempleo del ao 2004 no es muy til si para entrevistar
a cada familia se tarda hasta el 2006.
4. El que la poblacin sea excesivamente grande o infinita lo cual imposibilita cubrirla
totalmente. Por ejemplo:
a. Una evaluacin de los recursos forestales en la Amazona Venezolana
b. O la evaluacin de los recursos hdricos del pas
5. El que la poblacin sea suficientemente homognea.
Este hecho permite que una muestra muy pequea sea suficiente para inferir en la
poblacin con un margen de seguridad muy alto.
6. Que el proceso de medicin sea auto destructivo en el sentido de ocasionar dao o
prdida de la unidad sobre la cual se mide.
9

Razones del uso del censo


1. La poblacin es muy pequea
2 Si el tamao de la muestra es relativamente grande con respecto al tamao de la
poblacin, el esfuerzo adicional requerido para hacer un censo puede ser pequeo
3. Si se requiere una exactitud completa, un censo es la nica forma de alcanzarla.
Por ejemplo, La Coordinacin de los Programas de Formacin de Grado de la UBVBarinas Portuguesa no tomara al azar una muestra para saber la cantidad de alumnos que
estudian en determinado semestre, sino, que los contara todos.

Clasificacin de la Estadstica
Estadstica Descriptiva
Cuando algunas personas escuchan la palabra "estadstica", inmediatamente se imaginan
cosas como: promedios de calificaciones, cantidad de homicidios al mes, ndices de
accidentes, tasas de mortalidad, promedio de goles, entre otros. Esta rama de la estadstica
que utiliza nmeros para describir hechos, recibe el nombre de estadstica descriptiva, la
cual consiste en organizar resumir, simplificar, presentar los datos en cuadros y grficos y
del clculo de medidas numricas que permitan destacar los aspectos ms importantes de
los datos.
Los mtodos estadsticos descriptivos permiten obtener una visin completa de un
fenmeno en el sentido de describir lo que est ocurriendo en determinado momento. En
lenguaje figurado, la estadstica descriptiva proporciona una fotografa o inventario de una
situacin y pone de relieve los aspectos de mayor inters.
El ndice de desempleo, el costo de la vida, la precipitacin pluvial, el rendimiento medio
de un auto en kilmetros por litro y los promedios de calificacin, quedan todos en esta
categora.
Nota:
Un anlisis descriptivo puede realizarse en una muestra o en toda una poblacin.
Inferencia Estadstica
Consiste en el anlisis e interpretacin de una muestra de datos. Ms formalmente, la
inferencia estadstica se encarga de estudiar las caractersticas y las leyes propias de la
poblacin mediante una muestra seleccionada de ella.
El muestreo es un ejemplo vivo en la siguiente situacin familiar para nosotros: no hay que
comerse todo el queso para saber si esta salado. Por tanto, la idea bsica en el muestreo es
medir una porcin pequea pero tpica, de alguna poblacin, y posteriormente utilizar dicha
informacin para inferir (conjeturar inteligentemente) qu caractersticas tiene la poblacin
total. Otros ejemplos comunes son:

Probarse un vestido o calzado para saber la talla indicada


Probar un hervido para saber si le falta sal o no
Sacar un auto nuevo para probarlo
Realizarse un examen de sangre, etc.
10

Nota:
1. Los mtodos estadsticos inferenciales tienen su base de apoyo en la Teora de
Probabilidades y en la Teora del Muestreo.
2. Como los datos provienen de un conjunto menor que la poblacin, se cometen errores al
hacer una inferencia. Estos errores pueden ser cuantificados, as como la probabilidad de
cometerlos, la cual, adems de tratar con situaciones influenciadas por factores no
controlados por el analista, proporciona un modelo racional para trabajar con la variabilidad
inherente a la naturaleza del fenmeno bajo estudio y tambin con las situaciones
relacionadas con el azar. El conocimiento de las probabilidades relacionadas con una
situacin, suministra la base para el desarrollo de las tcnicas para la toma de decisiones,
explica el funcionamiento de esas tcnicas, e indica la manera en que las conclusiones
pueden ser presentadas e interpretadas correctamente.
3. La recoleccin de informacin constituye un aspecto importante en una investigacin y
en ese sentido la estadstica proporciona al investigador el apoyo necesario para su
ejecucin en todo lo referente a los instrumentos de recoleccin a utilizar y al tipo y
cantidad de informacin a recoger de tal manera que se obtengan resultados confiables,
especialmente en aquellos casos en que se piensa inferir los resultados a una poblacin. La
parte de la estadstica encargada de estos aspectos se conoce como diseo de experimentos
y teora del muestreo.
4. En este curso debemos suponer que los datos ya se han recogido mediante tcnicas
estadsticas y trabajaremos las herramientas estadsticas a partir de este punto.

En resumen tenemos la siguiente clasificacin de la estadstica:


o Estadstica Descriptiva
o Inferencia Estadstica (Basada en la teora del muestreo y en la teora de probabilidades)

La Estadstica y el mtodo cientfico


Los mtodos estadsticos utilizan el mtodo cientfico, que consiste en cinco pasos
bsicos:
1. Definir cuidadosamente el problema. Asegurarse de que est claro el objeto de un estudio
o un anlisis..
2. Formular un plan para recopilar los datos necesarios.
3. Reunir los datos.
4. Analizar e interpretar los mismos.
5. Anotar las conclusiones y otros descubrimientos, de manera que sean fcilmente
comprendidos por los que utilizarn los resultados al tomar decisiones.
11

Datos Estadsticos
Los datos estadsticos se obtienen mediante un proceso que comprende la observacin o
medicin de conceptos como:
Ingresos anuales en una comunidad.
Calificaciones de exmenes.
Cantidad de caf por taza despachada por una mquina vendedora.
Resistencia a la rotura de fibras de plstico.
Porcentaje de azcar en cereales, etc.
Tales conceptos tambin reciben el nombre de variables o caractersticas, ya que
producen valores que tienden a mostrar cierto grado de variabilidad, al efectuarse
mediciones sucesivas.

Variables y tipos de Datos


Variable, es una caracterstica que toma al menos dos valores.
Las variables estadsticas generalmente se simbolizan con las letras maysculas X, Y, Z.
Las variables se clasifican en: Cuantitativas (Continuas y Discretas) y Cualitativas.
Variable Cuantitativa Continua, son aquellas variables que pueden tomar infinitos
valores entre dos nmeros, por muy prximos que los fijemos. Ejemplos: Edad, peso,
estatura, espesor, velocidad, temperatura, cantidad de lluvia, nivel de colesterol de ciertos
pacientes de un hospital, entre otras, quedan dentro de esta categora.
Datos Continuos
Son aquellos datos que se obtienen de variables continuas.
Ejemplo:
La cantidad de caf que se vende por da, la gasolina que se expende por hora, la velocidad
del aire, las edades, pesos y estaturas de los estudiantes de la UBV.

Nota:
En trminos prcticos, los instrumentos de medicin presentan ciertas limitaciones de tipo
fsico que restringen el grado de precisin, a pesar de esto los datos siguen siendo
continuos. Este es el caso de datos que representan la estatura de una persona. Usando una
cinta mtrica tradicional, se habla por ejemplo, de que una persona mide 71,3 mts. Pero si
tuvisemos a disposicin algn instrumento electrnico sofisticado podra obtenerse que
esta persona mide 71,295428metros.
Variable Cuantitativa Discreta, son aquellas variables que toman valores numricos
aislados y no pueden tomar ningn valor entre dos consecutivos fijados. Ejemplo: nmero
de hijos por familia, nmero de rboles en un bosque, nmero de viviendas en construccin
en el municipio Barinas, nmero de hormigas en un termitero, etc. Una variable cuantitativa
discreta puede tomar un nmero finito o infinito numerable de valores.
12

Datos Discretos
Los datos discretos surgen al contar el nmero de conceptos que posee cierta caracterstica.
Ejemplos de datos discretos son: el nmero de clientes por da, la cantidad de alumnos en
un saln de clase, los defectos de un auto, nmero de goles en un partido de ftbol.
Datos Cuantitativos
Tanto los datos discretos y continuos se conocen como datos cuantitativos, ya que son
inherentemente numricos. Es decir, ciertos valores numricos se relacionan de manera
natural con las variables que se miden. Las variables de donde se obtienen este tipo de
datos se denominan variables cuantitativas.
Variables Nominales
Se caracterizan porque la nica relacin que est definida entre los valores que puede tomar
la variable es la igualdad o diferencia.
Ejemplo:
Sexo (masculino, femenino)
Color de los ojos (azul, marrn, negro, verde)
Campo de estudio en la UBV (Gestin Ambiental, Gestin Social para el Desarrollo
Comunitario, Estudios Jurdicos, Comunicacin Social.).
Nota:
Ninguna de las caractersticas anteriores es numrica por naturaleza. En caso de utilizar
nmeros, estos simplemente constituyen un indicador de distincin cualitativa y en ningn
caso el orden y la distancia entre ellos tiene otra interpretacin. Es decir, si se usan nmeros
ms bien se deben considerar como un cdigo y no como el valor numrico que representa.
Por ejemplo, la variable sexo puede tomar los valores 0 y 1, donde un 0 representa a
masculino y un 1 representa a femenino. En este caso sumar 0 + 1 no tiene sentido porque
es como querer sumar masculino + femenino. Ntese que en este ejemplo el 0 y el 1no son
inherentemente numricos, son cdigos.
Los datos asociados a este tipo de variable se conocen como datos nominales.
Variables Ordinales
Se caracterizan porque entre dos valores de la variable, adems de la relacin de igualdad o
diferencia se pueden dar las relaciones "mayor que" o "menor que". Es decir, dados dos
valores de la variable se puede decir si son iguales o diferentes y adems saber cual valor
est antes que el otro de acuerdo a un orden, es decir se jerarquizan los valores.
Ejemplo:
Escala de notas de conocimientos del 1 al 20
Concurso de belleza o de cocina
Jerarqua del ejercito
El nmero de una pgina cualquiera de un libro, etc.
13

Los datos ordinales son los valores que toman las variables ordinales.
Variables Cualitativas Son aquellas comprendidas por variables nominales u ordinales.
stas no son inherentemente numricas, es decir, presenta modalidades no cuantitativas y
en caso de utilizar nmeros para representar esas modalidades, estos no tienen significado
en s mismos. Las variables cualitativas tambin son conocidas como atributos, Los datos
que se obtienen de este tipo de variables se llaman datos cualitativos.
En la siguiente ilustracin se puede observar la clasificacin de las variables:

Notacin:
Se acostumbra denotar a las variables por letras latinas maysculas, en general las ltimas
del alfabeto: X, W, Y, Z, etc. A los valores que toma la variable se habita denotar con la
misma letra en minscula enumerada con un subndice. Por ejemplo, si X representa a la
variable Edad, entonces x indica la edad que toma el tercer individuo.
3

14

Series Cronolgicas o Series de Tiempo


Una serie cronolgica o serie de tiempo es una sucesin de observaciones tomadas
secuencialmente en el tiempo. As, una serie de tiempo refleja las variaciones de una
variable en el tiempo.
Ejemplos
a. Produccin anual de petrleo (en nmero de barriles) en Venezuela
b. La cotizacin diaria del dlar
c. El ndice mensual de precios al consumidor
d. Las pruebas de electrocardiograma en un hospital
e. La produccin semestral de leche en el Estado Barinas.

Variables Univariantes y Multivariantes (tambin unidimensionales y


multidimensionales)
Existe otra clasificacin de acuerdo al nmero de variables que se analizan conjuntamente.
Cuando las variables se presentan y analizan individualmente, se habla de variable
univariante. Alternativamente, cuando se analizan simultneamente dos, tres o ms
variables se habla de variable bivariante, trivariante o multivariante.
Por ejemplo, de una encuesta se obtienen los datos sobre tipo de sangre, peso, ingreso y
sexo de los estudiantes de Gestin Ambiental; y se analiza cada una de estas variables
separadamente. En este caso se tienen cuatro variables univariantes.
Por otro lado, si es de inters analizar conjuntamente las variables tipo de sangre y peso se
est ante la presencia de una variable bivariante. Pero, si se analizan simultneamente las
cuatro variables, entonces se habla de una variable multivariante.
Sea,
X: Tipo de sangre, Y: Peso, W: Ingreso, Z: Sexo.

15

Estadstico y Parmetro
Es conveniente describir una poblacin en trminos de unas pocas medidas que resumen
caractersticas de inters. Una medida calculada de los valores poblacionales es llamada
Parmetro. Muchos parmetros distintos pueden ser definidos para medir diferentes
aspectos de una poblacin.
Un Estadstico, es una medida que es calculada sobre la base de los datos de la muestra.
Ms formalmente, un estadstico es una funcin matemtica de una muestra.
Por tanto, un parmetro es un valor nico mientras que un estadstico puede tomar distintos
valores dependiendo de la muestra seleccionada.
Por ejemplo, de una muestra de 80 estudiantes de la UBV, se puede obtener que el
porcentaje de estudiantes que trabajan es 9%; este 9% es el valor de un estadstico o un
parmetro?
Se acostumbra a denotar los parmetros con letras griegas y los estadsticos con letras
latinas. Por ejemplo, generalmente se denota la media de una poblacin como y la media
de una muestra como

16

Estudio descriptivo de un conjunto de datos


Cuando se ha recolectado la informacin correspondiente al fenmeno que se est
investigando, se cuenta con una coleccin de datos individuales, la cual constituye la
materia prima para el investigador. Comnmente, este conjunto de datos es bastante grande
y por ende es muy difcil obtener algunas conclusiones que sean de utilidad para el estudio.
Por tal razn se hace necesario utilizar los mtodos estadsticos descriptivos tanto para
resumir y presentar convenientemente los datos, como tambin para conseguir algunos
indicadores numricos que sean de utilidad para la interpretacin de los aspectos ms
importantes y de inters de los datos.

Organizacin de datos cualitativos


La manera de condensar o agrupar los datos cualitativos es muy intuitiva. Slo es necesario
un conteo de las distintas modalidades que presenta la variable en cuestin, lo que se
conoce como frecuencia:
Modalidad 1
f1

...

Modalidad k
fk

Total
n

Tabla de doble entrada o tabla de contingencia


Tambin se pueden organizar dos variables en una tabla. Este tipo de organizacin de datos
se conoce como tabla de doble entrada o tabla de contingencia:
VARIABLE
a1 a2 ...

A
ak

TOTALES

b2

VARIABLE B

b1

bi
TOTALES

Nota:
Tambin pueden organizarse en una misma tabla tres o ms variables.

17

Organizacin de datos cuantitativos


Cuando se agrupan datos cuantitativos, generalmente, el tipo de organizacin visto antes no
es adecuado. Esto se debe a que las variables cuantitativas por lo regular presentan muchos
valores distintos, con lo cual la finalidad de condensar la informacin no se cumple.
La idea ahora consiste en establecer intervalos que cubran todos los datos que se tienen a
disposicin sobre la variable en estudio. De esta manera, se construye una tabla en la que se
cuenta el nmero de observaciones contenidas en cada intervalo previamente especificado.
Estos intervalos se llaman clases o intervalos de clases y el nmero de datos en cada
intervalo se denomina frecuencia. Esta forma de agrupar los datos tendr esta apariencia:
Intervalos de clase
LI1 - LS1
LI2 - LS2
...
LIi - LSi
...
LIk - LSk

frecuencia
f1
f2
...
fi
...
fk
Total de observaciones

De este modo, se puede definir una distribucin de frecuencias como una ordenacin
tabular de los datos en intervalos de clase con sus respectivas frecuencias.
Nota:
Cuando los datos se presentan en distribuciones de frecuencias, se habla de datos
agrupados, mientras que cuando se presentan individualmente, se habla de datos no
agrupados.

Pasos para la construccin de una distribucin de frecuencias


1. Determinar el valor mximo y el valor mnimo de los datos.
2. Calcular el rango (o recorrido) de la variable el cual viene dado por la diferencia entre el
valor mximo y el valor mnimo. El rango se denota por R = valor mximo valor
mnimo.
3. Determinar el nmero de clases (K) y las amplitudes de clase (Ci):
A la anchura de un intervalo de clase se le conoce como amplitud de clase, es decir, la
amplitud de clase de un intervalo viene dada por la diferencia entre el lmite superior y el
lmite inferior de dicho intervalo. Podemos determinar la amplitud o el nmero de clases
tomando en cuenta lo siguiente:
a. Si se conoce el nmero de clases: C i = R / K

18

b. Si se conoce la amplitud de la clase: K = R / C i


c.

Regla de Sturges: K = 1 + 3,3 * Log ( n )

Nota:
i. La frmula de Sturges slo proporciona una orientacin sobre cual debe ser el nmero
ii. Pueden existir clases abiertas, es decir, clases que slo tienen un lmite superior o
solamente un lmite inferior. Si ese es el caso, a esta clase abierta no se le podr
determinar la amplitud.
iii. En la prctica no se conoce de antemano el nmero de clases y la amplitud de stas. Sin
embargo, existen dos recomendaciones importantes al construir una distribucin de
frecuencias:

Que el nmero de clases no sea inferior a 5 ni mayor que 15.


De ser posible es deseable que todas las clases tengan la misma amplitud.
4. Proceder a construir los intervalos de clase.
En este punto ya se debe conocer el nmero de intervalos de clase a construir y las
amplitudes de clase de cada uno de ellos, las cuales pueden ser iguales o no. Para la
construccin de las clases se deben seguir los siguientes pasos:
a. Establecer el lmite inferior del primer intervalo de clase. Esto se puede realizar
arbitrariamente de acuerdo a las siguientes alternativas:
o Utilizando el valor mnimo de los datos
o Utilizando otro valor menor al mnimo, pero no muy alejado.
b. Fijado el primer lmite inferior se le suma a ste la amplitud de la primera clase, C1, y se
obtiene el lmite superior de esta primera clase, el cual se constituye a la vez como el
lmite inferior de la segunda clase, a este se le suma la amplitud C2 y se obtiene el lmite
superior de la segunda clase. Y de la misma manera se construyen los K intervalos.
Naturalmente el ltimo intervalo de clase debe incluir el valor mximo de los datos.
c. Para calcular la frecuencia de cada intervalo, se debe asumir lo siguiente: En trminos
matemticos los intervalos de clase van a ser intervalos cerrados por su lmite inferior y
abiertos por su lmite superior.
5. Determinar el nmero de datos contenidos en cada clase. Es decir, determinar las

6. Determinar el resto de las frecuencias.


a. Frecuencia relativa de una clase:

19

Se va a denotar por fri y se obtiene de la siguiente manera: fr i = fi

b. Frecuencia acumulada de una clase:


Se denota por Fi. Se obtiene sumando las frecuencias absolutas de todas las clases
anteriores a ella ms la frecuencia absoluta de la i-sima clase considerada. Por tanto la
frecuencia acumulada de la ltima clase es Fk = n.
La frecuencia acumulada, Fi, representa el nmero de observaciones que son menores
que el lmite superior de la i-sima clase.
c. Frecuencia relativa acumulada de una clase: Se denota por Fri y se obtiene de la
siguiente manera: Fri = Fi / n Tambin, Fri = fr1 + fr2 + fr3 + . . . + fri . La frecuencia
relativa acumulada, Fri, representa la proporcin de todas las

observaciones que son

menores que el lmite superior de la i-sima clase.


d. Marca de clase o punto medio de clase: La marca de clase o punto medio de clase,
denotado por mi se define como el punto central de la clase particular:
mi = (LIi + LSi) / 2, donde LIi es el lmite inferior de la i-sima clase y LSi es el

lmite

superior de esa clase.


Ejercicio: Con base en los datos recogidos en clase, construir una distribucin de
frecuencias para la variable peso, edad y estatura.
Nota 3:
Existen algunas situaciones en que uno o ms intervalos de clase en una distribucin de
frecuencias no tienen lmite inferior o superior. Estos se conocen como Clases Abiertas.
Por ejemplo, la siguiente distribucin de frecuencias tiene dos clases abiertas:
Clases
Menos de 5
5 - 10
10 - 15
50 y ms

fi
73
58
35
39
20

Observe que a las clases abiertas no se les puede determinar la amplitud y tampoco la
marca de clase.
Ejercicio:
Completar la siguiente distribucin de frecuencias:
Clases mi
--15
[20 -30) -[30 - 40) -[40 - 50) 45
--65
Totales

fi fri Fi Fri
-- --- -- 0,16
-- 0,08 -- --6 --- 12 --8 --- 20 ---- --- -- ------

Distribucin de frecuencias cuyas clases son valores individuales de la variable en


estudio
En muchas ocasiones se presentan colecciones de datos en las cuales el nmero de valores
diferentes que toma la variable de inters es pequeo y por consiguiente, no es apropiado
agrupar estos datos en una distribucin de frecuencias cuyas clases sean intervalos.
Generalmente, en estos casos, los datos son de tipo discreto.
En tal situacin, se toman como clases los diferentes valores de la variable y las frecuencias
se calculan de la forma habitual.
Ejemplo: Con base en los datos recogidos en clase, construyan una distribucin de
frecuencias para la variable Nmero de veces que ustedes utilizan el servicio de transporte
de la UBV durante el semestre.
Nota:
a. Ntese que en este tipo de distribucin de frecuencias no existen lmites de clase,
amplitudes y las marcas de clase mi coinciden con las clases.
b. Obsrvese tambin que en las distribuciones de frecuencias cuyas clases son valores
individuales, se puede reconstruir fcilmente la coleccin de datos originales. Recuerde
que esto no es posible cuando las clases son intervalos.

21

Ventajas y desventajas de agrupar los datos en distribuciones de frecuencias


Facilita la presentacin y resumen de los datos, lo que permite analizar sus aspectos
ms resaltantes.
La desventaja principal es que se pierde la individualidad de los datos. Se sabe que en
determinado intervalo est contenido cierta cantidad de datos pero no se conoce
exactamente que valores toman.
En conclusin, al agrupar datos se gana en simplicidad y accesibilidad, pero se pierde el
nivel de detalle.
Distribuciones de frecuencias para datos Cualitativos
Las distribuciones de frecuencias tambin se pueden utilizar para datos cualitativos. stas
son ms fciles ya que las clases se ponen de manifiesto con ms facilidad, de tal manera
que los clculos son mnimos.
Por ejemplo, en el siguiente cuadro se presenta el tipo de vivienda en cierta comunidad del
Estado Barinas , ordenadas en una tabla de frecuencia:
Tipo de vivienda
Rancho
Casa
Quinta
Vivienda Rural
Otra
Total

fi ( N de familias)
40
30
20
15
05
110

fri (% de familias)
36.36%
27.27%
18.18 %
13.64%
4.54%
100%

Observe que no se calculan las frecuencias acumuladas. Esto se debe a que en este caso no
tiene sentido dado que los valores de la variable se pueden ordenar de forma arbitraria.
Ejercicio:
Calcule la frecuencia acumulada a la distribucin de frecuencias anterior e intente
interpretarla de manera similar a como lo hizo con la variables peso, edad y estatura. Debe
notar que tal interpretacin carece de sentido en este caso particular.

22

Presentacin de los datos


Presentacin Escrita
Este mtodo consiste en presentar un informe que resea los rasgos de mayor importancia
de los datos. Debido a que es necesario leer el informe ntegramente para conocer los
aspectos de inters de los datos, este mtodo no es muy efectivo y por consiguiente es poco
empleado. Sin embargo, posee la virtud de poder resaltar las cifras y las comparaciones que
se consideren esenciales.

Cuadros Estadsticos
Los cuadros estadsticos son tablas en las cuales se exhibe de manera ordenada a los datos.
Un cuadro estadstico debe ser capaz de explicarse por s solo. Para cumplir esto debe
poseer principalmente ttulo, encabezados, cuerpo y fuente.
El ttulo debe ser breve y suficientemente explicativo de la situacin estudiada, la poca y
el sitio. Los encabezados son los nombres de las filas y columnas de la tabla. El cuerpo son
los datos ya condensados y organizados. La fuente indica el origen de la informacin, por
esta razn nunca debe faltar en todo cuadro estadstico.
Adicionalmente a los elementos anteriores, estos cuadros pueden llevar notas preliminares
en el ttulo del cuadro, notas explicativas debajo del cuadro y numeracin del cuadro
cuando existen varios de ellos.
Ejercicio:
Presentar en un cuadro estadstico la distribucin de frecuencias de las variables peso,edad
y estatura.

Construccin de grficos
Los grficos facilitan la visualizacin de las cifras y son ampliamente utilizados en la
representacin de los datos estadsticos. Cuando se elabora cualquier clase de grfico se
pierde informacin, pues ya no existen las observaciones originales. Sin embargo,
frecuentemente esa prdida de informacin es pequea comparada con la sntesis y
facilidad de la interpretacin.
Al igual que los cuadros estadsticos, los grficos deben llevar un ttulo que explique de lo
que trata la informacin all presentada. Tambin pueden llevar notas explicativas y
numeracin correlativa.
Principales tipos de grficos

Diagrama de puntos
Diagrama de dispersin
Curvas
Grfico de barras
Grfico circular
23

Pictogramas
Grficos especiales para distribuciones de frecuencias de datos cuantitativos:
a. Histograma
b. Diagrama de lneas
c. Polgonos de frecuencias
d. Ojiva
e. Diagrama de frecuencias acumuladas

Grfico de barras
Los grficos de barras constituyen una herramienta muy adecuada para representar series
cronolgicas, para datos cualitativos ordinales y en general para datos donde exista algn
orden. En algunas ocasiones tambin se utiliza en datos nominales.

Construccin del grfico


Paso 1: Establezca un orden (arbitrario cuando la variable es cualitativa nominal) para la
colocacin, en el eje horizontal de:
Las distintas modalidades en el caso de variables cualitativas.
El tiempo de ser una serie de tiempo.
Paso 2: Teniendo en cuenta el valor mximo de la frecuencia (o porcentaje) de los datos,
escoja una escala vertical para representar los valores correspondientes.
Paso 3: En el eje horizontal, para la primera modalidad (o tiempo), dibuje un rectngulo de
base cualquiera y altura proporcional al valor de la modalidad.
Paso 4: Repita el proceso del paso 3 para las dems modalidades.

24

Ejemplo:

Fuente: Comandancia General de Polica. Estado Barinas

ROBOS DISCRIMINADOS POR RENGLON MUNICIPIO BARINAS


ENERO - JULIO 2006

500

455

400
300
200

184

157
34

23

56

100
0
RESIDENCIAS

COMERCIOS

AUTOS

MOTOS

BICICLETAS

OTROS

TOTAL

Fuente: Comandancia General de la Polica. Estado Barinas

Como se puede apreciar en el grfico anterior, la presentacin puede realizarse en tres


dimensiones lo cual puede mejorar la esttica del grfico.
El grfico de barras tambin puede construirse de tal manera que las barras aparezcan de
forma horizontal. Se acostumbra utilizar esta variante cuando se comparan datos
cualitativos o datos que se refieren a zonas geogrficas.

25

Ejemplo:

Con un grfico de barras tambin existe la posibilidad de presentar dos o ms variables en


un mismo grfico, de tal manera de que se pueda apreciar el comportamiento individual y
adems poder hacer comparaciones entre ellas. Veamos esto con un ejemplo:

Rendimiento Acadmico
Estudiantes UBV-Barinas
semestre 2006 II
16
14
12
10
8

Masculino
Femenino

6
4
2
0
Excelente

Bueno

Mejorable

Fuente: Datos hipotticos

26

Histograma
El histograma es el adecuado para ilustrar el comportamiento de los valores agrupados en
intervalos de clase, siendo un grfico de barras compuesto por varios rectngulos
adyacentes, que representan a la tabla de distribucin de frecuencias de cierta variable
cuantitativa. En el eje horizontal se marcan los intervalos, y cada intervalo es la base de
cada rectngulo; en el eje vertical se marcan las alturas de los rectngulos la cual viene
dada por las frecuencias respectivas (absolutas simple o relativas)

Construccin:
Paso 1: En el eje horizontal, marque sucesivamente los lmites de cada clase.
Paso 2: En el eje vertical, marque, en la escala, los valores correspondientes a las
frecuencias absolutas o frecuencias relativas de las clases.
Paso 3: Para la primera clase, construya un rectngulo cuya base es el intervalo de clase y
la altura es la frecuencia absoluta simple (o relativa) de esa clase.
Paso 4: Para la clase siguiente, construya un rectngulo adyacente al primero cuya base
es el intervalo de la clase y la altura es la frecuencia absoluta o relativa de esa clase.
Paso 5: Repita el procedimiento para las dems clases.

En la siguiente figura se representa la apariencia que tendr un histograma

Nota
Cuando se construyen histogramas, el eje vertical debe mostrar el cero verdadero para no
distorsionar o representar equivocadamente el tipo de datos. Sin embargo, no es necesario
que el eje horizontal especifique el punto cero del fenmeno de inters. Por razones de
esttica, el rango de la variable debe constituir la principal porcin de la grfica y, cuando
no se incluye el cero, resulta apropiado incluir fracturas

27

Ejercicio:
Construir un histograma para la distribucin de frecuencias de la variable peso, edad y
estatura.
Cuando las clases de una distribucin de frecuencias tienen todas la misma amplitud y el
histograma se construye utilizando como altura las frecuencias relativas de clase, se permite
la comparacin de histogramas correspondientes a distribuciones de frecuencias de datos de
la misma naturaleza que difieren en cuanto al nmero de datos. Cuando se utilizan las
frecuencias absolutas como alturas, no es posible comparar histogramas diferentes excepto
en casos especiales.

Nota
En un histograma, al eliminar los espacios entre las barras se logra que la grfica lleve
consigo una "continuidad" que refleja que los datos son continuos. En los grficos de
barras (para datos cualitativos), deben aparecer los espacios entre las barras para evitar que
el lector interprete una "continuidad" de los datos, ya que las categoras de las variables
cualitativas son ordenadas en general de forma arbitraria y por definicin no pueden tomar
todos los valores en el eje horizontal.

Polgono de frecuencias
Una alternativa para un histograma, es el polgono de frecuencias. En el eje horizontal se
marcan las marcas de clase de cada intervalo y para cada una de estas m se marcan las
i

alturas en el eje vertical, las cuales vienen dadas por las frecuencias respectivas (absolutas
simple o relativas). Luego, se marcan los puntos (mi, fri mi, fi), se une con rectas en el
plano cartesiano. Para cerrar la curva resultante con el eje de las abscisas, se crean dos
puntos medios ficticios, uno anterior al de la primera clase y otro posterior al de la ltima
clase cada uno con frecuencia igual a cero. De esta manera se obtiene el polgono de
frecuencias:

Ntese como el polgono puede obtenerse directamente del histograma:


28

Ejercicio:
Construir un polgono de frecuencias para la distribucin de la variable peso, edad y
estatura.

Diagrama de lneas de frecuencias


Es el equivalente al histograma en una distribucin de frecuencias cuyas clases son valores
individuales de la variable.
Construccin
Paso 1: En el eje horizontal, marque sucesivamente las clases.
Paso 2: En el eje vertical, marque, en la escala, los valores relativos a las frecuencias
absolutas o frecuencias relativas de las clases.
Paso 3: Para la primera clase, trace una lnea vertical cuya altura es la frecuencia absoluta
simple (o relativa) de esa clase;
Paso 4: Repita el procedimiento para las dems clases.
En la siguiente figura se representa un diagrama de lneas.

29

Ejercicio:
Construir un diagrama de lneas para la distribucin de frecuencias de la variable nmero
de hermanos.

Descripcin de la forma en que se distribuyen los datos


Los grficos para distribuciones de frecuencias vistos anteriormente sirven para
proporcionar una idea a primera vista acerca de la forma en que se distribuyen los datos. En
este sentido se tienen las siguientes definiciones:
Distribucin simtrica
Una distribucin de frecuencias es simtrica (o con sesgo cero) con respecto al valor central
de la distribucin, llammoslo x0, cuando el grfico a la izquierda de x0 es el "espejo" de la
derecha. En otras palabras, si a la izquierda y a la derecha de x 0 existe la misma cantidad de
datos la distribucin ser simtrica.
Distribucin asimtrica
Si una distribucin no es simtrica, se dice que es asimtrica (o sesgada). Existen dos casos
de asimetra:
Asimetra Positiva o por la derecha
Este tipo de asimetra se presenta cuando existe una mayor concentracin de datos en las
primeras clases en comparacin con las ltimas. Se puede visualizar fcilmente cuando el
extremo o "cola" de la derecha del grfico se prolonga ms que el de la izquierda.
Asimetra Negativa o por la izquierda
Cuando hay mayor concentracin de datos en las ltimas clases en comparacin con las
primeras, es decir, cuando la "cola" izquierda de la curva se prolonga ms que la derecha se
dice que, la distribucin de frecuencias es asimtrica negativa o por la izquierda.
Ejemplo:
A continuacin se presentan algunos casos de distribuciones simtricas:

30

Ejemplo:
A continuacin se presentan dos casos de distribuciones asimtricas:

Ojiva (Polgono de frecuencias acumuladas)


Este grfico se emplea en distribuciones de frecuencias cuyas clases son intervalos. Es un
tipo especial de grfico de curvas en el cual se representan las frecuencias acumuladas.
31

Construccin :
Paso 1: En el eje horizontal, marque sucesivamente los lmites superiores de cada clase.
Paso 2: En el eje vertical, marque los valores correspondientes a las frecuencias acumuladas
o frecuencias relativas acumuladas.
Paso 3: Para cada lmite superior de clase se marca con un punto su correspondiente
frecuencia acumulada.
Paso 4: El lmite inferior de la primera clase tambin se seala con un punto en el eje
horizontal, asignndole una frecuencia acumulada igual a 0.
Paso 5: Se unen todos los puntos con segmentos de recta.

As se obtiene la Ojiva. Ntese que este grfico es no decreciente.

Las ojivas son principalmente usadas para determinar grficamente y de forma aproximada
el nmero o proporcin de datos que son menores, o que son iguales o mayores a una valor
de inters. Si se usa papel milimetrado para graficar la ojiva, se fija el valor x0 de inters de
la variable en estudio el cual es ubicado en el eje horizontal y se levanta desde este valor x0
una lnea perpendicular al eje que llegue hasta la curva. Luego, a partir del punto de
interseccin se traza una lnea paralela al eje de las abscisas; y el punto de corte con el eje
32

vertical, y0, representa el nmero o proporcin de datos (dependiendo si la ojiva se


construy con las Fi con las Fri) que son inferiores al valor x0 especificado.

Tambin se puede encontrar la proporcin de datos y0 que son menores que el valor x0,
mediante un proceso de interpolacin (si no se usa papel milimetrado) usando la propiedad
de tringulos semejantes:

Ntese en el grfico anterior que el tringulo ABC es equivalente con el tringulo ARS, con
lo cual se cumple la propiedad:

33

Que al aplicarse en nuestro caso, tenemos que:

Entonces, sustituyendo en la propiedad de los tringulos semejantes, queda:

despejando y0 de la igualdad anterior, se encuentra que:

As, a travs de ese mtodo de interpolacin se puede encontrar una aproximacin a la


proporcin de datos, igual a y0, que es menor que el valor x0.
Ejercicios:
Usando la distribucin de frecuencias construida en clase para la variable peso, encuentre
mediante el mtodo grfico de interpolacin:
1. La proporcin de estudiantes que pesan menos de 78 Kg.
2. La proporcin de estudiantes cuyos pesos son menores a 56 Kg.
3. La proporcin de estudiantes que tienen un peso mayor o igual a 56 Kg.
4. El porcentaje de estudiantes que pesan menos de 56 Kg.
5. El valor del peso por encima del cual se encuentra el 50% de los pesos de los estudiantes.
6. El peso tal que el 10% de los estudiantes est por debajo de l.
7. El peso tal que la mitad de los datos est por debajo de su valor.

Diagrama de Frecuencias Acumuladas (Grfico de escalera)


El grfico equivalente a la ojiva en el caso de distribuciones de frecuencias cuyas clases
son valores individuales de la variable en estudio se denomina diagrama de frecuencias
acumuladas.
Construccin :
Paso 1: En el eje horizontal, marque sucesivamente los valores de la variable que
representan las clases.
Paso 2: En el eje vertical, marque los valores correspondientes a las frecuencias acumuladas
o frecuencias relativas acumuladas (o porcentaje).
34

Paso 3: A cada valor de la variable se le representa su frecuencia acumulada mediante una


lnea horizontal que se prolonga hasta donde est sealado el prximo valor de la variable.
Paso 4: Al trazar las lneas anteriores, se les coloca un punto al comienzo. Esto indica que
al correspondiente valor en el eje horizontal le corresponde esa frecuencia acumulada.

Ntese que el grfico suministra visualmente el nmero de datos menores o iguales que un
valor particular de la variable en estudio.

Comentarios finales
En las aplicaciones prcticas, el objetivo de construir una distribucin de frecuencias y su
respectivo histograma es conseguir informacin relevante sobre los datos. En este sentido,
la decisin ms difcil, pero inevitable, es cuanto ha de detallarse. Si se realiza una
presentacin muy poco detallada, es decir con muy pocas clases, se pueden ocultar
caractersticas importantes, mientras que si se cae en el otro extremo, podramos perdernos
en un exceso de detalle. La mejor gua a seguir es el sentido comn, aunque pueden
enumerarse unas cuantas reglas generales:
1. Como se haba comentado antes, para lograr una interpretacin ms fcil es preferible
establecer intervalos de igual longitud. Sin embargo, en algunas ocasiones habr que
descartar este principio. Si un conjunto de datos tiene muchas observaciones
contenidas en muy pocos intervalos de clase, mientras que las otras estn muy
35

dispersas en el resto de las clases, ser preferible dividir en intervalos de longitud


pequea la zona donde las observaciones estn ms concentradas, y en intervalos ms
amplios las observaciones fuera de esta zona. Si se hace esto, es importante tener muy
en cuenta que son las reas y no las alturas de los rectngulos del histograma, las que
han de ser proporcionales a las frecuencias.
2. Es importante asegurarse que los puntos medios de los intervalos sean representativos
de los miembros de esa clase. Por ejemplo, muchos artculos en las tiendas tienen
precios de Bs. 9.999, Bs. 10.999, etc. Si se clasifican los precios en intervalos [Bs.
9.000 - Bs. 10.000), [Bs. 10.000 - Bs. 11.000), etc., es muy probable que en cada
intervalo de clase predominen los precios prximos al lmite superior. Una mejor
solucin consistira en establecer clases como: [Bs. 9.500 - Bs. 10.500), [Bs. 10.500 Bs. 11.500) y as sucesivamente.
Una razn para elegir puntos medios de clase que sean representativos de los valores
de los miembros de esa clase, es que el histograma tendr un aspecto visual ms
fidedigno. Adems como se ver ms adelante, en muchos casos se calculan medidas
de centralizacin y dispersin para datos agrupados. Estos clculos dependen del
supuesto de que los puntos medios de cada intervalo de clase son representativos de
la clase.
3. Muchas veces, la decisin ms difcil de tomar es decidir el nmero de clases a incluir.
Si el nmero de clases es demasiado pequeo, la clasificacin resultante puede
esconder aspectos importantes de los datos. Si hay demasiadas clases, puede resultar
un grfico quebrado y desigual, difcil de interpretar. En general, como se haba
recomendado antes, debe usarse un nmero de clases mayor que cinco y menor que
15. Para conjuntos de datos muy grandes, con muchas observaciones, ser razonable
establecer ms clases. Subdividir, por ejemplo, un conjunto de 20 observaciones en 15
clases pequeas conllevara a tener muchas clases vacas o casi vacas. Esto puede ser
un problema menos grave si se tienen 200 observaciones. Incluso si se tienen en
cuenta los factores enunciados no siempre estar clara la eleccin del nmero de
intervalos. En muchos casos, una buena idea es probar varias posibilidades y ver cul
de los histogramas resultantes presenta un aspecto ms claro.
36

Medidas Descriptivas Numricas


Frecuentemente una coleccin de datos se puede reducir a una o unas cuantas medidas
numricas sencillas que resumen al conjunto total. Tales medidas son ms fciles de
comprender que el conjunto de datos originales o ya agrupados. Tres caractersticas
importantes de los datos que las medidas numricas ponen de manifiesto son:
1. El valor central o tpico de los datos
2. La dispersin de los datos
3. Medidas de forma
Medidas de Posicin o Localizacin (tendencia central)
Las medidas de posicin se utilizan para indicar un valor que tiende a tipificar o a ser el
ms representativo de un conjunto de datos. Las tres medidas que ms comnmente se
emplean son la media, la mediana y la moda.
1. Media
a. Media Aritmtica
La media aritmtica es lo que viene a la mente de la mayora de las personas cuando se
menciona la palabra "promedio". Como este trmino tiene ciertas propiedades
matemticas deseables, es la ms importante de las tres medidas de tendencia central.
La media aritmtica se calcula al sumar los datos y al dividir este resultado entre el
nmero de valores.
Ejemplo:
Si un granjero quiere conocer el peso promedio de sus ocho cerdos cuyos pesos en
kilogramos son: 172, 177, 178, 173, 177, 174, 176, 173; realizar el siguiente clculo:
(172+177+178+173+177+174+176+173) / 8 = 1400 / 8 = 175

Es decir, el peso promedio de esos cerdos es 175 Kg.

El procedimiento para calcular la media aritmtica es el mismo, independientemente si


un conjunto de datos se refiere a las observaciones de la muestra o a todos lo valores de
la poblacin. Sin embargo, se utiliza el smbolo para la media de una poblacin y N
para el nmero de elementos en la misma:

37

Nota:
i. La media aritmtica viene expresada en las mismas unidades que los datos originales.
ii. La media aritmtica no tiene que coincidir con alguno de los datos de la coleccin.

iii. Quizs la manera ms adecuada de interpretar la media aritmtica sea la que se hace
desde el punto de vista de la fsica, en el sentido de que la media de una serie de
datos representa el centro de gravedad o punto de equilibrio de esos datos.
Una representacin fsica de la media es imaginar una barra con un punto de apoyo
central que sostiene pesos iguales en sitios correspondientes a los valores de un
conjunto. La media de los nmeros 10, 15 y 20 se puede ilustrar como se observa en
la siguiente figura:

Ntese como la media es el punto de equilibrio de la tabla; las diferencias positivas y


negativas se contrabalancean entre s.
En el ltimo ejemplo tambin podemos observar visualmente el punto de equilibrio o
centro de gravedad de esos datos:

38

Nota
No debe interpretarse la media como punto medio de los datos. La media representa el
punto de equilibrio de las observaciones, el cual no tiene que ser igual al punto medio. En
el grfico anterior el punto de equilibrio coincide con el punto medio debido a que esos
datos se distribuyen simtricamente.
Ejercicio:
Para los datos no agrupados, de estudio en clase, calcule la media aritmtica para las
variables peso, nmero de hermanos, ndice acadmico, estatura e ingreso mensual del
hogar.
b. Media Ponderada
La frmula de la media aritmtica supone que cada observacin es de igual
importancia. Habitualmente, suele suceder as, sin embargo, existen algunas
excepciones. Por ejemplo, un profesor informa a su clase que efectuar cuatro
evaluaciones. Estas, con respecto a la calificacin final del curso equivalen a:
evaluacin 1: 20%, evaluacin 2: 30%, evaluacin 3: 20% y evaluacin 4: 30%
El clculo de la media deber considerar las diferentes ponderaciones de los exmenes.
Se conoce como peso o ponderacin a los factores cuantitativos que modifican a cada
uno de los datos.
La media ponderada de una coleccin de datos x1, x2, ... ,xn , cuyas respectivas
ponderaciones son w1, w2, ... ,wn se define como:

As un alumno que logre las siguientes calificaciones:


Evaluacin Calificacin Ponderacin
1
15
0,30
2
12
0,20
3
19
0,20
4
12
0,30

Obtendr un promedio de 14,3 puntos. Si todas las evaluaciones poseen la misma


importancia, entonces el promedio sera 14,5 puntos. Por qu?

39

Ejemplo:
Supngase que el semestre anterior un estudiante curs Estadstica I, tica, Bases del
Conocimiento y Tcnica de Anlisis Espacial obteniendo las siguientes calificaciones:
Unidad Curricular
Unidades Crdito Calificacin
Estadstica I
4
10
tica
2
16
Bases del Conocimiento
3
13
Tcnica de Anlisis Espacial
4
20
As el promedio ponderado del estudiante fue de:
x p = [4(10)+2(16)+3(13)+4(20)] / (4+2+3+4) = 191 / 13 = 14.69 puntos
y su promedio aritmtico simple:
x = (10+16+13+20) / 4 = 14.75 puntos
A qu se debe que los dos promedios anteriores sean distintos?

c. Media aritmtica para datos agrupados en distribuciones de frecuencias


Es posible utilizar una variante de la frmula para calcular la media ponderada, a fin de
obtener la media de una distribucin de frecuencias. Las ponderaciones son sustituidas
por las frecuencias absolutas simples y la frmula se convierte en:

Ejercicio:
Calcular la media aritmtica para las distribuciones de frecuencias de las variables peso,
edad, estatura, nmero de hermanos, ndice acadmico e ingreso mensual del hogar.
Nota:
En el caso de una distribucin de frecuencias para valores individuales de la variable,
mediante la frmula se obtendr la misma respuesta como si se trabajara con datos
originales. Si las clases de la distribucin de frecuencias son intervalos, el agrupamiento
hace que se pierda informacin y por tanto la media resultante es una aproximacin. El
uso de los puntos medios de clase (marcas de clase) los considera como promedios de
clase, que representan a la clase respectiva, lo cual no siempre se cumple. Sin embargo,
si no se dispone de datos originales, no existe otra alternativa razonable. Adems la
aproximacin de esta frmula a la verdadera media es generalmente buena.

40

Propiedades de la media aritmtica


La media aritmtica presenta ciertas propiedades tiles e interesantes, que explican por
qu es la medida de tendencia central que se utiliza ms ampliamente.

Ejemplo:
En el ejemplo de los pesos de los cerdos se obtuvo que la media aritmtica es 175 Kg.

172 175
177 175
178 175
173 - 175
177 175
174 175
176 175
173 175

=
=
=
=
=
=
=
=

-3
+2
+3
-2
+2
-1
+1
-2
0

Si se calcula la expresin anterior sustituyendo x por cualquier otro valor


arbitrario que
se nos ocurra, se obtiene un valor mayor al que se consigue
utilizando x.
iii.

Si todos los datos son iguales a un mismo valor fijo o constante c, entonces la
media de esos datos tambin es igual a c:

41

iv.

Si a cada uno de los datos originales se le suma un mismo nmero real c, entonces
se tiene una nueva coleccin de datos x1 + c, x2 + c, ... ,x + c, cuya media viene
n

Esta situacin se puede visualizar grficamente de la siguiente manera:

Al sumar la misma constante a cada uno de los datos, realmente lo que estamos
haciendo es desplazar sobre el eje horizontal los datos hacia la derecha si la constante
es positiva o hacia la izquierda si la constante es negativa. Entonces la media
aritmtica se "corre" con los datos.
v.

Si cada uno de los datos originales se multiplica por un mismo nmero real c,
entonces se genera una nueva coleccin de datos x1 * c, x2 * c, ... ,x * c, cuya media
n

En la siguiente ilustracin se puede observar como se ensancha la distribucin de los


datos originales cuando estos han sido modificados al multiplicar cada uno por una
constante, con lo cual la media se ve afectada.

42

Ejemplo:
Si en un semestre un estudiante aprob sus cuatro materias con 15 puntos Cul fue su
calificacin promedio?
De acuerdo a la propiedad iii. la media aritmtica de sus calificaciones fue de 15
puntos.
Ejemplo:
Haciendo referencia al ejemplo de los pesos de los cerdos, suponga que al granjero le
han recomendado un nuevo alimento para cochinos que segn parece los engorda 20
Kg. en quince das. Cul ser el peso promedio de los cerdos dentro de quince das,
luego de utilizar el nuevo alimento?
Ntese que todos los cerdos aumentan 20 Kg., as que a cada uno de los pesos
originales se le debe sumar la constante c = 20. En consecuencia, de acuerdo a la
43

propiedad iv. dentro de quince das el peso promedio de los cerdos debe ser 175+20 =
195 Kg.
Ejercicio:
Suponga ahora que todos los cerdos del granjero se enferman a causa de un virus y se
detecta cinco das despus que todos estos animales han disminuido exactamente 10
Kg. cul es ahora el peso promedio de los cerdos?

Ejemplo:
Supngase que en la Aldea O`LEARY hay dos secciones (1 y 2) de estadstica I con 66
y 73 alumnos respectivamente. Se realiza la primera evaluacin y se obtiene lo
siguiente:

Ejemplo:
Si en el ejemplo de los cerdos, se incluye otro cochino cuyo peso es de 490 Kg., Calcule
la media aritmtica.

Desventajas de la media aritmtica

No puede calcularse cuando los datos estn agrupados en distribuciones de


frecuencias que tienen un intervalo de clase abierto.

La principal desventaja es que se ve afectada por la presencia de valores extremos o


atpicos en los datos.
Ventajas de la media aritmtica

Es un promedio que toma en cuenta todos los valores de una coleccin de datos.
44

Es fcil de calcular y se presta a operaciones algebraicas, lo que la convierte en la


medida de tendencia central ms utilizada tanto en estudios descriptivos como para
realizar inferencias.

En general, para una serie dada de datos existe una buena aproximacin entre el valor
de la media para los datos no agrupados y la media de los datos agrupados.

2. Mediana
La mediana de una coleccin de datos, que previamente han sido ordenados, es aqul
valor ms central o que est ms en medio en el conjunto de datos. En otras palabras, la
mediana es mayor que aproximadamente la mitad de los datos y menor que
(aproximadamente) la otra mitad. As se tiene que aproximadamente 50% de las
observaciones se encuentran por arriba y 50% (aproximadamente) por debajo de ella.
La mediana se denota Md.
Ejemplo:
Los tiempos de los miembros de un equipo de atletismo en una carrera de 1,6 Km estn
dados en la siguiente tabla, calcule la mediana.
Miembro
1
2
3
4
5
6
7
Tiempo (en minutos) 4.2 9.0 4.7 5.0 4.3 5.1 4.8
En primer lugar se deben ordenar los datos: 4.2 4.3 4.7 4.8 5.0 5.1 9.0.
Mediana
Md = 4.8 minutos, es el valor que est en el centro de los datos.

Ejemplo:
Calcule la mediana para el nmero de pacientes tratados en Barrio Adentro II en el
municipio Barinas, durante ocho das consecutivos:
Da
1 2 3 4 5 6 7 8
No. de pacientes 49 52 86 30 35 31 43 11

45

La mediana en este caso puede ser 43 35, o tambin cualquier valor entre 43 y 35.
Para evitar esta imprecisin, se acepta tomar como mediana la suma de los dos valores
centrales y se dividen entre dos:
Md =( 43+35) / 2 = 39

Nota:
Si se tienen n observaciones ordenadas, la mediana es la observacin que ocupa la
posicin (n+1) / 2 cuando n es impar y la media de las observaciones que ocupan las
posiciones n / 2 y (n+2)/ 2 cuando n es par.
Ejemplo:
Regresando al ejemplo de los tiempos del equipo de atletismo, se pide calcular la
media y comparar este resultado con el de la mediana ya obtenida.

Clculo de la mediana para datos agrupados en distribuciones de frecuencias


i. Cuando las clases son intervalos
Se ubica la clase medianal, la cual viene dada por aquella clase que contiene a la
frecuencia acumulada n/ 2 o equivalentemente a la frecuencia relativa acumulada
0,5

Luego de ubicada la clase medianal, el clculo de la mediana se hace mediante


un proceso de interpolacin el cual conduce a la siguiente frmula:

Ejemplo: Calcular la mediana para la distribucin de frecuencias de la variable peso con


la siguiente informacin:
46

En primer lugar se debe ubicar la clase medianal, para esto se debe calcular:
n / 2 = 43 / 2 = 21.5
Ahora se ubica la frecuencia acumulada que contiene a 21,5:

Tambin se puede ubicar la clase medianal encontrando la frecuencia relativa


acumulada que contiene a 0,5000.
Entonces, se tiene que:
Md = 58 + [(21.5-14)/15] * 9 = 62.5
De esta manera, Md = 62,5 Kg. representa el valor central de los pesos. Es decir,
aproximadamente la mitad de los estudiantes de Estadstica I tienen un peso inferior a
62,5 Kg. y aproximadamente la otra mitad pesa ms de 62,5 Kg.

Nota:
En la frmula de la mediana se est suponiendo que los valores en el intervalo de clase
que contiene la mediana estn uniformemente espaciados (o equidistantes). Entonces,
en el ejemplo anterior se est suponiendo que los 15 valores que contiene la clase
medianal estn uniformemente espaciados en [58 -67):

47

Ejercicio:
Calcule la mediana para las distribuciones de frecuencias correspondientes a las
variables estatura, ndice acadmico e ingreso mensual del hogar.

ii. Cuando las clases son valores individuales


Se calcula n / 2 (o se considera el valor 50% de las observaciones)
Si el valor n / 2

NO APARECE en la columna de la Fi, entonces se ubica aquella


frecuencia acumulada que lo contiene y la mediana ser el valor de la variable
correspondiente a esa frecuencia acumulada.

Una forma equivalente de hacer lo anterior es la siguiente, si el valor 50% no aparece

en la columna de las Fr i * 100 entonces se ubica aquella frecuencia que lo contenga


y la mediana ser el valor de la variable correspondiente a esa clase.
Si el valor n / 2

APARECE en la columna de las Fi , es decir que coincide con la


frecuencia acumulada de alguna clase, entonces la mediana viene dada por la media
aritmtica de ese valor de la variable y el siguiente valor.
Tambin, si el valor 50% coincide con alguna de las Fr * 100, entonces la mediana
i

viene dada por el promedio de los valores de la variable correspondiente a esa clase
y a la siguiente.

Ejemplo hipottico:
La siguiente distribucin de frecuencias corresponde al nmero de materias que
cursan 112 estudiantes de la carrera de Gestin Ambiental de la UBV-Barinas.
Calcule la mediana.
Inicialmente se debe calcular
Fi.

n/2

= 56. Entonces 56 no aparece en la columna de las

Por tanto, Md = 4 materias.


48

Ejemplo:
Calcule la mediana para la siguiente distribucin de frecuencias, en donde
decir, n / 2 aparece en la columna de las frecuencias acumuladas:

n/2

= 30. Es

La mediana grficamente
Mediante la ojiva y a travs del mtodo de interpolacin visto en esa seccin se puede
obtener de manera grfica el valor de la mediana de una coleccin de datos agrupados
en una distribucin de frecuencias cuyas clases son intervalos. Si se usa la ojiva
construida con la frecuencia acumulada Fi la mediana ser aqul valor en el eje
horizontal cuya ordenada sea n / 2. En el caso de usar la ojiva construida con la
frecuencia relativa acumulada Fri (o Fri*100), la mediana vendr dada por el valor en
el eje de las abscisas que corresponda a la ordenada 0,5 (o 50%).

As aplicando el mtodo de interpolacin visto antes se obtiene la frmula del clculo


de la mediana:

49

Ejercicio:
Obtenga grficamente la frmula anterior para el clculo de la mediana.

Para el caso de distribuciones de frecuencias cuyas clases son valores individuales de


la variable, se puede hallar grficamente la mediana por medio del diagrama de
frecuencias acumuladas. El procedimiento es similar que cuando se usa la ojiva. Se
ubica en el eje vertical n / 2. (o 50% si se us Fri*100) y se traza una lnea paralela al
eje horizontal, as se presentan las dos situaciones siguientes:
Si la lnea intercepta el grfico, entonces la mediana viene dada por el valor en el eje
de las abscisas que corresponde a la ordenada n / 2 (o 50%).

Si la lnea coincide con uno de los escalones del grfico, la mediana vendr dada

por el punto medio de ese escaln.

Propiedades de la mediana
i. La Mediana es una medida de tendencia central de fcil comprensin pero que
solamente toma en cuenta la posicin que ocupan las observaciones y no el
valor en s de las mismas. Esto hace que la mediana no sea susceptible de
operaciones algebraicas y en consecuencia limita su utilidad, por ejemplo para
fines de inferencia.
50

ii. Puede calcularse en el caso de distribuciones de frecuencias con clases abiertas


siempre y cuando se disponga de la informacin correspondiente a la clase
medianal.
iii. No se ve afectada ante la presencia de unos pocos valores atpicos y es por ello
que se recomienda su uso en el caso de distribuciones marcadamente
asimtricas.
3. Moda
La moda es el valor que ms se repite, es decir el que aparece con mayor frecuencia. En
otras palabras la moda es el valor ms comn de los datos, se denota por Mo y viene
expresada en las mismas unidades que los datos.

Ejemplo:
Calcule la moda de los siguientes datos: 5, 3, 6, 5, 4, 5, 2, 4.
En este caso el valor que ms se repite es el 5, por tanto Mo = 5.
Ejemplo:
Calcule la moda de los siguientes datos: 5, 3, 6, 5, 4, 5, 2, 4, 4.
En este conjunto de datos existen dos valores que se repiten con la misma frecuencia: 4
y 5. As, se tienen dos modas: Mo = 4 y Mo = 5.
1

Ejemplo:
Calcule la moda de los siguientes datos: 5, 3, 3, 5, 6, 2, 6, 4, 2, 4.
En este caso no existe la moda dado que no hay datos que se repitan ms que otros.
En conclusin, una coleccin de datos puede que no tenga moda o puede ser que posea
una o ms modas.
Nota:
Cuando hay una sola moda la distribucin de datos se llama unimodal, con dos modas
bimodal, con tres modas trimodal y con 4 o ms modas se llama polimodal o
multimodal. Si todos los valores se presentan la misma cantidad de veces, la distribucin
se llama amodal.
Cuando los datos estn agrupados en distribuciones de frecuencias cuyas clases
presenten igual amplitud, se toma el punto medio de la clase con mayor frecuencia
absoluta como la moda.

51

Representacin grfica de la moda:

52

La clase modal es [25 - 30) y la moda es Mo = 27,5.


Si se introduce una pequea modificacin en las clases, por ejemplo agrupando las dos
primeras, se tiene:
Clases

[0 - 10) 8
[10 - 15) 6
[15 - 20) 6
[20 - 25) 4
[25 - 30) 7
[30 - 35) 2
Total
33
La clase modal pasa a ser [0 - 10) y Mo = 5. Obsrvese el cambio tan grande que se
produce en la moda ya que pasa de 27,5 a 5.

53

vi. La moda es de utilidad en aquellos casos donde la naturaleza de los datos as lo


indique.
Ejemplo:
Para una fbrica de zapatos, el inters est en conocer la o las tallas ms frecuentes en la
poblacin.
Relacin entre la Media Aritmtica, la Mediana y la Moda
En funcin de la simetra de una distribucin se presentan las siguientes relaciones entre
esas tres medidas:
1. En distribuciones simtricas unimodales la media, la mediana y moda coinciden:

2. En distribuciones simtricas bimodales, la media y la mediana son iguales pero no


coinciden con las modas.

3. En distribuciones asimtricas negativas o por la izquierda, se cumple que x< Md < Mo

54

4. En distribuciones asimtricas positivas o por la derecha, se cumple que x> Md > Mo

Seleccin de la Medida de Tendencia Central adecuada


Los siguientes factores deben tomarse en cuenta en el momento de la seleccin de la medida
numrica apropiada para describir la posicin o tendencia central de los datos:
1. De acuerdo al tipo de dato se puede utilizar una u otra medida de tendencia central. Las
medidas que pueden aplicarse con cada tipo de dato son las siguientes:
i. Datos Nominales: Moda
ii. Datos Ordinales: Moda y Mediana
iii. Datos Discretos: Todas
iv. Datos Continuos: Todas
2. Teniendo en cuenta lo anterior se recomienda tener presente los siguientes aspectos:
a. La naturaleza de la distribucin de los datos. Grficamente se puede observar la
forma general en que se distribuyen los datos. Esto es determinante en la seleccin del
promedio adecuado.
Si se trata de una distribucin simtrica o aproximadamente simtrica, se sabe que la
media, la mediana y la moda coinciden y en consecuencia se puede utilizar
cualquiera de ellas.
Si la distribucin es asimtrica, la media aritmtica no va a ser adecuada y es
preferible inclinarse por la moda o la mediana.
b. El concepto de tendencia central o de posicin que interese reflejar en una
situacin dada.
Si interesa conocer el valor ms comn de una serie de datos como por ejemplo la
estatura tpica de las personas que ingresan al ejercito, es necesario usar la moda.
Si se desea ubicar a una persona en cuanto a su salario anual diciendo que gana por
encima o por debajo de lo que gana la mitad de los trabajadores del pas, entonces
habr que usar la mediana.
Cuando interesa el total de datos o reflejar el punto de equilibrio de los mismos se
utiliza la media aritmtica.
55

c. Riesgos que se corren ante la presencia de valores atpicos.


Si existen valores atpicos, hay que verificar si se incurri en algn error en la recoleccin
de la informacin o puede ser el alerta de alguna situacin no esperada por el investigador.
En todo caso hay que tener presente que la media aritmtica se ve seriamente afectada ante
la presencia de valores atpicos y ser necesario recurrir a alguna de las otras medidas
conocidas.
d. Posibilidad de realizar inferencia estadstica
Cuando el anlisis estadstico se realiza sobre una muestra de la poblacin con la intencin
de generalizar a la totalidad, lo que se conoce como inferencia estadstica, prcticamente la
nica medida de tendencia central utilizada hasta ahora satisfactoriamente es la media
aritmtica y esto se debe a que existe un fundamento terico bien fundamentado que la
respalda.

Medidas de Dispersin
Adems de obtener la informacin que renen las medidas de tendencia central es muy
conveniente tener conocimiento sobre el grado de dispersin o variabilidad que presentan
los datos. Las medidas de dispersin indican si los valores estn relativamente cercanos uno
del otro o si se encuentran dispersos. Esta idea se ilustra en las siguientes figuras.
Recurdese que en el ejemplo de los pesos de los cerdos tenemos los siguientes datos: 172,
177, 178, 173, 177, 174, 176, 173. El diagrama de puntos para esos valores es:

Si los cerdos de otro granjero tienen los siguientes pesos: 165, 182, 185, 168, 170, 173, 180,
177. Entonces el diagrama de puntos est dado por:

Obsrvese que ambos grupos de datos poseen la misma media aritmtica y la misma
mediana, Md =
= 175 Kg. Adems, tambin se puede advertir como las observaciones en
el primer grfico tienen valores relativamente ms cercanos entre s en comparacin con los
pesos del segundo grupo de cerdos.
Por consiguiente, adems de las medidas de tendencia central, siempre es importante contar
con indicadores que midan la dispersin de los datos. Una medida de tendencia central, casi
nunca es suficiente por s sola, para resumir adecuadamente las caractersticas de un
56

conjunto de datos. Por lo general, es necesario, adicionalmente, una medida de la dispersin


de los datos.
En general se pueden clasificar las medidas de dispersin en absolutas y relativas. Las
medidas de dispersin absolutas son aquellas que vienen expresadas en las mismas unidades
que los datos. Las medidas de dispersin relativas no vienen expresadas en las unidades de
los datos sino en porcentaje.
A pesar de que existen diferentes medidas de dispersin, slo se van a considerar las ms
usadas:
Medidas de dispersin absolutas:
Rango o recorrido

Desviacin Estndar

Varianza

Percentiles

Medida de dispersin relativa:


Coeficiente de Variacin
Todas estas medidas, excepto el rango, toman la media como punto de referencia. En cada
caso un valor cero indica que no hay dispersin, mientras que la dispersin aumenta a
medida que se incrementa el valor del indicador (varianza, coeficiente de variacin, etc.)
1. Rango o recorrido
Esta es la medida ms sencilla de calcular y comprender. Se concentra en el valor mximo
y mnimo de la coleccin de datos y viene dada por:
R = Valor mximo - Valor mnimo
En el caso de distribuciones de frecuencias, el rango se obtiene restndole al lmite superior
de la ltima clase el lmite inferior de la primera clase.
En los ejemplos anteriores para los dos grupos de cerdos se tiene que el recorrido para el
grupo 1 es R = 178 - 172 = 6 Kg. y para el grupo 2 es R = 185 - 165 = 20Kg.
La ventaja de utilizar el rango como medida de dispersin, se basa en el hecho de que su
obtencin es bastante sencilla, aun cuando se trate de un conjunto bastante grande de datos.
Adems, el significado de esta medida es fcil de comprender.
La principal limitacin del rango es que considera solamente los valores extremos de los
datos, y no proporciona informacin respecto a los dems valores.
En el siguiente ejemplo se presentan tres conjuntos de datos bastante diferentes, que poseen
el mismo rango.

57

Ntese como en el primer grupo de datos, los valores se distribuyen en forma uniforme, y
esta medida cumple con su objetivo. En el segundo conjunto, los datos se encuentran ms
agrupados y ac el rango mide de una "forma cruda" la dispersin. Sin embargo, la tercera
coleccin demuestra cmo se puede influir fcilmente en el rango mediante unos cuantos
valores extremos, y presentar informacin bastante engaosa respecto a la dispersin de una
coleccin de datos. Debido a estos problemas, el rango tiene una limitada utilidad ya que no
resulta una medida de dispersin confiable.
2. Varianza

Puesto que algunos valores de la muestra son mayores que la media y otros son menores,
algunas de estas diferencias sern positivas y otras negativas. Es ms, las diferencias estn
equilibradas, en el sentido de que su suma es 0 (por propiedad i. de la media aritmtica.
Sin embargo, para analizar la dispersin de los datos, no interesa el signo de las diferencias,
As se tratar una diferencia negativa exactamente igual que una diferencia positiva de la
misma cantidad. Por ejemplo, un salario que est 100.000 bolvares por debajo de la media
deber ser tratado exactamente igual que uno que est 100.000 bolvares por encima de la
media. Una forma de conseguir este objetivo consiste en fijarse, no en las diferencias, sino
en sus cuadrados:

El promedio de los cuadrados de las diferencias proporciona una medida de la dispersin


que se conoce con el nombre de varianza.
Este es un indicador que mide la dispersin de los datos con respecto a su media aritmtica y
se denota por S2
58

Dada una coleccin de datos x1, x2, ... ,xn , cuya media aritmtica es , se define la varianza
de esos datos como el promedio de las diferencias elevadas al cuadrado de cada uno de esos
valores con respecto a su media. Es decir:

Nota
De la frmula anterior se deduce que:
i. Mientras ms alejados estn los valores de su media mayor ser el valor de la
varianza y mientras ms concentrados se encuentren alrededor de su media, menor
ser el valor de la varianza.
ii. La varianza nunca es negativa, ya que se est sumando cantidades elevadas al
cuadrado.
iii. El valor mnimo que puede tomar es cero, el cual se logra cuando todos los valores
son iguales entre s, es decir, que no existe variabilidad entre ellos.
iv. Si se desarrolla la frmula anterior, se obtiene otra expresin equivalente de la
varianza, ms cmoda de calcular y adems reduce los errores de redondeo:

Ejemplo:
Los datos de los pesos de los cerdos son: 172, 177, 178, 173, 177, 174, 176, 173 y la media
es 175 Kg. Calcular la varianza.

Por la otra frmula:

Ntese que la varianza viene expresada en las unidades de los datos pero elevadas al
cuadrado. Por esta razn, la varianza resulta difcil de interpretar. Para solucionar esta
situacin se define la desviacin estndar.

59

3. Desviacin Estndar (Desviacin Tpica):


La desviacin estndar o desviacin tpica de una coleccin de datos, denotada por
se define como:

La cual viene dada en las mismas unidades de los datos.


Ejemplo:
Tomando el ejemplo anterior se tiene que:

Para distribuciones de frecuencias


Para el caso de datos agrupados en distribuciones de frecuencias, las expresiones para la
varianza y la desviacin estndar son:

Ejercicio:
Calcular la varianza y la desviacin estndar para las distribuciones de frecuencias de las
variables peso, nmero de hermanos, estatura, ingreso mensual del hogar, e ndice
acadmico.

60

Propiedades de la varianza y la desviacin estndar

Ejercicio:
En un estudio realizado en un hospital se determin que se gastaba en medicinas un
promedio de Bs. 80.000 semanalmente por paciente con una desviacin estndar de Bs.
15.000.
a. Si se produce un aumento del 100% en las medicinas, cuanto ser el gasto
promedio por paciente y cuanto ser la varianza.
b. Cuanto ser el gasto promedio por paciente y cuanto ser la desviacin estndar
si el aumento es del 20%.
Varianza muestral y varianza poblacional

61

Nota:
La varianza muestral tambin puede definirse como:

Se utiliza con la finalidad de, adems de tener fines descriptivos, realizar inferencias sobre
2

una poblacin usando S y no


, por cuanto se demuestra que S es un mejor estimador
2
de la varianza poblacional que
como se ver en el tema de estimacin.
4. Coeficiente de variacin
La medida de dispersin relativa ms conocida es el coeficiente de variacin. En
algunas ocasiones es de inters comparar la dispersin de dos colecciones de datos. Si
los datos estn medidos en las mismas unidades y las respectivas medias aritmticas son
iguales o muy parecidas es posible utilizar la desviacin estndar. Si esto no se cumple,
no se puede utilizar la desviacin estndar para comparar las dispersiones de los dos
grupos de datos.
Una medida de dispersin que permite la comparacin de la dispersin en cualquier
situacin, que no viene expresada en ninguna unidad es el coeficiente de variacin.
El coeficiente de variacin se define como:

El coeficiente de variacin es la proporcin o porcentaje de la media que representa la


desviacin estndar. Obsrvese como la frmula anterior proviene de una regla de tres
simple:

Si por ejemplo el CV=20%, significa que la desviacin estndar representa el 20% del
valor de la media aritmtica.
Ejercicio:
Supngase que se desea comparar las dispersiones de los salarios de obreros de una
empresa pblica y una privada. Los salarios promedio para estas empresas son Bs.
700000 y Bs. 180000 respectivamente; las desviaciones estndar correspondientes son
Bs. 200000 y Bs. 70000.
Ejercicio:
En una encuesta sobre bienes races en la Urbanizacin Santa Cecilia de una ciudad, se
obtiene entre otras cosas, informacin sobre el valor actual de la casa y el tamao del
62

lote de terreno. Se est interesado en determinar si el valor de avalo tiene mayor


variabilidad que el tamao del lote. De la mencionada encuesta se consigue lo siguiente:

Percentiles, Deciles y Cuartiles


Adems de las medidas de tendencia central, dispersin y forma, tambin existen algunas
medidas interesantes de posicin que se utilizan al resumir y analizar las caractersticas o
propiedades de grandes colecciones de datos.
1. Percentiles
Los percentiles son aquellos valores que dividen a los datos ordenados de forma
creciente, en cien partes iguales. Existen noventa y nueve percentiles que se denotan
por P , P , ... , P . Entre dos percentiles consecutivos se encuentra el 1% de los datos.
1

99

As, por ejemplo, entre los percentiles P y P se encuentran 10% de los datos.
10

20

Para denotar un percentil cualquiera usamos P , donde h=1,2,3, ... ,99. As, la definicin
h

formal de percentil es la siguiente:


El percentil P de una coleccin de datos que previamente han sido ordenados (de forma
h

creciente), es un valor tal que como mximo el h% de los datos son menores que l, y
tambin como mximo un (100-h)% de los datos son mayores que l.
Como en el caso de la mediana, si dos valores consecutivos del conjunto de datos
cumplen con la definicin anterior, se conviene en tomar como percentil al promedio de
ellos dos.
Ejemplo:
Suponga que los pesos de diez personas (en Kg) son: 52, 97, 108, 63, 90, 74, 86, 73.
Hallar lo percentiles: P , P y P .
20

50

80

En primer lugar se deben ordenar de forma creciente los datos:


52 63 73 74 86 90 97 108.
El P es el valor tal que el 20% de los datos, es decir el 20% de 8 = 1,6 datos como
20

mximo son menores que l, y tambin como mximo el 80% de 8 = 6,4 datos son
mayores que l.
Observe que el valor 63 cumple con estas condiciones. Por tanto, P = 63 Kg.
20

Ahora, en el clculo de P se observa que existen dos valores 74 y 86, que cumplen con
50

la definicin. De esta manera, P = (74 + 86) / 2 = 80 Kg.


50

Para estos datos, P tiene como mximo 6,4 datos por debajo de l y a lo sumo 1,6
80

datos por encima. El valor 97 satisface esto, as P = 97 Kg. Ntese que ni el valor 90
80

ni 108 cumple con las condiciones. Por ejemplo, el valor 90 tiene cinco datos por
63

debajo que cumple con lo que se exige pero por encima tiene a dos datos (el 25% de los
datos), lo que no satisface los requerimientos para ser percentil 80.

2. Deciles
Los Deciles son los valores que dividen a los datos ordenados (de forma creciente) en
diez partes iguales. Existen nueve deciles que se denotarn por D , D , ... , D . Entre dos
1

deciles consecutivos se encuentra un 10% de los datos.

3. Cuartiles
Los cuartiles son los valores que dividen a una coleccin de datos que previamente han
sido ordenados en forma creciente, en cuatro partes iguales. De esta manera, existen tres
cuartiles que se denotan Q , Q y Q . Ntese que entre dos cuartiles consecutivos se
1

encuentra un 25% de los datos. Adems, por debajo de Q , se encuentra un 25% de los
1

datos y por encima un 75%; mientras por debajo del cuartil tres, se encuentra un 75%
de los datos y por encima de l existe un 25% de los datos.

Ntese que el segundo cuartil, Q , es igual a la mediana. Adems, puede dejarse ver las
2

siguientes relaciones entre los cuartiles deciles y percentiles:


Q =P
1

25

Q = D = P = Md
2

Q =P
3

D =P
1

D =P
2

D =P
9

50

75
10
20

90

Nota:
A los cuartiles, deciles y percentiles en general se les denominan cuantiles
Ejercicio:
Para los datos no agrupados de estatura, calcular e interpretar: los cuartiles, el decil tres
y el percentil diez.
64

Clculo de Percentiles en distribuciones de frecuencias


En el caso de distribuciones de frecuencias cuyas clases son intervalos, los percentiles, de la
misma manera como se hizo con la mediana, se pueden calcular mediante un mtodo de
interpolacin tanto de forma algebraica como grfica.
Algebraicamente, para el clculo del percentil h-simo, P , se sigue el siguiente
h

procedimiento:
1. Se ubica la clase del percentil h, que es aquella que contiene la frecuencia acumulada

2. Una vez ubicada la clase del percentil h, mediante un proceso de interpolacin se puede
obtener la siguiente frmula para el clculo de los percentiles:

en donde,
LI : Lmite inferior de la clase del percentil h.
p

n: No. total de observaciones o datos


F : Frecuencia acumulada anterior a la clase del percentil h.
ap

f : Frecuencia absoluta de la clase del percentil h.


p

C : Amplitud de la clase del percentil h.


p

Como se vio antes con la mediana, se pueden obtener grficamente los percentiles
utilizando la ojiva:

65

Ntese que por el mismo mtodo de interpolacin grfico de la ojiva para distribuciones de
frecuencias con intervalos; si se conoce algn valor de los datos, digamos P , entonces
h

puede ser encontrada la proporcin (o porcentaje) de datos, h, que son menores (o puede
ser, mayores o iguales) que el valor P . Simplemente, despejando h de la frmula para
h

calcular percentiles en distribuciones de frecuencias. As de ese despeje queda que:

Si las clases de la distribucin de frecuencias son valores individuales de la variable en


estudio, se procede similarmente a como se hizo con la mediana. En este caso, no hace falta
hacer alguna interpolacin. Se puede encontrar cualquier percentil mediante la definicin.
Ejercicio:
Calcular los cuartiles Q y Q , el decl D y el percentil P
1

90

en las distribuciones de

frecuencias de las variables peso y estatura usando el mtodo algebraico y el mtodo


grfico.
Ejercicio:
Calcular los percentiles P y P para las distribuciones de frecuencias correspondientes a
15

80

las variables nmero de hermanos y nmero de visitas al cine usando el mtodo algebraico
y el mtodo grfico.

Los percentiles tambin son utilizados como indicadores de la dispersin de los datos. En
base a ellos se construyen algunas medidas de dispersin. Veamos algunas de ellas:

Recorrido Intercuartil
El recorrido intercuartil, viene dado por:
RQ = Q - Q
3

Esta medida refleja la dispersin de la parte central de la distribucin ya que toma en cuenta
al 50% de los datos del centro de la distribucin:

66

Desviacin Cuartil Recorrido Semi-Intercuartil


La desviacin cuartil se obtiene mediante la siguiente expresin:

Si se calcula :
Md Q
se obtiene un intervalo que contiene aproximadamente el 50% de los datos.
Fcilmente puede notarse que las dos medidas anteriores no toman en cuenta a todos los
datos, lo cual puede representar una seria desventaja ya que es posible que por debajo de Q

o por encima de Q , los datos se encuentran muy concentrados o muy dispersos y el efecto
3

sobre RQ y Q ser el mismo. Aunque por otro lado, y por la misma razn, el recorrido
intercuartil y la desviacin cuartil no son afectados por valores atpicos.
Recorrido Percentil
Es una medida basada en la misma idea que el RQ, la cual viene dada por:
RP= P - P
90

10
.

Este indicador refleja el 80% de los datos ubicados en la parte central de la distribucin

Ejercicio:
Para las distribuciones de frecuencia correspondientes a las variables peso e ingreso hallar:
a) RQ.
b) RP.
c) El intervalo que contiene aproximadamente el 50% de los datos del centro de la
distribucin.

67

Medidas de Forma
En una seccin anterior se examin la forma en que se distribuyen los datos analizando el
respectivo grfico. Se observ la simetra (o asimetra) que presentan los datos y tambin se
poda percibir el grado de apuntamiento (o achatamiento ) del grfico que representa la
distribucin de los datos.
Existen indicadores que cuantifican la asimetra y el apuntamiento de una distribucin, los
cuales son de utilidad cuando no se dispone del grfico o para confirmar las conclusiones
obtenidas grficamente.
Tanto las medidas de asimetra como las de apuntamiento son indicadores relativos ya que
no vienen expresados en alguna unidad de medida.
1. Medidas de Asimetra
Los resultados que se discutirn se refieren a distribuciones unimodales:
a. Coeficiente de Asimetra de Pearson
Este indicador se basa en la relacin existente entre la media y la mediana:

Obsrvese que si la distribucin es:

El coeficiente de asimetra de Pearson toma valores en el intervalo (-3, 3)

68

b. Coeficiente de Asimetra de Fisher


Se denota por y viene dado por la siguiente frmula:
1

Datos no agrupados:

Datos agrupados:

El coeficiente est basado en la media aritmtica e indica de que lado las diferencias
1

respecto de stas son mayores.


Su interpretacin es similar a la del coeficiente de Asimetra de Pearson

Ejercicio:
Calcule e interprete los coeficientes de asimetra ASP y para las distribuciones de
1

frecuencias correspondientes a las variables peso, estatura, ingreso y nmero de


hermanos.

2. Medidas de Apuntamiento o Curtosis


Estas medidas indican el grado de apuntamiento o achatamiento del grfico correspondiente
a una distribucin de frecuencias. La medicin del apuntamiento de un grfico se hace
tomando como referencia la curva normal (curva de campana o curva de Gauss). A la curva
normal se le llama mesocrtica, si es ms puntiaguda se le llama leptocrtica y si es mas
achatada platicrtica.
Ntese que los indicadores de curtosis, miden el nivel de concentracin de datos en la
regin central.

69

Coeficiente de Pearson
El coeficiente de Pearson es el ms utilizado de las medidas de apuntamiento y viene
2

dado por:
Datos no agrupados:

Datos agrupados:

Si la curva es normal (mesocrtica) , 2 = 3


Si la curva es leptocrtica , 2 > 3
Si la curva es platicrtica , 2 < 3

Ejercicio:
Calcule e interprete el coeficiente de Pearson para las distribuciones de frecuencia
2

correspondientes a las variables peso, estatura y nmero de hermanos.

70

Demografa
La Demografa es la ciencia que tiene como objetivo el estudio de las poblaciones
humanas y que trata de su dimensin, estructura, evolucin y caractersticas generales,
considerados desde un punto de vista cuantitativo. Por tanto la Demografa estudia
estadsticamente la estructura y la dinmica de las poblaciones humanas y las leyes que
rigen estos fenmenos.
Tabla de contenidos
1 Tipos de Demografa:
2 Fuentes de la Demografa:
3 Expresin de los datos demogrficos:
4 Historia de la Demografa:
5 Importancia de la Demografa:
Tipos de Demografa:
Los dos tipos o partes de la Demografa estn interrelacionados entre s y la separacin es
un tanto artificial, puesto que el objetivo de estudio es el mismo: las poblaciones humanas.

Demografa esttica: Es la parte de la Demografa que estudia las poblaciones


humanas en un momento de tiempo determinado desde un punto de vista de dimensin,
territorio, estructura y caractersticas estructurales.
1. La dimensin es el nmero de personas que residen normalmente en un territorio
geogrficamente bien delimitado.
2. El territorio es el lugar de residencia de las personas que puede globalizarse o
desagregarse como puede ser una nacin, regin, provincia, ciudad, municipio, etc.
3. La estructura de una poblacin es la clasificacin de sus habitantes segn variables
de persona. Segn las Naciones Unidas estas variables son: edad, sexo, estado civil,
lugar de nacimiento, nacionalidad, lengua hablada, nivel de instruccin, nivel
econmico y fecundidad.

Demografa dinmica: Es la parte de la Demografa que estudia las poblaciones


humanas desde el punto de vista de la evolucin en el transcurso del tiempo y los
mecanismos por los que se modifica la dimensin, estructura y distribucin geogrfica
de las poblaciones, como son la natalidad, nupcialidad, familia, fecundidad, sexo, edad,
educacin, divorcio, envejecimiento, mortalidad, migracin, trabajo, emigracin e
inmigracin

Su expresin son las Tablas demogrficas, que son los datos estadsticos numricos y
grficos. Los administradores utilizan el censo total -real- cada diez aos o muestreos estimados- mensuales o anuales. Tienen que estar diseados de forma que no slo se
puedan establecer estadsticas descriptivas, sino que tambin 'anlisis demogrficos
cruzados' puedan ser hechos. Un ejemplo : sueldos anuales y edades o distribucin por

71

sueldos, por clases sociales, en la nacin y en una comunidad, por viviendas y familias, etc.
y tpicos generales o variables bsicas son la riqueza, el poder y la movilidad social.
Fuentes de la Demografa:

Censos.
Encuesta.
Padrones.
Registros Civiles.
En Venezuela Instituto Nacional de Estadsistica (INE).

Expresin de los datos demogrficos:

Pirmide de poblacin.

Historia de la Demografa:
En 1798 Thomas Robert Malthus public su obra llamada "Ensayo sobre el principio de
la poblacin", en la que adverta de la tendencia constante del crecimiento de la poblacin
humana superior al de la produccin de alimentos, e inform de los distintos factores que
influan en este crecimiento como son: la guerra, el hambre, la enfermedad, la
anticoncepcin.
Pero Malthus se equivoc. La ciencia ha conseguido que la produccin de alimentos pueda
crecer incluso a mayor velocidad que la poblacin, especialmente en los pases
industrializados, y muchos de ellos se han convertido en exportadores de productos
agrcolas.
Importancia actual de la Demografa
El estudio del estado y de la dinmica poblacional y su evolucin son fundamentales para
poder disear programas para el desarrollo de los pueblos. El tamao de la poblacin, la
edad de los residentes, el gnero, la ocupacin, los niveles de educacin, niveles de ingreso,
el estado civil, son solo algunas de las variables utilizadas por profesionales en diferentes
campos para establecer sus estrategias de trabajo tanto en el sector pblico como en el
privado. A continuacin se sealan algunas de las reas que requieren de estudios
demogrficos para realizar su labor de una manera exitosa:
Planificacin de nuevos programas: Salud, educacin, seguridad, etc.
Evaluacin del impacto de los programas existentes.
Distribucin equitativa de los recursos.
Identificacin de problemas y necesidades futuras.
Identificacin del potencial de las localidades para el mercado de bienes y servicios.
Determinacin de las caractersticas de los potenciales clientes.
72

Desarrollo de estrategias de mercadeo para nuevos productos


Empleo de tcnicas y modelos demogrficos para explicar otros comportamientos.
Entre otros.

73

74

Glosario de trminos:
Entidad Federal: son las unidades de mayor jerarqua dentro de la Divisin Poltico
Administrativa de Venezuela, creadas a travs de la Constitucin Nacional.
Municipio: Constituye la unidad poltica primaria y autnoma dentro de la organizacin
nacional, establecida en una extensin determinada del territorio. Tiene personalidad
jurdica y su representacin la ejercen los rganos determinados en la Ley.
POBLACIN
Censo de poblacin y vivienda: Es el estudio, para un momento dado, de una zona
determinada de un pas o de este en su totalidad, que da como resultado la enumeracin de
toda la poblacin y de todas las viviendas, adems de la recopilacin de la informacin
demogrfica, social y econmica concerniente a dicha poblacin, as como de las
caractersticas de las viviendas.
Superficie total (Km): Superficie territorial del municipio, segn cifras provenientes del
Sistema de Informacin Geogrfico y Estadstico (SIGE) del INE.
Densidad de poblacin (hab/km2): Relacin entre el nmero de habitantes por kilmetro
cuadrado de superficie. Es el resultado de dividir el total de poblacin entre la superficie
(km2), de un rea geogrfica determinada.
ndice de masculinidad: Representa la proporcin de hombres que hay por cada 100
mujeres en el pas o en una determinada rea geogrfica. Su clculo consiste en dividir la
poblacin masculina entre la poblacin femenina y multiplicar por cien.
Pirmide de poblacin: Grfica que refleja la composicin de una poblacin por edad y
sexo. Es generada a partir del clculo de los porcentajes para cada grupo de edad y sexo con
relacin al total general de poblacin del municipio. La base de la pirmide corresponde al
tramo de edad de 0 a 4 aos y la punta de la misma, al tramo de edad de 75 y ms aos. Los
tramos intermedios se ordenan ascendentemente desde la base hacia la cspide. Las barras a
la izquierda de la pirmide, reflejan la estructura de edad de la poblacin masculina,
mientras que las barras a la derecha, reflejan esta estructura para la poblacin femenina.
Poblacin adolescente: Se considera adolescente a toda persona con edad comprendida
entre 12 y 17 aos.

75

Poblacin en edad escolar: Se considera tal a la poblacin entre 3 y 24 aos, como la edad
estndar oficial nacional (internacional) para estudiar. sta se divide en grupos segn nivel
educativo: preescolar (de 3 a 6 aos); educacin bsica (de 7 a 14 aos); media,
diversificada y profesional (de 15 a 17) y universitaria (de 18 a 24 aos).
Poblacin femenina en edad reproductiva: Se considera tales a las mujeres entre los 15 y
los 49 aos.
Poblacin en edad de trabajar: Se considera tal a la poblacin entre 15 y 64 aos.
Poblacin Infantil: Se considera tal a la poblacin menor de 12 aos de edad.
Poblacin menor: Se considera a la poblacin menor de 15 aos de edad.
Poblacin mayor: Se considera a la poblacin mayor de 64 aos de edad.
Poblacin dependiente: Se considera a la sumatoria de la Poblacin menor y la
Poblacin mayor.
Poblacin rural: Es la poblacin que reside en las localidades o centros poblados con
menos de 2500 habitantes.
Poblacin urbana: Es la poblacin que reside en los centros poblados mayores de 2.500
habitantes.
Proyeccin de poblacin: Son las estimaciones del volumen de poblacin de un rea
geogrfica o pas, para los aos o quinquenios de un perodo, estimados al 30 de junio de
cada ao. Estas provienen de clculos relativos a la evolucin futura de esta poblacin,
tomando como base la informacin del ltimo censo y ciertos supuestos respecto a la
evolucin de la fecundidad, la mortalidad y la migracin en el rea o pas.
Razn de dependencia de mayores: Relacin entre la poblacin mayor (mayores de 64
aos) y la poblacin en edad de trabajar (de 15 a 64 aos). Permite conocer cuntas
personas mayores hay por cada persona en edad de trabajar. Se calcula dividiendo el total
de poblacin mayor de 64 aos de edad entre el total de poblacin de 15 a 64 aos de edad.
Permite apreciar la dependencia econmica especfica de los mayores.
Razn de dependencia de menores: Relacin entre poblacin menor (menores de 15
aos) y la poblacin en edad de trabajar (de 15 a 64 aos). Permite conocer cuntas
personas menores hay por cada persona en edad de trabajar. Se calcula dividiendo el total
de poblacin menor de 15 aos de edad entre el total de poblacin de 15 a 64 aos de edad.
Permite apreciar la dependencia econmica especfica de los menores.
Razn de dependencia: Relacin entre la Poblacin dependiente (menores de 15 y
mayores de 64 aos) y la poblacin en edad de trabajar (de 15 a 64 aos). Permite
conocer cuntas personas dependientes hay por cada persona en edad de trabajar. Se calcula
dividiendo el total de poblacin menor de 15 aos y mayor de 64 aos de edad entre el total
76

de poblacin de 15 a 64 aos de edad. Permite apreciar la dependencia econmica,


relacionando poblacin en edades dependientes con la poblacin en edad de trabajar.
Razn de reemplazo: Es la relacin entre la Poblacin menor y la Poblacin mayor.
Expresa resumidamente la estructura de edad de la poblacin. Permite observar el ritmo de
sustitucin de la poblacin y el ingreso de nuevas personas a la poblacin econmicamente
activa. Tambin es un indicador de crecimiento poblacional. Se calcula dividiendo el total
de poblacin menor de 15 aos entre el mayor de 64 aos de edad.

HECHOS VITALES
Defuncin: Es la desaparicin permanente de todo signo de vida, posterior al nacimiento
vivo, cesacin de las funciones vitales con posterioridad al nacimiento, sin posibilidades de
resucitar.
Lugar de residencia habitual de la madre: Se refiere a la localidad o centro poblado
declarado por la madre como su residencia en el acto de registro.
Lugar de residencia habitual: Para los registros de defunciones se considera municipio de
residencia la localidad o centro poblado en la que resida el difunto, segn lo declarado por
quien realiz el registro.
Mortalidad infantil: Se refiere al fallecimiento de nios, ocurrido antes de cumplir stos
un ao de vida.
Nacimiento vivo: Es la extraccin o expulsin completa del cuerpo de la madre de un
producto de la concepcin, independientemente de la duracin del embarazo, que despus
de esta separacin respira o manifiesta cualquier otro signo de vida, tal como latidos del
corazn o del cordn umbilical, el movimiento de msculos sometidos a la accin de
voluntad, haya sido cortado o no el cordn umbilical, o que la placenta siga conectada.

EDUCACIN
Alumnos matriculados: Constituye la totalidad de los estudiantes inscritos en cualquier
nivel de educacin al iniciarse el ao escolar.
Dependencia del plantel: especifica la dependencia a la que pertenece el plantel, que
pueden ser: Nacional, Estatal, Municipal, Autnoma, Privada, Privada Subvencionada
Oficial y Privada Subvencionada, todos adscritos al Ministerio de Educacin Cultura y
Deportes.

77

Educacin preescolar: Constituye la fase previa al nivel de educacin bsica. Asistir y


proteger al nio en su crecimiento y desarrollo y lo orientar en las experiencias
socioeducativas propias de la edad.
Educacin bsica: Tiene una duracin no menor de nueve (9) aos, su finalidad es
contribuir a la formacin integral del educando mediante el desarrollo de sus destrezas y de
su capacidad cientfica, tcnica, humanstica y artstica. Cumple funciones de exploracin,
orientacin educativa y vocacional, iniciacin al aprendizaje de disciplina y tcnicas que
permiten el ejercicio de una funcin socialmente til; estimulando el deseo de saber y
desarrollando la capacidad de ser de cada individuo de acuerdo a sus aptitudes.
Educacin media diversificada y profesional: Tiene una duracin no menor de dos aos.
Su objetivo es continuar el proceso formativo del alumno iniciado en los niveles
precedentes, ampliar el desarrollo integral del educando y su formacin cultural, ofrecerle
oportunidades para que defina su campo de estudio y de trabajo; brindarle una capacitacin
cientfica, humanstica y tcnica que le permita incorporarse al trabajo productivo y
orientarlo para la prosecucin de estudios en el nivel de educacin superior.

Educacin superior: Tiene como objetivo continuar el proceso de formacin integral del
hombre; formar profesionales y especialistas y promover su actualizacin y mejoramiento
conforme a las necesidades del desarrollo nacional y del progreso cientfico. Igualmente,
fomentar la investigacin de nuevos conocimientos e impulsar el progreso de la ciencia, la
tecnologa, las letras, las artes y las dems manifestaciones creadoras del espritu, en
beneficio del bienestar del ser humano, de la sociedad y del desarrollo independiente de la
nacin.
Matrcula inicial: Son todos los estudiantes inscritos al comienzo del ao acadmico en
un nivel de enseanza determinado.
Matrcula repitiente: Son todos los estudiantes inscritos al comienzo del ao acadmico
que tienen que volver a cursar el mismo grado o ao que curs el ao acadmico anterior.
Matrcula final: Se refiere a la cantidad de estudiantes que terminan el ao acadmico, no
se considera la repitencia ni la desercin.
Nivel educativo: Es un perodo de varios grados o aos dentro del sistema educativo que
tiene una finalidad especfica derivada del grado de cultura y que en el sistema educativo
regular corresponde a una determinada etapa del desarrollo psico-fsico del educando. Son
niveles de educacin, la educacin preescolar, la educacin bsica, la educacin media
diversificada y profesional y la educacin superior.
Personal docente: Son aquellas personas cuya actividad profesional entraa la transmisin
de los conocimientos, las actitudes y las capacidades estipulados en un programa de estudio
oficial, a los alumnos matriculados, en un establecimiento de enseanza formal.

78

Plantel: Es la institucin estructurada y organizada como unidad, destinada a impartir un


nivel determinado de enseanzas o parte de l.
Porcentaje de la matrcula inicial: Expresa para cada nivel educativo, cmo es la
distribucin (porcentual) de los alumnos matriculados. A nivel del rea geogrfica
municipal, para cada nivel educativo, se divide el total de alumnos matriculados del
municipio entre el total de matrcula del estado.
Porcentaje de repitientes: Es el nmero total de alumnos matriculados como estudiantes
del mismo grado o ao que curso el ao acadmico precedente, expresado en relacin sobre
el total de la matrcula inicial en ese grado.
Promedio alumnos por docentes: Es el nmero promedio de alumnos por maestro en un
nivel de enseanza especfico y en un ao acadmico determinado.
Razn masculino femenino: Representa la proporcin de nios que hay por cada 100
nias en un nivel educativo y en un ao acadmico determinado. Se define como el
cociente entre los alumnos masculinos y las estudiantes femeninas por cien.
Secciones: Son los subconjuntos que se forman dentro de un mismo grado o ao de estudio
cuando el nmero de alumnos sobrepasa al que normalmente puede atender un slo
maestro.
SALUD
Camas arquitectnicas: Es el nmero de camas de hospitalizacin que un centro de salud
estara en capacidad de albergar.
Camas funcionales: Es el nmero de camas de hospitalizacin que realmente estn en
condiciones de uso en un centro de salud.
Camas presupuestadas: Es el nmero de camas de hospitalizacin existentes en un centro
de salud.
Causa de muerte: Es la enfermedad o circunstancia bsica que origina el fallecimiento de
una persona. En la presente publicacin se utiliza la X Clasificacin Internacional de
Enfermedades - CIE 10 para agrupar estas causas bsicas de muerte.
Causas de morbilidad de consulta ambulatoria: Es la circunstancia, enfermedad o
sntoma de sta, que est presente en un paciente y que es la razn por la cual ste asiste a
algn centro ambulatorio de atencin en salud.
Enfermedades de notificacin obligatoria: Es el grupo de enfermedades de alto riesgo
epidemiolgico, las cuales deben ser reportadas diariamente y de manera obligatoria ante
los organismos pblicos encargados de la vigilancia epidemiolgica en todo el pas.

79

Enfermeras por mdico: Es el nmero de enfermeras existentes por cada mdico en un


centro de salud.
Habitantes por mdicos: Es el nmero de habitantes por cada mdico existente en un rea
geogrfica determinada
ndice de rendimiento hospitalario: Es un indicador de eficiencia que permite medir el
tiempo medio que dura un paciente desde su ingreso u hospitalizacin hasta su egreso del
centro de salud.
Intervalo de sustitucin: Representa el tiempo estimado en horas que permanece una
cama funcional vaca luego de que un paciente la desocupa.
Porcentaje de ocupacin: Permite conocer cuntas camas permanecen ocupadas en un da
por cada cien camas funcionales presentes en el centro de salud.
Promedio de estancia: Representa el tiempo estimado en das que permanece un paciente
recluido en un centro de salud.
Promedio diario de camas ocupadas: Representa el nmero estimado de camas que
permanecen ocupadas por pacientes en un da.
Proporcin de mortalidad por causa: Es el nmero de defunciones debidas a una causa
especfica de muerte por cada cien defunciones registradas.
Tasa de mortalidad por causa: Es el nmero de defunciones registradas debidas a una
causa especfica de muerte por 100.000 habitantes en un ao determinado. Se calcula
dividiendo el total de las defunciones para cada causa de muerte entre el total de poblacin
y el resultado se multiplica por diez mil.
Promedio de aos potenciales de vida perdidos: Es un indicador de mortalidad y
longevidad que expresa el nmero promedio de aos de vida perdidos en relacin a un
lmite de edad. Se calcula como el promedio de la diferencia entre la edad al morir y la
edad lmite (se utiliz una edad lmite de 70 aos como la Esperanza de Vida de
la poblacin de 1 a 70 aos). Se excluye la mortalidad infantil (menores de un ao de
edad) y la mortalidad de personas mayores de 70 aos.

NUTRICIN
(Tomado de: Instituto Nacional de Nutricin, Direccin Ejecutiva, Oficina de Sistema de
Vigilancia Alimentaria y Nutricional, Boletn Alimentario y Nutricional, 1994 1997.
Venezuela 1998).
Indicador Peso para la Edad (Peso/Edad): Es la relacin que existe entre el peso
obtenido en un sujeto a una edad determinada y la referencia para su misma edad y sexo. Es
sensible, fcil de obtener y susceptible a ser modificada rpidamente en situaciones de

80

dficit nutricional. Sin embargo, como la variabilidad del peso refleja la de la talla, no
permite diferenciar el dficit actual del dficit pasado; muchos investigadores lo consideran
un indicador de desnutricin global.
Combinacin de indicadores: Mtodo de medicin de la desnutricin que combina los
indicadores antropomtricos: Talla, Peso/Edad y Talla/Edad. Permiten un enfoque ms real
de la situacin nutricional a travs del tiempo, por lo que es de gran utilidad para
diferenciar la mal nutricin actual, la pasada y la global.
Desnutricin aguda: Segn la combinacin de indicadores se entiende en desnutricin
aguda a los nios o nias con peso insuficiente para la talla, sin afectarse la talla con
respecto a su edad, siendo el desbalance entre el aporte y el requerimiento de corta data.
Desnutricin compensada: Segn la combinacin de indicadores se entiende en
desnutricin compensada a los nios y nias cuyo dficit en la ingesta de nutrientes se ha
prolongado en el tiempo (se observa desnutricin crnica), habindose afectado la talla con
respecto a su edad, pero que se encuentran adaptados por lo que no presentan desnutricin
actual (homeorresis). Son nios muy bajos para su edad con un fsico armnico. Nios
considerados desnutridos tan slo por el indicador antropomtrico Talla/Edad.
Desnutricin descompensada: Segn la combinacin de indicadores se entiende en
desnutricin descompensada a los nios y nias cuyo dficit en la ingesta de nutrientes se
ha prolongado en el tiempo (se observa desnutricin crnica), habindose afectado la talla
con respecto a su edad y que sufren un episodio agudo de desnutricin. Nios considerados
desnutridos por los tres indicadores antropomtricos: Peso/Talla, Peso/Edad y Talla/Edad.
ndice antropomtrico: Es el resultado de interpretar una medida fsica, como el peso y la
talla, cuando sta es comparada con valores.

FUERZA DE TRABAJO
Buscando Trabajo por primera vez (BTPPV): Incluye a las personas de 15 aos y ms
de edad, que no han trabajado nunca y durante el perodo de referencia estaban buscando
trabajo remunerado.
Categora ocupacional: Clasificacin de una persona econmicamente activa con respecto
a su condicin ocupacional en la fuerza de trabajo. En esta clasificacin se excluyen a las
personas que buscan trabajo por primera vez. Se consideran las siguientes categoras: i)
empleado u obrero gubernamental, ii) empleado u obrero en empresa particular,
iii) miembro de cooperativa, iv) trabajador por cuenta propia, v) patrono o empleador, vi)
ayudante no familiar no remunerado, y vii) ayudante familiar no remunerado.

81

Cesantes: Son aquellos desocupados que en el perodo de referencia no estaban trabajando


por haber perdido su empleo y buscaban un trabajo con remuneracin.
Desocupados: Agrupa a las personas econmicamente activas de 15 aos y ms de edad,
que durante el perodo de referencia no estaban trabajando, incluye los cesantes y los que
buscan trabajo por primera vez.
Ocupados: Son aquellas personas econmicamente activas, de 15 aos y ms de edad, que
estaban trabajando o tenan una ocupacin, con o sin remuneracin, durante el perodo de
referencia, ya se trate de trabajadores a jornada parcial o completa. Las personas ocupadas
sin remuneraciones en dinero se denominan por lo general Trabajadores familiares y/o
Ayudantes familiares no remunerados.
Poblacin Econmicamente Activa (PEA): Est constituida por todas las personas de 15
aos y ms de edad, de uno u otro sexo que suministran la mano de obra disponible para la
produccin de bienes y servicios en un momento o perodo de referencia determinado.
Tasa de actividad: Es la relacin entre la poblacin econmicamente activa con respecto a
la poblacin de 15 aos y ms, multiplicado por cien.
Tasa de cesanta: Es el cociente del nmero de cesantes y la Poblacin Econmicamente
Activa (PEA), multiplicado por cien.
Tasa de desocupacin: Es el cociente del nmero de desocupados y la Poblacin
Econmicamente Activa (PEA), multiplicado por cien.
Tasa de ocupacin: Es el cociente del nmero de ocupados y la Poblacin
Econmicamente Activa (PEA), multiplicado por cien.

82

BIBLIOGRAFIA:
1. Armas, J. (1988) Estadstica Sencilla. Descriptiva. Mrida: FACES-ULA.
2.

Rangel, G. J .L (2006) Apuntes de estadstica. Mrida: FACES-ULA.

3.

Newbold, P. (1998) Estadstica para los Negocios y la Economa. Madrid: Prentice


Hall.

4.

Ya-Lun Chou. (1992) Anlisis Estadstico. Mxico: Editorial Interamericana.

5.

Berenson, M., Levine, D. y Krehbiel, T. (2001) Estadstica para Administracin.


Mxico: Pearson Educacin.

6.

Mason, R., Lind, D. y Marchal, W. (2001) Estadstica para Administracin y


Economa. Mxico, D.F.: Alfaomega.

7. Stevenson,. W. (1981) Estadstica para Administracin y Economa. Mxico, D.F.:


Harla.
8. Instituto Nacional de Estadstica. Barinas

83

Potrebbero piacerti anche