Sei sulla pagina 1di 35

Centro de Altos Estudios Universitarios de la OEI

Curso Iberoamericano de formacin permanente de


profesores de matemtica
Tema 21: Estadstica Descriptiva

1
Curso Iberoamericano de formacin permanente de profesores de matemtica

Introduccin.

El pensamiento estadstico ser un da tan necesario para el ciudadano eficiente como


la capacidad de leer y escribir
H. G. Wells

La estadstica actual es el resultado de la unin de dos disciplinas que evolucionan


independientemente hasta confluir en el siglo XIX: la primera es el clculo de
probabilidades, que nace en el siglo XVII como teora matemtica de los juegos de azar;
la segunda es la Estadstica (o ciencia del Estado, del latn Status) que estudia la
descripcin de datos, y tiene unas races ms antiguas. La integracin de ambas lneas
de pensamiento da lugar a una ciencia que estudia cmo obtener conclusiones de la
investigacin emprica mediante el uso de modelos matemticos.
La estadstica acta como disciplina puente entre los modelos matemticos y los
fenmenos reales [] La Estadstica proporciona una metodologa para evaluar y
juzgar estas discrepancias entre la realidad y la teora.
Extrado de Estadstica Modelos y mtodos Daniel Pea

El trmino estadstica se asocia al trmino del latn statisticum que significa Estado y de
su derivado italiano statista hombre de estado, y parte de su origen es se, pero fue
Gottfried Achenwall (1749) quien primero denominaba con la palabra alemana,
Statistik, el anlisis de datos del Estado, y no fue hasta el siglo XIX cuando el trmino
estadstica adquiri el significado de recolectar y clasificar datos. Este concepto fue
introducido por el ingls John Sinclair.
Aunque el trmino es relativamente reciente, los comienzos de los procedimientos
estadsticos son mucho ms antiguos.

En el antiguo Egipto los faraones lograron recopilar, hacia el ao 3050 antes de Cristo,
datos relativos a la poblacin y la riqueza del pas. De acuerdo al historiador griego
Herdoto, dicho registro de riqueza y poblacin se hizo con el objetivo de preparar la
construccin de las pirmides.

En el antiguo Israel, la Biblia da referencias, en el libro de los Nmeros, de los datos


estadsticos obtenidos en dos recuentos de la poblacin hebrea. El rey David por otra
parte, orden a Joab, general del ejrcito hacer un censo de Israel con la finalidad de
conocer el nmero de la poblacin.

Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los griegos
efectuaron censos peridicamente con fines tributarios, sociales (divisin de tierras) y
militares (clculo de recursos y hombres disponibles). Pero fueron los romanos quienes
mejor supieron emplear los recursos de la estadstica. Cada cinco aos realizaban un
censo de la poblacin y sus funcionarios pblicos tenan la obligacin de anotar
nacimientos, defunciones y matrimonios, sin olvidar los recuentos peridicos del
ganado y de las riquezas contenidas en las tierras conquistadas.

En un segundo perodo, la estadstica, sin abandonar su tarea recopilatoria, empieza su


avance tanto el terreno de la aplicacin del mtodo cientfico a la recogida de datos,
como tambin en el campo del anlisis e interpretacin de los mismos. En Inglaterra,
durante el siglo XVII, se inicia y desarrolla lo que vino en llamarse Aritmtica Poltica.
2
Centro de Altos Estudios Universitarios de la OEI

As, en 1662 el londinense John Graunt 1620-1674), public su libro Natural and
Political Observations made upon the Bills of Mortality. En esta obra se lleva a cabo el
primer intento de interpretar fenmenos biolgicos y sociales de la poblacin a partir de
datos numricos. En su libro, Graunt pone de manifiesto las cifras brutas de nacimientos
y defunciones en Londres durante el perodo comprendido entre 1604 y 1661, as como
la influencia ejercida en dichos fenmenos por causas naturales y sociales.

Hoy en da el uso de la estadstica se ha extendido ms all de sus orgenes como un


servicio al Estado, y las personas y organizaciones la usan para entender datos y tomar
decisiones en prcticamente todos los campos sociales y cientficos.

1. Conceptos bsicos

La estadstica hoy en da es considerada como una rama de las Matemticas que se


encarga de la recopilacin e interpretacin de datos obtenidos mediante un estudio. La
estadstica, tal y como hemos visto en la introduccin, permite tomar decisiones en el
mbito gubernamental, pero tambin en el mundo econmico, cientfico y hasta
personal.

Definicin: Se denomina estadstica al conjunto de procedimientos y tcnicas


empleadas para recolectar, organizar y analizar datos, los cuales sirven de base para
tomar decisiones en las situaciones de incertidumbre que plantean las ciencias sociales o
naturales.

La estadstica se divide en dos ramas: la estadstica descriptiva y la inferencia


estadstica.

La estadstica descriptiva se refiere a la recoleccin, presentacin, descripcin, anlisis


e interpretacin de una coleccin de datos. Esencialmente consiste en resumir stos
mediante unos parmetros (medidas descriptivas) que caracterizan la totalidad de los
mismos. La estadstica Descriptiva es el mtodo de obtener de un conjunto de datos
conclusiones sobre s mismos y no sobrepasan el conocimiento proporcionado por stos.

Estadstica Inferencial se refiere al proceso de lograr generalizaciones acerca de las


propiedades del todo, poblacin, partiendo de lo especfico, muestra. La estadstica
inferencial es el conjunto de tcnicas que se utiliza para obtener conclusiones que
sobrepasan los lmites del conocimiento aportado por los datos, busca obtener
informacin de un colectivo mediante un metdico procedimiento del manejo de datos
de la muestra. Los mtodos estadsticos-matemticos surgieron desde la teora de la
probabilidad.

Antes de continuar es conveniente que conozcamos algunos trminos bsicos usados en


estadstica.

Definicin: Al conjunto de elementos, objetivo de la investigacin se le denomina


poblacin.

Individuo o Unidad estadstica: Cada uno de los elementos de la poblacin.

3
Curso Iberoamericano de formacin permanente de profesores de matemtica

Definicin: Se denomina muestra a un subconjunto de la poblacin.

La estadstica inferencial, es el proceso por el cual se deducen (infieren) propiedades o


caractersticas de una poblacin a partir de una muestra, extrada de la poblacin
mediante mtodos de extraccin de muestras. Estas tcnicas se utilizan cuando el
estudio de la poblacin completa puede ser de elevado coste o incluso imposible. Desde
el punto de vista de las tcnicas desarrolladas por la estadstica inferencial, la muestra
debe ser lo ms representativa posible.

Definicin: La observacin de un individuo se traduce en la descripcin de alguna


cualidad o propiedad inherente al mismo. A esta cualidad o propiedad se le denomina
caracterstica.

Una caracterstica puede adoptar diferentes modalidades.


Modalidad: Diferentes posibilidades o variantes de una caracterstica.

Ejemplo.

Poblacin: alumnos de un centro


Caractersticas: sexo, edad, curso, nmero de hermanos, deporte que practican,
notas
Modalidades:
Sexo: hombre, mujer.
Edad: 1, 2, 3
Curso: primero, segundo, tercero, cuarto
Nmero de hermanos: 0,1,2,3...
Deporte que practica: natacin, baloncesto, ftbol, gimnasia
Notas: aprobado, complementario o bien 1, 2, 3 Observacin:segn
calificaciones en Paraguay

2. Variables estadsticas

Definicin: La variable estadstica es el conjunto de valores, numricos o no,


observados sobre un conjunto de individuos, a partir de una determinada caracterstica.

Las variables pueden ser de dos tipos:

2.1. Tipos de variables

Variables cualitativas o atributos: no se pueden medir numricamente (por


ejemplo: nacionalidad, color de la piel, sexo).

Variables cuantitativas: tienen valor numrico (edad, precio de un producto,


ingresos anuales).
4
Centro de Altos Estudios Universitarios de la OEI

Las variables tambin se pueden clasificar en:

Variables unidimensionales: slo recogen informacin sobre una caracterstica


(por ejemplo: edad de los alumnos de una clase).

Variables bidimensionales: recogen informacin sobre dos caractersticas de la


poblacin (por ejemplo: edad y altura de los alumnos de una clase).

Variables pluridimensionales: recogen informacin sobre tres o ms


caractersticas (por ejemplo: edad, altura y peso de los alumnos de una clase).

Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:

Discretas: son aquellas que toman valores que se pueden contar y slo toman valores
aislados (1, 2, 8, -4, etc.). Por ejemplo: nmero de hermanos (puede ser 1, 2, 3....,etc,
pero, por ejemplo, nunca podr ser 3,45).

Continuas: son aquellos valores que se pueden medir y pueden tomar cualquier valor
real dentro de un intervalo. Por ejemplo, la velocidad de un vehculo puede ser 80,3
km/h, 94,57 km/h, etc.

2.2. Escalas de medicin

Cuando las variables son cuantitativas, sus diferentes modalidades son cantidades
numricas, como acabamos de ver. Pero tambin es posible asignar cantidades
numricas a las diferentes modalidades que presenta un carcter cualitativo, es decir,
codificar numricamente las diferentes modalidades de un atributo.

Ejemplo.

1) Sexo: Hombre=0, Mujer=1


2) Gafas: No gafas=0, S gafas=1

3) Nivel de estudios:
1= Analfabeto
2= Sin estudios, pero sabe leer y escribir
4= Fue a la escuela pero no complet la Educacin bsica
5= Educacin bsica
6= Educacin media
7= Educacin superior

As, una variable estadstica presentar una serie de valores numricos, cuyo significado
depender de la escala que se haya empleado.

Para las variables cualitativas podemos distinguir dos tipos de escala:

5
Curso Iberoamericano de formacin permanente de profesores de matemtica

Escala nominal: Dadas dos modalidades, slo podemos comprobar si son iguales o
distintas.

Ejemplo.

1) Sexo: Hombre=0, Mujer=1


2) Gafas: No gafas=0, Si gafas= 1

Escala ordinal: Adems de poder comprobar que dos modalidades dadas son iguales o
distintas tambin podremos establecer una relacin de orden:

Ejemplo.

3) Nivel de estudios:

1= Analfabeto
2= Sin estudios, pero sabe leer y escribir
4= Fue a la escuela pero no complet la Educacin bsica
5= Educacin bsica
6= Educacin media
7= Educacin superior

3. Tablas de frecuencias

Cuando sobre una poblacin hemos realizado una encuesta o cualquier registro para
conocer los valores que toman las variables, nos encontramos ante una gran cantidad de
datos que debemos organizar. La mejor forma de organizar esta informacin es
mediante tablas que llamaremos tablas de frecuencias.

Definicin: La tabla de frecuencias es una ordenacin, en forma de tabla, de los datos


estadsticos, asignado a cada dato su frecuencia correspondiente

3.1. Tipos de frecuencias

Frecuencia absoluta

Definicin: La frecuencia absoluta es el nmero de veces que aparece un determinado


valor en un estudio estadstico. Se representa por f i .

Supongamos una variable estadstica X , constituida por N valores, X 1 , X 2 , X 3 ..., X N


procedentes de la observacin de una determinada caracterstica sobre una poblacin o
muestra compuesta por N individuos. Y supondremos que toma k valores distintos que
6
Centro de Altos Estudios Universitarios de la OEI

denotamos por x1 , x 2 , x3 ..., x k (con mayscula todos los datos de la poblacin y con
minscula los que son distintos y forman las modalidades o valores de la variable).
La frecuencia absoluta f i es el nmero de veces que se repite el valor xi . Estas
frecuencias se disponen en forma de tabla, con la siguiente estructura.

Valores Frecuencia
absoluta
x1 f1
x2 f2

xk fk
TOTAL N=

La suma de las frecuencias absolutas es igual al nmero total de datos, que se


representa por N.

f 1 + f 2 + f 3 + ... + f k = N

Para indicar de manera resumida estas sumas se utiliza la letra griega (sigma
mayscula) que se lee suma o sumatoria.

f
i =1
i =N

Ejemplo. Para una variable discreta

A 100 alumnos de un colegio se les pregunta la edad, obteniendo los siguientes valores:
12 13 12 12 13 14 13 13 13 12 13 14 13 15 14 13 13 13 14 14
14 15 12 15 14 15 15 16 14 16 12 14 14 14 18 15 16 16 13 15
16 14 15 17 15 16 18 16 16 16 12 14 13 13 16 13 12 13 13 13
14 15 15 13 14 17 17 13 14 14 14 14 17 15 13 14 13 14 15 17
13 14 13 14 14 14 16 17 14 14 15 15 18 13 16 15 13 12 17 17
Vamos a indicar en la columna valores los valores distintos que toma la variable, y
en la columna Frecuencia absoluta el nmero de veces que se repite cada uno de
ellos.

Valores Frecuencia
absoluta
12 9
13 25
14 27
7
Curso Iberoamericano de formacin permanente de profesores de matemtica

15 16
16 12
17 8
18 3
TOTAL N=100

Frecuencia relativa

Definicin: La frecuencia relativa es el cociente entre la frecuencia absoluta de un


determinado valor y el nmero totas de datos. Se representa por fri , aunque algunos
autores la representan con h i o n i .

La expresin para calcular la frecuencia relativa es:

fi
fri =
N

La suma de las frecuencias relativas es igual a 1.

fr =1
i =1
i

La frecuencia relativa tambin se puede expresar en forma de porcentajes:

pi = 100 fri

Frecuencia acumulada

Definicin: La frecuencia acumulada es la suma de las frecuencias absolutas de todos


los valores inferiores o iguales al valor considerado. Se representa por Fi .

As, la frecuencia acumulada viene dada por la expresin:

k
Fk = f i
i =1

F1 = f 1 F2 = f1 + f 2 y sucesivamente hasta llegar a Fk = f 1 + f 2 ... + f k

Por tanto, la frecuencia acumulada del ltimo dato, ser siempre igual al nmero
total de datos, Fn = N

Si completamos la tabla anterior con todas estas frecuencias, la tabla quedara as:

8
Centro de Altos Estudios Universitarios de la OEI

Valores Frecuencia Frecuencia Porcentajes Frecuencias


absoluta relativa acumuladas
f1
x1 f1 fr1 = p1 = 100 fr1 F1 = f 1
N
f2
x2 f2 fr 2 = p 2 = 100 fr2 F2 = f1 + f 2
N

fk
xk fk fr k = p k = 100 frk Fk = f 1 + f 2 ... + f k
N
k k k
TOTAL N= f i fr i =1 p i = 1 00
i =1 i =1 i =1

Ejemplo. Para una variable discreta

Completamos la tabla de frecuencias del ejemplo anterior correspondiente al recuento


de las edades de los 100 alumnos de un centro con los valores de las frecuencias
relativas, porcentuales y acumuladas.
Vamos a hacer el recuento de los datos y presentarlos en una tabla de frecuencias:

Valores Frecuencia Frecuencia Porcentajes Frecuencias


absoluta relativa acumuladas
12 9 9 / 100 = 0,09 9% 9
13 25 25 / 100 = 0,25 25% 34
14 27 27 / 100 = 0,27 27% 61
15 16 16 / 100 = 0,16 16% 77
16 12 12 / 100 = 0,12 12% 89
17 8 8 / 100 = 0,08 8% 97
18 3 3 / 100 = 0,03 3% 100

TOTAL N=100 1 100

3.2. Agrupacin en intervalos.

Cuando tenemos una variable que presenta una gran cantidad de datos agrupamos los
valores en intervalos para realizar el recuento ms fcilmente, conviertiendo as la
variable en una variable continua. Los valores se agrupan usualmente en intervalos de la
forma (a, b].

Para establecer el nmero adecuado de intervalos hay varios mtodos entre los que
destacan: la frmula de Sturges y la raz del nmero de datos.

9
Curso Iberoamericano de formacin permanente de profesores de matemtica

Nmero de intervalos k = N , donde N es el nmero total de datos.


Frmula de Sturges: nmero de intervalos k = 1 + 3,3 log N , donde N es el
nmero total de datos.

Para poca cantidad de datos, aproximadamente menos de 50, la raz cuadrada es sencilla
de calcular haciendo uso de la calculadora, pero cuando este valor es grande el nmero
de intervalos tambin aumenta, observemos el grfico de las dos funciones pulsando en
el siguiente botn:
Pulsa
aqu para
ver ms

Cuando ya hemos determinado el nmero de intervalos los construimos. Generalmente


los intervalos sern de la forma (ai1, ai] y, para construir la tabla de frecuencias, a cada
uno de ellos se le asocia un valor representativo, denominado marca de clase, que se
denota xi , y que usualmente es el punto medio del intervalo, es decir:
a i 1 + a i
xi =
2

Ejemplo. Para una variable continua

A los 100 alumnos del colegio anterior tambin se les pregunta el peso, obteniendo las
siguientes respuesta en 96 casos (4 no respondieron):
34,5 35,2 36,1 37,0 37,9 38,5 38,5 39,1 39,6 40,0 40,4 40,4
40,5 40,8 40,9 41,1 45,0 45,2 46,0 47,3 47,7 47,8 48,0 48,2
48,3 48,3 48,7 49,0 49,1 49,1 49,2 50,3 50,5 50,5 50,6 50,9
52,3 52,8 52,9 53,0 53,3 53,5 54,0 54,2 54,9 55,1 55,3 55,3
55,4 55,6 55,8 55,8 55,8 56,0 56,2 56,4 57,4 58,1 58,0 58,9
58,9 59,0 59,3 59,3 60,1 60,4 60,5 60,5 60,7 62,5 62,7 63,0
63,1 63,2 63,8 64,6 65,0 65,0 65,0 65,5 65,6 65,7 65,8 68,2
68,4 69,6 70,1 70,3 72,5 72,5 73,0 79,0 80,4 80,7 85,8 108,4

Vamos a calcular el nmero de intervalos aplicando la frmula de Sturges:


k = 1 + 3,3 log 96 = 7,541 8 intervalos
mayor valor-menor valor=108 33 = 75
75/8=9,38 10 amplitud de los intervalos

Marca de Frecuencia Frecuencia Frecuencias


Valores Porcentajes
clase absoluta relativa acumuladas
(30, 40] 35 9 9 / 96 = 0,09 9% 9
(40, 50] 45 22 22 / 96 = 0,23 23% 31
(50, 60] 55 33 33 / 96 = 0,34 34% 64
(60, 70] 65 22 22 / 96 = 0,23 23% 86
(70, 80] 75 6 6 / 96 = 0,06 6% 92
(80, 90] 85 3 3 / 96 = 0,03 3% 95
(90, 100] 95 0 0 / 96 = 0 0% 95
10
Centro de Altos Estudios Universitarios de la OEI

(100, 110] 105 1 1 / 96 = 0,01 1% 96

TOTAL N=96 1 100

3.3. Diagrama de tallo y hojas

El diagrama de tallo y hojas es una interseccin entre una representacin grfica y una
tabla de frecuencias. Es una variacin de la tabla de frecuencias que ofrece informacin
visual de la distribucin de los datos conservando los datos originales y aadiendo una
informacin adicional.

Para construir un diagrama de tallo y hoja seguimos los siguientes pasos:

1. Examinar los datos para decidir cuantos dgitos van a formar el tallo. Todos
los dgitos, salvo el ltimo, forman el tronco de la observacin, el ltimo
dgito es la hoja. El lugar de truncamiento, que podemos hacer con o sin
redondeo, depender del tipo de datos.
2. Escribir la lista de posibles troncos ordenados de menor a mayor. El tallo se
coloca a la izquierda de una lnea vertical y los valores de las hojas a la
derecha.
3. En la primera fila informar sobre la unidad utilizada y como estn
representados los valores sobre el diagrama. Si hay valores extremos, se
representan en la fila siguiente, indicando si son superiores o inferiores.
4.
La observacin de un diagrama de tronco y hoja revela propiedades y caractersticas
tales como, Rango de valores de los datos, as como concentracin y simetra de los
mismos. Valores que se separan marcadamente del resto, y valores poco observados o
lagunas.

A veces, cuando los dgitos correspondientes a las hojas son unidades, se originan
diagramas con pocos troncos, pero si se toman dcimas, aparecen demasiados. En estos
casos, se puede dividir un tronco en dos partes.

Ejemplo.

Preguntamos la altura a los 100 alumnos del colegio anterior que vamos a representar
mediante un grfico de tallo y hojas:
135 140 145 146 146 147 147 149 149 149 150 150 150 150
150 151 152 152 153 155 155 155 156 156 156 157 157 157
158 159 159 159 160 160 160 160 160 160 160 160 160 161
161 162 162 162 162 163 163 163 163 163 163 164 164 164
164 164 164 165 165 165 165 165 165 165 165 166 168 168
169 170 170 170 170 170 170 172 172 173 174 174 175 175
176 176 176 177 178 179 180 182 185 190 192 192 195
Vamos a tomar 2 cifras significativas para formar el tallo, las centenas y las decenas, y
con las unidades formamos las hojas, as el diagrama de tallo y hojas quedara:

11
Curso Iberoamericano de formacin permanente de profesores de matemtica

Con este grfico podemos ver una cierta simetra y la presencia de valores extremos
que ms adelante se podr confirmar, o no, con los cuartiles.

4. Representacin grfica

Los grficos muestran visualmente y de forma rpida la distribucin de los datos y sus
principales caractersticas, constituyen un importante complemento en la presentacin
de la informacin.

Podemos emplear distintos grficos estadsticos segn el tipo de variable que


representan, por el tipo de informacin que ofrece, o por el nfasis que quiera poner el
informador en los datos. Los ms habituales son los siguientes: Diagrama de barras,
Histograma, Polgono de frecuencias, Diagrama lineal, Diagrama de sectores,
Pictograma y Cartograma. Se describen a continuacin cada uno de ellos:

4.1. Diagrama de columnas

Para representar datos de variables cualitativas y cuantitativas discretas, y en general


para distribuciones de frecuencias de datos sin agrupar, se utiliza el diagrama de
columnas. Este diagrama representa los valores de la variable en el eje de abscisas
levantando en cada punto una barra de longitud proporcional a la frecuencia de ese
valor. El ancho de los rectngulos de las columnas ha de ser el mismo y las divisiones
de la escala, equitativas.

Es indiferente si se construyen con los valores de las frecuencias absolutas o relativas,


pero si los usamos para comparar datos de diferentes conjuntos hay que utilizar las
frecuencias relativas pues el total de datos puede influir de manera indirecta en la
representacin.

Ejemplo. Variable cualitativa

Preguntamos a los mismos alumnos del colegio por el empleo que hacen del tiempo
libre con las siguientes opciones:

A: deporte B: mantenimiento C: msica D: cine E: lectura F: otros


obteniendo los siguientes datos que representamos debajo medinte un diagrama de
12
Centro de Altos Estudios Universitarios de la OEI

columnas:

ACE C AC CE AC DE AB DEF AF F BCE


CDF AF ACEF F ACD ABCF BDE ADF CF ACF AF
E ACE ABF ACF ACD BE A CD D AB ABCDEF
BC ADF ABCDEF F E ADE ABD DE AF AC E
CEF ACF D ACF BCF AF BF AF C EF DE
AC ACE DEF AB DF ACF AF CEF EF F F
ABF A CE ACF AF CE BEF D ACF ACDF CD
CDE AEF ACDE ABCDEF D AC CF BCE BDF AC AC
ACD A CF CF CEF ACF EF CD

Al ser una pregunta de respuesta mltiple la suma de las frecuencias no da como


resultado el nmero total de datos.

4.2. Diagrama de barras

El diagrama de barras es un grfico idntico al de columnas en el que los rectngulos se


colocan horizontalmente. Se emplea para el mismo tipo de variables y su construccin
es anloga. (En algunos textos llaman diagramas de barras tanto a las verticales como a
las horizontales).

Ejemplo. Variable cuantitativa discreta

Usamos los datos de la edad de los alumnos cuya tabla de frecuencias construimos
anteriormente y que reflejaba los siguientes datos:

Valores Frecuencia
absoluta
12 9
13 25
13
Curso Iberoamericano de formacin permanente de profesores de matemtica

14 27
15 16
16 12
17 8
18 3

TOTAL N=100

Su representacin mediante

un diagrama de barras es 

Edades de los alumnos entrevistados

18

17

16
edad

15

14

13

12

0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30
nm ero de alum nos

4.3. Diagrama de sectores

El diagrama de sectores consiste en dividir un crculo en tantas porciones como clases


existan, de modo que a cada clase le corresponde un sector circular proporcional a su
frecuencia absoluta o relativa. Se utiliza para cualquier tipo de variable, especialmente
cuando las frecuencias estn expresadas en porcentajes. Siempre va acompaado de una
leyenda.

Para calcular la amplitud de los sectores supongamos que a la modalidad xi le


corresponde una amplitud de i grados. Como podemos emplear frecuencias absolutas
o relativas, empleamos las relativas, entonces se tiene que: i = c fri , siendo c la
constante de proporcionalidad, por lo que:

360 = i = c fri = c fri = c 1 i = 360 fri


i i i
Y de esta forma se calculan las correspondientes amplitudes de cada modalidad, en
grados sexagesimales.
14
Centro de Altos Estudios Universitarios de la OEI

Ejemplo. Variable cualitativa

Se le pide a los alumnos cul es la actividad preferida de entre sus actividades de ocio,
obtenidendo los datos que vaciamos en la siguiente tabla de frecuencias:

Frecuencia Frecuencia
Valores Porcentaje
absoluta relativa
Deportes 51 0,5258 52,58%
Mantenimiento 8 0,0825 8,25%
Msica 17 0,1753 17,53%
Cine 10 0,1031 10,31%
Lectura 6 0,0691 6,19%
Otros 5 0,0515 5,15%
TOTAL N=97 100 %
1
Caculamos la amplitud de los sectores para cada uno de los valores de la variable con
sus frecuencias dadas en forma porcentual:
i = 360 fri

Frecuencia Frecuencia
Valores ngulo correspondiente
absoluta relativa
Deportes 51 0,5258 deportes = 3600,5258 = 189,3
Mantenimiento 8 0,0825 matenimiento = 3600,0825 = 29,7
Msica 17 0,1753 msica = 3600,1753 = 63,1
Cine 10 0,1031 cine = 3600,1031 = 37,1
Lectura 6 0,0691 lectura = 3600,0691 = 24,9
Otros 5 0,0515 otros = 3600,0515 = 18,5

Dividiendo la superficie circular en los sectores con la amplitud calculada obtenemos el


siguiente grfico circular.

15
Curso Iberoamericano de formacin permanente de profesores de matemtica

4.4. Histograma

Es un grfico similar a los diagramas de barras y se utilizan para representar


distribuciones de variables cuantitativas continuas, es decir, agrupadas en intervalos.
Consiste en dibujar rectngulos adosados, cuyas bases coinciden con la amplitud de los
intervalos y sobre cada uno de estos intervalos se levanta un rectngulo de rea igual o
proporcional, a la frecuencia del mismo, que en principio puede ser absoluta o relativa.
Para determinar la altura hi del rectngulo correspondiente al intervalo (ai 1 , a i ] de
amplitud ci , para que su rea coincida con las frecuencias absolutas ser tal que:
f i = ci hi despejando obtenemos la expresin para el cclulo de las alturas
fi
hi = , i = 1,....k
ci
Observemos que en un histograma, cuanto mayor es la amplitud del intervalo menor
ser la altura del rectngulo, pues el elemento del grfico representativo es la superficie.
De esta manera podemos obtener grficos pocos estticos, si fuera as, podemos usar
alturas proporcionales que produzcan grficos ms armoniosos.

En el caso particular de que todos los intervalos tuvieran la misma amplitud, las alturas
pueden tomar el valor de las frecuencias.

Ejemplo.

Con los datos del peso y la altura de los alumnos hemos calculado el IMC (ndice de
Masa Corporal) que estn reflejados en la siguiente tabla de frecuencias:
Frecuencia
Valores
absoluta
[14.5, 16) 4
[16, 18.5) 22
[18.5, 25) 61
[25, 30) 5
16
Centro de Altos Estudios Universitarios de la OEI

[30, 30.5) 1
N=93

Si los intervalos tuvieran igual amplitud podras dibujar los rectngulos del histograma
con la altura igual a la frecuencia absoluta, pero al no ser igual tenemos que calcular la
altura de cada rectngulo para que tengan la superficie proporcional a la frecuencia.

Frecuencia
Valores Amplitud Altura
absoluta
4
[14.5, 16) 1.5 4 h1 = = 2.67
1 .5
22
[16, 18.5) 2.5 22 h2 = = 8 .8
2 .5
61
[18.5, 25) 6.5 61 h3 = = 9 .4
6 .5
5
[25, 30) 5 5 h4 = = 1
5
[30, 1
0.5 1 h2 = =2
30.5) 0 .5

N=93

Construyendo los rectngulos de base la amplitud de los intervalos y altura las


calculadas obtenemos el siguiente histograma en el que el rea de los rectngulos que
lo forman es igual a las frecuencias absolutas de cada uno:

17
Curso Iberoamericano de formacin permanente de profesores de matemtica

4.5. Polgonos de frecuencias

Este diagrama consiste en una serie de segmentos de recta que unen los puntos cuyas
abscisas son los valores de la variable, o las marcas de clase, en el caso de variables
continuas, y cuyas ordenadas son proporcionales a sus frecuencias respectivas. Este
grfico se puede construir tanto para variables no agrupadas como agrupadas en
intervalos, y tanto con frecuencias absolutas como relativas.

Muchas veces este tipo de grfico se superpone a un diagrama de barras o a un


histograma.

Variables no agrupadas

Un polgono de frecuencias se forma uniendo los extremos de las barras de un diagrama


de barras mediante segmentos. Tambin se puede realizar trazando los puntos que
representan las frecuencias y unindolos mediante segmentos.

Variables agrupadas

En el caso de variables agrupadas en intervalos para construir el polgono de frecuencia


se toma la marca de clase que coincide con el punto medio de cada rectngulo de un
histograma.

Ejemplo. Variable discreta

Vamos a construir el polgono de frecuencias de la variable edad de los alumnos sobre


el diagrama de barras construido en un ejercicio anterior.
Frecuencia
Valores
absoluta
12 9
13 25
14 27
15 16
16 12
17 8
18 3
TOTAL N=100

Edades de los alumnos


entrevistados

30
25
20
15
10
5
0
12 13 14 15 16 17 18

18
Centro de Altos Estudios Universitarios de la OEI

Ejemplo. Variable continua

Vamos a construir el polgono de frecuencias de la variable altura de los alumnos sobre


el histograma. Al ser los intervalos de igual amplitud podemos establecer la altura de
los rectngulos como el valor de la frecuencia, en este caso trabajaremos con la
frecuencia relativa expresada en porcentajes.

Frecuencia Frecuencia
Valores Porcentajes
absoluta relativa
(134, 143] 2 0,0206 2,06%
(143, 152] 16 0,1649 16,49%
(152, 161] 25 0,2577 25,77%
(161, 170] 34 0,3505 35,05%
(170, 179] 13 0,1340 13,40%
(179, 188] 3 0,0309 3,09%
(188, 197] 4 0,0412 4,12%

TOTAL N=97 N=1 N=100

Altura de los estudiantes de 12 a 18 aos

40%
35%
30%
25%
20%
15%
10%
5%
0%
(134, 143] (143, 152] (152, 161] (161, 170] (170, 179] (179, 188] (188, 197]

Para construir el polgono de frecuencias sobre el histograma seguimos los


siguientes pasa:
- hallamos la marca de clase de cada intervalo
- marcamos sobre el grfico los puntos de interseccin de cada punto
medio de clase con su frecuencia respectiva
- finalmente unimos con segmentos los puntos de interseccin.

19
Curso Iberoamericano de formacin permanente de profesores de matemtica

4.6. Otros grficos

PICTOGRAMA

Son grficos que utilizan dibujos que hacen referencia a la variable que se est
estudiando. El tamao o cantidad de cada dibujo es proporcional al valor de la
frecuencia de cada modalidad.

Ejemplo.

La siguiente tabla muestra el nmero de horas semanales que pasan los alumnos del
centro anterior viendo la televisin
Frecuencia
Valores
absoluta
[0,4) 4
[4,8) 28
[8,12) 21
[12,16) 15
[16,20) 9
[20,24) 5
TOTAL N=82

Con estos datos construimos un histograma sustituyendo los rectngulos por el dibujo
de una televisin y conviertiendo as el grfico en un pictograma

20
Centro de Altos Estudios Universitarios de la OEI

Nmero de horas de televisin semanales

30

25

Nmero de alumnos
20

15

10

0
[0,4) [4,8) [8,12) [12,16) [16,20) [20,24)
Horas de televisin

CARTOGRAMA

Es un grfico que se utiliza cuando nos interesa conocer la distribucin geogrfica de


una variable, por ello se construye sobre un mapa en el que las zonas aparecen
coloreadas segn los valores de la variable que se est estudiando. Va acompaado de
una leyenda en la que, por colores, se indica la interpretacin.

Ejemplo.

La siguiente tabla muestra la distribucin de habitantes de Gran Canaria por


municipios. Le acompaa un cartograma que refleja los datos. Siempre debes consultar
la leyenda que acompaa al grfico para su correcta interpretacin.

21
Curso Iberoamericano de formacin permanente de profesores de matemtica

Extrado de Canarias en Cifras 2008. Instituto Canario de Estadstica

5. Medidas estadsticas

Las medidas estadsticas o parmetros estadsticos son valores representativos de una


coleccin de datos y que resumen en unos pocos valores la informacin del total de
datos. Estas medidas estadsticas nos darn informacin sobre la situacin, dispersin y
otros patrones de comportamiento de los datos, de manera que sea posible captar
rpidamente la estructura de los mismos y tambin la comparacin entre distintos
conjuntos de datos. Las ms importantes son: las de tendencia central o centralizacin,
que indican el valor medio de los datos, las de dispersin que miden la variabilidad de
los datos respecto a los parmetros de centralizacin y las de forma: simetra y
apuntamiento, que nos indican la forma de distribucin de los datos.

Estas medidas sern ms significativas cuanto ms homogneos sean los datos y pueden
ser engaosas cuando mezclamos poblaciones distintas.

5.1. Medidas de centralizacin

Nos dan los valores centrales de los datos obtenidos. Las ms usuales son: la media, la
moda y la mediana.

Media ( x )

Es el resultado de sumar el valor de la variable de todos los individuos y dividir por el


total de individuos.
n

X
i =1
i
x=
N

22
Centro de Altos Estudios Universitarios de la OEI

Supondremos que toma la variable X toma k valores distintos x1 , x 2 , x3 ..., x k que se


repiten el nmero de veces que indica la frecuencia relativa f i
, sustituyendo en la
frmula, la expresin de la media quedara como:

xi f i xi f i
x= =
f i N

Para datos agrupados el valor de xi ser el de la marca de clase.

Ejemplo. Variable discreta

Vamos a calcular la media de edad de los alumnos entrevistados. Aadimos a la tabla


de frecuencias absolutas la columna con el producto de cada valor de la varaible por su
x f
frecuencia i i
Frecuencia
Valores xi f i
xi f i 1433 absoluta
x= = = 14,33 12 9 108
f i 100
13 25 325
La media de edad de los alumnos del centro
14 27 378
entrevistados es de 14,33 aos. 15 16 240
16 12 192
17 8 136
18 3 54

TOTAL N=100 1433

Caractersticas de la media:

- La media aritmtica slo se puede calcular para variables numricas.


- Un conjunto de datos numricos slo tiene una media.
- La media es un parmetro sensible a la presencia de valores muy separados
del resto de datos.

Por ejemplo, la serie de valores, 1, 1, 2, 3, 3, 5, 7, 8, 8, 50 posee un valor


extremo que es el 50. La media aritmtica calculada con los 9 primeros
valores es 4.2, lo que constituye un valor central razonable. Por el contrario,
si se considera tambin el ltimo valor, la media aritmtica resulta ser 8.8,
que es un valor muy poco indicativodel conjunto pues est muy influido por
ese valor extremo.
Moda (Mo)
La moda es el valor ms frecuente de la variable estadstica. La moda, como la media,
representa un valor central de la distribucin de datos y su determinacin visual la
podemos obtener a partir de la tabla de frecuencias o de su grfico, en el caso de ser de
columnas corresponde con la columna ms alta.

23
Curso Iberoamericano de formacin permanente de profesores de matemtica

Este parmetro se puede calcular para cualquier tipo de variable.

Ejemplo. Variable cualitativa

Podemos identificar la moda de la actividades del tiempo libre preferida de los alumnos
observando la tabla de frecuencias:
Frecuencia
Valores
absoluta
Deportes 51
Mantenimiento 8
Msica 17
Cine 10
Lectura 6
Otros 5
TOTAL N=97

El conjunto de datos puede ser unimodal (1 moda), bimodal (2 modas) o amodal (sin
moda), grficamente sera:

1 2 3 4 5 6 7 1 2 3 4 5 6 7

Bimodal Unimodal

26
23
20
17
14
11
8
5

1 2 3 4 5 6 7

Amodal

Para datos agrupados

Para datos agrupados no se puede calcular exactamente el valor de la moda. Sin


embargo, se puede estimar utilizando los siguientes pasos:

Para obtener la moda en datos agrupados, se buscar la clase o intervalo que tenga el
f
mayor cociente entre frecuencia y amplitud, es decir, valor mximo de hi = i .
ci
24
Centro de Altos Estudios Universitarios de la OEI

Tal y como vimos en la construccin de los histogramas, esta clase estar asociada al
rectngulo de mayor altura. Si todos los intervalos tienen la misma amplitud, dicho
intervalo ser el de mayor frecuencia.

Esta clase o intervalo se denomina intervalo modal, y una vez hallado, se aplica la
siguiente expresin derivada del clculo de proporciones para calcular la moda:

D1
Mo = Li 1 + ( ) ci
D1 + D2

Donde:

Li 1 = Lmite inferior de la clase modal.

D1 = hi hi 1

Pulsa
D2 = hi hi +1 aqu para
ver ms
fi
hi =
ci

ci = amplitud del intervalo.

f i = frecuencia absoluta de la clase modal.


f i 1 y f i +1 = frecuencia absoluta de la clase inferior y superior respectivamente.

En el caso de trabajar con intervalos de igual amplitud se puede trabajar directamente


con las frecuencias absolutas.

Ejemplo. Para datos agrupados

Vamos a calcular la moda del nmero de horas semanales que pasan los alumnos del
centro anterior viendo la televisin
Frecuencia Frecuencia
Valores
absoluta acumulada
[0,4) 4 4
[4,8) 28 32
[8,12) 21 53
[12,16) 15 68
[16,20) 9 77
[20,24) 5 82

TOTAL N=82

La clase modal es [4,8), la de mayor frecuencia absoluta. Al tratarse de intervalos de

25
Curso Iberoamericano de formacin permanente de profesores de matemtica

igual amplitud podemos sustituir en la frmula las frecuencias absolutas:

Li 1 = 4

D1 = f i f i 1 =28-4=24

D2 = f i f i +1 =28-21=7

ci = amplitud del intervalo=4

24
Mo = 4 + 4 = 7 .1
24 + 7

Caractersticas de la moda:
- La moda es de fcil interpretacin.
- Su clculo es sencillo para variables discretas y cualitativas pero la expresin
para variables agrupadas se complica.
- No intervienen en su determinacin todas las observaciones.
- Es til para detectar posibles mezclas de distintas poblaciones en una misma
masa de datos.
- Se puede calcular para todo tipo de variable.

Mediana (Me)
La mediana es el valor de la variable que divide la serie estadstica ordenada en dos
partes iguales, dejando tantos valores por encima como por debajo y por consiguiente la
frecuencia a uno y a otro lado de la mediana tambin son iguales.
Si los n datos no estn agrupados y estn enumerados del 1 al N el valor de la mediana
ser:
N +1
- Si N es impar, el valor que ocupa el lugar
2
N
- Si N es par, la media aritmtica de los valores que ocupan el lugar y
2
N
+1.
2
Este procedimiento es til cuando disponemos de pocos datos, pero cuando el nmero
de estos es elevado es mejor incluir en la tabla de frecuencias las frecuencias
acumuladas.

Datos no agrupados: La mediana ser el primer valor cuya frecuencia acumulada es


N
Fi .
2
Datos agrupados: Se buscar la primera clase cuya frecuencia acumulada supere la
mitad de las observaciones. Esta clase se denomina clase mediana y su marca de clase,
se podra dar como una aproximacin de la mediana. Sin embargo podemos obtener un
valor ms aproximado empleando la frmula siguiente:
26
Centro de Altos Estudios Universitarios de la OEI

N
Fi 1
Me = Li 1 + 2 ci
fi
Donde:

Li 1 = Lmite inferior de la clase mediana.

ci = amplitud del intervalo.

f i = frecuencia absoluta de la clase mediana.


Fi 1 = frecuencia absoluta acumulada de la clase inferior a la clase mediana.

Ejemplo. Variable continua

Vamos a calcular la mediana del nmero de horas semanales que pasan los alumnos del
centro anterior viendo la televisin
Frecuencia Frecuencia
Valores
absoluta acumulada
[0,4) 4 4
[4,8) 28 32
[8,12) 21 53
[12,16) 15 68
[16,20) 9 77
[20,24) 5 82

TOTAL N=82
82
= 41 . La primera frecuencia acumulada
2
que supera N/2 es 53, por tanto la clase mediana es el intervalo [8,12). Para calcular el valor
de la mediana aplicamos la frmula definida:
41 32
Me = 8 + 4 = 9.71
21

Caractersticas de la mediana:

- La mediana es sencilla de calcular y de interpretar.


- Por depender de los valores a travs de su orden, la mediana no vara
demasiado por los valores extremos, por ello, si nuestros datos contienen
valores de este tipo, ser preferible usar la mediana en vez de la media
aritmtica como medida central.

Relacin entre media, mediana y moda.


Es recomendable comparar los valores obtenidos para la moda, media y mediana, para
conocer mejor la distribucin de los datos que estamos analizando. Diferencias
importantes entre la media y la moda o la media y la mediana indican que la

27
Curso Iberoamericano de formacin permanente de profesores de matemtica

distribucin de los datos es asimtrica, y si son iguales o muy cercanos la distribucin


de los datos ser simtrica. Observa los siguientes grficos:

5.2. Otras medidas. Medidas de posicin

Para describir otros aspectos relevantes de la distribucin de frecuencia se utilizan las


medidas de posicin: los cuartiles y los percentiles. Son valores que dividen la
distribucin en partes iguales:

Cuartiles: Hay 3 cuartiles que dividen a una distribucin en 4 partes iguales:


primero, segundo y tecer cuartil.
Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales:
(primero al noventa y nueve percentil).

Cuartiles
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales. Q1 , Q 2 y Q3 determinan los valores correspondientes
al 25%, 50% y 75% de los datos. Q 2 coincide con la mediana.

Si tenemos n datos, para hallar el primer cuartil, se ordenan los valores de menor a
mayor y a continuacin se busca en dicha serie ordenada el primer valor cuyo orden de
lugar supere n/4.

Puede ocurrir que el valor coincida exactamente con n/4 (sucede cuando n es mltiplo
de 4), en tal caso, el primer cuartil se obtiene tomando dicha observacin y la siguiente,
y calculando su media aritmtica, tal y como hacamos para la mediana. Veamos el
siguiente ejemplo.

28
Centro de Altos Estudios Universitarios de la OEI

Ejemplo. Variable discreta

Vamos a calcular el primer y tercer cuartil de la distribucin de las edades de los alumnos del
centro
Valores Frecuencia Frecuencias
absoluta acumuladas
12 9 9
13 25 34
14 27 61
15 16 77
16 12 89
17 8 97
18 3 100

TOTAL N=100

Q1  N/4=25 buscamos aqul valor que su frecuencia acumulada sea mayor que 25, en este
caso Q1 =13, es decir el 25% de los datos estn por debajo de esa cantidad.
Q3  3N/4=75 buscamos aqul valor que su frecuencia acumulada sea mayor que 75, en este
caso Q3 =15, es decir el 75% de los datos estn por debajo de esa cantidad.

Para datos agrupados

En este caso los cuartiles se buscar la primera clase cuya frecuencia acumulada supere
N/4, 2N/4 o 3N/4 de las observaciones, segn estemos hallando el primer, segundo o
tercer cuartil. La marca de clase de dicho intervalo, se podra dar como una
aproximacin de la mediana. Sin embargo podemos obtener un valor ms aproximado
empleando la frmula siguiente, similar a la empleada para hallar la mediana:
N
K Fi 1
Qk = Li 1 + 4 ci
fi
Donde:
K= nmero del cuartil que queremos hallar
Li 1 = Lmite inferior de la clase del cuartil que queremos hallar.
ci = amplitud del intervalo.

f i = frecuencia absoluta de la clase del cuartil.

Fi 1 = frecuencia absoluta acumulada de la clase inferior a la clase del cuartil.

Percentiles
Los percentiles son los valores de la variable que dividen a un conjunto de datos
ordenados en cien partes iguales. P1 , P2 ...P100 determinan los valores correspondientes
al 1%, 2%...100% de los datos. P50 coincide con la mediana.
29
Curso Iberoamericano de formacin permanente de profesores de matemtica

Su clculo es similar al de los cuartiles, veamos el siguiente ejemplo para datos


agrupados

Ejemplo. Variable continua

P
Vamos a calcular el percentil 25 ( 25 ) del nmero de horas semanales que pasan los alumnos
del centro anterior viendo la televisin. Usamos la frecuencia acumulada en porcentajes para
hallar los percentiles.
Frecuencia Frecuencia Porcentajes
Valores
absoluta acumulada acumulados
[0,4) 4 4 4,87%
[4,8) 28 32 39,02%
[8,12) 21 53 64,63%
[12,16) 15 68 82,93%
[16,20) 9 77 93,90%
[20,24) 5 82 100%

TOTAL N=82

82
25 = 20,50 . La primera frecuencia porcentual que supera 25N/100 es 39,02%, por tanto
100
la clase del percentil 25 es el intervalo [4,8). Para calcular el valor aplicamos la frmula:
N
K Fi 1
Pk = Li 1 + 100 ci
fi
20,50 4
P25 = 4 + 4 = 6,36
28
Podemos decir que el 75% de los alumnos ve la televisin ms de 6 horas semanales

5.3. Medidas de dispersin

Mediante la media, la mediana y la moda conocemos una parte de la informacin acerca


de las caractersticas de los datos, pero para completar esa informacin necesitaramos
saber si todos los estn prximos o no a estas medidas. Para medir esta desviacin
respecto a los valores centrales utilizamos los parmetros de dispersin.

Rango (R).
Es la diferencia entre el mayor y el menor de los valores que toma la variable.
Caractersticas del rango:
- El rango es sencillo de calcular y de interpretar.
- No es una medida muy significativa.

Varianza (V) y desviacin tpica.

30
Centro de Altos Estudios Universitarios de la OEI

La varianza es una medida de dispersin que se basa en la desviacin de las


observaciones con respecto a la media aritmtica, y se denota por V o 2 .

Para su clculo seguimos los siguientes pasos:


1) hallamos la distancia de cada valor observado con respecto a la
media, xi x
( )2
2) la elevamos al cuadrado xi x , con el fin de convertirlas en positivas;
( )2
3) multiplicamos por su frecuencia absoluta xi x f i para tener en cuenta las veces
que se repite cada dato,
4) sumamos todos los valores obtenidos hasta ahora para conseguir una
medida global
5) dividimos el resultado anterior por N (nmero de datos), para conocer
el valor medio,

Con estos pasos llegamos a la expresin:

V = =
(
xi x f i
2 )2

N
si desarrollamos el cuadrado de esta expresin, obtenemos:
2
2 xi f i 2
V = = x
N
que es una expresin ms sencilla de manejar.

Si hallamos la raz cuadrada de la expresin de la varianza compensamos el cuadrado


tomado inicialmente. A este valor se le denomina desviacin tpica y es la medida de
desviacin ms usual.
2
xi f i 2
= x
N

Ejemplo. Variable discreta

31
Curso Iberoamericano de formacin permanente de profesores de matemtica

Habamos obtenido que la media de edad de los alumnos del colegio entrevistados era de
14,33. Vamos a calcular la desviacin tpica para saber si las edades estn dispersas o
concetradas respecto a la media.
Lo primero que vamos a hacer es completar la tabla: x = 14,33
Frecuencia
Valores xi2 xi2 f i
absoluta
12 9 144 1296
13 25 169 4225
14 27 196 5292
15 16 225 3600
16 12 256 3072
17 8 289 2312
18 3 324 972
TOTAL N=100 1433 20769

20769
Sutituyendo los valores obtenemos = 14,33 2 = 1,53
100

Y vemos que las edades difieren de la media en un ao y medio por encima y por debajo.
Teniendo en cuenta que el rango de edades es de 6 aos, los datos presentan poca dispersin,
aunque la conclusin de mucha o poca depende del contexto del problema y de la
comparacin con otras poblaciones o muestras.

Caractersticas de la desviacin tpica:

- La desviacin tpica tiene ms significado si usa para comparar dos o ms


poblaciones.
- Es ms sensible que la media a valores errneos al usar el cuadrado en su
expresin.
- No es sensible al cambio de escala a diferencia de la varianza, es decir, si
medimos en metros o en kilmetros obtendremos valores similares.

6. Nmeros ndice

El nmero ndice es una medida que muestra los cambios de una variable en funcin del
tiempo, como por ejemplo el IPC (ndice de precios de consumo), que mide la
evolucin de los precios a lo largo de los meses o aos. Es una medida relativa a un
valor llamado base, y suele venir expresada en porcentajes.

A los efectos de la elaboracin de un determinado ndice se debe tomar como referencia


un determinado perodo, el cual se le denomina perodo base, con el que vamos a
hacer la comparacin.

32
Centro de Altos Estudios Universitarios de la OEI

Un ndice se calcula dividiendo el precio, la cantidad, o el valor de un momento


determinado de un bien sobre el precio, la cantidad o el valor en el momento base de ese
bien multiplicado por 100.

Ejemplo. nmeros ndices

Tomemos como ejemplo para la construccin de ndices la siguiente tabla que muestra las
exportaciones de bienes y servicios de Paraguay
Perodo Cantidad
($ miles
de
millones)
1988 34,4
1998 50,2
2007 50,9
2008 53,1

Fuente: Development Economics LDB database

Establecemos el primer ao (1988) como base de referencia y su valor se llama valor base (en
el ejemplo 34,4), este valor pasa a ser 100 (100%) y obtenemos el resto de valores mediante la
siguiente proporcin:

valor base valor a calcular


=
100 ndice

Aplicando este clculo obtenemos para 1998 un ndice de

valor a calcular 50,2


indice = 100 = 100 = 145,93
valor base 34,4

y su variacin sera 145,93-100=45,93

Continuando con el resto de aos obtenemos la siquiente tabla:

Perodo Cantidad ndice Variacin


1988 34,4 100
1998 50,2 145,93 45,93
2007 50,9 147,97 47,97
2008 53,1 154,36 54,36

Estos ndices suelen representarse grficamente para apreciar su evolucin


33
Curso Iberoamericano de formacin permanente de profesores de matemtica

34
Centro de Altos Estudios Universitarios de la OEI

Bibliografa

Daniel Pea (1991). Estadstica Modelos y mtodos 1. Fundamentos. Ed. Alianza


Universidad Textos.

David Ruiz Muoz. Manual de Estadstica. Universidad Pablo de Olavide.


Martin Guzmn Conejo, M. P. (2006): Manual de estadistica descriptiva. Madrid,
Civitas

Fernndez, S.; Cordero, J. M.; Crdoba, A. (1996) Estadstica Descriptiva. ESIC


Editorial,

Fernando Garca y Fernando Garzo; Estadstica; Editorial McGraw-Hill; Madrid

35

Potrebbero piacerti anche