Sei sulla pagina 1di 10

Medidas de Tendencia Central

ESTADSTICA DESCRIPTIVA
Estadstica Deductiva o Descriptiva es aquella que describe y analiza un grupo de
datos, caracterizndolo pero sin sacar conclusiones a partir de ello respecto de un grupo
de datos mayor (Spiegel, 1991). Las modernas tcnicas de caracterizacin de datos que
cumplen con los propsitos de la Estadstica Descriptiva se agrupan bajo el trmino
Anlisis Exploratorio de Datos, que puede considerarse sinnimo del trmino anterior.
MEDIDAS DE POSICIN
El propsito de las medidas de posicin es resumir y describir conjuntos de datos a
travs de nmeros nicos que, por cuya posicin en el valor de la variable, tengan la
capacidad de representar al conjunto de valores observados. Las medidas de posicin
reciben la denominacin de Medidas de Tendencia Central cuando los nmeros calculados
asumen valores que tienden a ubicarse hacia el centro del conjunto de datos ordenados
por magnitud, tales como la moda, la mediana y la media o promedio.
Cuando las medidas de posicin se calculan a partir de los datos de la totalidad de la
poblacin se les denomina parmetros; cuando se calculan a partir de datos
correspondientes slo a una muestra de la poblacin, se les llama estadsticos o
estadgrafos.
Moda
La moda (Mo) es el valor que ocurre con mayor frecuencia absoluta dentro de un
conjunto de datos, es decir, es el valor que se repite ms veces; es una medida de
tendencia central que tiene la ventaja de no ser influenciada por la presencia de valores
extremos (muy altos o muy bajos) en el conjunto de datos. Puede suceder en ciertos
casos que la moda no exista como ocurre en el caso de datos que corresponden a
variables medidas en escala de razn con gran cantidad de cifras decimales, o bien, que
exista ms de una moda como en el caso de variables discretas que asumen pocos
valores. Aunque no es necesario ordenar los datos de acuerdo a su magnitud, contar con
datos ordenados de menor a mayor valor facilita el clculo de la moda en datos no
agrupados. Ejemplos de clculo de la moda para datos no agrupados:

El conjunto de datos: 2,2,5,7,9,9,9,9,10,10,11,12,18, tiene Mo = 9 (unimodal).


El conjunto de datos: 4,3,7,4,2,9,5,7,4,7,5, tiene Mo = 4 y 7 (bimodal).
El conjunto de datos: 7,2,10,9,4,2,5,6,1,7,3,4,10, tiene Mo = 2, 4, 7 y 10 (multimodal).
El conjunto: 3,5,8,10,12,15 y 16, no tiene moda.

De acuerdo a la cantidad de modas presentes en un conjunto de datos, es posible


distinguir distribuciones unimodales, bimodales o multimodales, segn la presencia de
una, dos o ms modas respectivamente. La siguiente figura muestra la apariencia de
distribuciones de frecuencia con distintas cantidades de moda.

Medidas de Tendencia Central

F
r
e
c
u
e
n
c
i
a

F
r
e
c
u
e
n
c
i
a

F
r
e
c
u
e
n
c
i
a

Valor de la Variable

Valor de la Variable

Valor de la Variable

Frecuencia Unimodal

Frecuencia Bimodal

Frecuencia Multimodal

Es necesario hacer notar que en los casos en que una distribucin posea ms de una
moda, aquellos valores que constituyen moda deben tener exactamente la misma
frecuencia o deben repetirse la misma cantidad de veces entre los datos.
Cuando los datos estn agrupados en una tabla de frecuencia, el valor de la moda se
calcula de acuerdo a la siguiente expresin (Spiegel, 1991):

1
c
1 2

Moda L i

En donde Li es el lmite inferior del intervalo modal, 1 es la diferencia de frecuencia


entre el intervalo modal y el intervalo de valor inferior inmediato, 2 es la diferencia de
frecuencia entre el intervalo modal y el intervalo de valor superior inmediato y c es la
amplitud del intervalo modal.
Ejemplo: Una Empresa ha tomado una muestra del pick de ruido (Db) al que se
encuentran sometidos 45 de sus empleados y ha agrupado los datos en la tabla de
frecuencia siguiente, calcule a partir de ella la moda para datos agrupados:
Intervalo de
Peso (kg)
[49,8 - 52,8)
[52,8
55,8)
[55,8 - 58,8)
[58,8 - 61,8)
[61,8 - 64,8)
[64,8 - 67,8)
[67,8 - 70,8]

Frecuencia
Marca de Absoluta
Absoluta
Relativa
Relativa
Clase (kg)
(n)
Acumulada (n)
(%)
Acumulada (%)
51,3
7
7
15,6
15,6
54,3
9
16
20,0
35,6
57,3
10
26
22,2
57,8
60,3
6
32
13,3
71,1
63,3
8
40
17,8
88,9
66,3
1
41
2,2
91,1
69,3
100
4
45
8,9
45
100

Medidas de Tendencia Central

El intervalo de clase modal es [55,8 58,8) debido a que es el intervalo de mayor


frecuencia absoluta (10). El lmite inferior del intervalo modal es L i = 55,8. La diferencia de
frecuencia entre el intervalo modal y el intervalo de valor inferior inmediato es 1 = 10-9 =
1. La diferencia de frecuencia entre el intervalo modal y el intervalo de valor superior
inmediato es 2 = 10-6 = 4. La amplitud del intervalo modal es c = 3 Db. Empleando la
ecuacin de clculo de la moda para datos agrupados:

1
10 - 9

1
c 55,8
Moda L i
3 55,8
3 56,4 Db
10 9 10 6
1 4
1 2

Mediana
La mediana (Md), dentro de un grupo de datos ordenados, corresponde a una medida
de tendencia central que es igual al valor central cuando la cantidad de datos es impar, o
al promedio de los valores centrales cuando la cantidad de datos es par; es decir, la
mediana es un valor que separa al conjunto de datos en dos mitades iguales, quedando el
50% de los datos por debajo de la mediana y el 50% de los datos por sobre ella. Al igual
que la moda, el valor de la mediana no es afectado por la magnitud de los valores
extremos presentes en los datos. Ejemplos de clculo de la mediana para datos no
agrupados:
El conjunto de datos 2,3,4,4,4,5,5,7,7,7,9, tiene Md = 5 (el primero de los dos 5).
El conjunto de datos 2,2,5,7,9,9,9,10,10,11,12,18, tiene Md = (9+9) / 2 = 9.
El conjunto de datos 2,4,6,5,7,9,9,10,11,12, tiene Md = (7+9) / 2 = 8.
Cuando los datos estn agrupados en una tabla de frecuencia, el valor de la mediana
se calcula de acuerdo a la siguiente expresin (Spiegel, 1991):
o Si para el intervalo mediano ocurre que Ni-1 < N/2 < Ni, entonces:

En donde Li es el lmite inferior del intervalo


N

mediano, N es el nmero de datos del conjunto


- f

c
o frecuencia total, (f) es la suma de las Mediana L i 2
f Mediana

frecuencias de los intervalos de clase de valor

inferior al del intervalo de la mediana, f Mediana es


la frecuencia absoluta del intervalo en que se ubica la mediana y c es la
amplitud del intervalo de la mediana.

o Si para el intervalo mediano ocurre que N i = N/2, entonces: Me = L i , donde Li es el


lmite superior del intervalo mediano

Medidas de Tendencia Central

Ejemplo: La siguiente tabla de frecuencia rene informacin sobre el alcance frontal


(cm) en posicin sentado de una muestra de 67 empleados de oficina chilenos. Calcule
a partir de ella la mediana para los datos agrupados:

Frecuencia
Intervalo de
Marca de Absoluta
Absoluta
Relativa
Relativa
Alcance (cm) Clase (cm)
(n)
Acumulada (n)
(%)
Acumulada (%)
[76,5 - 78,5)
77,5
12
12
17,9
17,9
[78,5 - 80,5)
79,5
10
22
14,9
32,8
[80,5 - 82,5)
81,5
1
23
1,5
34,3
[82,5 - 84,5)
83,5
16
39
23,9
58,2
[84,5 - 86,5)
85,5
14
53
20,9
79,1
[86,5 - 88,5]
87,5
14
67
20,9
100
67
100

El intervalo de clase de la mediana es [82,5 84,5) debido a que es el intervalo en que


se encuentra la frecuencia 34 que se ubica en el centro de los 67 datos. El lmite inferior
del intervalo de la mediana es L i = 82,5. La frecuencia total de la muestra es N = 67. La
suma de las frecuencias de los intervalos de clase de valor inferior al del intervalo de la
mediana es (f) = 12+10+1 = 23. La frecuencia absoluta del intervalo en que se ubica la
mediana es fMediana = 16. La amplitud del intervalo de la mediana es c = 2 cm. Empleando la
ecuacin de clculo de la mediana para datos agrupados:
N
- f

Mediana L i 2
f Mediana

67

- 12 10 1

33,5 - 23
2 82,5
c 82,5 2
2 83,8 cm
16
16

Media
El Promedio o Media es en la mayora de los casos la medida apropiada para describir
los valores centrales de un grupo de datos, aunque se debe tener presente que posee la
desventaja de ser afectada por valores extremos en los datos. Existen diferentes tipos de
promedio, cada uno de los cuales resulta apropiado en circunstancias particulares:

Media aritmtica, es la de uso ms extendido y la que tiene mayores aplicaciones.


Media geomtrica, entrega una medida ms precisa del cambio porcentual promedio
de una serie de nmeros (Webster, 2000), por ejemplo en clculos financieros de
variaciones de tasas de inters.
Media cuadrtica, de amplio uso en ciencias fsicas y de ingeniera.

El promedio aritmtico de un conjunto X 1, X2, X3, XN de datos no agrupados se


calcula mediante:
N

Xi
X1 X 2 X 3 ... XN
i1
X

N
N

Medidas de Tendencia Central

En donde X1, X2, X3, XN son los datos individuales (no agrupados) cuyo promedio se
va obtener, N es la cantidad total de datos a promediar.
Ejemplo: Calcule el valor promedio aritmtico para los siguientes 35 datos muestrales
de concentracin de partculas en suspensin (ug/m, fraccin MP10) registrados en la
Regin Metropolitana:
39 - 41 - 43 - 44 - 45 - 46 - 47 - 47 - 52 - 52 - 53 - 53 - 54 - 54 - 61 - 61 - 62 - 63 - 63 67 - 69 - 70 - 70 - 70 - 71 - 72 - 73 - 73 - 74 - 75 - 75 - 75 - 76 - 78 - 78
N

35

Xi

i1

X
i1

35

39 41 43 44 45 ... 75 75 76 78 78 2.146

61,3 ug/m
35
35

El promedio aritmtico de un conjunto X 1, X2, X3, XN de datos que se repiten con


frecuencias f1, f2, f3, fN se calcula mediante la media aritmtica ponderada:
N

X f X 2 f2 X 3 f3 ... XN fN
X 1 1

f1 f2 f3 ... fN

X f X f
i

i1

f
i1

i1

En donde X1, X2, X3, XN son las marcas de clase de cada uno de los intervalos en que
se agrupan los datos, f1, f2, f3, fN son las frecuencias absolutas asociadas a cada
marca de clase y f1 + f2 + f3 + + fN es la frecuencia total de la tabla o la cantidad total de
datos a promediar (N).
La media aritmtica ponderada es la manera correcta de calcular la media cuando los
datos estn agrupados en una tabla de frecuencias, tambin es usada cuando los valores
de Xi poseen diferente ponderacin, importancia o participacin del total.
Ejemplo: Calcule el valor promedio aritmtico para los siguientes datos de precio de
venta de propiedades urbanas:
Propiedad
A
B
C
D
E
F
Precio ($) 25.756.521 13.254.807 12.334.704 35.654.899 27.456.951 15.923.872
N

X X
i1

i1

27.756.521 13.254.807 .... .... 27.456.951 15.923.872


6

X
i1

130.381.754
$21.730.292
6

Medidas de Tendencia Central

Ejemplo: Calcule el valor promedio aritmtico ponderado para los datos muestrales de
concentracin de partculas en suspensin (ug/m, fraccin MP10) registrados en la
Regin Metropolitana, pero ahora agrupados en una tabla de frecuencias:
Frecuencia
Intervalo de
Marca de
Absoluta
Absoluta
Relativa
Concentracin (ug/m) Clase (ug/m)
(n)
Acumulada (n)
(%)
[37,50 43,50)
40,5
3
3
8,6
[43,50 49,50)
46,5
5
8
14,3
[49,50 55,50)
52,5
6
14
17,1
[55,50 61,50)
58,5
2
16
5,7
[61,50 67,50)
64,5
4
20
11,4
[67,50 73,50)
70,5
8
28
22,9
[73,50 79,50]
76,5
7
35
20,0
35
100,0

Relativa
Acumulada (%)
8,6
22,9
40
45,7
57,1
80
100

X f
i

i1

f
i1

40,5 3 46,5 5 52,5 6 ... 76,5 7 2.143,5

61,2 ug/m
3562487
35

De los ejemplos anteriores, en los primeros es conveniente usar un promedio


aritmtico sin ponderar debido a que el clculo se efecta sobre datos no agrupados; en el
segundo ejemplo, al estar agrupados los datos en una tabla de frecuencia el clculo de la
concentracin promedio debe efectuarse usando una media ponderada, la ponderacin en
este caso consiste en multiplicar la marca de clase de la concentracin de cada intervalo
por la frecuencia absoluta, es decir, la frecuencia absoluta constituye el factor de
ponderacin a objeto de que las concentraciones con mayor frecuencia tengan un mayor
peso o importancia en el clculo de la concentracin promedio. Comparando ambos
resultados es posible notar que existe una diferencia de 0,1 ug/m entre la concentracin
promedio calculada a partir de los datos no agrupados (61,3 ug/m) y la concentracin
promedio ponderada calculada a partir de los datos agrupados en la tabla de frecuencia
(61,2 ug/m), esta discrepancia se produce por el error de agrupamiento que se introduce
en la tabla al emplear en el clculo del promedio ponderado las marcas de clase como
valores de concentracin representativas de las mediciones que quedan incluidas en cada
intervalo, en este caso y para efectos prcticos, no existe una diferencia de importancia
entre ambos valores. El error de agrupamiento suele incrementarse en la medida en que
aumenta la amplitud (c) de los intervalos de clase, por lo cual una de las maneras de
reducir tal error consiste en disminuir la amplitud de los intervalos, sto sin embargo
produce un aumento en el nmero de intervalos de la tabla, aumento que puede superar la

Medidas de Tendencia Central

cantidad mxima de intervalos aconsejables en tablas de este tipo (12 a 15 intervalos


como mximo). En la actualidad, y debido a la posibilidad de procesar grandes cantidades
de datos con computadoras, los clculos de promedios y otros valores suelen realizarse a
partir de los datos no agrupados y la tabla de frecuencias se emplea como una forma de
resumir y presentar los datos; el clculo de estadgrafos a partir de datos agrupados en
tablas de frecuencia es una prctica que slo se recomienda en aquellos casos en los que
no se cuenta con la base de datos original de la tabla de frecuencia.
Ejemplo: Calcule la nota promedio de presentacin a examen de un alumno cuyas
calificaciones, junto con la ponderacin de cada calificacin, son las siguientes:
Calificacin
Nota
Ponderacin (%)

1
5,5
10

2
6,0
25

3
3,4
10

4
6,8
25

5
3,5
30

X f
i

i1

5,5 10 6,0 25 3,4 10 6,8 25 3,5 30 25

5,1
10 25 10 25 30
100

i1

En este ejemplo se debe usar un promedio aritmtico ponderado para calcular el


promedio final de presentacin a examen, ya que cada una de las notas obtenidas durante
el semestre no poseen el mismo valor, importancia o ponderacin en la calificacin final.
Ejemplo: Calcule el valor promedio aritmtico ponderado para los siguientes datos de
precio de venta de propiedades urbanas, todas las cuales poseen diferente superficie:
Propiedad
A
B
C
D
E
F
Precio ($)
25.756.521 13.254.807 12.334.704 35.654.899 27.456.951 15.923.872
Superficie (m)
450
340
240
600
150
334
N

X f X f
i

i1

f
i1

i1

f
i1

27.756.521 450 13.254.807 340 .... .... .... 15.923.872 334


450 340 240 600 150 334

X f
i

i1

f
i1

49.887.453.088
$23.598.606
2.114

En este ejemplo, al poseer antecedentes de que los sitios tienen diferente superficie y
que este factor se relaciona con el valor de las propiedades, el valor promedio aritmtico
debe ponderarse por la superficie de cada sitio, a objeto de que los terrenos de mayor
extensin tengan un mayor peso o importancia en el clculo del promedio.

Medidas de Tendencia Central

Propiedades de la Media
La media posee ciertas propiedades que resultan tiles conocer cuando se realizan
operaciones con los datos a partir de los cuales ella se calcula, tales propiedades son
aplicables tanto a la media de datos agrupados como no agrupados y se pueden resumir
en las siguientes:

El promedio aritmtico de una constante es igual a la constante:


k k k k ... k
k Xk
n

El promedio de una variable ms, o menos, una constante es igual al promedio de la


variable ms, o menos, la constante:
n

k X
i1

k X1 k X 2 k X 3 ... k Xn
kX
n

El promedio del producto entre una constante y una variable es igual al producto de la
constante por la media de la variable:
n

k X
i1

k X1 k X 2 k X 3 ... k Xn
kX
n

El promedio aritmtico de una variable menos su media es igual a cero ya que la suma
de las diferencias entre una variable y su media es igual a cero:

X X
n

i1

0
0 X1 X X 2 X X 3 X ... Xn X 0
n

Si una poblacin se subdivide ntegramente en muestras de distinto tamao, entonces


el promedio aritmtico de la poblacin () es igual al promedio aritmtico de las
muestras ponderadas por sus respectivos tamaos:
X1 n1 X 2 n 2 X 3 n3 ... Xn nn

n1 n2 n3 ... nn

Ejemplo: calcule las medidas de tendencia central moda, mediana y media aritmtica
para datos muestrales de precipitacin mensual correspondientes a 24 estaciones
meteorolgicas. Compare los resultados de cada estadstico, indique la influencia que

Medidas de Tendencia Central

los datos extremos de la muestra ejercen sobre los valores calculados y sugiera cul
de los estadsticos usara Usted para describir de manera adecuada los datos:
8,3 -34,4 -48,9 -170,8 -18,9 -249,6 -10,5 -22 -49,4 -230,1 -34,5 -190,5 -13,3 -22,2 -80,5
-255,3 -18,6 -338,3 -67,8 -27 -116,4 -265,6 -49,6 326
Se ordena la base de datos desde el valor menor al mayor para facilitar los clculos :
8,3 -10,5 -13,3 -18,6 -18,9 -22 -22,2 -27 -34,4 -34,5 -48,9 -49,4 -49,6 -67,8 -80,5 -116,4
-170,8 -190,5 -230,1 -249,6 -255,3 -265,6 -326 -338,3
Se calculan los valores de los estadsticos de tendencia central:
Mo no existe moda
49,4 49,6
49,5 mm
2
8,3 10,5 13,3 18,6 ... 255,3 265,6 326 338,3
X
110,4 mm
24

Md

Interpretacin de resultados: De los tres estadsticos de tendencia central calculados,


la moda resulta ser inexistente debido a que por la precisin con que se han medido
los datos (dcima de milmetro) no se ha repetido ningn valor de precipitacin en las
26 estaciones meteorolgicas, este hecho (que no exista Moda) no resulta extrao
cuando se realizan mediciones con gran precisin. La mediana y la media tienen
valores muy diferentes, existiendo 60,9 mm de diferencia entre ambos estadsticos,
esto est indicando que los valores extremos (mnimo y mximo) estn afectando de
manera considerable el valor de la media aritmtica lo que ocasiona que su gran
diferencia respecto de la mediana; en la prctica esta situacin debe ser analizada con
cuidado ya que puede ser un indicador de que existen errores de medicin o de
registro, o bien, puede significar que se est intentando promediar valores que
provienen de lugares con precipitacin muy dismil; cuando los valores de mediana y
media son muy parecidos cualquiera de ellos, mediana o media, podra emplearse
como estadstico representativo de la tendencia central de los datos; el uso de la media
aritmtica bajo esas circunstancias suele ser mucho ms frecuente que el de la
mediana.

Caractersticas de las medidas de tendencia central:


Medida
Se expresa en las mismas
unidades que la variable
Se calcula usando todos los
valores de la distribucin
Es nica
Es influida por valores extremos
de la variable

Media aritmtica
X

Moda Mediana
X

(X)

X
X
X

Medidas de Tendencia Central

Se puede calcular para


variables cualitativas
Se puede calcular para
variables en escala ordinal
Su clculo requiere ordenar la
distribucin de menor a mayor

X
X
X

Bibliografa

Spiegel, Murray. Estadstica. McGraw-Hill,1991.

Webster, Allen. Estadstica aplicada a los negocios y la economa. 3 ed. Irwin Mc Graw
Hill. 2000.

Potrebbero piacerti anche