Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADSTICA DESCRIPTIVA
Estadstica Deductiva o Descriptiva es aquella que describe y analiza un grupo de
datos, caracterizndolo pero sin sacar conclusiones a partir de ello respecto de un grupo
de datos mayor (Spiegel, 1991). Las modernas tcnicas de caracterizacin de datos que
cumplen con los propsitos de la Estadstica Descriptiva se agrupan bajo el trmino
Anlisis Exploratorio de Datos, que puede considerarse sinnimo del trmino anterior.
MEDIDAS DE POSICIN
El propsito de las medidas de posicin es resumir y describir conjuntos de datos a
travs de nmeros nicos que, por cuya posicin en el valor de la variable, tengan la
capacidad de representar al conjunto de valores observados. Las medidas de posicin
reciben la denominacin de Medidas de Tendencia Central cuando los nmeros calculados
asumen valores que tienden a ubicarse hacia el centro del conjunto de datos ordenados
por magnitud, tales como la moda, la mediana y la media o promedio.
Cuando las medidas de posicin se calculan a partir de los datos de la totalidad de la
poblacin se les denomina parmetros; cuando se calculan a partir de datos
correspondientes slo a una muestra de la poblacin, se les llama estadsticos o
estadgrafos.
Moda
La moda (Mo) es el valor que ocurre con mayor frecuencia absoluta dentro de un
conjunto de datos, es decir, es el valor que se repite ms veces; es una medida de
tendencia central que tiene la ventaja de no ser influenciada por la presencia de valores
extremos (muy altos o muy bajos) en el conjunto de datos. Puede suceder en ciertos
casos que la moda no exista como ocurre en el caso de datos que corresponden a
variables medidas en escala de razn con gran cantidad de cifras decimales, o bien, que
exista ms de una moda como en el caso de variables discretas que asumen pocos
valores. Aunque no es necesario ordenar los datos de acuerdo a su magnitud, contar con
datos ordenados de menor a mayor valor facilita el clculo de la moda en datos no
agrupados. Ejemplos de clculo de la moda para datos no agrupados:
F
r
e
c
u
e
n
c
i
a
F
r
e
c
u
e
n
c
i
a
F
r
e
c
u
e
n
c
i
a
Valor de la Variable
Valor de la Variable
Valor de la Variable
Frecuencia Unimodal
Frecuencia Bimodal
Frecuencia Multimodal
Es necesario hacer notar que en los casos en que una distribucin posea ms de una
moda, aquellos valores que constituyen moda deben tener exactamente la misma
frecuencia o deben repetirse la misma cantidad de veces entre los datos.
Cuando los datos estn agrupados en una tabla de frecuencia, el valor de la moda se
calcula de acuerdo a la siguiente expresin (Spiegel, 1991):
1
c
1 2
Moda L i
Frecuencia
Marca de Absoluta
Absoluta
Relativa
Relativa
Clase (kg)
(n)
Acumulada (n)
(%)
Acumulada (%)
51,3
7
7
15,6
15,6
54,3
9
16
20,0
35,6
57,3
10
26
22,2
57,8
60,3
6
32
13,3
71,1
63,3
8
40
17,8
88,9
66,3
1
41
2,2
91,1
69,3
100
4
45
8,9
45
100
1
10 - 9
1
c 55,8
Moda L i
3 55,8
3 56,4 Db
10 9 10 6
1 4
1 2
Mediana
La mediana (Md), dentro de un grupo de datos ordenados, corresponde a una medida
de tendencia central que es igual al valor central cuando la cantidad de datos es impar, o
al promedio de los valores centrales cuando la cantidad de datos es par; es decir, la
mediana es un valor que separa al conjunto de datos en dos mitades iguales, quedando el
50% de los datos por debajo de la mediana y el 50% de los datos por sobre ella. Al igual
que la moda, el valor de la mediana no es afectado por la magnitud de los valores
extremos presentes en los datos. Ejemplos de clculo de la mediana para datos no
agrupados:
El conjunto de datos 2,3,4,4,4,5,5,7,7,7,9, tiene Md = 5 (el primero de los dos 5).
El conjunto de datos 2,2,5,7,9,9,9,10,10,11,12,18, tiene Md = (9+9) / 2 = 9.
El conjunto de datos 2,4,6,5,7,9,9,10,11,12, tiene Md = (7+9) / 2 = 8.
Cuando los datos estn agrupados en una tabla de frecuencia, el valor de la mediana
se calcula de acuerdo a la siguiente expresin (Spiegel, 1991):
o Si para el intervalo mediano ocurre que Ni-1 < N/2 < Ni, entonces:
c
o frecuencia total, (f) es la suma de las Mediana L i 2
f Mediana
Frecuencia
Intervalo de
Marca de Absoluta
Absoluta
Relativa
Relativa
Alcance (cm) Clase (cm)
(n)
Acumulada (n)
(%)
Acumulada (%)
[76,5 - 78,5)
77,5
12
12
17,9
17,9
[78,5 - 80,5)
79,5
10
22
14,9
32,8
[80,5 - 82,5)
81,5
1
23
1,5
34,3
[82,5 - 84,5)
83,5
16
39
23,9
58,2
[84,5 - 86,5)
85,5
14
53
20,9
79,1
[86,5 - 88,5]
87,5
14
67
20,9
100
67
100
Mediana L i 2
f Mediana
67
- 12 10 1
33,5 - 23
2 82,5
c 82,5 2
2 83,8 cm
16
16
Media
El Promedio o Media es en la mayora de los casos la medida apropiada para describir
los valores centrales de un grupo de datos, aunque se debe tener presente que posee la
desventaja de ser afectada por valores extremos en los datos. Existen diferentes tipos de
promedio, cada uno de los cuales resulta apropiado en circunstancias particulares:
Xi
X1 X 2 X 3 ... XN
i1
X
N
N
En donde X1, X2, X3, XN son los datos individuales (no agrupados) cuyo promedio se
va obtener, N es la cantidad total de datos a promediar.
Ejemplo: Calcule el valor promedio aritmtico para los siguientes 35 datos muestrales
de concentracin de partculas en suspensin (ug/m, fraccin MP10) registrados en la
Regin Metropolitana:
39 - 41 - 43 - 44 - 45 - 46 - 47 - 47 - 52 - 52 - 53 - 53 - 54 - 54 - 61 - 61 - 62 - 63 - 63 67 - 69 - 70 - 70 - 70 - 71 - 72 - 73 - 73 - 74 - 75 - 75 - 75 - 76 - 78 - 78
N
35
Xi
i1
X
i1
35
39 41 43 44 45 ... 75 75 76 78 78 2.146
61,3 ug/m
35
35
X f X 2 f2 X 3 f3 ... XN fN
X 1 1
f1 f2 f3 ... fN
X f X f
i
i1
f
i1
i1
En donde X1, X2, X3, XN son las marcas de clase de cada uno de los intervalos en que
se agrupan los datos, f1, f2, f3, fN son las frecuencias absolutas asociadas a cada
marca de clase y f1 + f2 + f3 + + fN es la frecuencia total de la tabla o la cantidad total de
datos a promediar (N).
La media aritmtica ponderada es la manera correcta de calcular la media cuando los
datos estn agrupados en una tabla de frecuencias, tambin es usada cuando los valores
de Xi poseen diferente ponderacin, importancia o participacin del total.
Ejemplo: Calcule el valor promedio aritmtico para los siguientes datos de precio de
venta de propiedades urbanas:
Propiedad
A
B
C
D
E
F
Precio ($) 25.756.521 13.254.807 12.334.704 35.654.899 27.456.951 15.923.872
N
X X
i1
i1
X
i1
130.381.754
$21.730.292
6
Ejemplo: Calcule el valor promedio aritmtico ponderado para los datos muestrales de
concentracin de partculas en suspensin (ug/m, fraccin MP10) registrados en la
Regin Metropolitana, pero ahora agrupados en una tabla de frecuencias:
Frecuencia
Intervalo de
Marca de
Absoluta
Absoluta
Relativa
Concentracin (ug/m) Clase (ug/m)
(n)
Acumulada (n)
(%)
[37,50 43,50)
40,5
3
3
8,6
[43,50 49,50)
46,5
5
8
14,3
[49,50 55,50)
52,5
6
14
17,1
[55,50 61,50)
58,5
2
16
5,7
[61,50 67,50)
64,5
4
20
11,4
[67,50 73,50)
70,5
8
28
22,9
[73,50 79,50]
76,5
7
35
20,0
35
100,0
Relativa
Acumulada (%)
8,6
22,9
40
45,7
57,1
80
100
X f
i
i1
f
i1
61,2 ug/m
3562487
35
1
5,5
10
2
6,0
25
3
3,4
10
4
6,8
25
5
3,5
30
X f
i
i1
5,1
10 25 10 25 30
100
i1
X f X f
i
i1
f
i1
i1
f
i1
X f
i
i1
f
i1
49.887.453.088
$23.598.606
2.114
En este ejemplo, al poseer antecedentes de que los sitios tienen diferente superficie y
que este factor se relaciona con el valor de las propiedades, el valor promedio aritmtico
debe ponderarse por la superficie de cada sitio, a objeto de que los terrenos de mayor
extensin tengan un mayor peso o importancia en el clculo del promedio.
Propiedades de la Media
La media posee ciertas propiedades que resultan tiles conocer cuando se realizan
operaciones con los datos a partir de los cuales ella se calcula, tales propiedades son
aplicables tanto a la media de datos agrupados como no agrupados y se pueden resumir
en las siguientes:
k X
i1
k X1 k X 2 k X 3 ... k Xn
kX
n
El promedio del producto entre una constante y una variable es igual al producto de la
constante por la media de la variable:
n
k X
i1
k X1 k X 2 k X 3 ... k Xn
kX
n
El promedio aritmtico de una variable menos su media es igual a cero ya que la suma
de las diferencias entre una variable y su media es igual a cero:
X X
n
i1
0
0 X1 X X 2 X X 3 X ... Xn X 0
n
n1 n2 n3 ... nn
Ejemplo: calcule las medidas de tendencia central moda, mediana y media aritmtica
para datos muestrales de precipitacin mensual correspondientes a 24 estaciones
meteorolgicas. Compare los resultados de cada estadstico, indique la influencia que
los datos extremos de la muestra ejercen sobre los valores calculados y sugiera cul
de los estadsticos usara Usted para describir de manera adecuada los datos:
8,3 -34,4 -48,9 -170,8 -18,9 -249,6 -10,5 -22 -49,4 -230,1 -34,5 -190,5 -13,3 -22,2 -80,5
-255,3 -18,6 -338,3 -67,8 -27 -116,4 -265,6 -49,6 326
Se ordena la base de datos desde el valor menor al mayor para facilitar los clculos :
8,3 -10,5 -13,3 -18,6 -18,9 -22 -22,2 -27 -34,4 -34,5 -48,9 -49,4 -49,6 -67,8 -80,5 -116,4
-170,8 -190,5 -230,1 -249,6 -255,3 -265,6 -326 -338,3
Se calculan los valores de los estadsticos de tendencia central:
Mo no existe moda
49,4 49,6
49,5 mm
2
8,3 10,5 13,3 18,6 ... 255,3 265,6 326 338,3
X
110,4 mm
24
Md
Media aritmtica
X
Moda Mediana
X
(X)
X
X
X
X
X
X
Bibliografa
Webster, Allen. Estadstica aplicada a los negocios y la economa. 3 ed. Irwin Mc Graw
Hill. 2000.