Sei sulla pagina 1di 30

tema

60 MATEMÁTICAS

Parámetros estadísticos.
Cálculo, significado y propiedades.
24-13852-13

Temario 1993
tema 60

matemáticas

1. Parámetros estadísticos
1.1. Conceptos generales

1.2. Parámetros estadísticos

2. Cálculo, significado y propiedades


2.1. Medidas de centralización
2.1.1. Media aritmética de una variable
2.1.2. Media geométrica
2.1.3. Media armónica
2.1.4. Relación entre las distintas medias
2.1.5. Mediana
2.1.6. Moda
2.1.7. Percentiles
2.1.8. Relación entre media, mediana y moda

2.2. Medidas de dispersión


2.2.1. Recorrido
2.2.2. Desviaciones
2.2.3. Varianza y desviación típica

2.3. Momentos

2.4. Medidas de asimetría y curtosis

3
tema 60

matemáticas

INTRODUCCIÓN

Vamos a recordar, en primer lugar, unas definiciones básicas e imprescindibles para el de-
sarrollo posterior del tema.
Se llama Estadística a la ciencia que tiene por objeto el tratamiento y análisis de la infor-
mación obtenida en una serie de observaciones.
Los objetivos de la Estadística son:
a) Indicar los métodos de recogida y agrupamiento de datos.
b) El análisis de dichos datos, para obtener conclusiones o leyes aplicables en la práctica.
El campo de aplicación de la Estadística se ha ido ensanchando con el tiempo, y actualmen-
te está presente en todas las ramas de la ciencia y de la técnica.

5
tema 60

matemáticas

1 Parámetros estadísticos
En un estudio estadístico, además de los gráficos y tablas que permiten visualizar
y resumir los datos observados, es preciso utilizar valores numéricos o medidas
que describan de forma objetiva los datos recogidos. Estas medidas son los pará-
metros estadísticos. Vamos a recordar, en primer lugar, unas definiciones básicas
e imprescindibles para el desarrollo posterior del tema.

1.1. Conceptos generales

„„ Población
Llamaremos población a todo conjunto homogéneo de objetos de cualquier
naturaleza que tienen unas características comunes. La población debe estar
definida con precisión para que dado un objeto no haya dudas sobre si pertenece
o no a ella. No siempre es posible analizar cada elemento de una población (por
razones económicas, de falta de tiempo, personal disponible…) por lo que, en
estos casos, se estudia una parte de la población.
„„ Muestra
Recibe el nombre de muestra todo subconjunto de una población. Ejemplos de
población pueden ser los habitantes de Madrid censados en 2007 o las piezas
fabricadas por una máquina en un mes. Una muestra de la primera población
la forman los habitantes de Madrid menores de 30 años, y una muestra de la
segunda, los tornillos fabricados en una semana por la máquina citada. La ope-
ración de tomar una muestra se llama muestreo.
„„ Carácter
Llamamos carácter a una cualidad de los elementos de una población que sea
observable, que posea varias modalidades (o valores) y tal que cada elemento
de la población presente una y sólo una modalidad.
El sexo es un carácter que presenta dos modalidades: varón y hembra. La esta-
tura es un carácter cuyas modalidades son las distintas tallas.
Los caracteres de los elementos de la población se dividen en cualitativos o
atributos y cuantitativos o variables.
−− Un carácter se llama cualitativo o atributo cuando sus distintas modalida-
des no son medibles numéricamente (por ejemplo: el sexo, estado civil, ...).
−− Se llama cuantitativo o variable si sus distintas modalidades son medibles
numéricamente (por ejemplo, la talla, el peso, ...)

6
tema 60

matemáticas

„„ Datos u observaciones
Los resultados que se obtienen tras la observación de atributos y variables se
denominan datos u observaciones. En el caso de las variables se les suele llamar
valores.
Distinguimos dos tipos de variables:
„„ Variable discreta
Una variable estadística se dice discreta cuando sus posibles valores son finitos
o numerables. Son variables estadísticas discretas: el número de hijos de una
familia, el número de tornillos fabricados por una máquina en una hora, ...
„„ Variable continua
Una variable estadística se dice continua si sus valores posibles son un número
infinito, o bien, si entre dos valores de la variable, ésta puede tomar todos los
intermedios. son variables estadísticas continuas: la talla, la edad de una perso-
na, la medida del diámetro de una pieza, etc.
Por extensión de la noción de variable estadística continua, una magnitud que
pueda tomar un gran número de valores, aunque sean aislados, se considera
como continua. Por ejemplo, el salario mensual de una persona.
Los valores que toma una variable estadística se presentan en tablas estadísticas
para facilitar su manejo y mediante gráficos para visualizar mejor el conjunto de
la muestra.

1.2. Parámetros estadísticos

Las tablas estadísticas y la representación gráfica nos dan una idea cualitativa de
conjunto de una distribución de frecuencias que no es suficiente, por ejemplo, para
comparar dos distribuciones.
Con el fin de obtener un resumen cuantitativo se sustituye el conjunto de valores
por números llamados parámetros estadísticos o medidas descriptivas de los
datos, que son unos números que nos permitirán, con objetividad y precisión,
tener una visión más completa del fenómeno estudiado, comparar distintas distri-
buciones de frecuencias y valorar con números sus distintas características.
Los parámetros estadísticos se clasifican en diversos tipos:
„„ Medidas de posición o centralización.
„„ Medidas de dispersión.
„„ Medidas de asimetría y curtosis.

7
tema 60

matemáticas

2 Cálculo, significado y propiedades

2.1. Medidas de centralización

Las medidas de posición o centralización son valores que están medidos en las
mismas unidades que las observaciones y que nos indican en torno a qué posición
se distribuyen las observaciones de que disponemos, es decir, cómo se agrupan
los datos observados.
En la medida en que dichos valores nos orienten sobre la posición de una parte
cualquiera previamente determinada de la distribución o sobre el lugar central de
la misma, se clasifican en medidas de posición no central (cuartiles, deciles y
percentiles) y medidas de posición central (medias, mediana y moda).
Es obvio que todas ellas han de verificar que su valor esté comprendido entre el
menor y el mayor valor de los datos disponibles.

2.1.1. Media aritmética de una variable

XX Media aritmética de una variable discreta

Parece bastante natural pensar como modelo de la posición central de una distri-
bución, en aquel valor que actuase como su centro de gravedad en el sentido de
compensar las desviaciones con respecto de él de los valores de la variable, en un
sentido o en otro.
−− Datos simples: se llama media aritmética de una serie de valores xi, x2, ..., xn
de una variable estadística X, a la suma de ellos dividida por el número total

de valores. Se designa por x y viene dada por:
x1 +  + xn
N

∑x
1
x= = i
N N i =1

−− Datos agrupados: si los valores x1, ..., xk están afectados por sus correspon-
dientes frecuencias f1, ..., fk, la media aritmética se define:
k k

∑ ∑xn
1
x = x1 ⋅ f1 +  + xk ⋅ f k = xi f i = i i
i =1
N i =1

donde xi serán valores de la variable.


„„ Propiedades de la media
La suma de las desviaciones de cada valor respecto de la media, ponderadas por
su correspondiente frecuencia absoluta, es igual a cero.
Demostración:
Sean xi, x2, ..., xk los valores de la variable y n1, n2, ..., nk sus frecuencias abso-
lutas.

8
tema 60

matemáticas


En efecto, llamando desviaciones a los valores xi – x queda:
k k k

∑ ∑ ∑ xn = x − x = 0
1 1 1
( xi − x )ni = xi ni − i
N i =1
N i =1
N i =1

ya que ∑n i
=1
N

„„ Cálculo abreviado de la media


−− Cambio de origen: cuando los datos son muy numerosos o contienen deci-
males, se puede abreviar el cálculo utilizando un promedio aproximado, que
llamaremos origen de trabajo y que puede ser cualquier valor del centro de
la muestra.
Si llamamos a este valor x0, y a los datos xi les restamos x0, obtendremos una
nueva variable «y», que tomará los valores siguientes:
y1 = x1 – x0
y2 = x2 – x0
.
.
.
yk = xk – x0
k

∑ x n haciendo el cambio y = x – x , se obtiene:


1
como x = ⋅ i i i i 0
N i =1

1  
k k k k

∑ ∑ ∑ ∑ x n  =
1 1
y= ⋅ yi ni = ⋅ ( xi − x0 ) ⋅ ni =  xi ni − 0 i
N i =1
N i =1
N  i =1 i =1

k k

∑ ∑x n = x−x
1 1
= xi ni − 0 i 0
N i =1
N i =1

   
y despejando: x = y + x0 que permite calcular x a partir de y y de x0.

−− Cambio de escala o unidad: a veces, es conveniente multiplicar todos los


valores xi por una misma cantidad 1/c, obteniendo otros valores que llama-
remos ui, tal que:
1 1 1
u1 = x1 u2 = x 2  uk = x k
c c c
Se dice entonces que hemos cambiado de unidad. La media de esta nueva
variable es:
k k

∑ ∑xn = c
1 1 1 1 x
u= ⋅ xi ni = ⋅ ⋅ i i
N i =1
c c N i =1
 
de donde x = c u

9
tema 60

matemáticas

−− Cambio de origen y de unidad: si hacemos primero el cambio de origen


yi = xi – x0 y luego el cambio de unidad
1 1 x − x0
ui = yi , queda ui = yi = i
c c c
Ahora bien,

xi − x 0
k k k

∑ ∑ ∑ ( x − x )n =
1 1 1 1
u= ⋅ xi ni = ⋅ ni = ⋅ i 0 i
N i =1
N i =1
0 c N i =1

1 k k

∑ ∑ x n  = c ( x − x ).
1 1 1
=  ⋅ xi ni − ⋅ 0 i 0
c  N i =1
N i =1

1
O sea, u = ( x − x0 ), y despejando:
c
x = u c + x0

XX Media aritmética de una variable continua

La media aritmética de una variable continua es la media de las marcas de


clase ponderadas por las correspondientes frecuencias relativas.
Si llamamos xi a las marcas de clase, será:
k k

∑xn =∑x f
1
x= ⋅ i i i i
N i =1 i =1

Suponiendo que todas la clases tienen una amplitud constante c, se demuestra que
haciendo el cambio:
x − x0
ui = i
c
los ui resultan números enteros pequeños. En este caso x0 es una de las marcas de
clase del centro de la muestra.
Es evidente que ahora se puede proceder como hemos explicado en el apartado
anterior para el cálculo abreviado de la media.
En la tabla estadística de variable continua se añadirán dos nuevas columnas para
facilitar el cálculo, una con la variable ui, y otra con los productos ni · ui.
Para la media aritmética, podemos encontrar las siguientes ventajas e inconve-
nientes como medida de posición central:
Ventajas:
„„ Está perfectamente determinada de forma objetiva, y es única.
„„ Tiene un significado interpretativo muy claro.
„„ Es sencilla de calcular.
„„ Se utilizan para el cálculo todos los valores de que se dispone en la distribu-
ción.

10
tema 60

matemáticas

Inconvenientes:
Los valores extremos muy dispares influyen de manera notable en su valor a causa
de lo cual puede perder valor representativo.
No obstante, a pesar del inconveniente que acabamos de mencionar, podemos
decir que es, sin lugar a dudas, la medida de posición central más utilizada.
Cuando es conocido que los valores de la variable no tienen todos la misma im-
portancia con respecto al tratamiento que deben dárseles, suele ser bastante útil
utilizar una variante de la media aritmética que vamos a ver a continuación.

XX Media ponderada

Para calcularla se le asocia a cada valor de la variable xi un peso wi que mide su


grado de importancia en la distribución. Dichos pesos wi son valores positivos y
representan el número de veces que sus correspondientes valores xi son más repre-
sentativos que un valor que tuviese peso asociado a la unidad.
Se define la media aritmética ponderada de una distribución de valores
x1, x2, ..., xk, de pesos o importancias relativas w1, w2, ... , wk a:
k

∑w ⋅x i i

xp = i =1
k

∑w i =1
i

En general, y esto es importante, los pesos wi pueden ser números reales positivos
cualesquiera.

2.1.2. Media geométrica

En muchas situaciones los valores de la distribución no son de naturaleza propia-


mente aditiva como puede suceder por ejemplo en el caso de que fueran puntos,
bonos, salarios, etc. En estos casos la media aritmética deja de ser fácilmente
interpretable y, por tanto, pierde gran parte de su interés. Así, por ejemplo, si tene-
mos una serie de índices de precios durante un período de años, un índice medio
anual de precios debe ser aquel que, manteniéndose constante durante todos esos
años, produzca la misma degradación final de los precios en el último año con
respecto del año inicial, que los índices originales.
En estas circunstancias la medida de posición central más utilizada es la que se
conoce con el nombre de media geométrica.
„„ Datos simples
Si las frecuencias no están agrupadas y xi > 0, se llama media geométrica de N
valores x1, x2 ... xN a la raíz N-ésima de su producto.
G= N x1 ⋅ x2 ⋅  ⋅ x N (1)

11
tema 60

matemáticas

„„ Datos agrupados:
Sean los valores de la variable o las marcas de clase x1, ..., xk y sus frecuencias
absolutas n1, ..., nk respectivamente. Se define la media geométrica como:
G= N
x1n1 ⋅ x2n2 ⋅  ⋅ xknk con n1 + n2 + ... + nk = N (2)
Su cálculo se hace posible mediante logaritmos. Aplicándolos en (1) queda:

[log x1 + log x2 +  + log xn ]


1
log G =
N

[n1 ⋅ log x1 + n2 ⋅ log x2 +  + nk ⋅ log xk ]


1
y en ( 2), log G =
N
La media geométrica no es muy utilizada por su complicación de cálculo, aun-
que reduce la influencia de los valores extremos.
Entre las ventajas de la media geométrica podemos citar:
−− Está definida de forma objetiva y es única.
−− Considera en su cálculo todos los valores de la distribución.
−− Los valores extremos tienen menos influencia que en la media aritmética.
Inconvenientes:
−− Cálculo un poco complicado.
−− Lógicamente sólo debe aplicarse cuando los valores de la distribución sean
todos positivos ya que si alguno fuese cero, se anularía la media geométrica,
y si hubiere valores negativos, obtendríamos valores imaginarios.
El empleo más habitual de la media geométrica es para datos de tipo multipli-
cativo como números índices, porcentajes, tasas, etc.

2.1.3. Media armónica

„„ Datos simples
La media armónica de una serie de N valores x1, ..., xN es el recíproco de la
media de los recíprocos de los valores. Es decir:
N N
H = = N
1 1 1
∑x
+ ++ 1
x1 x2 xN
i =1 i

„„ Datos agrupados
La media armónica de k valores x1, ..., xk con frecuencias absolutas n1, ..., nk
se define como:
N N
H = = k
; con n1 +  + nk = N y xi ≠ 0, ∀i
n1 n2 nk

+ ++ 1
x1 x2 xk xi
i =1

Entre las ventajas de la media armónica podemos citar:

12
tema 60

matemáticas

−− Está definida de forma objetiva y es única.


−− En su cálculo intervienen todos los datos de la distribución.
−− Su cálculo es sencillo.
Inconvenientes:
No debe usarse cuando los valores de la variable sean cercanos a cero ya que sus
inversos pueden crecer en demasía, haciendo despreciable frente a ellos la infor-
mación que aportasen otros valores mayores. Obviamente, por otro lado, cuando
exista algún valor nulo de la variable, no podemos tampoco calcular la media
armónica.

2.1.4. Relación entre las distintas medias

Proposición
Para una serie de valores x1, x2, ..., xN de una variable estadística X, la media arit-
mética, geométrica y armónica (siempre que existan) verifican que:

H≤G≤x

Demostración:
Veamos primero que H ≤ G para el caso particular de dos valores x1 y x2:

2 2 x1 x2
H≤G ↔ ≤ x1 x2 ↔ ≤ x1 x2 ↔ 2 x1 x2 ≤ x1 x2 ( x1 + x2 ) ↔
1 1
+ x1 + x2
x1 x2

↔ 4 x12 x 22 ≤ x1 x2 ( x1 + x2 ) ↔ 4 x1 x2 ≤ ( x1 + x2 )
2 2
↔ 4 x1 x2 ≤ x12 + 2 x1 x2 + x 22 ↔

↔ 0 ≤ ( x1 − x2 )
2
↔ 0 ≤ x12 − 2 x1 x2 + x 22
Que es una desigualdad que se verifica por lo que H ≤ G
Veamos ahora que G ≤ x :

x1 + x2
↔ 4 x1 x2 ≤ ( x1 + x2 ) ↔ 0 ≤ ( x1 − x2 )
2 2
G≤x ↔ x1 x2 ≤
2

Desigualdad análoga a la anterior y que se verifica por lo que G ≤ x


Y por tanto:
H≤G≤x
Por inducción, la proposición se demuestra ∀ N

2.1.5. Mediana

La mediana M es el valor de la variable que divide a la serie estadística ordenada,


en dos partes iguales, habiendo tantos valores por encima como por debajo de
ella.

13
tema 60

matemáticas

Si los datos no están agrupados y están numerados de 1 a N, es el valor que ocupa


el lugar
N +1
si N es impar
2
Cuando N es par, la mediana no queda definida y se toma la media de los valores
que ocupan el lugar
N N
y   +1
2 2

Como la mediana deja a un lado y a otro un número de datos iguales, las frecuen-
cias a uno y otro lado también son iguales.

Si tenemos representado el polígono de frecuencias relativas acumuladas, bastará


1
con trazar la recta paralela al eje X de ordenada y determinar la abcisa del punto
2
en que lo corta.

1
Puede suceder que la recta y =tenga un segmento de puntos comunes, entonces
2
se toma como mediana el punto medio del segmento.

Si los datos están agrupados en intervalos, construiremos el polígono de frecuen-


1
cias relativas acumuladas y buscamos la intersección de la recta y = .
2

14
tema 60

matemáticas

Como se ve en la figura 0M = 0N + NM = 0N + AB. Por ser los triángulos ABE


y ACD semejantes:
DC EB EB
= ⇒ AB = ⋅ AC
AC AB DC

EB EM − BM
y, por tanto, 0 M = 0 N + AB = 0 N + ⋅ AC = 0 N + ⋅ AC
DC DC

Luego 0M es fácil de calcular, pues ON es la abscisa del extremo inferior del in-
1
tervalo que contiene a M, EM = , BM = AN es la frecuencia relativa acumulada
2
del intervalo anterior, DC es la frecuencia relativa del intervalo en que está la

mediana y AC es la amplitud del intervalo mediano. En símbolos:


i −1

∑f
1
− j
2 j =1
M = ai −1 + ei
fi
con ei = ai - ai-1
Si multiplicamos y dividimos por N (número total de datos) la fracción, queda:

i −1

∑n
N
− j
2 j =1
M = ai −1 + ei
ni

Veamos qué le sucede al valor de la mediana si tenemos que llevar a cabo un cam-
bio de origen y escala.
x − x0
Si realizamos el cambio ui = i y llamamos M (u) a la mediana de la nueva
c
distribución transformada, entonces se verifica que M = c M (u) + x0 como puede
demostrarse sin dificultad.

15
tema 60

matemáticas

Entre las ventajas de la mediana como medida de posición central podemos des-
tacar las siguientes:
„„ Es sencilla de calcular.
„„ No influyen en ella más que los datos centrales de la distribución, por lo que se
puede calcular aún cuando no se conozcan los valores extremos de la distribu-
ción, siempre claro está, que tengamos suficiente información respecto de sus
frecuencias.
„„ Es de fácil interpretación al ser siempre un valor propio de la variable.
Inconvenientes
No puede expresarse mediante una fórmula matemática sencilla a efectos de rea-
lizar con ella grandes desarrollos algebraicos.

2.1.6. Moda

Se llama moda (M0) de una distribución de frecuencias al valor (o valores) de la


variable al que corresponde mayor frecuencia.
Una distribución de frecuencias puede tener una o varias modas, si tiene una se
llama unimodal, si tiene dos, bimodal, etc.
El cálculo de la moda resulta sencillo en los casos de datos simples y datos agru-
pados. Ahora bien, cuando los datos están agrupados en intervalos, igual que su-
cedía con la media o con la mediana, no obtendremos el valor exacto de la moda,
sino una aproximación que vendrá en función de las hipótesis que realicemos
sobre las observaciones de cada intervalo considerado.
En el caso que nos ocupa dichas hipótesis suelen ser las siguientes:
„„ Hay una moda en cada intervalo cuya densidad de frecuencia no es superada
por ningún otro.
„„ Dentro de dichos intervalos, la moda es aquel punto que equilibra las densida-
des de frecuencia de los intervalos adyacentes, suponiendo que los valores se
repartan en el interior de los mismos de una manera uniforme.
Sea, pues, [ai-1, ai) un intervalo cuya densidad de frecuencia no es superada por
ningún otro. Dicho intervalo recibe el nombre de intervalo modal o clase modal.

Recordemos por otro lado que la densidad de frecuencia hi de un intervalo i-ésimo


es el cociente entre la frecuencia absoluta asociada ni y su amplitud ei:
ni
ei : hi =
ei

16
tema 60

matemáticas

En la representación gráfica, el equilibrio debe darse en el sentido de ser:


a b
=
hi − 2 hi

y como la moda M0 será: M0 = ai–1 + b, tenemos:


a e −b
b= ⋅ hi = i ⋅ hi ⇔ bhi − 2 = ei hi − bhi ,
hi − 2 hi − 2
Luego
hi
b= ⋅ ei
hi −2 + hi
y, por tanto:
hi
M 0 = ai −1 + ⋅ ei
hi − 2 + hi

Si las amplitudes de los intervalos fuesen constantes, la expresión de la moda


sería:
hi
M 0 = ai −1 + ⋅ ei
ni − 2 + ni

Entre los inconvenientes de la moda podemos mencionar los siguientes:


„„ No tiene una expresión matemática sencilla para el cálculo algebraico.
„„ No intervienen en su determinación todos los valores de la distribución.
„„ Los cambios en la distribución que se produzcan ajenos al valor modal no son
detectados.

17
tema 60

matemáticas

Ventajas:
„„ Cálculo sencillo.
„„ Fácil interpretación.
Por otro lado la obtención de las modas de una distribución tiene una importancia
propia derivada del hecho de que sirve para detectar posibles fusiones (mixturas)
de distintas poblaciones unidimensionales en la masa de datos. A veces la moda
nos avisa de la necesidad de dividir dicha masa de datos en partes distintas para
que el fenómeno que estamos tratando se estudie mejor.
Al igual que hemos hecho ya anteriormente con otras medidas, la moda, si se
efectúa un cambio de escala y traslación, toma la forma:
M0 = c M0(u) + x0
2.1.7. Percentiles

Se define como percentil de orden r, y lo representamos por Pr, al valor de la


variable tal que las frecuencias absolutas de los valores iguales o menores que él
representan el % de la frecuencia total N.
Los percentiles más importantes son los P25, P50, P75, que se denominan cuartiles.
El P25 y P75 son respectivamente el cuartil inferior y superior. El P50 es la mediana.
Los valores P10, P20, ..., P90 se llaman deciles.
Su cálculo es análogo al de la mediana y, en general, se aplica la expresión:
i −1
r⋅N
100
− ∑n
j =1
j

Pr = ai −1 + ⋅ ei
ni
2.1.8. Relación entre media, mediana y moda

En el caso de distribuciones unimodales lo más frecuente es que la mediana esté


comprendida entre la moda y la media. Cuando está más cerca de la media que de
la moda, la distribución se dice:

desviada a la derecha

o más raramente:

desviada a la izquierda

Si la distribución es simétrica y unimodal, las tres características coinciden.


Se ha comprobado empíricamente que para distribuciones moderadamente asimé-
tricas, se verifica:
 
x – M0 ≤ 3 x – M
que se conoce con el nombre de desigualdad de Pearson.

18
tema 60

matemáticas

2.2. Medidas de dispersión

Tienen por objeto dar una idea de la mayor o menor concentración de los valores
de una distribución alrededor de los valores centrales.

2.2.1. Recorrido

Se llama recorrido a la diferencia entre el mayor y el menor de los valores de la


variable.
El recorrido, por su sencillez de cálculo, se utiliza en el control de fabricación
industrial más que la desviación típica, aunque es muy sensible a los valores erró-
neos.
Recorrido intercuartílico es la diferencia entre los valores P75 y P25, es decir,
entre el cuartil superior e inferior.

2.2.2. Desviaciones

Consideremos un valor central C y un valor de la variable xi. Al valor xi – C se


llama desviación de xi respecto de C. Al valor xi – C, desviación absoluta.

XX Desviación media

Definimos desviación media d de una distribución de frecuencias con respecto a


un valor central C, para datos no agrupados como:
N

∑ x −C
1
D= ⋅ i
N i =1

Con datos agrupados:


N

∑ x −C ⋅n
1
D= ⋅ i i
N i =1

Las desviaciones medias más utilizadas son respecto a la media y a la mediana,


u
que se obtienen sustituyendo C por x y por M, respectivamente.

2.2.3. Varianza y desviación típica

XX Varianza

Varianza de una distribución de frecuencias es la media aritmética de los cuadra-


dos de las desviaciones respecto a la media. Es el índice de dispersión más usado
y se designa por σ2.
Para datos no agrupados queda:
k

∑ ( x − x)
1
σ2 = ⋅ i
2
N i =1

19
tema 60

matemáticas

y para datos agrupados (xi marcas de clase):


k

∑ ( x − x)
1
σ2 = ⋅ i
2
⋅ ni
N i =1

u
siendo x la media aritmética de la distribución de valores x1, ..., xk y de las fre-
cuencias n1, ..., nk.
A la raíz cuadrada positiva de la varianza se llama desviación típica:
k

∑ ( x − x)
1
σ= ⋅ i
2
⋅ ni
N i =1

„„ Cálculo abreviado de la varianza y de la desviación típica


Para datos agrupados:
k k

∑ ∑ (x
1 1
σ = ⋅
2
( xi − x ) ⋅ ni = ⋅
2 2
i + x 2 − 2 xxi )ni =
N i =1
N i =1

k k k k

∑ ∑ ∑ ∑nx
1 1 1 1
= ni xi2 + x 2 ni − 2 x ⋅ ni xi = 2
i i + x 2 − 2x x =
N i =1
N i =1
N i =1
N i =1

∑nx
1
= 2
i i −x
N i =1

luego:
k

∑nx
1
σ2 = 2
i i − x2
N i =1

Los cálculos se disponen en una tabla de la siguiente forma:

xi ni ni xi ni x2i
x1 n1 n1x1 n1 x21
· · · ·
· · · ·
· · · ·
xi ni ni xi ni x2i
· · · ·
· · · ·
· · · ·
xk nk nk xk nk xk2
N = Σni Σni xi Σni x2i

Si la variable es continua, está agrupada en clases y a la vista de los datos puede


convenir hacer un cambio de origen o de escala.

20
tema 60

matemáticas

u u
En el caso general se hace xi = ui c + x0, x = u c + x0, entonces:
u u u
xi – x = (uic + x0) – (u c + x0) = c(ui – u)

∑ ( x − x ) n = N ⋅ ∑ c (u − u) n = c ∑ (u − u) n = c σ
1 1 1
σ2 = ⋅ i
2
i
2
i
2
i
2
⋅ i
2
i
2 2
u
N N
donde σu2 es la varianza de la variable u.
Finalmente σ2 = c2 · σ2u
Los cálculos se disponen en una tabla como sigue:


1
Se aplica primero σ u2 = ⋅ ni ui2 − u 2 , y luego σ2 = c2 σu2
N

Marcas Frecuencias xi – x0
Intervalos ui = ———– ui uin2i
de clase absolutas ni c
[a0, a1) x1 n1 u1 u1n1 u1n21
[ai–1, ai) xi ni ui uini uin2i
[ak–1, ak) xk nk uk uk nk uk nk2
Σn1 Σu1 Σu1n1 Σu1n21

„„ Propiedades de la desviación típica


1. La desviación típica no tiene un sentido muy concreto en sí misma y tiene
significado sólo para comparar dos distribuciones.
Dividiendo las desviaciones típicas de ambas se puede saber cuántas veces
una distribución es más dispersa que la otra.
2. La desviación típica es más sensible que la media a los valores erróneos,
puesto que intervienen al cuadrado. Su cálculo puede resultar pesado, por lo
que a veces se prefiere el recorrido.
3. La desviación típica es la menor de todas las desviaciones cuadráticas res-
pecto a un promedio.
Sea x un promedio cualquiera. Bastará demostrar que:
u
Σ(xi – x)2 < Σ (xi – x)2
Calculemos el valor de x para que I = Σ(xi – x)2 sea mínimo.

∑ ( x − x) = 0; −2∑ x + 2∑ x = 0; ∑ x = ∑ x = Nx
dl
= −2 i i i
dx

de donde:

x=
∑x i
= x, y como
d 2l
=2 ∑ 1 = 2N > 0
N dx 2
u
el valor mínimo corresponde a las desviaciones respecto a x.
4. Puede comprobarse que si se realiza un cambio de escala y traslación:
σ = c σ(u)

21
tema 60

matemáticas

5. Para distribuciones simétricas o moderadamente asimétricas, se cumple,


aproximadamente, que:
u u
−− Entre x – σ y x + σ están, aproximadamente, el 68% de las ob­
servaciones.
u u
−− Entre  x – 2σ y x + 2σ están, aproximadamente, el 95% de las observa-
ciones.
u u
−− Entre x – 3σ y x + 3σ están, aproximadamente, el 98% de las observa-
ciones.
Dichas aproximaciones son de mucha utilidad para visualizar mentalmente
la dispersión.

2.3. Momentos

XX Momentos centrales y respecto al origen

„„ Para datos no agrupados, se llama momento de orden r respecto al valor C a


la cantidad:
N

∑ (x − C)
1
mr = ⋅ i
r
N i =1

„„ Para datos agrupados, se define por:


N

∑ (x − C)
1
mr = ⋅ i
r
⋅ ni
N i =1

Según los valores de C, se definen varias clases de momentos.


Haciendo C = 0 se obtienen los llamados momentos respecto al origen, que-
dando para datos no agrupados:
N

∑x
1
mr = ⋅ r
i
N i =1

y para datos agrupados:


k

∑x
1
mr = r
i ⋅ ni
N i =1
u
Haciendo C = x se obtienen los momentos centrales o respecto a la media.
Para datos no agrupados:
N

∑ ( x − x)
1
mr = µr = ⋅ i
r
N i =1

y para datos agrupados:


k

∑ ( x − x)
1
µr = ⋅ i
r
⋅ ni
N i =1

22
tema 60

matemáticas

Los primeros momentos no centrales son:


u u
m0 = 1    m1 = x    m2 = σ2 + x2
Y los primeros centrales o respecto a la media:
µ0 = 1    µ1 = 0    µ2 = σ2

XX Relaciones entre momentos centrales y no centrales


u
„„ Teniendo en cuenta que m = x
1
k k

∑ ∑ f (x − m )
1
µr = ( xi − x ) r ni = i i 1
r
N i =1 i =1

Desarrollando por el binomio de Newton queda:


k
 r  r  r  r −1  r  r −2 2 r r
r  
µr = ∑⋅f
i =1
i   xi −   xi m1 +   xi m1 −  + ) − 1)   m1 
 0   1  1 r 
k
r k
r k
= ∑
i =1
f i xir −   m1
 1
∑ i =1
f i xir −1 +  + ( −1) r   m1r ⋅
r
∑f i =1
i =

r r r
= mr −   m1mr −1 +  + ( −1) r   m1
r r
Para r = 2, 3 y 4 da:
µ2 = m2 – m12 (teorema de König)
µ3 = m3 − 3m2 m1 + 2m13

µ4 = m4 − 4 m3 m1 + 6 m12 m2 − 3m14
que dan los momentos centrales en función de los no centrales.
k k
Como mr = 1 ⋅
∑ ∑ f [( x − m ) + m ]
r
„„ xir ni = i i 1 1
N i =1 i =1

desarrollando queda:
k
 r r r 
mr = ∑⋅f
i =1
i ( xi − m1 ) +   ( x1 − m1 ) m1 +  +   m1  =

r

 1
r −1

r 

r r
= µr +   m1 µr −1 +  +   m1r
r r

2.4. Medidas de asimetría y curtosis

Hemos visto hasta ahora las medidas de centralización o posición y las medidas de
dispersión y, por tanto, tenemos una idea de la «forma» que tiene la distribución
objeto de nuestro estudio. Ahora bien, es necesario definir otra serie de medidas

23
tema 60

matemáticas

que permitan cuantificar la forma de la distribución en dos sentidos: la mayor o


menor simetría y la concentración más o menos acusada de los valores centrales
de la distribución en torno a las medidas de posición central que ya conocemos.

XX El índice de simetría de Pearson

Recordemos que en distribuciones unimodales y moderadamente acampanadas la


mediana estaba siempre entre la moda y la media aritmética y si no era simétrica,
u u
se verificaba que M0 ≤ M ≤ x o bien x ≤ M ≤ M0.
Pearson define su índice de simetría:
x − M0
f1 =
σ
Según esto:

24
tema 60

matemáticas

Hay otros que son incluso más generales como el de Fisher que vale:
k

∑ ( x − x)
1
⋅ i
3
⋅ ni
N
g1 = i =1
σ3
Análogamente a como ocurría con el de Pearson:
Si g1 = 0, distribución simétrica
Si g1 > 0, asimetría a la derecha
Si g1 < 0, asimetría a la izquierda

XX Coeficiente de curtosis

Tiene el valor:
k

∑ ( x − x)
1
⋅ i
4
⋅ ni
N
g2 = i =1
−3
σ4
Si g2 = 0, tenemos una distribución mesocúrtica o asimilable a la distribución
normal de Gauss.

Si g2 > 0, tenemos una distribución leptocúrtica, más puntiaguda que la distribu-


ción normal de Gauss.

25
tema 60

matemáticas

Y si g2 < 0, la distribución se llama platicúrtica y es mas aplanada que la distribu-


ción normal de Gauss.

26
tema 60

matemáticas

BIBLIOGRAFÍA
CALOT, G.: Curso básico de estadística descriptiva. Ed. Paraninfo.
FIDALGO RODRÍGUEZ, M.: Parámetros Estadísticos. Autor Editor.
G. BARBANCHO, A.: Estadística Elemental Moderna. Editorial Ariel.
GLASS, G.; STANLEY, G.: Métodos estadísticos aplicados a las Ciencias Sociales. Prentice Hall.
RIOS, S.: Métodos estadísticos. Ed. del Castillo.

27
tema 60

matemáticas

RESUMEN

Parámetros estadísticos.
Cálculo, significado y propiedades.

1.
1 Parámetros estadísticos
En un estudio estadístico es preciso utilizar valores numéricos o medidas que describan de
forma objetiva los datos recogidos. Estas medidas son los parámetros estadísticos.

1.1. Conceptos generales


Se definen los conceptos más importantes como población, muestra, carácter y tipos de
caracteres, variables estadísticas discretas y continuas.

1.2. Parámetros estadísticos


Con el fin de obtener un resumen cuantitativo se sustituye el conjunto de valores por
números llamados parámetros estadísticos o medidas descriptivas de los datos, que se
clasifican en diversos tipos:
„„ Medidas de posición o centralización.
„„ Medidas de dispersión.
„„ Medidas de asimetría y curtosis.

2.
2 Cálculo, significado y propiedades

2.1. Medidas de centralización


Las medidas de posición o centralización son valores que están medidos en las mismas
unidades que las observaciones y que nos indican cómo se agrupan los datos observados.
Se clasifican en medidas de posición no central (cuartiles, deciles y percentiles) y medi-
das de posición central (medias, mediana y moda).

2.1.1. Media aritmética de una variable


Se estudian los casos discreto y continuo y sus propiedades. Debido a que en ocasiones
presenta ciertos inconvenientes se define la media ponderada en función del grado de
importancia de los datos registrados. Su empleo más habitual es en distribuciones de na-
turaleza aditiva.

2.1.2. Media geométrica


Se define en este punto el concepto media geométrica que se emplea en distribuciones de
tipo multiplicativo como números índices, porcentajes, tasas, etc.

29
tema 60

matemáticas

2.1.3. Media armónica


Se define este tipo de media que se aplica por ejemplo para fijar el precio justo de una
transacción.

2.1.4. Relación entre las distintas medias


Se establece en este punto que:
H≤G≤x

2.1.5. Mediana
Se define el concepto de mediana y cómo se calcula en los casos discreto y continuo.

2.1.6. Moda
Se define el concepto de moda y cómo se calcula en los casos discreto y continuo.

2.1.7. Percentiles

2.1.8. Relación entre media, mediana y moda

2.2. Medidas de dispersión


Tienen por objeto dar una idea de la mayor o menor concentración de los valores de una
distribución alrededor de los valores centrales. Se definen:

2.2.1. Recorrido

2.2.2. Desviaciones
Se define el concepto de desviación y el de desviación media.

2.2.3. Varianza y desviación típica


Se definen ambos conceptos y cómo se calculan en los casos discreto y continuo. Además
se estudian sus propiedades.

2.3. Momentos
La media y la varianza son un caso particular de unos parámetros llamados momentos. Se
distinguen entre momentos centrales y momentos respecto al origen.

2.4. Medidas de asimetría y curtosis


Se definen una serie de medidas que permiten cuantificar la forma de la distribución en
dos sentidos: la mayor o menor simetría y la concentración más o menos acusada de los
valores centrales de la distribución en torno a las medidas de posición central.

30

Potrebbero piacerti anche