Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
CAP. 2
MEDIDAS DE TENDENCIA
MEDIDAS DE TENDENCIA CENTRAL
Una medida central es un ndice de localizacin central empleado en las descripcin de las distribuciones de
frecuencias. Tambin sirve como una base para medir y evaluar valores anormalmente altos o bajos (o valores
extremos)
Caractersticas
Debe estar definido en forma objetiva
Debe depender de toda la informacin obtenida en lo posible
Debe ser fcil de comprender (no debe tener un carcter abstracto) y de interpretar
Debe ser fcil de calcular
Debe ser estable (no debe ser sensible a fluctuaciones)
Debe ser adecuado a clculos algebraicos posteriores
Tipos de promedios
Los promedios ms usuales son:
Sea x1, x2,.,xn valores de la variable X. La media aritmtica simple de X representada por es dado por:
=1
= =
Sea x1, x2,.,xk valores de la variable X ponderados por sus respectivas frecuencias absolutas: fi,.fk. La
media de la variable x es dado por:
=1
= = = Donde: n==1
=1
Propiedades de la media aritmtica
1) La suma de las deviaciones o diferencias entre los valores de la variable X y su media aritmtica es
cero. (*)
2) Para un conjunto dado de observaciones, la media es nica.
3) La media es sensible (o afectada) por los valores del conjunto. As, si un valor se modifica, la media
aritmtica tambin se modifica
4) La suma de los cuadrados de las desviaciones entre los valores de la variable x y de su media aritmtica
es mnima. (*)
5) Si a los valores de una variable X se le suma o se le resta una constante C, entonces la media aritmtica
quedara aumentada o disminuida en la constante C (*).
Si fueran multiplicados o divididos los valores de una variable X por una constante C, entonces la media de
X, quedara multiplicada o dividida por esta constante (*)
Desventajas
- La media aritmtica no puede calcularse en las distribuciones que tienen intervalos de clases de extremos
abiertos en la primera y en la ltima clase, es decir, cuando los datos se han agrupado en intervalos de clase
menor que o mayor que.
1) Sea Ot (el origen del trabajo) el valor ms frecuente de la variable x, o que esta hacia el centro de la
distribucin de frecuencias y sea di= xi-Ot (para todo i= 1,2,,k) las desviaciones de xi respecto a Ot entonces
xi= di+Ot
=1
= Ot+
2) Este procedimiento es til cuando los valores de X son grandes y la amplitud de clase constante
C= amplitud del intervalo de clase
ui=
2 Calculo de la media :
xi = Ot + C ui
=1 )
= Ot+C (
Media Ponderada
Cuando se trabajan con varios grupos de datos, para sacar la media se debe tomar en cuenta el nmero de
observaciones de cada grupo (muestras estratificadas).
En la media ponderada se toma en cuenta el numero de observaciones en el clculo de cada promedio.
Sea 1, 2,., n las medias aritmticas de r subconjuntos menores, cada uno con valores n1, n2,.,n r
observaciones respectivamente. La media aritmtica del conjunto formado por los trminos de los r
subconjuntos es dad por la frmula:
1 1 + 2 2 + + =1
= =
1 + 2 + .
Donde:
=
=1
En general, si p1, p2,., pr, son los pesos asociados a los valores de la variable X=x1, x2,.,xr respectivamente,
entonces la media ponderada ser:
=1
=
=1
MEDIANA
La mediana es un valor que divide a un conjunto de observaciones ordenadas en forma ascendente o
descendente en dos grupos de igual nmero de observaciones.
+1
La mediana ser el valor de la variable que ocupa la posicin media (rango de orden )
2
ii) La variable de estudio es discreta y n (nmero de observaciones) es par, en este caso no existe en la
ordenacin un valor de la variable que ocupe la posicin central.
En este caso se utiliza una convencin que consiste en tomar como mediana de la ordenacin la media
aritmtica de los valores que ocupan las posiciones +1
2 2
++1
= 2 2
2
iii) La variable de estudio es continua, en este caso el problema esta en determinar un punto dentro del
intervalo en que est comprendida la mediana.
1 Paso: Calcular la posicin de orden Como la variable es continua no se debe preocupar si n en
2
par o impar.
2 Paso: Por las frecuencias acumuladas se identifica la clase que contiene a la mediana, esto es, la
clase para el cual se cumple:
F k-1 Fk
2
Con lo cual la mediana estar en la clase que tiene como frecuencia acumulada Fk
Utilizar la frmula:
3 Paso: Donde:
= Lmite inferior de la clase que contiene a la mediana
Fk1 n= Tamao de la muestra
= + 2 = Amplitud de la clase que contiene la mediana
Fk F k1
Fk= frecuencia acumulada de la clase que contiene la mediana
F k-1= frecuencia acumulada de la clase inmediatamente
anterior a la clase que contiene a la media
Propiedades de la Mediana
1) =1 =1 Para cualquier observacin de A del conjunto
En trminos de las frecuencias relativas ser:
2) La frmula
Fk1
= + 2
Fk F k1 1
Hk1
= + 2
Hk H k1
3) Como la mediana depende del nmero de valores observados, entonces esta afectado por las observaciones y
no por el tamao de los valores extremos.
4) La mediana es un valor muy adecuado cuando se utiliza para describir distribuciones cuyos valores centrales
estn muy prximos.
5) Algunas veces es un valor ms representativo de un conjunto de datos que otros promedios, gracias a su
independencia, a sus valores extremos
6) La mediana se puede calcular an cuando los intervalos de clase de la distribucin de frecuencias son de
lmites abiertos.
7) La mediana no es adecuado a manipulaciones algebraicas posteriores o sea, Zi = xi + yi, entonces no siempre
= +
Los cuartiles son valores que dividen a un con junto de datos ordenados en forma ascendente o descendente
en cuatro partes iguales.
0% 25% 50% 75% 100%
Q1 Q2 Q3 Q4
Q1: 1 cuartil, deja 25% de las observaciones menores o iguales a l y el 75% superiores a l.
Q3: 3 cuartil, deja 75% de las observaciones inferiores o iguales a l y el 25% de stas superiores a l.
Determinacin de Q1
2 Paso: Se identifica la clase que contiene F k-1 Fk
4
a Q1, por medio de las frecuencias
acumuladas, es decir, por la desigualdad 1
O cuando se Hk1
Fk1 1 = 1 + 4 1
3 Paso: Se aplica la formula: 1 = 1 + 4 1 usan Hk H k1
Fk F k1 frecuencias
relativas
acumuladas:
Donde:
1 = Lmite inferior de la clase que contiene a Q1
n= Tamao de la muestra
Fk= frecuencia acumulada de la clase que contiene al primer cuartil
F k-1= frecuencia acumulada de la clase inmediatamente anterior a la clase que contiene a Q1
1 = Amplitud de la clase que contiene Q1
Determinacin de Q3
Los deciles son valores que dividen a un conjunto de datos ordenados de forma ascendente o descendente en 10 partes
iguales
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
D1 D2 D3 D4 D5 D6 D7 D8 D9
Donde:
= Lmite inferior de la clase que contiene a Di, i: 1,2,,9
n= Tamao de la muestra
1 = Amplitud de la clase que contiene Di
Fk= frecuencia acumulada de la clase que contiene al i-simo decil
F k-1= frecuencia acumulada de la clase anterior a la clase que contiene a Di
Percentiles
Son valores que dividen la muestra ordenada en forma ascendente o descendente en 100 partes iguales
0% 1% 2% .. 50% 98% 99%100%
Dad una distribucin de frecuencias, la moda denotada con , es el valor de la variable que tiene mayor
frecuencia, esto es, es el valor mas frecuente de la distribucin.
Propiedades de la Moda
ii) La moda es una medida inestable porque varia si se cambia el intervalo de clase
Distribuciones simtricas:
Se dice que una distribucin de frecuencias es simtrica
cuan do valores de la variable equidistante de una valor
central tienen las mismas frecuencias. Es importante
destacar en este caso que:
= =
Para una distribucin sesgada hacia la izquierda (si
Para una distribucin sesgada hacia la derecha (si la cola la cola mayor se presenta a la izquierda de la curva)
mayor se presenta a la derecha de la curva) se tiene se tiene < <
> >
MEDIA GEOMETRICA
Sean x1, x2,.,xk valores de la variable X asociadas a las frecuencias absoluta f1, f2,.,fk respectivamente,
la media geomtrica de X esta dad por:
= G= 11 22
=
=1
log ++ log10
=1 log10
log10 = log10 = 1 10 1 =
=1 log10
log10 = G=Antilog =
Propiedades de la media Geomtrica
1) Si se define una variable Zi = Gz =
2) La media geomtrica esta basada en todas las observaciones, por lo que esta afectada por todos los
valores de la variable. Sin embargo, da menos peso a los valores extremadamente grandes que el que le
da la media aritmtica.
3) La media geomtrica es la medida que se debe utilizar cuando lo que se va a promediar son tasa de
cambio o proporciones.
6) La media geomtrica no puede determinarse cuando hay valores negativos entre los datos
7) La media geomtrica presenta el inconveniente de que si uno de los valores de la variable es igual a
cero, la media resulta igualmente cero
En demografa para estimar la poblacin de una determinada localidad en el ao tx, cuando se supone
crecimiento geomtrico entre dos censos, se usa la frmula:
Donde:
Po: Es la poblacin en el primer censo, realizado en
1
Px = ( )1 la fecha to
P1: es la poblacin en el segundo censo, realizado en
la fecha t1
Px: es la poblacin que se quiere determinar en la
fecha tx
1 1
Px = ( )2
Px es la media geomtrica de Po y P1
MEDIA ARMNICA
Sean x1, x2,.,xk valores de la variable X asociadas a las frecuencias absolutas f1, f2,.,fk
respectivamente, la media armnica de X esta dada por:
Donde: = =1
h = 12 =
+ ..
=1
1 2
Esta media, como la media geomtrica, solo es aplicable a ciertos tipos de problemas
Propiedades de la media armnica
1) La media armnica se basa en todas las observaciones, por lo que esta afectada por todos los valores de la
variable. Da a los valores extremadamente grandes un peso menor que el que las da la media geomtrica.
Mientras que a los valores pequeos les da un peso mucho valor que el que las da la media aritmtica,
como la media geomtrica
2) La media armnica es indeterminada si alguno de los valores de la variable es cero
3) La media armnica se presta a manipulaciones algebraicas posteriores
siempre que se trate de la misma serie y cuando los trminos no son iguales
4) H G ,
La media armnica es particularmente recomendable para series de valores que son inversamente
proporcionales, como por ejemplo para calcular la velocidad media, costo medio de bienes comprados con
una cantidad fija
MEDIA CUADRATICA
Sean x1, x2,.,xk valores de la variable X asociadas a las frecuencias absolutas f1, f2,.,fk respectivamente, la
media cuadrtica esta dada por:
= 112 +222 + 2
=
=1 11
2 Donde: = =1
c c
Las medidas de dispersin son los que cuantifican el grado de concentracin o de dispersin de los valores
de la variable en torno de un promedio o valor central de la distribucin, las medidas de dispersin se
necesitan para dos propsitos bsicos:
- Recorrido o rango
- Recorrido intercuartilico
- Recorrido semi- intercuartilico
- Desviacin media
- Varianza y Desviacin estndar
1) Recorrido o rango
R = X Max. X Min.
La utilizacin del rango como medida de dispersin es muy limitado, ya que solo toma en cuenta los valores
extremos descuidando los valores intermedios.
Puede ser que uno de los valores extremos este accidentalmente desplazado y no constituye, por lo tanto, un
valor representativo; en este caso el recorrido sera exagerado y la dispersin aparecera distorsionado.
2) Recorrido Intercuartilico
Como los cuartiles son tres puntos (valores) que dividen un ordenamiento de datos o una distribucin de
frecuencias en 4 grupos aproximadamente iguales, la medida esta dada por:
QI = Q3 Q1
Toma en cuenta el valor medio. Pero si bien toma ms valores que el rango, tambin depende de dos valores
de la variable, dejando de lado el resto, y en consecuencia la influencia de valores extremos puede, aunque
en menor medida, originar algn tipo de deformacin en cuanto al grado de dispersin.
Esta medida se basa en la posicin ocupada por los 50% de los valores centrales de la dispersin.
Esta dada por:
3 1
=
2
4) Desviacin Media
La desviacin media o desviacin promedio, es la media aritmtica de los valores absolutos de las
desviaciones de todos los valores en relacin a un punto central, tal como la media o la mediana.
Sean x1, x2,.,xk valores de la variable X con frecuencias absolutas f1, f2,.,fk respectivamente, la desviacin
media de X respecto a un promedio p es dado por:
=1
Donde: = =1
=
Con respecto a la media es:
=1 o
= =
=1
Con respecto a la mediana es:
=1 o =
=
=1
Como medida de dispersin, la desviacin media es superior al recorrido y la desviacin cuartlica, pues toma
en cuenta cada elemento y es ms simple y se ve menos afectada por la presencia de valores extremos. Por lo
tanto, se usa a menudo en muestras pequeas que incluyen valores extremos.
La principal deficiencia de la desviacin promedio surge del hecho de que promedia los valores absolutos de
las desviaciones , es decir, no reconoce el signo de las desviaciones.
Esto hace que sea menos conveniente que la desviacin estndar.
2
=1
V = 2 =
=1 o Var = 2
1
1
La varianza Poblacional se define en trminos de la media poblacional
2
=1
2 Donde: = =1
=
Esta ecuacin es la que normalmente se utiliza en estadstica, porque proporciona la mejor estimacin de la
varianza poblacional de la que se ha extrado la muestra.
Una frmula alternativa es la siguiente, ya que mide la dispersin de la muestra pero tiende a sobreestimar la
dispersin de la poblacin
2
2 =1
=
Si 2 = 0, se entiende que todos los valores de xi coinciden con la media , es decir, todas las observaciones
estn concentradas en un mismo punto, por lo que la dispersin es mnima (nula)
La desviacin estndar o tpica de los valores de una variable X se define como la raz cuadrada positiva de la
varianza.
=1
2
2 = + [] = +
1
El valor numrico de S cuantifica el grado de dispersin de los valores de una variable con respecto a su
media.
Mientras mayor es su dispersin de las observaciones, mayor es la magnitud de sus desviaciones respecto a la
media y por ende ms alto el valor numrico de la desviacin estndar.
Propiedades de la varianza y desviacin estndar
1) Var [x] = S2 0; la varianza de una variable siempre es positiva y es igual a cero cuando la variable X toma el
valor constante C., es decir, Var [c] = 0
1 1
2 = [1=1 2 2 ] S= [1=1 2 2 ]
1 1
2Mtodo abreviado
Sea Ot (origen de trabajo) el valor ms frecuente de la variable X o que esta hacia el centro de la distribucin de
frecuencias y sea:
di = xi - Ot i= 1,2,, k
1 1
2 = [1=1 2 2 ] S= [1=1 2 2 ]
1 1
3Mtodo abreviado
Este se aplica a datos agrupados en intervalos de clase de igual amplitud
1 Paso
Se efecta el cambio de variable de Xi a ui, utilizando la siguiente formula:
ui=
2 Paso
Se calcula la media aritmtica con la siguiente ecuacin:
=1
= Ot+C (
) = Ot+C
3 Paso
Se calcula la varianza S2, con la siguiente ecuacin:
2 1
2 = [1=1 2
2] S= [1=1 2]
2
1 1
MEDIDAS DE DISPERSIN RELATIVA
A veces es necesario compara dos conjuntos de datos expresados en unidades diferentes (tales como toneladas
de azcar con litros de kerossenene), en estos casos las medidas de dispersin absoluta no son comparables y
deben utilizarse medidas de dispersin relativa.
La medida relativa de dispersin, til para la comparacin en trminos relativos del grado de concentracin en
torno a la media de dos distribuciones distintas es dado por:
= =
Algunas veces se llama coeficiente de dispersin, porque coeficiente significa uan razn o un numero puro
independiente de la unidad de medicin. Generalmente el coeficiente de variacin se expresa como un
porcentaje.
En la practica, se acostumbra considerar que C.V. Superior a 50% indica alto grado de dispersin y,
consecuentemente pequea representabilidad de la media aritmtica. En cuanto que para valores
inferiores al 50% la media ser tanto mas representativa, cuanto menor sea el C.V.
MOMENTOS
Sean x1, x2,.,xk valores de la variable X con frecuencias absolutas f1, f2,.,fk respectivamente, el momento
de orden r respecto al parmetro C es dado por:
=1
Donde: = =1
() =
a) Momento respecto al origen
=1 Donde: = =1
=
b) Momento respecto a la media
En ele caso en que C= tenemos los momentos respecto a la media o momentos centrales
=1
= Donde: = =1
Algunos momentos son:
0 0
(1 )
= =1 = = 1
1 1
(1 )
1 = = 1 = = 0
2 2
(1 )
2 = = S2 2 = = S2
Siempre se pueden encontrar relaciones que liguen los momentos centrales con los momentos respecto al
origen. Para estos solo ser necesario utilizar el Binomio de Newton.
Medidas de asimetra
Cuando la curva de frecuencias esta inclinada Cuando la curva de frecuencias esta inclinada
hacia la derecha, se la denomina asimetra a la hacia la izquierda, se la denomina asimetra a la
derecha o positiva izquierda o negativa
Coeficientes de asimetra
Cuando disponemos de los valores de la media , moda, mediana, cuartiles y desviacin estndar debemos
utilizar:
i) COEFICIENTE DE PEARSON
3( )
= = =
Si As = 0, la distribucin es simtrica
Si As > 0, la distribucin es sesgada hacia la derecha
Si As < 0, la distribucin es sesgada hacia la izquierda
ii) COEFICIENTE DE PEARSON
Coeficientes de Curtosis
Se entiende por curtosis al grado de deformacin vertical (apuntamiento) de una distribucin de frecuencia, con
relacin al grado de apuntamiento (la cantidad de datos que se concentran en la parte central), podemos tener:
1
=1 2 Dado que K es 1