Sei sulla pagina 1di 65

ESTADISTICA DESCRIPTIVA

RESUMEN PREPARADO POR:


ALEJANDRINA DE BOUTAUD MONTERO

MEDIDAS DE RESUMEN
Parmetros y estadsticos
Parmetro: Es una cantidad numrica
calculada sobre una poblacin.
La altura media de los individuos de un
pas.
La idea es resumir toda la informacin
que hay en la poblacin en unos pocos
nmeros (parmetros).
Estadstico: dem (cambiar poblacin por muestra).
La altura media de los que estamos en este aula.
Somos una muestra (representativa?) de la poblacin.
Si un estadstico se usa para aproximar un parmetro tambin
se le suele llamar estimador.
MEDIDAS DE RESUMEN

Entre las medidas que permiten
resumir informacin proveniente de
una poblacin, podemos considerar
las medidas de posicin, medidas de
dispersin y medidas de forma.

Posicin
Dividen un conjunto ordenado de datos en grupos con la
misma cantidad de individuos.
Cuantiles, percentiles, cuartiles, deciles,...
Centralizacin
Indican valores con respecto a los que los datos parecen
agruparse.
Media, mediana y moda
Dispersin
Indican la mayor o menor concentracin de los datos con
respecto a las medidas de centralizacin.
Desviacin tpica, coeficiente de variacin, rango, varianza
Forma
Asimetra
Apuntamiento o curtosis
Estadsticos
MEDIDAS DE POSICIN
Tienen por objeto, obtener un valor que resuma
en s todas las mediciones. La mayora de ellas
trata de ubicar el centro de la distribucin,
razn por la cual, se llaman MEDIDAS DE
TENDENCIA CENTRAL; estas son: Media,
Mediana y Moda.

MEDIDAS DE TENDENCIA CENTRAL
Media Aritmtica, Media o Promedio:
Es una de las medidas de tendencia central de mayor
uso. La media muestral se simboliza por y la
media poblacional de denota por .
X
CARACTERSTICAS DE LA MEDIA ARITMTICA
Calculada para datos en escala de Intervalo y
Razn
nica para un conjunto dado de datos
Centro de gravedad de los datos
Sensible a todos los valores del conjunto de
datos, sobre todo a los valores extremos
La suma de desvos de los datos con respecto a la
media es 0
til para comparar poblaciones
No se puede calcular con clases abiertas
MEDIA PARA DATOS NO TABULADOS- NO
AGRUPADOS
Sea X una variable cuantitativa y x
1
, x
2
,, x
n
una muestra
de tamao "n" de valores de la variable, se define la media
aritmtica de X como:
n
x x x x
X
n
+ + + +
=
.....
3 2 1
Esta expresin se puede escribir tambin , como:
n
x
X
n
i
i
=
=
1
a. Media para datos no agrupados.
Ejemplo N1
Consideremos la edad en aos de ocho personas
10 18 25 32 12 5 7 7
En este ejemplo el promedio , media o media aritmtica
de la edad de estas personas est dada por:
8
7 7 5 12 32 25 18 10 + + + + + + +
= x
Es decir la edad promedio de estas personas es de
14,5 aos.
MEDIA PARA DATOS NO TABULADOS- NO
AGRUPADOS
EJEMPLO No.2: MEDIA PARA DATOS
NO TABULADOS- NO AGRUPADOS
Cuadro N.: Datos obtenidos en encuesta sobre los ingresos
anuales de una comunidad X-marzo 2005

INGRESOS ANUALES
1000 1110 1010 1070 1030 1000
1150 990 1090 1080 1150 1200
1050 1030 1120 1050 1030 1150
1230 1170 1180 1110 1160 1100
1100 1060 1130 1105 935 1210


X


= 1,000+1,150+1,050++1,100+1210 ==1,093.30 balboas
30

CALCULO DE LA MEDIA PARA DATOS
AGRUPADOS
b.) Clculo de la Media para los datos
Agrupados
En el caso de los datos agrupados en una
distribucin de frecuencias la media aritmtica
se obtiene al multiplicar los puntos medios o
marcas de clase de cada intervalo por sus
respectivas frecuencias.
Se tiene entonces

X= (X1f1+ X2f2+...Xnfn)/(f1+f2++fn)=
S Xi fi/ S fi
donde Xi es la marca de clase para cada
intervalo y fi es la frecuencia de clase
CALCULO DE LA MEDIA PARA DATOS
AGRUPADOS
Intervalo de
Clase
Punto medio o
Marca de Clase
Frecuencia
930 - 980
980 - 1030
1030 1080
1080 1130
1130 1180
1180 - 1230
955
1005
1055
1105
1155
1205
1
7
5
8
6
3
30


= (955(1)+1005(7)+1055(5)+1105(8)+1155(6)+1205(3))
(1+7+5+8+6+3)

= 32650/30 = 1,088.3 balboas

X

X
Resultado del ejercicio
La media aritmtica o promedio de los ingresos es 1,088.3
balboas que es el valor representativo de todos los datos.
Es el cociente entre la suma de los valores de la variable, y el
tamao de la poblacin o de la muestra (nmero de observaciones)
Media Aritmtica o Esperanza de x

1
N
i
i
x
N

=
=

n
i
i
x
x
n
=

1
k
i
i
i
x f
N

-
=
=

1 1
1
k k
i i
i i
i i
k
i
i
x f x f
x
n
f
- -
= =
=
= =

POBLACIN
MUESTRA
AGRUPAR
DATOS SIN
DATOS
AGRUPADOS
Sea X una variable por lo menos ordinal y sea x
1
,
x
2
,x
n
una muestra de tamao n de observaciones de
la variable, se define como Mediana "Me" un valor tal
que supera a no ms del 50% de las observaciones y
es superado por no ms del 50% de las observaciones,
cuando estas han sido ordenadas segn magnitud.
MEDIDAS DE TENDENCIA CENTRAL:
Mediana (Me)

MEDIANA (Me)
Para un conjunto de datos ORDENADOS de mayor a
menor, la mitad de los valores sern menores o iguales a
la MEDIANA mientras que la mitad restante ser
mayor o igual a la MEDIANA
X mn X mx
Me
50% 50%
La mediana divide una distribucin de
frecuencia en 2 mitades

Se puede calcular con clases con extremos abiertos

CARACTERSTICAS DE LA MEDIANA
Calculada para datos en escala Ordinal, Intervalo y
Proporcin (razn)
nica para un conjunto dado de datos
Fcil de determinar en datos no agrupados
No es influenciada por valores extremos
1, 2, 4, 5, 6, 6, 800.
La media es 117,7
La mediana es 5
MEDIANA PARA DATOS NO
TABULADOS-NO AGRUPADOS
impar es n si x Me
par es n si
x x
Me
n
n n
2
1
1
2 2
2
+
+
=
+
=
a)Datos no agrupados
Consideremos el ejemplo anterior, con la edad en
aos de ocho personas
10 18 25 32 12 5 7 7
Para calcular la mediana , previamente se deben ordenar las
observaciones. En este caso lo haremos en forma creciente:
EJEMPLO DEL CALCULO DE LA MEDIANA
PARA DATOS NO TABULADOS-NO AGRUPADOS
5 7 7 10 12 18 25 32
Como el tamao de la muestra es n=8 , un nmero
par , l a mediana es:
2
12 10
2
2
5 4
1
2
8
2
8
+
=
+
=
+
=
+
x x
Me
x x
Me
La mediana es 11 aos, lo cual significa que el 50% de
estas personas tiene entre 5 y 11 aos y el 50% restante
tiene entre 11y 32 aos.
EJEMPLO DEL CALCULO DE LA MEDIANA
PARA DATOS NO TABULADOS-NO AGRUPADOS
Consideremos el peso en kilogramos de una muestra de
11 personas
65 76 48 48 68 78 90 87 67 72 78
Recordemos que para calcular la mediana debemos ordenar los
datos:
48 48 65 67 68 72 76 78 78 87 90
El tamao de la muestra es n=11, impar por lo tanto la mediana
se determina como:
EJEMPLO No2: CALCULO DE LA MEDIANA
PARA DATOS NO TABULADOS-NO AGRUPADOS
6
2
2
1
1 11
x x x Me
n
= = =
+
+
Me=72 kilos, lo cual significa que el 50% de estas
personas pesa entre 48 y 72 kilos y el 50% restante
pesa entre 72 y 90 kilos.
EJEMPLO No3: CALCULO DE LA MEDIANA
PARA DATOS NO TABULADOS-NO
AGRUPADOS
1. Se ordenan los datos en forma creciente:


INGRESOS ANUALES
935 1030 1060 1100 1130 1170
990 1030 1070 1105 1150 1180
1000 1030 1180 1110 1150 1200
1000 1050 1190 1110 1150 1210
1010 1050 1100 1120 1160 1230
2. Ya ordenados, con el nmero de datos es par, la mediana .
Mediana =
Mediana =

X
15
+ X
16
= 1,100+1,100 = 1,100 balboas
2 2
X
n/2
+ X
(n/2) +1
=

X
30/2
+ X
(30/2) +1
= X
15
+ X
16

2 2 2
INTERPRETACION: EL 50% DE LA FAMILIAS TIENEN INGRESOS
ENTRE B/.935 y B/.1,100 Y EL OTRO 50% ENTRE B/.1,100 y
B/.1,230
MEDIANA PARA DATOS AGRUPADOS
En el caso de los datos agrupados, se debe
obtener primero la clase mediana. Esta se define
como la clase mas baja para la cual la frecuencia
acumulada sea igual o exceda inmediatamente a la
sumatoria de todas las frecuencias entre dos, para
ubicar el centro de la distribucin.
Es decir, fi/2 n/2
O sea, el primer intervalo que se encuentre bajo la
condicin anterior ser identificado como la clase
mediana.
MEDIANA PARA DATOS AGRUPADOS
CLASE MEDIANA
Intervalo de
Clase
Punto medio
o Marca de
Clase
Frecuencia Frecuencia
acumulada
930 - 980
980 - 1030
1030 1080
1080 1130
1130 1180
1180 - 1230
955
1005
1055
1105
1155
1205
1
7
5
8
6
3
1
8
13
21
27
30
30
En nuestro ejemplo fi/2 30/2 15
O sea, el primer intervalo que se encuentre bajo la condicin
anterior ser identificado como la clase mediana.
La frecuencia ms inmediata que cumple la condicin sealada es la
frecuencia acumulada es 21 que esta en la clase cuarta (1080-1130).
Identificada esta clase, la siguiente ecuacin servir para hallar el valor
de la mediana.

Mediana= Lm + ((n/2 fL )/ fm) * T, en donde
Lm = lmite real inferior de la clase mediana
n = total de frecuencias
fL = suma de frecuencias de todas las clases por debajo de la clase
mediana. Columna de frecuencia acumulada
fm = frecuencia simple en la clase mediana
T = tamao del intervalo de clase
El trmino entre parntesis circular, se define como el ajuste por el
sesgo presentado en la distribucin, conocido como factor de
correccin.
Lm = 1080
n = 30
fL = 13
fm = 8
T = 50
MEDIANA PARA DATOS AGRUPADOS
MEDIANA PARA DATOS AGRUPADOS
Mediana= Lm + ((n/2 fL )/ fm) * T,
Mediana= 1080 + ((30/2 13 )/ 8) * 50
Mediana= 1080 + (15 13 )/ 8) * 50
Mediana= 1080 + (.25) * 50=1080+12.50=1,092.50


Interpretacin:
Un 50% de las familias encuestadas ganan entre B/. 930 y
B/1,092.00 y la otra mitad de las familias encuestadas ganan
entre B/1,092.00 y B/ 1,230.
Clases Xi f F fr Fr
330-345 337 3 3 0,09 0,09
345-360 352 3 6 0,09 0,18
360-375 367 4 10 0,11 0,29
375-390 382 12 22 0,34 0,63
390-405 397 7 29 0,20 0,83
405-420 412 4 33 0,11 0,94
420-435 427 2 35 0,06 1,00
TOTAL 35 1,00
Clases Xi f F fr Fr
330-345 337 3 3 0,09 0,09
345-360 352 3 6 0,09 0,18
360-375 367 4 10 0,11 0,29
375-390 382 12 22 0,34 0,63
390-405 397 7 29 0,20 0,83
405-420 412 4 33 0,11 0,94
420-435 427 2 35 0,06 1,00
TOTAL 35 1,00
EJEMPLO 2-CALCULO de la MEDIANA para datos agrupados
1) Determinar la posicin 18 5 . 0 ) 1 35 ( = +
2) clase que contiene la Mediana 375 = Li
3) Realizar la interpolacin para hallar el
valor de la MEDIANA
5 . 382 5 . 7 375 15
12
10
2
35
375 = + =

+ = Mediana
Extensin del intervalo T = 390-375
( ) T
fm
f
n
Li Mediana
l
*
2

+ = Distribucin de frecuencias relativas acumuladas


de los pesos de novillos. FV. 2002
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
330 345 360 375 390 405 420 435
Marcas de Clase Kg
F
r
EJEMPLO - Mtodo grafico para hallar la Mediana
Distribucin de frecuencias relativas acumuladas
de los pesos de novillos. FV. 2002
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
330 345 360 375 390 405 420 435
Marcas de Clase Kg
F
r
Mn (P50)
CALCULO de la MEDIANA
1) Ordenar los valores de menor a
mayor
Determinar la posicin i
Hallar el valor de x en la
posicin i
DATOS
SIN AGRUPAR:
DATOS
AGRUPADOS:
1) Determinar la posicin (igual que para datos sin agrupar)
3) Realizar la interpolacin
para hallar el valor de la Mn
2) Determinar la clase que contiene la Mediana
( ) T
fm
f
n
Li Mediana
l
*
2

+ =
MEDIDAS DE TENDENCIA CENTRAL
Moda (Mo)-Datos no agrupados
Como su nombre lo indica es aquel valor de la variable
que tiene una mayor frecuencia.
Si consideramos el ejemplo N2 del peso de una muestra de
personas:
65 76 48 48 68 78 90 87 67 72 78
Mo = 48 kilos
Mo = 78 kilos.
Esto significa que la mayora de estas personas pesa 48 kilos y 78
kilos.
Esta distribucin es bimodal. En nuestro caso diremos que no hay
moda por no haber un solo valor que represente la distribucin.
CARACTERSTICAS DE LA MODA

til para medidas nominales y ordinales
No se afecta por valores extremos
Se puede utilizar con clases abiertas
Puede no existir o no ser nica
Moda (Mo)-Datos agrupados

Datos agrupados
La moda estar representada por la clase que posee la
ms alta frecuencia, denominndose clase modal. La
moda ser entonces aquel valor del intervalo que posea
la mayor cantidad de frecuencias. El calculo de la moda
se obtiene con la siguiente expresin:

Moda = Li + (d1 / d1+d2) *T
Li = Lmite inferior de la clase modal
d1 = Frecuencia absoluta de la clase modal menos
la frecuencia absoluta de la clase inmediatamente
anterior.
d2 = Frecuencia absoluta de la clase modal menos
la frecuencia absoluta de la clase inmediatamente
posterior.
T= Tamao del Intervalo de clase
Moda (Mo)-Datos agrupados
Intervalo de
Clase
Punto medio o
Marca de Clase
Frecuencia Frecuencia
acumulada
930 - 980
980 - 1030
1030 1080
1080 1130
1130 1180
1180 - 1230
955
1005
1055
1105
1155
1205
1
7
5
8
6
3
1
8
13
21
27
30
30
L
i =
1080
d
1
= 8-5=3
d
2
= 8-6=2
T= 50
Moda = L
i
+ (d
1
/ d
1
+d
2
) *T= 1080+ (3/(3+2))*50
= 1080+ (3/5)*50
= 1080+30= B/1,110.00

Este valor se interpreta como el ingreso familiar con mayor frecuencia, o bien
que la mayora de las familias poseen ingresos cercanos a B/.1,100.00.
CLASE MODAL
Extensin del intervalo T = 390-375
23 . 384 23 . 9 375 15
5 8
8
375 = + =
+
+ = Mo
Clases Xi f F fr Fr
330-345 337 3 3 0,09 0,09
345-360 352 3 6 0,09 0,18
360-375 367 4 10 0,11 0,29
375-390 382 12 22 0,34 0,63
390-405 397 7 29 0,20 0,83
405-420 412 4 33 0,11 0,94
420-435 427 2 35 0,06 1,00
TOTAL 35 1,00
Clases Xi f F fr Fr
330-345 337 3 3 0,09 0,09
345-360 352 3 6 0,09 0,18
360-375 367 4 10 0,11 0,29
375-390 382 12 22 0,34 0,63
390-405 397 7 29 0,20 0,83
405-420 412 4 33 0,11 0,94
420-435 427 2 35 0,06 1,00
TOTAL 35 1,00
EJEMPLO 2-CALCULO de la MODA para datos agrupados
1) Determinar la clase que contiene la Moda
2) Realizar la interpolacin para hallar
el valor de la Mo
375 = Li
( ) T
d d
d
Li Mo *
2 1
1
+
+ =
d
1
= 12 4 = 8 d
2
= 12 7 = 5
d
1

d
2


d1
d2
x
T
Li
Limite inferior de la clase modal
Diferencia entre
la frecuencia de
la clase modal y
la clase anterior
Diferencia entre
la frecuencia de
la clase modal y
la clase
siguiente
Extensin del intervalo
Mo
forma grfica de
determinar la moda
MEDIDAS DE
DISPERSIN
ABSOLUTAS
RELATIVAS
RECORRIDO (RANGO)
VARIANZA
DESVIACIN ESTNDAR
COEFICIENTE DE VARIACIN
MEDIDAS DE DISPERSIN


MEDIDAS DE DISPERSIN

Un rasgo principal de los datos es su
dispersin o amplitud, que se refiere a su
variabilidad, a la evaluacin de cun
separados o extendidos estn estos datos o
bien cuanto difieren unos de otros.
Variacin: es el grado en que los datos
numricos tienden a extenderse al rededor
de un valor, generalmente el valor medio
MEDIDAS DE DISPERSIN
Por qu es importante la variacin?

1. Al menudo una medida de posicin de un conjunto de datos se
vincula con la indicacin de cun tpico o representativo es
para la poblacin y para ello es necesario contar con la
informacin que proporcionan las medidas de variacin. Solo el
conocimiento de un estadstico de tendencia central no aclara
o define toda la distribucin, adems que no existe un valor de
tendencia central ideal, por lo que es significativo tener una
idea de la dispersin de los valores y determinar si es mucha o
poca al rededor de la media, pues si la variacin es muy
grande entonces esta medida de tendencia central no es
buena seleccin como valor tpico.
2. La medida de tendencia central no indica la relacin de un dato
con los otros, es necesario para ello las medidas de
variabilidad o dispersin.
3. Al tratar problemas con datos dispersos se requiere conocer que
problemas puede esto traer, hasta que punto la dispersin
tiene un riesgo aceptable o inaceptable en la toma de
decisiones.
MEDIDAS DE DISPERSIN
RANGO

Mide la dispersin de la totalidad de los datos. Es la
ms obvia de las medidas ya que es la distancia
entre los valores mximo y mnimo.
El rango o recorrido da alguna idea del grado de
variacin que ocurre en la poblacin, pero con
frecuencia los resultados pueden ser engaosos,
pues este depende de los valores extremos e
ignora la variacin de las dems observaciones.
Est afectado por ocurrencias raras o
extraordinarias.
Rango = X mxima- X mnima= 1230-935=295
MEDIDAS DE DISPERSIN
Desviacin Absoluta Media El es promedio de las
desviaciones absolutas de los datos respecto a la
media. sta medida se obtiene calculando la media
aritmtica de la muestra, y luego realizando la
sumatoria de las diferencias de todos los valores
con respecto de la media. Luego se divide por el
nmero de observaciones. Una medida como sta
tiene la ventaja de que utiliza cada observacin y
corrige la variacin en el nmero de observaciones
al hacer la divisin final. Y por ltimo tambin se
expresa en las mismas unidades que las
observaciones mismas

MEDIDAS DE DISPERSIN
Varianza
Otro tratamiento para evadir la suma cero de las
desviaciones de las observaciones respecto a su
Media Aritmtica, consiste en recurrir al proceso de
elevar al cuadrado estas desviaciones y sumar los
cuadrados, dividiendo la suma por el nmero de
casos, a esta cantidad se le denomina varianza, y es
la ms importante de las medidas de variacin porque
tiene la ventaja de no prescindir de los signos de las
desviaciones, pero al igual que la desviacin media los
valores extremos pueden distorsionarla
MEDIDAS DE DISPERSIN
VARIANZA
Frmula para poblacin datos no agrupados
o
2
= E
2
/ N
Frmula para poblacin datos agrupados

o
2
= E f
i
(X
i
-X )
2
/ E fi

Frmula para muestra datos no agrupados con n > 30

S
2
= E ( X
i
--X)
2
/ ( n)
Frmula para muestra datos agrupados con n > 30

S
2
= E fi ( X
i
--X )
2
/ (E f
i
)
Frmula para muestra datos no agrupados con n < 30
S
2
* = E ( X
i
--X)
2
/ ( n-1)
Frmula para muestra datos agrupados con n < 30
S
2
*= E fi ( X
i
-X )
2
/ (E fi -1)

MEDIDAS DE DISPERSIN
Desviacin Estndar
Es la raz cuadrada de la varianza
representando se con la letra S y se
define como la raz de la sumatoria
(E) de las desviaciones cuadradas
entre el nmero total de datos de la
muestra menos uno. Tiene las
mismas unidades que los datos de la
muestra estadstica
Varianza S
2
(Variance): Mide el promedio de las
desviaciones (al cuadrado) de las observaciones con
respecto a la media.





Es sensible a valores extremos (alejados de la media).

Sus unidades son el cuadrado de las de la variable.

Desviacin tpica (standard deviation)
Es la raz cuadrada de la varianza. Tiene las misma
dimensionalidad (unidades) que la variable.

=
i
i
x x
n
S
2 2
) (
1
2
S S =
MEDIDAS DE DISPERSIN-
DESVIACIN ESTANDAR
Frmula para muestra datos no agrupados con n > 30

S
2
=? E (X
i
- X)
2
/ ( n)

Frmula para muestra datos agrupados con n > 30

S
2
=? E fi (X
i
--X )
2
/ (E f
i
)

Una muestra es considerada pequea si n<30. En estos casos se ha comprobado
que la variabilidad de los datos ser mayor, por lo tanto debemos incluir un factor de
correccin en la desviacin estndar con la finalidad de tener un buen estimador

Frmula para muestra datos no agrupados con n < 30

S
2
* = ?E (X
i
-- X)
2
/ ( n-1)

Frmula para muestra datos agrupados con n < 30

S
2
*= ?E fi (X
i
-X )
2
/ (E fi -1)
Varianza

poblaci
n
muestra
AGRUPAR
DATOS SIN
DATOS
AGRUPADO
S
( )
1
2
2

=
n
x x f
s

( )
1
2
2

=
n
x x
s

( )
n
x

=
2
2

o
( )
n
x f

=
2
2

o

Coeficiente de variacin
Es la razn entre la desviacin tpica y la media.

Mide la desviacin tpica en forma de
qu tamao tiene con respecto a la media
Tambin se la denomina variabilidad relativa.
Es frecuente mostrarla en porcentajes
Si la media es 80 y la desviacin tpica 20 entonces
CV=20/80=0,25=25% (variabilidad relativa)

Es una cantidad adimensional. Interesante para
comparar la variabilidad de diferentes variables.
Si el peso tiene CV=30% y la altura tiene CV=10%, los
individuos presentan ms dispersin en peso que en altura.

No debe usarse cuando la variable presenta valores
negativos o donde el valor 0 sea una cantidad fijada
arbitrariamente
Por ejemplo 0C 0F
Los ingenieros electrnicos hablan de la razn
seal/ruido (su inverso).
x
S
CV =
MEDIDAS DE DISPERSIN
COEFICIENTE DE VARIABILIDAD
VALOR DEL
COEFICIENTE DE
VARIACIN
INTREPRETACIN DEL
COEFICIENTE
Igual a cero Variacin Nula
Mayor de 0 hasta 20 Variacin baja
Mayor de 20 hasta 60 Variacin moderada
Mayor de 60 hasta 90 Variacin alta
Mayor de 90 Variacin alta



Media= X= 1088,3
Intervalo
de Clase
Punto medio o
Marca de Clase
X
i
f
i
(X
i
- X ) (X
i
- X )
2
(X
i
- X )
2
*f
i
930- 980 955 1 -133,3 17768,89 17768,89
980-1030 1005 7 -83,3 6938,89 48572,23
1030-1080 1055 5 -33,3 1108,89 5544,45
1080-1130 1105 8 16,7 278,89 2231,12
1130-1180 1155 6 66,7 4448,89 26693,34
1180-1230 1205 3 116,7 13618,89 40856,67
30 -49,8 E= 141666,70
1,66 balboas
141666,70
30
DESVIACIN ESTNDAR

141666,70/30
DESVIACIN ESTNDAR=
6,31%
Interpretacin: En promedio existe una dispersin de 68,72 balboas con
respecto a la media
Interpretacin: 6,31% implica una variacin baja, por lo cual se traduce
a que la variable presenta una buena estabilidad en su comportamiento
COEFICIENTE DE VARIABILIDAD
68,72
1,088,30
S = E f
i
(X
i
-X )
2
/ E fi
68,72
68,72 balboias
Desviacin Absoluta Media
=
49,8
4722,22
4722,22 balboas
2
30 1,66
Desviacin Absoluta Media=
VARIANZA=
S
2
= E f
i
(X
i
-X )
2
/ E fi
VARIANZA
ESTADGRAFOS DE FORMA
MEDIDAS DE FORMA
MEDIDAS DE FORMA
MEDIDAS DE FORMA
Son aquellos nmeros resmenes, que indican la
morfologa de la distribucin de los datos, es decir de
la simetra y apuntamiento que tiene el histograma de
la variable en estudio. Slo se pueden calcular en
variables medidas en escala intervalar y de razn.
Son el:
SESGO (COEFICIENTE DE ASIMETRIA)
CURTOSIS
INTRODUCCIN
TIPOS DE DISTRIBUCIONES DE FRECUENCIA
MS COMUNES
Distribucin Simtrica
Distribucin simtrica
DISTRIBUCIN ASIMTRICA
DISTRIBUCIN ASIMTRICA
Ejemplo: Vamos a calcular el Coeficiente de Asimetra de Fisher
de la serie de datos referidos a la estatura de un grupo de
alumnos:

Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple
Acumulad
a
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
Recordemos que la media de esta muestra es 1,253
E((xi - x)^3)*ni E((xi - x)^2)*ni
0,000110 0,030467
Por lo tanto el
Coeficiente de
Fisher de Simetra
de esta muestra es
-0,1586, lo que
quiere decir que
presenta una
distribucin
asimtrica negativa
(se concentran ms
valores a la
izquierda de la
media que a su
derecha).
RELACIN ENTRE LA MEDIA, MEDIANA Y MODA
X = Me = Mo
Cuando una distribucin de frecuencia
es simtrica, la media, mediana y
moda coinciden en su valor ( X = Me
= Mo). En el caso de una distribucin
binomial simtrica, es necesario
calcular el promedio de las modas.
Mo < Me < X
En una distribucin
sesgada a la izquierda, la
moda es menor a la
mediana, y esta a su vez
menor que la media.
En una distribucin
sesgada a la derecha
la relacin se
invierte, la moda es
mayor a la mediana,
y esta a su vez
mayor que la media.
Mo > Me > X
COEFICIENTE DE ASIMETRA
Mide el grado de asimetra de la distribucin con
respecto a la media. Un valor positivo de este
indicador significa que la distribucin se encuentra
sesgada hacia la izquierda (orientacin positiva). Un
resultado negativo significa que la distribucin se
sesga a la derecha.
Ejemplo: Clculo del coeficiente de asimetra
Calcular el coeficiente de asimetra a partir de los siguientes datos
obtenidos de una muestra. Realizando el Polgono de Frecuencias.
CURTOSIS
Si los datos estn muy
concentrado hacia la
media, la distribucin es
leptocrtica (curtosis
mayor a 0).
Si los datos estn muy
dispersos, la distribucin
es platicrtica (curtosis
menor a 0).
El comportamiento normal
exige que la curtosis sea
igual a 0 (distribucin
mesocrtica).
Indica que tan apuntada o achatada se encuentra una distribucin
respecto a un comportamiento normal (distribucin normal).
Ejemplo: Vamos a calcular el Coeficiente de curtosis de la serie
de datos referidos a la estatura de un grupo de alumnos:

Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple
Acumulad
a
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
Recordemos que la media de esta muestra es 1,253
Por lo tanto, el
Coeficiente de
Curtosis de esta
muestra es -1,39, lo
que quiere decir que
se trata de una
distribucin
platicrtica, es decir,
con una reducida
concentracin
alrededor de los
valores centrales de la
distribucin E((xi - xm)^4)*ni E((xi - xm)^2)*ni
0,00004967 0,03046667
Clculo de la Curtosis
La frmula empleada para calcular la Curtosis se
muestra a continuacin (reemplace el valor de n por N
en caso de tratar con datos poblacionales):
Ejemplo: Clculo de la Curtosis
Calcular el coeficiente de asimetra a partir de los
siguientes datos obtenidos de una muestra. Realizar
el polgono de frecuencias.

Potrebbero piacerti anche