Sei sulla pagina 1di 29

Mdulo 3.

Medidas de Variabilidad
Objetivos. Al terminar este mdulo usted
conocer, obtendr e interpretar las
principales medidas de dispersin y de
forma.

A partir de un conjunto de datos dispuestos


en planilla electrnica, obtener estadgrafos
de variabilidad y de forma, tales como:

3-1
UDA
Medida de Variabilidad:
Recorrido o Rango (simple)
Recorrido intercuartlico
La varianza.
La desviacin estndar
Coeficiente de variacin

Medidas de forma
Sesgo
Curtosis

3-2
UDA
RECORDEMOS EL EJ. ILUSTRATIVO

Un comerciante, el casero, vende su ropa a


sectores rurales. Viaja con su bus a distintos
pueblos vendiendo ropa de adulto joven.

3-3
UDA
Tunca

x 24 aos

3-4
UDA
Con la misma lgica, conforme a los buenos
resultados de venta en el pueblo anterior,
decide aventurarse a otro pueblo.

3-5
UDA
Miraflores

x 24 aos

3-6
UDA
Que le ocurri al comerciante?

DISPERSIN. POCA HOMOGENEIDAD Y/O


MUCHA DISPERSION, RUIDO
VALORES MUY EXTREMOS
MINIMO Y MAXIMOS DISTINTOS
PROMEDIO NO ES VLIDO PARA DESCRIBIR
UNA MUESTRA Y TOMAR UNA DECISIN
ENTORNO A UNA PROBLEMTICA
ETC.

3-7
UDA
Habrn medidas que capturen o ayuden a
explicar la variabilidad de un fenmeno en
estudio?

Con aquellas medidas,


le proporcionaramos ms informacin al
"casero" para la toma de decisiones?

En que pueblo las edades son ms


homogneas?
3-8
UDA
Recorrido:
El recorrido de una variable en estudio, es la diferencia entre el
MAXIMO y el MINIMO:

Recorrido = X(n) - X(1)

promedio

TUNCA 18 19 19 21 23 23 25 25 26 27 28 29 29 24 aos

MIRAFLORES 9 10 11 12 13 14 15 24 35 38 39 43 49 24 aos

Para estos datos se tiene:


Recorrido (TUNCA) = 29 - 18 = 11
Recorrido (MIRAFLORES) = 49 - 9 = 40

3-9
UDA
3-10
UDA
3-11
UDA
Recorrido intercuartlico:
Se llama recorrido intercuartlico de una
variable en estudio, a la diferencia entre el
tercer cuartil (P ) y el primer cuartil (P ) :
75 25

Recorrido intercuartlico = Q(3) - Q(1)

3-12
UDA
3-13
UDA
Un grfico muy til e importante en la
estadstica descriptiva, que refleja la
variabilidad de los datos e integra el cuartil y
recorrido intercuartlico; es el llamado grfico
de Caja con Bigotes (Box plot)

3-14
UDA
Grfico. Paquete estadstico Stata versin 9.0

Distribucin de las edad


Pueblo de Tunca
Q3+1.5RIC
16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

Q3

Q2

Q1

Q1-1.5RIC

3-15
UDA
10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50

UDA
8

Tunca
Distribucin de las edades

miraflores

3-16
Varianza
previo:
Llamaremos desvo del i-simo dato respecto al
promedio a la expresin:

di X i X
Es decir la distancia dirigida entre un dato y el
promedio.

3-17
UDA
Llamaremos VARIANZA de la muestra a la
expresin:
n 2

d12 d 22 ... d n2
X
i 1
i X
Sx2 Var ( X )
n 1 n 1

La varianza slo se puede calcular para


variables medidas en escala intervalar o de
razn

3-18
UDA
Varianza poblacional:
n 2

X
i 1
i
2 Var ( X )
N

Esta expresin es un parmetro de variabilidad.

3-19
UDA
Desviacin estndar:
Llamamos DESVIACION ESTANDAR a la RAIZ
CUADRADA de la VARIANZA:

n 2

d d ... d
2 2 2 X i X
Sx 1 2 n
i 1
n 1 n 1

3-20
UDA
Cuando la distribucin de los datos se acerca
a una distribucin normal, la mayora de los
datos (alrededor del 67%) est contenido
entre:
EL PROMEDIO MENOS LA DESVIACION y EL
PROMEDIO MAS LA DESVIACION

3-21
UDA
3-22
UDA
Coeficiente de variacin:

Sx
C.V . 100%
X
Coeficiente de variacin Coeficiente de variacin
TUNCA MIRAFLORES

16.05 % 60.91 %

3-23
UDA
Estadgrafos de forma :
Son aquellos nmeros resmenes, que
indican la morfologa de la distribucin de los
datos, es decir de la simetra y apuntamiento
que tiene el histograma de la variable en
estudio. Slo se pueden calcular en variables
medidas en escala intervalar y de razn.

Se destacan: el sesgo y la curtosis

3-24
UDA
Sesgo: mide el grado de asimetra, respecto de la moda (el
mximo del perfil del histograma), que tienen los datos.

Sesgo = 0 Sesgo > 0 Sesgo < 0

3-25
UDA
Curtosis: mide el grado de apuntamiento que tienen los
datos

USANDO EXCEL:
K baja (<0) K normal (=0) K alta (>0)

Algunos paquetes estadsticos:


K baja (<3) K normal (=3) K alta (>3)

3-26
UDA
3-27
UDA
Prctica
Utilizando base banco.xls.

Obtngase estadgrafos para la variable


continua: Saldo en cuenta vista.

3-28
UDA
Prxima clase.

EJERCICIOS PRCTICOS. USO DE LA


COMPUTADORA.

3-29
UDA

Potrebbero piacerti anche