Sei sulla pagina 1di 81

ESTADISTICA DESCRIPTIVA

RESUMEN PREPARADO POR:


ALEJANDRINA DE BOUTAUD MONTERO

MEDIDAS DE RESUMEN
Adems de los mtodos tabulares
y grficos de resumir los datos,
tambin es til resumir los datos
con mtodos que conducen a
resultados numricos, llamados
medidas descriptivas.
MEDIDAS DE RESUMEN
Tipos de Medidas
Posicin: fijan el comportamiento global de la variable
Dispersin: separacin de las
observaciones entre s.
Forma: deformacin de la distribucin
respecto a un estndar.
Central: fijan el centro de gravedad
de la distribucin.
No central: medidas ms generales.
Asimetra: deformacin horizontal.
Apuntamiento o curtosis:
deformacin vertical.
MEDIDAS DE POSICION
CUANTILES ( Q , D, P )
DE TENDENCIA CENTRAL :MODA, MEDIANA , MEDIA


MEDIDAS DE DISPERSION:
RANGO
VARIANZA y DESVIACION TIPICA
COEFICIENTE DE VARIACION



MEDIDAS DE FORMA : COEFICIENTE DE ASIMETRIA
MEDIDAS DE APUNTAMIENTO : COEFICIENTE DE CURTOSIS

ESTADSTICOS
Caractersticas medibles de una
MUESTRA, usadas para estimar
parmetros poblacionales.
Representadas por letras latinas.
VARIABLE para la poblacin, fija para la
muestra dada.
MEDIDAS DE RESUMEN DE DATOS NUMERICOS
PARMETROS
Caractersticas medibles de una
POBLACIN.
Representadas por letras griegas.
VALOR FIJO para una poblacin dada.
P

o
2
m1

,

2
1
1

s
x
p
1 ,

m2

,

p
2 ,

2
2
2

s
x

MEDIA ARITMTICA

MEDIANA

MODA


Medidas de Localizacin
centro

Tienen por objeto, obtener un valor que resuma en s todas las
mediciones. La mayora de ellas trata de ubicar el centro de la
distribucin, razn por la cual, se llaman MEDIDAS DE
TENDENCIA CENTRAL;
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA CENTRAL
Media Aritmtica, Media o Promedio:
Es una de las medidas de tendencia central de mayor
uso. La media muestral se simboliza por y la
media poblacional de denota por .
CARACTERSTICAS DE LA MEDIA ARITMTICA
Calculada para datos en escala de Intervalo y
Razn
nica para un conjunto dado de datos
Centro de gravedad de los datos
Sensible a todos los valores del conjunto de
datos, sobre todo a los valores extremos
La suma de desvos de los datos con respecto a la
media es 0
til para comparar poblaciones
No se puede calcular con clases abiertas
MEDIA PARA DATOS NO TABULADOS- NO
AGRUPADOS
Sea X una variable cuantitativa y x
1
, x
2
,, x
n
una muestra
de tamao "n" de valores de la variable, se define la media
aritmtica de X como:
n
x x x x
x
n
+ + + +
=
.....
3 2 1
Esta expresin se puede escribir tambin , como:
n
x
x
n
i
i

=
=1
a. Media para datos no agrupados.
Ejemplo N1
Consideremos la edad en aos de ocho personas
10 18 25 32 12 5 7 7
En este ejemplo el promedio , media o media aritmtica
de la edad de estas personas est dada por:
8
7 7 5 12 32 25 18 10 + + + + + + +
= x
Es decir la edad promedio de estas personas es de
14,5 aos.
MEDIA PARA DATOS NO TABULADOS- NO
AGRUPADOS
EJEMPLO No.2: MEDIA PARA DATOS NO
TABULADOS- NO AGRUPADOS

INGRESOS ANUALES
1000 1110 1010 1070 1030 1000
1150 990 1090 1080 1150 1200
1050 1030 1120 1050 1030 1150
1230 1170 1180 1110 1160 1100
1100 1060 1130 1105 935 1210
Cuadro N1.: DATOS OBTENIDOS EN ENCUESTA SOBRE LOS
INGRESOS ANUALES DE UNA COMUNIDAD X-MARZO 2005




= 1,000+1,150+1,050++1,100+1210 ==1,093.30 balboas
30

CALCULO DE LA MEDIA PARA DATOS
AGRUPADOS
b.) Clculo de la Media para los datos Agrupados
En el caso de los datos agrupados en una distribucin
de frecuencias la media aritmtica se obtiene al
multiplicar los puntos medios o marcas de clase de cada
intervalo por sus respectivas frecuencias.
Se tiene entonces


1 1
1
k k
i i
i i
i i
k
i
i
x f x f
x
n
f
- -
= =
=
= =

Donde Xi es el punto
medio o marca de
clase
CALCULO DE LA MEDIA PARA DATOS
AGRUPADOS ENTABLAS DE INTERVALO

= (955(1)+1005(7)+1055(5)+1105(8)+1155(6)+1205(3))
(1+7+5+8+6+3)

= 32650/30 = 1,088.3 balboas

X

X
Resultado del
ejercicio
La media
aritmtica o
promedio de los
ingresos es
1,088.3 balboas
que es el valor
representativo de
todos los datos.
Intervalo de
clase
Punto
medio
Xi
fi

Xi*fi

930-980 955 1 955
980-1030 1005 7 7035
1030-1080 1055 5 5275
1080-1130 1105 8 8840
1130-1180 1155 6 6930
1180-1230 1205 3 3615
TOTAL 30 32650
DATOS AGRUPADOS EN TABLAS
Los datos se pueden presentar o agrupar en tablas sin
intervalos y en tablas con intervalos , en ambos casos
se usa la Media Aritmtica Pondera.
n
f X
k
1 i
i i

=
=
x
Tablas sin Intervalo
(Ejemplo)
N hijos
Xi
N de
familias
Fi
Xi*fi

0 1 0
1 5 5
2 7 14
3 7 21
4 1 4
TOTAL 21 44
095 . 2
21
44
n
f X
k
1 i
i i
= =

=
=
x
Hijos por
familia
Es el cociente entre la suma de los valores de la variable, y el
tamao de la poblacin o de la muestra (nmero de observaciones)
Media Aritmtica o Esperanza de x

1
N
i
i
x
N

=
=

n
i
i
x
x
n
=

1
k
i
i
i
x f
N

-
=
=

1 1
1
k k
i i
i i
i i
k
i
i
x f x f
x
n
f
- -
= =
=
= =

POBLACIN MUESTRA
AGRUPAR
DATOS SIN
DATOS
AGRUPADOS
Busca sealar un valor caracterstico de un conjunto de datos a travs
de un solo valor. Al ser afectada por los valores extremos su
representatividad se mide por el coeficiente de variacin
Sea X una variable por lo menos ordinal y sea x
1
,
x
2
,x
n
una muestra de tamao n de observaciones de
la variable, se define como Mediana "Me" un valor tal
que supera a no ms del 50% de las observaciones y
es superado por no ms del 50% de las observaciones,
cuando estas han sido ordenadas segn magnitud.
MEDIDAS DE TENDENCIA CENTRAL:
Mediana (Me)

MEDIANA (Me)
Para un conjunto de datos ORDENADOS de mayor a
menor, la mitad de los valores sern menores o iguales a
la MEDIANA mientras que la mitad restante ser
mayor o igual a la MEDIANA
X mn X mx
Me
50% 50%
La mediana divide una distribucin de
frecuencia en 2 mitades

Se puede calcular con clases con extremos abiertos

CARACTERSTICAS DE LA MEDIANA
Calculada para datos en escala Ordinal, Intervalo y
Proporcin (razn)
nica para un conjunto dado de datos
Fcil de determinar en datos no agrupados
No es influenciada por valores extremos
1, 2, 4, 5, 6, 6, 800.
La media es 117,7
La mediana es 5
MEDIANA PARA DATOS NO TABULADOS-NO
AGRUPADOS
impar es n si x Me
par es n si
x x
Me
n
n n
2
1
1
2 2
2
+
+
=
+
=
a)Datos no agrupados
Consideremos el ejemplo anterior, con la edad en
aos de ocho personas
10 18 25 32 12 5 7 7
Para calcular la mediana , previamente se deben ordenar las
observaciones. En este caso lo haremos en forma creciente:
EJEMPLO DEL CALCULO DE LA MEDIANA
PARA DATOS NO TABULADOS-NO AGRUPADOS
5 7 7 10 12 18 25 32
Como el tamao de la muestra es n=8 , un nmero
par , l a mediana es:
2
12 10
2
2
5 4
1
2
8
2
8
+
=
+
=
+
=
+
x x
Me
x x
Me
La mediana es 11 aos, lo cual significa que el 50% de
estas personas tiene entre 5 y 11 aos y el 50% restante
tiene entre 11y 32 aos.
EJEMPLO DEL CALCULO DE LA MEDIANA
PARA DATOS NO TABULADOS-NO AGRUPADOS
Consideremos el peso en kilogramos de una muestra de
11 personas
65 76 48 48 68 78 90 87 67 72 78
Recordemos que para calcular la mediana debemos ordenar los
datos:
48 48 65 67 68 72 76 78 78 87 90
El tamao de la muestra es n=11, impar por lo tanto la mediana
se determina como:
EJEMPLO No2: CALCULO DE LA MEDIANA
PARA DATOS NO TABULADOS-NO AGRUPADOS
6
2
2
1
1 11
x x x Me
n
= = =
+
+
Me=72 kilos, lo cual significa que el 50% de estas
personas pesa entre 48 y 72 kilos y el 50% restante
pesa entre 72 y 90 kilos.
EJEMPLO No3: CALCULO DE LA MEDIANA
PARA DATOS NO TABULADOS-NO AGRUPADOS
1. Se ordenan los datos en forma creciente:


INGRESOS ANUALES
935 1030 1060 1100 1130 1170
990 1030 1070 1105 1150 1180
1000 1030 1180 1110 1150 1200
1000 1050 1190 1110 1150 1210
1010 1050 1100 1120 1160 1230
X
n/2
+ X
(n/2) +1
=

X
30/2
+ X
(30/2) +1
= X
15
+ X
16

2 2 2
2. Ya ordenados, con el nmero de datos es par, la mediana .
Mediana =
Mediana =

X
15
+ X
16
= 1,100+1,100 = 1,100 balboas
2 2
INTERPRETACION: EL 50% DE LA FAMILIAS TIENEN INGRESOS
ENTRE B/.935 y B/.1,100 Y EL OTRO 50% ENTRE B/.1,100 y
B/.1,230
MEDIANA PARA DATOS AGRUPADOS
En el caso de los datos agrupados, se debe
obtener primero la clase mediana. Esta se define
como la clase mas baja para la cual la frecuencia
acumulada sea igual o exceda inmediatamente a la
sumatoria de todas las frecuencias entre dos, para
ubicar el centro de la distribucin.
Es decir, fi/2 n/2
O sea, el primer intervalo que se encuentre bajo la
condicin anterior ser identificado como la clase
mediana.
MEDIANA PARA DATOS AGRUPADOS
CLASE MEDIANA
Intervalo de
Clase
Punto medio
o Marca de
Clase
Frecuencia Frecuencia
acumulada
930 - 980
980 - 1030
1030 1080
1080 1130
1130 1180
1180 - 1230
955
1005
1055
1105
1155
1205
1
7
5
8
6
3
1
8
13
21
27
30
30
En nuestro ejemplo fi/2 30/2 15
O sea, el primer intervalo que se encuentre bajo la condicin
anterior ser identificado como la clase mediana.
La frecuencia ms inmediata que cumple la condicin sealada es la
frecuencia acumulada es 21 que esta en la clase cuarta (1080-1130).
Identificada esta clase, la siguiente ecuacin servir para hallar el valor
de la mediana.

Mediana= LI+ ((n/2 fa )/ fi) * T, en donde
LI = lmite real inferior de la clase mediana
n = total de frecuencias
fa = suma de frecuencias de todas las clases por debajo de la clase
mediana. Columna de frecuencia acumulada
fi= frecuencia simple en la clase mediana
T = tamao del intervalo de clase
El trmino entre parntesis circular, se define como el ajuste por el
sesgo presentado en la distribucin, conocido como factor de
correccin.
LI = 1080
n = 30
fL = 13
fi = 8
T = 50
MEDIANA PARA DATOS AGRUPADOS
MEDIANA PARA DATOS AGRUPADOS
Mediana= LI + ((n/2 fa )/ fi) * T,
Mediana= 1080 + ((30/2 13 )/ 8) * 50
Mediana= 1080 + (15 13 )/ 8) * 50
Mediana= 1080 + (.25) * 50=
1080+12.50=1,092.50


Interpretacin:
Un 50% de las familias encuestadas ganan entre B/. 930 y
B/1,092.00 y la otra mitad de las familias encuestadas ganan
entre B/1,092.00 y B/ 1,230.
Clases Xi f F fr Fr
330-345 337 3 3 0,09 0,09
345-360 352 3 6 0,09 0,18
360-375 367 4 10 0,11 0,29
375-390 382 12 22 0,34 0,63
390-405 397 7 29 0,20 0,83
405-420 412 4 33 0,11 0,94
420-435 427 2 35 0,06 1,00
TOTAL 35 1,00
Clases Xi f F fr Fr
330-345 337 3 3 0,09 0,09
345-360 352 3 6 0,09 0,18
360-375 367 4 10 0,11 0,29
375-390 382 12 22 0,34 0,63
390-405 397 7 29 0,20 0,83
405-420 412 4 33 0,11 0,94
420-435 427 2 35 0,06 1,00
TOTAL 35 1,00
EJEMPLO 2-CALCULO de la MEDIANA para datos agrupados
( ) T
f i
f a
n
LI Mediana *
2

+ =
1) Determinar la posicin 18 5 . 0 ) 1 35 ( = +
2) clase que contiene la Mediana 375 = LI
3) Realizar la interpolacin para hallar el
valor de la MEDIANA
5 . 382 5 . 7 375 15
12
10
2
35
375 = + =

+ = Mediana
Extensin del intervalo T = 390-375 Distribucin de frecuencias relativas acumuladas
de los pesos de novillos. FV. 2002
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
330 345 360 375 390 405 420 435
Marcas de Clase Kg
F
r
EJEMPLO - Mtodo grafico para hallar la Mediana
Distribucin de frecuencias relativas acumuladas
de los pesos de novillos. FV. 2002
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
330 345 360 375 390 405 420 435
Marcas de Clase Kg
F
r
Mn (P50)
CALCULO de la MEDIANA
( ) T
f i
f a
n
LI Mediana *
2

+ =
1) Ordenar los valores de menor a mayor
Determinar la posicin i
Hallar el valor de x en la posicin i
DATOS
SIN AGRUPAR:
DATOS
AGRUPADOS:
1) Determinar la posicin (igual que para datos sin agrupar)
3) Realizar la interpolacin para hallar el valor de la Mn
2) Determinar la clase que contiene la Mediana
impar es n si x Me
par es n si
x x
Me
n
n n
2
1
1
2 2
2
+
+
=
+
=
MODA
Se refiere al valor de la variable que ms se
repite en una distribucin de frecuencia, o el
valor que est representado por el mayor
nmero de observaciones
En un grfico de barra o histograma la moda
corresponde al valor en que la distribucin
alcanza el mximo
MEDIDAS DE TENDENCIA CENTRAL
Moda (Mo)-Datos no agrupados
Como su nombre lo indica es aquel valor de la variable
que tiene una mayor frecuencia.
Si consideramos el ejemplo N2 del peso de una muestra de
personas:
65 76 48 48 68 78 90 87 67 72 78
Mo = 48 kilos
Mo = 78 kilos.
Esto significa que la mayora de estas personas pesa 48 kilos y 78
kilos.
Esta distribucin es bimodal. En nuestro caso diremos que no hay
moda por no haber un solo valor que represente la distribucin.
CARACTERSTICAS DE LA MODA

til para medidas nominales y ordinales
No se afecta por valores extremos
Se puede utilizar con clases abiertas
Puede no existir o no ser nica
190 185 180 175 170 165 160 155 150
10
5
0
Altura (cm)
F
r
e
c
u
e
n
c
i
a

Si la distribucin es un histograma existe la
Intervalo (CLASE) MODAL
la MODA es la marca de clase del intervalo
que contiene la mayor frecuencia
Dependiendo del nmero de modas que tenga la
distribucin de frecuencias se hablar de una
distribucin ...
Un Mximo = Unimodal
Dos Mximos = Bimodal
Ms de 2 mximos = Multimodal
Moda (Mo)-Datos agrupados

Datos agrupados
La moda estar representada por la clase que posee la ms alta
frecuencia, denominndose clase modal. La moda ser entonces
aquel valor del intervalo que posea la mayor cantidad de
frecuencias. El calculo de la moda se obtiene con la siguiente
expresin:

Moda = LI + (d1 / d1+d2) *T
LI = Lmite inferior de la clase modal
d1 = Frecuencia absoluta de la clase modal menos la
frecuencia absoluta de la clase inmediatamente anterior.
d2 = Frecuencia absoluta de la clase modal menos la
frecuencia absoluta de la clase inmediatamente posterior.
T= Tamao del Intervalo de clase
Moda (Mo)-Datos agrupados
Intervalo de
Clase
Punto medio o
Marca de Clase
Frecuencia Frecuencia
acumulada
930 - 980
980 - 1030
1030 1080
1080 1130
1130 1180
1180 - 1230
955
1005
1055
1105
1155
1205
1
7
5
8
6
3
1
8
13
21
27
30
30
L
i =
1080
d
1
= 8-5=3
d
2
= 8-6=2
T= 50
Moda = L
i
+ (d
1
/ d
1
+d
2
) *T= 1080+ (3/(3+2))*50
= 1080+ (3/5)*50
= 1080+30= B/1,110.00

Este valor se interpreta como el ingreso familiar con mayor frecuencia, o bien
que la mayora de las familias poseen ingresos cercanos a B/.1,100.00.
CLASE MODAL
Extensin del intervalo T = 390-375
23 . 384 23 . 9 375 15
5 8
8
375 = + =
+
+ = Mo
Clases Xi f F fr Fr
330-345 337 3 3 0,09 0,09
345-360 352 3 6 0,09 0,18
360-375 367 4 10 0,11 0,29
375-390 382 12 22 0,34 0,63
390-405 397 7 29 0,20 0,83
405-420 412 4 33 0,11 0,94
420-435 427 2 35 0,06 1,00
TOTAL 35 1,00
Clases Xi f F fr Fr
330-345 337 3 3 0,09 0,09
345-360 352 3 6 0,09 0,18
360-375 367 4 10 0,11 0,29
375-390 382 12 22 0,34 0,63
390-405 397 7 29 0,20 0,83
405-420 412 4 33 0,11 0,94
420-435 427 2 35 0,06 1,00
TOTAL 35 1,00
EJEMPLO 2-CALCULO de la MODA para datos agrupados
( ) T
d d
d
Li Mo *
2 1
1
+
+ =
1) Determinar la clase que contiene la Moda
2) Realizar la interpolacin para hallar
el valor de la Mo
375 = Li
d
1
= 12 4 = 8 d
2
= 12 7 = 5
d
1

d
2


d1
d2
x
T
Li
Limite inferior de la clase modal
Diferencia entre
la frecuencia de
la clase modal y
la clase anterior
Diferencia entre
la frecuencia de
la clase modal y
la clase
siguiente
Extensin del intervalo
Mo
forma grfica de
determinar la moda
MEDIDAS DE
DISPERSIN
ABSOLUTAS
RELATIVAS
RECORRIDO (RANGO)
VARIANZA
DESVIACIN ESTNDAR
COEFICIENTE DE VARIACIN
MEDIDAS DE DISPERSIN


MEDIDAS DE DISPERSIN

Un rasgo principal de los datos es su dispersin o
amplitud, que se refiere a su variabilidad, a la
evaluacin de cun separados o extendidos estn
estos datos o bien cuanto difieren unos de otros.
Variacin: es el grado en que los datos numricos
tienden a extenderse al rededor de un valor,
generalmente el valor medio
MEDIDAS DE DISPERSIN
Por qu es importante la variacin?
1. Al menudo una medida de posicin de un conjunto de datos se vincula
con la indicacin de cun tpico o representativo es para la poblacin y
para ello es necesario contar con la informacin que proporcionan las
medidas de variacin. Solo el conocimiento de un estadstico de
tendencia central no aclara o define toda la distribucin, adems que
no existe un valor de tendencia central ideal, por lo que es significativo
tener una idea de la dispersin de los valores y determinar si es
mucha o poca al rededor de la media, pues si la variacin es muy
grande entonces esta medida de tendencia central no es buena
seleccin como valor tpico.
2. La medida de tendencia central no indica la relacin de un dato con los
otros, es necesario para ello las medidas de variabilidad o dispersin.
3. Al tratar problemas con datos dispersos se requiere conocer que
problemas puede esto traer, hasta que punto la dispersin tiene un
riesgo aceptable o inaceptable en la toma de decisiones.
MEDIDAS DE DISPERSIN
RANGO

Mide la dispersin de la totalidad de los datos. Es la ms
obvia de las medidas ya que es la distancia entre los valores
mximo y mnimo.
El rango o recorrido da alguna idea del grado de variacin
que ocurre en la poblacin, pero con frecuencia los
resultados pueden ser engaosos, pues este depende de los
valores extremos e ignora la variacin de las dems
observaciones.

Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de I ao, a
saber: 18,23, 27,34 y 25.
R = mx- mn = 34-18 = 16 aos


Rango = X mxima- X mnima= 1230-935=295
MEDIDAS DE DISPERSIN
Varianza
La varianza tambin es una clase de promedio. Es el
promedio de los cuadrados de las desviaciones de los
valores individuales de su media. La varianza muestral
tiene dos funciones en el anlisis estadstico. Primera,
es usada como una medida de la dispersin presente en
la muestra. Segunda, es usada para estimar la varianza
de la poblacin de la que se extrajo la muestra.


Ejemplo:

Se tienen las edades de cinco estudiantes
universitarios de Ier ao, a saber: 18,23, 25, 27,
y 34.
Al calcular la media aritmtica (promedio de las
edades, se obtuvo 25.4 aos, encontrar la
varianza de las edades de estos estudiantes:





18 (18 25.5) = -7.4 (-7.4) 2=54.76
23 (23 25.5) = -2.4 (-2.4) 2= 5.76
25 (25 25.5) = -0.4 (-0.4) 2= 0.16
27 (27 25.5) = 1.6 ( 1.64 )2= 2.16
34 (34 25.5 )= 8.6 ( 8.6 )2 =73.96
Total 0 137.20
Para calcular se utiliza una tabla estadstica de
trabajo de la siguiente manera:

=
( )
1
2
2


=
n
x x
s
137.20 =34.3
5-1
x x
i

2
) ( x x
i

i
x
MEDIDAS DE DISPERSIN
Desviacin Estndar
Es la raz cuadrada de la varianza
representando se con la letra S y se define
como la raz de la sumatoria (E) de las
desviaciones cuadradas entre el nmero total de
datos de la muestra menos uno. Tiene las
mismas unidades que los datos de la muestra
estadstica
EJEMPLO DE VARIACIN EN LOS
PROCESOS
Este ejemplo tomado de www.seissigma.com permitir
conocer la importancia de la desviacin estndar en la
vida diaria: "Considere la compra de una deliciosa pizza,
la cual Ud. ordena en la pizzera que est de camino a
su casa. Se dispone de dos pizzeras de las cuales se
tiene la siguiente informacin en cuanto a tiempos de
preparacin (en minutos), para 10 pizzas:


EJEMPLO DE VARIACIN EN LOS PROCESOS
Pizzera ABC: 6,5 - 6,6 - 6,7 - 6,8 - 7,1 - 7,3 - 7,4 - 7,7 - 7,7 -
7,7
Pizzera XYZ: 4,2 - 5,4 - 5,8 - 6,2 - 6,7 - 7,7 - 7,7 - 8,5 - 9,3 -
10,0

Utilizando herramientas estadsticas comunes, tales como
la media, mediana y moda, se obtienen los siguientes
resultados:

Pizzera ABC: Media = 7,15 - Mediana = 7,20 - Moda = 7,7
Pizzera XYZ: Media = 7,15 - Mediana = 7,20 - Moda = 7,7



EJEMPLO DE VARIACIN EN LOS PROCESOS
De estos resultados se puede observar que ambas
pizzeras tienen las mismas medidas de tendencia
central; es decir, en promedio, los clientes de ambas
esperan por sus pizzas el mismo tiempo. Basado en
estos resultados, es difcil distinguir diferencias en
ambos procesos como para tomar alguna decisin al
respecto.
EJEMPLO DE VARIACIN EN LOS PROCESOS
Si se observan nuevamente los datos de tiempos de
preparacin, se puede observar una mayor variacin (o
dispersin) en los tiempos de la pizzera XYZ. Si todas
las dems caractersticas de calidad de ambas pizzeras
son iguales, es probable que los clientes prefieran
comprar sus pizzas en la ABC, por sus tiempos de
preparacin ms consistentes y menos variables. En el
mundo de los negocios se requiere de algo ms preciso
y confiable para medir y cuantificar la variacin de los
procesos; para ello se dispone de las siguientes
medidas:


EJEMPLO DE VARIACIN EN LOS PROCESOS
Rango y Desviacin Estndar."

Porqu es importante la desviacin estndar?.
Porque es una de las formas ms sencillas de
controlar la variabilidad, llmese presupuestos,
ventas, productos, tiempos de atencin y para
todo el nuevo conjunto de indicadores que estn
de moda.


EJEMPLO DE VARIACIN EN LOS PROCESOS
Por medio de la desviacin estndar se pueden
analizar encuestas a clientes y determinar que tan
concluyentes son las respuestas, se puede inferir la
probabilidad de que se alcancen las metas, que los
productos estn fuera de especificacin, que un
empleado llegue tarde, que un estudiante no logre
la nota mnima etc.

La desviacin estndar sirve para conocer si los
procesos tienen capacidad para cumplir con los
requerimientos del cliente, por medio de lo que se
conoce como anlisis del Cpk, o Cp, frmula
correcta para determinar su capacidad.



AUTO EVALUACION DATOS NO AGRUPADOS



El peso del contenido de varios frascos pequeos de aspirinas son (en
gramos): 4, 2, 5, 4, 5, 2, y 6. Cul es la varianza de la muestra?
Calcule la desviacin estndar de la muestra.

R. 2.33, calculados as:

AUTO EVALUACION DATOS NO AGRUPADOS
Los ingresos netos de una muestra de grandes importadores de
antigedades se organizaron en la tabla siguiente
a) Cmo se llama la tabla?
R. Distribucin de Frecuencia
b) Con base e la distribucin, Cul es el estimado del ingreso neto
medio aritmtico?
R.






c) Con base en la distribucin, cul es el estimado de la desviacin
estndar?

Varianza

poblacin
muestra
AGRUPAR
DATOS SIN
DATOS
AGRUPADOS
( )
1
2
2

n
x x f
s
i

( )
1
2
2

n
x x
s

( )
n
x


=
2
2

o
( )
n
x f
i

=
2
2

o

n<30
n30
( )
n
x x
s


=
2
2

n30
( )
n
x x f
s
i

=
2
2

n<30
Desviacin

poblacin
muestra
AGRUPAR
DATOS SIN
DATOS
AGRUPADOS
( )
1
2

=

n
x x f
s
i

( )
1
2

=

n
x x
s

( )
n
x
i

=
2

o
( )
n
x f
i i

=
2

o

n<30
n30
( )
n
x x
s


=
2

n30
( )
n
x x f
s
i i

=
2

n<30
Cuando se quiere comparar el grado de dispersin de
dos distribuciones que no vienen dadas en las mismas
unidades o que las medias no son iguales se utiliza el
llamado "Coeficiente de Variacin , del que se
demuestra que nos da un nmero independiente de las
unidades de medidas empleadas, por lo que entre dos
distribuciones dadas diremos que posee menor
dispersin aquella cuyo coeficiente de variacin sea
menor., y que se define como la relacin por cociente
entre la desviacin estndar y la media aritmtica; o en
otras palabras es la desviacin estndar expresada
como porcentaje de la media aritmtica.

Coeficiente de Variacin
Coeficiente de variacin
Es la razn entre la desviacin tpica y la media.

Mide la desviacin tpica en forma de
qu tamao tiene con respecto a la media
Tambin se la denomina variabilidad relativa.
Es frecuente mostrarla en porcentajes
Si la media es 80 y la desviacin tpica 20 entonces
CV=20/80=0,25=25% (variabilidad relativa)

Es una cantidad adimensional. Interesante para comparar la
variabilidad de diferentes variables.
Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos
presentan ms dispersin en peso que en altura.

No debe usarse cuando la variable presenta valores negativos o
donde el valor 0 sea una cantidad fijada arbitrariamente
Por ejemplo 0C 0F
Los ingenieros electrnicos hablan de la razn seal/ruido (su
inverso).
x
S
CV =
MEDIDAS DE DISPERSIN
COEFICIENTE DE VARIABILIDAD
VALOR DEL
COEFICIENTE DE
VARIACIN
INTREPRETACIN DEL
COEFICIENTE
Igual a cero Variacin Nula
Mayor de 0 hasta 20 Variacin baja
Mayor de 20 hasta 60 Variacin moderada
Mayor de 60 hasta 90 Variacin alta
Mayor de 90 Variacin alta




Entre menor es el coeficiente de variacin o variabilidad los valores se
acercan ms a su media y son ms estables.
Esta medida se utiliza siempre que haya que escoger entre dos o mas
alternativa, es decir tomar una decisin, y se toma la de menor variabilidad,
siempre y cuando la variabilidad no este en rango de alta


Ejemplo:
Suponga que Usted trabaja en una compaa de ventas,
que ofrece como premio de incentivo al mejor vendedor del
trimestre anterior las entradas al palco empresarial en la
serie final de bisbol de las grandes ligas en los Estados
Unidos.
De los registros de ventas se tienen los siguientes datos de
ventas, expresados en porcentajes de cumplimiento de las
metas fijadas mensualmente:
Vendedor A 95, 105, 100
Vendedor B 100, 90, 110
El promedio trimestral de cumplimiento de las metas de
ventas de ambos vendedores es igual y equivale al 100%,
pero Ud. Slo le puede dar el premio de incentivo a uno de
ellos. Cul usted escogera? Respuesta: empleado A

Xi ( Xi - x ) ( Xi - x ) 2
95 95 100 = -5 (-5) 2 = 25
105 105 100 = 5 ( 5) 2 = 25
100 100 100 = 0 ( 0) 2 = 0
Total XXX 50
Vendedor A





La desviacin estndar es
S=(50/2) = 25= 5
luego entonces el coeficiente de variacin es igual a:



=
5 = 5%
100
Xi ( Xi - x ) ( Xi - x ) 2
100 100 100 = 0 ( 0 ) 2 = 0
90 90 100 = -10 (-10 )2 = 100
110 110 100 = 10 ( 10) 2 = 100
Total XXX 200
Vendedor B





La desviacin estndar es
S=(200/2) = 100 = 10
luego entonces el coeficiente de variacin es igual a:



=
10 = 10%
100
Qu medidas de tendencia central y dispersin utilizar
forman DUOS
Media -
Varianza y
desviacin tpica
Mediana -
Semirrecorrido
intercuartlico
Moda -
Amplitud
total
Datos numricos
distribuciones simtricas o asimtricas
con muchas observaciones
Datos ordinales o numricos
distribucin asimtrica y con pocas
observaciones-
Datos nominales
Distribuciones bimodales
Segn teora de
momentos
Segn el mtodo de las
separatrices
Segn el mtodo de los
extremos
ESTADGRAFOS DE
FORMA
MEDIDAS DE FORMA
MEDIDAS DE FORMA
MEDIDAS DE FORMA
Son aquellos nmeros resmenes, que indican la
morfologa de la distribucin de los datos, es decir de
la simetra y apuntamiento que tiene el histograma de
la variable en estudio. Slo se pueden calcular en
variables medidas en escala intervalar y de razn.
Son el:
SESGO (COEFICIENTE DE ASIMETRIA)
CURTOSIS
INTRODUCCIN
TIPOS DE DISTRIBUCIONES DE FRECUENCIA
MS COMUNES
Distribucin Simtrica
Distribucin simtrica
DISTRIBUCIN ASIMTRICA
DISTRIBUCIN ASIMTRICA
Ejemplo: Vamos a calcular el Coeficiente de Asimetra de Fisher
de la serie de datos referidos a la estatura de un grupo de
alumnos:

Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple
Acumulad
a
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
Recordemos que la media de esta muestra es 1,253
E((xi - x)^3)*ni E((xi - x)^2)*ni
0,000110 0,030467
Por lo tanto el
Coeficiente de
Fisher de Simetra
de esta muestra es
-0,1586, lo que
quiere decir que
presenta una
distribucin
asimtrica negativa
(se concentran ms
valores a la
izquierda de la
media que a su
derecha).
RELACIN ENTRE LA MEDIA, MEDIANA Y MODA
Cuando una distribucin de frecuencia
es simtrica, la media, mediana y
moda coinciden en su valor ( X = Me =
Mo). En el caso de una distribucin
binomial simtrica, es necesario
calcular el promedio de las modas.
X = Me = Mo
Mo < Me < X
En una distribucin
sesgada a la izquierda, la
moda es menor a la
mediana, y esta a su vez
menor que la media.
En una distribucin
sesgada a la derecha
la relacin se invierte,
la moda es mayor a la
mediana, y esta a su
vez mayor que la
media.
Mo > Me > X
COEFICIENTE DE ASIMETRA
Mide el grado de asimetra de la distribucin con
respecto a la media. Un valor positivo de este
indicador significa que la distribucin se encuentra
sesgada hacia la izquierda (orientacin positiva). Un
resultado negativo significa que la distribucin se
sesga a la derecha.
Ejemplo: Clculo del coeficiente de asimetra
Calcular el coeficiente de asimetra a partir de los siguientes datos
obtenidos de una muestra. Realizando el Polgono de Frecuencias.
CURTOSIS
Si los datos estn muy
concentrado hacia la
media, la distribucin es
leptocrtica (curtosis
mayor a 0).
Si los datos estn muy
dispersos, la distribucin
es platicrtica (curtosis
menor a 0).
El comportamiento normal
exige que la curtosis sea
igual a 0 (distribucin
mesocrtica).
Indica que tan apuntada o achatada se encuentra una distribucin
respecto a un comportamiento normal (distribucin normal).
Ejemplo: Vamos a calcular el Coeficiente de curtosis de la serie
de datos referidos a la estatura de un grupo de alumnos:

Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple
Acumulad
a
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
Recordemos que la media de esta muestra es 1,253
Por lo tanto, el
Coeficiente de
Curtosis de esta
muestra es -1,39, lo
que quiere decir que
se trata de una
distribucin
platicrtica, es decir,
con una reducida
concentracin
alrededor de los
valores centrales de la
distribucin E((xi - xm)^4)*ni E((xi - xm)^2)*ni
0,00004967 0,03046667
Clculo de la Curtosis
La frmula empleada para calcular la Curtosis se
muestra a continuacin (reemplace el valor de n por N
en caso de tratar con datos poblacionales):
Ejemplo: Clculo de la Curtosis
Calcular el coeficiente de asimetra a partir de los
siguientes datos obtenidos de una muestra. Realizar el
polgono de frecuencias.

Potrebbero piacerti anche