Sei sulla pagina 1di 36

Estadstica descriptiva

Maestra en Ingeniera Industrial


Mencin Gerencia de Operaciones
Ms. Ivn Martn Olivares Espino

Caractersticas
de los Datos
Tendencia Central
(Posicin)
Dispersin
(Variacin)
Sesgo
Tendencia
Central
Media
Aritmtica
Mediana Moda Media
Pesada
Media
Geomtrica
Media de la Poblacin
Para datos no agrupados, la media
aritmtica de la poblacin es la suma de
todos los valores en ella dividida entre el
total de valores en la poblacin:

donde representa la media de la poblacin.
N es el nmero total de elementos en la
poblacin.
x representa cualquier valor en particular.
indica la operacin de sumar.
N x / E =
3-2
Media de una Muestra
Para datos no agrupados, la media de
una muestra es la suma de todos los
valores divididos entre el nmero total
de los mismos:


donde denota la media muestral
n es el nmero total de valores en la
muestra.
n x x / E =
x
Propiedades de la
Media Aritmtica
Todo conjunto de datos tiene un valor medio.
Al evaluar la media se incluyen todos los
valores.
Un conjunto de valores slo tiene una media.

Desventaja
Es afectada por los valores extremos.

Media Aritmtica
Es la medida ms comn de tendencia
central.
Es afectada por valores extremos.
0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10 12 14
Media = 5 Media = 6
Media pesada
La media pesada de un conjunto de nmeros
x
1
, x
2
, ..., x
n
, con las ponderaciones
correspondientes w
1
, w
2
, ...,w
n
, se calcula con
la frmula:
w x w x
w w w x w x w x w x
w
w
n n n
E E =
+ + + + + =
/ ) * (
) ... /( ) ... (
2 1 2 2 1 1
Media Geomtrica
La media geomtrica (MG) de un
conjunto de n nmeros positivos se
define como la raz n-sima del
producto de los n valores. Su frmula
es:


La media geomtrica se usa para encontrar
el promedio de porcentajes, razones,
ndices o tasas de crecimiento.
n
n x x x x MG ) )...( )( )( ( 3 2 1 =
Mediana
Mediana: es el punto medio de los
valores despus de ordenarlos de
menor a mayor, o de mayor a menor.
La misma cantidad de valores se
encuentra por arriba de la mediana que
por debajo de ella.
Nota: para un conjunto con un nmero
par de nmeros, la mediana ser el
promedio aritmtico de los dos
nmeros medios.
Mediana
No es afectada por los valores extremos.



0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Mediana = 5 Mediana = 5
2
1 +
=
n
Mediana
Propiedades de la mediana
La mediana es nica para cada conjunto
de datos.
No se ve afectada por valores muy
grandes o muy pequeos.
Puede calcularse para una distribucin de
frecuencias con una clase de extremo
abierto, si la mediana no se encuentra en
una de estas clases.
Moda
Valor que ocurre ms a menudo.
No es afectada por valores extremos.
Puede no existir una moda.
Pueden haber varias modas.
Usada para datos numricos o
categoras.
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Moda = 9
0 1 2 3 4 5 6
Sin Moda
Media de Datos Agrupados
La media de una muestra de datos
agrupados se puede estimar con la
formula:



f = frecuencia de cada clase
x = punto medio o marca de la clase
n = nmero de observaciones
n
x f
f
x f
x
) * ( ) * ( E
=
E
E
=
Mediana de datos
agrupados
La mediana de una muestra de datos agrupados se
calcula mediante la siguiente frmula:



n= nmero de elementos de la distribucin
F= suma de todas las frecuencias de clase hasta pero sin
incluir la clase mediana.
f
m
= Frecuencia de la clase mediana
W = ancho del intervalo de clase
Lm= Lmite inferior del intervalo de clase mediano

m
m
L w
f
F n
m +
|
|
.
|

\
| + +
= *
) 1 ( 2 / ) 1 (
Moda de datos agrupados
La moda de los datos agrupados se encuentra de la
clase que contiene la frecuencia de clase mayor.



L
Mo
= Lmite inferior de la clase modal
d
1
= Frecuencia de la clase modal menos la frecuencia de la
clase que se encuentra inmediatamente por debajo de ella.
d
2
= Frecuencia de la clase modal menos la frecuencia de la
clase que se encuentra inmediatamente por encima de ella.
w= Ancho del intervalo de la clase modal.
w
d d
d
L Mo o M *
2 1
1
|
.
|

\
|
+
+ =
Dispersin
Varianza Desviacin Estndar Coeficiente de
Variacin
Varianza de
la Poblacin
Varianza de la
Muestra
Desviacin
Estndar de
la Poblacin
Alcance
Alcance Intercuartil
Desviacin
Estndar de
la Muestra
Alcance o Rango
Diferencia entre la mayor y la menor de
las observaciones
Alcance = x
mayor
x
menor

No toma en cuenta la forma en que estn
distribuidos los datos.

7 8 9 10 11 12
Alcance: 12 - 7 = 5
7 8 9 10 11 12
Alcance: 12 - 7 = 5
Cuartiles
Los datos se ordenan de menor a mayor.





El alcance intercuartil es la distancia entre el tercer
cuartil Q3 y el primer cuartil Q1.



25% 25% 25% 25%
( )
1
Q
( )
2
Q ( )
3
Q
Observacin
Menor
Observacin
Mayor
Promedio de
desviacin de cada dato
0
1
2 3 4 5
-1
-2
1
2
0 ) ( = E x
Desviacin cuadrtica promedio con
relacin a la media de la Poblacin
Varianza de la Poblacin
N
x
2
2
) (
o
E
=
2
2
2
o
E
=
N
x
Raz Cuadrada de la Varianza de la
Poblacin
Desviacin Estndar
de la Poblacin
2
2
2
o o
E
= =
N
x
N
x
2
2
) (
o o
E
= =
Desviacin cuadrtica promedio (n-1) con
relacin a la media de la Muestra
Varianza de la Muestra
1
) (
2
2

E
=
n
x x
s
1 1
2
2
2

E
=
n
x n
n
x
s
Raz Cuadrada de la Varianza de la
Muestra
Desviacin Estndar
de la Muestra
1
) (
2
2

E
= =
n
x x
s s
1 1
2
2
2

E
= =
n
x n
n
x
s s
Varianza de la Poblacin
Datos Agrupados
N
x f
2
2
) (
o
E
=
2
2
2
o
E
=
N
fx
clase de marca = x
Desviacin Estndar
de la Poblacin
Datos Agrupados
2
2
2
o o
E
= =
N
fx
N
x f
2
2
) (
o o
E
= =
clase de marca = x
Varianza de la Muestra
Datos agrupados
1
) (
2
2

E
=
n
x x f
s
1 1
2
2
2

E
=
n
x n
n
fx
s
clase de marca = x
Desviacin Estndar
de la Muestra
Datos Agrupados
1
) (
2
2

E
= =
n
x x f
s s
1 1
2
2
2

E
= =
n
x n
n
fx
s s
clase de marca = x
Comparacin de
Desviaciones Estndar
Media = 15.5
s = 3.338
11 12 13 14 15 16 17 18 19 20 21
11 12 13 14 15 16 17 18 19 20 21
Datos B
Datos A
Media = 15.5
s = .9258
11 12 13 14 15 16 17 18 19 20 21
Media = 15.5
s = 4.57
Datos C
Interpretacin y usos de la
Desviacin Estndar
Teorema de Chebyshev: para
cualquier conjunto de
observaciones, la proporcin
mnima de valores que est dentro
de k desviaciones estndar desde
la media es al menos 1 - 1/k
2
,
donde k es una constante mayor
que 1.
4-14
Interpretacin y usos de la
Desviacin Estndar
Regla emprica: para una distribucin de
frecuencias simtrica de campana:
Cerca de 68% de las observaciones estar
dentro de 1 de la media ();
Cerca de 95% de las observaciones estar
dentro de 2 de la media ();
Alrededor de 99.7% estar dentro de 3 de
la media ().
4-15
DISTRIBUCION NORMAL
-3 -2 -1 +1 +2 +3
-3 -2 -1 +1 +2 +3

34.13% 34.13%
13.60%
13.60%
2.135%
2.135%
0.135% 0.135%
68.26%
95.46%
99.73%
-3 -2 -1 +1 +2 +3

o

=
x
Re
Resultado Estndar
Dispersin relativa
El coeficiente de variacin es la razn de
la desviacin estndar a la media
aritmtica, expresada como porcentaje:
%) 100 (
x
s
CV =
Sesgo de una distribucin



Media = Mediana = Moda

Media < Mediana < Moda
Moda < Mediana < Media
Positivamente
Sesgada
Simtrica
Negativamente
Sesgada