Sei sulla pagina 1di 5

Prof.

Jos Luis Quintero 37


ELEMENTOS DE ESTADSTICA
SEMANA 05 CLASE 08 MIRCOLES 09/05/12

1. Percentiles. El k-simo percentil de una muestra aleatoria se define como el valor
que ocupa una posicin tal en la muestra ordenada que a su izquierda caen
aproximadamente el k% de los datos.

2. Clculo para datos agrupados por valor:
El percentil k-simo
k
(P ) ser igual a
m 1
x
+
, es decir
k m 1
P x
+
= , siempre y cuando
se verifique que
k
m N m 1
100
< + , con m N .

Ejemplo de la duracin en minutos de las llamadas telefnicas:
Se desean encontrar los percentiles 30 y 75, es decir
30
P y
75
P respectivamente.
Para
30
P :
30 15
30
m 50 m 1 m 15 m 1 m 14 P x 3
100
< + < + = = =
Para
75
P :
75 38
75
m 50 m 1 m 37.5 m 1 m 37 P x 6
100
< + < + = = =

3. Clculo para datos agrupados por intervalos:
El percentil k-simo
k
(P ) ser igual a
m 1
x
+
, es decir
k m 1
P x
+
= , siempre y cuando
se verifique que
k
m N m 1
100
< + , con m N .
En primer lugar se identifica la clase j donde est el dato que ocupa la posicin
encontrada anteriormente. Una vez ubicada la clase se procede a estimar el
percentil k-simo de la muestra usando la expresin
k
j 1
100
k j j j
j
N F
P LI (LS LI )
f


= +

Ejemplo del pago del uso del servicio telefnico anual:
Se desean encontrar los percentiles 30 y 75, es decir
30
P y
75
P respectivamente.
Para
30
P :
30 15
30
m 50 m 1 m 15 m 1 m 14 P x
100
< + < + = =
La clase donde se encuentra
30
P es la clase 3:

3 1.529 1.561 1.545 15 23 0.30 0.46

Calculando ahora la estimacin para
30
P se tiene:
30
100
30
50 8
7
P 1.529 (1.561 1.529) 1.529 (0.032) 1.5439
15 15

= + = + =
Para
75
P :
75 38
75
m 50 m 1 m 37.5 m 1 m 37 P x
100
< + < + = =
Prof. Jos Luis Quintero 38
La clase donde se encuentra
75
P es la clase 5:

5 1.593 1.625 1.609 9 44 0.18 0.88

Calculando ahora la estimacin para
75
P se tiene:
75
100
75
50 35
2.5
P 1.593 (1.625 1.593) 1.593 (0.032) 1.6019
9 9

= + = + =

Ejemplo del pago del uso del servicio telefnico en dos aos:
Se desean encontrar los percentiles 30 y 75, es decir
30
P y
75
P respectivamente.
Para
30
P :
30 30
30
m 100 m 1 m 30 m 1 m 29 P x
100
< + < + = =
La clase donde se encuentra
30
P es la clase 4:

4 3.86 3.94 3.90 11 31 0.11 0.31

Calculando ahora la estimacin para
30
P se tiene:
30
100
30
100 20
10
P 3.86 (3.94 3.86) 3.86 (0.08) 3.9327
11 11

= + = + =
Para
75
P :
75 75
75
m 100 m 1 m 75 m 1 m 74 P x
100
< + < + = =
La clase donde se encuentra
75
P es la clase 6:

6 4.02 4.10 4.06 22 76 0.22 0.76

Calculando ahora la estimacin para
75
P se tiene:
75
100
75
100 54
21
P 4.02 (4.10 4.02) 4.02 (0.08) 4.0964
22 22

= + = + =

4. Observaciones de inters:
La mediana es considerada como el percentil 50 es decir
50
P M =


El cuartil k-simo
k
(Q ) es una medida de localizacin que verifica las siguientes
equivalencias:
1 25
Q P = ,
2 50
Q P = ,
3 75
Q P = ,
4 100
Q P = .
El decil k-simo
k
(D ) es una medida de localizacin que verifica las siguientes
equivalencias:
1 10 2 20 9 90 10 100
D P , D P , ... , D P , D P = = = = .

5. Medidas de dispersin:
Varianza de la muestra. Promedio aritmtico de los cuadrados de las diferencias
de cada valor en la muestra y la media de la muestra
Varianza corregida de la muestra. Cociente que resulta de dividir la suma de los
cuadrados de las diferencias de cada dato en la muestra y la media de la
muestra, entre el nmero de datos menos uno
Prof. Jos Luis Quintero 39
Desviacin estndar de la muestra. Es la raz cuadrada positiva de la varianza
de la muestra
Desviacin estndar corregida de la muestra. Es la raz cuadrada positiva de la
varianza corregida de la muestra
Intervalo intercuartil de la muestra. Es el intervalo de la muestra que resulta al
considerar solamente aquellos datos que estn entre el primer cuartil y el
tercero

6. Observaciones de inters:
Para conocer la varianza de la muestra, previamente se debe conocer la media
de la muestra
La justificacin de la frmula de la varianza corregida de la muestra se
encuentra en el tema de estimadores insesgados en la mayora de los libros de
Estadstica
La desviacin estndar de la muestra posee las mismas unidades que tienen los
datos de la muestra

7. Clculo para datos agrupados por valor:
Varianza de la muestra
2
(S ) .
n = nmero de clases
N = tamao de la muestra
Una frmula para su clculo:
n
2 2
i i
i 1
1
S f (x M)
N
=
=


Otra frmula para su clculo:

n n n
2 2 2 2 2 2
i i i i i i i i i i
i 1 i 1 i 1
n n n n
2 2 2 2 2 2 2
i i i i i i i
i 1 i 1 i 1 i 1
1 1 1
S f (x M) f (x 2xM M ) (f x 2f xM fM )
N N N
1 2 1 1
f x f xM fM f x 2M M M M
N N N N
= = =
= = = =
= = + = +
= + = + =



Varianza corregida de la muestra
2
c
(S ) .
n n
2 2 2 2
c i i i i
i 1 i 1
1 N 1 N
S f (x M) . f (x M) .S
N 1 N 1 N N 1
= =
= = =


Desviacin estndar de la muestra (S).
2
S S = +
Desviacin estndar corregida de la muestra
c
(S ) .
2
c c
S S = +
Intervalo intercuartil de la muestra
Q
(I ).
Q 3 1
I Q Q =

Prof. Jos Luis Quintero 40
Ejemplo de la duracin en minutos de las llamadas telefnicas:
Varianza de la muestra
2
(S ) .
n = 16 , N = 50 , M 4.94 =
Primera forma para su clculo:

2 2 2 2 2
1
S 3(1 4.94) 7(2 4.94) ... 1(15 4.94) 1(16 4.94)
50
538.82
10.7764
50

= + + + +

= =

Segunda forma para su clculo:
2 2 2 2 2 2 2
1 1759
S 3(1) 7(2) ... 1(15) 1(16) (4.94) (4.94) 10.7764
50 50

= + + + + = =


Varianza corregida de la muestra
2
c
(S ) .
2 2
c
N 50
S .S 10.7764 10.9963
N 1 49
= = =


Desviacin estndar de la muestra (S).
2
S S 3.2827 = + =
Desviacin estndar corregida de la muestra
c
(S ) .
2
c c
S S 3.3161 = + =
Intervalo intercuartil de la muestra
Q
(I ).
Q 3 1
I Q Q 6 3 3 = = =

8. Clculo para datos agrupados por intervalos o uso de clases continuas:
Varianza de la muestra
2
(S ) .
i
x = marca de clase que pertenece a la clase i
n = nmero de clases
N = tamao de la muestra
Una frmula para su clculo:
n
2 2
i i
i 1
1
S f (x M)
N
=
=


Otra frmula para su clculo:
2 2 2
S M M =
Varianza corregida de la muestra
2
c
(S ) .
2 2
c
N
S .S
N 1
=


Desviacin estndar de la muestra (S).
2
S S = +
Desviacin estndar corregida de la muestra
c
(S ) .
2
c c
S S = +
Intervalo intercuartil de la muestra
Q
(I ).
Q 3 1
I Q Q =

Ejemplo del pago del uso del servicio telefnico anual:
Varianza de la muestra
2
(S ) .
n = 7 , N = 50
Primera forma de clculo:
Prof. Jos Luis Quintero 41

2 2 2 2
1
S 4(1.481 1.56868) 4(1.513 1.56868) ... 1(1.673 1.56868)
50
0.1041
0.0021
50

= + + +

= =

Segunda forma de clculo:
2 2 2 2
S M M 2.4628 (1.56868) 0.0021 = = =
Varianza corregida de la muestra
2
c
(S ) .
2 2
c
N 50
S .S 0.0021 0.0021
N 1 49
= =


Desviacin estndar de la muestra (S).
2
S S 0.0458 = + =
Desviacin estndar corregida de la muestra
c
(S ) .
2
c c
S S 0.0458 = + =
Intervalo intercuartil de la muestra
Q
(I ).
Q 3 1
I Q Q 1.6019 1.5386 0.0633 = = =

Ejemplo del pago del uso del servicio telefnico en dos aos:
Varianza de la muestra
2
(S ) .
n = 10 , N = 100
Primera forma de clculo:

2 2 2 2
1
S 2(3.66 3.9976) 7(3.74 3.9976) ... 1(4.38 3.9976)
100
2.2090
0.02209
100

= + + +

= =

Segunda forma de clculo:
2 2 2 2
S M M 16 (3.9976) 0.02 = = =
Varianza corregida de la muestra
2
c
(S ) .
2 2
c
N 100
S .S 0.02 0.0202
N 1 99
= =


Desviacin estndar de la muestra (S).
2
S S 0.1414 = + =
Desviacin estndar corregida de la muestra
c
(S ) .
2
c c
S S 0.1421 = + =
Intervalo intercuartil de la muestra
Q
(I ).
Q 3 1
I Q Q 4.0964 3.8964 0.2 = = =

Potrebbero piacerti anche