Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADSTICA DESCRIPTIVA
Jos Luis Quintero
Distribucin
de
Frecuencias
Diagrama de
Caja y
Bigotes
Medidas de
Tendencia
Central
Estadstica
Descriptiva
Medidas
de
Dispersin
Medidas
de
Localizacin
FUNDAMENTOS DE
ESTADSTICA DESCRIPTIVA
Jos Luis Quintero
Distribucin
de
Frecuencias
Diagrama de
Caja y
Bigotes
Medidas de
Tendencia
Central
Estadstica
Descriptiva
Medidas
de
Dispersin
Medidas
de
Localizacin
PROLOGO
ROBABILIDADES (ITEL-30205)
OBJETIVOS A
LOGRAR
ROBABILIDADES (ITEL-30205)
INDICE GENERAL
ROBABILIDADES (ITEL-30205)
1. Definiciones de inters
1.1. Estadstica
1.2. Estadstica Descriptiva
1
1
1
1
1.7. Clase
1.8. Histograma de una muestra
1
1
2
2
3. Ejemplos ilustrativos para datos agrupados por valor o uso de clases discretas
4. Ejemplos ilustrativos para datos agrupados por intervalos o uso de clases continuas
2
4
5. Clculo de las medidas de tendencia central para datos agrupados por valor
6. Clculo de las medidas de tendencia central para datos agrupados por intervalos
7. Clculo de la media recortada al %
6
10
7.1. Definicin
10
10
11
7.4. Clculo para datos agrupados por valor o uso de clases discretas
11
7.5. Clculo para datos agrupados por intervalos o uso de clases continuas
8. Percentiles
12
13
8.1. Definicin
13
8.2. Clculo para datos agrupados por valor o uso de clases discretas
8.3. Clculo para datos agrupados por intervalos o uso de clases continuas
13
14
9. Intervalo intercuartil
16
9.1. Definicin
9.2. Clculo para datos agrupados por valor o uso de clases discretas
16
16
9.3. Clculo para datos agrupados por intervalos o uso de clases continuas
16
17
17
17
17
17
17
17
17
18
18
18
18
18
18
18
19
20
20
20
20
21
21
21
21
22
22
23
24
31
Probabilidad y Estadstica
1. DEFINICIONES DE INTERS
Observacin
Consideraciones
1.
acerca de la estadstica:
en tal anlisis.
cuantitativa
concerniente
condiciones.
que
se
realizaron
hace
unos
de
y
ganancias
riquezas
que
las
de
los
datos
1.7. Clase. Es cada uno de los intervalos que se consiguen al realizar una particin dentro del
conjunto de los nmeros reales.
1.8. Histograma de una muestra. Es una representacin grfica en forma de barras de una
muestra.
Probabilidad y Estadstica
2.
9
Observacin
2.
Consideraciones
Ejemplo 1.
Tabla de distribucin de frecuencias de la nota obtenida en un examen de Clculo
Clase
Dato (xi)
fi
Fi
hi
Hi
2.8
0.0417
0.0417
3.2
0.1667
0.2084
3.9
0.1250
0.3334
4.2
13
0.2082
0.5416
5.0
17
0.1667
0.7083
5.6
20
0.1250
0.8333
6.0
24
0.1667
1.0000
2
Probabilidad y Estadstica
Notacin de inters:
fi = frecuencia absoluta , Fi = Frecuencia absoluta acumulada
hi = frecuencia relativa , Hi = Frecuencia relativa acumulada
Frmulas de inters:
n = nmero de clases , N = nmero total de datos
i
Fi =
fj = Fi 1 + fi , hi =
j =1
fi
F
, Hi = i , i = 1,...,n
N
N
Ejemplo 2.
Tabla de distribucin de frecuencias de la duracin en minutos de las llamadas
telefnicas (xi ) entre las 9 a.m. y las 10 a.m. registradas en una central telefnica
Clase
Dato
fi
Fi
hi
Hi
Clase
(xi)
Dato
fi
Fi
hi
Hi
(xi)
0.06
0.06
45
0.00
0.90
10
0.14
0.20
10
10
46
0.02
0.92
19
0.18
0.38
11
11
46
0.00
0.92
10
29
0.20
0.58
12
12
48
0.04
0.96
35
0.12
0.70
13
13
48
0.00
0.96
39
0.08
0.78
14
14
48
0.00
0.96
43
0.08
0.86
15
15
49
0.02
0.98
45
0.04
0.90
16
16
50
0.02
1.00
Probabilidad y Estadstica
Ejemplo 3.
Tabla de distribucin de frecuencias del pago en miles de bolvares (MBs.) del uso
del servicio telefnico (xi ) efectuado por los usuarios en un ao
Clase
Inicio
Fin
Marca
de clase
fi
Fi
hi
Hi
0.08
0.08
(xi)
1
1.465
1.497
1.481
1.497
1.529
1.513
0.08
0.16
1.529
1.561
1.545
15
23
0.30
0.46
1.561
1.593
1.577
12
35
0.24
0.70
1.593
1.625
1.609
44
0.18
0.88
1.625
1.657
1.641
49
0.10
0.98
1.657
1.689
1.673
50
0.02
1.00
Figura 2. Histograma de frecuencias relativas para el pago anual del servicio telefnico
Probabilidad y Estadstica
Ejemplo 4.
Tabla de distribucin de frecuencias del pago en miles de bolvares (MBs.) del uso
del servicio telefnico (xi ) efectuado por los usuarios en dos aos
Clase
Inicio
Fin
Marca
de clase
fi
Fi
hi
Hi
0.02
0.02
(xi)
1
3.62
3.70
3.66
3.70
3.78
3.74
0.07
0.09
3.78
3.86
3.82
11
20
0.11
0.20
3.86
3.94
3.90
11
31
0.11
0.31
3.94
4.02
3.98
23
54
0.23
0.54
4.02
4.10
4.06
22
76
0.22
0.76
4.10
4.18
4.14
15
91
0.15
0.91
4.18
4.26
4.22
96
0.05
0.96
4.26
4.34
4.30
99
0.03
0.99
10
4.34
4.42
4.38
100
0.01
1.00
1
M=
N
xifi
i =1
M=
Probabilidad y Estadstica
M=
1 3 + 2 7 + ... + 15 1 + 16 1 247
=
= 4.94
50
50
xi
Me =
xi + xi +1
N+1
si N es impar
2
N
i=
si N es par
2
i=
Me =
x12 + x13
4.2 + 4.2
=
= 4.2
2
2
Me =
x25 + x26
4+4
=
=4
2
2
Probabilidad y Estadstica
1
M=
N
xifi .
i =1
M=
Ejemplo del pago del uso del servicio telefnico en dos aos:
M=
Notacin:
LIk = Lmite inferior de la clase k (clase medianal)
y = LIk +
pasa
por
los
puntos
de
coordenadas
LSk LIk
(x Fk 1 )
Fk Fk 1
Probabilidad y Estadstica
Me = LIk +
LSk LIk N
( Fk 1 ) = LIk +
Fk Fk 1 2
N
2
Fk 1
fk
(LSk LIk )
Observacin. Se suponen que los datos dentro de la clase medianal estn equiespaciados y
se usa interpolacin lineal para la estimacin de la mediana.
Ejemplo del pago del uso del servicio telefnico anual:
N= 50 por lo tanto N/2 = 25 y la clase medianal identificada es la clase 4:
4
1.561
1.593
1.577
12
35
0.24
0.70
3.94
4.02
3.98
23
54
0.23
0.54
d. Suponga que el intervalo de la clase modal es dividido en dos partes: una de ellas de
denota con p y la otra como LSk LIk p . Se establecer la relacin
Probabilidad y Estadstica
d
p
= 1.
LSk LIk p d2
CASO 1. d1 < d2
Aqui la clase premodal tiene una frecuencia absoluta mayor que la de la clase postmodal, de
modo que se desea que la moda estimada est ms cerca de ella que de la clase postmodal.
Trabajando la expresin anterior:
d
d
p
= 1 p = 1 (LSk LIk p) ,
LSk LIk p d2
d2
lo cual permite ver que p es menor que LSk LIk p y la moda estimada como Mo = LIk + p
estar ms cerca de la clase premodal que de la clase postmodal como se deseaba.
CASO 2. d1 = d2
Aqui la clase premodal tiene una frecuencia absoluta igual que la de la clase postmodal, de
modo que se desea que la moda estimada est equidistante de ambas clases. Trabajando la
expresin anterior:
LSk LIk
p
,
= 1 p = (LSk LIk p) p =
LSk LIk p
2
lo cual permite ver que p es igual que LSk LIk p y la moda estimada como Mo = LIk + p se
ver de la forma
Mo = LIk + p = LIk +
LSk LIk
LI + LSk
= k
2
2
CASO 3. d1 > d2
Aqui la clase premodal tiene una frecuencia absoluta menor que la de la clase postmodal, de
modo que se desea que la moda estimada est ms lejos de ella que de la clase postmodal.
Trabajando la expresin anterior:
d
d
p
= 1 p = 1 (LSk LIk p) ,
LSk LIk p d2
d2
lo cual permite ver que p es mayor que LSk LIk p y la moda estimada como Mo = LIk + p
estar ms lejos de la clase premodal que de la clase postmodal como se deseaba.
Visto todo lo anterior, despejando p se tiene
d
d1
p
(LSk LIk ) ,
= 1 p(d1 + d2 ) = d1(LSk LIk ) p =
LSk LIk p d2
d1 + d2
calculando entonces la estimacin de la moda como
d1
Mo = LIk +
(LSk LIk )
d1 + d2
1.529
1.561
1.545
15
23
0.30
0.46
Probabilidad y Estadstica
1.497
1.529
1.513
0.08
0.16
1.561
1.593
1.577
12
35
0.24
0.70
3.94
4.02
3.98
23
54
0.23
0.54
3.86
3.94
3.90
11
31
0.11
0.31
4.02
4.10
4.06
22
76
0.22
0.76
7.1. Definicin (Media recortada). Se define como el promedio de los datos que quedan al
eliminar el % inferior y superior en la muestra ordenada.
7.2. Clculo de la media recortada:
10
Probabilidad y Estadstica
.
N(1 ) N , con =
100
7.3. Clculo para datos no agrupados:
Despus de ordenarlos la media recortada al % se calcula como
N(1 )
Mrec()
1
=
N(1
) N
xi .
i = N + 1
7.4. Clculo para datos agrupados por valor o uso de clases discretas:
Mrec()
1
=
N(1 ) N
n1
xifi +
xi fi ,
i = n1 + 1
i = n2 +1
n2
xi
fi +
i =1
donde
Observaciones.
Las negritas se colocaron para indicar las frecuencias absolutas que fueron modificadas
La eliminacin de los 2 datos no afecta significativamente a la media anterior (4.5458) al
compararla con la nueva media (4.5591)
11
Probabilidad y Estadstica
Mrec()
1
=
N(1 ) N
n1
xifi +
xi fi ,
i = n1 + 1
i = n2 +1
n2
xi
fi +
i =1
donde
xi = marca de clase que pertenece a la clase i
12
Probabilidad y Estadstica
8. PERCENTILES
8.1. Definicin (Percentil). El k-simo percentil de una muestra aleatoria se define como el
valor que ocupa una posicin tal en la muestra ordenada que aproximadamente el k% de
m<
k
N m + 1 , con m N .
100
Observacin
3.
acerca
las
de
Consideraciones
medidas
de
localizacin:
El percentil k-simo tambin es
llamado medida de localizacin
La mediana es considerada como
el percentil 50 es decir P50 = Me
El cuartil k-simo (Qk ) es una
Q4 = P100
(Dk )
es una
Para P25 :
m<
El decil k-simo
25
24 m + 1 m < 6 m + 1
100
m = 5 P25 = x6 = 3.9
D10 = P100
Para P30 :
m<
30
24 m + 1 m < 7.2 m + 1 m = 7 P30 = x8 = 3.9
100
m<
75
24 m + 1 m < 18 m + 1 m = 17 P75 = x18 = 5.6
100
Para P75 :
P25 , P30
y P75
respectivamente.
Para P25 :
m<
25
50 m + 1 m < 12.5 m + 1 m = 12 P25 = x13 = 3
100
13
Probabilidad y Estadstica
Para P30 :
m<
30
50 m + 1 m < 15 m + 1 m = 14 P30 = x15 = 3
100
Para P75 :
m<
75
50 m + 1 m < 37.5 m + 1 m = 37 P75 = x38 = 6
100
8.3. Clculo para datos agrupados por intervalos o uso de clases continuas:
El percentil k-simo (Pk ) ser igual a xm +1 , es decir Pk = xm +1 , siempre y cuando se
verifique que
m<
k
N m + 1 , con m N .
100
En primer lugar se identifica la clase j donde est el dato que ocupa la posicin
encontrada anteriormente. Una vez ubicada la clase se procede a estimar el percentil ksimo de la muestra usando la expresin
Pk = LIj +
k
100
N Fj 1
fj
(LS j LIj )
P25 , P30
y P75
respectivamente.
Para P25 :
m<
25
50 m + 1 m < 12.5 m + 1 m = 12 P25 = x13
100
1.529
1.561
1.545
15
23
0.30
0.46
P25 = 1.529 +
25
100
50 8
15
4.5
(0.032) = 1.5386
15
14
Probabilidad y Estadstica
Para P30 :
m<
30
50 m + 1 m < 15 m + 1 m = 14 P30 = x15
100
1.529
1.561
1.545
15
23
0.30
0.46
P30 = 1.529 +
30
100
50 8
15
7
(0.032) = 1.5439
15
Para P75 :
m<
75
50 m + 1 m < 37.5 m + 1 m = 37 P75 = x38
100
1.593
1.625
1.609
44
0.18
0.88
75
100
50 35
9
2.5
(0.032) = 1.6019
9
Ejemplo del pago del uso del servicio telefnico en dos aos:
Se desean encontrar los percentiles 25, 30 y 75, es decir P25 , P30 y P75 .
Para P25 :
m<
25
100 m + 1 m < 25 m + 1 m = 24 P25 = x25
100
3.86
3.94
3.90
11
31
0.11
0.31
P25 = 3.86 +
25
100
100 20
11
5
(0.08) 3.8964
11
Para P30 :
m<
30
100 m + 1 m < 30 m + 1 m = 29 P30 = x30
100
15
Probabilidad y Estadstica
3.86
3.94
3.90
11
31
0.11
0.31
P30 = 3.86 +
30
100
100 20
11
10
(0.08) = 3.9327
11
Para P75 :
m<
75
100 m + 1 m < 75 m + 1 m = 74 P75 = x75
100
4.02
4.10
4.06
22
76
0.22
0.76
P75 = 4.02 +
9.
9
75
100
100 54
22
21
(0.08) = 4.0964
22
INTERVALO INTERCUARTIL
16
Probabilidad y Estadstica
10.
9
DEFINICIONES DE INTERS
10.1. Varianza
de
una
muestra.
Promedio
Observacin 4. Consideraciones
acerca de las medidas de dispersin:
Para conocer la varianza de la
muestra, previamente se debe
conocer la media de la muestra
La justificacin de la frmula de
la varianza corregida de la
muestra se halla en el estudio de
estimadores
insesgados
en
Estadstica
La desviacin estndar de la
muestra
posee
las
mismas
unidades que tienen los datos de
la muestra
El coeficiente de variacin, el
sesgo y la curtosis de la muestra
son adimensionales, es decir, no
poseen unidades
El
sesgo
y
la
curtosis
proporcionan informacin acerca
de la forma de la distribucin de
la muestra
10.7. Curtosis de una muestra. Es la relacin entre el promedio aritmtico de las diferencias
entre cada dato y la media de la muestra elevadas a la cuatro, y el cuadrado de la
varianza de la muestra.
17
Probabilidad y Estadstica
11.
9
1
S =
N
2
fi (xi M)2
i =1
1
S =
N
2
1
N
i =1
n
i =1
1
fi (xi M) =
N
2
fi (xi2
i =1
fixi2
2
N
1
2xiM + M ) =
N
2
fixiM +
i =1
1
N
2
(fixi2 2fixiM + fM
)
i
i =1
2
=
fM
i
i =1
1
N
fixi2 2M2 + M2 = M2 M2
i =1
S2c
1
=
N1
i =1
N 1
fi (xi M) =
.
N1 N
2
fi (xi M)2 =
i =1
N
.S2
N 1
S = + S2
11.4. Desviacin estndar corregida de la muestra (Sc ) .
Sc = + S2c
11.5. Coeficiente de variacin de la muestra (CV).
S
CV =
M
11.6. Sesgo de la muestra (SE).
n
SE =
1
3
NS
fi (xi M)3
i =1
18
Probabilidad y Estadstica
K=
1
NS4
fi (xi M)4
i =1
n = 7 , N = 24 , M = 4.5458
Primera forma para su clculo:
1
S2 =
(2.8 4.5458)2 + 4(3.2 4.5458)2 + ... + 3(5.6 4.5458)2 + 4(6 4.5458)2
24
24.7596
=
= 1.0317
24
Segunda forma para su clculo:
1
520.71
(4.5458)2 = 1.0317
S2 =
(2.8)2 + 4(3.2)2 + ... + 3(5.6)2 + 4(6)2 (4.5458)2 =
24
24
Varianza corregida de la muestra (S2c ) .
N
24
.S2 =
1.0317 1.0766
N1
23
S2c =
SE =
1
3
NS
fi (xi M)3 =
i =1
0.1047
24 (1.0157)3
= 0.0042
K=
1
NS
i =1
fi (xi M)4 =
44.7672
24 (1.0157)4
= 1.7526
50
50
Segunda forma para su clculo:
1
1759
S2 =
3(1)2 + 7(2)2 + ... + 1(15)2 + 1(16)2 (4.94)2 =
(4.94)2 = 10.7764
50
50
19
Probabilidad y Estadstica
N
50
10.7764 = 10.9963
.S2 =
N1
49
S2c =
SE =
1
3
NS
fi (xi M)3 =
i =1
2866
50 (3.2827)3
= 1.6204
K=
12.
9
1
NS4
fi (xi M)4 ==
i =1
32463
50 (3.2827)4
= 5.5911
Sean
xi = marca de clase que pertenece a la clase i
n = nmero de clases
N = tamao de la muestra
Una frmula para su clculo:
n
1
S =
N
2
fi (xi M)2
i =1
S2c =
N
.S2
N 1
20
Probabilidad y Estadstica
SE =
1
3
NS
fi (xi M)3
i =1
K=
1
NS
fi (xi M)4
i =1
50
Segunda forma de clculo: S2 = M2 M2 = 2.4628 (1.56868)2 = 0.0021
S2c =
N
50
.S2 =
0.0021 0.0021
N1
49
SE =
1
NS3
fi (xi M)3 =
i =1
3.7434 105
50 (0.0458)3
= 0.0078
K=
1
NS4
i =1
fi (xi M)4 =
5.5862 104
50 (0.0458)4
= 2.5391
Ejemplo del pago del uso del servicio telefnico en dos aos:
21
Probabilidad y Estadstica
100
Segunda forma de clculo: S2 = M2 M2 = 16 (3.9976)2 = 0.02
Varianza corregida de la muestra (S2c ) .
S2c =
N
100
.S2 =
0.02 0.0202
N1
99
SE =
1
NS3
fi (xi M)3 =
i =1
0.0260
100 (0.1414)3
= 0.0920
K=
13.
9
1
4
NS
fi (xi M)4 =
i =1
0.1340
100 (0.1414)4
= 3.3520
representar los tres cuartiles y los valores mnimo y mximo de la muestra con la
finalidad de definir la ubicacin de algunos valores de la muestra que no tienen un
comportamiento tpico o esperado y perfectamente podran deberse a errores en la
recoleccin y manipulacin de la muestra.
La figura 3 revela toda la informacin que se puede representar en un diagrama de caja.
22
Probabilidad y Estadstica
Ejemplo 2. La figura 5 representa un diagrama de caja por cada mes que muestra los
niveles de precipitacin de los ltimos 38 aos en la estacin de San Fernando de Apure.
400
300
200
100
0
PRECIPITACIN (mm)
500
ENE
FEB
MAR
ABR
MAY
JUN
JUL
AGO
SEP
OCT
NOV
DIC
23
Probabilidad y Estadstica
PROBLEMA 1.
Se toma una muestra de 60 obreros de una fbrica y se quiere hacer un estudio del salario
semanal (en miles de bolvares). Se obtuvo la siguiente informacin presentada en el cuadro
adjunto.
Salario
(Bs/sem)
Punto
medio
Frecuencia
absoluta
Frecuencia absoluta
acumulada
Frecuencia
relativa
Frecuencia relativa
acumulada
[20,24]
22
8/60
8/60
[25,29]
27
11
19
11/60
19/60
[30,34]
32
23
4/60
23/60
[35,39]
37
30
7/60
30/60
[40,44]
42
12
42
12/60
42/60
[45,49]
47
51
9/60
51/60
[50,54]
52
60
9/60
60/60
f1x1 + f2 x2 + f3x3 + f4 x4 + f5 x5 + f6 x6 + f7 x7
60
8 22 + 11 27 + 4 32 + 7 37 + 12 42 + 9 47 + 9 52 2255
=
=
37.583
60
60
M=
b. Determine el porcentaje de obreros que tienen salarios mayores o iguales a 25.000 Bs pero
igual o menor a 44.000 Bs
SOLUCIN.
f + f3 + f4 + f5
11 + 4 + 7 + 12
34
Porcentaje = 2
100 =
100 =
100 56.67%
60
60
60
c. Calcule la moda
SOLUCIN.
Clase modal:
Salario
(Bs/sem)
Punto
medio
Frecuencia
absoluta
Frecuencia absoluta
acumulada
Frecuencia
relativa
Frecuencia relativa
acumulada
[40,44]
42
12
42
12/60
42/60
24
Probabilidad y Estadstica
Moda = 40 +
12 7
5
20 340
4 = 40 + 4 = 40 +
=
= 42.5
12 7 + 12 9
8
8
8
Punto
medio
Frecuencia
absoluta
Frecuencia absoluta
acumulada
Frecuencia
relativa
Frecuencia relativa
acumulada
[25,29]
27
11
19
11/60
19/60
15 8
7
28 303
4 = 25 +
4 = 25 +
=
27.55
11
11
11
11
45 44 < 45 45 P75 = x45
P25 = 25 +
Clase P75 : 44 <
75 60
100
Salario
(Bs/sem)
Punto
medio
Frecuencia
absoluta
Frecuencia absoluta
acumulada
Frecuencia
relativa
Frecuencia relativa
acumulada
[45,49]
47
51
9/60
51/60
P75 = 45 +
45 42
3
12 417
4 = 45 + 4 = 45 +
=
46.33
9
9
9
9
Finalmente
PROBLEMA 2.
60 datos han sido agrupados en una distribucin de frecuencias de 6 clases de igual amplitud.
Se dispone de la siguiente informacin acerca de esa distribucin de frecuencias:
La mediana es 26
El 20% de los datos es superior a 38
H3 = 0.3
h3 = 0.1
F4 = 48
f1 = f5 =
1
f
2 6
SOLUCIN.
h3 = 0.1
f3
60
= 0.1 f3 = 6 . H3 = 0.3
F3 = F2 + f3 = 18 F2 + 6 = 18 F2 = 12 .
F3
60
= 0.3 F3 = 18 .
F4 = F3 + f4 = 48 18 + f4 = 48 f4 = 30 .
25
Probabilidad y Estadstica
80
100
60 18
30
(LS4 LI4 )
4
LI4 + (LS4 LI4 ) = 38
LS4 = 38
LS4 = 38
f1 + f2 + f3 + f4 + f5 + f6 = 60 f1 + f2 + 6 + 30 + f5 + f6 = 60 f1 + f2 + 36 + f5 + f6 = 60
f1 + f2 + f5 + f6 = 24 4f1 + f2 = 24 4f1 + F2 f1 = 24
3f1 + F2 = 24 3f1 = 12 f1 = 4 f5 = 4 f6 = 8
Finalmente f1 + f2 = F2 f2 = F2 f1 = 12 4 = 8
A continuacin se muestra la distribucin de frecuencias de los datos:
Marca de
Clase
Inicio
Fin
clase
fi
Fi
hi
Hi
(xi)
1
-42
-22
-32
4/60
4/60
-22
-2
-12
12
8/60
12/60
-2
18
18
6/60
18/60
18
38
28
30
48
30/60
48/60
38
58
48
52
4/60
52/60
58
78
68
60
8/60
PROBLEMA 3.
Considere un lote de 300 muestras distribuidas en forma simtrica en seis intervalos de igual
f3 = 2f1
26
Probabilidad y Estadstica
Inicio
Fin
de clase
fi
Fi
hi
Hi
(xi)
1
10
15
12.5
25
25
25/300
25/300
15
20
17.5
75
100
75/300
100/300
20
25
22.5
50
150
50/300
150/300
25
30
27.5
50
200
50/300
200/300
30
35
32.5
75
275
75/300
275/300
35
40
37.5
25
300
25/300
PROBLEMA 4.
Para estudiar la cantidad de errores ortogrficos cometidos por un conjunto de 60 estudiantes
al tomar un dictado, se organizaron los datos en una tabla de distribucin de frecuencias de
seis clases de igual amplitud. De dicha distribucin solo se conoce la siguiente informacin:
a. en la cuarta clase se tiene el doble de datos que en la sexta clase
b. las clases uno y cinco tienen igual nmero de datos
c. la clase tres tiene la mayor cantidad de datos igual a 25
d. la mediana de los datos es igual a 10.24
e. el extremo inferior de la clase 6 es 20
f. por encima de la clase tres hay 19 datos
g. el nmero de datos de la clase dos triplica al nmero de datos de la clase uno
Construya la distribucin de frecuencias para esos datos.
SOLUCIN.
Informacin suministrada:
f4 = 2f6 , f1 = f5 , f3 = 25 , f4 + f5 + f6 = 19 , f2 = 3f1 , LI6 = 20
Se sabe que
f1 + f2 + f3 + f4 + f5 + f6 = 60 f1 + 3f1 + 25 + 19 = 60 4f1 = 16 f1 = 4
Por lo tanto:
f2 = 12 , f5 = 4 .
Por otro lado
f4 + f5 + f6 = 19 3f6 + 4 = 19 f6 = 5 f4 = 10
Hasta ahora se tiene la siguiente informacin:
27
Probabilidad y Estadstica
Clase
Inicio
1
2
a
a+d
Fin
a+d
fi
Fi
hi
Hi
4/60
4/60
a + 2d
12
16
12/60
16/60
a + 2d
a + 3d
25
41
25/60
41/60
a + 3d
a + 4d
10
51
10/60
51/60
a + 4d
55
4/60
55/60
20
20
a + 6d
60
5/60
mediana = LI3 +
N
2
F2
f3
30 16
d = 10.24
25
(LS3 LI3 ) = a + 2d +
64
d = 10.24 25a + 64d = 256
25
Por otro lado se tiene que a + 5d = 20
a+
a + 5d = 20
Finalmente la tabla de distribucin de frecuencias de los datos se muestra a continuacin:
Clase
Inicio
Fin
fi
Fi
hi
Hi
4/60
4/60
12
16
12/60
16/60
12
25
41
25/60
41/60
12
16
10
51
10/60
51/60
16
20
55
4/60
55/60
20
24
60
5/60
PROBLEMA 5.
Se tienen los datos correspondientes al peso (en Kg.) de 200 productos, organizados en una
distribucin de frecuencias formada por 6 intervalos de clases de igual amplitud, con las
caractersticas siguientes:
La diferencia entre el percentil 90 y el percentil 2 es 0.88
Si se elimina el 5% inferior de los datos y el 10% superior de los datos, el peso promedio es
de 0.5776 Kg
La primera clase contiene el 5% de los datos
La mediana es el lmite superior de la tercera clase
La frecuencia acumulada absoluta de la segunda clase es 40
F4 F3 = 64
5f6 = 4f5
SOLUCIN.
Jos Luis Quintero
28
Probabilidad y Estadstica
Informacin suministrada:
P90 P2 = 0.88 , f1 = 10 , Me = LS3 , F2 = 40 , F4 F3 = 64
Clculos
F2 = 40 f1 + f2 = 40 10 + f2 = 40 f2 = 30
F4 F3 = 64 F3 + f4 F3 = 64 f4 = 64
Me = LS3 = LI3 +
100 40
100 40
(LS3 LI3 )
= 1 f3 = 60
f3
f3
m<
2
200 m + 1 m = 3 P2 = x 4
100
P90 :
90
200 m + 1 m = 179 P90 = x180
100
2 200 F
2 200 0
0
P2 = LI1 + 100
(LS1 LI1 ) = LI1 + 100
(LS1 LI1 ) = LI1 + 0.4(LS1 LI1 )
f1
10
m<
P90 = LI5 +
90
100
200 F4
f5
90
100
200 164
20
P90 P2 = (LI5 LI1 ) + 0.8(LS5 LI5 ) 0.4(LS1 LI1 ) = 4d + 0.4d = 0.88 d = 0.2
5
1
170
fixi = 0.5776
i=2
fixi = 98.192
i=2
i=2
Clase
Inicio
Fin
Marca
de clase
fi
Fi
hi
Hi
(xi)
1
0.0
0.2
0.1
10
10
0.05
0.05
0.2
0.4
0.3
30
40
0.15
0.20
0.4
0.6
0.5
60
100
0.30
0.50
0.6
0.8
0.7
64
164
0.32
0.82
0.8
1.0
0.9
20
184
0.10
0.92
1.0
1.2
1.1
16
200
0.08
1.00
29
Probabilidad y Estadstica
PROBLEMA 6.
Se desea distribuir en 7 clases los datos de la vida til, medida en meses, de 50 bateras para
automviles. Para ello se dispone de la siguiente informacin acerca de esa distribucin:
La mediana de la vida til de las bateras es de 20 meses
SOLUCIN.
Codificacin de la informacin suministrada:
Me = P50 = 20 ; f1 + f2 + f3 = 10 ; f5 + f6 + f7 = 25 ; f6 = f2 + f3 ; f5 = 11
f7 = 6 ; f7 = 2f2 ; P10 = 10 ; f1 + f2 + f3 + f4 + f5 + f6 + f7 = 50
Usando algunas de las anteriores relaciones se tiene que
f7 = 6 f2 = 3 ; f5 = 11 f6 = 8 f3 = 5 f1 = 2 f4 = 15
Se tiene hasta ahora la siguiente distribucin de frecuencias:
Marca de clase (xi)
Clase
Inicio
Fin
fi
Fi
hi
Hi
a+d
a + d/2
0.04
0.04
a+d
a + 2d
a + d + d/2
0.06
0.10
a + 2d
a + 3d
a + 2d + d/2
10
0.10
0.20
a + 3d
a + 4d
a + 3d + d/2
15
25
0.30
0.50
a + 4d
a + 5d
a + 4d + d/2
11
36
0.22
0.72
a + 5d
a + 6d
a + 5d + d/2
44
0.16
0.88
a + 6d
a + 7d
a + 6d + d/2
50
0.12
1.00
De la distribucin anterior se observa que la clase medianal es la clase 4 y se puede inferir que 20
es el lmite superior de la clase 4, por lo tanto se tiene que a + 4d = 20 . Por otro lado se puede
inferir tambin que el percentil 10 est en la clase 2 y 10 es su lmite superior. Este hecho genera
la ecuacin a + 2d = 10 . De las dos ecuaciones se tiene que a = 0 ; d = 5 . Por lo tanto
Clase
Inicio
Fin
fi
Fi
Hi
Hi
2.5
0.04
0.04
10
7.5
0.06
0.10
10
15
12.5
10
0.10
0.20
15
20
17.5
15
25
0.30
0.50
20
25
22.5
11
36
0.22
0.72
25
30
27.5
44
0.16
0.88
30
35
32.5
50
0.12
1.00
30
Probabilidad y Estadstica
31
Probabilidad y Estadstica
Punto
medio
Frecuencia
absoluta
Frecuencia absoluta
acumulada
Frecuencia
relativa
Frecuencia relativa
acumulada
[20,24]
22
8/60
8/60
[25,29]
27
11
19
11/60
19/60
[30,34]
32
23
4/60
23/60
[35,39]
37
30
7/60
30/60
[40,44]
42
12
42
12/60
42/60
[45,49]
47
51
9/60
51/60
[50,54]
52
60
9/60
60/60
h3 = 0.1
F4 = 48
f1 = f5 =
1
f
2 6
8. Considere un lote de 300 muestras distribuidas en forma simtrica en seis intervalos de igual
amplitud. Se dispone de la siguiente informacin acerca de esa distribucin de frecuencias:
La mediana es 25
El percentil 91.667 es 35
f2 = 3f1
32
Probabilidad y Estadstica
f3 = 2f1
5f6 = 4f5
33
Probabilidad y Estadstica
34
Probabilidad y Estadstica
400
300
200
100
0
PRECIPITACIN (mm)
500
ENE
FEB
MAR
ABR
MAY
JUN
JUL
AGO
SEP
OCT
NOV
DIC
Analice el siguiente grfico considerando los siguientes aspectos de inters: media aritmtica y
mediana por mes, datos atpicos, rango intercuartlico y comportamiento de la precipitacin.
18. Una empresa productora de antenas satelitales tiene tres mquinas dedicadas a la produccin
de antenas cuyo radio de pantalla debe ser de 11 cm. Debido a desperfectos en las mquinas
el radio de cada pantalla vara dificultando la calidad de las antenas producidas. Por esta
razn, el Departamento de Control de Calidad de la empresa ha decidido tomar una muestra
de 11 antenas de cada mquina para verificar su radio. La tabla siguiente presenta los
resultados obtenidos de las muestras tomadas.
Jos Luis Quintero
35
Probabilidad y Estadstica
N de la muestra
1
2
3
4
5
6
7
8
9
10
11
Mquina 1
Mquina 2
Mquina 3
11,6
12,2
11,8
11,2
11,7
11,2
11,3
11,7
11,5
11,8
12,0
11,5
11,7
11,9
11,6
11,0
11,5
11,2
9,6
11,4
10,4
10,1
11,4
10,2
10,2
11,2
11,2
9,5
11,4
10,7
9,6
11,3
10,4
Radios dados en centmetros
Con base en los diagramas de caja y bigotes para las 3 mquinas, qu podra decir usted acerca
de la calidad del lote de produccin analizado? Tome en cuenta localizacin y dispersin de la
muestra en su respuesta.
19. Se desea distribuir en 7 clases los datos de la vida til, medida en meses, de 50 bateras para
automviles. Para ello se dispone de la siguiente informacin acerca de esa distribucin:
La mediana de la vida til de las bateras es de 20 meses
Las tres primeras clases contienen un total de 10 datos
La mitad de los datos est en las tres ltimas clases
La suma de los datos de las clases 2 y 3 es igual al nmero de datos de la clase 6
En la clase 5 hay 11 datos y en la clase 7 hay 6 datos
f7 = 2f2 y P10 = 10
Obtenga la distribucin de frecuencias de la vida til de las 50 bateras.
20. Construya el diagrama de caja y bigotes para los datos del ejercicio anterior.
36
Probabilidad y Estadstica
RESPUESTAS
1. a. F b. F c. F d. V
3. M = Me =
n+1
2
n + 1 2
n impar
(n + 1)(2n + 1)
2
4. M =
, Me =
2
6
n + 1
1
n par
+
4
2
5. S2 =
n2 1
n(n + 1)
, S2c =
12
12
Inicio
Fin
Marca de
clase
fi
Fi
hi
Hi
(xi)
1
-42
-22
-32
4/60
4/60
-22
-2
-12
12
8/60
12/60
-2
18
18
6/60
18/60
18
38
28
30
48
30/60
48/60
38
58
48
52
4/60
52/60
58
78
68
60
8/60
8.
Marca
Clase
Inicio
Fin
de clase
Fi
Fi
hi
Hi
(xi)
1
10
15
12.5
25
25
25/300
25/300
15
20
17.5
75
100
75/300
100/300
20
25
22.5
50
150
50/300
150/300
25
30
27.5
50
200
50/300
200/300
30
35
32.5
75
275
75/300
275/300
35
40
37.5
25
300
25/300
Clase
Inicio
Fin
fi
Fi
hi
Hi
4/60
4/60
12
16
12/60
16/60
12
25
41
25/60
41/60
12
16
10
51
10/60
51/60
16
20
55
4/60
55/60
20
24
60
5/60
9.
37
Probabilidad y Estadstica
10.
Clase
Inicio
Fin
Marca
de clase
fi
Fi
hi
Hi
(xi)
1
0.0
0.2
0.1
10
10
0.05
0.05
0.2
0.4
0.3
30
40
0.15
0.20
0.4
0.6
0.5
60
100
0.30
0.50
0.6
0.8
0.7
64
164
0.32
0.82
0.8
1.0
0.9
20
184
0.10
0.92
1.0
1.2
1.1
16
200
0.08
1.00
11.
12.
38
Probabilidad y Estadstica
13.
14.
RANGO INTERCUARTIL = 20
15.
39
Probabilidad y Estadstica
16.
Inicio
Fin
Marca de
clase
fi
Fi
hi
Hi
(xi)
1
2.5
0.04
0.04
10
7.5
0.06
0.10
10
15
12.5
10
0.10
0.20
15
20
17.5
15
25
0.30
0.50
20
25
22.5
11
36
0.22
0.72
25
30
27.5
44
0.16
0.88
30
35
32.5
50
0.12
1.00
40
BIBLIOGRAFA
GENERAL
ROBABILIDADES (ITEL-30205)
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
http://www.joseluisquintero.com/