Sei sulla pagina 1di 11

EJERCICIOS

Ejercicio 1
Los siguientes datos son los lapsos, en minutos, necesarios para que 50 clientes de un banco
comercial lleven a cabo una transacción bancaria:

a. Construir la distribución de frecuencia relativa.


b. Construir la distribución de frecuencia relativa absoluta.
Solución:
Para la construcción de esta distribución, debemos, en primer lugar, ordenar los datos de menor a
mayor.
Tenemos entonces:
0.2 0.4 0.4 0.4 0.5
0.5 0.7 0.8 0.9 1.1
1.2 1.2 1.3 1.3 1.4
1.4 1.5 1.6 1.8 1.9
2.3 2.4 2.4 2.5 2.7
2.8 2.8 2.9 3.1 3.3
3.3 3.4 3.7 3.8 4.2
4.4 4.6 4.7 5.2 5.5
5.6 5.8 6.2 6.3 6.8
7.2 7.6 7.8 9.5 9.7

Seguidamente, vamos a encontrar los intervalos de clase para agrupar los datos:
Para determinar el número de intervalos que vamos a encontrar, utilizamos la fórmula de
Sturges: k =1+3.32 log(n)
Donde, k =número de intervalos
n=número de datos (50)
Para este caso: k =1+3.32 log (50)
k =1+3.32∗1.6989
k =1+5.64
k =6.64
k ≈7
Vamos a trabajar, entonces, con 7 intervalos.
Ahora, debemos hallar la amplitud de los intervalos, utilizando la siguiente fórmula:
rango
c=
nro de intervalos
rango=dato máximo−dato mínimo
rango=9.7−0.2=9.5
Entonces:
9.5
c= =1.357 ≈ 1.4
7
Para encontrar la amplitud de los intervalos, procedemos a formar los intervalos, que en nuestro
caso van a ser 7.
Al menor de los datos le agregamos el valor calculado anteriormente (1.4) y así sucesivamente
hasta completar los 7 intervalos:
intervalo Marca de clase( x i) Frec. Absoluta( f i) Frec. relativa %
0.2 - 1.6 0.9 17 17/50=0.34 34%
1.6 – 3.0 2.3 11 11/50=0.22 22%
3.0 - 4.4 3.7 7 7/50=0.14 14%
4.4 – 5.8 5.1 6 6/50=012 12%
5.8 – 7.2 6.5 4 4/50=0.08 8%
7.2 – 8.6 7.9 3 3/50=0.06 6%
8.6 – 10.0 9.3 2 2/50=0.04 4%

Como podemos observar en la tabla anterior, la frecuencia absoluta se encontró sumando los
datos de los lapsos de tiempo incluidos en cada intervalo dado. Luego de esto, se encuentra la
frecuencia relativa que como podemos observar en la tabla, es la relación que existe entre la
frecuencia absoluta de cada intervalo con el número total de los datos.
c. Con los datos agrupados calcule la media, mediana, moda, desviación estándar y desviación
media.
Solución:
Media:
Cuando los datos se presentan mediante una distribución de clases y frecuencias todos los
valores caen dentro de unos intervalos de clase dados, en este caso hay que considerar el
promedio de cada uno y por lo tanto se utiliza la “marca de clase” o punto medio de cada
intervalo que se lo representa con la letra x i.
Tenemos entonces:
intervalo Marca de clase( x i) Frec. Absoluta( f i) x i. f i
0.2 - 1.6 0.9 17 15.3
1.6 – 3.0 2.3 11 25.3
3.0 - 4.4 3.7 7 25.9
4.4 – 5.8 5.1 6 30.6
5.8 – 7.2 6.5 4 26
7.2 – 8.6 7.9 3 23.7
8.6 – 10.0 9.3 2 18.6
Totales: 50 165.4

La fórmula para hallar la media es:

X́ =
∑ xi . f i
N
165.4
Entonces procedemos: X́ = =4,552
50
X́ =3.308
R/ La media en este caso es de 3.308

Mediana:
Para calcular la mediana debemos conocer la frecuencia absoluta acumulada, así:
intervalo Frec. Frec.Abs.
f
Absoluta( i) Acumulada( F i
)
0.2 - 1.6 17 17
1.6 – 3.0 11 28
3.0 - 4.4 7 35
4.4 – 5.8 6 41
5.8 – 7.2 4 45
7.2 – 8.6 3 48
8.6 – 10.0 2 50
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la
suma de las frecuencias absolutas. 
N
Es decir, tenemos que buscar el intervalo en el que se encuentre, o sea:
2
N 50
Entonces: = =25
2 2
Buscamos este valor en la columna de frecuencias absolutas acumuladas y tendríamos que
ubicarlo en el intervalo 1.6 – 3.0.
Trabajamos con la siguiente fórmula:
N
−F i−1
2
Me=Li + ∗A
fi
Donde:
Li : Es el límite inferior de la clase donde se encuentra la mediana
N
: Es la semisuma de las frecuencias absolutas
2
F i−1 : Es la frecuencia acumulada anterior a la clase mediana
f i : Es la frecuencia del intervalo mediano
A : Es la amplitud de los intervalos
Entonces, para este caso se tiene:
Li : 1.6
N
: 25
2
F i−1 : 17
f i : 11
A : 1.4
N
−F i−1
Reemplazando: Me=L + 2 ∗A
i
fi
25−17 8
Me=1.6+ ∗1.4=1.6+ =1.6+ 0,7272=1.1636
11 11
Me=1.1636
R/ La mediana en este caso es de 1.1636
Moda:
Es el valor que representa la mayor frecuencia absoluta. En tablas de frecuencias con datos
agrupados, hablamos de intervalo modal. 
Cuando todos los intervalos tienen la misma amplitud, como en este caso, trabajamos con la
f i−f i−1
siguiente fórmula: Mo=Li + ∗A
( f i−f i−1 ) +( f i−f i +1)
Lo primero que debemos hacer es identificar el intervalo modal así:
intervalo Frec. Frec.Abs.
Absoluta( f i) Acumulada( F i
)
0.2 - 1.6 17 17
1.6 – 3.0 11 28
3.0 - 4.4 7 35
4.4 – 5.8 6 41
5.8 – 7.2 4 45
7.2 – 8.6 3 48
8.6 – 10.0 2 50

Donde:
Li : es el extremo inferior del intervalo modal
f i : es la frecuencia absoluta del intervalo modal
f i−1 : es la frecuencia absoluta del intervalo anterior al modal
f i+1 : es la frecuencia absoluta del intervalo posterior al modal
A : es la amplitud de los intervalos
Para este caso tenemos:
Li : 1.6
f i : 17
f i−1 : 0
f i+1 : 11
A : 1.4
f i−f i−1
Reemplazamos en: Mo=Li + ∗A
( f i−f i−1 ) +(f i−f i +1)
17−0 17 17
Mo=1.6+ ∗1.4=1.6+ =1.6 + =1.6+0,7391=1.1825
( 17−0 ) +(17−11) 17+6 23
Mo=1.1825
R/ La moda en este caso es de 1.1825

Desviación estándar:
La desviación típica, o desviación estándar, es la raíz cuadrada positiva de la varianza, es decir:
σ =√ σ 2
Entonces, hemos de calcular primero la varianza:
Para hallar la varianza en datos agrupados, construimos la tabla de frecuencias y luego
2

utilizamos la fórmula: σ 2 ∑ ( xi − X́ ) ∗f i
=
N
Ahora construimos la tabla, sabiendo que X́ =3.308 que la calculamos anteriormente:
2 2
intervalo Marca de Frec. ( x i− X́ ) ( x i− X́ ) ∗f i
clase( x i) Absoluta( f i)
0.2 - 1.6 0.9 17 5.798 98.566
1.6 – 3.0 2.3 11 1.016 11.176
3.0 - 4.4 3.7 7 0.153 1.071
4.4 – 5.8 5.1 6 3.211 19.266
5.8 – 7.2 6.5 4 10.188 40.752
7.2 – 8.6 7.9 3 21.086 63.258
8.6 – 10.0 9.3 2 35.904 71.808
Totales: N=50 305.897
2

Entonces, reemplazamos en la fórmula: σ 2=


∑ ( xi − X́ ) ∗f i
N
305.897
σ 2= =6.1179
50

σ 2=6.1179 minutos²

Ahora, procedemos a calcular la desviación estándar de σ =√ σ 2


Entonces, para este caso tenemos:
σ =√ 6.1179 minutos ²
σ =2,4734 minutos
R/ La desviación estándar en este caso es de 2,4734minutos.

Desviación media:
Para calcular en este caso, la desviación media, utilizamos la siguiente fórmula:

DM=
∑ |x i−x́|. f i
N
Elaboramos la siguiente tabla, con las casillas necesarias:
intervalo Marca de Frec. |x i−x́| |x i−x́|. f i
clase( x i) Absoluta( f i)
0.2 - 1.6 0.9 17 2.408 40.936
1.6 – 3.0 2.3 11 1.008 11.088
3.0 - 4.4 3.7 7 0.392 2.744
4.4 – 5.8 5.1 6 1.792 10.752
5.8 – 7.2 6.5 4 3.192 12.768
7.2 – 8.6 7.9 3 4.592 13.776
8.6 – 10.0 9.3 2 5.992 11.984
Totales: N=50 104.048

Reemplazamos en: D M =
∑ |x i−x́|. f i
N
104.048
DM=
50
D M =2.081
R/ La desviación media en este caso es de 2.081minutos.

Ejercicio 3

El consumo de combustible, en Km por litro, de automóviles de cierto modelo tiene una media
de 10 y una desviación típica de 2. Puede asumirse que la distribución poblacional es normal. Se
toma una muestra aleatoria de 6 automóviles, entonces:

a. Hallar la varianza de la media muestral.


b. Hallar el error estándar de la media muestral.

SOLUCION

a.
s=
√ ∑ (x i− x́ )2
i=1
n−1
Con este concepto claro sobre lo que es la desviación típica procedemos a calcular el efecto
contrario, por tanto elevamos al cuadrado la desviación típica y así tenemos la varianza

Varianza=s 2

Varianza=22

Varianza=4

s 2
b. s x́ = = ≈ 0.816
√n √ 6
Ejercicio 4

Aquí se presentan 3 conjuntos de datos:

a) 1 ,2 , 3 , 4 ,5 , 6
b) 1 ,1 , 1 ,6 ,6 , 6
c) −13 , 2 ,3 , 4 ,5 , 20
 Calcular la media y la varianza para cada conjunto de datos
 ¿Qué puede concluir?

SOLUCION:

Media:

1+2+3+4 +5+6 21
a) x́= = =3.5
6 6
1+1+ 1+ 6+6+6 21
b) x́= = =3.5
6 6
−13+2+3+ 4+5+20 21
c) x́= = =3.5
6 6

Varianza:

a) σ 2=
[ ( 1−3.5 )2+ ( 2−3.5 )2 + ( 3−3.5 )2+ ( 4−3.5 )2 + ( 5−3.5 )2+ ( 6−3.5 )2 ]
6
2 [ (−2.5 )2+ (−1.5 )2+ (−0.5 )2+ ( 0.5 )2 + ( 1.5 )2+ ( 2.5 )2 ]
σ =
6

17.5
σ 2= =2.91 6́
6

2 [ ( 1−3.5 )2+ ( 1−3.5 )2 + ( 1−3.5 )2 + ( 6−3.5 )2 + ( 6−3.5 )2+ ( 6−3.5 )2 ]


b) σ =
6

2 [ (−2.5 )2+ (−2.5 )2+ (−2.5 )2+ ( 2.5 )2+ ( 2.5 )2+ ( 2.5 )2 ]
σ = =¿
6

37.5
σ 2= =6.25
6

c) σ 2=
[ (−13−3.5 )2 + ( 2−3.5 )2+( 3−3.5 )2 + ( 4−3.5 )2 + ( 5−3.5 )2 + ( 20−3.5 )2 ]
6

2 [ (−16.5 )2+ (−1.5 )2+ (−0.5 )2+ ( 0.5 )2+ ( 1.5 )2+ (16.5 )2 ]
σ =
6

549.5
σ 2= =91.583
6

Se puede concluir que sin importar si las medias de un conjunto de datos tengan el mismo
valor numérico, es posible que sus varianzas obtengan resultados distintos, debido a los
distintos valores de los datos usados en cada uno

Ejercicio 5

La siguiente tabla muestra las ventas, en miles de dólares de 20 vendedores de una compañía de
computadoras.
a. Calcular la media

b. Calcular la mediana

c. Calcular la desviación estándar

d. ¿Qué medias de tendencia central y de dispersión se elegirían y por qué?

SOLUCIÓN

a.
∑ xi
x́= i=1
n
851.2
x́= =42.56
20
b. Ordenamos los datos de menor a mayor para encontrar la mediana:
25.1, 25.4, 26.9, 28.7, 29.3, 31.7, 32.3, 35.6, 35.6, 36.8, 37.8, 39.7, 40.2, 42.9, 44.2, 45.2,
50.6, 55.2, 88.2, 99.8
Los datos resaltados son la mediana, procedemos entonces con la fórmula para mediana
del cardinal de datos pares:

36.8+37.8
me=
2

74.6
me=
2

me=37.3

c. Desviación estándar de la muestra:


n

s=
√ ∑ (x i− x́ )2
i=1
n−1

Tabla elaborada en Excel para agilizar cálculos:


datos X X-media (X-media)^2
1 40.2 -2.36 5.5696
2 26.9 -15.66 245.2356
3 44.2 1.64 2.6896
4 31.7 -10.86 117.9396
5 29.3 -13.26 175.8276
6 28.7 -13.86 192.0996
7 32.3 -10.26 105.2676
8 36.8 -5.76 33.1776
9 35.6 -6.96 48.4416
10 99.8 57.24 3276.4176
11 55.2 12.64 159.7696
12 45.2 2.64 6.9696
13 88.2 45.64 2083.0096
14 35.6 -6.96 48.4416
15 50.6 8.04 64.6416
16 25.1 -17.46 304.8516
17 42.9 0.34 0.1156
18 37.8 -4.76 22.6576
19 25.4 -17.16 294.4656
20 39.7 -2.86 8.1796
total 851.2 7195.768
media 42.56

7195.768
s=
√20−1
7195.768
s=
√ 19
s= √378.724632
s=19.46

d. ¿Qué medidas de tendencia central y de dispersión se elegirían y por qué?

Dependiendo de las necesidades de la empresa, en las medidas de tendencia central la media


muestral es muy útil para conocer el promedio de ventas. La medida de dispersión como la
desviación estándar y el coeficiente de variación nos permiten reconocer qué tan dispersos
están los datos respecto a la distribución.

Potrebbero piacerti anche