Sei sulla pagina 1di 5

Tarea (El alumno deberá llevar a la PC1 las salidas y respuestas a las preguntas siguientes, que de

preferencia deben de hacerse en R).

El archivo CLIENTES, disponible en la carpeta Documentos del campus virtual del curso, contiene
información respecto a una muestra de 697 clientes registrados en la base de datos de una
empresa que vende productos únicamente por internet. Los datos en el archivo corresponden a
mediciones de las siguientes variables. En caso de ser necesario use la regla de Sturges.

Edad: Clasificación del cliente según grupo etario (Joven/ Media/ Adulta)

Sexo: Sexo del cliente (Femenino/ Masculino)

Vivienda: Tipo de vivienda en la que habita el cliente (Propia/ Alquilada)

Ecivil: estado civil del cliente (Soltero/ Casado)

Salario: Sueldo anual del cliente (en dólares americanos)

Hijos: número de hijos del cliente

Historial: Clasificación del cliente según el volumen de compras anteriores (Bajo / Medio / Alto)

Monto: monto pagado por el último pedido realizado (en dólares americanos)

Use los datos en el archivo CLIENTES para resolver los siguientes ejercicios:

1. Construya la distribución de frecuencias de cada una de las variables cualitativas.

counts:
Ecivil
Casado Soltero
369 328
percentages:
Ecivil
Casado Soltero
52.94 47.06

counts:
EDAD_ORD
a.Joven b.Media c.Adulta
165 363 169
percentages:
EDAD_ORD
a.Joven b.Media c.Adulta
23.67 52.08 24.25

counts:
Historial_ORD
1.Bajo 2.Medio 3.Alto
230 212 255
percentages:
Historial_ORD
1.Bajo 2.Medio 3.Alto
33.00 30.42 36.59

counts:
Sexo
Femenino Masculino
357 340
percentages:
Sexo
Femenino Masculino
51.22 48.78

counts:
Vivienda
Alquilada Propia
328 369
percentages:
Vivienda
Alquilada Propia
47.06 52.94

2. Presente gráficamente la distribución de clientes por grupo etario.

3. Use un diagrama de puntos o bastones para presentar gráficamente la distribución de clientes


por número de hijos.
4. Grafique el histograma de los montos y el histograma de los salarios anuales de los clientes.
Halle también la ojiva para estos datos.

counts:
Monto_int
0-1000 1001-2000 2001-3000 3001-4000 4001-5000 5001-6000 6001-7000
375 198 82 30 5 6 1

percentages:
Monto_int
0-1000 1001-2000 2001-3000 3001-4000 4001-5000 5001-6000 6001-7000
53.80 28.41 11.76 4.30 0.72 0.86 0.14

5. Calcule los siguientes estadísticos para cada una de las variables cuantitativas: Mínimo, cuartil
1, cuartil 2, cuartil 3, máximo, media, desviación estándar.

> numSummary(clientes[,c("Hijos", "Monto", "Salario")], statistics=c("mean", "sd", "IQR", "quantiles", "cv",


+ "skewness"), quantiles=c(0,.25,.5,.75,1), type="2")
Promedio sd IQR cv skewnes 0% 25% 50% 75% 100% n
s
Hijos 9.010043e- 1.045082 2 1.159908 0.804681 0 0 1 2 3 69
01 4 8 7
Mont 1.206714e+ 1000.32168 1230 0.828963 1.584629 38 472 918 1702 6217 69
o 03 0 0 4 7
Salari 5.805466e+ 30703.9545 4670 0.528880 0.378552 1010 3320 5520 7990 16880 69
o 04 77 0 1 5 0 0 0 0 0 7

a) Grafique los histogramas de las distribuciones de los salarios de los clientes para cada
categoría de estado civil.
b) Use un diagrama de cajas para comparar las distribuciones de los salarios de los clientes
según estado civil.

c) Calcule los siguientes estadísticos para los salarios de los clientes en cada categoría de
estado civil: Mínimo, cuartil 1, cuartil 2, cuartil 3, máximo, media, desviación estándar.

mean sd IQR cv skewness 0% 25% 50% 75% 100% data:n


Casado 77102.98 26679.36 36500 0.346022 - 10100 60000 77800 96500 168800 369
4 0.02999815
Soltero 36625.30 18315.39 31975 0.500074 0.28743705 10200 19250 35400 51225 80800 328
8
6. Repita los análisis solicitados en la pregunta 6, ahora para comparar la distribución de los
montos según las categorías de edad.
mean sd IQR cv skewness 0% 25% 50% 75% 100% data:n
a.Joven 492.4303 454.4999 435 0.922973 3.156154 38 210 345 645 3688 165
1
b.Media 1412.388 983.3211 1207 0.696211 1.496363 157 700 1194 1907 5878 363
4 5
c.Adulta 1462.319 1096.436 1366 0.749792 1.355000 65 638 1088 2004 6217 169
5 0 4

Potrebbero piacerti anche