Sei sulla pagina 1di 17

3/4/2020 Tema: Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

Buscar entradas o autor No leído    Suscrito 

1 11
Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

Santiago Daniel
De PRIMER BLOQUE-CIENCIAS BASICAS/ESTADISTICA INFERENCIAL-[GRUPO4]

ESPACIO PARA EL DESARROLLO Y CONSOLIDACIÓN


DEL TRABAJO COLABORATIVO

E
stimados estudiantes, este foro es un espacio para intercambiar ideas, presentar vías de solución al
problema propuesto y generar discusiones que permitan llegar a acuerdos para consolidar un
documento final. Antes de comenzar, por favor lea detalladamente el Anuncio del trabajo
colaborativo en donde están los detalles de esta atividad.

Esta actividad inicia en la semana 3 y finaliza en la semana 5, todas las participaciones y material se
maneja únicamente por medio de este foro.

Pautas del proceso y entrega

Criterios de evaluación

PACTO DE HONOR

El documento final se debe entregar finalizando la semana 5.

 Respuesta

https://poli.instructure.com/groups/158296/discussion_topics/156031 1/17
3/4/2020 Tema: Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

(https:// Santiago Daniel



(https://poli.instructure.com/groups/158296/users/10310)

23 de mar de 2020

Situación a desarrollar

En el siguiente link encontraras el problema que se ha

planteado para este grupo.

(http://bit.ly/2x1l5BA)

 Respuesta  (1 me gusta)

(http Cubides Quintero Javier Mauricio



(https://poli.instructure.com/groups/158296/users/65991)

Sábado

Buen Día

Apreciado Tutor y Compañeros

Agradezco a nuestra compañera por su oportuna colaboración.

Me gustaría acordar los puntos a tratar en el transcurso de la semana 3, 4 y 5 para que de


esta manera todos podamos realizar un aporte.

SEMANA 3

Utilizando la variable del valor de la compra (Purchase), realice lo siguiente:

1. Realice un histograma y explique la forma y la curtosis según el contexto.


2. Calcular: la media, mediana, moda, desviación estándar, coeficiente de variación e interprete los
resultados.

SEMANA 4

En relación a la variables dadas en la tabla anterior, responda y justifique los resultados:

https://poli.instructure.com/groups/158296/discussion_topics/156031 2/17
3/4/2020 Tema: Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

3.1 ¿Cuál es la categoría de edades que más realiza compras en el black-friday?

3.2 ¿Cuál es promedio de gatos de la categoría de la edad que más compra?

3.3 ¿La proporción de hombres que compran es mayor que la de mujeres?

3.4 ¿Cuánto es el promedio de gasto de los hombres y las mujeres?

SEMANA 5

Intervalos de confianza

4.1 Proponga una alternativa para determinar el tamaño de una muestra para la variable compra
(Purchase).

4.2 Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la diferencia
de los gastos para los hombres y mujeres e interprete el resultado obtenido.

Consolidación del Trabajo Colaborativo: Consolidar la información en un archivo PDF y con


soporte de un archivo en excel, el cual debe ser subido en el Foro: Desarrollo del trabajo
colaborativo. Este PDF debe tener (portada, objetivos, desarrollo de la actividad, resultados y
referencias), el excel los cálculos y procedimientos.

Si están de acuerdo me comentan.

Javier Cubides

Cel. 321 4614620

 Respuesta 

(http Cubides Quintero Javier Mauricio



(https://poli.instructure.com/groups/158296/users/65991)

Lunes

Cordial Saludo,

De manera respetuosa realizo mi aporte:

Recordemos la descripción del Ejercicio

El conjunto de datos en el archivo “black-friday” (Dagdoug, 2019) es una muestra de las


transacciones realizadas en una tienda minorista. La tienda quiere conocer mejor el comportamiento
de compra del cliente frente a diferentes productos. Específicamente, el problema que estamos

https://poli.instructure.com/groups/158296/discussion_topics/156031 3/17
3/4/2020 Tema: Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

tratando de predecir la variable dependiente (el monto de la compra) con la ayuda de la información
contenida en las otras variables.

Las variables del archivo adjunto son las siguientes:

SEMANA 3

Utilizando la variable del valor de la compra (Purchase), realice lo siguiente:

1. Realice un histograma y explique la forma y la curtosis según el contexto.


2. Calcular: la media, mediana, moda, desviación estándar, coeficiente de variación e interprete
los resultados.
FÓRMULA EMPLEADA
DATO VALOR INTERPRETACIÓN
EN EXCEL
La mitad de los datos del
"Valor de Compra" se
MEDIANA 8071 =MEDIANA(E:E) encuentran por debajo de
8071 Dólares y la otra mitad
por encima del mismo

El promedio del valor en


MEDIA 10294,79905 =PROMEDIO(E:E) compras es de
10294,79905 Dólares
El valor que más veces se
repite dentro de los datos
MODA 6855 =MODA(E:E)
de Compra es 6855
dólares.

Los datos se encuentran


DESVIACIÓN 16296,47453 dispersos
16296,47453 =DESVESTA(E:E)
ESTÁNDAR con respecto a la
Media
COEFICIENT 1,582981313 =DESVESTA/PROMEDIO Este valor representa la
https://poli.instructure.com/groups/158296/discussion_topics/156031 4/17
3/4/2020 Tema: Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

E DE relación entre la
VARIACIÓN desviación estándar y la
media para tal caso es
de 1,58 se puede
expresar en términos de
Porcentaje.

 Respuesta 

(http Navarrete Malaver Juan Camilo



(https://poli.instructure.com/groups/158296/users/51974)

Martes

Buena tarde

Compañera

Ejecutando las formulas difiero un poco en los resultados te explico:

MEDIA ARITMÉTICA

para hallar la media se debe de aplicar la formula realizar la tabla de frecuencias del
la variable (Purchase)

https://poli.instructure.com/groups/158296/discussion_topics/156031 5/17
3/4/2020 Tema: Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

luego se realiza la sumatoria de la fila de las frecuencias( f) el mismo proceso se


hace el la fila de que es la multiplicación de la variable por su respectiva
frecuencia.

y aplicas la formula

Por lo tanto la media corresponde a un valor de dolares

Interpretación: el promedio de compras en dolares es de .

MEDIANA

para hallar esta mediana debemos de organizar la variable Purchase de menos a mayor

y se le coloca un numero consecutivo del al que es el total de transacciones que se


registra en la tabla.

después aplicamos la formula: .

https://poli.instructure.com/groups/158296/discussion_topics/156031 6/17
3/4/2020 Tema: Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

es decir que el valor que contenga la transacción numero

sera denominada la mediana, buscamos en la tabla de transacciones y hallamos que el valor de


esa casilla es

lo que quiere decir la mitad de los valores de compra se encuentran por debajo de
dolares y la otra mitad por encima.

MODA

Esto quiere decir que en la tabla de frecuencias el valor de la Frecuencia que mas se repite es la
moda.

Organizamos la tabla de frecuencias en la fila la de (F) de mayor a menor y hallamos que la


moda corresponde a .

Lo que quiere decir que el valor de compra que mas se repite es dolares

DESVIACIÓN ESTÁNDAR

Para hallar la desviación estándar debemos de volver a nuestra tabla de frecuencias en donde
la columna de la sumatoria de

https://poli.instructure.com/groups/158296/discussion_topics/156031 7/17
3/4/2020 Tema: Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

la desviación estándar es de

COEFICIENTE DE VARIACIÓN

conociendo la media y la desviación estándar podemos concluir el coeficiente de variación.

Cordial saludo

Editado por Navarrete Malaver Juan Camilo (https://poli.instructure.com/groups/158296/users/51974) el 31 de


mar en 14:18

 Respuesta 

(http Fonseca Fonseca Yuranni



(https://poli.instructure.com/groups/158296/users/70973)

Martes

Buen Dia Compañero

Gracias por el aporte yo realice los cálculos de la misma forma en excel.

 Respuesta 

(http
https://poli.instructure.com/groups/158296/discussion_topics/156031 8/17
3/4/2020 Tema: Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

Cubides Quintero Javier Mauricio



(https://poli.instructure.com/groups/158296/users/65991)

Martes

Buen día

Realizo un aporte con respecto al Histograma.

Para elaborarlo relacioné la Edad de los compradores con el promedio de compra


en dólares de los mismos (Purchase).

INTERVALO DE EDADES PROMEDIO DE COMPRA EN USD

0 - 17 9020

18 - 25 9235

26 - 35 9315

36 - 45 9401

46 - 50 9285

51 - 55 9621
55+ 9454

De este Histograma podemos deducir que quienes más consumen en "Blackfriday"


en la tienda minorista del caso de estudio se encuentran entre los 51 y 55 años de
edad.

 Respuesta 

https://poli.instructure.com/groups/158296/discussion_topics/156031 9/17
3/4/2020 Tema: Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

(https:// Fonseca Fonseca Yuranni



(https://poli.instructure.com/groups/158296/users/70973)

Sábado

Buen Día Compañeros


Para el desarrollo del trabajo se nos facilito una muestra de una base de datos de las
transacciones realizadas en una tienda minorista. Con esta información se tienen que hallar
distintas variables
para empezar nos piden realizar un histograma utilizando la variable valor de compra
(PURCHASE)
Ya que la base de datos es bastante extensa empece hallando datos como los que se
muestran en la siguiente tabla

Para hallar estos datos lo realice usando formulas en la hoja de cálculo de Excel, el intervalo
lo halle con la fórmula de Sturges, el cual dio un numero de intervalo de 19

La diferencia del rango la distribuí en los valores máximo y valor mínimo en el valor máximo
se suman las unidades y en el valor mínimo se restan para un total de 12 unidades de
diferencia.

Después de esto cree la tabla de datos correspondiente a los intervalos de clase los cuales
son 19 como se muestra en la tabla anterior. Los intervalos están conformados por un límite
superior y un límite inferior.

El limite interior está dado por el valor mínimo y el límite superior corresponde al valor mínimo
sumado al intervalo de clase, para que no se repitan los valores esta creado el intervalo –1 se
fija la formula y se realiza con todos los intervalos para hallar la marca de clase, se busca el
promedio de los dos limites, la frecuencia absoluta la halle con todos los datos y el límite
superior, esto se realizó en función 2, es importantes hallar las dos frecuencias para hallar las
frecuencias acumuladas con estos genere la siguiente tabla .

https://poli.instructure.com/groups/158296/discussion_topics/156031 10/17
3/4/2020 Tema: Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

con esta información realice el siguiente Histograma

Quedo Atenta a sus comentarios ya que me gustaría saber de que manera realizaron el
histograma

 Respuesta  (1 me gusta)

(http Fonseca Fonseca Yuranni



(https://poli.instructure.com/groups/158296/users/70973)

Martes

Compañeros Buen Día

La curtosis me dio un valor negativo de -0,343121373 lo cual da como resultado una


distribución platicútica.

https://poli.instructure.com/groups/158296/discussion_topics/156031 11/17
3/4/2020 Tema: Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

 Respuesta 

(http Rodriguez Dimate Wilson Ramiro



(https://poli.instructure.com/groups/158296/users/69035)

Martes

Buen día compañera

El resultado de la curtosis es igual al que me había dado.

 Respuesta 

(https:// Rodriguez Dimate Wilson Ramiro



(https://poli.instructure.com/groups/158296/users/69035)

Martes

Buen día compañeros y tutor,

Para el desarrollo de la primera parte del ejercicio se pide utilizar el valor de la compra
(purchase) para los siguientes puntos:

1. Realice un histograma y explique la forma y la curtosis según el contexto.


2. Calcular: la media, mediana, moda, desviación estándar, coeficiente de variación e
interprete los resultados.

El numeral 1 se realiza con el tratamiento de datos agrupados utilizando la tabla de


distribución de frecuencias debido a la gran cantidad de datos que posee la variable de
estudio. Por tanto, los parámetros iniciales para elaborar la tabla de frecuencia son:

n 537577
k 20
min 185
max 23961
R 23776
A 1189
Li 183
Ls 1372

Donde:

https://poli.instructure.com/groups/158296/discussion_topics/156031 12/17
3/4/2020 Tema: Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

n: número de datos

k: número de intervalos – establecido a partir de la regla de Sturges)

min: mínimo – dato de la variable más pequeño

max: máximo – dato de la variable más grande

R: rango – es la diferencia entre max y min

A: amplitud del intervalo – el cociente entre R y k

Li: límite inferior – extremo inferior del primer intervalo

Ls: límite superior – extremo superior del primer intervalo

Con los resultados anteriores se construye la siguiente tabla de distribución de frecuencias


para los valores de compra:

Finalmente, se grafica el histograma donde se muestra la frecuencia relacionada con el valor


medio para cada intervalo de la compra (marca de clase).

https://poli.instructure.com/groups/158296/discussion_topics/156031 13/17
3/4/2020 Tema: Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

Para el desarrollo del siguiente punto, el cálculo de los valores estadísticos se puede
determinar en dos distintos escenarios, el primero sin agrupar los datos y el segundo con los
datos agrupados. El resultado de los valores para cada escenario es:

DATOS SIN AGRUPAR

Media 9333,86

Moda 6855

Mediana 8062

Desv. Est. 4981,02

Varianza 24810581,49

Coef. Var. 0,5337

Curtosis -0,3431

DATOS AGRUPADOS

https://poli.instructure.com/groups/158296/discussion_topics/156031 14/17
3/4/2020 Tema: Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

Media 9327,47

fi del int modal 69602

fi ant del int modal 61355

fi pos del int modal 35438

Li del int modal 7323

Moda 7554,21

n/2 268788,5

Fi de la mediana 289123

Fi ant del int de la


219521
mediana

fi de la mediana 69602

Li del int de la
7323
mediana

Mediana 8164,63

Varianza 24895516,32

Desv. Est. 4989,54

Coef. Var. 0,5349

Curtosis -0,3404

https://poli.instructure.com/groups/158296/discussion_topics/156031 15/17
3/4/2020 Tema: Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

Al comparar los valores de las dos tablas se puede observar la diferencia entre los valores,
principalmente en los resultados de la moda y la mediana, esto es debido a que en los valores
estadísticos de los datos agrupados se usan los puntos medios de clase para aproximar los
valores de los datos de cada clase, por lo cual, estos valores hacen una aproximación de los
estadísticos obtenidos con los datos originales (sin agrupar). Por tanto, siempre que se tenga
los datos originales y sea posible determinar los valores estadísticos, es más recomendable
hallarlos de esta forma.

Por lo anterior, se realiza la interpretación de los valores estadísticos para los datos sin
agrupar expresando lo siguiente:

El promedio del valor de las compras es de 9333,86 dólares

El valor de compra que se presenta con mayor frecuencia es de 6855 dólares

La mitad de las compras tienen un valor de 8062 dólares o más y la otra mitad de las compras
un valor de 8062 dólares o menos.

En promedio el valor de la compra varía en 4981,02 dólares

La desviación estándar corresponde al 53,37% del valor de la media.

De acuerdo con el resultado de la curtosis, se observa una distribución de forma Platicúrtica


ya que el resultado muestra una baja concentración de los valores (inferior a 0).

 Respuesta 

(https:// Fonseca Fonseca Yuranni



(https://poli.instructure.com/groups/158296/users/70973)

Miércoles

Buenas Tardes Compañeros

Compañeros muchas gracias por los aportes realizados

Siguiendo con el desarrollo del trabajo en cuanto a la pregunta ¿ Cual es la categoría de


edades que mas realiza compras en el BLACK FRIDAY?

Para esto inserte una tabla dinámica en donde agrupe esos dos datos

https://poli.instructure.com/groups/158296/discussion_topics/156031 16/17
3/4/2020 Tema: Foro: Desarrollo del trabajo - Semanas 3, 4 y 5 - SUBGRUPOS 27

Según la tabla el rango de edad que mas compra realizo fue de 26-35 años, por un valor total
de 1.999.749.106 de dolares

 Respuesta 

https://poli.instructure.com/groups/158296/discussion_topics/156031 17/17

Potrebbero piacerti anche