Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Proyecto Integrador
I.4 Definir variables involucradas Y: Ventas.- La variable principal. Se desea conocer el impacto que tienen las variables sobre esta. La unidad de medida es el nmero de coches vendidos semanalmente. X1: Anuncios transmitidos por televisin de la marca.- Interesa conocer el impacto que tiene la publicidad sobre las ventas, en este caso se consideran dos tipos de publicidad existentes, cabe sealar que en ambos casos se trata de un promedio. La unidad de medida es el nmero de anuncios transmitidos semanalmente. X2: Anuncios transmitidos por radio sobre el concesionario.- Se toman en cuenta los anuncios acerca del concesionario en particular que se transmiten
2
+
Y=Ven tas
+
X5= Nmero de promocione s
La variable x4 tal vez servira para determinar el comportamiento del mercado en cuanto a la compra de automviles y como ha ido en aumento o decremento, esto basndose en la economa del pas actualmente as como en aos anteriores para ver el impacto que tendra esa variable.
I.6 Escala de medicin Notaci n Y X1 X2 X3 X4 Escala de Medici n Razn Razn Razn Razn Razn Tipo de Variable Cuantitati va Cuantitati va Cuantitati va Cuantitati va Cuantitati va Unidad de Medida Unidades Unidades Unidades Unidades Unidades
Variable
Escala
Ventas semanales Anuncios por Tv Anuncios por radio Ventas del ao pasado Promociones
I.7 Fuentes y medios donde se obtienen La informacin histrica es proporcionada por el interesado del negocio en cuestin para as poder determinar las causales de compra y comportamientos de las mismas, es un histrico que se cuenta del ao 2008 , dicha informacin es proporcionada por la concesionara y esta es obtenida por la captura de informacin de acuerdo a las ventas realizadas en el periodo, as como por el rea de publicidad que involucra la parte de generacin de demanda y medios de publicidad para atraccin de clientes potenciales. I.8 Obtener la base de datos
Seman a 1 2 3 4 5 6
Y 40 30 12 13 17 12
X3 47 32 17 15 18 15
X4 3 3 3 2 2 1
I.9 Al terminar el planteamiento de su proyecto integrador, qu innovacin, cambio o mejora se dar con los resultados que encontremos? Qu es lo que buscan con este proyecto? Este punto debe ser alcanzable ya que se retomar en la etapa final La innovacin que se pretende lograr es principalmente tener un mejor conocimiento de las variables que afectan las ventas; para as en caso de tener relaciones muy fuertes entre las variables poder influir en la venta de autos para mejorarlas. Las innovaciones sern implementadas en el sector que resulte con un menor registro de ventas, o bien los resultados pueden proporcionar informacin acerca de la temporalidad y el tipo de campaa publicitaria que se puede implementar, reforzar algunas promociones o por el contrario cancelar o disminuir los recursos en las que no se necesitan. Otro objetivo que se pretende lograr es precisamente un pronstico aproximado de demanda, que permita la planeacin de los inventarios a lo largo del ao y de tal manera poder programar compras mayores pero con beneficios de costos totales, es decir comprar mayor volumen de unidades tomando en cuenta el pronstico de compra para el ao estudiado.
I.10 Cules son las consideraciones ticas en nuestro proyecto que habr que cuidar? Hemos sido ticos en el manejo de datos? o los hemos maquillado un poquito para quedar nosotros mejor u obtener mejores notas en la materia? Las consideraciones ticas que hay que cuidar ser respetar los datos, y no cambiarlos o modificarlos incluso si al empezar el anlisis existe dificultad en obtener los resultados que se esperan. La base de cualquier estudio estadstico son precisamente la fidelidad y veracidad de los datos que sern analizados, sean el universo de datos o una muestra del mismo, de tal manera que la confiabilidad de los resultados obtenidos y sobre los que se realizarn todo tipo de inferencias o tomas de decisiones sern precisamente el reflejo de la veracidad de los datos con que se hace el estudio. La base de datos que se recibi por parte del concesionario fue transcrita de forma original con el fin de tener resultados reales y no sesgar el resultado de los mismos, como se mencion con anterioridad el maquillar los datos nos traer como consecuencia la obtencin de respuestas errneas a un problema real que puede ser aplicable no slo en este caso en la concesionaria sino en los negocios en general. No se debe de ninguna manera contar con informacin errnea en un estudio que va a determinar si un negocio es viable, es rentable o es manejado de manera ineficiente y peor an contar con informacin verdica y alterarla para obtener algn resultado desead pero necesariamente falso.
II.1 Utilizar Box Plot o diagrama de caja para detectar valores atpicos
Dond e: Y X1 X2 X3 X4
Unidades vendidas Anuncios de la marca en tv Anuncios del concesionario en radio Ventas del ao pasado en la misma semana Nmero de Promociones
Al realizar las grficas de caja nos percatamos de que tenemos valores no atpicos, es decir, que se encuentran dentro del rango normal, por lo que podemos trabajar con las cuatro variables que quedaron al final de las correcciones de la primera entrega.
II.2 Describir y analizar las variables, con distribucin de frecuencia y grficas adecuadas
VARIABLE Y = UNIDADES VENDIDAS La primer variable a analizar es la Y que representa las ventas de automoviles semanales, en las cuales podemos observar que ms de un 80 % de las ventas se ubicada entre 10 y 20 vehiculos vendidos a la semana.
Y
Menor Superior
Punto medio 15 25 35 45 55
Frecuencia 24 21 5 1 1 52
10 20 30 40 50
20 30 40 50 60
10
Punto medio Frecuencia 125 15 135 19 145 10 155 2 165 0 175 2 185 1 195 3 52
VARIABLE X2 = ANUNCIOS DEL CONCESIONARIO EN RADIO El comportamiento de esta variable no tiene dependencia con otra, pues representa el nmero de veces que se realiza una presentacin o un spot comercial para hacer promocin a la compra de un auto, el cual podemos ver que se encuentra entre 80 y 90 anuncios que es el promedio ms alto.
11
80 90 100 110 120 130 140 150 160 170 180 190 200
< < < < < < < < < < < < <
90 100 110 120 130 140 150 160 170 180 190 200 210
Punto medio Frecuencia 85 17 95 15 105 9 115 2 125 4 135 0 145 0 155 2 165 0 175 0 185 2 195 0 205 1 52
% 32.7 28.8 17.3 3.8 7.7 0.0 0.0 3.8 0.0 0.0 3.8 0.0 1.9 100.0
VARIABLE X3 = VENTAS DEL AO PASADO EN LA MISMA SEMANA Con esta variable se pretende saber el comportamiento de las ventas del ao pasado y conocer el promedio de ventas de automviles por semana.
X3
Menor Superior
10
<
20
% 51,9
12
VARIABLE X4 = NUMERO DE PROMOCIONES Con esto vemos el comportamiento que se tiene en la compra de un auto al presentar una promocin, aqu vemos que la mayora de las semanas no se cuenta con una promocin, a medida que se vayan relacionando las diferentes variables se podr determinar el impacto de esta en la venta.
X4
Menor Superior
0 3
< <
2 5
13
Media Varianza Covarianza Desviacin estandar Mnimos Mximos Rango 1er Cuartil 2do Cuartil 3er Cuartil Rango intercuartilico Moda Mediana Donde: X1
Anuncios de la marca en tv
14
II.4 Conclusin de que medidas resumen son las ms adecuadas Una vez visto las diferentes variables se puede determinar que tiene una estrecha relacin en el nivel de venta semanal ya que de acuerdo al tipo de promocin empleada, as como el nmero de salidas al aire, y promociones, determinar la demanda de automviles en el concesionario, las variables dependen de agentes externos como lo pueden ser el rea de marketing, publicidad, relaciones comerciales, etc. Una vez visto las diferentes variables se puede determinar que tiene una estrecha relacin en el nivel de venta semanal ya que de acuerdo al tipo de promocin empleada, as como el nmero de salidas al aire, y promociones, determinar la demanda de automviles en el concesionario, las variables dependen de agentes externos como lo pueden ser el rea de marketing, publicidad, relaciones comerciales, etc. Una de las medias ms adecuadas para todas las variables es la Media ya que los datos que usamos no cuentan con valores dispersos a excepcin de la variable X2 en donde la desviacin estandar es la ms grande lo cual nos indica una dispersin de datos, es por ello que en esta variable la medida que mejor lo describe es la Moda.
II.5 Tabla Cruzada con relacin de dos variables categricas, en este caso ventas (y) y spots tv (x1)
Volumen de Venta Diaria (A) Bajas (10-23) Medias (2437) Altas (38-51) Total Nmero de Spots de TV por Semana (B) 120 a 144 30 8 0 38 145 a 169 6 2 0 8 170 a 195 0 3 3 6 Total 36 13 3 52
15
II.6 Planteamiento de preguntas variables cruzadas Para facilitar el anlisis hacemos una tabla con probabilidades conjuntas.
Volumen de Venta Diaria(A) Bajas (10-23) Medias (2437) Altas (38-51) Total Nmero de Spots de TV por Semana(B) 120 a 144 0.58 0.15 0.00 0.73 145 a 169 0.12 0.04 0.00 0.15 170 a 195 0.00 0.06 0.06 0.12 Total 0.69 0.25 0.06 1.00
Preguntas de probabilidad conjunta: 1. Cul es la probabilidad que las ventas sean bajas y el numero de Spots sean de 120-144? R= .58 2. Cul es la probabilidad que las ventas sean altas y el numero de Spots sean de 120-144? R= 0 Preguntas de probabilidad marginal: 3. Cul es la probabilidad de tener ventas altas? R=.06 4. Cul es la probabilidad de tener ventas bajas? R=.69 5. Cul es la probabilidad de que el numero de spots este entre 170 y 195? R=.12 Preguntas de probabilidad condicional: 6. Cul es la probabilidad de tener ventas altas dado que el numero de spots esta entre 170-195? P(AIB)=.5 7. Cul es la probabilidad de tener ventas medias dado que el numero de spots esta entre 120-144? P(AIB)=.205
1. 2.
Si P (AyB) = P(A) P(B) los eventos A y B son independientes. Si P(A/B) = P(A) los eventos A y B son independientes.
Para la prueba 1 tomamos la pregunta 1 tenemos que P(AyB)= .58 y tenemos que P(A)P(B)=.50 Son diferentes por lo que son dependientes. Para la prueba 2 tomamos la pregunta 6 tenemos que P(AIB)= .50 y tenemos que P(A)=.69 Son diferentes por lo que son dependientes
As podemos establecer las hiptesis: Las ventas siguen una distribucin normal con una media de 21.46 y una desviacin estndar de 7.57
17
Luego calculamos las frecuencias esperadas: Cuadrado de Frecuen Frecuen Cuadrad la diferencia cia cia Diferenc o de la dividido observa esperad ia diferenc entre la da a ia frecuencia esperada 1 9 8 6 6 7 4 3 4 4 5 5 5 5 5 5 5 5 5 5 -4 4 3 1 1 2 -1 -2 -1 -1 16 16 9 1 1 4 1 4 1 1 3.2 3.2 1.8 0.2 0.2 0.8 0.2 0.8 0.2 0.2 10.8
Calificacin
Menores que 11.76 11.76 a 15.095 15.095 a 17.52 17.52 a 19.56 19.56 a21.46 21.46 a 23.35 23.35 a25.40 25.40 a 27.82 27.82 a 31.16 Mayor a 31.16 Total
18
Ventas S emanal es
Normal
99 Media Desv .Est. N AD Valor P 21.46 7.653 52 1.348 <0.005
95 90 80
Porcent aje
70 60 50 40 30 20 10 5
10
20 C1
30
40
50
III.2 Calcular el valor aproximado de la desviacin estndar poblacional a partir de la aplicacin de la regla emprica, tomando como referencia los valores mayor y menor de la variable dependiente. Para la regla emprica tenemos que el 95% de los datos se encuentran a no ms de 2 desviaciones estndar.
Despejamos s, tomamos el valor ms pequeo y consideramos la regla emprica tomando en cuenta que el valor se encuentra aproximadamente a 2 desviaciones.
19
III.3 Concuerda el resultado obtenido en el punto 2 (regla emprica) con el valor obtenido en el reporte de medidas resumen numricas? Cmo interpretara esto? En el caso del valor ms pequeo la desviacin obtenida si se acerca a la deviacin estndar obtenida con los datos, que es de 7.67, en el caso del valor ms grande se aleja mucho por lo que podramos considerar que es una observacin atpica.
De acuerdo a las mediciones realizadas podemos determinar que el valor obtenido va ms apegado a seguir una distribucin normal, ya que todos los datos obtenidos se apegan a dicha distribucin. Como se coment con anterioridad se tiene un pico de un valor atpico el cual no se considera dentro del estudio a realizar, por lo que se concluye que esta lleva una distribucin normal.
III.4 Suponiendo normalidad en los datos. Qu valor de la variable hace que el 80% del total de datos sea mayor a l? Este valor lo calculamos cuando hicimos la prueba de bondad de ajuste, donde utilizamos el despeje que de se pide; regresando tenemos: Porcent aje 10 20 30 40 50 60 70 80 90 Z -1.28 -0.84 -0.52 -0.25 0 0.25 0.52 0.84 1.28 Puntuaci n 11.76050 8 15.09522 4 17.52047 2 19.56677 5 21.4615 23.35622 5 25.40252 8 27.82777 6 31.16249 2
20
De aqu podemos obtener que el 80% de los valores ser mayor a 15.095 III.5 Suponiendo normalidad en los datos. Realizar el clculo del intervalo de confianza para la variable dependiente. Consideramos que debemos usar Z, ya que la varianza puede ser considerada poblacional debido a que no tomamos una muestra si no el total de datos. De ah tenemos la formula:
De ah tenemos que el intervalo es entre 19.40 y 23.51. Es por ello que podemos concluir lo siguiente: Con un 95% de confianza la media de autos vendidos por semana oscila entre 19.40 y 23.51
III.6 Suponiendo normalidad en los datos. Hacer una prueba de hiptesis sobre si la media de Y es estadsticamente igual o no a un valor hipottico. H0 : => 23 Ha : < 23 z = x - 23 7,65 / raiz 52 1,645
21,25
Rechazar H0 siempre que X sea 21,25 significa que se aceptar el pedido siempre que X > 21,25 z = 21,25 - 19 = 2,25 = 2,12
21
1 0,9830 = 0,017 Debido a que el valor p es menor a 0,05 se rechaza la hiptesis nula lo cual nos lleva a tener ventas menores a 23 automviles por semana. III.7 Suponiendo normalidad en los datos. Construir una prueba de hiptesis de la diferencia entre las medias de dos poblaciones o grupos de la variable Y. Para realizar la diferencia entre dos poblaciones dividimos nuestra variable dependiente en dos grupos las ventas del primer semestre del ao y las ventas del segundo semestre del ao como a continuacin se presenta. Cabe mencionar que no estamos hablando de muestras poblacionales pareadas, ya que no estamos utilizando canales de venta diferentes; slo estamos diviendo las ventas en dos periodos semestrales.
Semana 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Semana 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43
22
H0 = 1 -2 =0
Ha = 1 -2 0
z =
(x1 - x2) - D0 = 21 n1 + 22 n2
El valor p es menor a 0,05 es por ello que se rechaza la hiptesis nula, es decir la diferencias de medias es diferente a cero.
III.8 Suponiendo normalidad en los datos. Realizar un procedimiento ANOVA con la variable dependiente. Total del 1er 2do 3er 4to rengln trimestr trimestr trimestr trimestr de e e e e bloques 40 13 19 16 88 VENTAS Media del bloque 22
Bloques
Semana 1
23
H0 = 1 = 2 = 3 H a = No todas las medias poblacionales son iguales Fuentes Suma de Grados de cuadrado de Cuadrado F variacin s Libertad Medio Ventas 588 3 196 3,48 Bloques 369 12 30,75 Error 2030 36 56,39 TOTAL 2987 51
Valor-p 0,027
F= 3,48 se encuentra entre F0,05 = 2,92 y F0,025 = 3,59. Por tanto el valor-p se encuentra entre 0,05 y 0,025. Debido a que el valor-p es menor a 0,05 se rechaza la hiptesis nula y se concluye que las medias poblacionales de las ventas semanales de automviles en los tres trimestres no son iguales.
24
Resumen De acuerdo al anlisis estadstico realizado a la concesionaria se pudieron analizar las variables aleatorias que afecta de manera directa el proceso de venta de automviles, entre las cuales se analizaron los spots publicitarios ya sea por radio o por televisin, as como las promociones lanzadas por la concesionaria. El proyecto integrador propuesto por el equipo nos permite hacer diversos anlisis estadsticos para, entre otras situaciones, validar si lo que estamos afirmando es correcto o no es correcto, con esto identificamos que las variables afecta de manera directa la venta de automviles de manera semanal, ya que de acuerdo al nmero de puntos que se tiene para cada variable se ve directamente afectado el incremento de automviles vendidos. Esta informacin nos ser til para poder determinar que las ventas se basan en sobremanera en la inclusin de mtodos publicitarios que determinaran los incrementos en las ventas directas; As mismo se pueden realizar los pronsticos de venta de acuerdo a lo que
25
26