Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Nojek, S.1, Britos, P. 1,2, Rossi, B. 1,2 y Garca Martnez, R.2 Departamento de Ingeniera Industrial. Instituto Tecnolgico de Buenos Aires. Av. Madero 399 (C1106ACD). Buenos Aires - Argentina. sebasnojek@fibertel.com.ar 2 Centro de Ingeniera del Software e Ingeniera del Conocimiento (CAPIS). Instituto Tecnolgico de Buenos Aires. Av. Madero 399 (C1106ACD). Buenos Aires - Argentina. pbritos@itba.edu.ar, brossi@itba.edu.ar, rgm@itba.edu.ar Resumen: Actualmente es comn que las empresas realicen pronsticos de ventas para poder planificar ms acertadamente su produccin. El objetivo de este trabajo consiste en estudiar la prediccin de ventas mediante el uso de redes neuronales, comparar los resultados obtenidos con los pronsticos de un mtodo estadstico clsico y establecer los entornos ms adecuados para su uso. Palabres Clave: Pronostico de Ventas Prediccin basada en Redes Neuronales Abstract: Companies usually need sales forecast for improving production planning. This research work pursues to study sales forecast based on neural networks and to compare this results whith the ones based on classical statistical methods trying to specify the adecuate bussines enviroment for using them Keywords: Sales Forecast Forcasting based on Neural Networks
1
Situacin actual:
La eleccin e implementacin de un mtodo adecuado de pronsticos siempre ha sido un tema de gran importancia para las empresas. Se utilizan los pronsticos en el rea de compras, marketing, ventas, etc. Un error significante en el pronstico de ventas podra dejar a una empresa sin la materia prima o insumos necesarios para su produccin, o podra generarle un inventario demasiado grande. En ambos casos, el pronstico errneo disminuye las utilidades de la empresa. Las consecuencias anteriormente descriptas se ven amplificadas y representan un problema grave para empresas como Shell CAPSA (Compaa Argentina de Petrleo S. A.) en las que, segn Guillermo Lucero, quien trabaja en la produccin y realiza el planeamiento de la distribucin de los productos de esta empresa para todo Latinoamrica, se debe realizar mensualmente un pronstico para ms de mil productos. La estimacin del comportamiento futuro de algunas variables puede realizarse utilizando diversas tcnicas de pronstico. Cada una de las tcnicas de proyeccin tiene una aplicacin de carcter especial que hace de su seleccin un problema de decisin influido por diversos factores, como por ejemplo, la validez y disponibilidad de los datos histricos, la precisin deseada del pronstico, el costo del procedimiento, los beneficios del resultado, los periodos futuros que se desee pronosticar y el tiempo disponible para hacer el estudio entre otros [Sapag Chain, 2000].
En una situacin estable la importancia de los pronsticos es menor. Pero a medida que ella crece en dinamismo y complejidad, ms necesaria se torna la proyeccin de las variables del mercado. Como se mencion anteriormente, existen diversas tcnicas para proyectar el mercado. Dentro de las mismas se encuentran las tcnicas clsicas de proyeccin. Una forma de clasificarlas consiste en hacerlo en funcin de su carcter, esto es, aplicando mtodos de carcter cualitativo, modelos causales y modelos de series de tiempo. Los mtodos de carcter cualitativo se basan principalmente en opiniones de expertos. Su uso es frecuente cuando el tiempo para elaborar el pronstico es escaso, cuando no se dispone de todos los antecedentes mnimos necesarios o cuando los datos disponibles no son confiables para predecir el comportamiento futuro. Resulta difcil emitir un juicio sobre la eficacia de sus estimaciones finales. Los modelos de pronstico causales parten del supuesto de que el grado de influencia de las variables que afectan al comportamiento del mercado permanece estable, para luego construir un modelo que relacione ese comportamiento con las variables que se estima que son
Reportes Tcnicos en Ingeniera del Software. Vol 5(1). Pg. 1-12. 2003 ISSN: 1667-5002. CAPIS-EPG-ITBA (http:// http://www.itba.edu.ar/capis/rtis)
Pronstico de Ventas: Comparacin de Prediccin basada en Redes Neuronales versus Mtodo Estadstico
las causantes de los cambios que se observan en el mercado [Dervitsiotis, 1981]. Los modelos de series de tiempo (mtodo estadstico) se refieren a la medicin de valores de una variable en el tiempo a intervalos espaciados uniformemente. El objetivo de la identificacin de la informacin histrica es determinar un patrn bsico en su comportamiento, que posibilite la proyeccin futura de la variable deseada. Existen, adems de los mtodos clsicos de proyeccin, diversos mtodos de proyeccin no tradicionales, dentro de los cuales se encuentran las redes neuronales. Debido a su constitucin y a sus fundamentos, las redes neuronales artificiales presentan un gran nmero de caractersticas semejantes a las del cerebro humano. Por ejemplo, son capaces de aprender de la experiencia, de generalizar de casos anteriores a nuevos casos y de abstraer caractersticas esenciales a partir de entradas que representan informacin irrelevante [Jos R. Hilera y Vctor J. Martnez,1995].
Relationship Management (SRM). El mismo utiliza doce mtodos de pronstico estadsticos distintos. El sistema de calculo del software, segn la informacin que nos brinda el manual del mismo, funciona de la siguiente manera: primero, el sistema determina cul de los 12 mtodos se ajusta mejor a los datos proporcionados por el usuario (datos histricos) y luego, el sistema utiliza el mtodo seleccionado para realizar las proyecciones de ventas. Los 12 mtodos utilizados fueron: Mtodo 1: Porcentaje sobre las ventas del ao anterior. La frmula Porcentaje sobre las ventas del ao anterior multiplica los datos del ao anterior por un porcentaje determinado por el usuario, luego proyecta los resultados para el ao siguiente. Ejemplo: Ventas Febrero 1998 = Ventas Febrero 1997 * 1.1 Ventas Marzo 1998 = Ventas Marzo 1997 * 1.1 Mtodo 2: Porcentaje sobre el ao pasado calculado. La frmula Porcentaje sobre el ao pasado calculado multiplica los datos del ao anterior por un porcentaje determinado por el sistema, luego proyecta los resultados para el ao siguiente. Mtodo 3: Ventas del ao anterior. La frmula Ventas del ao anterior copia los valores de las ventas del ao anterior. Mtodo 4: Promedio mvil . Este mtodo calcula el promedio de las ventas histricas ms recientes y realiza un pronstico a corto plazo. Mtodo 5: Aproximacin lineal. Realiza una aproximacin lineal en base a dos datos de ventas histricos determinados por el usuario. Estos puntos definen una lnea recta que es proyectada hacia el futuro. Mtodo 6: Regresin de cuadrados mnimos. El mtodo calcula automaticamente los valores de a y b que se utilizan en la frmula: Y=a+bX. Esta ecuacin describe una lnea recta en donde Y representa las ventas y X representa al eje temporal.
REPORTES TCNICOS EN INGENIERA DEL SOFTWARE 5 (1)
3. Hiptesis de la investigacin:
Hiptesis: Utilizando un mtodo de pronstico no tradicional, como las redes neuronales, es posible obtener un pronstico de ventas ms acertado en comparacin a los resultados obtenidos utilizando un mtodo de pronstico estadstico clsico. La metodologa propuesta para este trabajo fue la siguiente: 1. Obtener los datos histricos de ventas de algunos productos de la empresa Shell CAPSA. 2. Realizar un pronstico de ventas utilizando distintos mtodos estadsticos. Para este trabajo se va a utilizar un software de la empresa J. D. Edwards, el Supplier Relationship Management (SRM), el cual incluye 12 (doce) mtodos estadsticos distintos. 3. Utilizando los mismos datos de entrada que se utilizaron para realizar el pronstico estadstico, se va a realizar un pronstico utilizando redes neuronales. Se va a utilizar el software de la empresa Statsoft en Neural Network. 4. Comparar los resultados obtenidos por ambos mtodos. 5. Definir el nivel de confianza (de 0 a 100 %) con el cual se puede decir que con las Redes Neuronales se obtuvo, para la muestra de datos previamente seleccionada, un pronstico ms acertado.
Pronstico de Ventas: Comparacin de Prediccin basada en Redes Neuronales versus Mtodo Estadstico
Mtodo 7: Aproximacin de segundo grado. El mtodo calcula automaticamente los valores de a, b y c que se utilizan en la ecuacin de segundo grado, Y=a+bX+cX2. El eje Y representa las ventas y el eje X representa al eje temporal. Mtodo 8: Mtodo flexible. Este mtodo es similar al mtodo 1 (Porcentaje sobre el ao pasado). El usuario determina un factor especifico, el cual se multiplica por las ventas de un periodo determinado (tambin por el usuario). Mtodo 9: Promedio mvil ponderado. Este mtodo es similar al mtodo 4 (Promedio mvil). El usuario debe determinar: n, numero de periodos a tener en cuenta, y el peso que se le asigna a cada uno de los periodos pasados. Mtodo 10: Decaimiento lineal. Este mtodo es similar al mtodo 9. La principal diferencia esta el peso que relativo que se le asigna a cada periodo lo determina el sistema automaticamente. Mtodo 11: Decaimiento exponencial. Este mtodo es similar al mtodo 10. El sistema le asigna a cada peso relativo valores que decaen exponencialmente. El usuario debe determinar dos factores: alfa, constante de decaimiento, y n, el numero de datos pasados a tener en cuenta en cada pronstico. Mtodo 12: Decaimiento exponencial con tendencia y estacionalidad. Es similar al mtodo anterior. Se diferencia principalmente porque incluye adems un factor de estacionalidad beta.
Qu conocimientos se necesitan para realizar un pronstico estadstico? Y para realizar un pronstico utilizando Redes Neuronales? Las redes neuronales son sistemas dinmicos autoadaptativos. Son adaptables debido a la capacidad de autoajustarse de los elementos procesales (neuronal) que componen el sistema. Son dinmicos, pues son capaces de estar constantemente cambiando para adaptarse a las nuevas condiciones [Jos R. Hilera, 1995].
Fig. 1 Ejemplo de Red neuronal En el proceso de aprendizaje, los enlaces ponderados de las neuronas se ajustan de manera que se obtengan unos resultados especficos. Una red neuronal no necesita un algoritmo para resolver un problema, ya que ella puede generar su propia distribucin de los pesos de los enlaces mediante el aprendizaje. En este trabajo, se utiliz una red neuronal backpropagation para predecir la variable ventas debido a que esta red es especialmente til en aplicaciones de reconocimiento o clasificacin de patrones. En este modelo de red existe una capa de entrada con n neuronas y una capa de salida con m neuronas y al menos una capa oculta de neuronas internas. Cada neurona de una capa (excepto las de entrada) recibe entradas de todas las neuronas de la capa anterior y enva su salida a todas las neuronas de la capa posterior (excepto las de salida). El algoritmo backpropagation tiene dos fases, una hacia delante y otra hacia atrs. Durante la primera fase el patrn de entrada es presentado a la red y propagado a travs de las capas hasta llegar a la capa de salida. Obtenidos los valores de salida de la red, se inicia la segunda fase, comparndose estos valores con la salida esperada para obtener el error. Se ajustan los peses de la ultima capa proporcionalmente al error. Se pasa a la capa anterior con una retropropagacin del error (backpropagation), ajustando convenientemente los pesos y continuando con este proceso hasta llegar a la primera capa. De esta manera se han modificado los pesos de las conexiones de la red para cada ejemplo o patrn de aprendizaje del problema, del que conocamos su valor de entrada y la salida deseada que debera generar la red ante dicho patrn.
Pronstico de Ventas: Comparacin de Prediccin basada en Redes Neuronales versus Mtodo Estadstico
entorno exterior. Las capas de salida transfieren la informacin de la red hacia el exterior. Numero de neuronas por capa: Topologa II III 1 2 1 4 1 3 1 6
IV 1 4 1 8
Cuadro 1 Neuronas por Topologa Step: Es el nmero de datos pasados que la red tomo como entrada. Por lo tanto, la entrada a la red est formada por una neurona (una variable), pero segn vare su topologa, tendr en cuenta distinta cantidad de datos histricos simultneamente. Por ejemplo, para la topologa II (steps =4), cuando el dato de las ventas de la semana n se encuentra en la capa de salida, las ventas de las semanas n-1, n-2, n-3 y n-4 se encuentran en la capa de entrada. Mecanismo de aprendizaje: El aprendizaje es el proceso por el cual una red neuronal modifica sus pesos en respuesta a una informacin de entrada. Los cambios que se producen durante el proceso de aprendizaje se reducen a la destruccin, modificacin y creacin de conexiones entre las neuronas.
Fig. 2 Topologa I
Fig. 3 Topologa I
En todas las pruebas realizadas se utiliz el tipo de aprendizaje denominado aprendizaje supervisado. El mismo se caracteriza porque el proceso de aprendizaje se realiza mediante un entrenamiento controlado por un agente externo (supervisor) que determina la respuesta que debera generar la red a partir de una entrada determinada. Tipo de informacin de entrada y salida: Forma de representar la informacin de entrada y salida: En todas las pruebas, tanto los datos de entrada como de salida fueron de naturaleza analgica; es decir que las ventas se tomaron en todos los casos como valores reales continuos.
Fig. 5 Topologa IV
La capa de entrada recibe directamente la informacin proveniente de las fuentes externas. En este caso recibe los datos histricos de ventas. Las capas ocultas son internas de la red y no tienen contacto directo con el
4
Pronstico de Ventas: Comparacin de Prediccin basada en Redes Neuronales versus Mtodo Estadstico
presentacin de los datos histricos a la red neuronal. Para entrenar adecuadamente a las redes neuronales se deben ajustar algunos parmetros: Fase I: Especificar qu datos histricos se utilizaran para entrenar a la red y cules se utilizarn para verificar (supervisar) que el entrenamiento haya finalizado o llegado al punto deseado. Fase II: Determinar cuando debe detenerse el entrenamiento de la red. En todos los casos se determin un error target del 0.1 %. Fase III: Verificar grficamente que los datos utilizados para entrenar a la red se ajusten grficamente a los datos histricos de ventas.
utilizaron los datos histricos de Noviembre, Diciembre y Enero. Para los meses siguientes se procedi de la misma manera.
Pronstico de Ventas: Comparacin de Prediccin basada en Redes Neuronales versus Mtodo Estadstico
Grfico 6 Datos histricos y pronstico de Redes (topologa 1) Grfico 3 Datos histricos y pronstico estadstico
Grfico 8 Datos histricos y pronstico de Redes (topologa 1) Grfico 5 Datos histricos y pronstico estadstico
Pronstico de Ventas: Comparacin de Prediccin basada en Redes Neuronales versus Mtodo Estadstico
Pronstico de Ventas: Comparacin de Prediccin basada en Redes Neuronales versus Mtodo Estadstico
Serie I: v<V Estadstico Vs. Topologa 1 Estadstico Vs. Topologa 2 Estadstico Vs. Topologa 3 Estadstico Vs. Topologa 4 32,00 26,92 42,31 57,69 z 1,60 2,16 0,59 0,59 Nivel de Confianza 94,52% 98,45% 72,19% 27,81%
5.3.1 Procedimiento:
La prueba del signo es un procedimiento para la probar hiptesis acerca de la media de una distribucin continua.. Es una prueba no paramtrica porque no entran en juego los parmetros, sea porque no se los conoce o simplemente porque no se los utiliza. La tcnica consiste en: 1. Obtener las n diferencias di. Se obtiene calculando: Ai Bi = di La muestra A representa a la muestra del error absoluto entre los datos histricos y el pronstico estadstico. Se calcul de la siguiente manera: Valor Absoluto (Histrico Estadstico). La muestra B representa a la muestra del error absoluto entre los datos histricos y el pronstico estadstico. Se calcul de la siguiente manera: Valor Absoluto (Histrico Redes Neuronales). Para cada serie de tiempo se calcularon 4 (cuatro) series B, cada una de ellas correspondiente a una topologa de red distinta. Desechar las diferencias nulas. Contar el nmero de diferencias menores que cero. Se denomina N- a este valor. El porcentaje de diferencias menores que cero se denomina como v <V. Con el valor de N- se ingresa en una tabla de lmites de confianza de la mediana y se calcula el nivel de confianza (N.C) con el cual podemos asegurar que el pronstico de redes fue ms preciso que el pronstico estadstico.
Resultados Serie 1
Grfico 15 Error Absoluto estadstico y redes neuronales (Topologa 2) Serie II: v<V Estadstico Vs. Topologa 1 Estadstico Vs. Topologa 2 Estadstico Vs. Topologa 3 Estadstico Vs. Topologa 4 23,08 23,08 26,92 23,08 z 2,55 2,55 2,16 2,55 Nivel de Confianza 99,46% 99,46% 98,45% 99,46%
2. 3. 4. 5.
Resultados Serie 2
Pronstico de Ventas: Comparacin de Prediccin basada en Redes Neuronales versus Mtodo Estadstico
Serie IV: v<V Estadstico Vs. Topologa 1 Estadstico Vs. Topologa 2 Estadstico Vs. Topologa 3 Estadstico Vs. Topologa 4 Grfico 16 Error Absoluto estadstico y redes neuronales (Topologa 4) Serie III: v<V Estadstico Vs. Topologa 1 Estadstico Vs. Topologa 2 Estadstico Vs. Topologa 3 Estadstico Vs. Topologa 4 25,00 37,50 34,78 54,17 z 2,25 1,02 1,25 0,20 Nivel de Confianza 98,76% 84,63% 89,45% 41,91% Grfico 18 Error Absoluto estadstico y redes neuronales (Topologa 2) Serie V: v<V Estadstico Vs. Topologa 1 Estadstico Vs. Topologa 2 Estadstico Vs. Topologa 3 Estadstico Vs. Topologa 4 Grfico 17 Error Absoluto estadstico y redes neuronales (Topologa 1) 56,52 50,00 47,37 25,00 z 0,42 -0,25 0,00 1,75 Nivel de Confianza 33,83% 40,13% 50,00% 95,99% 56,00 54,17 65,38 65,38 z 0,40 0,20 1,37 1,37 Nivel de Confianza 34,46% 41,91% 8,49% 8,49%
Resultados Serie 4
Resultados Serie 3
Resultados Serie 5
Pronstico de Ventas: Comparacin de Prediccin basada en Redes Neuronales versus Mtodo Estadstico
Serie VII: v<V Estadstico Vs. Topologa 1 Estadstico Vs. Topologa 2 Estadstico Vs. Topologa 3 Estadstico Vs. Topologa 4 Grfico 19 Error Absoluto estadstico y redes neuronales (Topologa 4) Serie VI: v<V Estadstico Vs. Topologa 1 Estadstico Vs. Topologa 2 Estadstico Vs. Topologa 3 Estadstico Vs. Topologa 4 38,46 46,15 42,31 50,00 z 0,98 0,20 0,59 -0,20 Nivel de Confianza 83,66% 57,77% 72,19% 42,23% Grfico 21 Error Absoluto estadstico y redes neuronales (Topologa 2) 76,92 46,15 57,69 57,69 z 2,55 0,20 0,59 0,59 Nivel de Confianza 0,54% 57,77% 27,81% 27,81%
Resultados Serie 7
Resultados Serie 6
6. Conclusiones:
Conclusin 1: Los resultados nos permiten concluir con un nivel de confianza del 82.29 % que las redes neuronales realizaron un pronstico ms acertado en comparacin al mtodo estadstico utilizado. Este resultado corresponde al promedio de los mejores pronsticos para cada serie de tiempo.
Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6 Serie 7 en % en % en % en % en % en % en % Promed io en % 82,29 74,56 36,18 60,27
10
Pronstico de Ventas: Comparacin de Prediccin basada en Redes Neuronales versus Mtodo Estadstico
Uno de los cuadros que result ms interesante para analizar fue el Cuadro 3. En el mismo estn indicados con la letras C los casos en donde el error absoluto del pronstico de Redes fue mayor que el error absoluto del pronstico estadstico. Los casos A y B representan los pronsticos que tuvieron menor error absoluto (A representa el mejor de los pronsticos para cada serie). Serie Serie Serie Serie Serie Serie I II III IV V VI B B A C C A I A B B C B B II B B C B B III B A B C A B IV B Cuadro 3 Resultados generales Del cuadro 2 y el cuadro 3 (los dos cuadros anteriores) podemos inferir que hay casos bien definidos, Serie IV y Serie VII, en donde el pronstico de redes es claramente inferior al pronstico estadstico. Se obtuvo un nivel de confianza promedio de 23.34% y 28.49% respectivamente. Por lo tanto podemos decir que para esos dos productos no es conveniente utilizar el pronstico de Redes neuronales. Si ahora analizamos los resultados del pronstico sin tener en cuenta aquellos productos en donde claramente no conviene utilizar redes se obtiene el siguiente cuadro: Serie 1 Serie 2 Serie 3 Serie 5 Serie 6 Mejor Resultado Mejores 2 resultados Peor Resultado Promedio de Serie 98,45% 99,46% 98,76% 95,99% 83,66% 96,49% 99,46% 94,11% 73,00% 77,92% 27,81% 98,45% 41,91% 33,83% 42,23% 73,24% 99,21% 78,69% 54,99% 63,96% Cuadro 4 Nivel de confianza Los resultados del cuadro anterior, nos permiten decir que el nuevo enfoque para realizar pronsticos es superior al enfoque estadstico con un nivel de confianza promedio del 95.27 % . Conclusin 2: En la mayora de los casos no hubo una topologa determinada que tenga un rendimiento superior a las dems. El promedio del nivel de confianza para cada topologa nos indica que para cada producto habra una topologa determina con la cual podramos obtener pronsticos ms precisos.
Topologa
Conclusin 3: En cuanto al conocimiento necesario para realizar los pronsticos estadsticamente o mediante la utilizacin de redes neuronales podemos decir que es menor en el caso de las redes neuronales. Sin embargo, el usuario necesita saber qu topologa y mtodo de entrenamiento debe aplicar para cada caso en particular.
11
Pronstico de Ventas: Comparacin de Prediccin basada en Redes Neuronales versus Mtodo Estadstico
8. Referencias: 1. Cmo elegir la tcnica de pronstico correcta. Chambers, J. Mullick, S. Y Smith, D. Biblioteca Harvard. 2. Estadstica aplicada a la administracin y la economa. Kazmier, Leonard. Mc Graw-Hill, 1999. 3. Estadstica mdica. Domingo A. Ledesma, Editorial Universitaria de Buenos Aires, 1980. 4. Manual del software Supplier Relationship Management (SRM). Appendix A: Forecast Calculation Methods. 5. Neural Network Utility Versin 3.1: Installation and users guide. IBM, 1994. 6. Operations Management. Derevitsiotis, Kostas. Mc Graw-Hill, 1981. 7. Preparacin y evaluacin de proyectos. Sapag Chain, Mc-Graw Hill, 2000. 8. Probabilidad y estadstica para ingeniera y ciencias. Jay L. Devore; Thompson Editores, 1998. 9. Redes Neuronales Artificiales: Fundamentos, modelos y aplicaciones. Jos R. Hilera, Vctor J. Martnez; Ra-ma, 1995. Sitio de Internet: http://ubmail.ubalt.edu/~harsham/statdata/opre330Forecast. htm
12