Sei sulla pagina 1di 15

Exploracin de patrones de datos y seleccin de la tcnica de pronstico

Series de tiempo
Mgr. Jos Luis Morales Rocha

Mgr. Jos Luis Morales Rocha

Exploracin de patrones de datos y seleccin de la tcnica de pronstico


Series de tiempo La generacin de un pronstico preciso y til implica dos consideraciones bsicas: La primera consiste en reunir datos que sean aplicables para la tarea de pronstico y que contengan informacin que pueda producir pronsticos precisos. El segundo factor es seleccionar una tcnica de pronostico que utilice al mximo la informacin contenida en los datos y los patrones que estos presentan.

Componentes de las series de tiempo


Una serie de tiempo consta de datos que renen, registran u observan sobre incrementos sucesivos de tiempo.

Tendencia de una serie de tiempo


Es el componente de largo plazo que representa el crecimiento o disminucin en la serie sobre un periodo amplio.

Componente cclico
Es la fluctuacin en forma de onda alrededor de la tendencia.

Componente estacional
Es un patrn de cambio que se repite as mismo ao tras ao.

Componente aleatorio
Mide la variabilidad de las series de tiempo despus de retirar los otros componentes.

Exploracin de patrones mediante el anlisis de correlacin


Cuando se mide una variable a travs del tiempo, con frecuencia esta correlacionada consiga misma cuando se desfasa uno o ms periodos. Esta correlacin se mide mediante e coeficiente de auto correlacin.

Mgr. Jos Luis Morales Rocha

Autocorrelacin
Es la correlacin existente entre una variable que es desfasada uno o ms periodos y la misma variable de la serie de tiempo. Los patrones de datos que incluyen componentes como tendencia, estacionalidad e irregularidad se pueden estudiar usando el enfoque de anlisis de correlacin. Para el clculo del coeficiente de autocorrelacin de primer orden (r1) o la correlacin entre Yt y Yt-1 est dado por: ( )( ( ) )

Dnde: : Coeficiente de autocorrelacin de primer orden : Media de los valores de la serie : Observacin en el periodo t : Observacin en el periodo anterior o en el periodo t-1 Para el clculo del coeficiente de autocorrelacin de orden k; (rk) entre Yt y Yt-1, est dado por: ( )( ( ) )

Por ejemplo, Harry Vilca reuni datos sobre el nmero de videocaseteras que vendi el ao pasado. Los datos se presentan en la siguiente tabla:
Periodo t 1 2 3 4 5 6 7 8 9 10 11 12
2

Mes Enero Febrero Marzo Abril Mayo Junio Julio Agosto Setiembre Octubre Noviembre Diciembre

Datos originales Yt 123 130 125 138 145 142 141 146 147 157 150 160

Y desfasada un periodo Yt-1 123 130 125 138 145 142 141 146 147 157 150

Y desfasada dos periodos Yt-1 123 130 125 138 145 142 141 146 147 157

Mgr. Jos Luis Morales Rocha

Calcular el coeficiente de autocorrelacin de primer y segundo orden.


Solucin

Periodo t 1 2 3 4 5 6 7 8 9 10 11 12

Yt 123 130 125 138 145 142 141 146 147 157 150 160 1704

Yt-1 123 130 125 138 145 142 141 146 147 157 150

Yt - -19 -12 -17 -4 3 0 -1 4 5 15 8 18 0

Yt-1 - -19 -12 -17 -4 3 0 -1 4 5 15 8 -18

(Yt - )2 361 144 289 16 9 0 1 16 25 225 64 324 1474

(Yt - ) (Yt-1 - ) 228 204 68 -12 0 0 -4 20 75 120 144 843

Existe alguna correlacin en esta serie de tiempo desfasada un periodo. Esto significa que las ventas sucesivas de videocasetes estn de alguna manera relacionadas una con otra. ( )( ( ) )

Existe una autocorrelacin moderada en esta serie de tiempo desfasada en dos periodos. Por consiguiente, utilizaremos el programa Eviews para poder visualizar las autocorrelaciones en varias desfases de tiempo.

Correlograma
Es una herramienta grafica que se emplea, para exhibir las autocorrelaciones para varios desfases en una serie de tiempo. Para nuestro ejemplo se muestran en el siguiente esquema:

Mgr. Jos Luis Morales Rocha

Los coeficientes de autocorrelacin para diferentes periodos desfasados de una variable se pueden utilizar en una serie de tiempo de datos para identificar lo siguiente: Los datos son aleatorios? Los datos tienen una tendencia (no estacionaria)? Los datos son estacionarios? Los datos son estacionales?

1. Si una serie es aleatoria; la correlacin entre Yt y Yt-1 es cercana a cero y los valores sucesivos de la serie de tiempo no guardan relacin entre s. 2. Si una serie tiene tendencia, Yt y Yt-1 estn altamente correlacionados y es tpico que los coeficientes de autocorrelacin sean diferentes de cero de manera significativa para varios de los primeros periodos de desfasamiento y caigan gradualmente hacia cero al incrementarse el nmero de periodos. 3. Si una serie tiene un patrn estacional, se presentara un coeficiente de autocorrelacin significativo en el periodo de desfasamiento correspondiente: cuatro en los datos trimestrales o doce en los mensuales. 4. Si una series es estacionaria, es aquella cuyas propiedades estadsticas bsicas, como la media y la varianza permanecen constantes en el tiempo. Se dice que una serie que no presenta crecimiento o declinaron es estacionaria. Los coeficientes de autocorrelacin de datos estacionarios caen a cero despus del segundo o tercer periodo de desfasamiento.

Cuando la serie es aleatoria


A un nivel de confianza, se puede considerar aleatoria una muestra, si los coeficientes de autocorrelacin calculados se encuentran todos dentro del intervalo producido por la siguiente ecuacin:

(1)

Mgr. Jos Luis Morales Rocha

Dnde: Z: Es el valor normal estndar para un novel de confianza dado. n: Nmero de observaciones en la serie. Prueba de hiptesis para determinar si una serie es aleatoria

El estadstico de prueba est dado por: Ejemplo, Se tiene una serie con 30 observaciones:
Periodo t 1 2 3 4 5 6 7 8 9 10 Yt 646 477 560 688 892 386 747 533 127 54 Periodo t 11 12 13 14 15 16 17 18 19 20 Yt 707 709 39 164 30 708 379 458 590 766 Periodo t 21 22 23 24 25 26 27 28 29 30 Yt 173 145 674 533 67 296 838 242 717 196

Al graficar las observaciones, observamos que los datos son aleatorios.


NUM
900 800 700 600 500 400 300 200 100 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30

Mgr. Jos Luis Morales Rocha

Por lo tanto, podemos observar que las muestras son aleatorias, entonces hallamos los valores de la ecuacin (1). {

Podemos concluir que si un coeficiente de autocorrelacin es menor que -0.353 mayor que 0.353, entonces se rechaza la hiptesis nula, en caso contrario no rechazarla (rechazar H0 si rk <-0.353 rk >0.353). Para ello hallamos el Correlograma como se muestra a continuacin:

Las dos lneas de los puntos paralelas al eje vertical son los lmites de confianza al 95% (<-0.353 y 0.353), se verifican 16 periodos de desfase y todos los coeficientes de autocorrelacin se ubican dentro de estos lmites. Por consiguiente se determinar que la serie es aleatoria.

Cuando la serie tiene tendencia


Si una serie tiene tendencia, existe una relacin significativa entre los valores sucesivos de la serie de tiempo. Es tpico que los coeficientes de autocorrelacin sean significativamente diferentes de cero para varios de los primeros periodos de desfasamiento y caigan despus gradualmente hacia cero al incrementarse el nmero de periodos. Una serie estacionaria es aquella cuyas propiedades estadsticas bsicas, como la media, la varianza, permanecen constantes en el tiempo. Se dice que una serie que no presenta crecimiento o declinacin es estacionaria. Una serie que tiene una tendencia se dice que es no estacionaria.
6

Mgr. Jos Luis Morales Rocha

En estas series se deben quitar la tendencia antes de realizar cualquier anlisis posterior, como su uso en los procedimientos de Box-Jenkins. Por ejemplo, A Alberto Mendoza un analisite se le asigna la tarea de pronosticas las ventas del 2010. Alberto rene los datos de 1974 a 2009, como se muestra en la tabla siguiente:
AO 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 VENTAS DE ROPA Yt 3307 3556 3601 3721 4036 4134 4268 4578 4093 5716 6357 6769 7296 8178 8844 9251 10006 10991 AO 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 VENTAS DE ROPA Yt 12306 13101 13639 14950 17224 17946 17514 25195 27357 30020 35883 38828 40715 44282 48440 52251 53794 55972 57242

Estos datos se grafican en la serie de tiempo siguiente:

Mgr. Jos Luis Morales Rocha

VENTAS
60,000

50,000

40,000

30,000

20,000

10,000

0 1975 1980 1985 1990 1995 2000 2005 2010

Luego determina el Correlograma utilizando el software Eviews.

Al examinarlo nota que las autocorrelaciones para los primeros 7 periodos de desfasamiento son significativamente diferentes de cero y que estos valores gradualmente caen a cero. Por lo tanto Alberto determina que los datos tienen tendencia.

Mgr. Jos Luis Morales Rocha

Alberto sabe que la serie debe diferenciarse para quitar la tendencia y crear una serie estacionaria. Primero realiza la diferenciacin de los datos mediante el Eviews y desarrolla un Correlograma similar al siguiente:

En este Correlograma se aprecia que el coeficiente de autocorrelacin para el periodo de desfasamiento 3, es significativamente diferente de cero y que los dos primeros coeficientes y el cuarto estn cerca de ser significativos. Despus del tercer desfase el patrn decae gradualmente a cero.

Cuando la serie es estacional


Si una serie es estacional, un patrn se repite a si mismo en forma regular durante un intervalo particular (por lo regular un ao), y se presentaran coeficientes de autocorrelacin significativos en el periodo de desfasamiento correspondiente. Si se analizan datos trimestrales, aparecer un coeficiente de autocorrelacin significativo en el periodo de desfasamiento 4. Si los datos se analizan mensualmente, aparecer un coeficiente de autocorrelacin significativo en el periodo 12. Es decir Enero se correlacionada con otros eneros, febrero con otros febreros, etc. Por ejemplo mostramos a continuacin una serie estacional. VENTAS POR TRIMESTRES (2001 2010)
AO FISCAL 2001 2002 2003 2004 2005 DICIEMBRE 31 147.60 139.30 140.50 168.80 259.70 MARZO 31 251.80 221.20 245.50 322.60 401.10 JUNIO 31 273.10 260.20 298.80 393.50 464.60 SETIEMBRE 31 249.10 259.50 287.00 404.30 479.70
9

Mgr. Jos Luis Morales Rocha

2006 2007 2008 2009 2010

264.40 232.70 205.10 193.20 178.30

402.60 309.20 234.40 263.70 274.50

411.30 310.70 285.40 292.50 295.40

385.90 293.00 258.70 315.20 311.80

Graficando la serie:
VENTAS
500 450 400 350 300 250 200 150 100 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

El Correlograma es el siguiente:

10

Mgr. Jos Luis Morales Rocha

Se observa que en periodo 4 de desfasamiento, los coeficientes de autocorrelacin son significativamente diferentes de cero (0.733 > 0.31), por lo que se concluye que las ventas son estacionales en una base trimestral.

Seleccin de una tcnica de pronstico


Se deben de considerar algunas preguntas antes de decidir sobre la tcnica de pronstico ms adecuada para un problema en particular: 1. 2. 3. 4. 5. 6. 7. Por qu se requiere un pronstico? Quin utilizar el pronstico? Cules son las caractersticas de los datos disponibles? Qu espacio de tiempo se pronosticar? Cules son los requerimientos mnimos de datos? Cul es la precisin deseada? Cul ser el costo del pronstico?

Para una buena seleccin de la tcnica de pronstico adecuada, el pronosticador deber hacer lo siguiente: 1. Definir la naturaleza del problema 2. Explicar la naturaleza de los datos bajo investigacin 3. Describir las capacidades y limitaciones de las tcnicas de pronsticos potencialmente tiles. 4. Desarrollar algunos criterios predeterminados sobre los cuales se pueda tomar la decisin de seleccin. Un factor importante que influye en la seleccin de una tcnica de pronostico consiste en la identificacin y comprensin de patrones histricos en los datos. Si se pueden reconocer patrones de tendencia, cclicos o estacionales, entonces se pueden seleccionar las tcnicas con la capacidad de utilizar eficazmente estos patrones.

Tcnicas de pronstico para datos estacionales


Varias tcnicas que se podran considerar al pronosticar en series estacionales son los mtodos no formales, los mtodos de promedio simple y los mtodos mviles, atenuacin exponencial y de Box-Jenkins.

Tcnicas de pronstico para datos con una tendencia


Las tcnicas a considerar al pronosticar series con tendencia son promedio mvil lineal, atenuacin exponencial lineal de Brown, atenuacin exponencial lineal de Holt, atenuacin exponencial cuadrtica de Brown, regresin simple, modelo de Gompertz, curvas de crecimiento y modelos exponenciales.

Tcnicas de pronstico para datos con estacionalidad


11

Mgr. Jos Luis Morales Rocha

Las tcnicas a considerar al pronosticar series estacionales son descomposicin clsica, Census II, atenuacin exponencial de Winter, regresin mltiple de series de tiempo y mtodos de Box-Jenkins.

Tcnicas de pronstico para series cclicas


Las tcnicas a considerar al pronosticar series cclicas son descomposicin clsica, los indicadores econmicos, los modelos economtricos, la regresin mltiple y mtodos de Box-Jenkins.

Medicin del error en el pronstico


Existen diferentes mtodos para medir los errores generados por una tcnica particular de pronstico, que consiste en determinar la diferencia entre los valores observados y los valores de pronsticos, que a menudo son llamados residuales.

Residual
Un residual es la diferencia entre un valor real y su valor de pronstico. Para determinar el error residual de cada periodo de pronstico, se utiliza la siguiente formula: En donde: : Error del pronstico en el periodo t : Valor real en el periodo t : Valor del pronstico en el periodo t

Mtodos para calcular el error de pronstico 1. Desviacin absoluta media (DAM)


Mide la precisin de un pronstico mediante el promedio de la magnitud de los errores de pronstico (valores absolutos de cada error). La DAM es de gran utilidad cuando se desea medir el error de pronstico en las mismas unidades de la serie original. Se calcula de la siguiente manera: | |

2. Error medio cuadrado (EMC)


Este enfoque penaliza los errores mayores de pronstico ya que eleva cada uno al cuadrado. En ocasiones es preferible una tcnica que produzca errores moderados a otra que por lo regular tenga errores pequeos, pero que ocasionalmente arroje algunos en extremos grandes. La ecuacin muestra el clculo del EMC:
12

Mgr. Jos Luis Morales Rocha

3. Porcentaje de error medio absoluto (PEMA)


En ocasiones resulta ms til calcular los errores de pronstico en trminos de porcentaje y no en cantidades. El PEMA proporciona una indicacin de que tan grandes son los errores de pronstico comparados con los valores reales de la serie. La ecuacin muestra el clculo de la PEMA. | |

4. Porcentaje medio de error (PME)


A veces resulta necesario determinar si un mtodo de pronostico est sesgado (pronostico consistente alto o bajo). Si un enfoque de pronstico no est sesgado el PME producir un porcentaje cercano a cero. Si el resultado es un porcentaje negativo grande, el mtodo de pronstico est sobrestimado de manera consistente. Si el resultado es un porcentaje positivo grande, el mtodo de pronstico est subestimado en forma consistente. Est dado por: ( )

En el siguiente ejemplo se presenta datos del nmero de clientes diarios que requieren trabajos de reparacin Yt y un pronstico de estos datos. La tcnica de pronstico utiliza el nmero de clientes atendidos en el periodo anterior, como pronostico del periodo actual.
Periodos t Datos Yt Clientes Pronostico del error

| |

(| | )

( )

1 2 3 4 5 6 7 8 9

58 54 60 55 62 62 65 63 70

58 54 60 55 62 62 65 63

-4 6 -5 7 0 3 -2 7 12

4 6 5 7 0 3 2 7 34

16 36 25 49 0 9 4 49 188

7.4 10.0 9.1 11.3 0.0 4.6 3.2 10.0 55.6

-7.4 10.0 -9.1 11.3 0.0 4.6 -3.2 10.0 16.2

Los clculos para evaluar este modelo mediante DAM, EMC, PEMA y PME se muestran en la tabla y en las siguientes formulas:
13

Mgr. Jos Luis Morales Rocha

| ) |

( |

En conclusin tenemos que: La DAM indica que cada pronostico esta desviado en un promedio de 4.3 clientes. El EMC indica de 23.5 y el PEMA de 6.95% se compararan con el EMC y PEMA de cualquier otro modelo empleado para pronosticar estos datos. Por ltimo, un bajo PME de 2.03% indica que la tcnica no est desviada; ya que su valor es cercano a cero, la tcnica no sobrestima ni subestima en forma consistente el numero diario de clientes atendidos.

14

Potrebbero piacerti anche