Sei sulla pagina 1di 6

Trabajo No 1 de Estadstica III

Analisis de Series de Tiempo: Ajuste de Tendencia y Estacionalidad

14 de agosto de 2017

1. Objetivos del Trabajo

1. Identificar y ajustar modelos globales basados en la descomposicion por regresion y compararlos en


terminos de ajustes y pronostico, usando la estrategia de validacion cruzada.

2. Aplicar tecnicas de ajuste local conforme a los patrones de la serie, tambien usando la estrategia de
validacion cruzada, y comparar con los modelos globales en terminos de ajuste y pronostico.

3. Probar la estabilidad del modelo global.

2. Puntos a desarrollar

La presentacion de la solucion de los puntos a desarrollar y que se enuncian a continuacion, de-


bera acomodarse al formato y al contenido de Secciones descrito en la plantilla de los trabajos del curso
(descargar de moodle el archivo PlantillaTrabajos.docx).

1. Introduccion (ver indicaciones en plantilla de trabajos): Presente consulta sobre que son los datos,
es decir, defina la variable de la serie, su unidad de medida, su construccion e interpretacion de sus
cifras, perodos observados, frecuencia de observacion, total de observaciones y fuente de los datos.

Nota 1: Las series asignadas son construidas y publicadas por el DANE y por tanto debera consultar
y referenciar el estudio u encuesta de la cual se deriva la serie que le correspondio y la clasificacion
industrial del subsector o tipo de productos asociados a esa serie segun Clasificacion Industrial
Internacional Uniforme de todas las Actividades Economicas, Revision 4 adaptada para Colombia
(CIIU REV.4 A.C). Lea en el archivo .csv en el cual esta la serie la informacion en los primeros
renglones y consulte en detalle en la pagina web del DANE. Las series en archivos cuyos nombres
comienzan por EMCM-Serie-indices-nal-..., corresponden a numeros ndices construidos con base
en la Encuesta Mensual de Comercio al por Menor y Vehculos - EMCM; las series en archivos
cuyos nombres comienzan por Anex-mmh-...., corresponden a ndices construidos con base en la
informacion de la Muestra Mensual de Hoteles-MMH.

2. Analisis descriptivo de la serie: Presente y analice la grafica de la serie en terminos de los patrones
observables y argumente si las componentes de la serie son aditivas o multiplicativas; use filtros

1
apropiados para la descomposicion (aditiva o multiplicativa) pero extraiga solo la componente de
tendencia, realice tambien el grafico de boxplots comparativos de la distribucion de la serie versus
perodos del ano calendario y el periodograma identificando en cuales frecuencias pudiera existir
alguna componente periodica y determine si existe componente estacional. De tambien una conclu-
sion preliminar sobre si existe tendencia que se pueda ajustar globalmente o si es local. Considere
ademas en el analisis la identificacion de posibles ciclos, cambios estructurales e intervenciones (si
se dispone de informacion sobre esto ultimo). Interprete considerando la naturaleza de los datos.

Nota 2: Si la serie es de componentes multiplicativas analice solo la tendencia de la descomposicion


aditiva del logaritmo natural de la serie, as mismo realice los boxplots y periodograma solo para los
datos transformados.

Nota 3: En el caso aditivo realice la grafica de la componente de tendencia, as

Tt=decompose(serie)$trend
plot(Tt,ylim=c(min(serie),max(serie)))

En el caso multiplicativo realice la grafica de la tendencia del logaritmo de la serie as

Tt.log=decompose(log(serie))$trend
plot(Tt.log,ylim=c(min(log(serie)),max(log(serie))))

En los dos ejemplos anteriores el objeto serie se supone es el objeto ts() creado en R con los datos
asignados, con formato de serie de tiempo. Tenga presente ademas que el objetivo es tratar de repre-
sentar la tendencia con una curva suave (tanto como sea posible aun en presencia de patrones cclicos).

3. Postulacion de modelos:

a) Modelos de ajuste global: Si la serie es de componentes aditivas, proponga los dos mejores
modelos de regresion-polinomial estacional. Si la serie es de componentes multiplicativas pro-
ponga el mejor modelo exponencial-polinomial estacional y el mejor modelo de ajuste aditivo
sobre el logaritmo natural de la serie (modelo log-polinomial estacional). Los modelos propuestos
deben estar claramente sustentados en los resultados del analisis descriptivo y verificaciones de
ajustes, pronosticos y validez de supuestos en modelos tentativos. Para ello proporcione un breve
resumen de lo hallado en los modelos tentativos que uds. probaron (ademas de los que finalmente
seleccionaron para este trabajo), en cuanto a calidad de ajuste, calidad de pronostico y validacion
de supuestos.

b) Modelos de ajuste local: Considerando la serie en su escala original, y considerando si es aditiva


o multiplicativa, formule el modelo local correspondiente al suavizamiento exponencial Holt-
Winters y el mejor modelo de ajuste local basado en la combinacion del filtro de descomposicion
clasica (para estimar y predecir la componente estacional) con la regresion LOESS (para estimar
y predecir la tendencia). Para este ultimo caso argumente claramente por que el tipo de ajuste local
de tendencia (lineal o cuadratico) y el criterio de informacion (AICC o GCV) usado en la defincion

2
del parametro de suavizamiento loess optimo, resultan la mejor opcion segun calidad del ajuste,
precision de pronosticos y validez de supuestos del modelo local de tendencia loess combinada
con el filtro de la descomposicion clasica.

4. Ajuste de los modelos propuestos con validacion cruzada: Implemente la estrategia de validacion
cruzada. Escoja una porcion de los datos (t = 1, 2, . . . , n, n < N ) para ajustar y otra para comparar
los pronosticos (t = n + 1, n + 2, . . . , N ). Reporte cuantos datos dejo para la validacion cruzada y
explique por que se usara esa cantidad de pronosticos. Para todos los modelos tanto de ajuste global
como local, presente los resultados como se indican en la plantilla para los trabajos del curso en la
Seccion de ajustes de modelos con validacion cruzada. Para todos los modelos tanto de ajuste global
como local, calcule el AIC y BIC usando exp (Cn (p)) (ver en notas de clase Captulo 3 su definicion y
en talleres de clase y del monitor como se programa en R Cn (p), donde Et = Yt Yt ).

Nota 3: En los modelos de ajuste global evalue solo la significancia de los parametros relevantes
que determinan la tendencia y la estacionalidad y para estos ultimos interprete las estimaciones
halladas. Para los modelos basados en ajuste del logartmo natural de la serie, debe obtener las
estimaciones de la serie en su escala original debidamente corregidos por factor de correccion del
sesgo por transformacion lognormal y reportar la formula usada para obtener Yt y el valor del factor
de correccion.

Nota 4: Para comparar las medidas de bondad de ajuste de modelos donde se ajusto en escala
logartmica con modelos donde se ajusto en la escala original de la serie, recuerde que todas las
medidas usadas deben ser calculados en la escala original de los datos.

Nota 5: Para el calculo de exp(Cn (p)) en suavizamientos Holt-Winters use p = 2 + s 1 y en ajuste


combinando descomposicion clasica & LOESS, use p calculado como la suma del numero de parametros
equivalentes de la regresion Loess mas (s 1).

5. Analisis de residuales y validacion de supuestos: Para todos los modelos ajustados, globales y lo-
cales, realice el analisis de residuales como se especifica en la plantilla de los trabajos del curso,
Seccion Analisis de residuales y validacion de supuestos.

Nota 6: Recuerde que para los modelos ajustados sobre el logaritmo de la serie la validacion de los
supuestos se hace con los residuales que directamente arroja el ajuste de tal modelo, es decir, en la
escala logartmica.

6. Pronosticos para la validacion cruzada: Para todos los modelos de ajuste global y local presenta-
dos, presente los resultados y analisis de pronosticos como se indica en la plantilla de los trabajos
del curso en la Seccion Pronosticos para la validacion cruzada. Tenga en cuenta que para mode-
los ajustados sobre logaritmo de la serie tambien es necesario aplicar el factor de correccion por
transformacion lognormal al traer valores pronosticados y sus intervalos de prediccion a la escala
original.

3
7. Seleccion del mejor modelo de ajuste global. Test de estabilidad sobre mejor modelo global: Selec-
cione el mejor modelo de ajuste global entre los dos presentados, argumente de acuerdo a la calidad
de ajuste y pronostico y validez de supuestos: considere los resultados previos del analisis de los
graficos de residuales, de la serie ajustada y pronosticada vs. valores reales, del AIC, BIC, MAPE,
MAE, RMSE y la cobertura y precision de los intervalos de pronostico ex-post. Realice analisis de
estabilidad para el modelo escogido y ajustado con todos los datos (o sea, para t = 1, 2, . . . , N ). Postule
claramente las hipotesis nula y alternativa del test para el vector de parametros y escriba el modelo
teorico bajo cada una de estas hipotesis. Evalue el test mediante la grafica de residuales recursivos,
la grafica CUSUM y la prueba CUSUM de los residuales recursivos, muestre y analice tambien las
estimaciones recursivas de los parametros. Concluya en cada caso sobre la hipotesis de estabilidad.

Nota: Si el mejor modelo global es el modelo exponencial, entonces para el test de estabilidad trabaje
sobre el modelo log-polinomial estacional auxiliar de este modelo exponencial.

8. Conclusiones del trabajo: Para esta seccion remitirse a las indicaciones dadas en la plantilla de
trabajos del curso y exprese claramente que recomienda para la serie en cuanto a ajustes globales o
locales, segun lo realizado hasta el momento.

3. Presentacion, Valor del Trabajo y Condiciones

Para la presentacion de este informe utilice Microsoft Word o LaTex. Hojas tamano carta, formato y
secciones como se especifica en el documento plantilla e imprimir a color las paginas donde aparezcan
las graficas de los ajustes y de la comparacion de los pronosticos en la validacion cruzada, en el punto 6.

El valor del promedio ponderado del trabajo y la prueba escrita subsiguiente es del 40 %. La fecha
de entrega es septiembre 18, horario 10:00 am - 12:00 m.

Finalmente, se incluye una condicion acerca del copiado. En la eventualidad de comprobarse


que hubo copia entre dos trabajos, o que se encargo a un tercero el trabajo a cambio de un pago, se
procedera a anular el trabajo.

4. Guas de Programacion en R

Consulte en los talleres y en ejemplos de clase disponibles en moodle, los distintos procedimientos
vistos para la descomposicion, y la modelacion de la tendencia y la estacionalidad.

Cargar libreras

Tenga en cuenta las siguientes libreras que previamente deben ser instaladas en el computador y
cargadas con library o require.

library(forecast); library(TSA); library(strucchange)


library(fANCOVA)

4
Lectura de los datos, declarar objeto ts y graficacion de la serie

Ver Apendice A de esta gua y archivo R en moodle: PROGRAMARLECTURADATOSASIGNADOS022017.R

5. Asignacion a los grupos de trabajo

Consulte con su respectivo docente y de acuerdo a la asignacion indicada, descargue de moodle el


archivo .csv correspondiente. Lea los datos asignados como se indica en el Apendice A.
Nota 7: El nombre de la serie asignada debe ser definido con base en la informacion que aparece
antecediendo a los datos dentro del archivo .csv a descargar y junto con el nombre especfico de la
columna asignada. Para mas informacion sobre estas variables y segun serie asignada, consulte glosario
y metodologa del DANE de: la Encuesta Mensual de Comercio al por Menor y Vehculos - EMCM,
Muestra Mensual de Hoteles-MMH; busque y presente lo que sea pertinente para responder a lo pedido
en la introduccion de este trabajo.

Apendice A. Instrucciones para uso del programa R para leer y grafi-


car la serie asignada

1. De acuerdo al numero de la serie asignada a su grupo de trabajo, identifique el archivo .csv donde
estan los datos correspondientes. Guardelo y no modifique de ninguna manera su contenido.

2. Guarde el archivo R PROGRAMARLECTURADATOSASIGNADOS022017.R, ingrese al programa R


y por menu Archivo-Abrir Script, acceda a este archivo; busque en este segun el numero de la
serie asignada, las lneas de programacion para leer y graficar el conjunto de datos correspondiente
(busque por Datos#), copielas en un nuevo script de R y guarde con extension .R.

3. Ejecute las lneas de programacion correspondientes para que verifique que no obtiene errores y
para que pueda visualizar los datos. Tal como esta la programacion usando la funcion read.table(),
se habilita la navegacion en su sistema de archivos para ubicar el archivo de datos .csv. No cambie
de ninguna manera la programacion suministrada ni el archivo csv.

Por ejemplo, si su serie es la No. 22 (Datos22), entonces debe usar el archivo EMCM-Serie-indices-nal-
empalmados-ventas-reales-segun-actividad-CIIU-may17.csv del cual debera leer su columna 8: 4751 -
4771. Establecimientos especializados en la venta de productos textiles, prendas de vestir y sus acceso-
rios, siguiendo la programacion R para el objeto Datos22, como aparece en el archivo PROGRAMAR-
LECTURADATOSASIGNADOS022017.R, y al que corresponde las siguientes lneas de programa:

#Para leer EMCM-Serie-indices-nal-empalmados-ventas-reales-segun-actividad-CIIU-may17.csv, col 8: "4751 - 4771. Establecimientos


Datos22=read.table(file.choose(),header=T,sep=";",skip=8,dec=",",colClasses=c(rep("NULL",7),"numeric",rep("NULL",4)))
Datos22=ts(Datos22,freq=12,start=c(2003,1))
plot(Datos22)

5
Referencias

[1] Bowerman, B. L, OConnell, R. T y Koehler, A. B. (2009) Pronosticos, Series de Tiempo y Regresion.


Un Enfoque Aplicado. CENGAGE Learning

[2] Diebold, F. (1999) Elementos de Pronosticos. International Thomson Editores, Mexico.

[3] Cryer, J. D. and Chan, K-S. (2008) Time Series Analysis With Applications in R. Springer.

[4] Gonzalez, N. G. (2013) Notas de Clase Estadstica III 3009137. Escuela de Estadstica, Universidad
Nacional de Colombia Sede Medelln.

[5] Shumway, R. H. and Stoffer, D. S. (2011) Time Series Analysis and Its Applications. With R Examples.
Third ed. Springer

Potrebbero piacerti anche