Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
y modelación
Parte 10: Modelos autorregresivos
Por Lic. Gabriel Leandro, MBA
La Metodología Box – Jenkins
• El método Box-Jenkins de pronóstico es
diferente de la mayoría de los métodos.
• Esta técnica no asume ningún patrón
particular en los datos históricos de la
serie a pronosticar.
– Se utiliza un enfoque iterativo de
identificación de un modelo útil a partir de
modelos de tipo general.
La Metodología Box – Jenkins
• El modelo elegido se verifica contra los datos
históricos para ver si describe la serie con
precisión.
• El modelo se ajusta bien si los residuos entre el
modelo de pronóstico y los puntos de datos
históricos son reducidos, distribuidos de manera
aleatoria e independiente.
– Si el modelo especificado no es satisfactorio, se
repite el proceso utilizando otro modelo diseñado
para mejorar el origen.
– Este proceso se repite hasta encontrar un modelo
satisfactorio.
Modelos ARIMA
• Los modelos ARIMA o modelos de
promedio móvil autorregresivo integrado
son un tipo general de los modelos de
Box-Jenkins para series de tiempo
estacionarias.
– Recuerde que una serie histórica estacionaria
es aquella cuyo valor promedio no cambia a
través del tiempo.
Modelos ARIMA
• Este grupo incluye a:
– los modelos AR sólo con términos
autorregresivos,
– los modelos MA sólo con términos de
promedio móvil y
– los modelos ARIMA que comprenden tanto
términos autorregresivos como de promedio
móvil.
Modelos ARIMA
• Para efectuar la selección del modelo
apropiado:
– Se compara la distribución de los coeficientes
de autocorrelación de la serie histórica que se
está ajustando,
– con las distribuciones teóricas para los
distintos modelos.
Modelos AR
• Los modelos autorregresivos se presentaron
cuando se tocó el tema de las series de tiempo.
• Sin embargo, las ecuaciones que se plantearán
ahora difieren en varias formas importantes.
– Antes los coeficientes de regresión se estimaban
mediante el método lineal de mínimos cuadrados.
– Ahora los coeficientes de regresión se encuentran
por medio de un método de mínimos cuadrados no
lineal.
Modelos AR
• Por lo regular el método de mínimos
cuadrados no lineal utiliza una técnica de
solución iterativa para calcular los
parámetros en vez de usar un cálculo
directo.
– Se emplean estimaciones preliminares como
puntos iniciales.
– Luego estas estimaciones se mejoran
sistemáticamente hasta encontrar valores
óptimos.
Modelos AR
• Además, ahora las varianzas para las
ecuaciones se calculan de una forma
distinta,
– que toma el hecho de que las variables
independientes están relacionadas entre sí.
– Por último, ahora las ecuaciones pudieran o
no contener un término constante.
Modelos AR
• La modelización ARIMA o Box-Jenkins parte de
considerar que el valor observado de una serie
(un dato de una variable económica) en un
momento determinado de tiempo t es una
realización de una variable aleatoria yt definida
en dicho momento de tiempo.
– Por tanto, una serie de t datos es una muestra de un
vector de t variables aleatorias ordenadas en el
tiempo al que denominamos proceso estocástico.
Modelos AR
• En ocasiones pretendemos predecir el
comportamiento de una variable y en un
momento futuro t, a partir del comportamiento
que la variable tuvo en un momento pasado, por
ejemplo, en el período anterior, yt-1.
– Formalmente notaríamos que
yt = f(yt-1)
– es decir, que el valor de la variable y en el momento t
es función del valor tomado en el período t-1.
Modelos AR
• Puesto que en el comportamiento de una
variable influyen más aspectos, debemos
incluir en la relación anterior un término de
error, et.
– Este et es una variable aleatoria a la que
suponemos ciertas características
estadísticas apropiadas.
• Es decir:
yt = f(yt-1, et)
Modelos AR
• Ahora debemos elegir una forma funcional
concreta para esta expresión.
– Por ejemplo, una forma lineal como
yt = 0 + 1yt-1 + et
– donde 0 es un término independiente y 1 es
un parámetro que multiplica al valor de la
variable y en el período t-1.
Modelos AR
• Utilizando métodos estadísticos
adecuados podemos estimar los
parámetros 0 y 1 de forma que estos
cumplan propiedades estadísticas
razonables y sean una buena (la mejor
posible) estimación.
– Con ello obtendríamos una expresión que
utilizaríamos a efectos de predicción.
Modelos AR
• Esta es la esencia de los modelos
autorregresivos (o modelos AR).
• Se realiza una regresión de la variable yt
sobre sí misma (autorregresión).
– Es decir, se realiza una regresión sobre los
valores que la variable tomó en el período o
periodos anteriores.
Modelos AR
• Un aspecto importante es el orden del modelo
AR.
– Por ejemplo, el modelo
yt = 0 + 1yt-1 + et
– es de orden 1, y se denota como AR(1).
• Si se toma en el modelo como explicativas los
valores de la variable y en los 2 períodos
anteriores, es decir:
yt = 0 + 1yt-1 + 2yt-2 + et
– entonces se ha especificado un AR(2).
Modelos AR
• De igual forma un AR(3) vendría dado por
yt = 0 + 1yt-1 + 2yt-2 + 3yt-3 +et
• En general, un AR(p) viene dado por
yt = 0 + 1yt-1 + 2yt-2 + …+ pyt-p +et
– Es frecuente encontrarnos con Modelos AR con un
bajo orden (1 o 2).
– En series con componente estacional es habitual que
el desfase sea coincidente con la periodicidad de los
datos.
• En ese caso hablamos de modelos SAR.
Modelos AR en Gretl
• Suponga que se tiene la siguiente serie de
datos:
25, 28, 36, 34, 29, 20, 17, 21, 19, 28, 32, 25
• Y que se desea emplear un modelo AR(1)
para efectuar un pronóstico de la serie.
Modelos AR en Gretl
• Primero se introduce la serie de datos.
• Es útil observar la gráfica de los datos.
– Menú: Variable – Time series plot
• Para aplicar el modelo AR(1):
– Menú: Model – Time series – ARIMA
• Dependent variable: Yt
• AR order: 1
• Difference: 0
• MA order: 0
36
34
32
30
28
Yt
26
24
22
20
18
16
1950 1951 1952
Modelos AR en Gretl
ARMA estimates using the 12 observations 1950:1-1952:4
Estimated using Kalman filter (exact ML)
Dependent variable: Yt
32
30
28
26
24
22
20
18
16
14
1951.8 1952 1952.2 1952.4 1952.6 1952.8 1953
Modelos SAR
• Cuando se modela una serie con
estacionalidad,
• por ejemplo, la tasa de variación mensual de
inflación, con 12 datos al año,
– la comparación adecuada no solo debe ser,
por ejemplo, de la inflación de junio de 2004
con mayo y abril de 2004,
– sino con el mismo mes (junio) de los años
anteriores, en nuestro ejemplo 2003 y 2002.
• Ello da lugar a los modelos SAR.
Modelos SAR
• La formulación sería la siguiente:
– Un modelo SAR(1), también denotado como
ARs(1) viene dado por:
yt = 0 + 1yt-s + et
• donde s=4, si la serie a modelar es de frecuencia
trimestral,
• o s=12, si la serie es mensual.
– Un modelo SAR(2) se especificaría como:
yt = 0 + 1yt-s + 2yt-2s + et
Modelos MA
• Una alternativa de modelización pasa por
tratar de explicar el comportamiento de
una variable y, no en función de los
valores que tomó en el pasado (modelos
AR)
– sino a través de los errores al estimar el valor
de la variable en los períodos anteriores.
• Ello da lugar a los modelos de medias
móviles.
Modelos MA
• Por ejemplo, un modelo MA(1) viene dado
por la expresión
yt = + et + 1et-1
– donde es el valor constante alrededor del
cual se mueve la variable, y ha de ser
estimado igualmente con los coeficientes .
Modelos MA en Gretl
• Se introducen los datos.
– Menú: Model – Time series – ARIMA
– MA order: 1
Modelos MA en Gretl
ARMA estimates using the 12 observations 1950:1-1952:4
Estimated using Kalman filter (exact ML)
Dependent variable: Yt
AR(1): yt = 0 + 1yt-1 + et
1 1
0 k 0 k
-1 -1
AR(1): yt = 0 + 1yt-1 + et
1 1
0 k 0 k
-1 -1
1 1
0 k 0 k
-1 -1
1 1
0 k 0 k
-1 -1
MA(1): yt = W0 + et - W1et-1
1 1
0 k 0 k
-1 -1
MA(1): yt = W0 + et - W1et-1
1 1
0 k 0 k
-1 -1
1 1
0 k 0 k
-1 -1
1 1
0 k 0 k
-1 -1
1 1
0 k 0 k
-1 -1
1 1
0 k 0 k
-1 -1
1 1
0 k 0 k
-1 -1
1 1
0 k 0 k
-1 -1
FAC FAP
Se anula para Decrecimiento
MA(q) retardos rápido sin llegar a
superiores a q anularse
Decrecimiento Se anula para
AR(p) rápido sin llegar a retardos
anularse superiores a p
1 +- 1,96/T^0,5
0.5
-0.5
-1
0 2 4 6 8 10 12
lag
PACF for Yt
1 +- 1,96/T^0,5
0.5
-0.5
-1
0 1 2 3 4 5 6
lag
Modelos ARIMA en Gretl
ARIMA(1,1): yt = 0 + 1yt-1 + et - W1et-1
1 1
0 k 0 k
-1 -1
260
255
250
245
240
235
230
225
220
215
0 10 20 30 40 50
Solución
• La gráfica parece mostrar una cierta
tendencia en los datos.
• El primer paso para identificar un modelo
tentativo es observar los coeficientes de
autocorrelación de los datos.
• En Gretl:
– Seleccionar PCierre
– Variable – Correlogram – Maximum lag: 24
Autocorrelation function for PCierre
1 +- 1,96/T^0,5
0.5
-0.5
-1
0 5 10 15 20 25
lag
1 +- 1,96/T^0,5
0.5
-0.5
-1
0 5 10 15 20 25
lag
Solución
• Al observarse que las primeras 12
autocorrelaciones parecen descender a
cero, entonces podría decirse que la
apreciación inicial de que existe tendencia
era correcta.
• Para resolver este problema puede
diferenciarse la serie.
Solución
• En Gretl:
• Seleccionar PCierre
• Add – First differences of selected variables
– Después graficar:
• Seleccionar PCierre
• Variable – Time series plot
– Analizar autocorrelograma:
• Seleccionar PCierre
• Variable – Correlogram – Maximum lag: 24
6
-1
-2
-3
-4
0 10 20 30 40 50
• Autocorrelation function for d_PCierre
1 +- 1,96/T^0,5
0.5
-0.5
-1
0 5 10 15 20 25
lag
1 +- 1,96/T^0,5
0.5
-0.5
-1
0 5 10 15 20 25
lag
Solución
• La gráfica de las autocorrelaciones de los
datos diferenciados muestra que los datos
son estacionarios.
• En consecuencia se puede aplicar la
metodología Box – Jenkins para modelar
los datos.
Solución
ARIMA estimates using the 11 observations 1950:2-1952:4
Estimated using Kalman filter (exact ML)
Dependent variable: (1-L) Yt