Sei sulla pagina 1di 23

Capitolo 3 (parte prima) Approccio classico: modelli di (s)composizione Introduzione e analisi mediante funzione analitica

Tipi di pattern sistematico

Molti metodi di previsione si basano sul fatto che, se esiste un pattern sistematico (rispetto al tempo), questo possa essere individuato e separato da eventuali oscillazioni accidentali, mediante metodi di perequazione o smussamento (lisciamento, smoothing) dei dati della serie storica. L’effetto dello smussamento è quello di eliminare disturbi casuali cosicché, una volta individuato il pattern sistematico, questo possa essere proiettato nel futuro per produrre la previsione.

I metodi detti di scomposizione tendono, di norma, a individuare due pattern: il trend-ciclo e la stagionalità. Il trend-ciclo può essere scomposto, a sua volta, in componente di fondo (trend) e oscillazioni congiunturali (ciclo).

Un metodo di scomposizione, di per sé, produce una descrizione dei dati storici (passati) e non una previsione.

N.B. nel seguito, consideriamo il CICLO non presente o compreso nel trend (si parla allora di trend-ciclo)

Capitolo 3

2

Componenti elementari di una serie storica

TREND: componente che varia lentamente nel tempo e che tende a determinare il livello della serie. T t

STAGIONALITÀ: componente periodica che si ritrova uguale o quasi uguale a distanza fissa nel tempo (a distanza di 12 periodi per le serie mensili, a distanza di 4 periodi per le serie trimestrali, a distanza di 7 per le serie giornaliere, ecc.). S t

COMPONENTE IRREGOLARE: componente erratica che determina nella serie oscillazioni tipicamente di breve periodo. Tale componente può essere assimilata a fenomeni dei disturbi accidentali. E t

TREND, STAGIONALITÀ: pattern o componente sistematica

Modelli di composizione

Modello additivo

y t = T t + S t + E t

Modello moltiplicativo

y t = T t x S t x E t

log(y t )= log(T t )+ log(S t )+ log(E t )

Modello misto (con errore additivo)

y t = T t x S t + E t

Due domande

1. Quali valori può assumere la componenti erratica E t nei vari modelli ?

2. Se la serie y t è espressa in Kg., quale sarà l’unità di misura della componenti nei vari modelli ?

Esempio di una serie (trimestrale) a componenti additive

54

52

50

48

46

44

42

40

T t
T t
1 S 5 9 13 17 21 25 29 33 37 41 45 49 53
1
S
5
9
13
17
21
25
29
33
37
41
45
49
53
57
t
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57
1
5
9
13
17
21
25
29
33
37
41
45
49
53
57
E t

15 70

65

10 60

5 55

0 50

45

40

-10

-5

35

30

25

20

-15

-20

4 -25

3

2

1

0

-1

-2

-3

-4

y t = T t + S t + E t

y t = T t + S t + E t

y t = T t + S t + E t
y t = T t + S t + E t
-25 3 2 1 0 -1 -2 -3 -4 y t = T t + S
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57
1
5
9
13
17
21
25
29
33
37
41
45
49
53
57

1

5

9

13

17

21

25

29

33

37

41

45

49

53

57

Capitolo 3

5

Esempio di una serie (trimestrale) a componenti moltiplicative

200

180

160

140

120

100

80

60

40

T t 2 S 5 1.8 255 1 9 13 17 21 25 29 33
T t
2
S 5
1.8 255
1
9
13
17
21
25
29
33
37
41
45
49
53
57
t
1.6
1.4 205
1.2
1
155
0.8
0.6
105
0.4
0.2
55
0 1.2
1
5
9
13
17
21
25
29
33
37
41
45
49
53
57
1.2
E t
5
1.1
1.1
1.0
1.0
0.9
0.9
0.8
1
5
9
13
17
21
25
29
33
37
41
45
49
53
57
Capitolo 3
y t = T t x S t x E t

y t = T t x S t x E t

y t = T t x S t x E t
y t = T t x S t x E t
45 49 53 57 Capitolo 3 y t = T t x S t x E
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57
1
5
9
13
17
21
25
29
33
37
41
45
49
53
57

6

Che serie è?

600 500 400 300 200 100 Index 50 100 1000 100 Capitolo 3 7 Index
600
500
400
300
200
100
Index
50
100
1000
100 Capitolo 3
7
Index
50
100
_

Dati originari (mensili) Passeggeri aerei 1949-60

E’ una serie moltiplicativa

Trasformazione

logaritmica

Diventa una serie additiva

Un’altra serie moltiplicativa

3

2.5

2

1.5

1

0.5

0

T t 2 4 1.8 1 5 9 13 17 21 25 29 33 37
T
t
2
4
1.8
1
5
9
13
17
21
25
29
33
37
41
45
49
53
57
S
3.5
1.6
t
1.4
3
1.2
2.5
1
2
0.8
0.6
1.5
0.4
1
0.2
0
1.2 0.5
1
5
9
13
17
21
25
29
33
37
41
45
49
53
57
0
1.2
E
t
1.1
1.1
1.0
1.0
0.9
0.9
0.8

y t = T t x S t x E t

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57
1
5
9
13
17
21
25
29
33
37
41
45
49
53
57

1 5

9

13

17

21

25

29

33

37

41

45

49

53

Capitolo 3

57

8

Grafici che aiutano a individuare le componenti

255

205

155

105

55

5

Time plot
Time plot

Serie trimestrale (15 anni)

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57
1
5
9
13
17
21
25
29
33
37
41
45
49
53
57
250
1
Seasonal plot
2
3
200
4
5
6
7
150
8
9
10
100
11
12
13
50
14
15
0
Capitolo 3
1
2
3
4
Trimestre
i

9

Grafici che aiutano a individuare le componenti Grafico serie su anni

Ordinata: y t Ascissa: anno

250 200 150 100 50 0 0 5 10 15 Anno Y
250
200
150
100
50
0
0
5
10
15
Anno
Y

Serie trimestrale (15 anni)

Stima delle componenti

In genere le componenti sistematiche di una serie storicanon sono note ma:

1. Talvolta sono approssimabili da una opportuna funzione analitica del tempo

2. Se si possono rappresentare mediante una funzione analitica e allora si usano procedure di lisciamento o smussamento (smoothing).

Iniziamo a vedere la procedura 1) nel caso in cui sia presente solo il trend. Vedremo casi in cui tali funzioni del tempo sono lineari o linearizzabili nei parametri.

Capitolo 3

11

Analisi del trend mediante funzione analitica

TREND: evoluzione lenta e regolare nel lungo tempo.

Supponiamo che l’analisi grafica della serie y t evidenzi la sola presenza del TREND (come componente sistematica).

Y t =f(t)+e t =T t +e t

dove f(t)=T t

è il trend, t=1,…,n

Consideriamo come struttura generale di f(t) una forma polinomiale

f(t)= β 0 + β 1 t +β 2 t 2 +

+β q t q

Se β 1 =β 2 = Se β 2 = β 3 = Se β 3 = β 4 =

=β q =0 pattern orizzontale Y t = β 0 + e t =β q =0 trend lineare Y t = β 0 + β 1 t + e t =β q =0 trend quadratico Y t = β 0 + β 1 t + β 2 t 2 + e t

Capitolo 3

12

Stima del modello

I parametri del modello non sono noti e quindi vengono stimati sui dati della serie col metodo dei minimi quadrati (MQ).

Esempio modello quadratico min β0, β1, β2 Σ t [y t ( β 0 + β 1 t + β 2 t 2 )] 2

Proprietà delle stime dei MQ

Devianza totale (Dtot)= Dev. regressione (Dreg) + Dev. Residua (Dres)

totale (Dtot)= Dev. regressione (Dreg) + Dev. Residua (Dres) Misura di fitting R 2 = Dreg/Dtot

Misura di fitting

R 2 = Dreg/Dtot = 1- (Dres/Dtot)

0 R 2 1

Come si fa a scegliere il grado q del polinomio?

Criterio delle differenze successive

Criterio dell’ R 2 corretto

Capitolo 3

13

Criterio delle differenze successive

Se c’è un TREND lineare:

Y t =(1-B)Y t = β 0 + (e t e t-1 ) pattern orizzontale

Y t = β 0 + β 1 t +e t

Se c’è un TREND quadratico:

2 Y t =(1-B) 2 Y t = 2β 2 + (e t e t-1 )+ (e t-1 e t-2 ) pattern orizzontale

Y t = β 0 + β 1 t + β 2 t 2 +e t

In generale:

Differenziazione di livello q elimina un polinomio di grado q (cioè riporta la serie ad un pattern orizzontale)

Capitolo 3

14

Differenze successivo e trend non lineare ma linearizzabile

Ad esempio, se c’è un TREND esponenziale:

Y t = f(t) ε t = α 0 exp(α 1 t) ε

dove α 0 >0, ε>0

Si linearizza mediante la trasformazione log naturale log(Y t )=log(α 0 )+α 1 t + log(ε ) = β 0 + β 1 t + e t

dove β 0 = log(α 0 )

) = β 0 + β 1 t + e t dove β 0 = log(

e t = log(ε )

siamo nel caso di trend lineare

Trend esponenziale in Y t

= log( ε ) siamo nel caso di trend lineare Trend esponenziale in Y t Capitolo

Capitolo 3

Trend lineare in log(Y t )

15

Criterio dell’ R 2 corretto

Si considerino i seguenti modelli

Trend lineare:

Trend quadratico: Y t = β 0 + β 1 t + β 2 t 2 + e t

Y t = β 0 + β 1 t + e t

Per decidere sul migliore, possiamo confrontare i corrispondenti fitting. Tuttavia, non possiamo confrontare i rispettivi R 2 perché i due modelli hanno un diverso numero di variabili esplicative e, per tale motivo, il quadratico avrà sempre un fitting migliore o al minimo ugual al modello lineare.

Si usa invece l’R 2 corretto che considera la ‘parsimonia’ dei modelli. In generale, con p parametri:

2

R corretto = 1

Dres /( n p )

Dtot /( n 1 )

Capitolo 3

16

Trend non lineare nei parametri: cenni

Molte serie storiche esibiscono trend difficilmente rappresentabili da un polinomio e/o linearizzabili

Andamenti di questo tipo possono essere descritti da particolari modelli detti curve di crescita. I principali sono i seguenti:

Esponenziale

modificata

Logistica

Curva di Gompertz

f ( t )

=β +β

0

1

β

exp( t )

2

β

0

f ( t )

=

α

1

β

exp( kt )

>

α

0,

β <

1

0,

β

2

<

0

>

0,

β

>

0,k 0

>

f ( t ) =α exp(β exp(kt )) α > 0, β > 0,k > 0

Capitolo 3

17

Stima della stagionalità mediante minimi quadrati …

Stagionalità: evoluzione periodica regolare, di periodo k.

Supponiamo che l’analisi grafica della serie y t evidenzi la sola presenza della stagionalità (come componente sistematica).

Y t = β 0 +S t +e t

con β 0 il livello della serie (trend costante), t=1,…,n

dove S t =S t+k =S t+2k = S t+3k … (si ripete rigidamente ogni k tempi)

Inoltre, poiché la stagionalità esplica il suo effetto all’interno dell’anno, si assume che

S 1 +S 2 + … +S k =0

(il dato annuale non contiene effetto stagionale)

Vediamo il modello e la stima nel caso k=4 (serie trimestrale)

Capitolo 3

18

… stima della stagionalità mediante minimi quadrati …

Il modello assunto su una serie storica trimestrale è il seguente

Y t = β 0 +γ 1 D 1t +γ 2 D 2t + γ 3 D 3t +γ 4 D 4t +e t

dove D j t =1 se t è il trimestre j; D jt =0 altrimenti. La stima dei MQ sarà di tipo vincolato

min (β0,γ1,γ2,γ3,γ4)

sotto il vincolo

Σ t (y t -

(β 0 +γ 1 D 1t +γ 2 D 2t + γ 3 D 3t +γ 4 D 4t )) 2

(γ 1 +γ 2 + γ 3 +γ 4 )=0

N.B. S 1 =S 5 =…= γ 1 S 2 =S 6 =…= γ 2 S 3 =S 7 =…= γ 3 S 4 =S 8 =…= γ 4

(primo trimestre) (secondo trimestre) (terzo trimestre) (quarto trimestre)

Capitolo 3

19

Stima simultanea di trend (lineare) e stagionalità

Il modello assunto su una serie storica trimestrale è il seguente

Y t = β 0 +

β 1 t +γ 1 D 1t +γ 2 D 2t + γ 3 D 3t +γ 4 D 4t +e t

La stima dei MQ sarà di tipo vincolato

min (β0, β1, γ1,γ2,γ3,γ4)

Σ t (y t - (β 0 +

β 1 t +γ 1 D 1t +γ 2 D 2t + γ 3 D 3t +γ 4 D 4t )) 2

sotto il vincolo

(γ 1 +γ 2 + γ 3 +γ 4 )=0

Capitolo 3

20

Altri modi per valutare la bontà di un modello …

Indichiamo con y t : valore osservato

y* t : valore stimato (fitted)

Errore di stima (residuo) r t =y t - y* t

Possiamo valutare il fitting mediante vari indici

- Mean error (ME)

- Mean absolute error (MAE)

- Mean squared error (MSE)

- Mean absolute percentage error (MAPE)

squared error (MSE) - Mean absolute percentage error (MAPE) Valori bassi indicano migliore adattamento Capitolo 3

Valori bassi indicano migliore adattamento

Capitolo 3

21

… valutazione fitting

ME =

n

t

r

t = 1

n

MAE =

n

∑ t r t = 1 n
∑ t
r
t = 1
n

MAPE =

n r t ∑ y t = 1 t n
n
r
t
y
t = 1
t
n

100

MSE =

n

(

 

)

2

r

t

t = 1

n

ME: può assumere sia valori positivi che negativi MAE, MSE: possono assumere valori non negativi ME, MAE: stessa unità di misura di y MSE: unità di misura di y elevata al quadrato MAPE: non dipende dall’unità di misura di y.

Capitolo 3

22

Interpretazione degli indici di fitting

E’ importante tenere presente ciò che segue.

1. Metodi diversi utilizzano criteri diversi per la stima dei modelli sui dati storici e quindi non conviene utilizzare un unico indice

2. Nella scelta del modello e nella valutazione della sua accuratezza dobbiamo fare un compromesso fra livello di parsimonia del modello e livello di accuratezza. Su dati di serie storiche, potremo scegliere una forma polinomiale con tanti parametri che riproduce perfettamente tutti i dati. Il modello sarebbe poco parsimonioso (tanti parametri quante sono le osservazioni ?) e si avrebbe anche il fenomeno di overfitting. Tutto ciò non andrebbe bene anche se gli indici di accuratezza darebbero valori vicini a zero.

Capitolo 3

23