Sei sulla pagina 1di 43

L'analisi delle serie storiche:

un'introduzione alle tecniche


statistiche classiche
Simone Celant
1. Introduzione
Uno degli obiettivi chiave dell'analisi statistica dei dati quello di fornire previsioni
sull'andamento di determinate grandezze. In qualunque genere di circostanza ci si trovi, la
previsione uno strumento molto importante nell'ottica di una pianificazione efficiente. Che tempo
far domani Come si comporteranno i prezzi dei beni di consumo nel corso del prossimo
trimestre Che tipo di domanda posso aspettarmi per le automobili nel prossimo anno Che tipo di
ciclo economico affronteremo nei prossimi !"# anni $uanto guadagner% tra &' anni Sono tutte
domande la cui risposta, se conosciuta dal soggetto interessato, permette di prendere delle decisioni
ottimali su diversi orizzonti temporali.
(vere un'idea del tempo previsto per domani mi permette di scegliere il vestiario pi) consono, in
modo che io non soffra il caldo o il freddo* sapere quale sar l'andamento dei prezzi dei beni di
consumo nel futuro immediato permette alle autorit di prendere eventuali decisioni di politica
monetaria per scongiurare un'inflazione troppo alta* un'azienda automobilistica pu% decidere di
compiere o meno degli investimenti o delle assunzioni sulla base che si preveda che la domanda di
automobili cresca o si riduca nel corso di un anno* governo, aziende e persone possono prendere
decisioni ottimali in termini, ad esempio, di politica fiscale +l'aumento della spesa per la ricerca,, di
compiere degli investimenti +l'apertura una nuova filiale, o di decisioni di consumo durevole
+l'acquisto di un'automobile, se prevedono che nei prossimi anni la congiuntura economica sar
positiva, mentre manterranno un atteggiamento pi) prudente se pensano che il ciclo sar negativo*
le mie prospettive di guadagno possono farmi prendere decisioni molto diverse sul tipo di casa che
potrei acquistare, e valutazioni analoghe possono permettere ad una banca di accettare o rifiutare la
mia richiesta di mutuo minimizzando il rischio di insolvenza.
-ell'ottica di effettuare delle previsioni, la metodologia statistica pi) adatta il modello di
regressione. Il modello di regressione, tuttavia, si basa sul il fatto che la variabile di cui si intende
prevedere l'andamento futuro dipenda da una o pi) variabili utilizzate come regressori. .' possibile
tuttavia che anche l'andamento futuro di questi regressori sia incerto/ ad esempio, il principale
regressore per la domanda di qualunque tipo di bene il reddito. $uindi, stando al modello di
regressione usuale, se voglio stimare quale sar la domanda di automobili di un paese per il
prossimo anno devo sapere quale sar il reddito interno lordo di quel paese/ in altre parole, tutto
quello che posso fare, in assenza di ulteriori informazioni, dire che 0se il reddito sar questo, la
domanda di automobili sar questa1.
In molte circostanze, tuttavia, il miglior metodo di previsione per l'andamento una determinata
variabile consiste nel basarsi sul suo valore attuale e passato/ la temperatura prevista per la giornata
di domani differir generalmente piuttosto poco rispetto a quella che si registrata oggi* il mio
reddito dell'anno prossimo sar probabilmente piuttosto simile a quello di quest'anno* e via dicendo.
In altre parole, il miglior metodo di previsione per l'andamento futuro di alcune variabili consiste
nel verificare come si sono comportate dette variabili nel tempo. Sulla base di questa
considerazione nasce la necessit di sviluppare metodologie che consentano l'analisi delle
cosiddette serie storiche, o serie temporali.
Una serie storica consiste nell'osservazione di una o pi) variabili ad intervalli regolari di tempo.
In questa sede ci si concentrer su serie storiche univariate, in cui l'analisi si concentra su una sola
variabile alla volta. Un tipico esempio di serie storica univariata rappresentato dalle rilevazioni
trimestrali del 2rodotto Interno 3ordo dell'Italia effettuate dall'IS4(4. 3'analisi delle serie storiche
consiste in una serie di metodologie che permettono di scomporre l'andamento, solitamente
irregolare ed altalenante, di questa serie, nelle sue componenti pi) importanti, alcune
deterministiche, altre accidentali, nell'ottica di individuare con la maggiore esattezza possibile
l'andamento di fondo e di poter effettuare delle previsioni sul comportamento futuro realistiche ed
efficienti. $uesto tipo di approccio va sotto il nome di analisi classica delle serie storiche.
In questa sede, come esempio applicativo, verr portata avanti, parallelamente all'introduzione
delle tecniche di analisi, uno studio della serie storica dei flussi turistici mensili in negli ultimi &'
anni.
2. Definizioni, rappresentazioni ed analisi preliminari
Una serie storica una serie di osservazioni del medesimo fenomeno ad intervalli regolari di
tempo. Come gi accennato, esempi di serie storiche possono essere il fatturato giornaliero di
un'attivit, il prezzo orario delle azioni di una compagnia, il profitto annuo di un'azienda, la
temperatura massima giornaliera in una determinata localit. ( differenza dei dati cross"section, una
serie storica si concentra su un solo fenomeno e lo segue nel tempo. 3'obiettivo di questo tipo di
rilevazione un'analisi in cui si cerchi di stabilire se esistono delle regolarit nello sviluppo
temporale della serie. Successivamente, supponendo che queste regolarit rimangano invariate nel
tempo, utilizzarle per prevedere l'andamento futuro della serie.
Si noti che l'analisi delle serie storiche tratta il fenomeno oggetto di studio come una scatola
chiusa priva di contatti con l'esterno. 3'unica cosa cui si interessati dare una spiegazione
quantitativa all'andamento nel tempo di detto fenomeno, in modo da poter formulare delle ipotesi
realistiche sul suo andamento futuro, indipendentemente da eventuali variabili che possano
influenzare l'andamento della serie, sia nel passato che in ottica previsiva/ il fenomeno viene
modellato solamente rispetto al tempo. In altre parole, la nostra attenzione focalizzata solamente
sull'andamento della serie e sulle previsioni sul suo andamento futuro, non siamo interessati a cosa
determini questo andamento. -ell'esempio dello studio del mercato dell'automobile, la domanda
futura sar trattata come funzione esclusiva della domanda presente e passata, indipendentemente
da variabili rilevanti come reddito pro capite o numero di veicoli in circolazione nel paese. $uindi,
l'analisi dell'andamento dei flussi turistici verr considerato un fenomeno isolato/ siamo interessati
solo a vedere come si evoluto l'andamento degli arrivi e delle presenze sul territorio italiano
nell'ultima decina d'anni, non di se e come fattori come il ciclo economico, gli investimenti,
l'inquinamento ambientale abbiano influenzato questo andamento. $uesto tipo di considerazioni
verr, eventualmente, introdotto in seguito come sussidio interpretativo ai risultati che emergono
dall'analisi del fenomeno in s5 considerato.
6ue esempi di serie storiche sono riportati nelle seguenti tabelle 7.& e 7.7. -ella tabella 7.&
riportata la stima IS4(4 della popolazione residente in Italia nel periodo &897"7''9.
Tab. 2.1: Popolazione residente in Italia nel periodo 1982-2008
Una prima analisi intuitiva che conviene effettuare per avere un'idea del tipo di fenomeno che si
sta affrontando una semplice analisi grafica. Il tipo di grafico pi) semplice per rappresentare una
serie temporale il cosiddetto time plot +o line plot,, che rappresenta l'evoluzione della serie
rispetto al tempo. Il time plot della serie della popolazione italiana riportato in figura 7.&.
Fig. 2.1: Time plot per i dati in tab. 2.1
6all'analisi grafica si evince che la popolazione italiana cresciuta molto lentamente fino al
7''&, per poi subire un'improvvisa impennata nel corso degli ultimi 9 anni. Si noti tuttavia che
l'IS4(4 aggiorna le proprie stime continuamente, in particolare in occasione dei censimenti
decennali, l'ultimo dei quali relativo proprio al 7''&. -el corso dell'anno 7''8 non solo stato
inserito il valore relativo al primo gennaio 7''8, ma sono stati aggiornati anche le stime relative
agli anni precedenti. 2er avere una stima efficiente dell'evoluzione della popolazione residente in
Italia bisogna dunque attendere che siano disponibili i dati del nuovo censimento, che avr luogo
nel 7'&&. In virt) di queste considerazioni, si pu% osservare come la serie relativa alla popolazione
residente, in particolare in riferimento al periodo di tempo per il quale i dati sono da considerarsi
attendibili, relativamente regolare/ presenta un andamento debolmente crescente, che ha
conosciuto una piccola accelerazione nel periodo tra la fine degli anni ottanta e l'inizio degli anni
novanta.
-ella seguente 4abella 7.7 invece riportata la serie del consumo interno lordo annuo di energia
elettrica dell'Italia +dati in giga:att ora, ;:h, dal sito di 4erna, nel periodo dal &8<! al 7''=. Il
relativo time plot riportato in figura 7.7.
In questo caso l'analisi preliminare del time plot permette di identificare che la serie ha un
andamento di fondo, o trend, crescente, e che questa crescita avviene ad un ritmo complessivamente
costante. Inoltre, si nota che con una certa regolarit si verificano dei momentanei rallentamenti
nella crescita di domanda di energia, quando non si tratta proprio di lievi cali/ il caso ad esempio
del lieve calo che caratterizza il &8=> o del periodo di domanda sostanzialmente costante che
caratterizza i primi anni ottanta ed i primi anni novanta. $ueste variazioni nel ritmo di crescita
hanno due caratteristiche importanti/ da un lato si verificano con una certa regolarit, dall'altro
questa regolarit non perfetta, n5 in termini di intervallo temporale +la seconda flessione nella
domanda di energia si verifica circa > anni dopo la prima, ma bisogna aspettarne quasi &' per
osservarne un'altra,, n5 in termini di intensit +la flessione di domanda del &8=> ha comportato una
diminuzione della domanda lorda evidente anche nel grafico, quella dei primi anni novanta solo un
rallentamento nel ritmo di crescita, il che le rende non esattamente prevedibili. $ueste periodiche
oscillazioni dei valori della serie sono dette cicli.
3e serie che tipicamente sono interessate da movimenti ciclici sono le serie economiche.
Chiunque ha sentito parlare di ciclo economico, di periodi di espansione e di contrazione o crisi. 3e
serie economiche come quelle del 2I3 di qualunque paese sono caratterizzate da un trend di fondo
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
54000000
55000000
56000000
57000000
58000000
59000000
60000000
61000000
crescente e da variazioni cicliche di entit pi) o meno importante, che possono essere rappresentate
da semplici rallentamenti nel ritmo di crescita o da periodi di contrazione denominati 0recessioni1
+formalmente, si dice che un paese in recessione quando il suo 2I3 registra un calo in due
rilevazioni trimestrali consecutive,.
Tab. 2.2: Consumo interno dell'Italia di energia elettria in !"# nel periodo 19$%-200&
Fig. 2.2: Time plot dei dati in tab. 2.2
2er poter effettuare delle previsioni sull'andamento futuro della serie oggetto di indagine
necessario dunque avere informazioni tanto sull'andamento di fondo della stessa, detto trend, tanto
sulle variazioni cicliche. -ella maggior parte dei casi i cicli, per quanto non perfettamente
prevedibili, hanno durata ed intensit che varia relativamente poco nel corso del tempo. In altre
parole, anche in una situazione di espansione possibile prevedere con un margine d'errore
ragionevole, quando si verificher la prossima contrazione ciclica. (d esempio, nella serie che si
osserva in figura 7.7, si vede chiaramente come nel periodo 7''<"7''= la domanda interna di
energia stesse subendo un nuovo rallentamento/ dopo pi) di un decennio di crescita era pi) che
lecito aspettarselo. Si noti tuttavia che questa serie si interrompe prima dell'esplodere della crisi
(nno Consumo (nno Consumo (nno Consumo
energetico energetico energetico
&8<! =7<#! &8=9 &==&<= &88! 7<777'
&8<# ===#& &8=8 &9<<>= &88# 7<8#'!
&8<> 9!788 &89' &8&97# &88> 7=98'=
&8<< 8'9!> &89& &8&799 &88< 79&9&!
&8<= 89=!8 &897 &87>8> &88= 78'78#
&8<9 &'<&7= &89! &8!8<7 &889 !''>&9
&8<8 &&787= &89# 7'!>>8 &888 !'=<<=
&8=' &7&!99 &89> 7'8#'8 7''' !7'8=<
&8=& &7<>7& &89< 7&#### 7''& !7=!=7
&8=7 &!>#<& &89= 77#>&9 7''7 !!>87'
&8=! &#<!8= &899 7!#9&= 7''! !##9!!
&8=# &>&&89 &898 7###=8 7''# !#98><
&8=> &#88&# &88' 7>&>#< 7''> !>797<
&8=< &<#<!9 &88& 7>=&7! 7''< !>8'=>
&8== &<8!77 &887 7<&>#! 7''= !<'&=&
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
0
50000
100000
150000
200000
250000
300000
350000
400000
economica le cui prime avvisaglie hanno cominciato a verificarsi nella primavera del 7''9/ una
congiuntura economica fortemente negativa come quella che l'Italia sta attraversando avr
certamente comportato un forte rallentamento, se non un calo, nei consumi energetici.
-ella seguente tabella 7.! invece riportata la serie degli arrivi totali mensili di turisti negli
esercizi ricettivi sul territorio italiano nel periodo &888"7''9 +http/??con.istat.it?amerigo?, per
scaricare i dati richiesta la registrazione gratuita,, espressi in migliaia di unit. Il relativo time plot
riportato in figura 7.!.
Tab: 2.%: 'rri(i mensili negli eserizi rietti(i italiani nel periodo 1999-2008) in migliaia
Fig. 2.%: Time plot dei dati in tab. 2.%
Anno Mese Anno Mese Anno Mese Anno Mese Anno Mese
1999gen 3543 2001gen 3690 2003gen 3784 2005 gen 4228 2007 gen 4375
feb 3797 feb 4220 feb 4213 feb 4410 feb 4856
mar 4747 mar 5107 mar 5262 mar 6081 mar 6186
apr 6179 apr 7159 apr 6975 apr 6813 apr 8455
mag 7535 mag 7484 mag 8081 mag 8473 mag 8783
giu 7910 giu 9818 giu 9547 giu 9813 giu 11246
lug 9828 lug 10771 lug 10415 lug 11941 lug 12578
ago 10580 ago 11544 ago 11838 ago 12026 ago 13111
set 7768 set 8468 set 8092 set 8971 set 9936
ott 5695 ott 5830 ott 6306 ott 6900 ott 7057
nov 3399 nov 3815 nov 3872 nov 4179 nov 4710
dic 3340 dic 3868 dic 4341 dic 4504 dic 4859
2000gen 3581 2002gen 3488 2004gen 4082 2006 gen 4386 2008 gen 4507
feb 3920 feb 4153 feb 4678 feb 4761 feb 5191
mar 5028 mar 5857 mar 5463 mar 5823 mar 6664
apr 6975 apr 6452 apr 7090 apr 8272 apr 7424
mag 7226 mag 8109 mag 8574 mag 8542 mag 9806
giu 9029 giu 9284 giu 9232 giu 10632 giu 10486
lug 10755 lug 10463 lug 11335 lug 12359 lug 12364
ago 11213 ago 11711 ago 11800 ago 12457 ago 13673
set 8571 set 8371 set 8731 set 9710 set 9329
ott 5926 ott 6256 ott 6681 ott 6889 ott 6869
nov 3701 nov 3980 nov 4077 nov 4396 nov 4379
dic 4108 dic 3905 dic 4215 dic 4819 dic 4854
Arrivi
ot!
Arrivi
ot!
Arrivi
ot!
Arrivi
ot!
Arrivi
ot!
1999"01
1999"06
1999"11
2000"04
2000"09
2001"02
2001"07
2001"12
2002"05
2002"10
2003"03
2003"08
2004"01
2004"06
2004"11
2005"04
2005"09
2006"02
2006"07
2006"12
2007"05
2007"10
2008"03
2008"08
0
2000
4000
6000
8000
10000
12000
14000
16000
3'analisi grafica in questo caso consente di trarre molte meno conclusioni. .merge in modo
chiaro solamente un aspetto/ la serie oscilla con una certa regolarit attorno ad un valore centrale
che varia in misura molto minore. $uesto intuitivamente piuttosto ovvio/ la serie degli arrivi
mensili negli esercizi ricettivi dipende in misura considerevole, appunto, dal mese in cui ci si trova/
nei mesi estivi, gli alberghi sono molto pi) pieni rispetto ai mesi di tardo autunno ed inizio inverno,
mentre nel periodo successivo il turismo comincia a muoversi di nuovo per tornare ai massimi
estivi. $ueste variazioni sono enormemente pi) significative delle variazioni dei movimenti turistici
da un anno all'altro. .merge a questo punto uno dei principali problemi connessi all'analisi delle
serie temporali, quello delle variazioni stagionali.
$ualunque serie venga raccolta con cadenza regolare nel corso di un anno soffre di questo
problema. -aturalmente in alcuni casi questo problema dimensionalmente trascurabile/ se si
andassero ad analizzare +se fossero disponibili, le stime della popolazione residente su base
mensile, ci si accorgerebbe che le variazioni stagionali, per quanto complessivamente regolari, non
sono significative in relazione all'analisi del fenomeno nel suo complesso/ nonostante infatti sia
noto che le nascite ed i movimenti migratori abbiano dei picchi in determinati periodi dell'anno, se
raffrontati con l'ammontare complessivo della popolazione italiana questi picchi sono
dimensionalmente irrilevanti. Il discorso cambierebbe se si fosse interessati al saldo di popolazione/
se la serie oggetto d'analisi fosse la serie delle differenze tra la popolazione nel mese corrente e la
popolazione in quello precedente, le variazioni stagionali assumerebbero un peso assolutamente non
trascurabile.
Se si analizzasse la serie del consumo energetico riportata in tabella 7.7 su base mensile, si
assisterebbe a variazioni stagionali estremamente significative/ il consumo di energia dipende ad
esempio in maniera rilevante dalle ore di luce, quindi pi) elevato nei mesi invernali di quanto sia
nei mesi estivi. 4uttavia, nei mesi estivi il consumo privato di energia risente enormemente della
temperatura/ la maggior parte degli edifici hanno un sistema di climatizzazione che d'inverno si
fonda sul riscaldamento a gas, e dunque non influisce sulla domanda di energia elettrica, e d'estate
su condizionatori che invece consumano energia elettrica. Infatti capita spesso che durante l'estate,
nelle giornate particolarmente calde, si sentano raccomandazioni a limitare l'uso dei condizionatori
per evitare carichi di domanda di energia che gli impianti non sono in grado di sostenere.
Un'altra serie caratterizzata da forti oscillazioni stagionali intuitivamente comprensibili quella
della vendita dei beni di consumo non alimentari/ si assiste a picchi nel mese di dicembre in
corrispondenza con le festivit natalizie, ed a cali nel mese di agosto quando buona parte delle
persone si trova in ferie e domanda complessivamente di meno. . dunque, anche la serie mensile
delle presenze nelle strutture ricettive delle localit di villeggiatura ha un'enorme componente
stagionale, in ovvia relazione con i periodi in cui la gente vi si reca in vacanza/ nelle localit
marittime nei mesi di luglio e agosto, in quelle montane nei mesi di febbraio e marzo e, in misura
complessivamente minore, nei mesi estivi.
(bbiamo a questo punto introdotto le tre principali fonti di variazione pi) o meno prevedibile di
una serie storica. Ce n' un quarto, completamente deterministico, che riguarda solamente le serie
aggregate, quali ad esempio il 2I3, i consumi o le presenze nelle strutture ricettive/ si tratta delle
variazioni dovute alle differenze di calendario.
Se si analizza una serie come la domanda mensile di energia elettrica, questa influenzata dal
numero di giorni da cui i mesi sono composti/ se si vuole confrontare la domanda di energia del
mese di gennaio con quella relativa al mese di febbraio, bisogna tenere in considerazione che
febbraio ha ! giorni meno di gennaio, dunque molto probabile che il valore grezzo sia minore in
quest'ultimo mese. $uesto problema ovviamente sparisce se invece si intende confrontare la
domanda relativa al mese di gennaio di due anni diversi. 4uttavia, dal momento che l'energia
elettrica domandata in parte significativa da stabilimenti produttivi, fabbriche, uffici e via dicendo,
e che una fabbrica ha un fabbisogno energetico enormemente superiore rispetto a quella di
un'abitazione privata, un altro fattore che influisce sulla domanda il numero di giorni in cui gli
stabilimenti sono aperti, ossia il numero di giorni feriali nel mese. $uesto problema riguarda sia i
confronti tra periodi dello stesso anno che i confronti tra gli stessi periodi in anni diversi.
3e differenze di calendario, essendo completamente deterministiche, vengono affrontate
preliminarmente a qualunque tipo di analisi, semplicemente aggiustando il dato aggregato in modo
da renderlo confrontabile con gli altri. (d esempio, essendo un anno composto da &7 mesi e !<>
giorni, la lunghezza media di un mese pari a !<>?&7@!',#7 giorni. Il dato grezzo relativo a
qualunque mese i pu% essere pertanto aggiustato dividendolo per il numero di giorni che ha il mese i
e moltiplicato per !',#7. In questo modo si ha che i dati relativi ai &7 mesi di un anno sono
confrontabili tra loro, perch5 sono stati normalizzati/ come se tutti i mesi fossero composti da
!',#7 giorni. 3'aggiustamento per rendere confrontabili i dati degli stessi periodi di anni diversi
riguarda invece i giorni lavorativi/ ad esempio, nel mese di gennaio del 7'&' i giorni non lavorativi
sono stati, oltre ai > sabati +7, 8, &<, 7! e !', ed alle > domeniche +!, &', &=, 7# e !&,, l'& ed il il <,
per un totale di &7/ quindi i giorni lavorativi sono stati !&"&7@&8. Il fatto che parecchie persone si
siano prese due giorni di ferie il # ed il > +per poter fare un 0ponte1 tra capodanno e l'epifania, non
rientra in questo genere di aggiustamento, si tratta di una componente stagionale. -el mese di
febbraio dello stesso anno, i giorni non lavorativi sono stati 9/ # sabati +<, &!, 7' e 7=, e #
domeniche +=, &#, 7& e 79,. $uindi i giorni lavorativi sono stati 79"9@7', uno in pi) del mese di
gennaio. Se si vuole aggiustare il dato grezzo del generico mese t sulla base dei giorni lavorativi,
pertanto, possibile dividerlo per il numero di giorni lavorativi che ha il mese t e moltiplicare il
risultato per !',#7. In questo modo possibile effettuare tutti i tipi di confronto.
(nalogamente, un possibile aggiustamento preliminare che concerne le serie storiche
economiche espresse in valore monetario +ad esempio il 2I3 di un'entit geografica o il fatturato di
un'azienda, quello sulla base dell'indice di variazione dei prezzi. Se nel corso di un anno di
calendario la serie di dati grezzi del 2I3 di un paese passa, in miliardi di euro, da #''' a #&'', il
tasso di crescita del 2I3 pu% essere calcolato, come noto, calcolando #&''?#''' A & @ ','7>/
quindi il 2I3 cresciuto del 7,>B. Se per% in quello stesso anno l'inflazione stata del !B, quindi i
prezzi dei beni al consumo sono aumentati del !B, si ha che il prodotto interno lordo cresciuto
meno del livello dei prezzi, dunque il paese nel complesso si impoverito +in questo caso si parla di
impoverimento reale,. 6ividendo il valore del 2I3 del secondo anno per l'opportuno indice dei
prezzi corrispondente ad un aumento degli stessi del !B, ossia &,'! si ha che il valore aggiustato
per le variazioni dei prezzi del del 2I3 nel secondo anno pari a #&''?&,'! @ !89& miliardi di euro/
questo aggiustamento permette di includere l'impoverimento reale nella serie.
3'ultima fonte di variazione che caratterizza le serie storiche il cosiddetto errore accidentale.
3'errore accidentale comprende tutto quello che non compreso nelle precedenti fonti di variazione,
di conseguenza completamente casuale e, in quanto tale, non prevedibile. Si tratta dunque di una
sorta di residuo, che spiega la differenza tra il valore 0teorico1 della serie, ossia il valore che la serie
dovrebbe assumere sulla base di aggiustamenti di calendario, trend, ciclo e componente stagionale,
e il valore effettivamente osservato. -ella massima parte dei casi si tratta di una componente
letteralmente accidentale, ossia di un valore imprevedibile e di difficile interpretazione teorica.
4uttavia, in alcuni casi, esso pu% essere interpretato come uno shocC causato da qualche evento
esterno che influenza l'andamento della serie.
(d esempio, analizzando l'andamento mensile del prezzo dei titoli di credito probabile che si
osservi un valore insolitamente basso nel settembre 7''9, in corrispondenza del fallimento della
3ehman Drothers, che ha dato il via alla crisi finanziaria le cui conseguenze hanno portato ad una
congiuntura economica definita come la peggior crisi dal &878. Il valore negativo relativo al mese
di settembre certamente parte del movimento ciclico a cui si gi accennato, tuttavia esso legato
anche al panico dei giorni successivi al fallimento della banca inglese, che ha portato molti
investitori a vendere le proprie azioni, determinando un crollo nei prezzi delle stesse, e dunque una
loro complessiva sottovalutazione. (llo stesso modo, nel mese di novembre 7''8 la Eicrosoft ha
lanciato la nuova versione del suo sistema operativo di punta, 0Findo:s =1/ a seguito dei numerosi
problemi che la precedente versione di Findo:s, 0Gista1, aveva creato agli utenti, molti, in
particolar modo uffici ed aziende +che tra l'altro non possono utilizzare copie pirata, si sono
affrettati a cambiare sistema operativo, il che ha certamente causato uno shocC significativo negli
introiti della compagnia. In questo caso la componente residuale della serie storica +mensile o
trimestrale, del fatturato della Eicrosoft non solo facilmente interpretabile, era addirittura almeno
in parte prevedibile. 4uttavia, ancorch5 prevedibile, il residuo va sempre considerato una
componente accidentale, dal momento che non rientra nelle componenti deterministiche che sono
state identificate in precedenza/ eventuale aggiustamento di calendario, trend, ciclo e stagionalit.
Gedremo in seguito l'importanza che ha nell'analisi delle serie storiche l'analisi dei residui. In
primo luogo ci si soffermer sulla scomposizione della serie nelle sue componenti deterministiche.
3. La scomposizione di una serie
6a quanto abbiamo visto nel paragrafo precedente, i valori di una serie storica, una volta che
sono stati depurati da eventuali grandezze che la perturbano quali i giorni di calendario, la crescita
dei prezzi etc., sono influenzati da quattro componenti fondamentali/ trend, ciclo, stagionalit e
residui. 6a qui in avanti, se non viene specificato diversamente, useremo il simbolo *
t
) t+1) 2) ...) n
per indicare la serie storica* la componente tendenziale sar indicata con la lettera T, la componente
ciclica con la lettera C, le variazioni stagionali con la lettera ,, la componente stagionale con la
lettera u.
Hormalmente dunque/
*
t
+ H+T
t
) C
t
) ,
t
) u
t
,, t+&, 7, ..., n.
3a forma della funzione H dipende dal tipo di approccio che si intende adottare. I modelli in cui
l'azione combinata di componenti sistematiche ed accidentali vengono analizzate per verificare
come determinano l'andamento della serie sono sostanzialmente di tre tipi/ il modello additivo, il
modello moltiplicativo ed i modelli misti.
-el modello additivo le quattro componenti si sommano per determinare i valori della serie/
*
t
+ T
t
- C
t
- ,
t
- u
t
, t+&, 7, ..., n.
-el modello moltiplicativo le quattro componenti si moltiplicano tra loro/
*
t
+ T
t
I C
t
I ,
t
I u
t
, t+&, 7, ..., n.
Il modello additivo si basa sull'ipotesi che le componenti siano tra loro indipendenti, mentre in
quello moltiplicativo le grandezze sono tra loro legate da una relazione di proporzionalit. In altre
parole, nel modello additivo l'ampiezza le oscillazioni cicliche, stagionali ed accidentali non
dipende dal livello della serie, in quello moltiplicativo sussiste invece una relazione di dipendenza.
$uesto significa che se una serie crescente nel tempo, nel modello additivo le oscillazioni dovute
a ciclo, stagionalit e residui rimangono costanti, mentre nel modello moltiplicativo aumentano
proporzionalmente/ nel modello additivo le varie quantit sono espresse nella medesima unit di
misura della serie, quindi determinano l'esatta variazione della stessa, mentre in quello
moltiplicativo il trend espresso nell'unit di misura della serie, mentre le altre quantit
rappresentano coefficienti di variazione e sono sempre maggiori di '.
$uesto implica che i coefficienti neutri, che non modificano il valore della serie, sono pari a '
nel modello additivo +nella serie degli arrivi mensili in migliaia un errore accidentale od una
componente stagionale nulli sono espressi dal valore di ' arrivi, e pari ad & nel modello
moltiplicativo +nella stessa serie, la componente stagionale e l'errore accidentale che non ne
modificano il valore sono pari a &/ non &''' arrivi, & come numero puro, senza unit di misura,.
$uindi, nel modello additivo, una componente stagionale pari a J',9 rende il valore pari a <'''9''
arrivi se la serie si attesta su <'''''' di arrivi arrivi, e pari a !'''9'' arrivi se la serie attestata
sul valore di !'''''' di arrivi* in quello moltiplicativo, una variazione di &,9 +',9 sommato al
valore neutro, pari ad &, rende il valore pari a &'9''''' di arrivi nel primo caso, e pari a >#'''''
di arrivi nel secondo.
Il modello moltiplicativo pu% essere reso lineare mediante trasformazione logaritmica/
*
t
+ T
t
I C
t
I ,
t
I u .+/ log *
t
+ log T
t
- log C
t
- log ,
t
- log u
t
, t+&, 7, ..., n.
I modelli misti prevedono che una parte del modello, sia di tipo moltiplicativo, una parte di tipo
additivo/
*
t
+ T
t
I C
t
I ,
t
- u
t
, t+&, 7, ..., n.
*
t
+ T
t
I C
t
- ,
t
- u
t
) t+&, 7, ..., n.
-el primo di questi due modelli solamente il trend e la componente accidentali sono espressi
nella stessa unit di misura della serie, mentre C ed , sono numeri puri. -el secondo, invece, sono
espressi nell'unit di misura della serie il trend, le componenti stagionale ed i residui, mentre
solamente il ciclo espresso da un numero puro
.mpiricamente, si osservato che in diverse serie reali i valori delle oscillazioni cicliche e di
quelle stagionali tendono a variare al variare del livello della serie. 2er questa ragione il modello
moltiplicativo e quello misto del primo tipo sono quelli che hanno trovato pi) vasta applicazione
pratica. Si noti comunque che, se il trend della serie costante o varia in modo molto contenuto, i
risultati cui si giunge con i diversi modelli sono sostanzialmente analoghi, quindi la scelta del
modello, la cui arbitrariet rappresenta un punto di debolezza di questo tipo di analisi, assume
un'importanza tutto sommato contenuta.
4. Le medie mobili e le prime analisi del trend
4orniamo alla serie degli arrivi mensili di turisti negli esercizi ricettivi italiani nel periodo dal
&888 al 7''9. (vevamo visto che i valori della serie presentavano una forte componente stagionale,
dal momento che gli arrivi dipendevano fortemente dal mese in cui venivano osservati, il che
rendeva non solo difficile determinare le effettive componenti tendenziali e cicliche, ma anche
impossibile i confronti, salvo quelli tra gli stessi mesi di anni diversi. Un metodo per smussare la
serie per eliminare la dipendenza dal periodo dell'anno in serie di questo tipo sono le cosiddette
medie mobili. 3a media mobile a 70-& termini centrata su t relativa alla serie data da/
1'
t ) 0
=
*
t0
*
t 0&
...*
t &
*
t
*
t&
... *
t 0&
*
t 0
7C&
$uindi la media mobile a 70J& termini centrata su t calcolata semplicemente come media dei 0
elementi precedenti e dei 0 elementi successivi della serie. 3a media mobile permette di eliminare le
fluttuazioni dovute alla stagionalit sostituendo ai osservati valori della serie le medie mobili
centrate con un numero di termini pari al periodo di oscillazione. (d esempio, in presenza di dati
quadrimestrali la media mobile centrata con 0 pari a & +quindi 70J&@!, elimina le oscillazioni
stagionali/ infatti, ogni anno di calendario presenta ! osservazioni quadrimestrali* l'osservazione per
l'anno 2 del primo quadrimestre sostituita dalla media delle osservazioni relative al terzo
quadrimestre dell'anno 2"& e delle osservazioni relative al primo ed al secondo quadrimestre
dell'anno 2. In pratica si tratta della media di un anno centrata sul valore di interesse.
In questo modo, tuttavia, la media centrata su t calcolata come media di un numero dispari di
elementi/ i 0 precedenti, i 0 successivi e quello centrale. 2u% tuttavia essere necessario calcolare
medie mobili con un numero complessivo di elementi pari. (d esempio, nel caso di dati mensili,
come quelli degli arrivi turistici sopra riportati, la lunghezza totale del periodo di stagionalit pari
a &7. In questo caso la media mobile a 70 termini viene centrata con una procedura artificiosa/
infatti, questa viene calcolata su 7CJ& termini con pesi pari a &?7 per i due valori estremi e pari ad &
per gli altri.
1'
t ) 0
=
&
7
*
t 0
*
t0 &
... *
t &
*
t
*
t &
... *
t 0 &

&
7
*
t 0
7C
In altri termini, per i dati mensili, le medie mobili centrate a &7 termini vengono calcolate
considerando i < valori precedenti, i < valori successivi ed il valore centrale. $uindi, per gli arrivi
negli esercizi turistici registrati nel mese di luglio del 7''& in Italia, la media mobile che permette
di eliminare le fluttuazioni stagionali comprende i valori registrati degli arrivi negli esercizi turistici
nei mesi di febbraio, marzo, aprile, maggio, giugno, luglio, agosto, settembre, ottobre, novembre e
dicembre del 7''& con peso unitario, ed i valori degli arrivi turistici registrati nei mesi di gennaio
7''& e gennaio 7''7 con peso pari a ',>.
I dati, una volta corretti con l'applicazione delle medie mobili, sono detti destagionalizzati,
sebbene si tratti di un procedimento 0embrionale1 della destagionalizzazione vera e propria. Si noti
che perch5 il procedimento di destagionalizzazione restituisca una serie in cui le oscillazioni
stagionali siano effettivamente state eliminate, necessario che il numero di termini delle medie
mobili sia uguale al periodo di stagionalit. Se si commette un errore in questo passaggio, la serie
delle medie mobili soffrir ancora di stagionalit.
3e serie temporali usuali sono per lo pi) dati annuali, quadrimestrali, trimestrali e mensili. Il
periodo di stagionalit in questi casi molto semplice da determinare, essendo pari generalmente al
numero di osservazioni che vengono rilevate nel corso di un anno* tuttavia alcuni fenomeni hanno
un periodo pluri"annuale. I dati annuali non hanno in generale stagionalit, a meno che non si
analizzi un fenomeno che ha un periodo pluri"annuale +ad esempio, la serie storica delle ore di
trasmissione televisiva dedicata allo sport durante un anno di calendario ha periodo pari a # anni/
infatti i principali eventi sportivi che influiscono in modo rilevante sulle ore di trasmissione
televisiva, mondiali ed europei di calcio, olimpiadi estive ed invernali, si svolgono tutti ogni #
anni,. (ltre serie storiche possono essere rilevate quotidianamente +ad esempio la tiratura dei
quotidiani, o addirittura con cadenza oraria +ad esempio il prezzo delle azioni delle aziende quotate
in borsa od il consumo di energia elettrica,. Il periodo di stagionalit dei dati rilevati
quotidianamente generalmente pari a = +i giorni di una settimana,, quella dei dati rilevati a
cadenza oraria pari a 7# +le ore in un giorno,.
(ttenzione/ questi valori di periodicit stagionale sono solamente indicativi, nulla vieta che dei
dati orari abbiano una stagionalit diversa, pi) breve, di poche ore. Inoltre, si noti che le medie
mobili di qualunque ordine hanno l'effetto di attenuare le variazioni stagionali, in particolare se
l'ordine un multiplo o un sottomultiplo della periodicit stagionale effettiva. Solamente
utilizzando le medie mobili centrate dell'ampiezza pari esattamente alla periodicit, tuttavia, queste
consentono di eliminare completamente le fluttuazioni stagionali.
Il principale problema connesso con l'utilizzo delle medie mobili consiste nel fatto che si
perdono esattamente 70 osservazioni, 0 all'inizio e 0 alla fine della serie, per i quali la media mobile
non pu% essere calcolata. $uesto problema pu% essere molto serio se la serie ha un periodo molto
lungo e non si dispone di un numero di osservazioni elevato. -el caso dei flussi turistici portato ad
esempio, si hanno &' anni di osservazioni mensili, quindi un totale di &7' osservazioni. .ssendo il
periodo di stagionalit pari a &7, si perdono esattamente < osservazioni all'inizio della serie e <
osservazioni alla fine della serie, quindi il totale di medie mobili disponibili pari a &'9, con una
perdita informativa complessivamente accettabile.
Si noti che dati come il consumo orario di energia elettrica aggregato a livello nazionale hanno
diversi livelli di componente stagionale/ infatti, se ovvio che il ciclo si ripete complessivamente
analogo ogni giorno, altrettanto plausibile che il consumo dipenda dal giorno della settimana,
quindi ad esempio sia minore la domenica, giorno in cui la maggior parte degli impianti produttivi
chiusa, rispetto a quanto si osservi nei giorni feriali/ tuttavia, un periodo di stagionalit pari a =I7#
@ &<9 comporta la perdita di un numero elevatissimo di osservazioni/ questo problema pu% essere
ovviato se le osservazioni ricoprono un periodo di tempo sufficientemente lungo, ma se si ha a
disposizione la serie del consumo orario su diversi anni, si finisce per trattare diverse migliaia di
osservazioni alla volta. In questo caso la serie oraria perde la sua ragione di essere. Se si intende
analizzare una serie molto lunga, che si estende su un periodo di anni, opportuno cambiare la
periodicit dell'osservazione, aggregando i dati orari o facendone una media su base quotidiana, o
addirittura mensile/ la periodicit dell'osservazione dev'essere commisurata al tipo di analisi che si
intende condurre.
2u% tuttavia capitare di avere a che fare con una serie di dati giornalieri molto lunga che soffre di
diversi tipi di stagionalit. (d esempio, la serie delle vendite di un quotidiano ha ovviamente un
periodo di stagionalit pari a =/ generalmente, in Italia, le vendite dei quotidiani hanno un picco
negativo in corrispondenza della domenica, mentre quasi tutti vendono un numero maggiore di
copie il sabato. Inoltre, possibile osservare una complessiva flessione delle vendite con periodicit
annuale, perch5 le persone tendono a comprare il giornale meno spesso se si trovano in vacanza
lontano dal luogo di residenza. Infine, parecchi quotidiani registrano un picco nelle vendite il
medesimo giorno di ogni anno, il = di gennaio/ si tratta di un effetto legato all'estrazione dei premi
della lotteria Italia, dei quali i principali quotidiani riportano l'elenco completo.
Situazioni di questo tipo sono solitamente affrontate con l'introduzione di variabili dummies/
variabili che assumono valore significativo solo in corrispondenza del valore a cui sono associate,
nel caso portato ad esempio l'osservazione del = gennaio, in modo da poter 0attenuare1 l'effetto del
dato anomalo periodico.
C' un secondo problema, pi) delicato, connesso con l'utilizzo delle medie mobili/ queste infatti
non colgono le stagionalit ed i movimenti ciclici che hanno un periodo diverso dal numero di
termini su cui sono calcolate +70 o 70J&, a seconda che la periodicit sia pari o dispari,, o da un suo
sottomultiplo. In particolare, questo pu% dare luogo all'emersione di cicli spuri, che non hanno
riscontro nella serie originaria/ in altri termini, pu% succedere, e nei fatti succede relativamente
spesso, che una struttura dei residui che ha caratteristiche che sottostanno ad una qualche forma di
regolarit, trasformando la serie con il calcolo delle medie mobili, venga amplificata col risultato
che la serie trasformata sembra essere caratterizzata da movimenti ciclici sistematici, quantunque
non necessariamente regolari, che nella realt non sussistono. Infatti la completa eliminazione delle
variazioni stagionali fa sK che altre variazioni caratterizzate da una qualunque forma di ciclicit, che
nell'economia della serie grezza sono praticamente impercettibili, diventino numericamente
significative, anche se all'atto pratico non hanno nessuna rilevanza. $uesto processo noto come
effetto di SlutzCL"Mule.
.' un po' come se uno trovasse il sistema di prescindere i movimenti terrestri di rotazione sul
proprio asse e di rivoluzione intorno al Sole, quindi l'alternanza giorno"notte e l'alternanza delle
stagioni, nell'analisi dello sviluppo della vita sulla 4erra/ l'astronomia ci dice che rimangono
qualcosa come altri 7! movimenti di varia natura che compie la 4erra con periodo pi) o meno lungo
ed approssimativamente costante* i pi) noti sono il moto di precessione degli equinozi +che ha un
periodo di circa &!''' anni, e le nutazioni +che hanno un periodo variabile di pochi anni, tra i ! ed i
>,. Inoltre l'attrazione della 3una ed il suo ciclo di rotazione sul proprio asse e rivoluzione intorno
alla 4erra, entrambi di circa 79 giorni, oltre ad essere una delle concause di alcuni dei movimenti
minori della 4erra, determina le maree, che, come noto, si alternano quotidianamente, ma con
intensit variabile e ciclica. $uesta serie di fattori, pur essendo sostanzialmente irrilevanti e nella
pratica impercettibili, diventando gli unici che si osservano una volta eliminate rotazione e
rivoluzione terrestre, venendo a questo punto svolta l'analisi solo sulla loro base, assumerebbero
un'importanza che in effetti non hanno.
Infine, l'utilizzo delle medie mobili pu% spostare ed attenuare la visualizzazione dei punti di
svolta/ se una serie presenta un'osservazione critica, che porta ad una modifica rilevante nello
sviluppo della stessa, questa inizia a manifestare la sua influenza nel momento in cui l'osservazione
viene inserita per la prima volta nel calcolo di una media mobile, ed il suo effetto si spalma nelle
successive medie mobili. -ell'esempio citato pi) in alto, il fallimento della 3ehamn Drothers nel
settembre del 7''9 in riferimento alla serie mensile dei prezzi dei titoli di credito comincia a far
sentire il suo effetto gi nell'osservazione corretta tramite media mobile a &7 termini relativa al
mese di marzo 7''9, e solo nel mese di marzo 7''8 cessa di essere inclusa nel calcolo/ un evento
critico come l'insorgere di una forte crisi finanziaria che ha fatto precipitare il mercato dei titoli in
poche ore trasformato dalle medie mobili in un movimento verso il basso lungo &7 mesi, in cui
l'osservazione in cui questo si effettivamente verificato rappresenta una sorta di minimo locale.
Tab.3.1: 1edie mobili entrate a 12 termini della serie degli arri(i mensili negli eserizi rietti(i
italiani nel periodo 1999-2008
I valori delle medie mobili calcolate con questa procedura sui dati relativi al turismo dell'IS4(4
sono riportati in tabella #.&/ i dati sono stati previamente aggiustati per i giorni di calendario* il
relativo time plot riportato nella figura #.&, confrontato con la serie originaria. -ella successiva
figura #.7 riportato il time plot della serie delle medie mobili da solo, utilizzando per l'asse
verticale una scala molto pi) ridotta, in modo da poter apprezzare le differenze tra i valori.
Il time plot in figura #.& evidenzia alcuni aspetti/ preliminarmente, possibile osservare che la
serie destagionalizzata manca di alcuni valori a destra ed a sinistra, pi) esattamente i primi e gli
ultimi < valori della serie/ come gi detto, si tratta di un problema endemico di questa metodologia.
Inoltre, emerge in modo molto chiaro cosa significa destagionalizzare i valori tramite media mobile/
le variazioni tra i valori degli arrivi mensili dovute all'alternanza delle stagioni vengono attenuate in
modo molto netto. Si passa da una situazione in cui valori a distanza di sei mesi variano di quasi
&''''''' di unit ad una curva estremamente schiacciata e quasi orizzontale/ tutti i valori della
serie destagionalizzata si trovano nell'intervallo tra i sei milioni e gli otto milioni e mezzo di arrivi.
2assando all'analisi del grafico in figura #.7, in cui la serie destagionalizzata stata visualizzata
su una scala diversa, in cui i valori minimo e massimo sono rispettivamente circa <>'' e 97'' +dati
in migliaia di arrivi,, si apprezza come gli arrivi mensili destagionalizzati non siano affatto costanti.
.' infatti possibile osservare un movimento tendenziale di fondo chiaramente crescente,
caratterizzato tuttavia da movimenti oscillatori molto forti/ ad un primo periodo +&888"7''&, di
crescita netta ed evidente, segue un periodo di andamento di due anni di andamento pressoch5
orizzontale, coincidente con la crisi post && settembre. In questo caso si vede in modo molto netto
come il rallentamento legato a questo evento si inizi ad osservare, nella serie destagionalizzata
Anno Mese Arrivi ot! Anno Mese Arrivi ot! Anno Mese Arrivi ot! Anno Mese Arrivi ot! Anno Mese Arrivi ot!
1999 gen # 2001gen 6810 2003 gen 6863 2005 gen 7238 2007 gen 7873
feb # feb 6822 feb 6866 feb 7270 feb 7909
mar # mar 6829 mar 6860 mar 7287 mar 7945
apr # apr 6819 apr 6850 apr 7304 apr 7961
mag # mag 6819 mag 6847 mag 7316 mag 7981
giu # giu 6813 giu 6861 giu 7331 giu 7996
lug 6181 lug 6795 lug 6891 lug 7349 lug 8004
ago 6183 ago 6783 ago 6918 ago 7372 ago 8017
set 6195 set 6811 set 6941 set 7377 set 8045
ott 6241 ott 6812 ott 6956 ott 7428 ott 8023
nov 6264 nov 6808 nov 6983 nov 7492 nov 8023
dic 6300 dic 6811 dic 6991 dic 7530 dic 8035
2000 gen 6388 2002gen 6775 2004 gen 7018 2006 gen 7582 2008 gen 7997
feb 6454 feb 6770 feb 7057 feb 7616 feb 8014
mar 6516 mar 6772 mar 7084 mar 7665 mar 8014
apr 6561 apr 6786 apr 7129 apr 7696 apr 7983
mag 6584 mag 6810 mag 7154 mag 7705 mag 7962
giu 6629 giu 6819 giu 7158 giu 7727 giu 7949
lug 6665 lug 6832 lug 7159 lug 7739 lug #
ago 6689 ago 6847 ago 7159 ago 7743 ago #
set 6710 set 6825 set 7179 set 7762 set #
ott 6720 ott 6823 ott 7191 ott 7785 ott #
nov 6737 nov 6844 nov 7173 nov 7802 nov #
dic 6779 dic 6854 dic 7191 dic 7838 dic #
tramite medie mobili, < mesi prima, in corrispondenza del mese di marzo 7''&. Successivamente,
nel 7''!, la serie riprende a crescere, e la crescita, con ritmi variabili ma sempre evidentemente
positivi, dura circa # anni* a met 7''= si registra un rallentamento che porta la serie a decrescere
nella prima parte del 7''9.
Fig. 3.1: Con4ronto dei time plot relati(i ai dati in tab. 2.% e 3.1
Fig. 3.2: Time plot dei dati in tab. 3.1
.' a questo punto possibile effettuare qualche considerazione sui rischi che comporta l'analisi di
una serie storica complessa su un periodo molto limitato di tempo. Se infatti il grafico in figura #.7
fosse stato limitato al periodo &888"7''&, +figura #.!,, si sarebbe stati portati a pensare che la serie
degli arrivi mensili fortemente crescente, il che sarebbe smentito da una successiva analisi limitata
1999"01
1999"06
1999"11
2000"04
2000"09
2001"02
2001"07
2001"12
2002"05
2002"10
2003"03
2003"08
2004"01
2004"06
2004"11
2005"04
2005"09
2006"02
2006"07
2006"12
2007"05
2007"10
2008"03
2008"08
0
2000
4000
6000
8000
10000
12000
14000
16000
1999"07
1999"11
2000"03
2000"07
2000"11
2001"03
2001"07
2001"11
2002"03
2002"07
2002"11
2003"03
2003"07
2003"11
2004"03
2004"07
2004"11
2005"03
2005"07
2005"11
2006"03
2006"07
2006"11
2007"03
2007"07
2007"11
2008"03
5500
6000
6500
7000
7500
8000
8500
al periodo 7''&"7''!. Se invece ci si fosse limitati all'analisi del periodo 7''!"7''= +figura #.#,, si
avrebbe osservato un apparente trend ascendente molto netto caratterizzato da qualche piccolo
abbassamento ciclico. Nsservando la serie sui &' anni invece si osserva un andamento crescente,
quantunque a ritmi molto diversi ed enormemente influenzati da ciclo, che tuttavia si conclude con
un rallentamento e poi calo preoccupanti, in quanto registrati diversi mesi prima della crisi del
settembre 7''9.
Fig. 3.%: Time plot dei dati in tab. 3.1 relati(o al solo periodo 1999-2001
Fig. 3.3: Time plot dei dati in tab. 3.1 relati(o al solo periodo 200%-200&
Un modo per effettuare una stima del movimento tendenziale di una serie il modello di
regressione. Si suppone che il trend di una serie sia semplice funzione del tempo. In questa sede ci
limiteremo all'analisi della classica funzione lineare/
1999"07
1999"08
1999"09
1999"10
1999"11
1999"12
2000"01
2000"02
2000"03
2000"04
2000"05
2000"06
2000"07
2000"08
2000"09
2000"10
2000"11
2000"12
2001"01
2001"02
2001"03
6000
6200
6400
6600
6800
7000
2003"05
2003"07
2003"09
2003"11
2004"01
2004"03
2004"05
2004"07
2004"09
2004"11
2005"01
2005"03
2005"05
2005"07
2005"09
2005"11
2006"01
2006"03
2006"05
2006"07
2006"09
2006"11
2007"01
2007"03
2007"05
6600
6800
7000
7200
7400
7600
7800
8000
8200
*
t
+ 5
0
- 5
1
t - 6
t
.
In questa formulazione 6
t
un termine d'errore casuale che ha media nulla. Gedremo pi) avanti
cosa comporta questo genere di assunzione.
I coefficienti 5
0
e 5
1
vengono stimati col metodo dei minimi quadrati. .' buona norma numerare
in senso progressivo le osservazioni, anche se si dispone delle relative date/ in altre parole, il primo
valore della serie verr contrassegnato dal numero &, il secondo dal numero 7 e cosK via. In questo
modo il valore 5
0
, che corrisponde come noto al valore assunto da quando t@', restituir il valore
della serie all'inizio del periodo di osservazione. (ltrimenti, se si utilizzassero gli anni, 5
0
sarebbe
pari al valore della serie al vero tempo t@'/ quindi, ad esempio, nel caso della serie del consumo
annuale di energia sopra introdotta, si visualizzerebbe il consumo energetico teorico dell'Italia
nell'anno ', il che ovviamente un'informazione priva di senso.
2assiamo a calcolare i coefficienti del modello lineare nel tempo per delle serie reali. Iniziamo
con una serie che evidenziava un trend lineare piuttosto evidente, quella del consumo energetico.
.ffettuando i calcoli si ottiene quanto segue/
*
t
+ <<!9=,> - <><>,9t - 6
t
.
Il valore del coefficiente di determinazione per questo modello pari a ',88, quindi
l'adattamento del modello ai dati elevatissimo. In altre parole, questo modello lineare descrive in
maniera pressoch5 perfetta l'andamento di fondo della serie storica.
Il modello lineare confrontato con i dati grezzi della serie riportato nella seguente figura #.>.
Fig. 3.7: Time plot dei dati in tab. 2.2 e retta di regressione dei minimi 8uadrati
Nsservando il grafico emerge in maniera piuttosto chiaro l'ottimo adattamento ai dati del
modello.
3a serie degli arrivi mensili destagionalizzati restituisce invece i seguenti coefficienti/
*
t
+ <7=>,#8 - &<,7<t - 6
t
Il valore del coefficiente di determinazione pari a ',8#, quindi anche in questo caso molto
prossimo all'unit. In altre parole, nel caso della serie degli arrivi mensili su &' anni, il valore del
coefficiente angolare ha un andamento chiaramente crescente +gli arrivi crescono mediamente di
circa &<!'' unit al mese,, e l'adattamento ai dati molto buono. 6a questo si evince che il modello
lineare adeguato per descrivere l'andamento della serie.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
0
50000
100000
150000
200000
250000
300000
350000
400000
Il modello lineare confrontato con i dati della serie destagionalizzati mediante medie mobili a &7
termini riportato nella seguente figura #.<.
(nche dall'analisi del grafico l'ottimo adattamento del modello lineare rispetto ai dati
perfettamente visibile. Oisulta visibile tuttavia anche l'incapacit da parte del modello lineare di
cogliere movimenti ciclici che sono estremamente rilevanti nella determinazione di osservazioni
consecutive.
Fig. 3.$: Time plot dei dati in tab. 3.1 e retta di regressione dei minimi 8uadrati
2assiamo dunque ad analizzare la struttura dei residui, un aspetto molto importante dell'analisi
delle serie storiche. Il residuo, nel caso del modello lineare sopra introdotto, non altro che la
differenza tra il valore effettivamente osservato della serie ed il valore stimato con la retta dei
minimi quadrati/
6
t
+ *
t
A 5
0
- 5
1
t.
Come prima cosa, effettuiamo un'analisi grafica dei residui del modello lineare stimato per la
serie del consumo di energia elettrica dell'Italia nel periodo &8<!"7''=. I risultati sono riportati in
figura #.=.
Si vede immediatamente che i residui del modello hanno una struttura molto precisa e ben
identificabile. Se i residui fossero effettivamente casuali, ci si aspetterebbe una andamento erratico,
in modo che ogni singola osservazione sia indipendente dalle altre* qui invece si osserva che
l'andamento presenta delle evidenti caratteristiche cicliche. (ll'inizio si ha qualche residuo
lievemente negativo, poi si osserva una serie di valori positivi, intervallati da un solo valore
negativo, poi una serie di valori negativi, intervallati da tre piccoli valori positivi, poi di nuovo
valori positivi. Si dice in questo caso che la serie dei residui caratterizzata da una forte memoria/ il
fatto che un dato valore residuo sia positivo e di un certo livello, rende molto frequente che sia
positivo, e di intensit analoga, anche il valore successivo. In effetti su #> osservazioni si contano
solamente 9 cambi di segno.
Si considerino ora le considerazioni fatte in sede di analisi grafica della serie storica del consumo
energetico/ si era detto che a fronte di un trend crescete chiaramente identificabile, si osservavano
dei movimenti ciclici che portavano la serie a mostrare dei periodici rallentamenti nel ritmo di
crescita, quando non addirittura dei piccoli periodi di calo della domanda. -ell'applicare il modello
1999"07
1999"11
2000"03
2000"07
2000"11
2001"03
2001"07
2001"11
2002"03
2002"07
2002"11
2003"03
2003"07
2003"11
2004"03
2004"07
2004"11
2005"03
2005"07
2005"11
2006"03
2006"07
2006"11
2007"03
2007"07
2007"11
2008"03
5500
6000
6500
7000
7500
8000
8500
lineare, tuttavia, non si tenuto conto della struttura ciclica della serie. In questo senso, l'analisi
regressiva che stata effettuata senza dubbio interessante, in quanto permette di individuare
immediatamente l'andamento di fondo, anche con un buon livello di attendibilit, dimostrato
dall'elevato valore di O
7
, tuttavia non in grado da sola di cogliere tutti gli aspetti che caratterizzano
la serie.
Fig. 3.&: 9esidui del modello lineare sulla serie storia del onsumo di energia elettria in Italia
nel periodo 19$%-200&
-ella seguente figura #.9 sono riportati i residui del modello lineare per la serie destagionalizzata
degli arrivi totali negli esercizi ricettivi italiani nel periodo &888"7''9.
Fig. 3.8: 9esidui del modello lineare sulla serie storia degli arri(i totali mensili negli eserizi
rietti(i italiani nel periodo 1999-2008) destagionalizzata mediante medie mobili
(nche in questo caso, la struttura appare tutt'altro che casuale/ si osservano in modo chiaro dei
cicli, oltretutto di ampiezza ed intensit variabile/ come si vede, la serie inizia in una fase di ciclo
negativo, che diventa tuttavia positivo in modo repentino dopo poche osservazioni. I valori
1963
1965
1967
1969
1971
1973
1975
1977
1979
1981
1983
1985
1987
1989
1991
1993
1995
1997
1999
2001
2003
2005
2007
#15000
#10000
#5000
0
5000
10000
15000
1999"07
1999"11
2000"03
2000"07
2000"11
2001"03
2001"07
2001"11
2002"03
2002"07
2002"11
2003"03
2003"07
2003"11
2004"03
2004"07
2004"11
2005"03
2005"07
2005"11
2006"03
2006"07
2006"11
2007"03
2007"07
2007"11
2008"03
#250
#200
#150
#100
#50
0
50
100
150
200
250
osservati restano sopra la retta di regressione per un paio d'anni, poi, in corrispondenza del mese di
settembre del 7''&, i residui diventano negativi, e lo rimangono per circa # anni, per poi tornare
positivi, nuovamente per un periodo di circa 7 anni, e tornare negativi per le ultime tre osservazioni
disponibili. $uindi, su &'9 osservazioni complessive, si registrano solamente # cambi di segno dei
residui/ chiaramente, la struttura non casuale.
$uindi anche in questo caso, l'analisi del trend con un modello lineare permette di giungere a
risultati interessanti per quello che riguarda l'andamento di medio"lungo periodo/ si osserva che nel
corso di &' anni gli arrivi mensili nelle strutture ricettive del paese sono aumentati di circa &='''''
unit* tuttavia, trovandosi l'osservazione finale della serie nel mezzo di un ciclo negativo piuttosto
improvviso, che tra l'altro ha preceduto di poco l'insorgere di una gravi crisi economica, lecito
attendersi, qualora si dovessero inserire ulteriori osservazioni in coda alla serie, che il coefficiente
angolare della retta diminuisca leggermente. 4uttavia, l'analisi del trend basato semplicemente su un
modello di regressione lineare di per s5 insufficiente a cogliere tutti gli aspetti della serie. 3'analisi
dei residui aggiunge comunque qualcosa, perch5 permette di identificare almeno a livello intuitivo i
movimenti ciclici dei fenomeni.
Si ricorda tra l'altro che l'adattamento del modello ai dati misurato dal O
7
elevatissimo, essendo
quest'ultimo pari a ',8#, quindi poco lontano da &. Si faccia attenzione/ anche qualora si avesse a
che fare con un valore del coefficiente di determinazione molto pi) basso, tendente a ', non
significherebbe che il trend calcolato sbagliato. Significherebbe semplicemente che il modello
lineare non adatto ad interpretare la struttura dei dati. $uesto avverrebbe, ad esempio, nel caso di
valori oscillanti in modo molto significativo attorno ad un trend praticamente orizzontale. -el breve
e nel medio periodo, in condizioni di ciclo normali, una tipica serie caratterizzata da questo
comportamento quella delle medie mensili delle temperature. Un O
7
molto basso, tuttavia, non
toglie che una retta pressoch5 orizzontale sia la miglior stima del trend della serie.
Gediamo adesso una procedura che consentir di analizzare la componente sistematica in modo
pi) dettagliato.
5. I metodi di scomposizione
$uella che verr ora illustrata una procedura iterativa che permette di giungere ad una stima
separata delle componenti considerate sistematiche e delle componenti accidentali di una serie
temporale, in riferimento al modello additivo presentato in precedenza. Successivamente, verr
presentata una procedura analoga in riferimento al modello misto. In entrambi i casi l'esposizione
verr accompagnata dai risultati che si ottengono applicando le metodologie descritte alla serie
degli arrivi mensili nelle strutture ricettive italiane nel decennio &888"7''9. Si partir dalla serie dei
dati grezzi come stata introdotta nella parte iniziale di questo testo, aggiustati per i giorni di
calendario.
Il modello additivo, ricordiamo, prevede che la componente tendenziale, il ciclo, le fluttuazioni
stagionali e l'errore accidentale concorrano a determinare l'andamento della serie nel modo che
segue/
*
t
+ T
t
- C
t
- ,
t
- u
t
, t+&, 7, ..., n.
In questo modo, si ricorda, tutte le componenti sono espresse nella medesima unit di misura
della serie.
6a qui in avanti, tuttavia, questo modello sar sintetizzato come segue/
*
t
+ TC
t
- ,
t
- u
t
, t+&, 7, ..., n.
In questa formulazione, TC
t
indica la componente 4rend"Ciclo. In altre parole, il trend ed il ciclo
vengono accomunati per formare la parte sistematica di medio e lungo periodo. ,
t
continua ad
indicare la componente stagionale, mentre u
t
continua ad indicare i residui.
3a procedura iterativa consta dei seguenti passaggi/
&. Calcolo della componente di 4rend"Ciclo di prima approssimazione.
In questa fase una prima approssimazione della componente sistematica di riferimento viene
calcolata tramite le medie mobili centrate con un numero di termini pari alla periodicit della
componente stagionale. Sui dati mensili degli arrivi turistici, pertanto, le medie mobili saranno
centrate a &7 termini. In altre parole, si ripete quanto stato fatto in precedenza. Si noti che questa
procedura offre solamente una stima preliminare della componente 4rend"Ciclo, puramente
strumentale per il prosieguo del procedimento, non restituisce nessun risultato definitivo.
7. Calcolo preliminare della componente di stagionalit mista ad errore .
3a componente di stagionalit mista ad errore qui indicata con +, - u,
t
perch5 con questa
procedura quello che si ottiene un valore misto di stagionalit ed errore nel quale non possibile
separare l'apporto delle due quantit. $uesta componente viene calcolata come differenza tra i
valori osservati della serie originaria ed i rispettivi valori delle medie mobili calcolati nel passo
precedente/
+, - u:
t
@ *
t
A 11
t
,
in cui 11
t
il valore della media mobile centrata sul valore t calcolata al punto &.
!. Calcolo della componente di stagionalit.
In questo passo viene calcolata l'entit delle variazioni stagionali. Si suppone che le componenti
stagionali siano invarianti rispetto al tempo. -el caso di dati mensili, quindi con periodo di
stagionalit pari a &7, questo equivale a supporre che ,
t
+ ,
t-&7
+ ,
t-7#
+ ... + ,
t-&7p
, in cui p il
numero di anni che complessivamente copre la serie. In altre parole, si suppone che la variazione
stagionale relativa ad ogni singolo mese sia sempre della stessa entit, e che le eventuali differenze
che si riscontrano nelle osservazioni siano dovute ad effetti diversi. $uesto significa che, se si
suppone che il trend sia costante e che non vi siano effetti di ciclo, i valori dello stesso mese in anni
successivi sono strutturalmente sempre uguali, e che le osservazioni differiscano solo per via di
componenti accidentali. ;li arrivi in Italia nel mese di gennaio, dunque, in assenza di fattori
tendenziali e di movimenti ciclici, dovrebbero essere strutturalmente sempre gli stessi, e variare
solo in funzione del caso. In presenza di trend e ciclo, invece, ci% che determina l'osservazione
effettiva della temperatura media del mese di gennaio determinato da questi due fattori, e da una
componente residua casuale a media nulla.
Il valore della componente stagionale del mese m viene calcolato come media sull'universo delle
osservazioni disponibili della componente +, - u:
t
delle osservazioni relative al mese m/

,
m
=
&
p

i ='
p
, u
m&7i .
Il risultato di questi calcoli risulta in un numero di coefficienti di stagionalit pari al periodo di
stagionalit della serie grezza. -el caso dell'esempio, con dati mensili, si avranno &7 coefficienti
stagionali, uno per ogni mese dell'anno.
.ssendo il modello additivo, le componenti di stagionalit devono sommare a '/

m=&
&7

,
m
='
.
Infatti, per come stato costruito il modello additivo, le componenti stagionali devono sommare
all'elemento neutro dello stesso, che in questo caso pari a '. Se si verificasse il caso che le
componenti di stagionalit sommassero ad un valore pari a " diverso da ', ogni componente dovr
essere normalizzata sottraendole, sempre nel caso di dati mensili, un valore pari a "?&7/

m=&
&7

,
m
="
@P

, '
m
=

,
m

"
&7
, per ogni m.
I valori

,
m possono formare una serie a loro volta venendo messi in ordine e ripetuti in
sequenza/

,
t
={

,
&
)

,
7
) ... )

,
&7
)

,
&
) ... }
#. Costruzione della serie destagionalizzata ;
t
.
3a serie destagionalizzata ricavata per differenza tra la serie grezza originaria e la serie delle
componenti stagionali costanti ricavate nel passo precedente/
;
t
=*
t


,
t .
3a serie ;
t
, pertanto, contiene tutte le componenti della serie originaria, salvo quella stagionale.
>. Stima della componente trend"ciclo della serie
3a componente TC
t
della serie viene stimata mediante una media mobile a tre termini della serie
destagionalizzata costruita nel passo precedente. Si suppone infatti che una media mobile con un
numero di termini molto piccolo come questa sia in grado di smussare la serie dalle componenti
residuali, che, in quanto accidentali, non presentano nessun tipo di regolarit. Si ricorda, infatti, che
la media mobile di qualunque ordine in grado di smussare la serie e di ridurre la significativit
delle perturbazioni che la caratterizzano.

TC
t
=
&
!
;
t&
;
t
;
t&

.
In questo modo si perde una ulteriore osservazione all'inizio della serie ed un'altra alla fine. In
generale, questa perdita non tuttavia significativa.
<. Calcolo dell'intera parte sistematica della serie.
3a parte sistematica della serie pertanto quella costituita dalla componente trend"ciclo ottenuta
nel passo precedente e dagli effetti di stagionalit costanti calcolati nel passo !/
*
t
=

TC
t


,
t .
In questo modo, i valori
*
t contengono solamente la parte sistematica della serie, e prescindono
dagli errori accidentali.
=. Calcolo dei residui.
I residui sono a questo punto calcolati per differenza tra la serie originaria e la sua parte
sistematica ottenuta nel passo precedente/
u
t
=*
t
*
t .
I risultati di questa procedura sui dati IS4(4 degli arrivi mensili nelle strutture ricettive italiane nel
periodo &888"7''9 sono riportati nella seguente tabella >.&. 3e intestazioni di colonna rimandano
immediatamente alle quantit che vengono calcolate nei vari passi della procedura sopra
Tab. 7.1: ,omposizione on il modello additi(o <arri(i totali in Italia) 1999-2008:
1 3475"9 # # # # # 61 4015"8 7018"0 #3002"2 #3230"2 7311"9 7237"4
2 4125"2 # # # # # 62 4920"0 7056"7 #2136"7 #2374"0 7052"1 7143"1
3 4657"6 # # # # # 63 5374"4 7084"5 #1710"0 #1602"7 7065"3 7013"7
4 6264"7 # # # # # 64 7208"4 7128"5 79"8 166"4 6923"9 7204"1
5 7393"5 # # # # # 65 8435"3 7153"8 1281"5 950"5 7623"1 6995"9
6 8020"2 # # # # # 66 9385"6 7158"3 2227"3 2791"1 6440"6 7169"9
7 9643"2 6180"9 3462"2 3888"7 5939"4 # 67 11151"9 7159"1 3992"8 3888"7 7446"0 7057"5
8 10380"5 6182"8 4197"7 4514"5 6065"1 6001"6 68 11609"9 7159"2 4450"7 4514"5 7285"8 7231"5
9 7876"0 6194"7 1681"3 1767"9 6000"3 6197"6 69 8876"2 7178"5 1697"6 1767"9 6962"8 7253"8
10 5588"3 6241"2 #653"0 #831"9 6527"4 6326"3 70 6573"3 7190"7 #617"4 #831"9 7513"0 7201"8
11 3445"9 6263"8 #2818"0 #3052"5 6451"2 6441"8 71 4145"2 7173"0 #3027"8 #3052"5 7129"8 7288"3
12 3276"9 6300"3 #3023"4 #3007"2 6346"9 6536"4 72 4146"8 7191"4 #3044"6 #3007"2 7222"0 7269"9
13 3523"2 6387"7 #2864"5 #3230"2 6811"2 6483"9 73 4148"2 7238"4 #3090"2 #3230"2 7458"0 7154"7
14 4122"5 6454"0 #2331"5 #2374"0 6293"7 6578"5 74 4790"8 7269"8 #2479"0 #2374"0 6784"2 7308"7
15 4946"7 6516"0 #1569"3 #1602"7 6630"5 6577"8 75 5966"7 7286"9 #1320"2 #1602"7 7683"8 7038"2
16 7091"7 6561"0 530"7 166"4 6809"1 6571"6 76 6907"6 7304"2 #396"7 166"4 6646"6 7284"3
17 7109"0 6584"3 524"7 950"5 6275"1 6440"6 77 8313"5 7316"3 997"2 950"5 7522"5 7063"5
18 9179"3 6629"3 2550"0 2791"1 6237"7 6459"8 78 9949"0 7331"5 2617"5 2791"1 7021"6 7532"0
19 10581"7 6665"2 3916"5 3888"7 6866"5 6601"0 79 11715"9 7349"3 4366"7 3888"7 8051"9 7528"3
20 11032"3 6688"5 4343"8 4514"5 6698"7 6789"4 80 11799"5 7371"6 4427"9 4514"5 7511"3 7588"8
21 8713"7 6710"4 2003"2 1767"9 6802"9 6753"0 81 9095"6 7376"9 1718"7 1767"9 7203"1 7482"3
22 5829"9 6720"1 #890"1 #831"9 6757"4 6771"3 82 6770"6 7428"0 #657"4 #831"9 7732"4 7389"2
23 3762"8 6736"7 #2974"0 #3052"5 6753"6 6875"3 83 4237"5 7492"4 #3254"9 #3052"5 7232"0 7491"7
24 4041"3 6778"8 #2737"4 #3007"2 7114"8 6929"5 84 4418"9 7529"9 #3110"9 #3007"2 7510"9 7452"9
25 3620"3 6810"5 #3190"2 #3230"2 6920"0 6876"3 85 4303"1 7581"6 #3278"5 #3230"2 7615"8 7420"5
26 4584"4 6822"2 #2237"8 #2374"0 6594"2 6741"3 86 5171"7 7616"3 #2444"6 #2374"0 7134"8 7392"1
27 5010"7 6829"2 #1818"4 #1602"7 6709"6 6765"5 87 5713"4 7665"1 #1951"7 #1602"7 7425"7 7555"2
28 7258"5 6819"3 439"3 166"4 6992"8 6745"1 88 8386"4 7695"9 690"6 166"4 8105"2 7707"6
29 7342"7 6819"1 523"7 950"5 6533"1 6850"8 89 8381"6 7704"6 677"1 950"5 7591"9 7845"9
30 9954"0 6813"2 3140"8 2791"1 7026"5 6814"1 90 10779"4 7726"6 3052"8 2791"1 7840"6 7967"5
31 10568"7 6794"7 3774"0 3888"7 6882"7 6979"6 91 12126"2 7739"0 4387"2 3888"7 8470"1 8084"3
32 11326"8 6783"4 4543"4 4514"5 7029"5 6870"9 92 12222"3 7742"9 4479"4 4514"5 7942"2 8118"0
33 8585"9 6811"0 1774"8 1767"9 6700"4 6797"1 93 9844"5 7762"0 2082"5 1767"9 7941"8 7868"4
34 5719"9 6811"8 #1091"9 #831"9 6661"5 6743"2 94 6759"7 7784"6 #1024"9 #831"9 7721"2 7703"9
35 3868"1 6807"6 #2939"5 #3052"5 6867"6 6801"3 95 4457"3 7802"2 #3344"9 #3052"5 7448"7 7665"3
36 3794"8 6810"6 #3015"8 #3007"2 6874"7 6820"3 96 4728"1 7838"0 #3109"9 #3007"2 7826"0 7626"5
37 3422"6 6775"5 #3352"9 #3230"2 6718"4 6706"7 97 4292"3 7872"9 #3580"6 #3230"2 7604"9 7553"7
38 4511"5 6769"7 #2258"3 #2374"0 6527"0 6901"8 98 5275"2 7908"6 #2633"3 #2374"0 7230"1 7541"2
39 5747"1 6772"4 #1025"4 #1602"7 7460"0 6757"7 99 6069"5 7944"8 #1875"3 #1602"7 7788"6 7769"0
40 6541"9 6785"8 #243"8 166"4 6285"9 6968"2 100 8572"2 7961"2 611"0 166"4 8288"4 7969"8
41 7956"5 6810"2 1146"4 950"5 7158"6 6645"9 101 8617"7 7981"4 636"3 950"5 7832"5 8192"0
42 9413"3 6818"6 2594"6 2791"1 6493"2 6742"2 102 11402"4 7996"3 3406"1 2791"1 8455"0 8325"5
43 10266"5 6832"2 3434"2 3888"7 6574"7 6754"9 103 12340"9 8003"8 4337"1 3888"7 8688"9 8580"0
44 11490"9 6847"0 4643"9 4514"5 7196"8 6791"4 104 12863"8 8017"4 4846"4 4514"5 8596"1 8484"2
45 8487"0 6825"4 1661"6 1767"9 6602"9 6962"5 105 10073"5 8045"4 2028"2 1767"9 8167"7 8217"5
46 6138"1 6823"1 #685"0 #831"9 7087"8 6907"8 106 6924"2 8023"0 #1098"8 #831"9 7888"9 7939"7
47 4035"5 6844"1 #2808"6 #3052"5 7032"7 7010"8 107 4775"6 8023"2 #3247"6 #3052"5 7762"7 7839"2
48 3831"2 6854"0 #3022"8 #3007"2 6911"9 6986"2 108 4767"3 8035"2 #3267"9 #3007"2 7865"9 7788"7
49 3712"6 6863"1 #3150"5 #3230"2 7014"1 6837"5 109 4434"5 7997"0 #3562"5 #3230"2 7737"4 7722"7
50 4576"3 6866"3 #2290"0 #2374"0 6586"7 6821"8 110 5459"3 8014"2 #2554"8 #2374"0 7564"8 7856"4
51 5162"9 6859"7 #1696"9 #1602"7 6864"6 6753"2 111 6556"8 8014"1 #1457"3 #1602"7 8267"0 7696"4
52 7071"6 6850"0 221"6 166"4 6808"4 6934"6 112 7547"4 7982"7 #435"3 166"4 7257"3 8126"6
53 7929"3 6847"4 1081"9 950"5 7130"9 6898"4 113 9647"7 7962"3 1685"4 950"5 8855"4 7936"0
54 9679"7 6860"7 2819"0 2791"1 6755"9 6804"3 114 10661"2 7949"2 2712"0 2791"1 7695"3 #
55 10218"7 6891"2 3327"5 3888"7 6526"0 6868"5 115 12164"3 # # # # #
56 11615"3 6918"1 4697"2 4514"5 7323"6 6724"5 116 13452"1 # # # # #
57 8204"2 6941"3 1263"0 1767"9 6324"0 6928"4 117 9484"7 # # # # #
58 6187"1 6955"8 #768"7 #831"9 7137"6 6795"2 118 6758"2 # # # # #
59 3925"3 6982"6 #3057"3 #3052"5 6924"0 7136"7 119 4452"3 # # # # #
60 4259"5 6991"4 #2731"9 #3007"2 7348"4 7194"8 120 4775"6 # # # # #
*
t
11
t
,u
t

,
t
;
t
TC
t
t *
t
11
t
,u
t

,
t
;
t
TC
t
t
descritta. 2articolare importanza rivestono a questo punto la terzultima e l'ultima colonna/ la prima
riporta i dati della componente trend"ciclo, ossia della serie depurata dai termini di residuo
Si pu% osservare che la serie presenta delle similitudini molto vaghe con quella in cui la
destagionalizzazione era stata effettuata semplicemente applicando le medie mobili a &7 elementi
+fig. #.&,/ infatti possibile osservare l'insorgere di un problema. -el corso degli ultimi anni della
serie, che sono anche quelli caratterizzati dal livello complessivo pi) alto, la procedura non in
grado di bilanciare completamente le fluttuazioni stagionali. Si ricorda che queste sono stimate
come media aritmetica delle fluttuazioni registrate su tutto il periodo considerato. $uindi, la
presenza di un time plot come quello di figura >.& suggerisce che i movimenti stagionali dipendano
dal livello della serie +sono maggiori quando i valori della serie sono pi) elevati,. $uesto, a sua
volta, suggerisce che il modello di scomposizione additiva, i cui passaggi sono illustrati in tabella
>.&, non adeguato per rappresentare la serie.
Fig. 7.1: Time plot dei (alori stimati on somposizione additi(a della omponente trend-ilo
per la serie delle medie mensili delle temperature massime rile(ate a 1inneapolis nel periodo
1999-2008.accidentale e di stagionalit, il cui andamento riportato nella seguente figura >.&.
2assiamo a questo punto ad introdurre la procedura iterativa per la stima delle componenti del
modello misto. 6al momento che l'esempio applicativo far riferimento di nuovo ai dati relativi agli
arrivi mensili totali registrati negli esercizi ricettivi italiani nel decennio &888"7''9, la componente
stagionale verr ancora considerata avere una periodicit di &7 osservazioni. Oibadiamo che qualora
si dovesse analizzare una serie di dati trimestrali, come la maggior parte delle serie economiche, la
stagionalit avrebbe presumibilmente periodicit pari a #, il numero di trimestri che ci sono in un
anno. 3e procedure che sono state introdotte per il modello additivo e che verranno introdotte per
quello misto sono immediatamente generalizzabili a qualunque genere di componente stagionale. Si
noter che la procedura iterativa che verr illustrata per il modello misto nella pratica
assolutamente analoga a quella presentata per il modella additivo, con le sole differenze relative al
fatto che una parte delle componenti interagisce su base moltiplicativa invece che additiva. Si
ricorda, pertanto, che quando delle componenti vengono moltiplicate tra loro, solamente una +nel
caso specifico, il trend, espressa nella medesima unit di misura della serie, mentre le altre sono
numeri puri. Si ricorda anche che una perturbazione 0neutra1 in un modello moltiplicativo assume
valore &, contrariamente a quanto succede nel caso additivo, in cui una perturbazione priva di effetti
ha valore '.
1999$8
1999$12
2000$4
2000$8
2000$12
2001$4
2001$8
2001$12
2002$4
2002$8
2002$12
2003$4
2003$8
2003$12
2004$4
2004$8
2004$12
2005$4
2005$8
2005$12
2006$4
2006$8
2006$12
2007$4
2007$8
2007$12
2008$4
5000
5500
6000
6500
7000
7500
8000
8500
9000
Il modello misto che verr preso in considerazione il seguente/
*
t
+ T
t
I C
t
I ,
t
- u
t
, t+1) 2) ...) n.
$uindi trend, ciclo e stagionalit interagiscono tra loro su base moltiplicativa, mentre la
componente residua additiva, e, come tale, espressa nella stessa unit di misura della serie
originaria.
-el prosieguo della trattazione, come nel caso additivo, le componenti di trend e ciclo si
considerano formare una componente unica. 2ertanto, il modello di cui si analizzer la
decomposizione il seguente/
*
t
+ TC
t
I ,
t
- u
t
, t+1) 2) ...) n.
Come nel caso precedente, TC
t
indica la componente trend"ciclo, ,
t
la stagionalit e u
t
il residuo
della serie.
3a procedura iterativa di scomposizione consta dei seguenti passaggi.
&. Stima della componente trend"ciclo di prima approssimazione
.sattamente come nel caso del modello additivo, questa stima viene calcolata mediante
l'applicazione delle medie mobili centrate con l'appropriato numero di elementi, nel caso dei dati
mensili &7. I valori cosK calcolati vengono indicati con 11
t
.
7. Stima della componente di stagionalit mista ad errore, <,-u:
t
.
3a componente di stagionalit mista ad errore calcolata dividendo i valori della serie originaria
per le medie mobili calcolate nel passo precedente/
, u
t
=
*
t
11
t
!. Stima della componente stagionale
Con procedura analoga a quanto gi visto per il modello additivo, vengono calcolate le
componenti stagionali per ognuno dei mesi +o dei trimestri, dei quadrimestri, etc., sotto l'ipotesi che
le componenti stagionali rimangano costanti nel tempo. 3a procedura di calcolo assolutamente
analoga, ossia consiste, per il mese m"esimo, nell'effettuare le medie di tutte le osservazioni
disponibili relative al mese m della componente di stagionalit mista ad errore. In questo modo si
avranno &7 componenti stagionali, una per ogni mese/

,
m
=
&
p

i ='
p
, u
m&7i
Contrariamente al modello additivo, nel modello misto la somma delle &7 componenti stagionali
mensili +o di quelle appropriate per il periodo di osservazione considerato, devono sommare ad &.

m=&
&7

,
m
=&
Infatti, come nel caso additivo l'effetto complessivo delle &7 componenti deve compensarsi e
non avere l'effetto di traslare la serie/ solamente che affinch5 questo avvenga in una parte
moltiplicativa la somma dei fattori deve essere & invece di '. Se questo non avviene e la somma dei
coefficienti di stagionalit pari ad un numero " diverso da &, le componenti di stagionalit devono
essere divise per questo valore. In questo modo si ottiene la normalizzazione desiderata.
( questo punto possibile, esattamente come nel caso additivo, formare una serie delle
componenti stagionali.

,
t
={

,
&
)

,
7
) ... )

,
&7
)

,
&
) ... }
#. 6erivazione della serie destagionalizzata.
Il dato destagionalizzato si ricava dividendo i valori della serie originaria per i rispettivi valori
della componente stagionale calcolata nel passo precedente
;
t
=
*
t

,
t
Come nel caso del modello additivo, la serie ;
t
contiene la componente ciclo"trend e l'effetto del
disturbo.
>. Stima del ciclo"trend.
Come nel modello additivo, la componente ciclo"trend viene calcolata mediante media mobile
centata a ! termini della serie ;
t
calcolata nel passo precedente/

TC
t
=
&
!
;
t&
;
t
;
t&

<. Stima della componente sistematica della serie.


3a componente sistematica della serie, formata da ciclo, trend e stagionalit, viene calcolata
moltiplicando tra loro questi fattori/
*
t
=

TC
t


,
t
=. Calcolo dei residui.
Come nel caso del modello additivo, i residui della serie sono calcolati come differenza tra i
valori osservati della serie originaria ed i valori della componente sistematica ottenuta nel passo
precedente. Si ricorda infatti che i residui rappresentano la parte additiva del modello misto.
u
t
=*
t
*
t
I risultati di questa procedura sui dati degli arrivi totali mensili nelle strutture ricettive italiane
nel periodo &888"7''9 sono riportati nella seguente tabella >.7. Il time plot relativo alla terzultima
colonna di questa tabella, relativo alla componente trend"ciclo, riportato in figura >.7. 3a scala
relativa all'asse verticale la stessa che stata utilizzata per il grafico in figura >.&, relativo
all'andamento della serie di trend e ciclo stimata con il modello additivo. $uesto permette di fare un
primo confronto preliminare sulla base dell'analisi dei due grafici.
Si nota in modo abbastanza evidente che il modello misto si comporta complessivamente meglio
di quello additivo/ infatti, non sembra sussistere una dipendenza della stagionalit dal livello
generale della serie. (ll'inizio della serie sono osservabili delle oscillazioni che hanno durata
approssimativamente annuale, ma a questo proposito sono necessarie alcune considerazioni. In
primo luogo, la serie degli arrivi e delle presenze fortemente esposta ad errori accidentali di entit
anche molto significativa, dovuti ad una moltitudine di fattori, non sempre controllabili* in questo
caso, la serie presenta pichi pi) alti del normale nei mesi estivi del 7''& e valori pi) bassi della
norma nei rispettivi inverni, compreso quello successivo all'estate 7''&, ossia quello relativo al calo
post"&& settembre. $uesto non sufficiente a dire che la rappresentazione non adeguata.
Tab. 7.2: ,omposizione on il modello misto <arri(i totali in Italia) 1999-2008:
1 3475"9 # # # # # 61 4015"8 7018"0 0"57 0"55 7433"5 7310"0
2 4125"2 # # # # # 62 4920"0 7056"7 0"70 0"67 6985"5 7147"7
3 4657"6 # # # # # 63 5374"4 7084"5 0"76 0"78 7024"2 6979"3
4 6264"7 # # # # # 64 7208"4 7128"5 1"01 1"02 6928"1 7178"0
5 7393"5 # # # # # 65 8435"3 7153"8 1"18 1"13 7581"6 7058"0
6 8020"2 # # # # # 66 9385"6 7158"3 1"31 1"39 6664"2 7186"3
7 9643"2 6180"9 1"56 1"55 6341"0 # 67 11151"9 7159"1 1"56 1"55 7313"1 7057"4
8 10380"5 6182"8 1"68 1"64 6450"6 6336"2 68 11609"9 7159"2 1"62 1"64 7194"9 7165"0
9 7876"0 6194"7 1"27 1"25 6216"9 6372"1 69 8876"2 7178"5 1"24 1"25 6987"2 7248"9
10 5588"3 6241"2 0"90 0"88 6448"7 6206"0 70 6573"3 7190"7 0"91 0"88 7564"7 7231"0
11 3445"9 6263"8 0"55 0"57 5952"6 6059"9 71 4145"2 7173"0 0"58 0"57 7141"1 7332"7
12 3276"9 6300"3 0"52 0"58 5778"4 6084"2 72 4146"8 7191"4 0"58 0"58 7292"4 7377"7
13 3523"2 6387"7 0"55 0"55 6521"6 6051"0 73 4148"2 7238"4 0"57 0"55 7699"5 7192"5
14 4122"5 6454"0 0"64 0"67 5853"1 6280"0 74 4790"8 7269"8 0"66 0"67 6585"5 7368"2
15 4946"7 6516"0 0"76 0"78 6465"2 6378"1 75 5966"7 7286"9 0"82 0"78 7819"6 7020"8
16 7091"7 6561"0 1"08 1"02 6816"0 6556"9 76 6907"6 7304"2 0"95 1"02 6657"2 7323"1
17 7109"0 6584"3 1"08 1"13 6389"5 6574"4 77 8313"5 7316"3 1"14 1"13 7492"6 7077"8
18 9179"3 6629"3 1"38 1"39 6517"7 6615"5 78 9949"0 7331"5 1"36 1"39 7083"6 7426"7
19 10581"7 6665"2 1"59 1"55 6939"1 6764"6 79 11715"9 7349"3 1"59 1"55 7704"0 7373"3
20 11032"3 6688"5 1"65 1"64 6837"0 6878"5 80 11799"5 7371"6 1"60 1"64 7332"4 7405"3
21 8713"7 6710"4 1"30 1"25 6859"2 6801"8 81 9095"6 7376"9 1"23 1"25 7179"5 7441"7
22 5829"9 6720"1 0"87 0"88 6709"2 6683"5 82 6770"6 7428"0 0"91 0"88 7813"1 7437"6
23 3762"8 6736"7 0"56 0"57 6482"2 6766"1 83 4237"5 7492"4 0"57 0"57 7320"1 7641"8
24 4041"3 6778"8 0"60 0"58 7106"9 6769"6 84 4418"9 7529"9 0"59 0"58 7792"3 7699"8
25 3620"3 6810"5 0"53 0"55 6719"8 6709"5 85 4303"1 7581"6 0"57 0"55 7987"0 7629"5
26 4584"4 6822"2 0"67 0"67 6301"8 6529"5 86 5171"7 7616"3 0"68 0"67 7109"1 7527"9
27 5010"7 6829"2 0"73 0"78 6566"8 6621"4 87 5713"4 7665"1 0"75 0"78 7487"7 7559"8
28 7258"5 6819"3 1"06 1"02 6995"4 6726"7 88 8386"4 7695"9 1"09 1"02 8082"4 7708"1
29 7342"7 6819"1 1"08 1"13 6617"7 6900"1 89 8381"6 7704"6 1"09 1"13 7554"0 7770"4
30 9954"0 6813"2 1"46 1"39 7087"2 6884"8 90 10779"4 7726"6 1"40 1"39 7674"8 7734"2
31 10568"7 6794"7 1"56 1"55 6949"6 7025"1 91 12126"2 7739"0 1"57 1"55 7973"7 7747"9
32 11326"8 6783"4 1"67 1"64 7038"7 6921"8 92 12222"3 7742"9 1"58 1"64 7595"2 7779"9
33 8585"9 6811"0 1"26 1"25 6777"1 6805"5 93 9844"5 7762"0 1"27 1"25 7770"7 7722"1
34 5719"9 6811"8 0"84 0"88 6600"6 6686"6 94 6759"7 7784"6 0"87 0"88 7800"4 7756"9
35 3868"1 6807"6 0"57 0"57 6681"9 6658"0 95 4457"3 7802"2 0"57 0"57 7699"7 7945"8
36 3794"8 6810"6 0"56 0"58 6691"6 6575"4 96 4728"1 7838"0 0"60 0"58 8337"4 8001"4
37 3422"6 6775"5 0"51 0"55 6352"7 6415"3 97 4292"3 7872"9 0"55 0"55 7967"1 7852"0
38 4511"5 6769"7 0"67 0"67 6201"5 6695"3 98 5275"2 7908"6 0"67 0"67 7251"4 7724"3
39 5747"1 6772"4 0"85 0"78 7531"8 6679"4 99 6069"5 7944"8 0"76 0"78 7954"4 7822"4
40 6541"9 6785"8 0"96 1"02 6304"8 7002"5 100 8572"2 7961"2 1"08 1"02 8261"5 7994"2
41 7956"5 6810"2 1"17 1"13 7170"9 6725"9 101 8617"7 7981"4 1"08 1"13 7766"8 8048"9
42 9413"3 6818"6 1"38 1"39 6702"2 6874"6 102 11402"4 7996"3 1"43 1"39 8118"4 8000"0
43 10266"5 6832"2 1"50 1"55 6750"9 6864"6 103 12340"9 8003"8 1"54 1"55 8114"9 8075"7
44 11490"9 6847"0 1"68 1"64 7140"7 6863"6 104 12863"8 8017"4 1"60 1"64 7993"9 8020"1
45 8487"0 6825"4 1"24 1"25 6699"1 6974"3 105 10073"5 8045"4 1"25 1"25 7951"4 7978"5
46 6138"1 6823"1 0"90 0"88 7083"2 6917"8 106 6924"2 8023"0 0"86 0"88 7990"3 8063"8
47 4035"5 6844"1 0"59 0"57 6971"0 6936"7 107 4775"6 8023"2 0"60 0"57 8249"6 8215"5
48 3831"2 6854"0 0"56 0"58 6755"9 6872"7 108 4767"3 8035"2 0"59 0"58 8406"6 8288"2
49 3712"6 6863"1 0"54 0"55 6891"1 6645"9 109 4434"5 7997"0 0"55 0"55 8208"4 8122"1
50 4576"3 6866"3 0"67 0"67 6290"6 6649"3 110 5459"3 8014"2 0"68 0"67 7751"2 8176"4
51 5162"9 6859"7 0"75 0"78 6766"2 6624"0 111 6556"8 8014"1 0"82 0"78 8569"5 7858"2
52 7071"6 6850"0 1"03 1"02 6815"3 6909"3 112 7547"4 7982"7 0"95 1"02 7254"0 8165"0
53 7929"3 6847"4 1"16 1"13 7146"4 6951"2 113 9647"7 7962"3 1"21 1"13 8671"4 7831"8
54 9679"7 6860"7 1"41 1"39 6891"8 6919"2 114 10661"2 7949"2 1"34 1"39 7569"9 #
55 10218"7 6891"2 1"48 1"55 6719"5 6943"1 115 12164"3 # # # # #
56 11615"3 6918"1 1"68 1"64 7218"0 6804"5 116 13452"1 # # # # #
57 8204"2 6941"3 1"18 1"25 6475"9 6944"5 117 9484"7 # # # # #
58 6187"1 6955"8 0"89 0"88 7139"7 6798"8 118 6758"2 # # # # #
59 3925"3 6982"6 0"56 0"57 6780"8 7143"9 119 4452"3 # # # # #
60 4259"5 6991"4 0"61 0"58 7511"2 7241"8 120 4775"6 # # # # #
*
t
11
t
,u
t

,
t
;
t
TC
t
t *
t
11
t
,u
t

,
t
;
t
TC
t
t
Inoltre, solitamente si osserva una dipendenza diretta dei fenomeni stagionali dal livello generale
della serie, mentre difficile che detta relazione sia inversa/ in altre parole, mentre il fatto che al
crescere dei valori della serie la stagionalit non scompaia applicando i metodi di scomposizione
qui presentati porta a sospettare l'inadeguatezza della scomposizione effettuata, il contrario non
necessariamente vero. Infine, l'eventuale osservazione di una situazione come quella che compare
in figura >.7 conduce ad ipotizzare che la serie soffra di un problema diverso, che verr affrontato
pi) avanti/ pu% darsi che la serie storica osservata abbia una variabilit generale che varia
significativamente nel corso del tempo* in altre parole, i suoi movimenti intorno ai valori attesi
dipendenti da trend ed eventualmente ciclo sono pi) ampi in alcuni periodi rispetto ad alti,
indipendentemente dal valore generale della serie. $uesta situazione va sotto il nome di 0non
stazionariet in varianza1.
2assiamo adesso ad introdurre una tecnica che consenta di valutare la bont della scomposizione
effettuata, e di scegliere tra pi) modelli, nel caso specifico tra il modello additivo e quello misto
sopra calcolati, quale dei due pi) adatto a rappresentare la serie.
Sono stati sviluppati diversi indici per valutare la bont dell'adattamento del modello ai dati. In
questa sede, tuttavia, ci soffermiamo innanzitutto su un'analisi molto intuitiva che riguarda la
struttura dei residui. Una volta effettuata la stima del modello, infatti, se questo si adatta bene ai dati
i residui avranno una struttura casuale. In altre parole, le differenze tra il modello che viene stimato
mediate le procedure descritte sopra e i dati effettivamente osservati non debbono avere nessuna
struttura particolare, devono avere una distribuzione completamente aleatoria. I grafici dei residui
che abbiamo visto pi) in alto, in relazione all'analisi dei trend lineari, non avevano una struttura
casuale, in quanto erano perfettamente identificabili dei cicli.
Fig. 7.2: Time plot dei (alori stimati on somposizione mista della omponente trend-ilo per
la serie degli arri(i totali mensili negli eserizi rietti(i italiani nel periodo 1999-2008.
.sistono diversi tipi di strutture non casuali dei residui. Nltre a quelle che presentano dei cicli, i
problemi che si verificano pi) spesso riguardano i residui che hanno una forma funzionale ed i
residui che hanno un'intensit che dipende dal tempo. .sempi di queste due strutture sono riportati
nelle seguenti figure >.! e >.#.
In entrambi i casi evidente che la struttura dei residui non casuale/ nel primo caso, come in
quelli che abbiamo gi visto, i residui hanno una struttura caratterizzata da una forte memoria.
$uesto significa che il modello calcolato non adatto a rappresentare i dati. -el caso specifico, la
1999$8
1999$12
2000$4
2000$8
2000$12
2001$4
2001$8
2001$12
2002$4
2002$8
2002$12
2003$4
2003$8
2003$12
2004$4
2004$8
2004$12
2005$4
2005$8
2005$12
2006$4
2006$8
2006$12
2007$4
2007$8
2007$12
2008$4
5000
5500
6000
6500
7000
7500
8000
8500
9000
struttura presenta delle caratteristiche singolari/ prima i residui decrescono a tasso decrescente, poi
cambiano direzione ed iniziano a crescere, ad un ritmo via via sempre pi) rapido. $uesta una
tipica situazione in cui il modello che stato adottato sbagliato/ una struttura dei residui di questo
tipo si presenta solitamente quando si suppone che dei dati siano in relazione di dipendenza lineare,
mentre in realt la struttura di dipendenza non lineare, ha forma quadratica.
Fig. 7.%: 'ndamento non asuale dei residui) in aso di trend non lineare
Fig. 7.3: 'ndamento non asuale dei residui in aso di residui resenti nel tempo
I residui del secondo tipo invece si presentano quando le oscillazioni dipendono dal tempo, e
questa oscillazione non stata considerata nel modello. Una tipica situazione di questo tipo si ha
quando una serie storica con tendenza crescente stata scomposta con un modello che prevede la
costanza dei residui rispetto al livello, mentre un modello pi) adatto prevede che i residui dipendano
dall'ordine di grandezza della serie. Se si adottato un modello additivo o misto, in cui, come si
gi accennato, i residui sono espressi nella stessa unit di misura della serie, pertanto consigliabile
passare ad un modello moltiplicativo.
I residui del modello additivo e di quello misto calcolati per la serie degli arrivi totali in Italia
sono stati riportati nell'ultima colonna, rispettivamente, delle tabelle >.& e >.7. I relativi grafici sono
riportati nella seguente figura >.>/ i residui del modello additivo sono segnati in blu, quelli del
modello moltiplicativo in arancione. I due grafici sono stati sovrapposti nella stessa figura in
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
#6
#4
#2
0
2
4
6
8
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
#3
#2
#1
0
1
2
3
4
5
quanto, avendo in pratica la stessa struttura, possibile effettuare su questa base un confronto tra le
due distribuzioni per verificare quale sia il modello complessivamente migliore.
Fig. 7.7: 9esidui dei modelli di deomposizione additi(o <in blu: e misto <in rosso: della serie
degli arri(i mensili di turisti in Italia nel periodo 1999-2008
.ntrambi i modelli presentano dei residui che hanno una struttura complessivamente casuale,
quindi in entrambi i casi il modello si adatta bene alla serie. Inoltre, analizzando i residui non risulta
che uno dei due modelli si comporti in modo evidentemente migliore dell'altro.
In sede di analisi dei time plot delle serie di trend e ciclo calcolate con i due modelli si
osservato come il modello additivo risultava complessivamente inadeguato, in considerazione del
fatto che le oscillazioni stagionali sembravano dipendere dal livello generale della serie. $uesto
aspetto era evidente soprattutto in riferimento agli ultimi due anni analizzati/ questo dipende in
massima parte dalla sostanziale brevit della serie considerata. Se si fosse presa in considerazione
una serie pi) lunga, con il medesimo andamento tendenziale di fondo, la dipendenza della struttura
dei residui dal livello della serie sarebbe stata pi) evidente. In questa sede, si scelto di analizzare
la serie decennale per ragioni di brevit espositiva. Il fenomeno viene tuttavia rilevato dall'IS4(4 a
partire dal &88'. Si tratta di 8 anni in pi)/ non moltissimo, ma l'aggiunta dei primi 8 anni di
rilevazione in testa alla serie renderebbe questo aspetto pi) chiaro.
2u% essere a questo punto interessante tornare a calcolare il trend con la procedura dei minimi
quadrati impiegata in precedenza, sulla serie dei dati destagionalizzati e depurati della componente
residua identificata tramite il modello misto. In altre parole, avendo a disposizione la componente
stimata trend"ciclo, ed ipotizzando che il trend sia di tipo lineare, calcoliamolo col metodo dei
minimi quadrati/
*
t
=5
'
5
&
t 6
t .
.ffettuando i calcoli si ottiene la seguente retta di regressione/
*
t
=<7#>,<&=,&=t
t
.
3a bont di adattamento ai dati misurata da 9
2
pari a ',8. In confronto tra la retta di regressione
ed i dati ottenuti dalla procedura iterativa per il modello additivo riportato nella figura >.<.
I residui del modello lineare sono riportati in figura >.=.
1999$8
1999$12
2000$4
2000$8
2000$12
2001$4
2001$8
2001$12
2002$4
2002$8
2002$12
2003$4
2003$8
2003$12
2004$4
2004$8
2004$12
2005$4
2005$8
2005$12
2006$4
2006$8
2006$12
2007$4
2007$8
2007$12
2008$4
#1000"0
#800"0
#600"0
#400"0
#200"0
0"0
200"0
400"0
600"0
800"0
1000"0
Fig. 7.$: Time plot dei in tab. 7.2 e retta dei minimi 8uadrati
Fig. 7.&: 9esidui del modello lineare in 4ig. 7.&
Come nell'analisi effettuata in precedenza, i risultati suggeriscono che l'andamento di lungo
periodo che si evince da questi dati significativamente crescente, tra l'altro con un elevatissimo
grado di adattamento/ nel decennio &888"7''9 gli arrivi sono aumentati costantemente, mediamente
di circa &=''' unit al mese. Come era logico aspettarsi, inoltre, i residui presentano ancora delle
caratteristiche cicliche/ dopo un primo ciclo negativo molto breve, appaiono due cicli positivi,
interrotti da due sole osservazioni molto vicine alla retta interpolante, che assumono pertanto la
struttura dell'osservazione anomala* segue poi, successivamente al settembre 7''&, si osserva un
ciclo negativo di parecchi anni, anche questo interrotto da sporadici miglioramenti, non sistematici,
e verosimilmente da considerarsi pressoch5 anomali. ( partire da met 7''>, cominciato una
nuova fase con ciclo positivo, con un comportamento a fine periodo molto erratico, che potr essere
1999$8
1999$12
2000$4
2000$8
2000$12
2001$4
2001$8
2001$12
2002$4
2002$8
2002$12
2003$4
2003$8
2003$12
2004$4
2004$8
2004$12
2005$4
2005$8
2005$12
2006$4
2006$8
2006$12
2007$4
2007$8
2007$12
2008$4
5500
6000
6500
7000
7500
8000
8500
1999$8
1999$12
2000$4
2000$8
2000$12
2001$4
2001$8
2001$12
2002$4
2002$8
2002$12
2003$4
2003$8
2003$12
2004$4
2004$8
2004$12
2005$4
2005$8
2005$12
2006$4
2006$8
2006$12
2007$4
2007$8
2007$12
2008$4
#500
#400
#300
#200
#100
0
100
200
300
400
500
letto in modo pi) esaustivo aggiungendo osservazioni successive.
In questo modo, considerando solamente i dati fino alla fine del 7''9, l'analisi della serie si
chiude con l'osservazione relativa al mese di maggio dello stesso anno. I dati son tuttavia disponibili
fino al mese di ottobre del 7''8. (nche in questo modo, tuttavia, l'analisi si chiuderebbe con
l'osservazione del marzo 7''8. .' tuttavia possibile utilizzare i coefficienti di stagionalit stimati per
formalizzare anche le osservazioni fino all'ultima disponibile. $uesta procedura si basa tuttavia
sull'ipotesi che i coefficienti di stagionalit non cambino all'esterno dell'intervallo su cui sono stati
calcolati.
Si tratta semplicemente di estendere in coda alla colonna ,
t
della tabella >.7 i valori stimati per i
dodici coefficienti di stagionalit relativi ai rispettivi mesi. 3a colonna successiva, ;
t
, calcolata
dividendo i valori effettivamente osservati per i rispettivi valori di ,
t
, mentre TC
t
calcolata con una
media mobili a tre termini di ;
t
. $uindi, con questa procedura, i valori di trend e ciclo sono
disponibili fino alla penultima osservazione, ossia fino al mese di settembre 7''8.
Il time plot fino al settembre 7''8 riportato nella figura >.9
Fig. 7.8: Time plot dei (alori stimati on somposizione mista della omponente trend-ilo per
la serie degli arri(i totali mensili negli eserizi rietti(i italiani nel periodo 1999-2009.
Con l'aggiunta di questo ulteriore anno e mezzo di osservazioni, si assiste all'insorgere di una
fase negativa di entit non osservata nei &' anni precedenti. Il valore della componente sistematica
del marzo 7''8, una punta negativa che non si toccava da almeno # anni, verosimilmente
un'osservazione anomala, dal momento che significativamente inferiore anche ai valori
circostanti, ma si tratta comunque del culmine di una situazione critica velatamente iniziata alla fine
del 7''=, e dalla quale, alla fine della serie, l'Italia non si ancora del tutto ripresa, dal momento
che i livelli della met del 7''= non sono stati ancora nuovamente raggiunti. Si noti anche che un
valore cosK inferiore anche ai valori contigui, se venisse utilizzato per il calcolo delle componenti
stagionali, verosimilmente avrebbe come effetto quello di aumentare il coefficiente negativo
relativo ai mesi di marzo. Il risultato non sarebbe comunque un'attenuazione effettiva di quel punto
di minimo locale.
Nvviamente, l'aggiunta delle osservazioni in fondo alla serie, soprattutto in una situazione come
questa, in cui queste ultime si discostano in maniera significativa dall'andamento tendenziale
registrato sulle osservazioni precedenti, la retta interpolante calcolata col metodo dei minimi
quadrati cambia in modo rilevante. I coefficienti stimati sono i seguenti/
1999$8
2000$1
2000$6
2000$11
2001$4
2001$9
2002$2
2002$7
2002$12
2003$5
2003$10
2004$3
2004$8
2005$1
2005$6
2005$11
2006$4
2006$9
2007$2
2007$7
2007$12
2008$5
2008$10
2009$3
2009$8
5500
6000
6500
7000
7500
8000
8500
*
t
=<!>&,#&#,#>t
t
.
Il relativo grafico riportato in figura >.8
Fig. 7.$: Time plot dei in tab. 7.8 e retta dei minimi 8uadrati
Il coefficiente angolare significativamente pi) basso, da &=,&= a &#,#>/ significa che ogni
mese, mediamente, nel corso del decennio, a seconda che si considerino o meno le ultime
osservazioni, il numero di arrivi mensili negli esercizi ricettivi cresce di &=''' o di &#>'' unit
ogni mese. 2er avere un'idea pi) precisa, comunque, degli effetti di questo periodo critico in termini
strutturali, bisogna aspettare che lo stesso finisca, per valutare se comporter un cambiamento
dell'inclinazione della retta, un abbassamento del livello della stessa, o se verr superato senza
particolari conseguenze di lungo periodo, come gi successo per periodi critici precedenti,
quantunque di minore entit. $uesta considerazione porta a sottolineare come l'analisi di una serie
temporale con questo tipo di tecniche inevitabilmente poco concludente quando viene effettuata in
una fase particolarmente acuta, sia in positivo che in negativo, di un ciclo/ ci si trova sempre in una
fase ciclica, nondimeno, evidente, effettuare dei discorsi di medio"lungo periodo trovandosi con le
ultime osservazioni disponibili per l'autunno 7''> pi) facile che in questa situazione. $uesto,
tuttavia, non vuol dire che le conclusioni tratte e previsioni effettuate in un periodo di relativa
stabilit si rivelino automaticamente pi) accurate.
. Le pre!isioni
2assiamo a questo punto ad illustrare come si eseguono le previsioni una volta eseguita la
scomposizione. $uesto un aspetto particolarmente delicato per questo tipo di analisi, per almeno
due motivi.
In primo luogo il fatto che il metodo di scomposizione sostanzialmente un metodo analitico,
che non si adatta molto bene ad estendersi al di fuori dell'intervallo per il quale sono disponibili i
dati. In effetti la parte sistematica di medio e lungo periodo non viene interpretata con una forma
1999$8
2000$1
2000$6
2000$11
2001$4
2001$9
2002$2
2002$7
2002$12
2003$5
2003$10
2004$3
2004$8
2005$1
2005$6
2005$11
2006$4
2006$9
2007$2
2007$7
2007$12
2008$5
2008$10
2009$3
2009$8
5500
6000
6500
7000
7500
8000
8500
funzionale specifica, bensK viene analizzata in forma numerica sulla base dell'eliminazione degli
altri fattori. In altre parole, l'applicazione di un modello di scomposizione non restituisce una
tecnica specifica per effettuare delle previsioni. Se si esegue un'analisi con un modello regressivo
che si adatta particolarmente bene ai dati, come quello preso in considerazione nel paragrafo
precedente, molto semplice effettuare una stima di quale dovrebbe essere il valore della variabile
dipendente in presenza di un valore di quella dipendente esterno all'insieme di valori che risultano
disponibili. Se invece non si ha un'equazione di riferimento, ma solo una serie di valori ottenuti per
differenza, questo non possibile, ragione per la quale in effetti c' bisogno di ulteriori strumenti
analitici per arrivare a produrre delle previsioni.
Inoltre, il fatto di utilizzare le medie mobili, come gi pi) volte sottolineato, comporta la perdita
di alcune osservazioni in testa ed in coda alla serie. 2er quello che riguarda le prime osservazioni
ottenute, questo ha un'importanza molto limitata. 3e informazioni a fine serie invece rappresentano
un problema pi) delicato. Infatti, le osservazioni che si perdono a causa dell'utilizzo delle medie
mobili, che in un modello tipico come quello che stato utilizzato fin qui come esempio, coprono
un intervallo di circa sei mesi. $ualunque sia l'intervallo di rilevazione +mensile, bimestrale,
trimestrale, quadrimestrale, semestrale,, se si suppone che la stagionalit abbia un periodo annuale,
come nella maggior parte dei casi, le osservazioni che si perdono rappresentano l'ultima met
dell'ultimo anno. Inoltre, l'utilizzo della media mobile a ! termini per l'identificazione della
componente di trend e ciclo fa perdere un'ulteriore osservazione/ in tutto, dunque, nel caso ad
esempio di dati mensili, vengono a mancare = osservazioni a fine serie.
$ueste osservazioni, pur essendo tecnicamente disponibili, non hanno contribuito al calcolo
delle componenti sistematiche della serie, quindi, se si dovessero effettuare delle 0previsioni1 +o pi)
precisamente delle 0stime1, che le riguardano, probabile che risulterebbero comunque valori
diversi da quelli osservati. Ea il vero problema che comporta questa situazione il fatto che il
primo elemento che va effettivamente previsto, quello della prima osservazione successiva
all'interruzione della serie +che poi raramente si interrompe effettivamente al tempo presente/ ad
esempio la serie degli arrivi turistici stata inizialmente interrotta con la fine di un anno solare per
ragioni di comodit nella trattazione, ma comunque, al momento di scaricarla da internet, nel
febbraio del 7'&', arrivava fino all'ottobre del 7''8/ quindi il primo valore 0previsto1 sarebbe stato
un valore che in effetti era vecchio di circa # mesi, dista 9 mesi dall'ultima osservazione
analiticamente disponibile a tutti gli effetti. In altre parole, prendendo ad esempio la serie degli
arrivi fin qui utilizzata, l'ultimo valore analiticamente disponibile utilizzato nel calcolo della
decomposizione relativo al luglio 7''9/ ad oggi, maggio 7'&', il primo valore su cui tecnicamente
si sarebbe potuto fare una 0previsione1 sarebbe stato quello al tempo presente, il che vuol dire a 77
osservazioni di distanza. (nche considerando l'intero data set a disposizione, che si conclude con
l'ottobre 7''8, i calcoli per il calcolo delle componenti sistematiche comprenderebbero i periodi
fino al febbraio 7''8/ la prima previsione effettiva, considerando stime i valori fino all'ottobre
7''8, sarebbe relativa al maggio 7'&', dunque distante &> mesi dall'ultimo valore calcolato, e
comunque 9 mesi dall'ultimo valore osservato effettivamente.
Nra, intuitivamente piuttosto naturale aspettarsi che l'accuratezza delle previsioni decada
all'aumentare dell'orizzonte temporale sul quale vengono effettuate/ chiaro che una previsione da
un mese all'altro verosimilmente molto buona, mentre una previsione su due anni ci si aspetta lo
sia molto meno. (naliticamente, inoltre, l'utilizzo di una serie pi) frequente pone in modo ancora
maggiore questo problema/ infatti, una previsione ad un anno &7 osservazioni pi) avanti se i dati
sono mensili, e solo # osservazioni pi) avanti con dati quadrimestrali. C' dunque un trade-o44 tra
l'attualit dei dati, la loro maggiore frequenza, che li rende pi) interessanti per quello che riguarda
la vita di tutti i giorni +ad esempio, la media quadrimestrale di una temperatura ha ben poco senso, e
l'accuratezza delle previsioni che permettono di effettuare all'estendersi dell'orizzonte temporale.
Inoltre, dati aggregati, come ad esempio il reddito i consumi, o quelli calcolati con elaborazioni
come la media, quali quelli degli arrivi turistici o dei prezzi, se da un lato sono molto pi)
interessanti all'aumentare la frequenza della rilevazione +l'ideale, ad esempio, sarebbe poter
analizzare la serie delle temperature giornaliere,, dall'altro, se rilevati molto frequentemente,
comportano di solito la presenza di un numero enorme di dati anomali, che, quando sono
percentualmente rilevanti, sono difficili da trattare e possono essere fuorvianti.
3'ideale per effettuare delle previsioni efficaci che componente tendenziale e ciclo siano
chiaramente identificabili. (d esempio, nella serie del consumo energetico italiano, il trend lineare
in funzione del tempo che abbiamo calcolato spiegava quasi interamente l'andamento della serie,
dal momento che aveva un 9
2
quasi unitario. Inoltre c'era una componente ciclica forse meno
evidente ma complessivamente identificabile che comportava dei lievi rallentamenti nel ritmo di
crescita ogni qualche anno e qualche sporadica diminuzione della domanda. In questo modo, se si
volesse effettuare una previsione per gli anni a venire, si otterrebbe un risultato accettabile
semplicemente estrapolando i valori lungo la retta di regressione. Se si volesse raffinare i valori
previsti, sarebbe necessario trovare un fattore di correzione per il ciclo con una procedura analoga a
quella utilizzata per scorporare le stagionalit, una volta identificata la durata media dei movimenti
ciclici.
Se i dati sono rilevati a cadenza annuale, e dunque si suppone non soffrano di variazioni
stagionali, la decomposizione nei modelli additivi e moltiplicativi comunque possibile, ma vanno
omesse tutte le parti relative all'identificazione delle stagionalit/ in altre parole, si tratterebbe
solamente di scorporare la componente d'errore. Inoltre, se una delle componenti sistematiche, trend
o ciclo, ha una forma chiaramente identificabile +come nel caso dell'analisi dei consumi energetici,,
sarebbe possibile a sua volta isolarla con procedura analoga a quanto fatto per la stima delle
componenti stagionali, per poi analizzare la componente ciclica alla ricerca di una forma funzionale
che possa a sua volta spiegarla. 4uttavia, di solito molto difficile interpolare un movimento ciclico
nei termini di una funzione elementare.
2er questa ragione, analiticamente si tende a calcolare solo la tendenza di fondo della serie.
3'analisi della componente ciclica e la sua successiva proiezione in nel futuro avvengono con
procedure basate pi) sulle prove empiriche che su tecniche statistiche consolidate. .' la ragione per
cui, quando ad esempio si sente parlare di proiezioni di serie economiche o demografiche su un
orizzonte temporale piuttosto ampio, ci si trova di fronte a diverse previsioni che divergono
significativamente/ dal momento che si parla di fenomeni complessi, su cui hanno influenza un
enorme numero di variabili pi) o meno controllabili, necessario, per fare previsioni a lunga
scadenza, intervenire con delle ipotesi piuttosto stringenti sui cicli che caratterizzano le serie in
esame. (l variare di queste ipotesi, variano in maniera enorme anche le previsioni.
6al punto di vista puramente computazionale, la previsione di trend e componenti stagionali in
realt molto semplice. Il trend viene di solito stimato con un modello di regressione con il metodo
dei minimi quadrati, di tipo lineare +come abbiamo visto in precedenza, o di potenze superiori, ad
esempio quadratiche o logaritmiche rispetto al tempo, sulla base dell'analisi dell'adattamento del
modello ai dati. $uindi il trend viene stimato calcolando i coefficienti dei seguenti modelli di
regressione/
*
t
=5
'
5
&
t 6
t , che restituisce la tipica retta di regressione*
*
t
=5
'
5
&
t 5
7
t
7
6
t .
$uesto secondo modello interpola la serie con una parabola/ quindi l'andamento di fondo della
serie viene considerato crescente ad un ritmo crescente rispetto al tempo.
3a previsione della componente tendenziale della serie viene pertanto effettuata mediante una
semplice estrapolazione dell'equazione di regressione ponendo t uguale al periodo per il quale si
vuole conoscere il valore del trend.
3a stagionalit futura ancora pi) semplice da conoscere, dal momento che, ipotizzando che le
componenti stagionali continuino a rimanere costanti nel tempo, lo stesso periodo +mese, trimestre,
quadrimestre, e via dicendo, di qualunque anno avr sempre la medesima componente stagionale
che stata calcolata nel corso della scomposizione. $uindi, il mese di dicembre di qualunque anno
avr sempre la medesima componente stagionale

,
&7 , stimata con l'opportuno modello, additivo,
moltiplicativo o misto.
Se si ha una qualche informazione sull'andamento del ciclo, quindi se si in grado di effettuare
un'interpolazione che permetta di stimare i valori attesi futuri, o se si intende procedere per
approssimazioni successive, o basandosi su stime soggettive, queste vengono a loro volta prese in
considerazione. 6opodich5, a seconda che il modello di scomposizione adottato sia di tipo additivo,
moltiplicativo o misto, si procede a calcolare i valori attesi futuri desiderati nel modo che segue/
*'
t 0
=

T
t0


C
t 0


,
0
, per il modello additivo
*'
t 0
=

T
t 0


C
t0


,
0
, per il modello moltiplicativo e misto con errore additivo
*'
t 0
=

T
t 0


C
t0


,
0
, per il modello moltiplicativo e misto con errore e stagionalit additivi.
-el calcolo delle previsioni i residui futuri, essendo questi casuali ed a media nulla, vengono
considerati nulli.
". #ncora sulla scelta del metodo di decomposizione: Il concetto di
stazionariet$ ed il modello di risposta ad impulso
(bbiamo visto che la scelta del modello di decomposizione di una serie storica riveste un ruolo
cruciale nell'analisi, soprattutto perch5 in alcuni casi uno dei modelli, in particolare come abbiamo
visto quello additivo, pu% rivelarsi inadeguato per una serie di ragioni, che coinvolgono soprattutto
la dipendenza delle variazioni cicliche e stagionali e dei termini d'errore dall'ordine di grandezza
delle serie. (bbiamo inoltre mostrato che in caso di andamento di fondo sostanzialmente costante, i
modelli approssimativamente si equivalgono, e la scelta del modello da utilizzare ricade su altre
considerazioni, a loro volta molto importanti.
Se ne pu% concludere che una serie storica con andamento tendenziale costante sia di pi) facile
analisi rispetto ad una serie che cresce o decresci sistematicamente. In effetti, pi) o meno cosK.
4uttavia, la costanza approssimativa del trend non sufficiente a rendere pi) semplice l'analisi. 3e
condizioni che rendono enormemente pi) potenti le metodologie di calcolo, soprattutto se si utilizza
un approccio diverso e basato sui cosiddetti processi stocastici, sono un po' pi) complicate, e vanno
sotto il nome di stazionariet.
In estrema sintesi, una serie storica si dice stazionaria se stabile nel corso del tempo. 2i) in
dettaglio, una serie stazionaria se l'andamento di fondo orizzontale e le misure di variabilit non
dipendono dal tempo. $uindi una serie stazionaria ha sempre la stessa media e la stessa varianza,
indipendentemente dalle osservazioni che vengono prese in considerazione* c' una terza
condizione, che riguarda l'interdipendenza tra osservazioni diverse/ in pratica, se si analizza il
rapporto di dipendenza tra due osservazioni che distano lo stesso periodo, anche questo rapporto di
dipendenza deve essere indipendente dal tempo. In alte parole, se si vuole analizzare in che tipo di
rapporto sono due osservazioni destagionalizzate che distano &7 mesi, questo rapporto deve essere
mediamente lo stesso, indipendentemente dai due anni che vengono presi in considerazione, e deve
dipendere solo ed esclusivamente dal fatto che le due osservazioni distano &7 mesi l'uno dall'altro.
Hormalmente, e sinteticamente, una serie storica stazionaria se/
&. 3a sua media indipendente dal tempo ed sempre pari a =*
7. 3a sua varianza indipendente dal tempo ed sempre pari a >
2
;
!. 3e covarianze tra periodi distanti 0 osservazioni non dipendono dal tempo, ma solo
dall'intervallo tra le stesse, 0 e sono sempre pari a >
0
/ >
t) t-0
@ >
0
*
Una serie stazionaria, dunque, in cui la media e la varianza sono indipendenti dal tempo, non
soffre del problema principale per cui il modello additivo non pu% essere utilizzato, ossia la
dipendenza delle variazioni cicliche e stagionali dal livello della serie. Infatti, se il livello della serie
sempre lo stesso, le variazioni, anche qualora fossero effettivamente dipendenti da quest'ultimo a
livello strutturale, avranno portata complessivamente sempre analoga.
4uttavia, quasi nessuna delle serie fin qui analizzate pu% considerarsi stazionaria. 3a prima serie
portata ad esempio, quella dell'andamento demografico della popolazione italiana, non solo non ha
media costante/ ad una prima analisi, si nota come non sia costante neanche il trend. Infatti, da un
certo punto in avanti, la serie da praticamente orizzontale diventa improvvisamente crescente. Si
gi discusso dei probabili motivi di questa situazione* nondimeno, se si volesse analizzare la serie
su tutto il periodo in cui disponibile, non si potrebbe ignorare il fatto che la sua media non
costante. 3a serie del consumo annuale italiano di energia elettrica nel periodo &8<!"7''= a sua
volta non stazionaria, perch5 ha un trend evidentemente crescente/ quindi il livello della serie
dipende dal tempo, dunque la stazionariet esclusa. Si noti tuttavia che, eliminando gli effetti
dell'andamento di fondo, le altre caratteristiche richieste dalla stazionariet potrebbero benissimo
essere verificate, dal momento che, ad esempio, non sembra che la variabilit della serie vari
significativamente nel tempo. 3a serie degli arrivi mensili totali negli esercizi italiani ha a sua volta
un andamento chiaramente crescente, ed inoltre la variabilit dipende dal suo livello generale, e
dunque, indirettamente, dal tempo.
3o stesso vale per la maggior parte delle serie di cui si sente parlare solitamente, in particolare
per la serie del 2I3 e la serie dei consumi. In entrambi i casi, l'andamento crescente le rende non
stazionarie. 3a non stazionariet in media complessivamente il caso pi) frequente di non
stazionariet, dal momento che parecchie serie che si interessati ad analizzare hanno un
andamento di fondo che non costante. (nche la non stazionariet in varianza si presenta in modo
relativamente frequente.
.' possibile trasformare una serie non stazionaria in una serie stazionaria 3a risposta ,
ovviamente, sK. Gediamo prima come possibile eliminare la dipendenza della media della serie dal
tempo +non stazionariet in media,.
I metodi sono sostanzialmente due. Il primo consiste nel sottrarre ai valori della serie i rispettivi
valori assunti dal trend, opportunamente calcolati con un modello di regressione* il secondo consiste
nel differenziare la serie.
(bbiamo visto in precedenza come ottenere i parametri del modello di regressione nel caso di
una serie storica. In caso il modello presenti un trend lineare, crescente o decrescente, la retta di
regressione sar pari a/
*
t
=5
'
5
&
t u
t
$uello a cui siamo interessati in questa sede il solo fattore 5
&
t, che rappresenta la componente
tendenziale che siamo interessati ad eliminare. 3a serie de"trendizzata in questo modo sar pertanto/
*Q
t
@ *
t
A 5
&
t
Il valore 5
'
non viene considerato. Se infatti necessario, per ottenere stazionariet in media,
eliminare gli effetti del trend, non necessario modificare la media della serie. Se si sottrae anche 5
'
alla serie originaria si ottiene una serie stazionaria in media e con media nulla. -ulla vieta che la
media di una serie stazionaria sia diversa da zero.
Consideriamo il caso portato ad esempio nei paragrafi precedenti, quello della serie degli arrivi
mensili, stavolta sull'intero periodo di osservazione, che va dal gennaio del &88' all'ottobre del
7''8. (ggiungiamo un'altra serie, del tutto analoga e sullo stesso periodo di osservazione, relativa
non agli arrivi, ma alle presenze mensili medie in tutte le strutture ricettive italiane. I due time plot
risultanti dall'applicazione del modello misto su entrambe le serie, sono riportati in figura =.&.
3e due rette di regressione, che nei rispettivi grafici appaiono in arancione, sono/
*
t
@ #<!!,& J &>,#&t J u
t
, per la serie delle presenze*
*
t
@ 7'&'',! J >>,7#t J u
t
, per la serie degli arrivi.
3e due serie storiche de"trendizzate si ottengono pertanto con le seguenti trasformazioni/
*Q
t
@ *
t
A &>,#&t, per la serie delle presenze*
*Q
t
@ *
t
A >>,7#t, per la serie degli arrivi.
Fig. &.1: Time plot dei (alori di trend e ilo ottenuti mediante modello misto delle serie stori#e
degli arri(i <gra4io a sinistra: e delle presenze <gra4io a destra: mensili negli eserizi rietti(i
italiani nel periodo 1990-2009.
I grafici delle due serie destagionalizzate con la procedura del modello misto e rese stazionarie in
media con questa procedura sono riportati nella seguente figura =.7.
Fig. &.2: Time plot dei (alori di trend e ilo ottenuti mediante modello misto delle serie stori#e
degli arri(i <gra4io a sinistra: e delle presenze <gra4io a destra: mensili negli eserizi rietti(i
italiani nel periodo 1990-2009 de-trendizzate per sottrazione del (alore del trend
Con questa trasformazione, tra l'altro, possibile apprezzare in modo molto pi) netto ed evidente
gli effetti dei cicli/ si nota in effetti che in entrambe le serie c' stato un periodo negativo agli inizi
degli anni novanta, che stato seguito da una situazione di valori intorno alla media, e poi ad una
nuova fase di presenza turistica complessivamente scarsa verso la fine del decennio*
successivamente, c' stata una brusca ripresa, degli arrivi, ma ancor pi) delle presenze, seguita poi
da un calo in corrispondenza con il mese di settembre del 7''&, che ha avuto un'influenza
1990$8
1992$4
1993$12
1995$8
1997$4
1998$12
2000$8
2002$4
2003$12
2005$8
2007$4
2008$12
4000
4500
5000
5500
6000
6500
7000
7500
8000
8500
1990$8
1992$4
1993$12
1995$8
1997$4
1998$12
2000$8
2002$4
2003$12
2005$8
2007$4
2008$12
15000
17500
20000
22500
25000
27500
30000
32500
35000
1990$8
1992$2
1993$8
1995$2
1996$8
1998$2
1999$8
2001$2
2002$8
2004$2
2005$8
2007$2
2008$8
3500
3750
4000
4250
4500
4750
5000
5250
5500
1990$8
1992$4
1993$12
1995$8
1997$4
1998$12
2000$8
2002$4
2003$12
2005$8
2007$4
2008$12
15000
17500
20000
22500
25000
soprattutto sugli arrivi. In seguito, gli arrivi sono tornati a salire, anche se in modo discontinuo,
nella seconda met del decennio +le presenze invece non hanno evidenziato questa crescita, il che
porta a concludere che i soggiorni sono stati mediamente pi) brevi che in precedenza,. -ell'ultimo
anno e mezzo, si assistito ad un tracollo di arrivi e presenze, verosimilmente in relazione alla crisi
economico"finanziaria che ha investito il nostro paese cosK come il resto del mondo.
2assiamo ora alla de"trendizzazione mediante differenza/ si tratta semplicemente di sottrarre
all'osservazione corrente della serie in esame l'osservazione immediatamente precedente/
*Q
t
@ *
t
A *
t?&
.
2er le due medesime serie degli arrivi e delle presenze di turisti sul territorio italiano nel periodo
&98>"7''9, , vediamo che succede con questa procedura di de"trendizzazione/ i due grafici sono
riportati nella seguente figura =.!.
Fig. &.%: Time plot dei (alori di trend e ilo ottenuti mediante modello misto delle serie stori#e
degli arri(i <gra4io a sinistra: e delle presenze <gra4io a destra: mensili negli eserizi rietti(i
italiani nel periodo 1990-2009 de-trendizzate per di44erenziazione della serie
Con questa procedura di de"trendizzazione si nota in modo molto chiaro che diventa impossibile
anche identificare i movimenti ciclici/ non si apprezza nessuna particolare ciclicit, di nessun
periodo, in nessuna delle due serie. $uesto perch5 la presenza di cicli ha ben poca influenza sulle
singole osservazioni, che dunque differiscono da quelle immediatamente precedenti e successive
approssimativamente sempre nello stesso modo. 3'unica cosa sulla quale ci si concentra la serie
delle differenza tra due valori consecutivi della serie originaria. $uesto permette anche di verificare
l'eventuale presenza di una non stazionariet in varianza/ infatti, se la varianza della serie dipende
dal tempo, si avr che la serie delle differenze avr ampiezza sistematicamente diversa in settori
differenti del grafico. Se ad esempio si suppone che la varianza cresca al passare del tempo, le
differenze tra due valori consecutivi della serie tenderanno a crescere col passare del tempo/ questo
perch5 una varianza maggiore significa una maggiore variabilit tra i singoli valori della serie. In
questo caso, le due serie sembrano mostrare oscillazioni pi) ampie nella seconda parte del periodo
considerato +in particolare, la variabilit si accentua col passare del tempo,, il che, come gi
anticipato in precedenza in relazione all'analisi del time plot risultante dal modello misto, potrebbe
indicare la presenza di non stazionariet in varianza.
$uesta differenziazione degli effetti della de"trendizzazione di per s5 un criterio per stabilire
quale delle due procedure preferibile adottare. Se si vuole analizzare gli effetti dei cicli e delle
variazioni di breve e medio periodo, come nel caso della climatologia, si elimineranno gli effetti del
trend sottraendo ai valori della serie quelli assunti dalla variazione tendenziale. Se invece si intende
concentrare l'attenzione sulla variabilit della serie nel brevissimo periodo, come ad esempio nelle
analisi delle serie finanziarie per valutare le variazioni dei prezzi delle azioni da un'ora all'altra, la
serie sar de"trendizzata mediante differenziazione.
4uttavia, c' un altro criterio per stabilire quale delle due procedure sia la pi) adatta. Si tratta di
1990$9
1992$3
1993$9
1995$3
1996$9
1998$3
1999$9
2001$3
2002$9
2004$3
2005$9
2007$3
2008$9
#600
#400
#200
0
200
400
600
1990$9
1992$5
1994$1
1995$9
1997$5
1999$1
2000$9
2002$5
2004$1
2005$9
2007$5
2009$1
#2500
#2000
#1500
#1000
#500
0
500
1000
1500
2000
un criterio empirico, che per% ha a che fare con la struttura di fondo della serie, e non con gli utilizzi
pratici che si intende fare dei dati/ la cosiddetta 0risposta ad impulso1.
Immaginiamo che la serie subisca uno shocC esterno. Si pensi ad esempio ad una serie ed ad un
intervento dall'esterno, detto 0esogeno1, che abbia una grossa influenza su di essa/ ad esempio gli
attentati dell'&& settembre 7''&, come abbiamo gi detto, hanno avuto un impatto enorme sulla serie
del reddito e dei consumi a livello mondiale, in particolare negli Stati Uniti, sia per i soldi che sono
0costati1 ai vari sistemi, in particolare il paese colpito, gli US(, sia per il panico che hanno
scatenato. Golendo far riferimento a shocC che possono verificarsi con una frequenza pi)
controllata, un intervento di politica fiscale +riduzione od aumento delle tasse, un tipico esempio
di shocC esogeno. In teoria economica, un intervento di politica fiscale 0espansiva1 si ha quando le
tasse vengono diminuite/ in questo modo, visto che la gente paga meno tasse e la spesa pubblica
rimane invariata +cio lo stato taglia le tasse senza tagliare i fondi alla scuola o alla ricerca,, lo stato
si indebita e la popolazione ha pi) soldi a disposizione. In questo modo, si stimola la domanda,
perch5 si suppone che la gente user almeno una parte di quei soldi per comprare beni. $uesto ha
un effetto positivo sull'economia, perch5, appunto, c' un aumento dei consumi che devono essere
soddisfatti dal sistema produttivo, che dunque deve accelerare la produzione. Una politica fiscale
espansiva infatti una delle prime cose che si tentano di mettere in atto quando ci si trova in una
congiuntura economica sfavorevole/ di solito, una misura largamente insufficiente per una serie di
ragioni che non verranno approfondite in questa sede.
4rattandosi di una misura messa in atto dal governo del paese, e dunque non dal sistema
produttivo che genera reddito, nella serie del 2I3 una improvvisa immissione di soldi nel sistema
economico attraverso un taglio delle tasse uno shocC esogeno.
3a risposta della serie a questo shocC pu% essere di due tipi/ questo shocC pu% spostare in
maniera sistematica il livello del trend dei 2I3 del paese, che da quel momento in avanti tender ad
un nuovo livello +nel caso di politica fiscale espansiva, questo livello sar pi) alto,, e pu% non farlo,
limitando i propri effetti a cambiamenti di breve periodo, che per% non cambiano la struttura
sottostante. -el primo caso si parla di 0shocC permanente1, nel secondo di 0shocC transitorio1.
$ueste due situazioni sono presentate graficamente nella figura =.#.
In entrambi i casi dell'esempio, ad un certo punto c' uno shocC improvviso che spinge la serie
verso l'alto. -el primo, tuttavia, la serie si attesta su un nuovo livello, pi) alto del precedente, anche
se col medesimo coefficiente angolare* nel secondo, invece, la serie lentamente torna al suo livello
precedente. $uindi nel primo caso lo shocC permanente, nel secondo transitorio.
Fig. &.3: Time plot di una serie on s#o0 permanenti <a sinistra: e di una serie on s#o0
transitori <a destra:
.ffettuare un'interpolazione della serie a shocC permanenti per trovare il miglior trend lineare col
metodo dei minimi quadrati, porterebbe ad un risultato inesatto/ infatti, per effetto della presenza
distorsiva dello shocC, che da un certo punto in avanti sposta la serie verso l'alto, il coefficiente
angolare della retta, che nelle interpolazioni unico, risulterebbe sovra"stimato. In altre parole, il
metodo dei minimi quadrati restituirebbe come migliore interpolazione dei dati, e dunque migliore
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
50
60
70
80
90
100
1
3
5
7
9
11
13
15
17
19
21
23
25
27
29
31
33
35
37
39
41
43
50
60
70
80
90
100
stima dell'andamento tendenziale, una retta con pendenza troppo ripida, in conseguenza dello
spostamento di livello. -el caso di shocC transitori, invece, soprattutto se la serie consta di un
numero di osservazioni sufficientemente elevato, questo problema non sussiste.
3e serie risultanti dalla de"trendizzazione per sottrazione del valore corrente del trend e per
differenziazione sono riportate rispettivamente nel grafico destro e sinistro della seguente figura =.>.
-ella successiva figura =.< sono riportate i medesimi grafici per la serie caratterizzata da shocC
transitorio.
$uindi le procedure per rendere la serie stazionaria in media differiscono a seconda che la serie
sia caratterizzata da shocC permanenti o transitori/ se gli shocC sono permanenti la differenziazione
ottiene risultati migliori. Infatti il cambiamento di livello della serie verrebbe nelle differenze
registrato come una osservazione particolarmente elevata, che per% non comporta particolari
conseguenze.
Se gli shocC sono transitori, invece, per de"trendizzare la serie si pu% tranquillamente usare la
sottrazione dei valori correnti del trend alla serie originaria, che considerata pi) adeguata proprio
per il fatto che la retta che rappresenta l'andamento di fondo della serie rimane la stessa.
Fig. &.7: ,erie on s#o0 permanente de-trendizzata per sottrazione del (alore orrente del trend
<a sinistra: e per di44erenziazione <a destra:
Fig. &.$: ,erie on s#o0 transitorio de-trendizzata per sottrazione del (alore orrente del trend
<a sinistra: e per di44erenziazione <a destra:
2er questa ragione, una serie caratterizzata da shocC transitori detta 0trend stationar*1 +cio
stazionaria rispetto al trend, e viene indicata con la sigla 4S, mentre una serie caratterizzata da
shocC permanenti detta 0di44erene stationar*1 +cio stazionaria rispetto alle differenze,, e viene
indicata con la sigla 6S.
Nra, nelle serie economiche facilissimo individuare i punti critici nei quali sono intervenuti
degli shocC esogeni/ gli interventi di politica fiscale o monetaria si sa benissimo quando vengono
promulgati* allo stesso modo, possibile individuare eventi che hanno avuto effetti traumatici
1
3
5
7
9
11
13
15
17
19
21
23
25
27
29
31
33
35
37
39
41
43
#10
#5
0
5
10
15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
#4
#2
0
2
4
6
8
10
12
14
16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
#10
#5
0
5
10
15
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
#10
#5
0
5
10
15
sull'economia +ad esempio i gi citati attentati del settembre 7''&, o magari il martedK nero delle
borse dell'ottobre del &878, o il fallimento della 3ehman Drothers nel settembre del 7''9, senza
nessun problema. 3o stesso vale, perch5 il turismo un fenomeno economico, per le serie come
quelle che stiamo seguendo a titolo esemplificativo, ossia le serie di presenze ed arrivi su un
territorio. 6a un'analisi grafica dei rispettivi time plot riportati in figura 9.&, si evince ad esempio
che gli attentati del settembre 7''& non hanno comportato lo spostamento verso il basso di nessuna
delle due serie, quindi, almeno in relazione al periodo osservato, le due serie sembrerebbero essere
di tipo trend stationar*. (bbiamo visto, inoltre, che la crisi iniziata nel settembre 7''9 ha
comportato un significativo abbassamento degli arrivi e delle presenze di turisti sul territorio
italiano. Se questo nuovo shocC esogeno sar riassorbito o determiner uno spostamento del livello
della serie, tuttavia, lo sapremo solo col tempo.
Se la serie non stazionaria in varianza, invece, ossia presenta una variabilit dipendente dal
tempo, esistono diverse procedure per trasformarla in modo da risolvere questo problema. 3a
trasformazione pi) utilizzata si basa sulla procedura di DoI e CoI.
In pratica, si tratta di suddividere la serie in una decina sotto"serie pi) piccole, tutte della stessa
lunghezza approssimativa. Se il numero di osservazioni insufficiente per una suddivisione in &'
sotto"serie significative, il numero di sotto"serie viene ridotto. Si noti che si tratta di una procedura
artificiosa che non include l'analisi delle sotto"serie con procedure di scomposizione, un passaggio
puramente strumentale. $uindi auspicabile che le sotto"serie siano composte da un numero
rilevante di elementi, ma non necessario che constino di centinaia di osservazioni.
6opo aver costruito le sotto"serie, per ognuna di esse si calcolano media e scostamento
quadratico medio. 6opodich5 si inseriscono i valori ottenuti in un grafico a dispersione, come se si
volesse valutare la dipendenza dello scarto quadratico medio dalla media, e si verifica come si
dispongono i punti. ( seconda di come si dispongono i punti, si prende il corrispettivo valore di @,
come illustrato nel grafico di figura =.=. $uindi, se i valori dello scostamento quadratico medio si
posizionano lungo una linea orizzontale, si pone @ @ &* se i valori di R si dispongono lungo una retta
crescente, si pone @ @ '* se invece i due valori evidenziano una relazione lineare decrescente, si
pone @ @ "&* e via dicendo +vedi fig. =.=,.
Fig. &.&: 'ssegnazione del (alore di @ nella proedura di Ao2 e Co2
Una volta assegnato l'adeguato valore a S, si operer la seguente trasformazione/
z
t
@ +*
t
S
? &, ? T@B, se @ diverso da '* T@B indica il valore assoluto di @.
z
t
@ log *
t
, se @ @ '.
$uindi, ad esempio, se @ @ & la trasformazione neutra. In questo caso, infatti, quale che sia il
valore della media della sotto"serie, il valore dello scarto quadratico medio approssimativamente
sempre lo stesso/ si tratta esattamente della definizione di stazionariet in varianza.
3a serie z
t
quella che verr analizzata, in quanto questa trasformazione assicura la stazionariet
in varianza.
Fig. &.8: 'ssegnazione del (alore di @ nella proedura di Ao2 e Co2 per la serie degli arri(i in
Italia nel periodo 1990-2009
-ella figura =.9 sono riportati i valori di media e scarto quadratico medio calcolati su 9 sotto"
serie di ampiezza costante in relazione ai dati delle temperature di -e: MorC in un diagramma a
dispersione. Come si vede, e come avevamo anticipato in precedenza, i valori non si allineano lungo
una linea orizzontale, quindi la serie non stazionaria in varianza +come gi detto, se @+&, la
procedura di trasformazione di DoI e CoI lascia la serie invariata,/ necessario calcolare la nuova
serie. Con l'eccezione del secondo e del quarto valore da sinistra, i punti sembrano disporsi lungo
una traiettoria parabolica, che suggerisce una trasformazione con @@"&?7. 4uttavia, a causa di detti
valori anomali, la migliore interpretazione dell'andamento potrebbe anche essere una retta
crescente, che prevede la trasformazione con @@'. 2urtroppo situazioni come questa, in cui la
trasformazione necessaria a rendere la serie stazionaria in varianza non chiaramente identificabile,
si verificano di frequente. In linea generale, tuttavia, la scelta di un valore di @ piuttosto di un altro
non cosK decisiva/ se c' un dubbio, si possono scegliere entrambe le soluzioni. Inoltre, sempre
possibile verificare se la nuova serie, ottenuta con la trasformazione, stazionaria in varianza.
-el primo caso, ogni valore della serie originaria dovr essere trasformato secondo la seguente
formula/
z
t
=

*
t
&
&
&/ 7
=7
&

*
t
& .
-el secondo caso, invece, ogni valore della serie originaria dovr essere sostituito con il suo
logaritmo.
-ella figura =.8 sono riportati i time plot delle due serie, delle presenze e degli arrivi mensili in
tutti gli esercizi italiani nel periodo &88'"7''9, rese stazionarie in varianza attraverso la procedura
4500 5000 5500 6000 6500 7000 7500 8000 8500
100
150
200
250
300
350
di DoI e CoI con @@', quindi con la trasformata logaritmica. -ella successiva figura =.&' sono
riportate le medesime serie de"trendizzate mediante sottrazione del valore del trend. Come si vede,
la variabilit della serie intorno alla retta interpolante che determina l'andamento di fondo delle
stesse, adesso molto pi) omogenea. Si noti tuttavia che i brevi movimenti ciclici di durata annuale
all'inizio della serie che erano stati identificati in precedenza, sono complessivamente attenuati +di
modo che diviene evidente che non si tratta di fluttuazioni dovute ad una stima errata della
componente stagionale,, ma ancora presenti.
Fig. &.9: Time plot dei (alori di trend e ilo ottenuti mediante modello misto delle serie stori#e
degli arri(i <gra4io a sinistra: e delle presenze <gra4io a destra: mensili negli eserizi rietti(i
italiani nel periodo 1990-2009) resa stazionaria in (arianza.
Fig. &.10: Time plot dei (alori di trend e ilo ottenuti mediante modello misto delle serie in
4igura &.9) de-trendizzate per sottrazione del (alore del trend
$uando si compie una trasformazione come questa, i dati cambiano di unit di misura/ si passa
dal valore osservato al suo logaritmo. Infatti, come si vede dai grafici, sottraendo il valore del trend
le serie si oscillano rispettivamente intorno ai valori 9,#9 e 8,8! +si ricorda che i dati originari sono
in migliaia di unit,, mentre quelle non trasformate oscillano attorno, rispettivamente, a #<>' ed a
7'&<'. 4uttavia, questo tipo di trasformazioni non modifica il comportamento strutturale della serie.
Una propriet dell'algebra assicura infatti che se la trasformazione 0monot%na1, ossia agisce
sempre nella stessa direzione per tutti i dati, questi non cambiano strutturalmente, e dunque lecita.
$uando una serie stazionaria in media ed in varianza solitamente stazionaria anche in
covarianza. 3a non stazionariet in covarianza solitamente legata alla presenza di cicli di durata ed
intensit variabile. Infatti, ad esempio, serie che possono soffrire di non stazionariet in covarianza
sono quelle legate all'analisi dei fenomeni climatici. In questa sede, dunque, non ci si occuper delle
metodologie per rendere stazionaria in covarianza una serie storica che presenta questo problema
anche dopo esser stata resa stazionaria sia in media che in varianza.
1990$8
1992$2
1993$8
1995$2
1996$8
1998$2
1999$8
2001$2
2002$8
2004$2
2005$8
2007$2
2008$8
9"8
9"9
10
10"1
10"2
10"3
10"4
10"5
1990$8
1992$4
1993$12
1995$8
1997$4
1998$12
2000$8
2002$4
2003$12
2005$8
2007$4
2008$12
9"75
9"8
9"85
9"9
9"95
10
10"05
1990$8
1992$2
1993$8
1995$2
1996$8
1998$2
1999$8
2001$2
2002$8
2004$2
2005$8
2007$2
2008$8
8"4
8"5
8"6
8"7
8"8
8"9
9
9"1
1990$8
1992$2
1993$8
1995$2
1996$8
1998$2
1999$8
2001$2
2002$8
2004$2
2005$8
2007$2
2008$8
8"25
8"3
8"35
8"4
8"45
8"5
8"55
8"6