Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Marco Piemontese
890876
3 Conclusioni 20
Riferimenti bibliograci 20
2
1 Introduzione
Questo elaborato si basa su un'analisi sulla variazione dell'indice IPCA
1 in Italia
1) Come è variato l'indice IPCA negli ultimi venti anni in Italia (con riferi-
COICOP)?
2) Data una categoria di prodotto, come sono cambiati i prezzi delle sotto-
COVID-19 )?
Utilizzando un dataset con circa 250 osservazioni, dal 2001 al 2021, ho voluto
destinati al consumo nale delle famiglie. Gli indici dei prezzi al consumo sono
calcolati utilizzando l'indice di Laspeyres in cui sia il paniere sia il sistema dei
(IPCA)
1 L'IPCA (Indice dei Prezzi al Consumo Armonizzato tra i paesi europei) è uno dei tre
indici, insieme al NIC e al FOI, utilizzati in Italia dall'Istat per studiare l'andamento dei
prezzi al consumo.
3
I tre indici hanno nalità dierenti: il NIC è utilizzato come misura dell'ina-
ti, viene assunto come indicatore per vericare la convergenza delle economie
degli altri due, che considerano il prezzo pieno di vendita. Ad esempio, nel caso
Inoltre, l'indice IPCA tiene conto anche delle riduzioni temporanee di prezzo,
Contiene 2 842 945 osservazioni dal 1996 no al 2021, che rappresentano le varia-
zioni percentuali mensili dell'indice IPCA, o HICP nella versione inglese (Har-
una riguardante i prodotti tecnologici (dati i notevoli sviluppi negli ultimi venti
bevande analcoliche.
comunicazione.
2 https://ec.europa.eu/eurostat/web/products-datasets/-/prc_hicp_mmor
3 La classicazione C.O.I.CO.P. (Classication of Individual Consumption by Purpose) è
una classicazione dei consumi messa a punto dalla Divisione Statistica delle Nazioni Unite.
Il primo livello della classicazione dei prodotti considera 12 divisioni di spesa, il secondo è
costituito da 43 gruppi di prodotto e il terzo è formato da 102 classi di prodotto.
4
2 Analisi delle serie storiche
2.1 Gestione Dataset
Innanzitutto, ho importato su R il dataset "prc_hicp_mmor_linear.csv" (do-
Delle nove variabili, infatti, le uniche rilevanti ai ni dell'analisi sono "coicop"
(che indica la classicazione dei prodotti), "geo" (che indica il Paese di rife-
trassegnate con le sigle dei prodotti di interesse (cioè CP011, CP06, CP08 e
righe a colonne in modo da avere tre variabili come colonne, con il comando:
Da questi risultati si può notare che le variazioni percentuali mensili dei prezzi
dei generi alimentari e della sanità hanno una variabilità minore di quelle dei
prodotti tecnologici; ma il dato più rilevante è che i prezzi dei prodotti e dei
5
servizi di informazione e comunicazione siano diminuiti negli ultimi venti anni,
come si deduce dalla media delle variazioni pari a -0.285%. Questa diminuizione
potrebbe essere dovuta al fatto che venti anni fa, nei primi anni duemila, i servizi
Per quanto riguarda le altre due variabili, si può vedere che la media delle
per la sanità; quindi possiamo dedurre che i prezzi di queste due categorie di
storica di interesse. Per esempio, si può facilmente vedere quali sono stati i tassi
I graci seguenti mostrano la distribuzione dei dati per ogni variabile attraverso
curva di densità dei dati e in viola la densità di una distribuzione normale, per
Dalle distribuzioni si può vedere, per esempio, che la variabile Health presenta la
maggior parte delle variazioni prossime allo zero ed ha uno scarto interquartile
estremamente piccolo. Inoltre si può notare dal boxplot della variabile Food la
presenza di pochi outliers; di conseguenza si può dire che, in Italia, negli ultimi
6
vent'anni, non ci sono stati grossi valori anomali nei tassi di variazione mensili
7
quanto è variato in percentuale il prezzo dei generi alimentari in Italia rispetto al
mese precedente. Questo vuol dire che se a gennaio 2001 si registra un aumento dello
0.4% e a febbraio 2001 si registra una diminuizione dello 0.4%, in questi due mesi la
variazione è stata del -0.0016% (data dal prodotto tra -0.4% e 0.4%). Risulta quindi
dicile interpretare l'andamento dei prezzi veri e propri.
Tuttavia, dalle serie storiche delle variazioni di prezzo, del dataset originale di Eurostat,
è possibile ricavare le serie storiche dei valori dei prezzi. Infatti queste due grandezze
sono legate dalla seguente relazione: x1x−x 0
0
= v1 , dove x1 e x0 sono rispettivamente i
valori al tempo 1 e al tempo 0, e v1 è la variazione percentuale tra i due periodi.
Di conseguenza, disponendo del valore x0 è possibile ottenere il valore x1 , attraverso
la formula x1 = v1 · x0 + x0 .
Per esempio, il primo valore della serie Food è 0.4, questo vuol dire che nel primo mese
il prezzo dei generi alimentari è aumentato dello 0.4%. Quindi, prendendo x0 uguale
a 1 per semplicità, il valore successivo sarà uguale a 1.004.
Così facendo, ho ottenuto la serie storica dei valori di prezzo applicando quest'ultima
formula attraverso un ciclo for (utilizzando in questo esempio la variabile Food ):
pw_food <- numeric(253)
pw_food[1] <- 1
for(i in 1:252){pw_food[i+1] <- (y_food[i]/100)*pw_food[i] + pw_food[i]}
pw_food <- round(pw_food[-1],4)
pw_food <- ts(pw_food,start=c(2001,01,01),end=c(2021,12,01),frequency=12)
Di seguito, le rappresentazioni grache delle tre diverse serie storiche dei valori dei
prezzi, prendendo il primo valore uguale a 1.
8
Si può notare (come già si deduceva dalla media delle variabili Food, Health e Techno-
logy ) che i prezzi dei generi alimentari e della sanità sono aumentati, mentre i prezzi
Generi alimentari La prima cosa che salta all'occhio osservando la serie storica è
un forte trend positivo per tutto il ventennio, ed è l'unica componente assolutamente
visibile ad "occhio nudo", a dierenza di una eventuale stagionalità.
Inoltre è possibile notare che nel primo decennio le variazioni non subiscono grossi
cambi repentini, a dierenza del periodo 2011-2021. Questo si riette sulla serie storica
dei valori, dove l'instabilità delle variazioni tra un mese e l'altro genera una serie molto
più "ruvida".
Guardando le due serie, e considerando gli eventi cruciali di questo ultimo ventennio,
è interessante notare che tra la ne del 2007 e l'inizio del 2008 si è vericato un ra-
pido aumento del prezzo; difatti, le variazioni percentuali dell'anno 2008 sono tutte
positive. Questo aumento è probabilmente dovuto alla crisi nanziaria statunitense di
alcuni mesi prima, che ha poi inuenzato altri settori dell'economia reale mondiale ed
ha causato un crollo della ducia nei consumatori.
Inoltre, dopo un periodo di stabilità negli anni 2009-2010, inizia una fase più "tur-
bolenta" che dà inizio ad un trend in continua crescita che dura no ad oggi. Una
possibile causa di questa tendenza è la crisi dei debiti sovrani che ha colpito l'italia a
partire dal 2011. Per quanto riguarda la crisi da COVID-19 degli ultimi anni, il settore
dei generi alimentari non sembra aver accusato l'eetto della pandemia, mantendo il
trend in continua crescita.
9
Sanità Anche in questo caso, non si può parlare di stagionalità della serie; è invece
assolutamente visibile un forte trend continuo crescente che, in alcuni periodi, sembra
essersi stabilizzato. Inoltre è interessante capire se e come un particolare evento abbia
provocato un lieve shock permanente, visibile nella serie in corrispondenza del 2011.
Da queste due serie storiche si può notare una certa stabilità nelle variazioni percen-
tuali, la cui curva sembra quasi piatta ad eccezione di qualche valore anomalo. Questo
si riette sulla serie storica dei valori, che è molto "liscia" e abbastanza lineare. Inol-
tre è interessante notare che dal 2012 al 2021 la crescita dei prezzi ha cominciato a
rallentare notevolmente.
A cavallo del 2007 e nell'agosto del 2011, si possono notare dei cambi repentini, dovuti
a improvvisi valori anomali nella serie delle variazioni. Più precisamente, a febbraio
2007 si è vericato un aumento percentuale del 3.0% e ad agosto dello stesso anno una
riduzione del -1.8%; ad agosto del 2011, invece, si è registrato un aumento del 4.0%.
Quest'ultimo aumento repentino, in corrispondenza di agosto 2011, è probabilmente
dovuto all'introduzione, in molte regioni italiane, di una quota ssa di 10 euro per i
ticket sulla diagnostica (esami e visite specialistiche) per eetto della legge nanziaria
del mese precedente. Inoltre, è interessante notare un leggero trend decrescente sola-
mente per i mesi da febbraio a settembre del 2020; quindi è verosimile pensare che il
diondersi della pandemia da COVID-19 abbia in qualche modo inuenzato i prezzi
dei servizi sanitari.
10
Inoltre è possibile individuare un'improvvisa riduzione, dovuta ad una variazione ne-
gativa del -6.7% nel solo mese di marzo del 2007. È interessante notare che a gennaio
2007 sono state introdotte due importanti novità nel mondo della tecnologia: il 9 gen-
naio Apple presenta il primo Iphone e il 16 gennaio Netix annuncia lo streaming.
Questi due avvenimenti possono quindi aver inuenzato l'andamento dei prezzi degli
altri prodotti tecnologici concorrenti.
Inoltre, un'altra causa possibile è il decreto legge del 31 gennaio 2007 che emana nuo-
ve norme in materia di trasparenza delle condizioni economiche relative alle oerte
tariarie degli operatori della telefonia.
sponde a pane, cereali, pasta, riso e simili ), la classe CP0121 (cioè caè, tè e
cacao), la classe CP0112 (carne e derivati) e la classe CP0117 (verdure e ortaggi).
Per la variabile Healthsono stati presi: il gruppo di prodotti CP061 (prodotti
medicinali, attrezzature ed apparecchi terapeutici), il gruppo CP062 (servizi
ambulatoriali) e il gruppo CP063 (servizi ospedalieri).
Per la variabile Technology, sono stati presi: il gruppo CP082 (apparecchiature
11
sottocategoria con quello dei prodotti e dei servizi di comunicazione considerati nella
variabile Technology.
Dai graci si può notare che le sottocategorie dei generi alimentari hanno registrato un
aumento più o meno simile in termini numerici di crescita. In particolare, la serie della
classe CP0117 dei prezzi di verdure e ortaggi ha un andamento molto più "altalenante"
rispetto alle altre, anche se comunque il trend crescente è evidente in tutte le classi di
prodotto.
Per la sanità, si può facilmente notare una somiglianza della serie della classe CP062
con la serie della categoria generale CP06; si può quindi pensare che l'introduzione dei
ticket della legge nanziaria del 2011 abbia inuenzato solamente i prezzi dei servizi
ambulatoriali. La stessa serie, inoltre, è l'unica delle tre che sembra avere una essione
negativa in corrispondenza del 2020. Le altre invece sembrano seguire, in maniera più
o meno lineare, la tendenza crescente.
Riguardo alla variabile Technology, si nota innanzitutto un'enorme dierenza tra la
serie delle apparecchiature e quella dei servizi, la prima infatti attraversa una discesa
molto ripida con una variazione media del -0.9655% ogni mese. In particolare, la serie
storica dei servizi di informazione e comunicazione è caratterizzata dal lieve break-
strutturale permanente di marzo 2007, accennato prima.
Inne, la serie delle apparecchiature per l'elaborazione di informazioni attraversa una
discesa ripida e continua simile alla serie della classe CP082 delle apparecchiatu-
re di comunicazione. Questi ultimi risultati sono comprensibili dal momento che le
apparrecchaiture informatiche non sono più beni esclusivi come a inizio millennio.
12
precedente). Dal graco a sinistra si nota che i valori dei prezzi risultano, infatti, corre-
lati anche con i valori di 5 anni prima. L'autocorrelazione parziale, ovvero la funzione
di autocorrelazione ripulita dalle correlazioni intermedie, risulta invece statisticamente
non signicativa per tutti i ritardi, tranne che per il primo. I due correlogrammi sono
utili per capire quale tipo di processo rappresenta la serie (AR, MA, ARMA ecc.)
13
Figura 3: Serie dierenziate di ordine 1
Per la variabile Health i risultati sono gli stessi ottenuti in precedenza, portando alla
conclusione che la dierenza prima è, anche in questo caso, stazionaria. Allo stesso
modo, per la variabile Technology l'ipotesi nulla non viene riutata; la serie dieren-
ziata di ordine 1 invece risulta stazionaria. Si può quindi giungere alla conclusione che
le tre serie storiche sono processi integrati di ordine 1, in quanto la dierenza prima
di ogni serie risulta stazionaria.
14
Food Prendiamo in considerazione la serie storica per i generi alimentari; osservan-
do il correlogramma della dierenza prima di Food, si nota un evidente stagionalità
con un periodo di 12 mesi, (come si può intuire dalla forza della componente nella
decomposizione moltiplicativa).
In particolare, le autocorrelazioni totali decadono esponenzialmente mentre le auto-
correlazioni parziali si annullano dopo 2 ritardi, multipli di 12. A questo proposito ho
calcolato il modello ottimo con il comando auto.arima, allargando la ricerca anche ai
modelli stagionali con l'argomento seasonal=T e utilizzando come criterio di "ricerca"
l'AIC corretto.
Il modello ottenuto è un SARMA(1,0)(2,0)[12] (dove 12 indica il periodo della stagiona-
lità), quindi la componente regressiva della serie è di ordine 1, mentre la componente
autoregressiva della stagionalità è di ordine 2, come si intuisce dal correlogramma
parziale. Di conseguenza, il modello ottimo individuato per la serie è un processo
SARIMA(1,1,0)(2,0,0)[12].
15
Health Prendiamo adesso in considerazione la serie storica per la variabile Health.
La serie originale sembra avere tutte le caratteristiche per essere considerata un RW.
Per confermare questa ipotesi occorre osservare la serie della dierenza prima.
Nella serie della dierenza prima, le autocorrelazioni parziali e totali sono quasi tutte
non signicative, ad eccezione dei ritardi 48 e 54; secondo il criterio AICc, il modello più
accurato è ancora un ARIMA. Poiché i criteri di informazione su cui si basa la ricerca
del modello ottimo non sono buoni indicatori per selezionare l'ordine di dierenziazione
d, ma solo per selezionare i valori di p e q, occorre fare un'altra dierenziazione.
Ho calcolato quindi la dierenza seconda della serie originale e, come si può vedere
dai correlogrammi, la ACF si annulla dopo il primo ritardo mentre la PACF decade
esponenzialmente. Di conseguenza, la dierenza di ordine 2 della serie originale è
caratterizzata da una componente a media mobile di ordine q =1.
Difatti, il modello ottimo trovato, che miminizza l'AICc, è un MA(1).
Andando a ritroso, la dierenza prima della serie è un modello ARIMA(0,1,1), e la serie
originale è un processo integrato di ordine 2, e più precisamente può essere considerata
realizzazione di un processo ARIMA(0,2,1).
16
Figura 8: Dierenza seconda, Istogramma, ACF, PACF ( Health )
Technology Per quanto riguarda la serie storica per la variabile Technology, è pos-
sibile che anche questa sia una realizzazione di un processo Random Walk, in quanto
presenta le stesse caratteristiche della serie precedente.
17
di ordine 1 è un ARMA(2,2). Quindi, la serie originale può essere interpretata come
un ARIMA(2,1,2).
18
A questo punto, la serie originale Health può essere considerata un Random Walk con
drift pari a 0.0014.
19
3 Conclusioni
La relazione consiste in un'analisi della variazione dei prezzi al consumo di alcune
categorie di prodotti e servizi, secondo la classicazione Coicop: è stato studiato il
cambiamento che questi prezzi hanno avuto nell'ultimo ventennio, dal 2001 al 2021.
È stato evidenziato, nel corso di questo elaborato, come i prezzi di queste tre categorie
di prodotto abbiano subìto un'evoluzione più o meno accentuata nel tempo, dimostra-
to dai risultati relativi alle serie pw_food, pw_health e pw_technology.
I risultati di questo studio dimostrano come il prezzo dei generi alimentari ed il prezzo
della sanità abbiano subito un notevole aumento a partire dai primi anni duemila e
che questo non si sia mai interrotto, anzi la crescita che si è registrata è di circa il
45%. Il prezzo dei prodotti e dei servizi di tecnologia, invece, risulta essere diminuito
di oltre il 50% negli ultimi venti anni.
Per quanto riguarda i risultati relativi alla modellazione delle serie storiche, ovvero
ai modelli che meglio approssimano i dati originali, è stato individuato un processo
SARIMA(1,1,0)(2,0,0)[12] per la serie storica sul prezzo dei generi alimentari, un Ran-
dom Walk con drt per la serie storica dei prezzi della sanità e un ARIMA(2,1,2) per
la serie dei prezzi dei prodotti e servizi di comunicazione.
Riferimenti bibliograci
[1] Eurostat METADATA Classication of Individual Consumption by Purpose, 2018
version, (Ultimo accesso: 12 febbraio 2021)
https://ec.europa.eu/eurostat/ramon/nomenclatures/index.cfm?
TargetUrl=LST_NOM_DTL&StrNom=COICOP_2018&StrLanguageCode=EN&IntPcKey=
&StrLayoutCode=HIERARCHIC&IntCurrentPage=1.
[2] Istat COICOP IPCA, (Ultimo accesso: 12 febbraio 2021)
http://dati.istat.it/Index.aspx.
[3] Istat (produzione editoriale) (2013), Indici dei prezzi al consumo. Aspetti generali
e metodologia di rilevazione, Edizione 2012.
20