Abstract
Lobiettivo di questo paper quello di fornire una analisi dei modelli ACD introdotti da Russel ed
Engle nel 1998, ed utilizzare tra questi la variante WACD per determinare una misura del rischio di
mercato attenta ai continui cambiamenti di prezzo cui soggetto un titolo durante le ore di
negoziazione, lIrregularly Spaced Intraday Value at Risk. Inizialmente si stimato il modello
ACD pi appropriato a descrivere la dinamica degli intervalli di tempo tra le variazioni di prezzo
del titolo American Express. Infine, grazie al risultato ottenuto, abbiamo determinato lISIVaR del
titolo, che ci informa sul valore atteso della duration della prossima variazione di prezzo e sul
relativo Value at Risk . NellAppendice dellelaborato disponibile lo script del il codice utilizzato
per sviluppare il lavoro avvalendosi del software statistico R.
INTRODUZIONE
Le ampie fluttuazioni e la crescente volatilit che in questi ultimi anni hanno caratterizzato
i mercati finanziari impongono la raccolta di dati a frequenze sempre pi elevate, al fine di
minimizzare la naturale perdita di informazione a cui inevitabilmente si va incontro tramite
rilevazioni ad intervalli fissi, permettendo cosi la definizione di nuove misure di rischio.
La caratteristica principale delle osservazioni cosi raccolte lirregolarit della loro
distanza, questo fa si che il tempo tra il verificarsi degli eventi rilevati sia esso stesso una
variabile aleatoria che deve essere opportunamente trattata.
I modelli ACD, introdotti nel 1998 da Russel ed Engle1 forniscono lo strumento principale
per comprendere e prevedere la dinamica degli intervalli di tempo tra il verificarsi di eventi
riguardanti il titolo considerato. Nella prima parte del nostro lavoro (sezione 1 e 2) dopo
aver fornito una breve illustrazione teorica degli auteregressive conditional model
passeremo ad una loro applicazione pratica sul titolo American Express. Giungeremo cosi
alla determinazione di un modello WACD(2,2) per la modellizzazione delle duration del
titolo considerato, fino a fornire una previsione del tempo necessario per la prossima
variazione del prezzo (sezione 3). Questo e gli altri risultati ottenuti saranno utilizzati nella
sezione 4 per la determinazione di una misura di rischio caratterizzata da un
orizzonte temporale brevissimo, lIrregularly Spaced Intraday Value at Risk .
Pi precisamente lISIVaR un modello costituito da una coppia di valori: la duration
attesa tra due consecutivi cambiamenti del prezzo ed il corrispondente livello di rischio
sintetizzato nella previsione del relativo VaR. Quindi questa forma di Value at Risk
corrisponde alla massima perdita attesa che (ad un certo livello di confidenza) non sar
superata in corrispondenza della prossima variazione del prezzo.
In tal senso la sezione 3 introdurr una rassegna teorica del modello ed alcune formule utili
alla stima dellISIVaR per il titolo American Express mutuate dal lavoro di Russel ed
Engle del 1998. Nella sezione 5 si provveder a fornire i valori empirici del rischio
previsto. Lanalisi sul campione in esame stata condotta interamente mediante il software
statistico R.
Engle R., Russell J. (1998), "Autoregressive Conditional Duration: a New Model for Irregularly
Spaced Transaction Data", Econometrica, 66, pp. 1127-1162.
xi = i i
da cui
(1.1)
(1.2)
>0e
Exchange (i dati sono stati forniti da Bloomberg L.P.). Il campione racchiude al suo
interno informazioni dettagliate in merito ad ogni transazione avvenuta dal 03/01/2006 al
05/01/2006 con una frequenza di rilevazione maggiore o uguale al mezzo secondo, si tratta
quindi di un set di dati ad altissima frequenza caratterizzati da una spaziatura irregolare,
per un totale di 18661 osservazioni. Lapparato teorico stato illustrato riferendosi alla
durata i-esima come al tempo intercorrente tra la i-esima e la (i-1)-esima transazione, ma in
realt come proposto da Russel ed Engle (1998), si pu assumere come evento i-esimo
qualsiasi
Figura 2.1
Figura 2.2
Figura 2.3
Da questi primi tre grafici possibile apprezzare il ripetersi di alcune dinamiche interne ai
tre giorni considerati, nello specifico la prima parte della giornata presenta una maggior
intensit delle variazioni di prezzo, tradotta in duration minori, probabilmente dovuta
allinformazione accumulata tra la fase di chiusura del giorno precedente e lapertura del
giorno successivo. Proseguendo durante la giornata di negoziazione, gli intervalli di tempo
che intercorrono tra le variazioni del prezzo presentano un andamento crescente mostrando
i valori pi elevati nella parte intermedia della giornata, quindi nellarco temporale in cui il
mercato, da un lato sembra aver gi scontato linformazione sopraggiunta allapertura e
dallaltro si trova in una fase ancora distante dalla chiusura delle negoziazioni. Infatti, nel
periodo prossimo alla chiusura, gli operatori tenderanno a liquidare eventuali posizioni
rimaste aperte o a scontare immediatamente una aspettativa sulle quotazioni della
successiva riapertura, generando cosi una nuova intensificazione dei cambiamenti del
prezzo, che si tradurranno in duration ridotte. Quindi questo andamento sinusoidale,
dovuto alla maggiore attivit di trading nelle prime ore successive allapertura ed in quelle
prossime alla conclusione della giornata borsistica, pu esser considerato come uno
schema diurno (diurnal pattern) che tende a riproporsi in ogni giornata. Il ripetersi
giornaliero di questa dinamica rende preventivamente scontata linformazione contenuta al
suo interno, e quindi eliminabile. Ci sono diverse tecniche per eliminare questo diurnal
pattern, Engle e Russell (1998) e Zhang, Russell e Tsay (2001) usano una semplice
funzione esponenziale del tempo, Tsay (2005) costruisce una funzione deterministica del
tempo
Naturalmente
(2.1)
mercato.
(2.2)
(2.3)
(2.4)
in cui
(2.5)
Il primo passo nella fase di applicazione del modello stato quello di stimare il termine
noto
multipla (2.5), nella quale la variabile risposta data dal logaritmo delle duration presenti
nel campione e le covariate sono pari ai valori delle funzioni deterministiche del tempo
cosi come calcolati secondo la (2.3) e (2.4).
La regressione ci restituisce dei valori di
e di
= 0.58365 e
= 0.43547
, inoltre per ciascun coefficiente di regressione viene fornito lo standard error ed il valore
del test di Student t =
da questi primi valori possiamo trarre conclusioni positive in merito alla significativit del
termine noto e dei coefficienti della regressione2.
coefficiente
stima
t value
p-value
significativit
1.21737
0.02436
49.976
< 2.2e-16
***
0.58365
0.06131
9.519
< 2.2e-16
***
0.43547
0.03527
12.347
< 2.2e-16
***
(Figura
Figura 3.4
Lipotesi nulla del t-test che i coefficienti della regressione siano uguali a 0, p-value cosi bassi ci spingono
a rifiutare lipotesi nulla, inoltre valori elevati della statistica ne confermano la significativit.
(3.1)
con
in questo
modo:
(3.2)
ottenendo
Ora ritardiamo il modello (2.4) di un periodo e premoltiplichiamo per
otteniamo cosi:
(3.3)
dove
Ora possiamo effettuare una nuova stima della regressione ottenendo dei valori del termine
noto e dei coefficienti di regressione pari a
e
=1.0763498,
= 0.5762601,
= 0.4321021
residui di questa nuova regressione, dal grafico (Figura 3.5) della funzione di
autocorrelazione (ACF) degli errori standardizzati, possiamo notare come la correlazione
seriale riscontrata nella stima precedente sia stata del tutto eliminata.
Figura 3.5
La conferma dellassenza di autocorrelazione arriva dal test di Ljung-Box di ordine 12
effettuato sui residui della nuova regressione il cui p-value 0.9979. Una volto risolto il
problema dellautocorrelazione dei residui dobbiamo preoccuparci di verificare la loro
omoschedasticit, per far questo utilizziamo il test di Breusch-Pagan, il cui sito sulla
nostra regressione suggerisce la presenza di eteroschedasticit degli errori, infatti il p-value
0.0001768, questo ci porta a rifiutare lipotesi nulla di omoschedasticit. Per risolvere
questo problema calcoliamo gli standard error di White, detti standard error consistenti in
presenza di eteroschedasticit, otteniamo in questo modo dei nuovi standard error per i
coefficienti (estratti dalla nuova matrice varianza-covarianza).
Allora testando la consistenza dei coefficienti della regressione in corrispondenza di
questi nuovi standard error, possiamo affermare che la conclusione inferenziale sui
coefficienti stimati la stessa anche in presenza di eteroschedasticit, perch pur essendo
Questo risultato riscontrabile dai valori della tabella contenete i risultati della regressione che il software
ci restituisce come output.
10
,e
diversi da 0. Con i coefficienti della regressione della nuova regressione procediamo alla
stima di
e di
. I grafici Figura 3.6, Figura 3.7 e Figura 3.8, riportano le duration dei tre giorni di
negoziazione in seguito alla eliminazione del diurnal pattern, da questi possiamo notare
come leliminazione della componente deterministica abbia smussato landamento
sinusoidale riscontrato nel paragrafo precedente.
Figura 3.6
Figura 3.7
11
Figura 3.8
Ora possiamo procedere alla stima vera e propria del modello WACD. Mediante il package
dynamo (software R) possiamo stimare i parametri
Modello
WACD(1,1)
0.00903
0.03817
0.95424
7.80091
WACD(2,1)
0.006688
0.077536
-0.046426
0.963154
7.612121
WACD(1,2)
0.01431
0.05681
0.45202
0.47907
7.75518
WACD(2,2)
0.13285
0.07592
0.03246
0.40400
0.37659
7.74169
Tabella 3.2
Adesso grazie ai parametri stimati possiamo determinare in modo ricorsivo il vettore delle
fino allultimo cambiamento di prezzo verificatosi prima della mia previsione,
ottenendo cosi il vettore
A questo punto possiamo andare a defnire quale tra questi quattro modelli sia quello
specificato nel modo migliore, infatti dalla (1.1), disponendo di
ottenere
4
e di
Parametro di Weibull
12
, possiamo
opteremo per il
modello che presenta correlazione seriale degli errori minore, quindi in grado di descrivere
al meglio la dinamica delle duration lasciando la minor quantit di informazione nei
residui. In questa logica adotteremo il modello WACD(2,2) la cui ACF mostrata nella
Figura 3.9
Figura 3.9
4 LISIVaR
Ricordiamo che il Value at Risk una misura che indica la perdita potenziale di una
posizione di investimento in un certo orizzonte temporale, solitamente 1 giorno, con un
certo livello di confidenza, solitamente pari al 95% o 99%; lISIVaR (Irregularly Spaced
Intraday Value at Risk) per la probabilit di perdita una coppia, (
, che
tale che
(4.1)
dove
cambiamento di prezzo e
, con
Questa coppia di valori, misura una duplice dimensione del rischio: una stima del rischio di
13
dove
(4.2)
Allora il livello di rischio per li-esima variazione di prezzo pu essere espresso in questo
modo:
(4.3)
dove q il quantile
(4.4)
dove
(4.5)
la
sono le duration.
14
La scelta di esprimere il modello ACD, riferito agli intervalli di tempo tra le variazioni del
prezzo, in termini di funzione di intensit del prezzo appare pi chiara se si considerano i
risultati ottenuti da Russle ed Engle nel loro lavoro del 1998.
Essi propongono un collegamento tra lintensit del prezzo e la volatilit istantanea dei
cambiamenti di prezzo dato da:
=
=
da cui, per la definizione di funzione di intensit, otteniamo la (4.4).
(5.1)
Ottenuta la previsione
del parametro
, abbiamo stimato in modo ricorsivo grazie alla (4.4) e (4.5) i valori della
stato facile,
) = -0.436904 per
.
8
Si optato per lutilizzo di questa formula poich non esiste, per il software statistico R, un
package che consenta di effettuare una previsione della aspettativa condizionata della duration,
per i modelli ACD.
15
Finalmente, il valore dell ISIVaR per il prossimo cambiamento di prezzo (con una
probabilit di perdita pari ad =5%) dato per la (4.3) e per la (5.1) da (
(
. Inoltre
modello WACD(2,2), ci fornisce una misura del tempo che dall(i-1)-esima variazione di
prezzo bisogner attendere perche questo cambi di nuovo.
Conclusioni
Una parte cospicua della letteratura econometria negli ultimi anni ha focalizzato la propria
attenzione sui modelli per la durata. Fin dalla proposta iniziale avanzata nel 1998 da Engle
e Russel una larga parte dei ricercatori ha cercato di trovare una forma funzionale del
modello ACD. Questo paper ha voluto fornire una illustrazione teorica e pratica dei
modelli ACD dimostrando come le loro caratteristiche li rendano utili alla modellizzazione
di informazioni, e nello specifico alla definizione di misure di rischio, che in assenza di tali
modelli non avremmo potuto elaborare.
16
APPENDICE
Script del software utilizzato
library(timeDate)
library(fBasics)
library(MASS)
library(bbmle)
library(zoo)
library(timeSeries)
library(sandwich)
library(lmtest)
library(dynamo)
acd<-read.csv("AMEXrt.csv", header=TRUE, sep=";", dec=",")
dn<-acd[,1]
f11<-acd[,9]
f22<-acd[,10]
C<-acd[,11] ## variazioni del prezzo
Pi<-acd[,12] ## prezzi
rt<-acd[,13] ##rendimenti logaritmici
day1<-acd[1:3056,1]
day2<-acd[3057:5887,1]
day3<-acd[5888:8173,1]
plot(day1,type="l",main="duration del primo giorno di negoziazione") #duration del primo
giorno di negoziazione
plot(day2,type="l",main="duration del secondo giorno di negoziazione") #duration del
secondo giorno di negoziazione
plot(day3,type="l",main="duration del terzo giorno di negoziazione") #duration del terzo
giorno di negoziazione
fit<-lm(log(dn)~f11+f22)
summary(fit)
res<-residuals(fit)
res.std<-scale(res) ##residui standardizzati
17
18
lb2
bptest(fitdiff) ##test di Breusch-Pagan H0 omoschedasticit
vcov(fitdiff)## matrice varianza-covarianza dei coefficienti
sqrt(diag(vcovHC(fitdiff))) ## standard error di White
coeftest(fitdiff, vcov = vcovHC(fitdiff))
## test di significativit dei coefficienti con standard error di White
coefv<-as.vector(coef(fitdiff))
B0<-coefv[1]
B1<-coefv[2]
B2<-coefv[3]
B3<-coefv[4]
di=B0+B1*f11diff+B2*f22diff+B3*resdiff
fi=exp(di)
da<-dn/fi ##duration aggiustate
day1adj<-da[1:3056] ##duration aggiustate del primo giorno di negoziazione
day2adj<-da[3057:5887] ##duration aggiustate del secondo giorno di negoziazione
day3adj<-da[5888:8173] ##duration aggiustate del terzo giorno di negoziazione
plot(day1adj,type="l",ylim=c(1,3.5),main="duration aggiustate del primo giorno di
negoziazione")
plot(day2adj,type="l",ylim=c(1,3.5),main="duration aggiustate del secondo giorno di
negoziazione")
plot(day3adj,type="l",ylim=c(1,3.5),main="duration aggiustate del terzo giorno di
negoziazione")
wacd11 <- dm( da~acd(1,1),innovations="weibull" )
wacd12 <- dm( da~acd(1,2),innovations="weibull" )
wacd21 <- dm( da~acd(2,1),innovations="weibull" )
wacd22 <- dm( da~acd(2,2),innovations="weibull" )
########################## wacd11
coeff.wacd11<-coefficients(wacd11)
a11<-coeff.wacd11[1]
a11
b11<-coeff.wacd11[2]
19
b11
c11<-coeff.wacd11[3]
par.w11<-coeff.wacd11[4]
psi11=rep(1,8173)
for (n in 2:8173) {
psi11[n]=a11 +b11*da[n-1]+c11*psi11[n-1]
}
e11<-da/psi11[1:8173]
e11.std<-scale(e11)
acf(e11.std, lag=12, main="ACF residui standardizzati del modello WACD(1,1)")
########################## wacd12
coeff.wacd12<-coefficients(wacd12)
a12<-coeff.wacd12[1]
b12<-coeff.wacd12[2]
c12<-coeff.wacd12[3]
d12<-coeff.wacd12[4]
par.w12<-coeff.wacd12[5]
psi12=rep(1,8173)
for (n in 3:8173) {
psi12[n]=a12 +b12*da[n-1]+c12*psi12[n-1]+d12*psi12[n-2]
}
e12<-da/psi12[1:8173]
e12.std<-scale(e12)
acf(e12.std, lag=12, main="ACF residui standardizzati del modello WACD(1,2)")
############################ wacd21
coeff.wacd21<-coefficients(wacd21)
a21<-coeff.wacd21[1]
b21<-coeff.wacd21[2]
c21<-coeff.wacd21[3]
d21<-coeff.wacd21[4]
par.w21<-coeff.wacd21[5]
20
psi21=rep(1,8173)
for (n in 3:8173) {
psi21[n]=a21 +b21*da[n-1]+c21*da[n-2]+d21*psi21[n-1]
}
e21<-da/psi21[1:8173]
e21.std<-scale(e21)
acf(e21.std, lag=12, main="ACF residui standardizzati del modello WACD(2,1)")
############################ wacd22
coeff.wacd22<-coefficients(wacd22)
a22<-coeff.wacd22[1]
b22<-coeff.wacd22[2]
c22<-coeff.wacd22[3]
d22<-coeff.wacd22[4]
r22<-coeff.wacd22[5]
par.w22<-coeff.wacd22[6]
psi22=rep(1,8173)
for (n in 3:8173) {
psi22[n]=a22 +b22*da[n-1]+c22*da[n-2]+d22*psi22[n-1]+r22*psi22[n-2]
}
e22<-da/psi22[1:8173]
e22.std<-scale(e22)
acf(e22.std, lag=12, main="ACF residui standardizzati del modello WACD(2,2)")
psi22[8174]<-a22+b22*da[8173]+c22*da[8172]+d22*psi22[8173]+r22*psi22[8172]
previsione con WACD(2,2)
############################ ISIVAR
lambda=rep(1,8173)
g<-gamma(1+1/par.w22)
g
for (n in 2:8173) {
lambda[n]=(g/psi22[n+1])*(da[n]^(par.w22-1))*par.w22
}
absC<-abs(C)
21
##
c<-mean(absC)
sigma2<-rep(1,8173)
for (n in 2:8173) {
sigma2[n]=lambda[n]*(c/Pi[n])^2
}
ut<-rt/((sigma2)^0.5)
VaR<--alpha.quantile*sigma[8173]
VaR
22
Bibliografia
Engle R., Russell J. (1998), "Autoregressive Conditional Duration: a New Model for
Irregularly Spaced Transaction Data", Econometrica, 66, pp. 1127-1162.
Zuccolotto, P. (2001) Autoregressive conditional duration models for ultra-high
frequency data, Rapporti di ricerca del Dipartimento Metodi Quantitativi, Universit di
Brescia, Quaderno n. 191.
Giot, P. (2005), "Market risk models for intraday data", European Journal of Finance,
2005, pp. 309-324.
Baldi P. (1998), Calcolo delle probabilit e statistica, pp.197-322.
Pacurar, M. (2006), "Autoregressive Conditional Duration (ACD) Models in Finance: A
Survey of the Theoretical and Empirical Literature", Working Paper, Dalhousie
Tsay, R. S. (2010), Analysis of Financial Time Series, terza edizione, John Wiley,
Hoboken, New Jersey, pp.231-284.
Tsay, R. S. (2005),
23