Sei sulla pagina 1di 8

Dati finanziari ad

Trattamento e applicazioni
Massimiliano Cecconi, Marco J. Lombardi

alta frequenza

Universit degli Studi di Firenze - Dipartimento di Statistica "G. Parenti"

na delle tendenze pi moderne della finanza consiste nello studio dei cosiddetti dati ad alta frequenza, ovvero osservazioni registrate in tempo reale sui mercati. A differenza degli studi tradizionali, nei quali si tende a considerare dati misurati ad intervalli equispaziati, nel caso dellalta frequenza si registra ogni singola transazione (e anche richiesta di transazione) che avviene sul mercato. La possibilit di sfruttare questa enorme mole di informazione costituisce un indubbio vantaggio; le applicazioni di stime econometriche ricavate da dati ad altissima frequenza (ultra-high frequency, Engle [4]) si riflettono su gran parte della moderna teoria finanziaria: dal prezzaggio di opzioni alla previsione della volatilit intragiornaliera, dal calcolo del Value at Risk alla gestione della liquidit. Tuttavia, limpiego di tali dati pone delle difficolt sia per quanto concerne la loro raccolta che il loro trattamento. Difatti, oltre al problema di gestire ed organizzare enormi quantit di osservazioni (si pu anche arrivare ad alcune migliaia di registrazioni nellarco di una sola giornata borsistica), si pone quello del trattamento di osservazioni a frequenza irregolare. Una delle possibilit che sta riscuotendo maggior successo in letteratura consiste nel modellare i tempi che intercorrono tra una transazione e laltra (le cosiddette durations) tramite un nuovo processo, introdotto da Engle e Russell [5] e noto con lacronimo di modello ACD (Autoregressive Conditional Duration). Tra le motivazioni che hanno ispirato i due autori vi la constatazione che la presenza sul mercato di operatori maggiormente informati di altri si riflette in un tempo medio di attesa tra una transazione e laltra relativamente breve. Viceversa, tempi di attesa pi lunghi sono indice di una maggiore calma dei mercati, poich si ritiene che il prezzo corrente sia prossimo al suo valore di equilibrio. Scopo di questo articolo quello di presentare sinteticamente i dati ad alta frequenza, le problematiche connesse al loro stoccaggio ed al loro trattamento, e di fornire alcuni spunti sulle possibilit di utilizzo dei dati in svariati ambiti della moderna teoria finanziaria.

Scienza & Business, Anno III, n.9-10, 2001

17

Massimiliano Cecconi, Marco J. Lombardi - Dati finanziari ad alta frequenza

a modernizzazione degli strumenti informatici spesso venuta a coincidere con importanti innovazioni nel campo della finanza. Ad esempio, a partire dallinizio degli anni 90, la crescente velocit di elaborazione dei processori ha reso possibile sviluppare tecniche di analisi che risultavano in precedenza impensabili: tra le altre cose, ad esempio, si sono potute sviluppare tecniche di prezzaggio per titoli derivati di tipo non standard basate sulla simulazione del prezzo del titolo sottostante. Una delle ultime conseguenze della rapida espansione della tecnologia hardware rappresentata dalla possibilit di archiviare e gestire database di dimensioni imponenti grazie alla costante crescita di capienza dei supporti magnetici e allintroduzione su larga scala (e a costi contenuti) degli strumenti ottici di lettura/scrittura. In ambito finanziario, ci rende possibile studiare landamento dei mercati in una prospettiva intragiornaliera, ovvero registrare tutte le transazioni (eseguite o solo richieste) che si rilevano sui terminali degli operatori. In letteratura, spesso si indicano tali rilevazioni come dati tick-by-tick o trade-by-trade (Gwilym e Sutcliffe [6]). Se fino a poco tempo fa le applicazioni si limitavano a considerare al massimo osservazioni giornaliere, si sta diffondendo oggi la pratica di sfruttare la massima informazione possibile utilizzando i dati tick-by-tick. Difatti, utilizzando dati giornalieri, si suole considerare il prezzo di chiusura come indicativo dellintera giornata di contrattazioni, ma ci non necessariamente vero; tralasciando i movimenti intragiornalieri del prezzo si rischia pertanto di trascurare informazioni rilevanti ai fini della stima e della previsione. Tuttavia, utilizzare questo tipo di dati pone alcuni problemi e rende necessario ricorrere a strumenti parzialmente diversi da quelli tradizionalmente impiegati. Il problema principale consiste nel fatto che le osservazioni cos rilevate non sono necessariamente equispaziate: tra unosservazione e laltra pu intercorrere un lasso di tempo che oscilla da pochissimi secondi a qualche mi-

nuto. Al contrario, immediatamente evidente che, utilizzando dati giornalieri, tale problema non si pone.

Modalit di raccolta e gestione dei dati

dati ad altissima frequenza sono raccolti e forniti da organismi di vario tipo, spesso identificabili con listituzione che gestisce e regola il singolo mercato nazionale; nel caso italiano, essi sono gestiti direttamente dalla Borsa Italiana S.p.A. Tali dati si presentano sotto forma di database in formato ASCII che riporta in ordine: ! data della transazione, nel formato aaaammgg (ad esempio 20000703 indica il 3 luglio 2000); ! orario della transazione, nel formato hhmmsscc (ad esempio 11073200 indica le ore 11,7 minuti, 32 secondi); ! prezzo in euro al quale avviene lo scambio; ! volume scambiato; ! controvalore in euro. Una tipica giornata di contrattazioni, sul mercato italiano, supera abbondantemente le 1500 osservazioni. Si capisce subito come ci risulti costoso sia dal punto di vista dello stoccaggio che da quello del trattamento dei dati: un database di un anno consterebbe di circa 600.000 rilevazioni. Dai grafici che presentiamo possiamo vedere un confronto tra landamento giornaliero e quello tick-by-tick del prezzo del titolo FIAT tra il 10 e il 31 luglio del 2000. Nella Figura 1 riportiamo i prezzi giornalieri di chiusura, mentre nella Figura 2 il grafico delle quotazioni tick-by-tick. Si osserva che, ovviamente, le due serie risultano pi o meno sovrapponibili, ma che ad ogni modo la serie ad alta frequenza veicola una quantit di informazione infinitamente maggiore rispetto a quella giornaliera. La non omogeneit dei dati tick-by-tick non risulta molto evidente dalla Figura 2 a causa della enorme quantit di dati a disposizione (29087 osservazioni). Tuttavia,

Figura 1 Prezzo del titolo FIAT nel periodo 10/31 luglio 2000 sulla base di rilevazioni giornaliere

Figura 2 Prezzo del titolo FIAT nel periodo 10/31 luglio 2000 sulla base di rilevazioni tick-by-tick

18

Scienza & Business, Anno III, n.9-10, 2001

Massimiliano Cecconi, Marco J. Lombardi - Dati finanziari ad alta frequenza se concentriamo lattenzione su una frazione della giornata borsistica (ad esempio unora), immediatamente visibile landamento a salti della serie dovuto alla diversa frequenza con cui si registrano le transazioni. La Figura 3 illustra quanto descritto per il titolo FIAT nel giorno 10 luglio 2000 tra le 9. 30 e le 10. 30 del mattino; ciascun punto indica una diversa transazione avvenuta nel periodo considerato. Se il problema del trattamento dei dati si avverte gi sul mercato italiano, su quello statunitense infinitamente pi grande: non solo le transazioni sono molto pi numerose, ma linsieme delle informazioni rilevate risulta molto pi ampio. Il principale fornitore di dati per il mercato statunitense il New York Stock Exchange (NYSE) stesso, che cura il database TAQ (Trades and Quotes, [12]). Tale database riporta, oltre alle transazioni che effettivamente hanno luogo (trades), anche le quotazioni bid e ask, ovvero le proposte di vendita e di acquisto che non vanno a buon fine (quotes). Nel database TAQ, oltre ai dati relativi al NYSE, sono rilevati anche dati di altri mercati, tra cui il National Association of Securities Dealers Automated Quotations (NASDAQ), lAmerican Stock Exchange (AMEX) e il Chicago Board Options Exchange (CBOE). Per dare unidea della mole che pu raggiungere il database TAQ, ne riportiamo, in Figura 4, le dimensioni in MegaBytes per alcuni mesi di riferimento e solo per pochi titoli azionari del NYSE. Dal grafico si evince che la frequenza degli scambi sul mercato statunitense in forte crescita: la dimensione del database presenta difatti un marcato trend crescente sia per quanto riguarda le proposte immesse nel circuito telematico che per quanto riguarda le transazioni effettivamente realizzate. La modellistica tradizionale che si soliti utilizzare per lanalisi delle serie storiche finanziarie stata sviluppata quando ancora le osservazioni giornaliere rappresentavano il massimo grado di informazione che si potesse riuscire a gestire. Tale modellistica (ci riferiamo in partico-

Figura 4 Dimensione in MegaBytes del database TAQ

Figura 3 Prezzo del titolo FIAT tra le 9.30 e le 10.30 del 10 luglio 2000

lare ai modelli di tipo ARMA-GARCH; si veda, per una trattazione introduttiva, Hamilton [7]) quindi applicabile solo nel caso in cui i dati siano equispaziati e, come abbiamo visto, questo non il caso delle osservazioni ad alta frequenza. I primi studi in tale ambito si sono concentrati sul cercare di recuperare la modellistica tradizionale trasformando le osservazioni ad alta frequenza in osservazioni equispaziate. Lidea pi naturale in questo senso quella di registrare i dati a intervalli di tempo predefiniti: ad esempio ogni minuto, oppure ogni secondo. Questo approccio comporta per alcuni problemi: se infatti, per quanto riguarda le osservazioni giornaliere, al termine della giornata di contrattazioni si osserva comunque un singolo prezzo di chiusura, non detto (specie per quanto concerne i titoli a minore flottante) che si possa osservare una transazione esattamente ogni minuto (o addirittura ogni secondo). I dati devono essere quindi trattati in modo da renderli veramente equispaziati. Vi sono varie modalit di intervento possibili, che illustreremo con un semplice esempio grafico. Supponiamo che il prezzo di apertura del titolo che vogliamo analizzare sia 100. Desideriamo ricavare, a partire dalle osservazioni tick-by-tick, una serie di osservazioni equispaziate a un minuto. Dopo esattamente un minuto dallapertura del mercato, si registra la prima transazione a un prezzo di 101. La seconda transazione, a un prezzo di 102, avviene 1 minuto e 48 secondi (1,8 minuti) dopo lapertura del mercato, e la terza, a un prezzo di 104, dopo 2 minuti e 36 secondi (2,6 minuti). La situazione che ci si trova ad affrontare schematizzata nella Figura 5: a partire dalla prima linea temporale, non equispaziata, dobbiamo costruire la seconda, riempiendo le rilevazioni x0, x1, x2, e cos via. Per quanto riguarda x0, essa ovviamente coincide col prezzo di apertura; ugualmente, poich la prima transazione si verificata esattamente un minuto dopo lapertura del mercato, x1 coincide col prezzo di tale transazione, ovvero 101. Per quanto riguarda x2, invece, non disponiamo di unosservazione corrispondente al termine temporale dei 2 minuti, e dobbiamo quindi procedere in maniera diversa. Una prima idea pu essere quella di Scienza & Business, Anno III, n.9-10, 2001
19

Massimiliano Cecconi, Marco J. Lombardi - Dati finanziari ad alta frequenza utilizzare la transazione pi vicina ai 2 minuti, in questo caso 102. Altrimenti, si pu considerare la media aritmetica delle osservazioni immediatamente precedente e seguente ai 2 minuti, ovvero: x2 = (102 + 104) / 2 = 103. Unulteriore possibilit, pi raffinata, quella di considerare una media ponderata con gli intervalli di tempo che intercorrono tra le transazioni e il termine dei 2 minuti: x2 = [102 * (2 - 1,8) + 104 * (2,6 - 2)] / [(2 - 1,8) + (2,6 - 2)] = 103,5. Menzioniamo, infine, la strada dellinterpolazione lineare, consistente nel tracciare una retta per le due transazioni pi prossime a quella mancante e prendere come valore quello appartenente a tale retta in corrispondenza dellistante considerato. In pratica, ci si traduce nel risolvere la proporzione (x2 - 102): (2 - 1,8) = (104 - 102): (2,6 - 1,8), la cui soluzione rende un valore interpolato per x2 di 102,5. Ovviamente, nessuna di queste metodologie intrinsecamente la migliore. La media ponderata quella che considera il numero pi ampio di fattori, ma non necessariamente superiore alle altre in termini di risultato. Quello che vale la pena qui osservare che procedere ad accorpare i dati per renderli equispaziati comporta comunque, per quanto alta possa essere la frequenza di campionamento, una perdita di informazione. Abbiamo gi rilevato che, disponendo di dati equispaziati, possiamo sfruttare tutta la modellistica preesistente. Tuttavia, se si aggiunge a questo indubbio vantaggio linconveniente relativo alla perdita di informazione, questa strategia pu rivelarsi non ottimale a fini di analisi. cercatore allo scopo di individuarne le propriet statistiche fondamentali, sulla base di un minimo insieme di assunzioni sottostanti. Si va dunque alla ricerca di quelle regolarit empiriche che nella letteratura econometrico-finanziaria prevalente vengono definite fatti stilizzati. Andamento delle funzioni di autocorrelazione, forma della distribuzione campionaria, individuazione di patterns giornalieri e/o settimanali caratteristici, sono solo alcuni degli esempi di regolarit empiriche ispezionate in questa fase. Il secondo passo consiste nellutilizzare i fatti stilizzati precedentemente individuati per formulare adeguati modelli matematico-statistici. Occorre notare che per modelli adeguati si intendono formulazioni rigorose in grado di riprodurre le regolarit empiriche osservate, operando in un contesto di tipo essenzialmente ateorico, tipico delle scienze sperimentali, che si pone in contrapposizione allapproccio economico tradizionale dove laspetto determinante costituito dalla verifica empirica di quelle relazioni teoriche ritenute esplicative del comportamento dei mercati (la cosiddetta microstruttura). Nellultima fase occorre verificare ladeguatezza del modello nel riprodurre i fatti stilizzati precedentemente individuati sui dati. Lobiettivo finale non si limita alla ricerca di un modello puramente descrittivo dellandamento dei fenomeni analizzati, ma consiste piuttosto nellutilizzo di tali formulazioni per ricavare ragionevoli previsioni sui loro movimenti futuri, integrando nelle applicazioni pratiche questi strumenti con quelli oramai pi consolidati del risk management e del prezzaggio di opzioni. Come gi evidenziato, il metodo sperimentale si contrappone a quello proprio della teoria finanziaria tradizionale utilizzato per comprendere la microstruttura del mercato e volto ad analizzare la reazione dei mercati finanziari allinsorgere di nuova informazione. La presenza di operatori diversamente informati gioca un ruolo

Lapproccio sperimentale alle serie ad alta frequenza

n ci che precede abbiamo messo in evidenza come oggigiorno, chiunque si avvicini ai mercati finanziari possa disporre di enormi quantit di dati dai quali estrapolare utili suggerimenti per le proprie decisioni di investimento e disinvestimento. Tra i problemi maggiori che si incontrano vi senzaltro la necessit di operare unadeguata sintesi dellinformazione raccolta in modo da poterla utilizzare al meglio. Lapproccio comunemente utilizzato in questo ambito quello proprio delle scienze sperimentali (fisica, chimica o biologia), dove i fenomeni naturali vengono studiati mediante lausilio di strumenti matematici e statistici rigorosi. Lapplicazione del cosiddetto metodo sperimentale ai dati finanziari ad alta frequenza si esplica in tre fasi fondamentali (Dacorogna et al. [3]). La prima di esse, e forse la pi delicata, consiste nellanalizzare da un punto di vista esplorativo e descrittivo i dati a disposizione del riScienza & Business, Anno III, n.9-10, 2001

Figura 5 Costruzione di una serie di osservazioni equispaziate a partire da osservazioni tick-by-tick

20

Massimiliano Cecconi, Marco J. Lombardi - Dati finanziari ad alta frequenza chiave nel meccanismo di formazione dei prezzi. In tal senso, uno dei principali vantaggi dellapplicazione del metodo sperimentale ai dati ad alta frequenza consiste nella possibilit di riconciliare i due approcci, sintetizzando la maggiore informazione disponibile in particolari variabili esplicative da aggiungere ai modelli derivati in stretta aderenza alle regolarit empiriche osservate. In ci che segue daremo un semplice esempio illustrativo di modello econometrico derivato secondo le linee guida dellapproccio sperimentale ai mercati finanziari e ne metteremo brevemente in evidenza le potenzialit nel riprodurre le regolarit empiriche osservate su dati reali. so punto di vista in base al quale vengono studiate le sequenze di transazioni, dallaltro il loro elemento comune lindividuazione della presenza di operatori maggiormente informati di altri. Ci si traduce nel fatto che la quotazione corrente degli attivi finanziari risulta pi o meno vicina al suo valore di equilibrio a seconda della frequenza con cui avvengono le transazioni. La formulazione matematico-statistica pi innovativa volta a tale scopo senzaltro il modello ACD (Autoregressive Conditional Durations) introdotto da Engle e Russell [5]. Si tratta di una rappresentazione statistica per dati non equispaziati la cui finalit quella di comprendere quale sar il tempo medio di attesa fino alla prossima transazione, in quanto proprio dalla previsione di questo dato che gli operatori aggiorneranno la loro opinione (o probabilit soggettiva) circa la possibilit che vi sia informazione superiore nel mercato e che di conseguenza le quotazioni degli attivi finanziari siano relativamente lontane dal loro valore di equilibrio. Riportiamo in Figura 6, a titolo esemplificativo, il grafico delle durations rilevate per il titolo FIAT nel mese di gennaio 2000. Dal campione sono state escluse le durations nulle (relative al fatto che pi transazioni si sono verificate nello stesso istante), quelle della fase di pre-apertura, e le durate tra la prima transazione della giornata e lultima della giornata precedente, riducendo il campione a 35777 osservazioni, contro le 58123 originarie. Come si vede, le considerazioni che portano a ritenere che una maggiore attivit di trading si verifichi nelle prime ore successive allapertura ed in quelle prossime alla chiusura della giornata borsistica confermata dallandamento sinusoidale delle durations. I fondamenti di un simile comportamento si ritrovano nella constatazione che allapertura sia da scontare tutta linformazione e le opinioni della notte, mentre in prossimit della chiusura gli operatori tenderanno a liquidare eventuali posizioni rimaste aperte o a scontare immediatamente unaspettativa sulla quotazione alla riapertura. Senza entrare nei dettagli dei processi ad intensit condizionale, per i quali si rimanda, fra gli altri, a Lancaster [9], la rappresentazione formale del modello ACD pu essere espressa come segue. Sia xi = ti -ti-1 lintervallo di tempo espresso in secondi tra due transazioni consecutive (le cosiddette durations) e sia i il valore atteso delli-esima duration condizionato a tutta la storia passata di xi (xi-1 , xi-2 , ... , x1 ). In tal modo il modello pu essere espresso come: xi = i i dove i rappresenta una sequenza di variabili casuali indipendenti e identicamente distribuite con funzione di densit di probabilit che deve essere specificata e media uguale a 1. Da queste semplici assunzioni si nota come diverse formulazioni del modello ACD possono essere ricavate semplicemente indicando parametrizzazioni alternative per i ed ipotizzando distribuzioni diverse per i . Nel modello originario di Engle e Russell [5] si assume che le durations condizionali attese dipendano da q dei loro valori passati e da m ritardi delle durations pi un termine costante:

Una rappresentazione formale: il modello ACD

ome gi accennato in precedenza, la moderna teoria finanziaria si basa sulla constatazione che lunica variabile in grado di fornire utili suggerimenti circa la presenza di informazione superiore nel mercato rappresentata dalla sequenza delle transazioni. Partendo da una tale assunzione, numerosi sono stati i tentativi di formalizzare il comportamento degli operatori di mercato (si veda, ad esempio, OHara [11] per una rassegna di tali modelli). Basti qui ricordare che se da un lato le peculiarit dei vari modelli consistono nel diver-

Figura 6 Durations per il titolo FIAT - gennaio 2000

Il valore numerico dei parametri > 0, 1, ,m 0, 1, ,q 0, il cui vincolo di non-negativit si rende necessario al fine di ottenere stime non negative per i , determinato mediante lapplicazione di metodologie statistiche di stima, ed in parti21

Scienza & Business, Anno III, n.9-10, 2001

Massimiliano Cecconi, Marco J. Lombardi - Dati finanziari ad alta frequenza (tra parentesi quadre sotto la stima), la statistica test LB di Ljung e Box [10] per la verifica dellassenza di correlazione, nonch la media e la deviazione standard calcolate sui residui del modello stimato

Sebbene i residui sembrino, almeno in prima approssimazione, in linea con le ipotesi teoriche formulate sul modello, la parametrizzazione che meglio si adatta ai dati quella EACD (1, 2). Negli altri casi, o ci troviamo di fronte a parametri statisticamente non significativi, oppure la presenza di un valore negativo per 2 nel modello EACD (2, 1) o la non completa assenza di correlazione nei residui per il caso EACD (1, 1), li rendono di fatto meno accettabili del modello EACD (1, 2).
Figura 7 Istogramma sui residui del modello EACD (1, 2) per il titolo FIAT gennaio 2000

colare del metodo della massima verosimiglianza, una volta che si specificata la forma della distribuzione di i . Nei casi pi frequenti nella pratica, si ipotizza una distribuzione esponenziale o di Weibull per i , dalle quali derivano rispettivamente i modelli EACD (m, q) e WACD (m, q). A titolo esemplificativo, si riporta nella Tabella 1 la stima di vari modelli ACD di tipo esponenziale per il titolo FIAT allinterno del campione considerato. Oltre alle stime dei parametri, riportiamo gli standard error robusti

Tabella 1 Stime di vari modelli EACD per il titolo FIAT - gennaio 2000

Inoltre, come si evince dalle figure 7 e 8, lipotesi di distribuzione esponenziale per i termini di disturbo sembra poter essere adeguata. Listogramma dei residui osservati (Figura 7), a parte una diversit di scala facilmente eliminabile, riproduce abbastanza fedelmente landamento della distribuzione esponenziale (la media e la varianza sono infatti prossime allunit). Ci confermato dallo scatterplot tra i quantili teorici della distribuzione esponenziale e quelli ricavati da dalla distribuzione empirica dei residui (Figura 8), dove la disposizione dei punti lungo la bisettrice che passa per lorigine degli assi ne giustifica ladozione come ipotesi per la stima dei parametri. Le maggiori diversit rispetto ad una retta si hanno in corrispondenza di pochi valori elevati per i quali varrebbe la pena dare una spiegazione teorica piuttosto che considerare distribuzioni alternative (quali la Weibull) che avrebbero leffetto di complicare eccessivamente la procedura iterativa di stima. In tal caso, la presenza di pochi valori eccezionalmente grandi pu essere dovuta al fatto che la quotazione del momento abbia superato le soglie delleccesso di rialzo o di ribasso, in modo da provocare la sospensione del titolo FIAT dalle contrattazioni per qualche minuto. Linclusione tra i regressori di variabili dummy in grado di cogliere questi momenti o la ricerca di variabili esplicative aggiuntive potrebbero in parte rimediare a queste inefficienze del modello. Infine presentiamo in Figura 9 un confronto grafico tra le durations reali e quelle stimate col modello EACD (1, 2). Come si vede, il modello in grado di cogliere quellandamento sinusoidale di cui si parlato in precedenza evidenziando unadeguata discriminazione tra periodi caratterizzati da durate brevi e periodi nei quali i tempi di attesa tra una transazione e laltra sono significativamente pi lunghi.

22

Scienza & Business, Anno III, n.9-10, 2001

Massimiliano Cecconi, Marco J. Lombardi - Dati finanziari ad alta frequenza Pur essendo un modello relativamente recente, si trovano gi, in letteratura, numerose applicazioni, anche relative al mercato italiano. Si osservato, in particolare, che tale modello in grado di riprodurre in maniera adeguata landamento delle transazioni intragiornaliere. Sono state inoltre proposte numerose estensioni al modello ACD, con lobiettivo di migliorarne la performance e di renderlo adeguato a tratFigura 8 Scatterplot tra quantili stimati e quantili teorici della tare determinate carattedistribuzione esponenziale per il titolo FIAT - gennaio ristiche empiriche rileva2000 te sui dati reali. In particolare, sono stati introdotti modelli in grado di catturare le asimmetrie (Asymmetric ACD, Bauwens e Giot [2]), la memoria lunga (Fractionally Integrated ACD, Jasiak [8]) e la non-linearit (Log ACD, Bauwens e Giot [1] e Threshold ACD, Zhang et al. [13]). Tra gli elementi che pi frenano una maggiore diffusione della modellistica ACD e, pi in generale, dei dati ad alta freFigura 9 Confronto tra durations reali (linea rossa) e stimate quenza stessi, vi las(linea bianca) per il titolo FIAT - gennaio 2000 senza di software progettato specificamente per il loro trattamento e Note conclusive la loro analisi. Notiamo infatti che, al di l dellassenza di pacchetti di stibbiamo presentato somma- ma dei modelli ACD, anche la stessa riamente i principali problemi raccolta e analisi grafica dei dati che si incontrano volendo la- problematica, facendo affidamento vorare con dati finanziari ad alta fre- sui software di uso comune presso quenza al posto dei tradizionali da- gli operatori del settore, ovviamente ti giornalieri. Si visto come tali dati a causa della loro mole. presentino alcune interessanti pecuRiteniamo che, analogamente a liarit, in particolare il fatto che non quanto si verificato in passato per risultano equispaziati. A tale propo- altri modelli, la spinta decisiva alla sito, si introdotto il modello ACD, di loro diffusione possa venire proprio cui abbiamo mostrato i tratti salienti dallintroduzione di pacchetti softwaed unesemplificazione su dati reali. re specifici. Bibliografia
[1] Bauwens, L., Giot, P (1997). The Logarithmic . ACD Model: An Application to Market Microstructure and NASDAQ. CORE Discussion Paper 9789 : Universit Catholique de Louvain. [2] Bauwens, L., Giot, P. (1998). Asymmetric ACD Models: Introducing Price Information in ACD Models with A Two State Transition Model. CORE Discussion Paper 9844: Universit Catholique de Louvain. [3] Dacorogna, M. M., Genay, R., Mller, U., Olsen, R. B., Pictet, O.V. (2001). An Introduction to High-Frequency Finance, San Diego: Academic Press. [4] Engle, R. F. (2000). The Econometrics of Ultra-High Frequency Data, Econometrica, 66, pp. 1-22. [5] Engle, R. F., Russell, J. R. (1998). Autoregressive Conditional Duration: A New Model for Irregularly Spaced Transaction Data, Econometrica, 66, pp. 1127-1162. [6] Gwilym, O., Sutcliffe, C. (1999). High-Frequency Financial Market Data, London: Risk Books. [7] Hamilton, J. D. (1994). Time Series Analysis, Princeton: Princeton University Press. [8] Jasiak, J. (1999). Persistence in Intertrade Durations. Manuscript: York University. [9] Lancaster, T. (1990). The Econometrics Analysis of Transition Data, Econometric Society Monographs. Cambridge: Cambridge University Press. [10] Ljung, G., Box, G. (1979). On a Measure of Lack of Fit in Time Series Models, Biometrika, 66, pp. 265-270. [11] OHara, M. (1995). Market Microstructure Theory, Oxford: Basil Blackwell Inc. [12] TAQ Database, http: //www. nyse. com/marketinfo/marketinfo. html. [13] Zhang, M. Y., Russell, J. R., Tsay, R. S. (2001). A Nonlinear Autoregressive Conditional Duration Model with Applications to Financial Transaction Data, Journal of Econometrics, 104, pp. 179-207.

Ringraziamenti

ingraziamo la Borsa Italiana S.p.A. per averci cortesemente messo a disposizione i dati ad alta frequenza utilizzati in questo articolo. Un ringraziamento particolare va inoltre al Prof. Giampiero M. Gallo per averci supportato e incoraggiato nel nostro lavoro.

Scienza & Business, Anno III, n.9-10, 2001

23

Massimiliano Cecconi, Marco J. Lombardi - Dati finanziari ad alta frequenza

APPROFONDIMENTO: LA DISTRIBUZIONE DI WEIBULL

a distribuzione di Weibull in genere utilizzata per modellare dati di durata ed ha la peculiarit che la sua hazard function (funzione tasso di guasto) dipende dal parametro di forma k e pu risultare crescente, costante o decrescente, rendendo cos la distribuzione assai versatile. Lequazione della funzione di densit di probabilit :
Figura 10 - Densit di Weibull per diversi valori del parametro k, ponendo = 1

per t > 0. Il parametro k pu assumere valori strettamente positivi e determina, come dice il nome stesso, la forma della distribuzione. Nel caso in cui k = 1 la distribuzione detta anche esponenziale, ed ha tasso di guasto costante. In Figura 10 riportiamo il grafico della densit di Weibull per tre diversi valori di k. Il parametro , invece, detto parametro di scala, e determina lampiezza della distribuzione. Ai fini delle stime ACD, il parametro di scala viene spesso fissato a priori pari a uno.

Notizie sugli Autori


MASSIMILIANO CECCONI assimiliano Cecconi si laureato a pieni voti con lode presso la Facolt di Economia dellUniversit degli Studi di Firenze nellaprile 2001. Ha discusso una tesi in Econometria dal titolo: Modelli econometrici per fenomeni soggetti a smooth transition: lo studio della volatilit sui mercati finanziari, supervisionata dal prof. Giampiero M. Gallo, per la quale la commissione di laurea ha espresso l'auspicio di pubblicazione. Attualmente Assegnista di Ricerca presso il Dipartimento di Statistica G. Parenti dellUniversit di Firenze, dove svolge una ricerca dal titolo Microstrutture di Mercati Finanziari. Fa infine parte del gruppo di ricerca FEDRA. I suoi interessi di ricerca riguardano leconometria dei mercati finanziari, con particolare attenzione alla microstruttura dei mercati ed allo studio delle serie storiche finanziarie ad altissima frequenza (tick-by-tick). Si interessa inoltre di modellistica GARCH per lo studio della volatilit, modelli non-lineari per i mercati finanziari, modelli a transizione liscia, metodi di simulazione, implementazione di routine econometrico-finanziarie. contattabile allindirizzo e-mail: cecconim@ds.unifi.it o all'URL: http://www.cecconim.it. MARCO J. LOMBARDI arco Jacopo Lombardi nato a Firenze il 16 giugno 1976. Dopo il Diploma di Maturit Classica, si iscritto alla Facolt di Economia dellUniversit degli studi di Firenze e si laureato col massimo dei voti e lode il 12 febbraio 2001. La sua tesi in Econometria, supervisionata dal Prof. Giampiero M. Gallo e intitolata La previsione della volatilit di attivi finanziari: Processi a memoria lunga e Fractionally Integrated GARCH, ha ricevuto dalla commissione lauspicio di pubblicazione. Attualmente segue il corso di Dottorato di Ricerca in Statistica Applicata presso il Dipartimento di Statistica G. Parenti dellUniversit degli studi di Firenze. Oltre che ai modelli per dati ad alta frequenza e ai modelli a memoria lunga, interessato alla programmazione in linguaggio C/C++, allanalisi spettrale, alle reti neurali e ai metodi numerici di ottimizzazione. Lavora presso il Dipartimento di Statistica G. Parenti dellUniversit degli studi di Firenze (Viale G.B. Morgagni 59 - 50134 Firenze) e pu essere contattato allindirizzo e-mail: mjl@ds.unifi.it o allURL http://www.ds.unifi.it/~mjl/.

FEDRA l gruppo di ricerca FEDRA (Financial Econometrics and Derivatives Research Associates) si costituito nel giugno 2001 presso il Dipartimento di Statistica G. Parenti dellUniversit degli studi di Firenze con lobiettivo di coordinare e promuovere lattivit di ricerca del dipartimento nel settore dellanalisi quantitativa dei mercati finanziari. Il gruppo diretto da Giampiero M. Gallo ed attualmente composto da Christian T. Brownlees, Massimiliano Cecconi, Orazio Di Miscia, Andrea Gigli, Marco J. Lombardi e Barbara Pacini. Ulteriori informazioni sulle attuali attivit del gruppo sono disponibili allURL: http://www.ds.unifi.it/~fedra/.

24

Scienza & Business, Anno III, n.9-10, 2001