Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ii
Sommario
1 L’ingegneria dei trasporti per i sistemi a rete ....................................................................... 5
3.2 Specificazione, calibrazione e validazione dei modelli per la stima dei flussi di domanda........ 65
3.2.1 Calibrazione.............................................................................................................................................. 66
3.2.2 Specificazione ........................................................................................................................................... 75
3.2.3 Validazione ............................................................................................................................................... 77
4.1 Introduzione........................................................................................................................... 83
5.4 Una panoramica su modelli d’assegnazione alternativi a quelli di punto fisso....................... 110
5.5 I modelli dinamici di tipo day-to-day: l’interazione congestionata come processo dinamico. 113
iv
L’INGEGNERIA DEI TRASPORTI PER I SISTEMI A RETE
5
L’INGEGNERIA DEI TRASPORTI PER I SISTEMI A RETE
1 Entrambi i due precedenti termini sono per ora utilizzati nella loro accezione del linguaggio comune ma,
come si vedrà meglio in seguito, nel linguaggio rigoroso del nostro settore sono sbagliati.
6
L’INGEGNERIA DEI TRASPORTI PER I SISTEMI A RETE
X
µ3
µ
µ1
µ2
t
Figura 1 – Intervalli di stazionarietà di una variabile
7
L’INGEGNERIA DEI TRASPORTI PER I SISTEMI A RETE
8
I MODELLI DI SCELTA DISCRETI
I modelli di scelta discreta sono un potente strumento a disposizione della Ingegneria dei
trasporti. Essi vengono utilizzati allo scopo di simulare un disparato e vario tipo di scelte a
cui possono trovarsi di fronte gli utenti d'un sistema di trasporto. L'applicazione alla
ingegneria dei trasporti è solo una tra le tante possibili applicazioni dei modelli di scelta
discreta, che sono ampiamente utilizzati in molte applicazioni dell'econometria: per la teoria
delle scelte discrete Daniel Mac Fadden ha vinto, insieme a James Heckman, il nobel per
l’economia.
In questo capitolo non vi saranno riferimenti all'oggetto delle scelte che i decisori
intraprendono. I decisori, le alternative di scelta e quanto altro serve per descrivere i modelli
di scelta discreta saranno introdotti, ove non diversamente specificato, senza riferirsi ad un
esplicito contesto applicativo. In altri termini, quanto verrà qui descritto potrebbe essere, in
linea di principio ed esemplificativamente, applicato ad un problema di scelta tra diverse
modalità di trasporto, così come alla scelta di una marca di frigorifero, o a quella di un
gestore telefonico, o quella tra diversi percorsi che collegano una coppia origine-
destinazione tra cui vi è una domanda di spostamento.
I modelli di scelta discreta sono basati sull'ipotesi di potere rappresentare attraverso uno
strumento di simulazione i risultati delle scelte effettuate da un decisore.
Il primo processo logico è quello di simulare il contesto di scelta del decisore. Per
definizione, in un modello di scelta discreto, tale contesto di scelta viene simulato con un
numero discreto (e finito) di alternative di scelta che l'analista considera essere nella
percezione del decisore. L'analista deve dunque come prima cosa identificare quali siano le
alternative discrete tra cui il decisore effettua la sua scelta. Ad esempio, per un decisore che
debba scegliere di acquistare un'automobile, l'analista può ipotizzare che l'insieme di scelta
sia costituito da tutte le marche ed i modelli disponibili sul mercato, a meno di quelli con un
costo superiore ad una certa cifra (che il decisore si suppone escluda sicuramente a priori)
e/o omologate per una capienza minore di 4 persone, ecc...
Il contesto di scelta si suppone definito in modo che il decisore sia di fronte ad un numero
finito di alternative. L'analista è in grado di applicare un paradigma formale di scelta che
simula il comportamento decisionale rispetto a tale insieme di scelta. È importante notare
come tale paradigma è uno strumento proprio dell'analista e non del decisore. Il paradigma
formale permette di simulare i comportamenti di scelta ma non è necessariamente la
9
I MODELLI DI SCELTA DISCRETI
riproduzione dei meccanismi individuali “psicologici” e dei processi mentali del decisore.
Si tratta di un meccanismo di rappresentazione per “simulazione” e non per “riproduzione”.
Nella simulazione dei sistemi di trasporto si possono in generale adottare modelli di tipo
descrittivo o comportamentale. I modelli di scelta discreta sono intrinsecamente
comportamentali e differiscono da modelli semplicemente descrittivi proprio per la presenza
del paradigma formale decisionale. Esso rappresenta un processo di scelta, pur non essendo
necessariamente il comportamento vero del decisore.
Un modello descrittivo è in grado di rappresentare le scelte fatte dall'utente in funzione di
una serie di variabili esplicative, così come è in condizioni di rappresentare scelte diverse in
funzione di diversi valori assunti dalle variabili esplicative; si tratta, quindi, di una funzione
analitica tra una o più variabili esplicative ed una variabile dipendente (la scelta). Tale
funzione (vista come modello descrittivo) permette la rappresentazione dei risultati del
comportamento di scelta indipendentemente dalla rappresentazione di un comportamento.
Un modello comportamentale, invece, quale quelli basati sulla teoria delle scelte discrete,
pur rappresentare anche esso da un punto di vista matematico una relazione tra variabili
esplicative e scelte, ma lo fa attraverso la mediazione della rappresentazione esplicita di un
comportamento. In altri termini, la specifica razionalità utilizzata all'interno del paradigma
formale di scelta e le esplicite relazioni di causa-effetto che esso sottende sono i fattori che
determinano, nel modello, le scelte. Ad esempio, non sarebbe mai possibile, nella
simulazione della scelta di un'automobile, che un modello comportamentale rappresenti le
scelte dei decisori utilizzando come variabile esplicativa il costo di un chilo di mele, mentre
nulla impedisce che un modello descrittivo “funzioni” (e magari anche bene) nel mostrare
un eventuale bizzarra relazione statistica tra costo delle mele e scelta dell’automobile.
Analogamente, sempre ad esempio, ben difficilmente un modello comportamentale potrebbe
mostrare una preferenza di scelta all'aumentare (al di là di altre considerazioni) del costo
sopportato per la scelta stessa, a meno che il paradigma formale non espliciti le ragioni di un
tale controintuitivo comportamento. Un modello descrittivo, nelle stesse condizioni,
potrebbe invece tranquillamente mostrare una preferenza nella scelta di automobili che
costino di più, al di là di ogni necessità di spiegazione e rappresentazione che giustifichi un
tale fenomeno.
I modelli di scelta discreta che tratteremo nel seguito sono basati sulle ipotesi che:
§ il decisore conosca tutte le alternative dell'insieme di scelta;
§ associ ad ognuna di esse una quantità scalare (modelli monocriterio) che è un
indicatore della utilità della alternativa;
10
I MODELLI DI SCELTA DISCRETI
1 Esistono specificazioni sofisticate dei modelli d'utilità aleatoria in cui tale ipotesi è rilassata; in tali casi
occorre definire anche il modello con cui l'analista simula la percezione da parte del decisore (o la non
percezione, o il grado di percezione) delle diverse possibili alternative. Lo studio di tale tipo di modelli
esula dagli scopi di queste dispense.
2 Il fatto che l'utilità associata ad ogni alternativa sia espressa attraverso uno scalare che, in qualche modo,
riassume in un solo criterio diverse ragioni di scelta non è una ipotesi priva di motivazioni e di conseguenze.
Anzitutto, essa ha delle ragioni ben precise (non è facile fissare una metrica per delle grandezze vettoriali
e non sarebbe affatto facile definire con quali criteri un vettore può essere considerato maggiore di un altro).
Una delle conseguenze non banali è che, ad esempio, tale ipotesi permette (ma anche, impone) che nel
modello d'offerta, di cui si parlerà più oltre, gli attributi di costo dei percorsi siano omogeneizzati in un
costo di trasporto di percorso generalizzato.
3 In queste dispense si introducono modelli di scelta discreta di tipo aleatorio (o stocastico, o probabilistico,
o casuale, che dir si voglia), in cui, cioè, si considera una dispersione statistica delle utilità di scelta.
Evidentemente è possibile ragionare su modelli di scelta di tipo deterministico, in cui, cioè, si trascura la
dispersione statistica delle utilità. Nel seguito vi saranno numerosi accenni ai modelli deterministici che, da
un punto di visto logico, possono essere visti come un caso limite dei modelli aleatori al restringersi della
dispersione statistica.
11
I MODELLI DI SCELTA DISCRETI
risulta:
Uj= Vj+ej con ej~ v.a 2
dove:
§ Xj,k = generico attributo di scelta (k-esimo) per la generica alternativa j;
§ Xj = vettore degli attributi di scelta per la generica alternativa j;
§ X = [... ,XjT, ...] T vettore complessivo degli attributi di scelta.
Il paradigma formale di comportamento prevede che la scelta del decisore avvenga per quella
alternativa (tra quelle dell'insieme di scelta) che presenti la maggiore utilità percepita.
L'ipotesi di aleatorietà delle utilità percepite implica che non è possibile determinare quale
1 Si ricorda che esiste una relazione tra funzione di densità di probabilità e funzione di distribuzione di
probabilità per una variabile aleatoria multivariata. In generale, dunque, una può essere espressa in funzione
dell'altra.
2 Tale ultima ipotesi caratterizza, in realtà, una particolare famiglia di modelli di utilità casuale. Si tratta dei
modelli d'utilità casuale di tipo invariante. Si introduce fin da subito tale caratterizzazione perché il seguito
della trattazione avverrà con esclusivo riferimento a modelli invarianti. Le particolari proprietà di tali tipi
di modelli saranno introdotte più oltre.
12
I MODELLI DI SCELTA DISCRETI
sia la alternativa con la utilità maggiore ma solo la probabilità che ogni alternativa sia quella
d'utilità maggiore1. La probabilità che una data alternativa sia quella di maggiore utilità
coincide con la probabilità che quella alternativa sia scelta dal decisore.
" jÎI p(j) = Prob[ Uj = maxhÎI(Uh) ] 7
avendo introdotto:
§ p(j) = probabilità di scelta2 della generica alternativa j.
La precedente equazione equivale a definire la probabilità che la generica alternativa j sia
maggiore di ogni altra diversa alternativa appartenente all'insieme di scelta e cioè:
" jÎI p(j) = Prob[ Uj > Uh , " hÎI, j≠h] 8
o anche:
" jÎI p(j) = Prob[eh < (Vj - Vh) + ej , " hÎI, j≠h] 10
Quanto detto precedentemente esaurisce la descrizione generale dei modelli d'utilità casuale.
Ciononostante, alcune delle ipotesi implicitamente od esplicitamente sottese alle precedenti
formule meritano d’essere approfondite per la loro influenza sulle proprietà teoriche che ne
derivano. In particolare, è il caso di introdurre fin da subito alcuni concetti legati a:
§ la specificazione dei modelli rispetto agli attributi di scelta, il ruolo degli attributi
specifici e di quelli generici ed il ruolo dei parametri di reciproca sostituzione;
1 Una quantità aleatoria, infatti, non ha un “valore”. Essa ha, piuttosto, una distribuzione statistica di valori
che possono essere assunti con una certa probabilità. Di conseguenza non è possibile dire quando una
quantità aleatoria è maggiore di un'altra; è invece possibile dire quale è la probabilità che essa assuma un
valore maggiore di un'altra. Estendendo tale ragionamento a più quantità aleatorie, prese a due a due, è
evidente che non è possibile dire quale sia la massima tra le quantità ma solo quale è la probabilità che essa
assuma il valore massimo. Si ipotizza, inoltre, esplicitamente che la probabilità che due qualunque delle
v.a. possano assumere lo stesso valore sia nulla. Ciò è assicurato nel caso in cui le v.a. siano di tipo continuo.
2 A rigore, si sarebbe dovuta indicare la probabilità come p(j/I), ad esplicitare la dipendenza di essa dalla
composizione dell'insieme di scelta.
13
I MODELLI DI SCELTA DISCRETI
Da un punto di vista teorico, l'utilità sistematica può dipendere dagli attributi secondo una
funzione qualsiasi, in generale, però, soprattutto per esigenze legate alla calibrazione dei
modelli di scelta (tale argomento sarà trattato più oltre), si ipotizza una relazione lineare tra
attributi di scelta ed utilità sistematica. In particolare, si è soliti ipotizzare che la parte di
utilità sistematica dipendente dagli attributi di scelta possa essere espressa come
combinazione lineare degli stessi secondo opportuni parametri. In termini formali, con
riferimento ad una generica alternativa di scelta:
m
V jX ( X j ) = å b j,k × X j,k 13
k =1
dove, come già detto (equazione 5), il generico elemento Xj,k è il k-esimo attributo di scelta
ritenuto esplicativo per la scelta j e bj,k è il relativo parametro nella combinazione lineare. Ci
si potrebbe chiedere: “In che unità di misura è espressa la utilità?”. Evidentemente l'utilità
non rappresenta una grandezza fisica e, quindi, si potrebbe dire che essa è espressa con una
unità di misura propria, diciamo così convenzionale. Si potrebbe dare un nome a tale unità
14
I MODELLI DI SCELTA DISCRETI
di grandezza e dire che l'utilità è espressa in “util”. Si può anche decidere convenzionalmente
(ed è l'ipotesi che si fa in queste dispense) che l'utilità sia una grandezza adimensionale.
Congruentemente con l'adozione di tale ipotesi, dalla equazione 13 si evidenza che i
parametri della combinazione lineare (b) con cui si esprime l'utilità non sono grandezze
adimensionali. Ognuno di essi ha una unità di misura che è l'inverso dell'unità di misura
dell'attributo che moltiplica.
I parametri b sono spesso detti coefficienti di omogeneizzazione; essi, infatti, permettono di
sommare grandezze diverse in una grandezza omogenea. I parametri b sono, però, anche
detti parametri di reciproca sostituzione. Il rapporto tra due di essi, infatti, permette di
ottenere un coefficiente atto a trasformare la grandezza moltiplicata dal parametro a
denominatore nella grandezza moltiplicata dal parametro a numeratore. Per fissare le idee su
questo punto si considerino due classici attributi, tipici delle scelte di mobilità: il tempo
impiegato per uno spostamento ed il costo monetario connesso con lo spostamento stesso,
siano essi indicati, rispettivamente con bt e bc. L'unità di misura di bt ha dimensioni tempo-1
mentre quella di bc ha dimensioni costo-1. Se, dunque, si moltiplica il rapporto bt/bc per un
tempo si ottiene un costo (e viceversa, se si moltiplica il rapporto bc/bt per un costo si ottiene
un tempo). In particolare, il rapporto bt/bc è una sorta di valore monetario del tempo1 ed è
una grandezza ricorrente (spesso indicata con l'acronimo inglese VOT – Value of Time) in
molti dei modelli d'utilità casuale utilizzati nell'ambito della simulazione dei sistemi di
trasporto.
Uno stesso attributo k che compaia, seppure con valori diversi, nell'utilità di più di una
alternativa ed a cui, per ognuna delle alternative in cui compare, sia associato uno stesso
ìb k
valore del parametro bk ( b j,k = í "j Î I ) si dice generico, altrimenti si dice specifico
î0
dell'alternativa in cui compare. Ad esempio, nella seguente specificazione relativa a tre
alternative di acquisto di un modello di moto, gli attributi Costo e Cilindrata sono generici,
mentre l’attributo Lunghezza è specifico.
§ Alternativa 1 = Moto da strada, cilindrata 900cc, costo 15.000,00 €, lunghezza 1.80mt.;
§ Alternativa 2 = Scooter da città, cilindrata 250 cc, costo 6.000,00 €, lunghezza 1.45mt.;
1 Sembrerebbe valere, dunque, il vecchio adagio per cui “il tempo è denaro”. Si noti, comunque, che il valore
monetario del tempo non vuole essere introdotto come concetto “assoluto” ma, appunto, come semplice
concetto di “sostituzione” di due diverse grandezze relativamente alla sola scelta modellizzata. Si
tratterebbe, insomma, solo ed unicamente di un indicatore di quanto, ad esempio, un decisore sarebbe
disposto a pagare in più un servizio di trasporto al solo scopo di impiegare meno tempo per il suo
spostamento. In termini assoluti il tempo non ha un valore monetario, se non altro perché nessuno di noi sa
quanto ne ha a disposizione. Almeno il tempo dovrebbe sfuggire a qualunque logica di mercato.
15
I MODELLI DI SCELTA DISCRETI
Supponiamo sia perfettamente nota la distribuzione statistica delle utilità percepite e cioè, in
altri termini, che (cosa che non è) il vettore U possa essere osservato dall'analista.
Supponiamo che siano perfettamente noti e valutabili anche gli attributi che influenzano
l'utilità sistematica.
In questo caso si potrebbero valutare separatamente la media della utilità percepita (V=E[U])
e sottrarre ad essa la sola parte di utilità sistematica calcolata in funzione degli attributi
considerati (indicata con Vx(X)); ne potrebbe risultare un vettore di valori costanti ed
indipendenti dagli attributi. Tutto ciò non è altro che quanto già scritto nell’equazione 12. Al
1 La lunghezza di una moto Custom è in generale proporzionale alla lunghezza ed inclinazione della forcella
anteriore. Nessun amante del genere riesce a resistere ad una forcella anteriore spropositatamente lunga,
anche se la moto è tanto più inguidabile quanto più la forcella è lunga.
16
I MODELLI DI SCELTA DISCRETI
valore costante viene dato il nome, per ogni alternativa, di costante specifica dell'alternativa
(CSA).
CSAj = E[Uj] – VjX(Xj) 14
Se tale valore risultasse nullo, vorrebbe dire che gli attributi spiegano completamente il
paradigma comportamentale dell'utente (VjX = Vj). Le alternative per le quali questo valore
dovesse assumere valore non nullo sarebbero quelle (eventualmente anche tutte)
caratterizzate da una utilità (o disutilità) “per sé”, non spiegabile in funzione degli attributi
ma intrinseca dell’alternativa stessa e, soprattutto, costante.
Le costanti specifiche delle alternative sono, quindi, dei valori che permettono di spiegare
eventuali fenomeni per cui, a parità di utilità sistematica spiegata dagli attributi, una
alternativa potrebbe comunque essere sistematicamente preferibile rispetto ad altre.
La presenza delle CSA, inoltre, è anche una esigenza analitica; esse permettono di assicurarsi
che il valore atteso dei residui aleatori sia nullo. Per rendersi conto di questa esigenza si
supponga di trascurare nella specificazione del modello le costanti specifiche delle
alternative. Si supponga cioè di calcolare l’utilità sistematica come sola parte determinata
dagli attributi di scelta:
V_err = VX(X)
Nella realtà le utilità percepite non sono osservabili dall’analista e l’unico modo che egli ha
per stimarne la media è quella di stimare direttamente (con metodi che saranno spiegati più
oltre) l’utilità sistematica. Tutti gli errori che egli commette nella valutazione di questa utilità
sistematica devono potere cumularsi in maniera aggregata nel termine costante delle CSA.
Perché solo in questo caso il modello può compensare il valore “vero” ma inosservabile della
media delle utilità percepite in modo tale che il residuo aleatorio abbia effettivamente media
nulla. Le costanti specifiche delle alternative sono, dunque, anche una possibile camera di
compensazione di errori effettuati nella valutazione delle utilità sistematiche, per tale motivo,
da un punto di vista pratico, è opportuno analizzare ed approfondire con cautela modelli in
cui le costanti specifiche delle alternative tendessero a spiegare “troppa parte” dell'utilità
sistematica perché questo potrebbe risultare essere un indicatore del fatto di avere commesso
troppi errori modellistici.
Da un punto di vista formale, si è soliti uniformare la notazione relativa alle costanti
specifiche delle alternative a quella generalmente utilizzata per la specificazione dell'utilità
sistematica. In altri termini, si è soliti introdurre degli attributi, detti “attributi specifici
dell'alternativa” (ASA), che assumano valore unitario per l'alternativa a cui riferiscono e
valore nullo per tutte le altre alternative. Le costanti specifiche dell'alternativa vengono
17
I MODELLI DI SCELTA DISCRETI
trattate come se fossero i parametri (b) associati al relativo ASA. A scopo di esempio si
riporta di seguito la specificazione formale delle utilità sistematiche di un modello di scelta
tra tre alternative, due delle quali caratterizzate da costanti specifiche dell'alternativa.
V1 = V1X + CSA1 ASA1
V2 = V2X + CSA2 ASA2
V3 = V3 X
La precedente maniera di scrivere giustifica anche il nome dato agli ASA (e, di conseguenza,
alle CSA) che, come si vede, sono particolari attributi specifici.
Chi scrive preferisce che questa formalizzazione, che potrebbe portare a considerare gli ASA
alla stregua di “normali” attributi, non sia utilizzata. Non si consideri, quindi, l'introduzione
degli ASA e si considerino, invece, le CSA come la parte di utilità sistematica costante e non
spiegata dagli attributi.
Una delle peculiarità dei modelli di tipo invariante consiste nel fatto che le probabilità di
scelta stimate dal modello sono invarianti rispetto alla aggiunta, all'utilità sistematica di tutte
le alternative, di una stessa quantità costante.
Infatti, si supponga di avere un modello additivo di utilità aleatoria in cui, per definizione,
la distribuzione del vettore di dispersione aleatoria (fe(e)) non sia dipendente dall'utilità
sistematica. Un modello, insomma, per cui valga l'equazione 6. Si considerino due diversi
vettori dell'utilità sistematica, differenti l'uno dall'altro per una sola quantità costante
(scalare) V0:
V1 , V2 = V1 + V0 1
Si espliciti, per entrambe le utilità sistematiche, la probabilità di scelta di una generica
alternativa j utilizzando la formula 10:
p(j/V) = Prob[eh < (Vj - Vh) + ej , " hÎI, j≠h]
p(j/(V+V0 1)) = Prob[eh < (Vj + V0 - Vh – V0) + ej , " hÎI, j≠h]
¥
" j p( j / V ) = ò ... ò ... ò f (ε/V) de1 ...de j ...de n
e j= -¥ e1<e j + Vj -V1 e1<e j + Vj -Vn
¥
( (
" j p j / V + V ×1 = 0
)) ò ... ò ... ò f (ε/ (V + V
0
))
× 1 de1 ...de j ...de n
e j=-¥ e1<e j +Vj -V1 e1<e j + Vj -Vn
che, evidentemente, nel solo caso in cui f(e/V) = f(e) "eÎEn (equazione 6) certamente
coincidono.
Si noti che la precedente dimostrazione risulta ancora più semplice nel caso particolare in
cui la dispersione aleatoria sia costantemente nulla, nel caso in cui, cioè, Uj = Vj; si tratta di
un modello deterministico, la scelta si riduce alla determinazione dell'alternativa di massima
utilità sistematica e, come noto, i problemi deterministici di massimizzazione forniscono
risultati invarianti rispetto all'aggiunta di una quantità costante.
Abbiamo introdotto una particolarizzazione dei modelli di scelta discreta che è quella dei
modelli d'utilità casuale. Per essi si è fatta l'ipotesi fondamentale che le utilità associate ad
ogni alternativa di scelta siano caratterizzate da una dispersione aleatoria attorno al valore
medio. Può essere utile analizzare quali siano le possibili fonti dell'aleatorietà introdotta nel
paradigma formale di scelta di un generico singolo1 utente.
Un primo intrinseco motivo di aleatorietà può essere legato alla natura stessa degli attributi
utilizzati nel paradigma formale che, seppure variabili aleatorie, vengono tenuti in conto
nell'utilità sistematica attraverso il loro valore medio2. Si pensi, ad esempio, ad un modello
di scelta di una automobile ed all'attributo del consumo di carburante. È evidente che il
consumo di un’automobile è verosimilmente uno degli attributi che contribuiscono alla
scelta. È altrettanto evidente che esso (ad esempio, per una data automobile, “15 chilometri
con un litro”), seppure riferito a condizioni standard di funzionamento non può che essere
una media degli effettivi consumi, tutti tra loro diversi, che (se anche nelle stesse condizioni
e per la stessa vettura) si realizzerebbero riutilizzandola più volte. Analogamente, con un
esempio più calzante da un punto di vista dell'ingegneria dei trasporti, il tempo che un utente
1 Si tratta, per ora, il caso in cui il modello di scelta discreta sia applicato ad un singolo utente. Aspetti di
aleatorietà (dispersione statistica dei valori delle utilità) legati al fatto che ben raramente un modello di
scelta discreta è applicato in maniera totalmente disaggregata (per un singolo utente) hanno un peso
tutt'altro che trascurabile e saranno analizzati più oltre.
2 E non potrebbe essere diversamente, altrimenti l'utilità sistematica non sarebbe più tale.
19
I MODELLI DI SCELTA DISCRETI
può impiegare per effettuare un certo spostamento, seppure valutato sempre per uno stesso
modo di trasporto, sullo stesso percorso ed alla stessa identica ora della giornata, non sarà
mai esattamente lo stesso ogni volta che l'utente compirà quello spostamento. In ultima
analisi, la intrinseca dispersione aleatoria di tutti gli attributi considerati nel paradigma
formale viene in maniera aggregata1 considerata come dispersione aleatoria della utilità
percepita attorno al suo valore medio, questo ultimo calcolato attraverso il valore medio
degli attributi stessi.
Un secondo motivo di aleatorietà è connesso con un tipico problema di misura, ancora una
volta riferito agli attributi. Se anche si ammettesse per un certo attributo un valore
intrinsecamente deterministico (senza alcuna dispersione aleatoria), l'analista dovrebbe
comunque operare una misura di tale valore. Ebbene, è noto che ogni misura è
intrinsecamente affetta da un errore e che, nella migliore delle ipotesi, ripetute misure
permetterebbero solo di ottenere uno stimatore statistico del valore cercato e che, infine, tale
stimatore sarebbe intrinsecamente associato da una dispersione aleatoria.
Un terzo motivo di aleatorietà associato al paradigma formale del singolo decisore è
connesso alla intrinseca dispersione dei risultati della decisione. In altri termini, non è detto
che uno stesso decisore, posto più volte di fronte alla necessità di ripetere lo stesso processo
decisionale nelle stesse condizioni, debba necessariamente ripetere identicamente sempre la
stessa scelta. Tali scelte potrebbero essere determinate da una serie di fattori casuali che non
sono esplicitamente modellati e per i quali vi è bisogno di ricorrere alla teoria della
probabilità; ad esempio, uno stesso utente di fronte a più ripetizioni di una scelta modale
potrebbe essere influenzato da fattori casuali quali la pioggia, un momentaneo malessere che
gli impedisca di camminare troppo, ecc.
Ma l'ultimo, fondamentale e decisivo, motivo per cui è bene che un modello di scelta discreta
sia di utilità aleatoria deriva dalla possibilità di dimostrare che un modello di scelta
deterministico non è sufficientemente profondo. La logica di tale dimostrazione ripercorre
(ma ribalta) quella del famoso paradosso dell'asino di Buridano2. Si supponga, di avere
costruito un modello in grado di rappresentare i risultati delle scelte di un decisore razionale
in maniera deterministica. Si supponga di applicare un tale modello alla scelta tra due
1 Si noti che, al contrario di quanto spesso può sembrare nel parlare comune, la razionalità e l’aleatorietà
riferiscono a concetti ben diversi e non sono in antinomia.
21
I MODELLI DI SCELTA DISCRETI
Gli elementi della diagonale principale sono, in particolare, le varianze degli elementi della
variabile aleatoria multivariata:
sjh = sj2 = Var[ej] = E[(ej – E[ej])2] = E[ej2] 16
In definitiva:
é s12 s ... s1,n ù
1,2
ê 2
ú
ês 2 ,1 s 2 ... s 2 ,n ú
Se = ê 17
ê ! ! " ! úú
êës n ,1 s n ,2 ... s 2n úû
Si lascia al lettore la prova che tale matrice di dispersione può anche essere definita,
sfruttando i prodotti tra matrici, come:
Se = E[(e – E[e]) ( e – E[e])T] 18
Si noti che la matrice di dispersione è una matrice quadrata avente un numero di righe (e di
colonne) pari al numero di elementi del vettore di dispersione (e quindi pari al numero delle
alternative dell'insieme di scelta). È inoltre agevole dimostrare, dalla definizione di
covarianza, che la matrice di dispersione di una qualunque variabile aleatoria multivariata è
simmetrica1, dunque lo è anche la matrice varianza-covarianza del vettore di dispersione
aleatoria (Se =SeT). Si dimostra anche che la matrice di dispersione di una qualunque
1 Per una generica v.a. Y, sjh = E[(Yj – E[Yj] ) (Yh – E[Yh] )] = E[(Yh – E[Yh] ) (Yj – E[Yj] )] = shj
22
I MODELLI DI SCELTA DISCRETI
variabile aleatoria multivariata è una matrice positiva semidefinita1. Tale è, dunque, anche
la matrice varianza-covarianza del vettore della dispersione aleatoria. I modelli d'utilità
casuale, infine, sono sviluppati sotto le ulteriori ipotesi che le varianze di un qualunque
elemento del vettore di dispersione siano strettamente positive e che la matrice di dispersione
sia non singolare ( det(Se) ≠ 0 ).
Un modello di utilità deterministica può essere visto come il caso limite a cui tende un
modello di utilità aleatoria al tendere della matrice di dispersione alla matrice nulla (Se ® 0).
Ciononostante, molte delle proprietà teoriche dei modelli deterministici non possono essere
facilmente ottenute per banale estensione delle proprietà dei modelli aleatori e devono,
invece, essere specificamente analizzate.
1 æ-e ö é æ-e öù
fej ( e ) = expç - F ÷ expê- expç - F ÷ú 19
J è J ø ë è J øû
é æ-e öù
Fe j ( e ) = Pr[ε j £ e] = exp ê- expç - F ÷ú 20
ë è J øû
dove:
§ F è la costante di Eulero (pari a circa 0.577);
§ J è il parametro caratteristico della distribuzione, diverse forme della distribuzione di
Gumble possono essere ottenute al variare del valore J2.
La varianza del generico elemento ej, distribuito come una v.a. di Gumble, è pari a:
1 Per una generica v.a. Y, " a (n´1) aT SY a = aT E[(Y – E[Y] ) (Y – E[Y] )T] a = E[aT (Y – E[Y] ) (Y – E[Y]
)T a] da cui si evince che "a(n´1) aT SY a = E[b bT] = b2 ³0, avendo posto b = aT (Y – E[Y] ). La forma
quadratica associata ad una qualunque matrice di dispersione è, allora, non minore di zero e dunque una
qualsiasi matrice di dispersione è positiva semidefinita.
2 Si noti, per inciso, che l'ipotesi di invarianza, già introdotta in generale per i modelli d'utilità casuale di cui
ci occupiamo, si concretizza, nel caso del modello logit-multinomiale, nell'ipotesi che il valore del
parametro J sia indipendente dal valore delle utilità sistematiche.
23
I MODELLI DI SCELTA DISCRETI
J2
Var[e j ] = s 2j = p 2
6
L'ipotesi di identica distribuzione degli elementi del vettore di dispersione sta a significare
che le varianze di tutti gli elementi sono identiche:
J2
2
Var[e j ] = p " jÎ I
6
L'ipotesi di indipendenza tra gli elementi del vettore di dispersione aleatoria sta a significare
che le covarianze tra due qualsiasi elementi del vettore di dispersione sono nulle:
Cov[e j , e h ] = s j,h = 0 " ( j, h ), j ¹ h
Ne deriva che la matrice di dispersione associata ad un modello di tipo logit-multinomiale è
una matrice diagonale con elementi tutti uguali e può dunque essere scritta come prodotto di
uno scalare per la matrice identità di dimensioni pari al numero d’alternative nell’insieme di
scelta:
é 2 J2 ù
êp 0 ! 0 ú
ê 6 ú é1 0 ! 0ù
ê J 2
ú 2 ê 1 ! 0úú 2
Se = ê 0 p2 ! 0 ú = p 2 J ê0 =p 2 J
I
6 6 ê" " # "ú 6
ê " " # " ú
ê 2ú
ê ú
ë0 0 ! 1û
ê 0 2 J ú
0 ! p
êë 6 úû
È possibile dimostrare che, nelle ipotesi precedenti sulla distribuzione del vettore di
dispersione aleatoria, la equazione 9 può essere esplicitata con un'espressione di facile
calcolo:
æV ö
expç j ÷
Jø
" j Î I p( j) = Pr[V j - Vh > e h - e j , " h Î I , j ¹ h ] = n è 21
å expæçè Vh J ö÷ø
h =1
1
Attenzione! La proprietà IIA non è definita per il modello Logit multinomiale, anche altri modelli potrebbero
possederla. La definizione di indipendenza dalle alternative irrilevanti è che il rapporto tra le probabilità di
scelta di due qualsiasi alternative è costante rispetto ad una variazione di utilità sistematica di tutte le altre
o, anche, rispetto all’aggiunta di un’alternativa all’insieme di scelta.
24
I MODELLI DI SCELTA DISCRETI
Al variare dell’utilità di una (o più) qualsiasi delle alternative diverse dalle due considerate
(j e k) (dato che, per l'ipotesi di invarianza, il valore di J non può che rimanere costante), la
precedente equazione non varia.
Si supponga, inoltre, di aggiungere all’insieme di scelta un'alternativa, caratterizzata da un
qualunque valore dell'utilità sistematica:
I’ = IÈ{n+1} = {1, 2,…, j, …, n, n+1}
Si noti anzitutto che il valore del parametro J non può che restare inalterato per l'ipotesi di
invarianza (J=J'). Se si calcola il rapporto tra le utilità delle stesse precedenti alternative j e
k in questo nuovo contesto di scelta si ottiene sempre:
n
æV ö
p( j)
expç j ' ÷ å expæçè Vh J' ö÷ø
æ Vj - Vk ö æ V - Vk ö
= è Jø h =1
= expç ÷ = expç j ÷ " j, k Î I' Ì I , j ¹ k
p(k ) n æ V ö ç J' ÷ ç J ÷
æ Vh ö expç k ÷ è ø è ø
å çè J' ÷ø è J ø
exp '
h =1
Il che verifica l'invarianza del rapporto di probabilità anche rispetto all'introduzione di una
ulteriore alternativa nell'insieme di scelta.
La proprietà d'indipendenza dalle alternative irrilevanti è a volte una caratteristica
penalizzante rispetto alla verosimiglianza della rappresentazione dei fenomeni reali. Per
fissare le idee, si consideri un classico esempio limite in cui l'insieme di scelta sia costituito
da due modi alternativi per compiere uno spostamento: l'autovettura privata ed una linea di
autobus. Si supponga di aggiungere all'insieme di scelta una seconda linea di autobus,
25
I MODELLI DI SCELTA DISCRETI
differente dalla precedente per il solo fatto (è un caso limite) che i mezzi impiegati per il suo
esercizio sono, per esempio, di colore blu anziché arancione. La linea con i mezzi di colore
blu, quindi, ha la stessa utilità di quella con i bus di colore arancione e la sua introduzione
non varia l’utilità né dell’autovettura né della linea arancione. L'utilizzo di un modello logit
multinomiale condurrebbe ad una variazione delle probabilità di scelta dell'autovettura e
della linea arancione tale che, però, il loro rapporto di probabilità rimane eguale. Se, ad
esempio, prima dell'introduzione dei bus di colore blu la probabilità di scelta della
automobile era il 67% e quella della linea arancione il 33% (rapporto 2:1), dopo
l'introduzione dei bus blu le probabilità di scelta potrebbero essere del 50% per l'automobile
e del 25% per la linea arancione (sempre in rapporto 2:1). Evidentemente, dunque,
l'introduzione d'una alternativa irrilevante (quale la linea blu) ha rosicchiato probabilità alle
due precedenti alternative in maniera proporzionale alle precedenti probabilità. Questo è un
risultato controintuitivo, giacché è evidente che la linea blu concorre direttamente con la
linea arancione e non certamente con l'autovettura privata: avrebbe dovuto rosicchiare
probabilità alla sola linea arancione. In altri termini, il risultato più verosimile sarebbe stato
quello che la percentuale di scelta dell'autovettura rimanesse praticamente invariata e che la
restante parte di probabilità di scelta venisse egualmente divisa tra la linea arancione e quella
blu. È il caso di notare che il risultato controintuitivo ottenuto è il frutto, principalmente,
dell'ipotesi di indipendenza degli elementi del vettore di dispersione aleatoria. Nei successivi
paragrafi, infatti, si dimostrerà come la rimozione di tale ipotesi limitativa permetta di
ottenere risultati di simulazione più aderenti alle aspettative.
È evidente, dunque, che una teoria che prevedesse solo l'utilizzo del modello di utilità
casuale di tipo logit-multinomiale sarebbe una teoria esternamente incongruente, perché
incapace di cogliere alcuni dei fenomeni del sistema che si intende simulare. L'utilizzo del
modello logit-multinomiale è legittimo, anzi è consigliabile per la sua estrema semplicità e
trattabilità analitica, previa, però, la verifica che il contesto di utilizzo sia adeguato e, in
particolare, che possa essere considerata accettabile l'ipotesi di indipendenza statistica tra le
alternative. I modelli nested-Logit e Probit che saranno introdotti nei successivi paragrafi
permettono di ampliare il campo. In particolare, il modello nested-Logit può essere
considerato una generalizzazione del modello logit-multinomiale.
R
(Nodo Radice)
Livello 1
1 A
(alternativa semplice) (alternativa composta)
2 3
Livello 0
(alternativa semplice) (alternativa semplice)
Figura 3 – Esempio di struttura gerarchica ad 1 livello per un modello nested-LOGIT, ed albero delle scelte
corrispondenti
expæçV2 ö÷ expæç 3 ö÷
V
è JA ø è JA ø
p(2 / A) = ; p(3 / A) =
expæçV2 ö÷ + expæç 3 ö÷ expæçV2 ö÷ + expæç 3 ö÷
V V
è JA ø è JA ø è JA ø è JA ø
Occorre, a questo punto, determinare le probabilità di scelta di primo livello tra l'alternativa
(elementare) 1 e l'alternativa (composta) A. Per tale scopo, si associa alla alternativa
composta A una utilità percepita dipendente dalla massima utilità percepita tra le alternative
28
I MODELLI DI SCELTA DISCRETI
appartenenti al cesto1. Giacché sono aleatorie le utilità percepite delle alternative interne al
cesto, è aleatorio anche il loro massimo. Le alternative appartenenti al gruppo A, però, sono
state ipotizzate essere delle variabili di Gumble identicamente ed indipendentemente
distribuite con parametro JA e le variabili di Gumble godono di una importante proprietà
detta di “stabilità rispetto alla massimizzazione”. Il massimo di v.a. di Gumble identicamente
ed indipendentemente distribuite con parametro J è ancora una variabile di Gumble avente
ancora parametro J. È, inoltre, possibile dimostrare che il valore atteso del massimo di
variabili di Gumble identicamente ed indipendentemente distribuite può essere calcolato
come logaritmo della sommatoria degli esponenziali delle alternative di cui si cerca il
massimo. Nel caso del massimo tra le utilità delle alternative del gruppo A:
[ { }] æV
E max jÎA U j / A = J A × ln å expç j
J
ö
÷ = J A × YA
jÎA è Aø
Dove, per ipotesi, eA e e1 sono delle Gumble identiche ed indipendenti di parametro J0.
Inoltre, ricordando che le distribuzioni a tutti i livelli (e quindi hA e tutte le tj/A al variare di
j in A ed anche, di conseguenza, t_maxA) sono state ipotizzate tutte indipendenti:
s A2 =
p2 2
6
( )
J0 + J A2 ³ 0 Þ J02 - J A2 ³ 0 Þ J02 ³ J A2
Essendo i parametri J delle distribuzioni di Gumble dei valori non-negativi, deve risultare:
J0 ³ J A
1
Si suppone, in altri termini, di fare competere il cesto A con l’alternativa 1 in funzione del valore
(probabilisticamente) migliore di utilità tra le sue alternative 2 e 3.
29
I MODELLI DI SCELTA DISCRETI
Dunque, una importante proprietà del modello nested-Logit è quella che i valori dei
parametri devono decrescere dalla radice verso le foglie.
Al primo livello, ricapitolando:
U1 = V1 + e1 e1 ~ G (0, p2 J20 / 6)
UA = JA YA + eA eA ~ G (0, p2 J20 / 6)
e la matrice di dispersione del modello logit-multinomiale di primo livello vale:
p2 é1 ù
ΣR = J02 ê
6 ë 1úû
expæçV1 ö÷
p(1) = è J0 ø
expæçV1 ö÷ + expæçJ A Y A ö÷
è J0 ø è J0 ø
expæçJ A Y A ö÷
è J0 ø
p ( A) =
expæçV1 ö÷ + expæçJ A YA ö÷
è J0 ø è J0 ø
expæçJ A Y A ö÷ expæçV2 ö
÷
è J0 ø è JA ø
p(2) = p( A) × p(2 / A) = ×
V J Y
expæç 1 ö÷ + expæç A A ö÷ expæç 2
V ö + expæV3 ö
÷ ç J ÷
è J0 ø è J0 ø è JA ø è Aø
expæçJ A Y A ö÷ expæç 3 ö
V
J0 ø ÷
è è JA ø
p(3) = p( A) × p(3 / A) = ×
V J Y
expæç 1 ö÷ + expæç A A ö÷ expæç 2
V ö + expæV3 ö
÷ ç J ÷
è J0 ø è J0 ø è JA ø è Aø
30
I MODELLI DI SCELTA DISCRETI
E quindi VA = JA YD = 10.693
Risulta, quindi:
expæçV2 ö÷
è JA ø exp(10)
p(2 / A) = = = 0.5
æ
expç V2 ö æ V
÷ + expç J ÷
3 ö 2 exp(10 )
è JA ø è Aø
expæç 3 ö÷
V
è JA ø exp(10)
p(3 / A) = = = 0.5 (ma anche p(3 / A) =1 - p(2 / A) )
æ
expç V2 ö æ V
÷ + expç J ÷
3 ö 2 exp(10 )
è JA ø è Aø
p(1) =
expæçV1 ö÷
è J0 ø exp 10 (
2.24
)
æ
expç V1 ö æ V
÷ + expç J ÷
A ö
=
exp 10(2.24
+ )
exp (
10.693
2.24
)
= 0.42310
è J0 ø è 0ø
p( A) =
expæçV A ö÷
è J0 ø (
exp 10.693
2.24
)
= 0.57690 (ma anche p( A) =1 - p(1))
æ
expç V1 ö æ V
÷ + expç J ÷
A ö
=
exp 10 (
2.24
+ )
exp 10.693 (
2.24
)
è J0 ø è 0ø
31
I MODELLI DI SCELTA DISCRETI
0,4500
0,4300
0,4100
p(1)
0,3900
0,3700
0,3500
0,3300
0,3100
p(2)=p(3)
0,2900
0,2700
0,90 1,10 1,30 1,50 1,70 1,90 2,10 2,30
Al tendere ad uno del rapporto J0/JA si nota che le probabilità delle tre alternative tendo al
valore 1/3, cioè al valore che assumerebbero nel caso in cui fossero calcolato utilizzando un
modello logit-multinomiale anziché un modello nested-logit. Si dimostrerà più oltre in
maniera analitica che tale proprietà è una proprietà generale. In altri termini, un modello
nested-logit con parametri delle distribuzioni aleatorie tutti uguali non è nient’altro che un
modello logit-multinomiale. Ciò è confermato anche dal valore che assume la matrice di
dispersione del modello nel caso di parametri JA e J0 uguali:
éJ02 0 0 ù
p ê
2
2 ú p2 2
ΣR = ×ê 0 J0 J0 - J A2 ú ® J02 = Ja2 = J 2 Þ Σ R =
2
× J0 × I
6 ê 2 2 2 ú 6
0 J0 - J A J0 û
ë
Se, invece, si tende a fare aumentare il parametro J0 è facile verificare che la alternativa 1
tende ad assumere un valore di probabilità paria a 0.5 (indipendentemente dai valori delle
utilità sistematiche) e che le rimanenti due alternative (2 e 3 si ripartiscono equamente il
restante 50% di probabilità (questa volta nell’ipotesi che le loro utilità sistematiche siano
eguali).
32
I MODELLI DI SCELTA DISCRETI
p(1)
0,5000
0,4500
0,4000
0,3500
0,3000
p(2)=p(3)
0,2500
0,2000
2,0000 7,0000 12,0000 17,0000 22,0000 27,0000 32,0000 37,0000 42,0000 47,0000
Il motivo di tale andamento è da ricercarsi nel fatto che la varianza del modello di scelta di
primo livello (tra l’alternativa 1 e l’alternativa composta A) tende a crescere. Al suo tendere
ad infinito la dispersione aleatoria tende a prevalere fortemente sui valori sistematici di utilità
e, dunque, le alternative 1 e A tendono a divenire equiprobabili, indipendemente dal valore
assunto dalle loro utilità sistematiche.
Se, ancora, si prova a fare tendere a zero il valore del parametro JA, è facile anche in questo
caso verificare che i valori delle probabilità delle alternative 1 e A tendono a divenire uguali
e pari a 0.5. Questa volta, però, il fenomeno si verifica solo se le utilità sistematiche delle
alternative 1, 2 e 3 sono uguali. Il fenomeno è evidente nella successiva figura (la
diminuzione di JA, ovviamente e leggibile da destra verso sinistra)
33
I MODELLI DI SCELTA DISCRETI
0,5000
0,4500
p(1)
0,4000
0,3500
0,3000
p(2)=p(3)
0,2500
0,2000
0,0000 0,2000 0,4000 0,6000 0,8000 1,0000 1,2000
Questa volta l’andamento è determinato dal fatto che la covarianza tra le scelte di livello 0
(scelta tra 2 e 3 all’interno del cesto A) tende a divenire sempre più deterministico. Accade
allora che il cesto A tende a competere con l’alternativa semplice 1 direttamente con la sua
migliore utilità sistematica. In altri termini, la scelta di primo livello (tra A e 1) non è
influenzata in alcun modo aleatorio dalla scelta di livello 0 perché questa diviene nota a
priori; è possibile confrontare direttamente la migliore tra le alternative 2 e 3 (in questo caso
egualmente buone) con l’alternativa 1 ed il risultato di tale semplice modello logit-
multinomiale che ne risulta determina le probabilità di scelta del cesto A (e dell’alternativa
1).
Si noti anche che in entrambi i casi rappresentati dalle figure 5 e 6 si è fatta crescere la
covarianza tra le alternative 2 e 3, perché è cresciuto il rapporto J0/JA o, se si preferisce, la
differenza (J20 – J2A); esse, dunque, tendono sempre di più a competere congiuntamente con
l’alternativa A e dunque cresce la probabilità complessiva di scelta dell’alternativa 1 e
decrescono le probabilità complessive di scelta delle alternative 2 e 3. Tale fenomeno già
configura una situazione in cui è evidente che la proprietà IIA non vale per il modello nested-
Logit. Per verificarlo in modo esplicito procediamo numericamente.
Si noti che, nelle ipotesi introdotte inizialmente circa i valori delle utilità sistematiche in
gioco e dei parametri delle dispersioni aleatorie, il rapporto tra le probabilità complessive di
scelta delle alternative 1 e 2 vale:
p(1)/p(2) = 0.42310/0.28845 = 1.47
34
I MODELLI DI SCELTA DISCRETI
Allo scopo di evidenziare come, nel caso del modello nested-logit, l'introduzione (nel
precedente esempio) di una covarianza tra le alternative 2 e 3 eviti il verificarsi della
proprietà IIA (Independence of Irrilevant Alternatives), si modifichi la utilità connessa con
l'alternativa 3 portandola a:
V3 = 11
A seguito di tale variazione è facile verificare numericamente che le probabilità complessive
delle alternative 1, 2 e 3 ed il rapporto tra le probabilità di scelta dell'alternativa 1 e 2
divengono, rispettivamente:
p(1) = 0.35725
p(2) = 0.17286
p(3) = 0.46989
p(1)/p(2) = 2.07
Il rapporto p(1)/p(2) è dunque variato al variare dell’utilità dell’alternativa 3 e, dunque, non
vale la proprietà IIA.
Radice
Livello m
w
Livello r
k
Livello r-1
j h
Livello 0
i a
Ad un generico livello si indichi con k una alternativa composta contenente più alternative
(semplici o composte). La generica delle alternative contenute in k sia indicata con j (j Î k).
Si ipotizzi che le alternative contenute in k siano indipendentemente ed identicamente
distribuite come variabili aleatorie di Gumble. In particolare:
"jÎk Uj/k = Vj/k + ej/k con ej/k i.i.d. G (0, p2 J2k /6)
La probabilità condizionata di scegliere una qualunque alternativa del gruppo k è data
dunque da:
35
I MODELLI DI SCELTA DISCRETI
æV ö
expç j / k ÷
è J kø
"j Î k p( j / k ) =
å expæçè Vh / k Jk ö÷ø
hÎk
Le utilità sistematiche che compaiono nella precedente espressione possono essere espresse
eventualmente (se l’alternativa j è composta) in funzione delle alternative incluse in j:
"j Î k V j = J j × Y j
Nel caso invece in cui j sia una alternativa semplice, la sua utilità sistematica è nota a priori.
A loro volta, tutte le alternative contenute nel gruppo k determinano la variabile inclusiva
(Yk) del gruppo k che le contiene:
é æV j öù
Yk = ln êå expç ÷ú
êë jÎk è J k øúû
La probabilità di scegliere una alternativa semplice è data dalla produttoria delle probabilità
condizionate che tutti i gruppi di livello superiore che indirettamente o direttamente la
contengono siano a loro volta scelti. Rispetto alla precedente figura 7, ad esempio, la
probabilità di scelta della alternativa i è data da:
p(i) = p(i/j) p(j/k) p(k/w) p(w/radice) p(radice) con p(radice)=1
Si può inoltre dimostrare facilmente che le covarianze tra due qualunque alternative
elementari (i e a, ad esempio) sono pari a:
s i ,a =
6
(
p2 2
J0 - Jk2 ) 22
dove si è indicato con J0 il parametro associato al nodo radice (alle scelte, cioè, di livello
più alto – nella figura 7 il livello m) e con Jk il parametro associato al primo “antenato
comune” ad entrambe le alternative elementari, cioè al gruppo di livello più basso che le
contiene entrambe (nel caso della figura 7 e delle alternative i e a è il gruppo k).
Evidentemente, se il primo antenato comune ad entrambe le alternative elementari è la
radice, le alternative hanno covarianza nulla e, come atteso per il fatto di non appartenere né
direttamente né indirettamente ad alcun gruppo comune, sono indipendenti.
È il caso di notare che il modello nested-logit è stato qui ricavato con una procedura
induttiva, per estensione del modello logit-multinomiale.
In realtà si sarebbe potuta applicare anche una procedura inversa, in cui si sarebbe potuto
dapprima introdurre il modello nested-logit e poi ricavare quale caso particolare il modello
logit-multinomiale. Si sarebbe, anzi, potuto fare ancora di più. Si sarebbero potuti introdurre
36
I MODELLI DI SCELTA DISCRETI
æ 1 T ö
expç - ε Σ -1 ε ÷
f e (ε ) = è 2 ø 23
(2p) det (Σ )
n
1 A patto, ovviamente, che sia simmetrica e positiva semidefinita (per definizione di matrice di dispersione)
ed anzi, nei casi di nostro interesse, come già detto, anche non singolare e positiva strettamente definita.
37
I MODELLI DI SCELTA DISCRETI
La maggiore ampiezza, dunque, del modello Probit si paga con l'impossibilità di avere una
espressione “chiusa” della probabilità di scelta delle alternative. Tali probabilità, infatti, nel
caso di utilizzo del modello Probit, devono essere ottenute attraverso l'impiego di opportuni
algoritmi1 basati su tecniche di tipo numerico.
Il cosiddetto metodo Montecarlo viene discusso in questo paragrafo perché è una tecnica
classica per ottenere le probabilità di scelta di un modello di utilità casuale di tipo Probit. In
realtà non è assolutamente detto che possa essere utilizzato solo nel caso di funzioni di
densità di probabilità congiunte di tipo MVN, permette piuttosto di ottenere numericamente
una stima di probabilità a partire da qualunque tipo di legge di probabilità. L’utilizzo di tale
tecnica è piuttosto semplice. Verrà presentata in questo paragrafo direttamente con
riferimento alla soluzione numerica di un qualsiasi modello di utilità casuale.
Si supponga di avere un insieme di alternative di scelta:
I = {1, 2, …, j, …, n}
Si supponga di conoscere il vettore di utilità sistematiche delle alternative dell’insieme I:
" j ÎI Vj Þ V = [V1, V2, …, Vj, …, Vn]T
Si supponga anche nota la funzione di densità di probabilità congiunta del vettore dei residui
aleatori:
e = U – V, e » fe(e)
Si ipotizzi, infine, di avere uno strumento in grado di produrre delle realizzazioni aleatorie
distribuite proprio secondo la legge di distribuzione fe(e). Ad esempio, se il vettore aleatorio
e fosse composto da un solo elemento che può assumere, con uguali probabilità, tutti i valori
interi compresi tra 1 e 6, lo strumento in grado di produrre delle realizzazioni del vettore e
1 I metodi più diffusi in proposito sono il “Metodo di Clark” ed il “Metodo Monte Carlo”.
38
I MODELLI DI SCELTA DISCRETI
sarebbe un normale dado a 6 facce. Se, ancora ad esempio, il vettore aleatorio e fosse
composto da un solo elemento che può assumere con legge di probabilità uniforme tutti i
valori reali compresi tra 0 ed 1, lo strumento in grado di produrne delle realizzazioni aleatorie
sarebbe la funzione random() disponibile in tutti i linguaggi di programmazione di
calcolatori.
Più in generale, si indichi con r(fe) un realizzatore, cioè la funzione (tipicamente numerica
e non analitica) in grado di produrre realizzazioni con legge di probabilità fe(e). Una generica
di tali realizzazioni può, dunque, essere indicata con:
ē = r(fe).
Si immagini, a questo punto, di produrre un numero sufficientemente elevato di realizzazioni
del vettore aleatorio e. Ognuna di esse si ottiene da una applicazione del realizzatore:
" kÎ {1, 2, …, k, …, m} ēk = r(fe, k)
A tali realizzazioni corrispondono altrettante realizzazioni del vettore aleatorio delle utilità
percepite U:
" kÎ {1, 2, …, k, …, m} Ūk = V + ēk
Si indichi con Ūk,j la generica realizzazione k del generico elemento j del vettore delle utilità
percepite.
Si indichi mj il numero di volte (sulle m realizzazioni) in cui la realizzazione dell’utilità
percepita Ūk,j si è rivelata essere la massima all’interno del vettore Ūk.
Una stima della probabilità di scegliere l’alternativa j all’interno dell’insieme I può essere
espressa come:
mj
p( j / m ) =
m
È possibile dimostrare (e ciò è intuitivo se si pensa all’approccio cosiddetto “frequentistico”
alla teoria delle probabilità) che la stima ottenuta tende al valore “vero” della probabilità p(j)
al tendere ad infinito del numero di realizzazioni estratte (m):
m ® ¥ Þ p( j / m) ® p( j)
In altri termini:
p( j) = lim p ( j / m )
m =¥
1/6
e1 = e2 = e3
-3 0 3
( )
3 3
1
= ò (e1 + 3)2 de1 = 1 ò e1 2 + 6e1 + 9 de1 =
216 e1 = -3 216 e1 =-3
=
1 é1 3
216 êë 3
3 - (- (
3)3
+
6 2
2
3 - (- 3)) (
2
+ 9(3 + 3)ù
=
1
ú 216
û
(18 + 54)) =
1
3
1
Gli allievi sono invitati a ripetere l’esperimento qui descritto producendo, ad esempio, un opportuno foglio
di calcolo con il software Excel.
40
I MODELLI DI SCELTA DISCRETI
distribuite nell’intervallo1 [-3, +3]. Nelle seconde tre colonne del foglio di calcolo si
introducano delle formule che sommino i valori delle realizzazioni ottenute al valore di
utilità sistematica pari a 10, si ottengono così le realizzazioni delle utilità percepite. In una
terza terna di colonne del foglio di calcolo si introducano delle formule che diano risultato
unitario nel caso in cui la realizzazione di utilità percepita corrispondente sia la massima tra
le tre alternative. Alla fine, si sommino i valori ottenuti nell’ultima terna di colonne e li si
dividano per il numero di realizzazioni generate. I tre risultati così ottenuti sono una stima
delle probabilità di scelta delle tre alternative. Un esempio della procedura descritta, limitato
ad un numero di realizzazioni pari a sole 15 (m=15) è riportato nella seguente tabella.
È evidente che i valori ottenuti sono delle stime imprecise del valore 1/3 che si sarebbe
dovuto ottenere per tutte e tre le probabilità. La figura seguente mostra il variare delle stime
di probabilità ottenute al crescere del numero di estrazioni (fino a 1000, nella figura). Si noti
come progressivamente la stima tende al valore atteso di probabilità.
1
Utilizzando Excel (versione italiana) la formula da inserire per ottenere tale risultato è: 6*casuale()-3. La
funzione di Excel casuale(), infatti, permette di ottenere realizzazioni di una variabile aleatoria
uniformemente distribuita nell’intervallo [0,1]
41
I MODELLI DI SCELTA DISCRETI
0,9 p(1)
0,8
p(2)
0,7
0,6 p(3)
Probabilità
0,5
1/3
0,4
0,3
0,2
0,1
0
1 39 77 115 153 191 229 267 305 343 381 419 457 495 533 571 609 647 685 723 761 799 837 875 913 951 989
n° Estrazioni
L’utilizzo della tecnica Montecarlo nel caso delle tre alternative con utilità percepite
identicamente ed indipendentemente distribuite in maniera uniforma è, ovviamente,
nient’affatto necessario, giacché, come visto, le probabilità di scelta potrebbero essere
calcolate in maniera analitica ed esatta.
Si provi, però, a ripetere lo stesso esperimento nel caso di tre alternative sempre di identica
utilità sistematica (10) ed i cui elementi del vettore dei residui aleatori siano (sempre
indipendentemente, per semplicità) distribuiti come delle variabili Normali aventi tutte la
stessa varianza (pari a 16). È evidente che, ancora una volta, le particolarità dell’esempio
permettono di attendersi fin da subito delle probabilità di scelta delle alternative tutte uguali
e pari al valore 1/3. Questa volta, però, non è più possibile, data la difficoltà di risoluzione
dei modelli Probit, calcolare tali probabilità analiticamente ed in forma esatta. Occorre,
dunque, necessariamente ricorrere a tecniche numeriche quali quella del metodo Montecarlo.
Se si ripete la costruzione del foglio elettronico già descritta precedentemente1 si può
1
Nel caso delle realizzazioni di variabili gaussiane, la formula delle prime tre colonne del foglio elettronico,
in caso di utilizzo del software Excel (versione italiana), è: INV.NORM( casuale(); 0; 4 ). La funzione
INV.NORM(x; y; z), infatti, è l’inversa della distribuzione normale cumulativa di media pari al suo secondo
argomento (y) e deviazione standard pari al suo terzo argomento (z) in corrispondenza del valore di
probabilità paria al suo primo argomento (x). Si stanno, dunque, generando in maniera uniforme dei valori
casuali di probabilità (la funzione x=casuale() è uniformemente distribuita nell’intervallo [0,1]) e poi a tali
valori casuali si fanno corrispondere delle realizzazione della variabile aleatoria Gaussiana con media nulla
e varianza 16.
42
I MODELLI DI SCELTA DISCRETI
ottenere, per un numero di estrazione pari a 15, un risultato simile a quello della seguente
tabella.
Alternativa di max utilità percepita
e1 e2 e3 Ū1 = V1 +e1 Ū 2 = V2 + e2 Ū 3 = V3 + e3
1 2 3
1 5,9981 -0,4458 -4,2970 15,9981 9,5542 5,7030 1 0 0
2 -1,5207 -1,9307 -0,0215 8,4793 8,0693 9,9785 0 0 1
3 1,8181 -5,6632 -1,6652 11,8181 4,3368 8,3348 1 0 0
4 0,6196 -4,0154 -2,7471 10,6196 5,9846 7,2529 1 0 0
5 -2,0023 -1,5165 -5,1559 7,9977 8,4835 4,8441 0 1 0
6 0,7661 0,8718 7,0428 10,7661 10,8718 17,0428 0 0 1
7 3,0559 1,1664 -2,8191 13,0559 11,1664 7,1809 1 0 0
8 4,8150 -2,7989 -1,2162 14,8150 7,2011 8,7838 1 0 0
9 0,9062 2,7577 -1,7671 10,9062 12,7577 8,2329 0 1 0
10 0,2389 0,8386 -4,2293 10,2389 10,8386 5,7707 0 1 0
11 -6,7547 -0,5430 -0,4306 3,2453 9,4570 9,5694 0 0 1
12 3,0491 1,8313 2,6234 13,0491 11,8313 12,6234 1 0 0
13 -1,0915 2,1469 3,7586 8,9085 12,1469 13,7586 0 0 1
14 -2,1564 -0,2463 1,3970 7,8436 9,7537 11,3970 0 0 1
15 3,3906 0,5426 0,6223 13,3906 10,5426 10,6223 1 0 0
Numero di volte in cui l’alternativa è di massima utilità percepita 7 3 5
Stima dei valori di probabilità 0,4667 0,2000 0,3333
I valori delle stime di probabilità migliorano all’aumentare del numero di estrazioni delle
realizzazioni aleatorie, come dimostrato dalla seguente figura.
0,9 p(1)
0,8
p(2)
0,7
0,6 p(3)
Probabilità
0,5
1/3
0,4
0,3
0,2
0,1
0
1 39 77 115 153 191 229 267 305 343 381 419 457 495 533 571 609 647 685 723 761 799 837 875 913 951 989
n° Estrazioni
43
I MODELLI DI SCELTA DISCRETI
Nel caso, invece, d'un modello di tipo nested-logit, data una alternativa composta (gruppo)
denominata con k, le cui alternative elementari sono distribuite (rispetto alla scelta
condizionata all'interno del gruppo k) con parametro Jk, la soddisfazione associata al gruppo
k stesso è data dall'espressione:
é æV öù
s k (Vk ) = J k × ln ê expç j ÷ú = Jk × Yk (Vk )
å êë jÎk è J k øúû
Dove si è indicato con Vk il vettore delle utilità sistematiche delle alternative j all'interno del
gruppo k.
Nel caso, di un modello Probit non è possibile dalla definizione 24 e dalla legge di probabilità
congiunta del residuo aleatorio (fe(e)) propria della variabile aleatoria normale multivariata,
ottenere una espressione in forma chiusa per la variabile di soddisfazione. In tale caso,
comunque, essa può essere calcolata ricorrendo a tecniche di tipo numerico, ad esempio
utilizzando un metodo di tipo Montecarlo2.
1 Si tratta di quanto già detto in fase di derivazione del modello nested-Logit, giacché la soddisfazione è il
valore atteso della massima utilità percepita e la variabile aleatoria di Gumble gode della proprietàdi
stabilità rispetto alla massimizzazione.
2
A tale scopo è sufficiente applicare normalmente la tecnica Montecarlo, ottenendo m realizzazioni del vettore
di utilità percepite. All’interno di ogni realizzazione ottenuta si considera il valore di utilità massima
percepita tra tutte le alternative. Di tutti questi valori di utilità percepite massime si fa poi la media
aritmetica rispetto al numero di realizzazioni estratte (m).
44
I MODELLI DI SCELTA DISCRETI
Dove si è indicato con Vmax la massima utilità sistematica all'interno dell'insieme di scelta
Si verifichi ora tale proprietà nel caso del modello logit multinomiale.
é æ V öù é æ V öù é J × Vmax öù
s(V ) - Vmax = J lnêå expç j ÷ú - Vmax = J lnêå expç j ÷ú - lnêexpæç
êë jÎI è J øúû êë jÎI è J øúû ë è J ÷øúû
é æ V öù é Jù
Þ s(V ) - Vmax = J lnêå expç j ÷ú - lnêexpæç max ö÷ ú
V
êë jÎI è J øúû ëê è
Jø ú
û
é æV öù
é ê å expç j ÷ ú
è J øú
æ V j öù é æ Vmax öù ê
Þ s(V ) - Vmax
jÎI
= J lnêå expç ÷ú - J × lnêexpç = J ln
êë jÎI è J øúû ë è J ÷øúû ê æV öú
ê expç max J ÷ ú
êë è øú
û
é æV öù
ê å expç j ÷ ú
è J øú
Þ s(V ) - Vmax = J lnê1 +
ê
jÎI , j¹ j max
ú
( )
= J × ln 1 + a 2 ³ 0 Þ s(V ) ³ Vmax
expæç max ö÷ ú
V
ê Jø
êë è úû
Nei precedenti passaggi algebrici si è utilizzata la caratteristica della funzione esponenziale
di avere valori (condominio) nell’insieme R+ e della funzione logaritmo di assumere valori
positivi per argomenti maggiori dell'unità.
1 L'estensione della verifica delle proprietà enunciate al caso delle scelte condizionate delle alternative di un
dato gruppo all'interno di un modello nested-logit è banale ed è lasciata come esercizio al lettore.
45
I MODELLI DI SCELTA DISCRETI
Proprietà 2
Il valore della variabile di soddisfazione associata ad un certo insieme di scelta è non minore
della media pesata (utilizzando le probabilità di scelta) dell'utilità sistematiche delle
alternative dell'insieme di scelta stesso:
s(V ) ³ å p( j) × V j = p(V ) × V
T
27
jÎI
Dove si è indicata con p(V) la funzione (vettoriale di vettore) di probabilità di scelta delle
alternative dell'insieme. Questa proprietà è assai facilmente dimostrabile per un qualunque
caso, infatti:
Þ p(V ) × V £= Vmax
T
p(V ) × V £ s (V )
T
Proprietà 3
Se il modello di scelta, oltre ad essere additivo, è caratterizzato da una funzione di probabilità
p(V) continua1, la derivata parziale della variabile di soddisfazione rispetto all'utilità d'una
qualunque alternativa dell'insieme coincide con la probabilità di scelta dell'alternativa:
¶s(V )
= p( j) "j Î I 28
¶Vj
In forma vettoriale tale proprietà si può esprimere come:
Ñs(V) = p(V)
28b
Si verifichi tale proprietà nel caso del logit-multinomiale:
é é æ V öù ù
ê lnêå expç h J ÷ú å expæç h ö÷ ú
V
¶s(V ) ¶ é é æ V öù ù ê ëhÎI è øû hÎI è J ø ú
= êJ × lnêå expç h J ÷ú ú = J × ê¶ ×¶ ú
¶V j ¶V j êë ëhÎI è øû úû æ Vh ö
ê ¶ å expç J ÷
¶V j
ú
ê hÎI è ø ú
ë û
1 E' possibile dimostrare che è questo il caso sia per i modelli logit-multinomiale e nested-logit che per il
modello Probit (deriva dalla continuità delle relative funzioni di densità di probabilità fe (e)).
Evidentemente, dunque, questa proprietà e tutte quelle successive basate sulle stesse ipotesi, non sono
applicabili in generale nel caso in cui p(V) sia una mappa a più valori e non una funzione; non lo sono, per
esempio, nel caso di modelli di scelta deterministici.
46
I MODELLI DI SCELTA DISCRETI
¶s(V ) 1 1 æV ö
Þ = J× × × expç j ÷ = p( j)
¶V j J
å expæçè Vh J ö÷ø J è ø
hÎI
Proprietà 4
Se il modello di scelta, oltre ad essere additivo, è caratterizzato da una funzione di probabilità
p(V) continua, la variabile di soddisfazione aumenta al crescere dell'utilità sistematica di una
qualunque alternativa:
¶s(V )
³ 0 "j Î I 29
¶V j
Questa proprietà è di facilissima dimostrazione Infatti, per la proprietà 3:
¶s(V ) ¶s(V )
= p( j) "j Î I e poiché la probabilità è positiva per definizione: ³0
¶Vj ¶V j
Si lascia al lettore la verifica di tale proprietà per il modello logit-multinomiale (a tale scopo
si ricordi che le funzioni logaritmo ed esponenziale sono entrambe monotone crescenti e che
Proprietà 5
Se il modello di scelta, oltre ad essere additivo, è caratterizzato da una funzione di probabilità
p(V) continua, la variabile di soddisfazione cresce al crescere del numero d'alternative
nell'insieme di scelta:
[ ] [
s(V) < s(V' ) con V T = V1 ,V2 ,...,Vj ,...,Vn , V'T = V1 ,V2 ,...,Vj ,...,Vn ,Vn+1 ] 30
Questa proprietà si può intuire per estensione della proprietà 4. Aggiungere una alternative
all'insieme di scelta, infatti, può essere interpretato come il fare passare l'utilità sistematica
della alternativa n+1 dal valore -¥ al valore finito Vn+1.
Si verifichi questa proprietà nel caso del modello logit-multinomiale.
én æV ö ù én æ V öù
s(V') - s(V ) = J × lnêå expç j ÷ + expæç n +1 ö÷ú - J × lnêå expç j ÷ú =
V
ë j=1 è Jø è Jø
û ë j=1 è J øû
n
æ Vj ö é ù
å expçè + expæç Vn +1 ö÷ æ ö
J ÷ø ê V + ú
Jø expç n 1
J ÷ø ú
= J × ln
j=1
n
æV ö
è ê
= J × lnê1 + n è
ú [ ]
= J × ln 1 + a 2 > 0
å expçè j J ÷ø ê å expæç V j ö÷ ú
j=1 ê j=1
ë è J ø úû
[
Þ s(V') - s(V ) = J × ln 1 + a 2 > 0 ]
47
I MODELLI DI SCELTA DISCRETI
Dove si è tenuto conto del fatto che la funzione logaritmo assume valori positivi per
argomenti maggiori dell'unità e che la funzione esponenziale ha valori nell'insieme R+.
Proprietà 6
Se il modello di scelta, oltre ad essere additivo, è caratterizzato da una funzione di probabilità
p(V) continua, con derivate parziali prime continue1, la variabile di soddisfazione è
convessa rispetto al vettore delle utilità sistematiche:
s(µ V + (1 - µ) V' ) £ µs(V) + (1 - µ)s(V' ) " V, V' "µ Î [0,1] 31
La dimostrazione generale, nonché la verifica di tale proprietà nel caso del logit-
multinomiale, richiedono entrambe un numero non banale di passaggi matematici.
Proprietà 7
Se il modello di scelta, oltre ad essere additivo, è caratterizzato da una funzione di probabilità
p(V) continua, con derivate parziali prime continue, la variabile di soddisfazione ha matrice
Hessiana (simmetrica) positiva semidefinita.
aT Hess[s(V)] a ³ 0 "aÎEn 32
Proprietà 8
Se il modello di scelta, oltre ad essere additivo, è caratterizzato da una funzione di probabilità
p(V) continua, con derivate parziali prime continue, le probabilità di scelta delle alternative
hanno matrice Jacobiana (simmetrica) positiva semidefinita.
Tale proprietà deriva direttamente dalla proprietà 7 e dalla proprietà 3.
Infatti, la proprietà 3 esprime che Ñs(V) = p(V) e quindi Hess[s(V)]= Jac[p(V)], in termini
espliciti:
1 È possibile dimostrare che questo è il caso dei modelli logit-multinomiale, nested-logit e Probit.
Ovviamente, ancora una volta, questa proprietà e quelle che si basano sulle stesse ipotesi non sono
applicabili nel caso in cui p(V) sia una mappa a più valori e non una funzione; non sono applicabili, ad
esempio, al caso dei modelli deterministici.
48
I MODELLI DI SCELTA DISCRETI
é ¶ 2s ¶ 2s ¶ 2s ¶ 2s ù
ê ! ! ú
ê ¶V1
2 ¶V1¶V2 ¶V1¶V j ¶V1¶Vn ú
ê ¶ 2s ¶ 2s ¶ 2s ¶ 2s ú
ê ! ! ú
ê ¶V2 ¶V1 ¶V22 ¶V2 ¶V j ¶V2 ¶Vn ú
ê ú
Hess[s(V )] = ê "2 " # " # "
¶ s ¶ 2s ¶ 2s ¶ s ú
2
ê ! ! ú
ê ¶V j¶V1 ¶V j¶V2 ¶V j2 ¶V j¶Vn ú
ê " " # " # " ú
ê 2 ú
ê ¶ s ¶ 2s ¶ 2s ¶ 2s ú
! !
ê ¶Vn ¶V1 ¶Vn ¶V2 ¶Vn ¶V j ¶Vn2 úû
ë
Ed utilizzando l'espressione 28 della proprietà 3:
In definitiva, dunque, anche la matrice jacobiana Jac[p(V)] gode della stessa proprietà di
essere semidefinita positiva della matrice Hess[s(v)] a cui è equivalente.
Proprietà 9
Se il modello di scelta, oltre ad essere additivo, è caratterizzato da una funzione di probabilità
p(V) continua, con derivate parziali prime continue, le probabilità di scelta delle alternative
sono monotone crescenti rispetto alle utilità sistematiche:
49
I MODELLI DI SCELTA DISCRETI
Proprietà 10
Se il modello di scelta, oltre ad essere additivo, è caratterizzato da una funzione di probabilità
p(V) continua, con derivate parziali prime continue, la probabilità di scelta di una data
alternativa dell'insieme di scelta cresce al crescere della sua utilità sistematica, se le utilità
di tutte le altre alternative restano costanti:
¶p( j)
³ 0 " jÎ I 34
¶Vj
o, in termini più espliciti:
[
V T = V1 , V2 ,...,V j ,...,Vn ] ü
ï
ý ® p' ( j) ³ p( j) " j Î I
V' T
= [V1 , V2 ,...,V j + DV j ,...,Vn ] con DV j ³ 0ï
þ
Anche la dimostrazione generale di tale proprietà è immediata. Infatti, dalla proprietà 9:
[p(V) - p(V')]T × (V - V') ³ 0 " V ,V' che può essere scritta per qualunque valore dei
[
vettori V e V', e quindi anche per V'T = V1 , V2 ,...,Vj + DVj ,...,Vn . ]
[ ]
Poiché V T - V'T = 0,0,...,-DVj ,...,0 , risulta:
æV ö é æ V öù
expç j ÷ -1 êå expç h J ÷ú
è J ø × é expæ Vh öù + expæ V j ö × ¶ ëhÎI è øû
=¶ êå ç J ÷ú ç J÷
¶V j ëhÎI è øû è ø ¶V j
æV ö æV ö æV ö
expç j ÷ expç j ÷ expç j ÷
= è J ø × +(- 1) è J ø è J ø = p( j) - p( j) × p( j) = p( j) (1 - p( j))
Jå expæç h ö÷
V é ù
2 J J J J
æ V ö
hÎI è Jø ê å expç h
Jø÷ ú
ëhÎI è û
¶p( j)
Þ ³0
¶Vj
Avendo considerato che, per definizione, la probabilità è un valore compreso tra 0 ed 1.
50
I MODELLI DI SCELTA DISCRETI
1 Questa è l'unica ipotesi che, nel seguito, non sarà più rilassata.
2 Relative, cioè, all'insieme dei decisori.
51
I MODELLI DI SCELTA DISCRETI
p( j) = ò p( j / X ) f X (X ) dX " j Î I
X
dove si è indicato con:
§ p(j) la probabilità aggregata di scelta della alternativa j per l'insieme di decisori;
§ p(j/X) la probabilità di scelta dell'alternativa j condizionata al valore assunto per
ognuno dei decisori dal vettore degli attributi;
§ fX(X) la densità di probabilità congiunta della distribuzione del vettore degli attributi
di scelta (dispersi, appunto, tra i decisori).
Tale approccio non è agevole, se non altro perché per attuarlo occorrerebbe conoscere la
distribuzione della dispersione del vettore degli attributi e questa potrebbe portare a
complicazioni analitiche anche notevoli.
Ancora una volta, si preferisce ricorrere, nella pratica simulativa, all'approccio del “decisore
medio”. Gli attributi utilizzati, quindi, sono quelli medi ( X ) rilevati all'interno dell'insieme
dei decisori. Le probabilità di scelta delle alternative sono calcolate rispetto a tali attributi
medi, cumulando (in maniera aggregata) la dispersione del valore degli attributi nella
dispersione del residuo aleatorio associato alle alternative che ha, quindi, un motivo in più
per non essere identicamente nullo e che risulta, in questo caso, ancora più disperso rispetto
al caso in cui si consideri un solo decisore.
Nel caso in cui la dispersione degli attributi all'interno dell'insieme dei decisori presenti una
varianza troppo elevata, il metodo del decisore medio tende, ovviamente, a dare risultati
poco attendibili. Si ricorre, in questi casi, all'accortezza di partizionare l'universo dei decisori
in più sottoinsiemi, caratterizzati, ognuno, da una minore varianza nella dispersione dei
52
I MODELLI DI SCELTA DISCRETI
valori degli attributi. Le probabilità di scelta vengono calcolate per ognuno di tali insiemi di
decisori con il metodo del “decisore medio”. In termini formali:
scelta æç p i æç j / X i ö÷ ö÷ .
è è øø
Esistono metodi di aggregazione delle scelte per più decisori più raffinati di quello basato
sull'utente medio. Uno di questi metodi è quello cosiddetto della enumerazione campionaria
(in inglese sample enumeration). Tale metodo non è di difficile attuazione, la sua
descrizione, comunque, esula dagli scopi di questo modulo didattico.
53
LA DOMANDA DI TRASPORTO
3 LA DOMANDA DI TRASPORTO
1
Nel seguito, per semplicità, sottenderemo che ci si riferisca esclusivamente alla mobilità di persone e non alla
mobilità delle merci.
54
LA DOMANDA DI TRASPORTO
esempio, non è imposta a priori). Per tale motivo, in luogo della definizione di “non
sistematici” si utilizza talvolta quella di non vincolati.
Una delle principali caratterizzazioni analitiche della mobilità avviene tipicamente
associando alla domanda di trasporto proprio la caratteristica motivazionale (legata, come
detto, alle esigenze primitive che la mobilità è intesa a soddisfare, ad esempio spostamenti
per il motivo Lavoro, Studio, Svago, …). Altre caratteristiche importanti sono quelle:
temporali (il periodo di riferimento cui la mobilità viene analizzata); spaziali (l’origine e/o
la destinazione degli spostamenti); di modalità degli spostamenti (il modo con cui gli
spostamenti vengono effettuati - ad esempio in auto, coi mezzi di trasporto collettivo, ecc.).
Di volta in volta, a seconda del particolare contesto di analisi e simulazione, ulteriori
caratterizzazioni possono essere ritenute rilevanti per l’individuazione modellistica del
fenomeno della mobilità.
Per l'analisi della domanda di trasporto esistono più approcci. In particolare, i due approcci
principali sono classificabili nelle grandi famiglie dei metodi di stima diretta e dei modelli
per la determinazione dei flussi di domanda.
I diversi approcci sono entrambi caratterizzati da limiti di utilizzo. Ad esempio, i metodi di
stima diretta possono essere utilizzati solo per l'analisi della domanda di un sistema di
trasporto nella sua configurazione attuale, o per quelle aliquote di domanda che sia
ragionevole ritenere invarianti rispetto all'evoluzione/modifica del funzionamento del
sistema. Non possono essere, invece, utilizzati per la stima della domanda da prevedere in
caso di evoluzione della configurazione del sistema esaminato. I modelli per la
determinazione dei flussi di domanda, d'altro canto, non hanno la precedente limitazione e
possono essere utilizzati sia per l'analisi della configurazione corrente che per la
stima/previsione di configurazioni future. Essi, però, presentano limiti d'applicazione legati
alla necessità di essere alimentati con i dati caratteristici della configurazione territoriale e
socioeconomica che si vuole analizzare; tipicamente, i modelli per la determinazione dei
flussi di domanda possono essere utilizzati per l'analisi (o per la previsione) della domanda
di trasporto scambiata tra il sistema individuato e l'esterno del sistema stessa (e viceversa)
solo con notevoli difficoltà ed approssimazioni. D’altra parte, le relazioni tra sistema ed
ambiente esterno dovrebbero essere invarianti per definizione e ad esse possono dunque
essere bene applicati approcci di stima diretta.
In questa sede, comunque, saremo interessati allo studio dell’approccio modellistico per la
determinazione dei flussi di domanda, trascureremo l’approccio di stima diretta.
55
LA DOMANDA DI TRASPORTO
Essa è la funzione analitica con cui la domanda può essere determinata in funzione delle
variabili che la determinano e che ne determinano le caratteristiche.
Esistono diverse approcci che possono essere utilizzati per la messa a punto di modelli di
domanda. L'approccio più completo (e complesso) consiste nel simulare esplicitamente per
i potenziali utenti del sistema dei trasporti la successione (temporale e spaziale) delle attività
che compiono ed, in conseguenza di queste, la successione congruente di spostamenti (con
le relative caratteristiche) che permette di compiere tali attività. Tale approccio, che è la
migliore esplicitazione del concetto di domanda di trasporto come esigenza derivata, è
denominato activity-based; esso è tutt'altro che di agevole formulazione ed applicazione e,
allo stato attuale, deve essere soprattutto considerato come un argomento di ricerca, ancora
in piena fase di maturazione. Nei modelli detti di tipo tour-based, invece, la successione
delle attività si ritiene nota (non viene esplicitamente simulate ma si assume esogenamente
al modello) ed in base ad essa i diversi spostamenti che ne derivano vengono simulati
facendo attenzione alla loro concatenazione1. I modelli più consolidati e maturi, infine, sono
basati su approcci cosiddetti trip-based. In essi la successione di attività è assunta
esogenamente al modello e non viene esplicitamente simulata la concatenazione degli
spostamenti che ne risultano; si preferisce, invece, semplificare il problema ipotizzando che
ogni spostamento avvenga indipendentemente dall'altro e che la presenza di attività sul
territorio induca indipendente ogni spostamento.
I modelli di domanda che si tratteranno nel seguito saranno esclusivamente di tipo trip-based;
essi, inoltre, saranno finalizzati alla sola simulazione delle caratteristiche della domanda
1
Questo significa, ad esempio, che si considera esplicitamente il fatto che due spostamenti di uno stesso tour
debbano essere tali che la destinazione del primo coincide con la origine del secondo e che, sempre ad
esempio, se il primo è stato effettuato con un mezzo pubblico (e non ha come destinazione un luogo in cui
si ha a disposizione la propria automobile), il secondo non può essere effettuato con la vettura privata.
56
LA DOMANDA DI TRASPORTO
associate con le cosiddette scelte di viaggio, non anche di quelle associate alle cosiddette
scelte di contesto, quali ad esempio la scelta del luogo di residenza, del luogo di lavoro, di
possedere la patente di guida, la scelta del numero di automobili possedute (in famiglia), ecc.
In particolare, nel seguito si farà riferimento proprio a modelli finalizzati alla
rappresentazione di una domanda caratterizzata da:
§ un periodo di riferimento (ad esempio l'ora di punta antimeridiana di un giorno feriale
medio);
§ una caratteristica motivazionale (ad esempio spostamenti che avvengono per il motivo
Casa-Acquisti);
§ una caratterizzazione spaziale, identificata con una coppia di luogo di origine e
destinazione, intesi come opportune aggregazioni discrete (in zone di origine e
destinazione) della continuità di localizzazioni spaziali possibili in un'area di studio;
§ una caratterizzazione modale (ad esempio distinguendo spostamenti che avvengono a
piedi da quelli che avvengono con autovettura privata, da quelli che avvengono con
servizi di trasporto collettivo, ecc.).
La precedente caratterizzazione della domanda è solo una delle possibili, nulla impedisce
caratterizzazioni diverse e/o più ampie, a patto, ovviamente, di mettere a punto modelli adatti
a simulare tali diverse caratterizzazioni. È il caso di notare, comunque, che la
caratterizzazione sopra elencata è tra le più utilizzate nella pratica. Essa dà luogo ai flussi di
domanda nella loro accezione più comune; ad esempio un flusso di domanda con le
caratteristiche precedenti può essere formalmente espresso come:
d(h, s, o, d, m)
dove:
§ h è il periodo di riferimento;
§ s è il motivo dello spostamento;
§ o l'origine;
§ d la destinazione;
§ m il modo di trasporto.
Insomma, un flusso di domanda del tipo precedente potrebbe essere: il numero di utenti che
nel periodo di riferimento h (l'ora antimeridiana di punta di un giorno feriale medio) si sposta
per il motivo s (Casa-Acquisti) dall'origine o (il quartiere Vomero di Napoli) alla
57
LA DOMANDA DI TRASPORTO
1 2 ... j ... n
Figura 11 – Insieme delle alternative di scelta per un modello di domanda
La j-esima alternativa di Figura 11, rispetto alla caratterizzazione della domanda adottata
come esempio, potrebbe assumere il significato: spostarsi per il motivo s, nel periodo di
riferimento h, compiendo x spostamenti, partendo dall'origine o, giungendo nella
destinazione d ed usando il modo m.
Con tale approccio, il modello di domanda potrebbe essere rappresentato attraverso un
modello di scelta discreta come:
d(h, s, o, d, m) = Nå x p( j = [h, s, o, d, m, x]) jÎ I
x
oppure
d(h, s, o, d, m) = å N i å x p i ( j = [h, s, o, d, m, x]) j Î I i
i x
a seconda che tutti i (potenziali) utenti del sistema siano rappresentati nel modello di scelta
discreto come un unico decisore collettivo (di numerosità N), oppure siano classificati in più
gruppi (il cui generico è indicato con i ed ha numerosità Ni) di decisori collettivi. Le
probabilità p(j) (o pi(j), a seconda dei casi) si ottengono con un modello di scelta discreta
utilizzando l'approccio del decisore medio. Il numero n di alternative di scelta discrete può
1 Spesso l'insieme (per una data area di studio) dei flussi di domanda, così come precedentemente
caratterizzati, viene rappresentato in forma matriciale, identificando le origini e destinazioni degli
spostamenti rispettivamente con le righe e colonne di una matrice, indicata con d(h, s, m). L'elemento di
riga o e di colonna d dod(h,s,m) corrisponde al flusso di domanda d(h,s,o,d,m).
58
LA DOMANDA DI TRASPORTO
Radice
E=[s] s ...
D=[s,h] h ...
C=[s,h,x] x ...
B=[s,h,x,o] o ...
A=[s,h,x,o,d] d ...
j=[s,h,x,o,d,m] ...
m
Figura 12 – Gerarchizzazione delle scelte di un modello di domanda
expæç m / d ö
v
J ÷
p(m / d , o , x , h ,s ) = è Aø
1 Nel seguito i modelli nested-logit e logit-multinomiale vengono riferiti al caso di una sola classe di decisori.
L'estensione al caso di più classi di decisori è banale, almeno utilizzando l'approccio del decisore medio.
59
LA DOMANDA DI TRASPORTO
(v + J A YA ) ù
exp é d / o
êë J B úû
con YA = ln åm' expæç m' / d ö
v
p(d / o , x , h ,s ) =
J A ÷ø
å expéêë(v d' / o + JA' YA' )JB ùúû è
d'
(v + J B YB ) ù
exp é o / x
p(o / x , h ,s ) =
êë J C úû
con YB = ln åd' exp é
(v d' / o + J A' YA' ) ù
å expéêë(v o' / x + JB' YB' )JC ùúû
êë J B úû
o'
(v + JC YC ) ù
exp é x / h
p(x / h ,s ) =
êë J D úû
con YC = ln åo' exp é
(v o' / x + J B' YB' ) ù
å expéêë(v x' / h + JC' YC' )J D ùúû
êë J C úû
x'
(v + J D YD ) ù
exp é h / s
p(h / s ) =
êë J E úû
con YD = ln åx' exp é
(v x' / h + JC' YC' ) ù
å expéêë(v h' / s + J D' YD' )JE ùúû
êë J D úû
h'
exp é s
(v + J E YE ) ù
p(s ) =
êë J úû
con YE = ln åh' exp é
(v h' / s + J D' YD' ) ù
å expéêë(v s' + JE' YE' )J ùúû
êë J E úû
s'
con J ³ JE ³ JD ³ JC ³ JB ³ JA³ 0 e con vs, vh/s, vx/h, vo/x, vd/o, vm/d il contributo alla utilità
sistematica complessiva di ogni livello di scelta.
È noto che la sequenza della gerarchia non è ininfluente sulla struttura del modello; essa,
infatti, corrisponde a ben precise ipotesi sulla dipendenza delle distribuzioni dei residui
aleatori e determina, attraverso la matrice di varianza-covarianza risultante, le probabilità di
scelta complessive delle alternative. Ad esempio, la gerarchia riportata nella figura 12
presuppone che l'alternativa di compiere lo spostamento per il motivo s sia indipendente da
quella di compiere lo spostamento per un qualsivoglia altro motivo e che alternative
comunque composte, ma caratterizzate da motivi dello spostamento diversi, abbiano
comunque distribuzioni indipendenti. Similmente, alternative relative, ad esempio, a diverse
origini sono statisticamente correlate solo se hanno frequenze di spostamento (x) o periodi
di riferimento (h) o motivi dello spostamento (s) in comune. Insomma, una diversa
gerarchizzazione conduce a modelli di domanda diversi1 ed occorre rifarsi, dunque, alla
gerarchizzazione più opportuna a seconda delle circostanze.
1 Diverse matrici complessive di dispersione ed anche diversi valori delle probabilità condizionate e
complessive di scelta.
60
LA DOMANDA DI TRASPORTO
In alternativa, nel caso in cui tutte le scelte che caratterizzano la domanda si considerino
indipendenti, è possibile utilizzare un modello logit-multinomimale. In tale caso, detto J il
parametro (unico) del modello, la probabilità di scelta della generica alternativa è data da:
æV ö
expç j ÷
p( j) = è Jø 36
æV ö
åj' expçè j' J ÷ø
È possibile utilizzare l'impostazione precedentemente vista per il caso nested-logit al fine di
ottenere una fattorializzazione anche per il modello logit-multinomiale.
L'utilità sistematica di ogni alternativa j è la somma di tante aliquote quante sono le decisioni
che la caratterizzano:
Vj = vs + vh/s + vx/h + vo/x + vd/o + vm/d j=[s,h,x,o,d,m] "jÎI
Rispetto alla precedente formulazione del modello nested-logit, però, si considerino i
parametri delle distribuzioni ai vari livelle tutti uguali e pari a J, ad esempio:
JE = JD = JC = JB = JA = J ³ 0
In tale caso è ancora possibile scrivere (perché il concetto di probabilità condizionata può
essere applicato in qualsiasi circostanza):
p(j) = p(m/d,o,x,h,s) p(d/o,x,h,s) p(o/h,h,s) p(x/h,s) p(h/s) p(s)
con:
expæç m / d ö÷
v
è Jø
p(m / d , o , x , h ,s ) =
å expæçè v m' / d J ö÷ø
m'
exp é
(v d / o + J YA ) ù
êë J úû
con YA = ln åm' expæç m' / d ö÷
v
p(d / o , x , h ,s ) =
å expéêë(v d' / o + J YA' )J ùúû è Jø
d'
exp é
(v o / x + JYB ) ù
p(o / x , h ,s ) =
êë J úû
con YB = ln åd' exp é
(v d' / o + J YA' ) ù
å expéêë(v o' / x + J YB' )J ùúû
êë J úû
o'
exp é
(v x / h + JYC ) ù
p(x / h ,s ) =
êë J úû
con YC = ln åo' exp é
(v o' / x + J YB' ) ù
(v + J YC' )
exp é x' / h ù êë J úû
å êë J úû
x'
61
LA DOMANDA DI TRASPORTO
exp é
(v h / s + J YD ) ù
p(h / s ) =
êë J úû
con YD = ln åx' exp é
(v x' / h + J YC' ) ù
å expéêë(v h' / s + J YD' )J ùúû
êë J úû
h'
exp é
(v s + J YE ) ù
p(s ) =
êë J úû
con YE = ln åh' exp é
(v h' / s + J YD' ) ù
å expéêë(v s' + J YE' )J ùúû
êë J úû
s'
Non è difficile dimostrare che tale fattorializzazione conduce esattamente alla relazione 36,
tipica del modello logit multinomiale. Infatti:
expæç m / d ö÷
v (v + J YA ) ù
exp é d / o
è Jø êë J úû
p(m / d , o , x , h ,s ) p(d / o , x , h ,s ) = =
æ v m' / d ö é (v d' / o + J YA' ) ù
å expçè J ÷ø å
exp
êë J úû
m' d'
(v + v d / o ) ù expæç v o / x + Y ö÷
exp é m / d
êë J úû è J B
ø
p(m / d , o , x , h ,s ) p(d / o , x , h ,s ) p(o / x , h ,s ) =
å expæçè v d' / o J + YA' ö÷ø å expæçè v o' / x J + YB' ö÷ø
d' o'
exp é
(v m / d + v d / o + v o / x ) ù
êë J úû
=
å expæçè v o' / x J + YB' ö÷ø
o'
62
LA DOMANDA DI TRASPORTO
exp é
(v m / d + v d / o + v o / x + v x / h + v h / s ) ù expæç s + YE ö÷
v
êë J úû è J ø =
=
å expæçè v h' / s J + YD' ö÷ø å expçè J + YE' ö÷ø
æ v s'
h' s'
exp é
(v m / d + v d / o + v o / x + v x / h + v h / s ) ù expæç v s ö÷ å expæç v h' / s + YD' ö÷
êë J úû è J ø h' è J ø
= =
å expæçè v h' / s J + YD' ö÷ø æ v s'
å expçè J + YE' ÷ø ö
h' s'
æV ö
expç j ÷
= è Jø
å expæçè v s' J + YE' ö÷ø
s'
Ma a sua volta
å expæçè v
s'
s'
J
+ YE ' ö÷ = exp(YE ' )å expæç s ' ö÷ =
ø s'
v
è Jø
v v (v + v h'' / s' ) + Y ù =
= å expæç s' ö÷å expæç h'' / s' + YD'' ö÷ = å expé s'
è J ø h'' è J ø s' h'' ê
ë J D'' ú
û
s'
= å expéêë(vs' + v h'' / s' )J + YD'' ùúûå expæçè v x''' / h'' J + YC'' ö÷ø =
s' h'' x'''
expé
(v s' + v h'' / s' + v x''' / h'' ) + YC'' ù =
= å êë J úû
s' h'' x'''
(
é v + v h'' / s' + v x''' / h'' + v oIV / x''' + v d V / oIV + v mVI / dV ù )
= å expê s'
J úû
=
IV V VI
s' h'' x''' o d m ë
æV ö
= å expç j' ÷
è J ø
j'
63
LA DOMANDA DI TRASPORTO
æV ö
expç j ÷
p(m / d, o, x, h, s ) p(d / o, x, h, s ) p(o / x, h, s ) p(x / h, s ) p(h / s ) p(s ) = è J ø = p( j)
æV ö
åj' expçè j' J ÷ø
Si noti, inoltre, che in tal caso la matrice di dispersione complessiva del modello ha varianze
p2 2
(elementi della diagonale principale) tutte pari a J e covarianze tutte pari a
6
p2 2
6
( )
J - J 2 = 0 (si veda, in proposito, la relazione 22 del precedente capitolo). Anche la
1 Nella notazione del seguente elenco, per semplicità, s'omette la esplicitazione dei livelli condizionanti che,
nel caso del modello nested-logit, è comunque uno dei fattori che determinano la natura del modello
complessivo.
64
LA DOMANDA DI TRASPORTO
La procedura di specificazione, calibrazione e validazione dei modelli per la stima dei flussi
di domanda è finalizzata alla messa a punto di un modello che simuli in maniera appropriata
il fenomeno della mobilità, così come esso vuole essere caratterizzato dall'analista1.
La procedura nel suo complesso consiste nello:
§ specificare il modello, e cioè:
• definire le scelte corrispondenti alla caratterizzazione con cui si desidera analizzare
la mobilità;
• definire la forma funzionale del modello di domanda (o, se si preferisce, del
modello di scelta discreta utilizzato al suo interno);
• nel caso di una forma funzionale di tipo gerarchico (ad esempio modello nested-
logit), definire la gerarchia della successione di scelta;
• definire l'espressione dell'utilità sistematica attraverso l'individuazione degli
attributi di scelta che s'intende utilizzare al fine di “spiegare” le utilità sistematiche;
§ calibrare il modello, e cioè:
• individuare il valore dei parametri del modello di scelta discreta:
o coefficienti di reciproca sostituzione (b, comprensivi delle CSA);
o parametri della matrice di dispersione (J);
§ validare il modello, e cioè:
1 Nel seguito si farà esclusivamente riferimenti ad un modello relativo ad una sola classe di utenti. Nel caso
di più classi di utenti (i), fa parte della procedura anche l'individuazione delle stesse e quanto detto nel
seguito deve essere applicato ad ogni classe individuata.
65
LA DOMANDA DI TRASPORTO
Osservazione del
Specificazione fenomeno “reale”
Parametri da
calibrare Calibrazione Osservazione dei
comportamenti “reali”
Risultanze
modellistiche
NO Esito
positivo? Validazione
SI
Utilizzo del modello per la simulazione
Figura 13 – Specificazione, calibrazione e validazione dei modelli per la stima dei flussi di domanda
La complicazione del processo è dovuta al fatto che non è possibile osservare direttamente
le utilità percepite dagli utenti del sistema dei trasporti nell'effettuare le loro scelta. Se fosse
possibile osservare tali utilità, si potrebbe, infatti, stimare con tecniche statistiche
direttamente la loro media e la loro distribuzione di probabilità (E[U]=V, fe (e) con U=V +
e) ma, nella “realtà”, le utilità percepite, semplicemente, “non esistono”: il paradigma
formale di scelta è una costruzione dell'analista. Ciò che nella realtà esiste sono i risultati
delle scelte dei decisori e ciò che l'analista può osservare sono proprio tali risultati di scelta,
nonché i valori degli attributi che egli ritiene significativi per spiegare le scelte. L'operazione
di stima dei modelli di domanda, dunque, è costituita dalla specificazione e calibrazione d'un
paradigma formale che possa simulare “sufficientemente bene” i risultati di tali scelte.
Anche se l'operazione di specificazione del modello deve necessariamente precedere quella
di calibrazione, per comodità didattica è opportuno iniziare a descrivere la fase di
calibrazione.
3.2.1 CALIBRAZIONE
§ di avere ipotizzato la forma della distribuzione del vettore dei residui aleatori (fe(e)),
quindi di avere stabilito se si tratta di un modello, ad esempio, logit-multinomiale o
nested-logit;
§ nel caso di un modello nested-logit, di avere stabilito la gerarchia delle scelte, quindi
di avere ipotizzato quale sia la struttura della matrice di dispersione complessiva del
modello (quali alternative – o livelli di scelta – siano tra di loro dipendenti od
indipendenti – in altri termini, la forma dello “albero delle scelte”);
§ di avere ipotizzato quali siano gli attributi che “spiegano” le utilità sistematiche, si è
quindi identificata (a meno dei valori dei beta) la relazione Vj =Skbk Xjk, " j).
Rimangono incogniti i valori del parametro J (o dei parametri J, nel caso nested-logit) e dei
coefficienti di reciproca sostituzione b (comprensivi delle CSA); essi sono proprio l'oggetto
della calibrazione.
In queste condizioni le probabilità di scelta di ogni alternativa (e quindi il vettore delle
probabilità di scelta delle alternative) sono definiti a meno dei valori dei parametri J e b.
Diversi valori per tali parametri, quindi, possono dare luogo a diverse espressioni del vettore
delle probabilità di scelta:
p = p(X,β,J) 37
Lo scopo della calibrazione è quello di osservare i risultati delle scelte dei decisori (in
funzione degli attributi – X – di scelta, noti) e di trovare i J e b, non solo in modo da
riprodurre “al meglio” le percentuali complessive di scelta osservate, ma anche in modo da
riprodurre il più fedelmente possibile la distribuzione dei comportamenti (e quindi delle
scelte) osservati all'interno del gruppo di decisori considerato.
Un esempio dovrebbe aiutare a chiarire i concetti sopra esposti.
Si supponga, ad esempio, di trovarsi in un contesto di scelta in cui si debbano simulare gli
spostamenti tra le tre zone di una area di studio quale quella descritta nella seguente figura.
1 3
Si supponga di trascurare gli spostamenti interni a ciascuna delle zone e di considerare solo
quelli tra zone diverse e che per tali spostamenti siano disponibili tre modi di trasporto (auto,
bus, piedi). Quello che si vuole calibrare è, dunque, un modello di scelta modale.
67
LA DOMANDA DI TRASPORTO
æ p2 ö
" m, U m = Vm + e m e m i.i.d. » Gç 0, J2 ÷
ç 6 ÷
è ø
Si supponga di avere già specificato il modello in termini di individuazione degli attributi di
scelta e che per ognuno dei modi alternativi gli attributi medi, variabili a seconda delle zone
tra cui avviene lo spostamento, siano quelli riportati nella seguente tabella:
Costo (Euro)
Costo (Euro)
Origine
Tpiedi (min)
Tpiedi (min)
Parcheggio
ASA Auto
ASA Bus
O/D
Tattesa
Tbordo
Tbordo
(min)
(min)
(min)
1 2 1-2 8 0,93 1 1 14 5 3 0,77 1 20
1 3 1-3 12 1,34 0 1 7 6 5 0,77 1 28
2 1 2-1 8 0,93 0 1 14 5 3 0,77 1 20
2 3 2-3 10 1,03 0 1 7 6 5 0,77 1 20
3 1 3-1 12 1,03 0 1 7 6 5 0,77 1 28
3 2 3-2 10 1,29 1 1 7 6 5 0,77 1 20
Si supponga di avere osservato i risultati delle scelte di un gruppo di utenti che costituiscono
gli elementi del campione necessario per la nostra calibrazione. Essi siano quelli riportati
nella seguente tabella:
1 Si farà in questo esempio l'ipotesi di essere interessati alla sola caratteristica modale della domanda; in altri
termini, le altre caratteristiche si ritengono già note esogenamente al modello. Siamo dunque interessati,
sempre a solo titolo di esempio, al solo modello di scelta modale.
68
LA DOMANDA DI TRASPORTO
Per il momento ci si occupi della sola calibrazione dei parametri b (comprensivi delle CSA),
supponendo noto e fisso il valore del parametro J della matrice di dispersione (J = 1, per
esempio).
È possibile adottare due approcci differenti per la calibrazione dei parametri b. Il primo
approccio prende il nome di calibrazione aggregata. Esso consiste nel limitarsi ad analizzare
le probabilità aggregate di scelta delle alternative osservate nel campione e nel fare variare i
parametri del modello in modo che le percentuali di scelta che consegna, in funzione di essi,
il modello siano il più possibili simili a quelle osservate. In altri termini, dall’osservazione
del campione si nota che sulla coppia O/D 1-2 il 10% degli elementi del campione sceglie il
modo auto, il 40% il modo bus ed il 50% il modo piedi. Analoghe osservazioni si possono
fare per tutte le coppie O/D ottenendo la seguente tabella delle probabilità osservate:
Probabilità da Campione al variare degli attributi medi (cioè della coppia O/D)
O/D
Auto Bus Piedi
1-2 10% 40% 50%
1-3 90% 10% 0%
2-1 100% 0% 0%
2-3 90% 10% 0%
3-1 80% 20% 0%
3-2 0% 80% 20%
69
LA DOMANDA DI TRASPORTO
Si tratta a questo punto di fare variare i parametri del modello in modo da riprodurre quanto
più è possibile le precedenti percentuali. È possibile verificare che a questo scopo il migliore
insieme di valori per i parametri b è dato da:
Auto Bus Piedi
Beta Tbordo Costo Parcheggio CSA Auto Tbordo Tattesa Tpiedi Costo CSA Bus Tpiedi
-1,5612 -13,4243 -29,9282 5,2706 -1,5612 -1,8375 -2,16911 -13,4243 4,2706 -2,1691
Essi, infatti, consentono di ottenere i valori di probabilità da modello riportati nella tabella
successiva e nella stessa tabella confrontati con i dati di probabilità osservati nel campione.
Probabilità da Campione Probabilità da Modello in caso di calibrazione aggregata
O/D
Auto Bus Piedi Auto Bus Piedi
1-2 10% 40% 50% 10% 44% 46%
1-3 90% 10% 0% 86% 14% 0%
2-1 100% 0% 0% 99% 0% 0%
2-3 90% 10% 0% 97% 2% 1%
3-1 80% 20% 0% 95% 5% 0%
3-2 0% 80% 20% 1% 75% 24%
È possibile calcolare come indicatore sintetico della vicinanza tra probabilità campionarie e
probabilità modellistiche la somma degli scarti quadratici. Tale indicatore, nel caso
precedente, assume un valore di circa 0,06.
Il metodo descritto della calibrazione aggregata è dunque in grado di riprodurre in maniera
soddisfacente le frequenze osservate delle scelte.
Un approccio alternativo a quello della calibrazione aggregata è quello della calibrazione
disaggregata. Esso si basa non sulle sole frequenze di scelta all’interno del campione
(probabilità di scelta aggregate) ma anche sulla distribuzione di tali scelte tra gli elementi
del campione. In altri termini, giacché in funzione del vettore dei parametri b (e delle CSA
e del/i parametro/i J) il modello è in grado di fornire la sua stima delle probabilità di scelta
di ogni alternativa da parte di ogni elemento del campione, è in grado anche, sempre in
funzione della variazione dei parametri, di fornire la probabilità di scelta dell’alternativa che
ogni elemento del campione ha effettivamente dichiarato di scegliere (nell’esempio che
stiamo considerando l’alternativa Piedi per il primo elemento del campione, l’alternativa
Bus per il secondo elemento, di nuovo l’alternativa Piedi per il terzo elemento, e così via).
Lo scopo della calibrazione, in questo caso, è quello di fare variare i parametri in modo che
siano massimi i valori di probabilità che il modello associa alle alternative effettivamente
scelte nel campione.
70
LA DOMANDA DI TRASPORTO
È possibile verificare che, nel nostro esempio, il vettore dei b che è possibile ottenere con
questo approccio è quello riportato nella seguente tabella:
Auto Bus Piedi
Beta Tbordo Costo Parcheggio CSA Auto Tbordo Tattesa Tpiedi Costo CSA Bus Tpiedi
-1,2213 -11,9566 -26,2374 4,4104 -1,2213 -1,4976 -1,8292 -11,9566 3,4104 -1,8292
Le probabilità fornite dal modello per le scelte osservate nel campione1 in funzione dei
precedenti valori dei parametri di reciproca sostituzione sono riportate nella seguente tabella:
Alternativa
Alternativa
ln(P(j(w)))
ln(P(j(w)))
Intervista
Intervista
P(j(w))
P(j(w))
scelta
scelta
O/D
O/D
1 1-2 Piedi 0,41472 -0,88015 31 2-3 Auto 0,94131 -0,06049
2 1-2 Bus 0,49567 -0,70184 32 2-3 Auto 0,94131 -0,06049
3 1-2 Piedi 0,41472 -0,88015 33 2-3 Auto 0,94131 -0,06049
4 1-2 Piedi 0,41472 -0,88015 34 2-3 Auto 0,94131 -0,06049
5 1-2 Piedi 0,41472 -0,88015 35 2-3 Auto 0,94131 -0,06049
6 1-2 Bus 0,49567 -0,70184 36 2-3 Auto 0,94131 -0,06049
7 1-2 Auto 0,08961 -2,41232 37 2-3 Auto 0,94131 -0,06049
8 1-2 Bus 0,49567 -0,70184 38 2-3 Bus 0,04321 -3,14158
9 1-2 Piedi 0,41472 -0,88015 39 2-3 Auto 0,94131 -0,06049
10 1-2 Bus 0,49567 -0,70184 40 2-3 Auto 0,94131 -0,06049
11 1-3 Auto 0,82273 -0,19513 41 3-1 Auto 0,92138 -0,08188
12 1-3 Auto 0,82273 -0,19513 42 3-1 Auto 0,92138 -0,08188
13 1-3 Auto 0,82273 -0,19513 43 3-1 Auto 0,92138 -0,08188
14 1-3 Bus 0,17565 -1,73928 44 3-1 Auto 0,92138 -0,08188
15 1-3 Auto 0,82273 -0,19513 45 3-1 Bus 0,07790 -2,55230
16 1-3 Auto 0,82273 -0,19513 46 3-1 Auto 0,92138 -0,08188
17 1-3 Auto 0,82273 -0,19513 47 3-1 Auto 0,92138 -0,08188
18 1-3 Auto 0,82273 -0,19513 48 3-1 Bus 0,07790 -2,55230
19 1-3 Auto 0,82273 -0,19513 49 3-1 Auto 0,92138 -0,08188
20 1-3 Auto 0,82273 -0,19513 50 3-1 Auto 0,92138 -0,08188
21 2-1 Auto 0,98581 -0,01429 51 3-2 Bus 0,72862 -0,31661
22 2-1 Auto 0,98581 -0,01429 52 3-2 Bus 0,72862 -0,31661
23 2-1 Auto 0,98581 -0,01429 53 3-2 Piedi 0,26099 -1,34327
24 2-1 Auto 0,98581 -0,01429 54 3-2 Bus 0,72862 -0,31661
25 2-1 Auto 0,98581 -0,01429 55 3-2 Piedi 0,26099 -1,34327
26 2-1 Auto 0,98581 -0,01429 56 3-2 Bus 0,72862 -0,31661
27 2-1 Auto 0,98581 -0,01429 57 3-2 Bus 0,72862 -0,31661
28 2-1 Auto 0,98581 -0,01429 58 3-2 Bus 0,72862 -0,31661
29 2-1 Auto 0,98581 -0,01429 59 3-2 Bus 0,72862 -0,31661
30 2-1 Auto 0,98581 -0,01429 60 3-2 Bus 0,72862 -0,31661
Ln(Likelihood) -27,92379
1
dove la generica di esse, riferita al generico elemento w del campione, viene indicata con j(w)
71
LA DOMANDA DI TRASPORTO
somma di tali logaritmi estesi a tutto il campione. Nel seguito, infatti, si dimostrerà che nel
caso della calibrazione disaggregata massimizzare le probabilità di tutte le scelte osservate
nel campione significa massimizzare la produttoria della singole probabilità di ogni scelta
osservata (tale produttoria prende il nome di verosimiglianza o likelihood) e che tale
operazione è equivalente a massimizzare la somma dei logaritmi delle probabilità delle
singole scelte osservate (logaritmo della likelihood).
In funzione dei parametri che massimizzano la likelihood le probabilità aggregate di scelta
modale al variare degli attributi (e quindi al variare, nel nostro caso, della coppia O/D)
possono essere comunque con notevole successo confrontate con le probabilità aggregate
ottenute dal campione:
Probabilità da Campione Probabilità da Modello in caso di calibrazione disaggregata
O/D
Auto Bus Piedi Auto Bus Piedi
1-2 10% 40% 50% 9% 50% 41%
1-3 90% 10% 0% 82% 18% 0%
2-1 100% 0% 0% 99% 1% 1%
2-3 90% 10% 0% 94% 4% 2%
3-1 80% 20% 0% 92% 8% 0%
3-2 0% 80% 20% 1% 73% 26%
In questo caso la somma degli scarti quadratici tra probabilità calcolate sul campione e
probabilità consegnate dal modello in seguito alla calibrazione disaggregata è pari a circa
0,07.
In termini riassuntivi, i risultati rispetto ai valori disaggregati (likelihood) ed aggregati
(somma degli scarti quadratici tra probabilità del modello e probabilità aggregate del
campione) dei due approcci sono riassunti nella seguente tabella.
Calibrazione likelihood ln(likelihood) Scarto quadratico %
Aggregata 5,25071E-13 -28,275242 0,0632
Disaggregata 7,46194E-13 -27,923790 0,0723
Da esse si vede che la calibrazione aggregata permette di ottenere scarti quadratici migliori
ma a scapito di una verosimiglianza minore, di converso la calibrazione disaggregata
permette di ottenere verosimiglianze migliori a scapito di scarti quadratici peggiori. In
generale, però, è possibile dire che calibrazioni disaggregate permettono di ottenere le
migliori verosimiglianze con risultati rispetto alle probabilità aggregate comunque buoni
(sub-ottimi). Spesso, invece, le calibrazioni aggregate associano a risultati ottimi in termini
di confronto di probabilità aggregate risultati mediocri in termini di verosimiglianza. Per
come è concepita, inoltre, è possibile dire che la calibrazione disaggregata è quella più
congruente con il modello comportamentale della teoria dell’utilità casuale. La calibrazione
72
LA DOMANDA DI TRASPORTO
aggregata, invece, tende a caratterizzare il modello ottenuto molto più in senso descrittivo
che non comportamentale.
Infine, occorre notare che spesso, però, la calibrazione aggregata anche se meno rigorosa
risulta più conveniente da un punto di vista pratico. È infatti possibile che siano disponibili
dati aggregati sulle percentuali di scelta dei decisori in un dato contesto di scelta e che quindi
sia possibile, nel caso di utilizzo di calibrazioni aggregate, evitare gli oneri di
campionamento e di intervista invece necessari per la calibrazione disaggregata.
Nel seguito, in ragione del suo più elevato tasso di congruità teorica, si formalizzerà, con
riferimento ad un caso generale, la sola metodologia relativa alla calibrazione disaggregata,
essa è nota in statistica come metodo della massima verosimiglianza.
In termini analitici il problema si può porre nel seguente modo:
dove:
§ b è il vettore dei parametri modellistici, comprendente non solo i parametri di reciproca
sostituzione b ma anche le CSA ed il parametro del logit J (o tutti i parametri J del
logit multinomiale)
§ W è un insieme (di numerosità m) corrispondente ad campione di utenti intervistati,
rappresentativo dell’universo di decisori di cui si vogliono simulare i comportamenti;
§ w è il generico decisore tra quelli di cui si sono osservate le scelte;
§ j(w) è la scelta effettivamente osservata per il generico decisore w;
§ p(j(w), b) è la probabilità consegnata dal modello (che in fase di calibrazione è
funzione del solo vettore incognito dei parametri) di riprodurre la scelta osservata per
il generico decisore w;
§ Pwp(j(w), b) è la probabilità congiunta di riprodurre tutte le scelte osservate
(Likelihood);
§ β̂ è la soluzione del problema di calibrazione, cioè il vettore di parametri modellistici
che massimizza la likelihood.
In generale, invece di massimizzare la funzione di Verosimiglianza si massimizza il
logaritmo naturale di tale funzione; cioè comporta alcuni vantaggi di calcolo numerico1 ed è
un'operazione legittima, dato che la funzione logaritmo è una funzione strettamente
1
Essenzialmente, il logaritmo di un prodotto è pari alla somma dei logaritmi dei singoli fattori. Il problema si
trasforma dunque in quello di massimizzare una sommatoria (di termini tutti non positivi). Mentre la
funzione di verosimiglianza è tipicamente “piatta” e difficile da massimizzare, quella del logaritmo della
verosimiglianza è non-piatta e molto più agevole da massimzzare.
73
LA DOMANDA DI TRASPORTO
crescente e quindi il punto in cui la funzione ln(L(b)) assume il massimo coincide con quello
in cui lo assume la funzione L(b).
Nel caso in cui si stia calibrando un modello di tipo logit-multinomiale è possibile dimostrare
con considerazioni teoriche (non del tutto banali) che la funzione di verosimiglianza è una
funzione strettamente concava e quindi ammette un solo massimo globale. Nel caso si stia
calibrando un modello di tipo nested-logit, l'impostazione analitica del problema rimane la
stessa (variano, ovviamente, le formule per il calcolo delle probabilità di scelta – ed il vettore
b contiene i parametri di tutte le utilità sistematiche di tutti i livelli in cui si è considerata
gerarchizzata la scelta complessiva). Succede, però, in tale ultimo caso, che la funzione di
verosimiglianza non è più necessariamente una funzione concava; essa può presentare più
massimi locali ed occorre utilizzare opportuni accorgimenti numerici per assicurarsi di
ottenere il massimo globale della funzione stessa. Da un punto di vista operativo la
massimizzazione della funzione di verosimiglianza viene ottenuta attraverso opportuni
algoritmi di ottimizzazione quali, ad esempio, l'algoritmo di gradiente1.
Nel contesto del metodo di massima verosimiglianza appena descritto è il caso di fare alcune
precisazioni.
Anzitutto, nel precedente esempio relativo ad un semplice modello di tipo logit-
multinomiale, si è non casualmente incorporata la calibrazione del parametro J del modello
nel vettore b. Si noti, infatti, che la maniera utilizzata per calcolare l'utilità sistematica in
funzione degli attributi attraverso una combinazione lineare induce una particolarità del
modello logit che è facilmente verificabile:
æV ö
expç j ÷
" j Î I, p( j) = è Jø con Vj = å b k X jk Þ
æ V j' ö
åj' expçè J ÷ø k
Þ p( j) =
~
exp Vj ( ) ~ b ~
con Vj = å k X jk = å bk X jk
~
å exp Vj' ( ) k J k
j'
In altri termini, esiste una infinità di combinazioni di parametro J e vettore b che da luogo
esattamente alle stesse probabilità di scelta delle alternative. Ad esempio, con riferimento a
quanto finora utilizzato per illustrare la procedura di calibrazione, esattamente gli stessi
risultati, sia in termini di probabilità di scelta che di valore della likelihood, si sarebbero
ottenuti per un parametro J qualsiasi, diverso da quello implicitamente ipotizzato (J=1) ed
1 La trattazione di tali aspetti algoritmi, comunque, non è oggetto di questo modulo didattico.
74
LA DOMANDA DI TRASPORTO
3.2.2 SPECIFICAZIONE
1 Una conseguenza immediata di tale ipotesi di assumere unitario il valore del J0 associato alla radice
dell'albero delle scelte è che tutti gli altri J calibrati devono essere minori dell'unità, oltre che decrescenti
muovendosi lungo l'albero in direzione delle foglie.
2 Come già osservato, ci si riferisce all'ipotesi di avere individuato una sola classe di utenti. Nell'ipotesi di
più classi la specificazione deve essere effettuata per ognuna di esse. In realtà, la individuazione delle classi
d'utenza è parte integrante della fase di specificazione, A tale scopo può essere d'aiuto una analisi di cluster
effettuata sui risultati dei comportamenti osservati degli utenti.
75
LA DOMANDA DI TRASPORTO
Se, infatti, la validazione non dà risultato favorevole, essendo la fase di calibrazione una
procedura matematica univoca, l’unica fonte di errore (ipotizzando corretto il campione) è
la specificazione.
Alcuni accorgimenti generali, comunque, devono sicuramente essere adottati. Non è
possibile, infatti, specificare modelli che presentino attributi di scelta cosiddetti collineari.
Nel seguito di questo paragrafo si presentano alcune classiche condizioni di collinearità che
devono essere evitate; esse, infatti, se si presentano, non permettono di calibrare in maniera
efficiente il modello.
In primo luogo, se il modello di scelta discreto associato al modello di domanda è (come è
sempre nella pratica) di tipo invariante, non è possibile introdurre costanti specifiche delle
alternative per tutte le alternative dell'insieme di scelta; se ne possono introdurre al massimo
in tutte le alternative di scelta meno una. Questa limitazione non è, in realtà, intrinseca ai
modelli invarianti; piuttosto, essa deriva dall'impossibilità di calibrare adeguatamente
modelli che introducano costanti specifiche per tutte le alternative. Infatti, con riferimento
al precedente esempio di calibrazione, sarebbe possibile verificare che, nel caso in cui si
introducesse una costante specifica per l'alternativa piedi (CSApiedi), tutte le soluzioni1
mostrate nella seguente tabella sarebbero equivalenti sia rispetto alle probabilità di scelta
date dal modello, sia, di conseguenza, al valore corrispondente della likelihood.
Auto Bus Piedi
Beta Ln(L)
Tbordo Costo Parch. CSA Auto Tbordo Tattesa Tpiedi Costo CSA Bus Tpiedi CSA Piedi
Caso 1 -1,221 -11,957 -26,237 4,4104 -1,221 -1,498 -1,829 -11,957 3,4104 -1,829 0 -27,92
Caso 2 -1,221 -11,957 -26,237 14,4104 -1,221 -1,498 -1,829 -11,957 13,4104 -1,829 10 -27,92
Caso 3 -1,221 -11,957 -26,237 1,4104 -1,221 -1,498 -1,829 -11,957 0,4104 -1,829 -3 -27,92
Più in generale, sarebbero equivalenti tutte le (infinite) soluzioni caratterizzate dagli stessi
valori dei parametri bbordo, bcosto, bparcheggio, battesa e bpiedi e valori qualsiasi delle costanti
specifiche, purché soddisfacenti le condizioni:
CSAauto-CSApiedi = 4.4104 e CSAbus-CSApiedi = 3.4104.
Questo fenomeno è dovuto al fatto che il modello utilizzato è di tipo invariante. Infatti, le
costanti specifiche sono valori sempre fissi nell'utilità sistematica, al contrario degli attributi
di scelta, la cui variazione determina la variazione del valore dell'utilità sistematica e la
possibilità di calibrare in funzione di essa il modello. Per le scelte osservate, dunque, le
costanti specifiche delle alternative contribuiscono all'utilità sistematica sempre nella stessa
maniera. Si considerino, dunque, le probabilità di scelta delle alternative in corrispondenza
1
Delle quali la prima, con CSAPiedi=0, è in pratica quella in cui la costante specifica per il modo piedi non era
stata introdotta.
76
LA DOMANDA DI TRASPORTO
di una qualsiasi osservazione; le probabilità sono invarianti rispetto alla soluzione in cui la
CSApiedi ha valore nullo se si aggiunge un qualunque valore alla CSApiedi e lo stesso valore
anche alle CSAauto ed alle CSAbus; infatti, in tale caso, si aggiungerebbe una stessa quantità
costante a tutte le alternative e, dunque, il modello invariante darebbe le stesse probabilità
di scelta e, soprattutto, la stessa probabilità di scegliere l'alternativa effettivamente scelta. In
più, tale fenomeno accade per tutte le probabilità di scelta delle alternative osservate, quindi
per la likelihood e quindi per la capacità complessiva del modello di rappresentare le scelte
effettivamente osservate. Essa risulta, dunque, invariante rispetto all'aggiunta di un
qualunque valore alla CSApiedi (inizialmente nulla) e dello stesso valore anche alle CSAauto
ed alle CSAbus. In altri termini, non è possibile calibrare contemporaneamente costanti
specifiche per tutte le alternative ma solo la differenza di tutte rispetto ad una presa a
riferimento, ne deriva che il modello deve essere specificato considerando delle CSA fittizie
i cui valori sarebbero ottenibili delle CSA “vere” a cui è stato sottratto il valore “vero” di
una di esse presa a riferimento; quest'ultima, quindi, nella specificazione e calibrazione del
modello, assume un valore fittizio nullo (perché sottratta a se stessa).
Allo stesso modo, si può ragionare per evidenziare la necessità di evitare nella specificazione
del modello (nel caso esso sia additivo) la presenza di qualunque quantità che sia costante
per tutte le alternative (e costante per tutte le scelte osservate su cui avviene poi la
calibrazione).
Altri accorgimenti per evitare fenomeni di collinearità nella specificazione degli attributi
(sempre in caso di modelli additivi) consistono nell'evitare di introdurre nelle utilità attributi
che possano essere linearmente dipendenti gli uni dagli altri.
3.2.3 VALIDAZIONE
Una serie di indicatori possono essere utilizzati per esprimere un giudizio sulla “bontà” del
modello specificato e calibrato. Alcuni di questi indicatori hanno una valenza qualitativa,
altri sono dei veri e propri test statistici1.
Un primo indicatore di “ragionevolezza” del modello specificato e calibrato riguarda il
“segno algebrico” dei parametri di reciproca sostituzione ottenuti. Dato che il modello di
scelta utilizzato nel modello di domanda è un modello comportamentale, i segni dei
1 Si suppone di trattare la validazione di un modello messo a punto per una sola classe di utenti. Nel caso di
più classi occorre validare il modello di scelta relativo ad ognuna di esse. Inoltre, un esito negativo della
validazione potrebbe essere anche dovuto alla errata individuazione delle classi d'utenza che, quindi, è una
delle ipotesi dell'analista che deve eventualmente essere modificata nella procedura complessiva (Trial-
and-Error) di specificazione, calibrazione e validazione.
77
LA DOMANDA DI TRASPORTO
78
LA DOMANDA DI TRASPORTO
erroneamente stimato con un valore non nullo può essere verificato controllando una
variabile aleatoria di Student che deve risultare distribuita in maniera tale da avere alta
probabilità di assumere valori esterni ad un intervallo ben preciso (funzione della
accuratezza del test). Tutti i software di calibrazione dei parametri producono tali statistiche
di Student e l'analista deve verificare che per ogni parametro calibrato tale valore sia in
valore assoluto maggiore di 1.96 (che corrisponde ad una stima con un grado di accuratezza
del 95%, per un numero di scelte osservate su cui si esegue la calibrazione che sia
sufficientemente ampio1 da potere confondere la distribuzione di Student con la
distribuzione Normale).
Un'altra verifica che viene eseguita in maniera aggregata su tutto il vettore b dei coefficienti
calibrati è la verifica del rapporto di Verosimiglianza (Likelihood Ratio - LR). Tale test si
utilizza di solito per testare la “distanza” del vettore ottenuto dalla calibrazione da un vettore
di parametri tutti nulli. In tale caso occorre calcolare il valore della verosimiglianza che si
otterrebbe in corrispondenza di valori tutti nulli dei parametri b (quindi in corrispondenza di
alternative equiprobabili) e poi calcolare la quantità:
LR(0) = -2[ln(L(0)) - ln(L(β))]
È possibile dimostrare che tale quantità corrisponde nel processo di massimizzazione della
verosimiglianza ad una variabile aleatoria che, nell'ipotesi in cui il valore “vero” del vettore
b sia nullo (b=0), è distribuita con una distribuzione c2 con nb gradi di libertà (dove nb è il
numero di coefficienti di reciproca sostituzione stimati). Occorre, dunque, verificare che tale
rapporto di verosimiglianza assuma valori grandi abbastanza da rifiutare l'ipotesi nulla con
una buona probabilità. Tutti i software di calibrazione producono la statistica precedente e
l'analista deve verificare che essa assuma valori sufficientemente elevati.
Il rapporto di verosimiglianza può essere anche calcolato in corrispondenza dell'ipotesi di
volere testare che il valore “vero” sia quello con le sole costanti specifiche delle alternative.
In questo caso occorre calcolare il valore della likelihood in corrispondenza di soli valori
non nulli delle CSA e calcolare la quantità:
LR(CSA) = -2[ln(L(CSA)) - ln(L(β))]
In questo caso il rapporto di verosimiglianza, nell'ipotesi di sole CSA non nulle, è distribuito
come una variabile c2 con nb-nCSA gradi di libertà (dove nCSA è il numero di costanti
1
Bastano un centinaio di osservazioni, valore, questo, d’altra parte minore di quello necessario per assicurarsi
un campione sufficientemente significativo dell’universo i cui comportamenti si intendono simulare.
79
LA DOMANDA DI TRASPORTO
specifiche stimate). Come nel caso precedente occorre verificare che la precedente quantità
assuma valori sufficientemente elevati.
Un ulteriore test sulla qualità della calibrazione consiste nel calcolare la cosiddetta “bontà
dell'accostamento” (Goodness of Fit), essa è una misura (normalizzata nell'intervallo tra 0
ed 1) della capacità del modello di riprodurre le scelte effettuate dal campione di decisori
utilizzato per la calibrazione. Si può dimostrare che può essere calcolata come:
ln(L(β ))
r2 = 1 -
ln(L(0))
Occorre verificare che il suo valore sia il più possibile lontano dal valore nullo (in realtà, nei
casi pratici più frequenti, è sufficiente che tale rapporto assuma valori maggiori di 0.35,
0.40).
Nel caso di modelli di tipo nested-logit è, inoltre, possibile verificare le ipotesi fatte sulla
successione delle gerarchie di scelta. A tale scopo occorre verificare i risultati ottenuti dalla
calibrazione dei J, mano a mano che ci ci muove, infatti, verso le foglie dell'albero delle
scelte i valori di J devono decrescere, ove ciò non avvenisse potrebbe essere opportuno
scambiare di posto i livelli di scelta per cui si verifica l'inversione della decrescenza dei J.
Nel caso del modello logit-multinomiale, invece, è possibile utilizzare dei test statistici
appena un po' più complessi per verificare la bontà dell'ipotesi di indipendenza delle
alternative. In pratica è possibile utilizzare delle statistiche che individuano la presenza
all'interno delle scelte del campione utilizzato per la calibrazione del fenomeno della IIA
(Independence of Irrelevant Alternatives). Se tale proprietà non può ritenersi accettabile per
il campione vuole dire che l'avere specificato un modello di tipo logit-multinomiale non è
stata la scelta corretta.
In conclusione, la fase di validazione permette di valutare la bontà dei risultati ottenuti dalle
fasi di specificazione e calibrazione. Ove tale giudizio non fosse positivo, occorrerebbe
rispecificare (e ricalibrare) il modello in un processo di Trial-and-Error, come descritto nella
figura 13, fino a che la validazione non consegni un giudizio positivo.
80
LA DOMANDA DI TRASPORTO
Nella precedente relazione con wh si è indicato l'opposto dell'utilità sistematica relativa alle
scelte di itinerario. Tale utilità, infatti, assume sempre un valore negativo e dunque si
preferisce introdurre il costo di itinerario, definito appunto come opposto dell'utilità
sistematica ed avente valore positivo. Inoltre, il costo di un percorso ha una diretta
interpretazione intuitiva. Si intende, ovviamente un costo generalizzato, composto da varie
voci di costo (che sono altrettanti attributi di scelta, per esempio: tempo speso sul percorso;
suo costo tariffario; costo monetario del carburante; ecc.).
Il decisore è un decisore razionale e tende dunque a scegliere in modo da massimizzare
l'utilità percepita o, se si preferisce, a minimizzare il costo percepito, somma del costo
(sistematico) e del residuo aleatorio:
" hÎIi p(h) = Pr[wh + eh = minhÎI (wh’ + eh)] 40
" hÎIi p(h) = Pr[wh + eh < wh’ + eh’ " h’ÎIi, h’≠h] 41
" hÎIi p(h) = Pr[wh - wh’ < eh’ - eh " h’ÎIi, h’≠h] 42
Supposti noti i costi, la individuazione della legge di distribuzione del residuo aleatorio
permette di definire compiutamente le probabilità di scelta dei percorsi. A tale proposito, la
distribuzione più frequentemente utilizzata è la Normale Multivariata, che conduce al
modello di tipo Probit. È infatti facile immaginare che, nel caso della scelta di percorso, le
alternative sono ben difficilmente indipendentemente distribuite. Considerazioni
81
LA DOMANDA DI TRASPORTO
Si noti che l'implicazione inversa non è vera, giacché nulla esclude, in un modello
deterministico, che percorsi pure di costo minimo non vengano utilizzati2. Mentre per
l'approccio aleatorio, dunque, il vettore delle probabilità di scelta dei percorsi è una funzione
dei costi, nel caso deterministico, invece, p=p(-wi) è, come già detto, in genere una mappa a
più valori.
Una volta calcolato il vettore delle probabilità di scelta dei percorsi è possibile utilizzare tale
vettore per calcolare i flussi di percorso.
Detto di il flusso di domanda della i-esima coppia o/d e detto pi il vettore di probabilità di
scelta dei percorsi che uniscono tale coppia (insieme di scelta Ii) è possibile scrivere:
hi = di pi 44
dove con hi si è indicato il vettore dei flussi di percorso della i-esima coppia origne-
destinazione.
1 Negli ultimi anni sono stati messi a punto, proprio a partire dai modelli per il calcolo dei flussi di itinerario
delle particolarizzazioni dei modelli della famiglia Logit, noti come modelli C-Logit. Il loro studio,
comunque, esula dagli scopi di questo modulo didattico.
2 Ciò avviene, in particolare, nel caso in cui vi siano più percorsi di costo minimo. Non è possibile dire, da
modello, quali di questi viene scelto o, nel caso in cui ne venga scelto più di uno, come si ripartiscono i
diversi utenti tra quelli scelti.
82
L’OFFERTA DI TRASPORTO
4 L’OFFERTA DI TRASPORTO
4.1 INTRODUZIONE
I modelli (analitici) di offerta per i sistemi di trasporto sono finalizzati alla descrizione
astratta (attraverso un insieme congruente di relazioni matematiche) delle opportunità di
spostamento offerte da un sistema di trasporto (considerato come l'insieme delle
infrastrutture fisiche, dei servizi di trasporto che su di esse insistono, delle regole
organizzative e normative e delle prestazioni che derivano anche dall'interazione con gli
utenti che ne usufruiscono). La determinazione, all'interno del sistema di trasporto “reale”
delle parti (infrastrutturali e funzionali) di interesse per l'analista (e quindi soggette alla
modellizzazione) è una astrazione logica che, come già detto, concorre alla determinazione
del “sistema” oggetto delle analisi.
Una volta individuate le infrastrutture e le funzioni da sottoporre a modellizzazione, scopo
della operazione logica di astrazione del modello di offerta è quello di individuarne anzitutto
le caratteristiche salienti e le funzioni che occorre sottoporre ad una esplicita descrizione
formale. Occorre, altresì, individuare le modalità e gli strumenti con cui tali caratteristiche
salienti devono essere formalmente descritte. È il caso di sottolineare, infatti, che uno stesso
sistema di trasporto (individuato sia nelle infrastrutture che nelle funzioni, sia nei servizi che
nelle regole da sottoporre a modellizzazione) è suscettibile di diverse rappresentazioni
analitiche a seconda delle caratteristiche salienti scelte per la modellizzazione e delle
modalità di formalizzazione che si utilizzano. Ad esempio, avendo individuato che la
funzione del trasporto con la modalità individuale (auto) dei passeggeri all'interno di un certo
territorio afferisce alle funzioni da includere all'interno del sistema oggetto dell'analisi (e che
a tale fine è rilevante un certo numero di infrastrutture e servizi), una delle caratteristiche
che si può intendere modellizzare potrebbe essere la velocità con cui i veicoli riescono a
muoversi all'interno del sistema stesso, mentre l'accelerazione degli stessi veicoli, sempre ad
esempio, potrebbe non essere considerata tra le caratteristiche rilevanti per la
modellizzazione. Inoltre, le funzioni analitiche con cui modellizzare la caratteristica della
velocità dei veicoli potrebbero essere in vario modo scelte. È evidente, dunque, che uno
stesso sistema (di offerta) di trasporto può essere rappresentato da modelli di offerta
differenti, più o meno opportuni a seconda delle finalità dell'analista.
In generale, un modello di offerta di trasporto dovrebbe essere formalizzato in modo che
risultino simulabili sia le proprietà intrinseche del sistema stesso, sia la maniera in cui il
funzionamento del sistema è influenzato dall'utilizzo che gli utenti ne fanno. Le proprietà
83
L’OFFERTA DI TRASPORTO
del primo tipo potrebbero essere chiamate proprietà intrinseche del sistema, quelle del
secondo tipo potrebbero essere definite come proprietà esposte. Proprietà intrinseche al
sistema potrebbero, ad esempio, essere riferite alla capienza (o capacità) degli elementi dei
servizi di trasporto offerti, oppure ad elementi tecnologici (e/o normativi) quali, ad esempio,
le velocità massime ottenibili (e/o consentite) sugli elementi infrastrutturali e/o del servizio
offerto. Proprietà esposte del sistema potrebbero essere le velocità che si riescono
effettivamente a realizzare sugli elementi infrastrutturali (e/o di servizio offerto) in funzione
della reciproca interazione tra gli utenti che ne usufruiscono (basti pensare a quella che,
comunemente, nel linguaggio familiare, viene indicata come congestione stradale).
Un modello di sistema di trasporto può essere di tipo continuo, di tipo discreto o di tipo
misto. La continuità può essere riferita, in generale, all'insieme di definizione oppure ai
valori assunti dalle variabili utilizzate per la modellizzazione. Nel nostro caso definiremo
come continuo un modello in cui tutte le caratteristiche modellizzate sono individuate
attraverso variabili esplicative definite su un dominio continuo, indipendentemente dai
valori continui o discreti che esse possono assumere. Evidentemente un modello di tipo
discreto sarà un modello in cui le variabili che ne definiscono la rappresentazione analitica
sono tutte definite su un dominio discreto mentre un modello misto utilizza per la descrizione
analitica del sistema sia variabili definite su domini discreti che variabili definite su domini
continui. I modelli di offerta di solito utilizzati sono modelli di tipo misto. Esistono casi
particolari di modelli di tipo completamente discreto mentre la modellizzazione continua di
un intero sistema d'offerta di trasporto (e non di un solo elemento dello stesso) ben
difficilmente è stata affrontata. La tipologia di variabili che più difficilmente si presta ad una
modellizzazione continua, infatti, è quella relativa alla topologia (cioè alla forma) del
sistema. La descrizione topologica del sistema, infatti, deve essere effettuata sia rispetto ai
singoli elementi infrastrutturali (e di servizio) che compongono il sistema, sia rispetto alle
relazioni tra tali entità. Mentre la prima esigenza può essere soddisfatta attraverso l'utilizzo
di variabili continue (e tale rappresentazione è tutt'altro che rara), la seconda è generalmente
affrontata con grandezze di tipo discreto, giacché le relazioni topologiche tra elementi del
sistema sono intrinsecamente discretizzabili. Ciononostante, non è superfluo sottolineare che
ciò a cui ci riferiamo è il modello di offerta di trasporto, cioè la rappresentazione di una
realtà fisica che è per definizione caratterizzata, almeno, dalla intrinseca continuità dello
spazio fisico su cui il sistema insiste e dal fatto che il tempo è una grandezza anche essa
continua per definizione. È anche opportuno ricordare, in questa sede, che stiamo definendo
il modello analitico di rappresentazione, indipendentemente da come poi (ed è tutt'altro
84
L’OFFERTA DI TRASPORTO
85
L’OFFERTA DI TRASPORTO
spostamento (nel punto di coordinate x, y ed al tempo t). Il valore del modulo assunto dalla
grandezza s potrebbe essere una misura, ad esempio, della quantità di servizio disponibile
per effettuare lo spostamento. In ogni punto del dominio spazio-temporale potrebbe essere
anche definita (proprietà esposta del modello di offerta) la quantità di utenti presenti nel
sistema (o meglio, la densità in quel punto – ed in quel tempo – di utenti presenti), essa
potrebbe essere una grandezza scalare: r(x, y, t). Ancora, in ogni punto del dominio spazio
temporale potrebbe essere definita la velocità con cui il servizio di trasporto è in grado di
trasportare utenti, tale grandezza potrebbe essere di tipo vettoriale (con direzione analoga
alla grandezza s definita nello stesso punto del dominio spazio-temporale) e potrebbe essere
caratterizzata dalle due componenti principali ( vx(x,y,t), vy(x,y,t) ). Tale velocità, inoltre,
potrebbe essere dipendente dalla densità d'utenti nel punto (e nell'istante) considerato,
giacché una maggiore densità di utenti potrebbe fare abbassare le prestazioni del servizio
(v(x,y,t)=fV(r(x,y,t)). Oppure, complicando un po' la rappresentazione del fenomeno, allo
scopo di potere avere un modello più aderente alla realtà, si potrebbe pensare che la velocità
sia una grandezza dipendente non dalla densità di utenti puntuale, ma da quella in un
opportuno insieme spaziale e temporale (ad esempio tutti gli utenti che utilizzano la stessa
infrastruttura elementare di trasporto in un certo intervallo di tempo):
t
v(x, y, t ) = ò òò r(x, y, t ) × dx dy dt
t - Dt A ( x , y )
dove A(x,y) è l'opportuno intorno spaziale del punto (x,y) che ne influenza la velocità.
Evidentemente, molte altre grandezze dovrebbero essere definite per una rappresentazione
compiuta, così come dovrebbero essere definite tutte le (non banali) relazioni che legano
tali variabili all'interno del dominio spazio-temporale di definizione. La variazione della
densità di utenti, ad esempio, nello spazio e nel tempo, non può che essere funzione sia
della disponibilità e della capacità di trasporto dei servizi offerti che della velocità di
trasporto degli stessi (a sua volta funzione della densità). Analogamente dovrebbero essere
attentamente definiti i valori, ad esempio spaziali, che le variabili possono assumere in
parti del dominio in cui non è mai possibile spostarsi (ad esempio una porzione di spazio in
cui non vi sono strade né altri servizi di trasporto di tipo collettivo); il modello ha una sua
congruenza esterna rispetto alla realtà se, in tali parti, le densità, le velocità e la presenza
del servizio assumono costantemente valori nulli; ha una congruenza interna rispetto a se
stesso se le relazioni definite tra le varie variabili non possono in alcune modo indurre tali
caratteristicamente ad assumere valori non nulli dove, invece, tali dovrebbero essere.
86
L’OFFERTA DI TRASPORTO
Evidentemente la precedente non vuole essere la descrizione compiuta (né rigorosa, anzi è
volutamente parziale ed incongruente) di un modello di tipo assolutamente continuo per la
offerta di trasporto. Anche perché un tale tipo di modello non solo non è mai stato sviluppato
ma sarebbe anche assai complesso da sviluppare.
Nelle successive figure 15 e 16 è invece rappresentato, sempre visivamente, il modello
topologico discreto (grafo) che si è soliti utilizzare per la rappresentazione analitica di un
sistema d'offerta.
I sistemi di trasporto sono generalmente rappresentati dal punto di vista del modello d'offerta
ricorrendo agli strumenti dei grafi (e delle reti). Infatti, occorre sottolineare come l'offerta di
trasporto sia in qualche modo intrinsecamente una rete, formata da elementi (infrastrutture)
che possono essere considerati puntuali (ad esempio gli incroci) ed elementi di tipo lineare
(ad esempio una strada, o una tratta ferroviaria) che si integrano, appunto, in una struttura di
rete. È indicatore di tale natura il fatto stesso che anche nel linguaggio familiare, non tecnico,
quella dei trasporti viene spesso indicata appunto come rete (così come si è adusi riferirsi ad
altri sistemi quali le reti elettriche, le reti idriche, le reti di calcolatori che, anch'essi, sono
intuitivamente percepiti, appunto, come delle reti, al di là del modello formale con cui
vengono rappresentate).
87
L’OFFERTA DI TRASPORTO
Gli aspetti formali di descrizione del modello d'offerta attraverso una rappresentazione
analitica “a grafo” (e poi “a rete”) saranno approfonditi nel prossimo paragrafo. A tale
rappresentazione ci riferiremo nel prosieguo della trattazione, pur non essendo questa l'unica
possibile. È anche opportuno sottolineare, a scanso di equivoci, che l'illustrazione di nodi ed
archi (anche questi concetti, per ora lasciati alla loro significato comune ed intuitivo, per poi
introdurli e formalizzarli in seguito) riportata nella figura 16 non è “il grafo”, ne è soltanto
una sua illustrazione.
88
L’OFFERTA DI TRASPORTO
1 Tale omogeneità si intende originata da caratteristiche intrinseche dell'offerta di trasporto e non dovuta al
risultato delle modalità di utilizzo da parte degli utenti, che dovrebbero, in linea di principio, potere essere
considerate “qualsiasi”.
89
L’OFFERTA DI TRASPORTO
Gli insiemi dei nodi e degli archi (che sono, evidentemente, elementi tra loro congruenti per
definizione) nella teoria dei grafi definiscono, appunto, un grafo:
G=(N,L) 45
§ G = Grafo
§ N= insieme dei nodi;
§ L= insieme degli archi.
I nodi, nei grafi di trasporto possono essere utilizzati per individuare gli archi. Ogni arco, in
altri termini, può essere identificato attraverso un nome attribuito al suo inizio (nodo iniziale)
ed alla sua fine (nodo finale). Gli archi che si utilizzano nella rappresentazione dei sistemi
di trasporto sono sempre archi orientati (e quindi i grafi di trasporto si dicono orientati), nel
senso che l'arco avente come inizio il nodo i e come fine il nodo j è sempre considerato
distinto dall'arco avente come inizio il nodo j e come fine il nodo i.
Se, ad esempio, gli elementi del modello di offerta individuati e le loro interconnessioni sono
quelle rappresentate dalla seguente figura 17, il grafo è formato dai seguenti insiemi:
G=(N,L)
N= {1, 2, 3, 4, 5, 6};
L= {(1,3), (2,4), (3,4), (4,3), (4,6), (5,1), (5,3), (5,6), (6,5), (6,2)}
3 4
1 2
5 6
Figura 17 – Grafo di esempio
Sono possibili rappresentazioni analitiche della topologia dei grafi di più agevole trattazione
di quella legata alla definizione. Un esempio di esse è la cosiddetta matrice di Adiacenza
nodi/nodi. Il generico elemento (i, j) di essa assume valore unitario nel caso in cui esista
l'arco avente come inizio il nodo i e come fine il nodo j, assume valore nullo altrimenti. Nel
caso dell'esempio precedente tale matrice risulta essere:
é0 0 1 0 0 0ù
ê0 0 0 1 0 0úú
ê
ê0 0 0 1 0 0ú
ADN = ê ú
ê0 0 1 0 0 0ú
ê1 0 1 0 0 0ú
ê ú
êë0 1 0 0 1 0úû
90
L’OFFERTA DI TRASPORTO
Una rappresentazione analitica più compatta ed assai più spesso utilizzata è quella della
cosiddetta Forward-Star (FWS). La Forward-Star di un generico nodo i è un insieme
contenente tutti i rami aventi come inizio il nodo i (quindi “uscenti” dal nodo i):
" iÎN, FW(i) = {(i,j): (i,j) Î L, "jÎN)} 46
La Forward-Star dell'intero grafo si ottiene unendo le Forward-Star di tutti i nodi del grafo.
Per l'esempio precedente le Forward-Star che rappresentano il grafo sono:
FW(1) = {(1,3)}
FW(2) = {(2,4)}
FW(3) = {(3,4)}
FW(4) = {(4,3), (4,6)}
FW(5) = {(5,1), (5,3), (5,6)}
FW(6) = {(6,2), (6,5)}
La Backward-Star dell'intero grafo è l'insieme delle Backward-Star di tutti i nodi del grafo.
Ovviamente il contenuto informativo di una rappresentazione tramite FW-Star o BW-Star è
assolutamente identico. È, altrettanto ovviamente, possibile costruire la BW-Star se è nota
91
L’OFFERTA DI TRASPORTO
Ne consegue che:
a º (inizio(a), fine(a))
dove:
§ a = indice di un generico ramo della rete;
§ inizio(a) = estremo iniziale dell'arco a;
§ fine(a) = estremo finale dell'arco a.
Ad ogni componente elementare del modello di offerta (arco del grafo) può essere associata
una componente quantitativa (detta costo) che rappresenta la disutilità recepita dagli utenti
nell'effettuare la fase dello spostamento che l'arco rappresenta (e nel passare da tale fase alla
fase successiva dello spostamento). Un grafo ai cui archi siano stati associati tali costi è un
grafo pesato o rete. L'aliquota di disutilità associata a ciascuna fase dello spostamento (a
ciascun arco) può essere composta da diverse voci. Alcune di queste possono essere dei costi
monetari, altre possono rappresentare il tempo speso per compiere quella fase dello
spostamento, ecc. Le diverse componenti del costo prendono il nome di attributi di costo. In
generale, dunque, ad ogni arco è possibile associare una serie di attributi di costo ed il costo
dell'arco è l'insieme di tali attributi. In termini formali:
" aÎL, costoa=[xa1, xa2, …] 48
dove con:
§ costoa si è indicato il costo del generico ramo a;
92
L’OFFERTA DI TRASPORTO
dove:
§ bk è un coefficiente di reciproca sostituzione che permette di convertire tutti gli attributi
di costo in grandezze adimensionali (ogni coefficiente è dunque espresso in unità di
misura che sono l'inverso di quelle dell'attributo di costo che moltiplica) che si suppone
possano essere sommate per ottenere il costo associato all'arco2; ne consegue che il
costo di arco può essere considerato una grandezza scalare ed adimensionale.
Il vettore costituito dai costi associati a tutti i rami della rete (c) prende il nome di vettore
dei costi di arco ed i vettori costituiti dagli attributi di costo di tutti i rami della rete (xw)
prendono il nome di vettori degli attributi di costo di arco. Vale, dunque, la relazione
vettoriale:
c = å bk xk = x × β 50
k
1 I costi degli archi saranno utilizzati per determinare i costi degli itinerari, introdotti nel capitolo precedente.
Questi ultimi sono le disutilità del modello di scelta preventivo e, quindi, per ogni itinerario, devono essere
delle grandezze scalari.
2 Tale ipotesi sottointende la compensatorietà degli attributi di costo. Esiste cioè sempre una opportuna
quantità per un certo attributo di costo che è equivalente (attraverso il rapporto dei coefficienti di reciproca
sostituzione) ad una quantità unitaria di un altro degli attributi di costo. Ad esempio, una certa quantità di
tempo speso per effettuare la fase dello spostamento rappresentata dall'arco può essere compensata da
un'opportuna altra quantità di denaro.
93
L’OFFERTA DI TRASPORTO
tempo impiegato per compiere una certa fase dello spostamento), sia perché potrebbe ogni
volta percepirli (stimarli) in maniera diversa, sia, infine, perché più utenti che compiono una
stessa fase dello spostamento sono sicuramente caratterizzati da una dispersione del modo
in cui percepiscono gli attributi di costo. Le grandezze precedentemente introdotte (costi ed
attributi di costo) devono, dunque, essere considerate come i valori medi delle relative
grandezze aleatorie.
In generale gli attributi di costo relativi ad una fase di viaggio (arco) potrebbero non essere
indipendenti (in valore medio) rispetto alle condizioni in cui la fase del viaggio avviene. In
particolare, ci si vuole qui riferire al fenomeno per cui l'offerta di trasporto è quasi sempre
caratterizzata da un limite superiore (capacità) alla quantità di servizio di trasporto che è
intrinsecamente in condizioni di offrire. Al crescere del numero di utenti che, in un
determinato periodo di riferimento, usufruisce del servizio, progressivamente, quindi, che si
tende a raggiungere il limite superiore di capacità offerta, scade la qualità del servizio stesso
o, in altri termini, aumenta il costo generalizzato degli utenti nell'usufruirne. Ad esempio, è
esperienza comune che all’aumentare del numero di veicoli che, contemporaneamente,
chiedono di impegnare un tratto di una infrastruttura stradale, diminuisce la velocità con cui
gli stessi riescono a defluire sull'infrastruttura stessa, aumenta, dunque, il tempo impiegato
per spostarsi ed aumenta, di conseguenza, il costo generalizzato di trasporto relativo a quella
fase del viaggio. Un siffatto fenomeno prende il nome di congestione ed è definito come il
fenomeno per cui il costo di trasporto sugli archi della rete dipende dalla quantità di utenti
che, in un certo periodo di riferimento, usufruisce degli archi stessi. Una rete caratterizzata
da archi che risentono del fenomeno della congestione si dice rete congestionata. A volte la
crescita del costo di trasporto con l’aumento del numero di utenti che ne vogliono fruire può
essere un fenomeno non intrinseco alla rete e dipendente dalla sua capacità ma un fenomeno
volutamente indotto da chi controlla la rete. È sempre meno raro ricorrere a politiche di
controllo della circolazione che impongano per l'utilizzo della rete stradale delle tariffe
(road-pricing) che non sono costanti ma che dipendono dalla quantità di utenti che
usufruiscono del servizio. Ad esempio, è possibile utilizzare dei sistemi di esazione per
l'utilizzo di particolari arterie stradali (anche in ambito urbano) che sono crescenti con il
numero di utenti in quel momento presenti nel sistema sottoposto a tariffazione. In questo
modo si tende a mantenere sotto controllo costante la qualità, in termini di tempo di
percorrenza o di inquinamento generato sulla tratta stradale, del servizio sottoposto a
tariffazione, offrendo agli utenti una buona qualità di deflusso in cambio della disponibilità
94
L’OFFERTA DI TRASPORTO
dove con:
§ f si è indicato il vettore dei flussi di arco, cioè l'insieme ordinato dei flussi relativi ad
ogni arco della rete, definendo come flusso del generico arco a (fa) il numero di utenti
che impegnano l'arco1 in un periodo di riferimento predeterminato;
§ c(f) la legge di dipendenza tra il vettore dei costi di arco ed il vettore dei flussi di arco,
tale legge di dipendenza si dice modello di congestione e la sua specializzazione per
ogni arco (ca(f)) prende il nome di funzione di costo dell’arco.
Per la congestione indotta da chi esercisce il sistema tali leggi di dipendenza sono una scelta
di politica di controllo e sono, dunque, per definizione note all'analista (che spesso, anzi, le
utilizza come variabile di progetto del sistema). Nel caso, invece, della congestione
intrinseca e dipendente dalla capacità di servizio del sistema di offerta occorre studiare tali
leggi di dipendenza, ad esempio attraverso la teoria del deflusso.
In particolare, dalla teoria del deflusso è possibile individuare le leggi con cui il tempo di
utilizzo del sistema di offerta, relativamente ad una generica fase dello spostamento (arco),
dipende dal flusso (o dai flussi) e quindi come uno degli attributi di costo contribuisce alla
dipendenza funzionale espressa dalla precedente relazione 51. La dipendenza dei tempi dai
flussi per ogni arco definisce le cosiddette funzioni di ritardo, che dunque contribuiscono
alla definizione delle funzioni di costo. La teoria del deflusso viene generalmente studiata in
maniera diversa in corrispondenza di diversi tipi di infrastrutture (o tratti di infrastrutture)
che contribuiscono a determinare l'offerta di servizio di trasporto. Ad esempio, esiste una
teoria del deflusso ininterrotto ed una teoria del deflusso alle intersezioni. Inoltre, per ogni
tipo di elemento infrastrutturale esistono diversi tipi di approccio analitico allo studio del
deflusso: approcci di tipo analogico, approcci basati su leggi di tipo macroscopico,
mesoscopico o microscopico. Perché i risultati della teoria del deflusso possano essere
1
Il modello che si sta sviluppando vale per sistemi in condizioni stazionarie; ci si riferisce, dunque, ad una
qualunque sezione dell’arco e ad un qualunque istante di tempo. In condizioni stazionarie, infatti, il flusso
è indipendente dal tempo e identico in tutte le sezioni dell’arco.
95
L’OFFERTA DI TRASPORTO
utilizzati nell'ambito della rappresentazione delle reti (si ricordi sempre che si sta discutendo
la simulazione di un sistema in contesto stazionario), occorre che le funzioni di ritardo messe
a punto abbiano le seguenti caratteristiche:
§ devono potere essere riferite esclusivamente agli archi1;
§ devono avere proprietà teoriche2 tali che:
• il modello di congestione c(f) sia continuo nell'insieme di definizione del vettore
dei flussi di arco (si vedrà in seguito quale è questo insieme di definizione);
• il modello di congestione c(f) sia monotono crescente rispetto al vettore dei flussi
di arco (in tutto l'insieme di definizione del vettore dei flussi di arco);
o la precedente proprietà è assicurata nel caso in cui la matrice Jacobiana (delle
derivate parziali prime) della funzione vettoriale di ritardo rispetto al vettore
dei flussi di arco sia positiva definita;
ü a sua volta la precedente proprietà è assicurata nel caso in cui le funzioni
di ritardo di ogni arco siano separabili (dipendano, cioè dal solo flusso
sull'arco stesso ed in alcun modo dal flusso su qualunque altro arco) e
monotone crescenti.
Più in dettaglio, si supponga, per comodità, di dividere la funzione di costo di ogni arco in
due aliquote, di cui una caratterizzata da una dipendenza rispetto al flusso ed un'altra
costante:
"a Î L , ca (f ) = cv a (f ) + c 0a Þ c(f ) = cv (f ) + c 0 52
Si vuole che valgano le proprietà di continuità della funzione cv(f), da cui deriva quella di
continuità della c(f), e la proprietà di monotona crescenza della cv(f), da cui quella di
monotona crescenza della c(f). Questa ultima in termini analitici può essere espressa come:
[cv(f1)-cv(f2)]T (f1-f2)>0 " f1 , f 2 53
È possibile dimostrare che condizione sufficiente (non necessaria) per il verificarsi della
precedente è che sia:
1 Occorre che le funzioni di ritardo associate alle intersezioni siano attribuite ad una opportuna
rappresentazione esplosa in cui il tempo di attesa sia associato agli archi che esplicitamente rappresentano
gli accessi dell’intersezione. In alternativa, per intersezioni semplici, si può immaginare la presenza di un
solo accesso e il tempo di attesa può essere aggiunto al tempo di percorrenza del ramo che giunge
nell’intersezione. In tale modo la funzione di ritardo di un ramo rappresenta il tempo (in funzione del flusso)
necessario sia per compiere la fase dello spostamento rappresentato che per passare da questa a quella
successiva.
2 Vengono qui elencate proprietà “standard” richieste alle funzioni di ritardo. La ricerca si sta orientando
negli ultimi tempi verso il rilassamento di alcune delle proprietà elencate. Ad esempio, si stanno studiando
le proprietà di funzioni di ritardo “non ovunque continue” e/o non ovunque monotone crescenti. Tali
proprietà “avanzate”, però, sono ancora oggetto di ricerca scientifica.
96
L’OFFERTA DI TRASPORTO
e cioè che la matrice jacobiana della funzione vettoriale di costo sia definita positiva, dove:
Si è detto che un generico arco della rete di offerta di trasporto è una tra tutte le possibili fasi
di tutti i possibili spostamenti che avvengono (o possono avvenire) utilizzando il sistema di
trasporto stesso. Un intero spostamento, dunque, è rappresentato su rete da una successione
di archi, cioè dalla successione di tutte le fasi che lo compongono. Una tale successione di
archi è un percorso. Il concetto di percorso era già stato introdotto nel capitolo precedente
ed era stato lì definito proprio come una delle alternative elementari di spostamento che si
realizzano utilizzando l'offerta di trasporto.
Il modello di calcolo dei costi di percorso permette di determinare gli attributi di costo dei
percorsi elementari in funzione degli attributi di costo degli archi della rete. Sotto opportune
ipotesi relative alla scelta degli attributi di costo d'arco ed a quella degli attributi di costo dei
percorsi e nell'ipotesi in cui i coefficienti di reciproca sostituzione del modello di domanda
97
L’OFFERTA DI TRASPORTO
per il calcolo dei flussi di itinerario e quelli di reciproca sostituzione per il calcolo dei costi
generalizzati d'arco coincidano, i costi di percorso sono esprimibili in funzione dei costi di
arco.
Detto xr il vettore degli attributi di costo di arco relativo ad un generico attributo r (ad
esempio il tempo di pecorrenza) e XPr il vettore degli attributi di costo di percorso relativo
alla stessa componente di costo, si cerca la funzione:
"r XPr = XPr (xr)
La precedente relazione viene di solito espressa attraverso dei modelli di tipo lineare1; in
particolare si fa di solito l'ipotesi che gli attributi di costo relativi ad un percorso siano la
somma degli attributi di costo degli archi che lo compongono. In tale caso è facile verificare
che risulta:
"r XPr = ΔiT xr "r 57
dove Δi è la matrice d'incidenza archi/percorsi relativi a tutti i percorsi della i-esima coppia
origine-destinazione.
Il generico elemento δak della matrice di incidenza archi/percorsi assume valore unitario nel
caso in cui l'arco a appartiene al percorso k, valore nullo altrimenti2.
La stessa relazione può essere scritta, in forma matriciale:
"r XPr = ΔiT xr 58
Se si suppone che le stesse leggi lineari semplificate di composizione (58) valide per gli
attributi di costo siano valide anche per il costo complessivo, risulta:
wi = ΔiT c 59
La precedente relazione 59 è la forma più utilizzata del modello di calcolo dei costi di
percorso. È il caso di notare che essa non è l'unica forma possibile per tale modello e che la
espressione estremamente semplice cui si è giunti è il risultato di una serie di ipotesi
semplificative. Infatti, è possibile scrivere la 59 solo avendo assunto:
§ una legge lineare di composizione degli attributi di costo di arco nella formazione del
costo complessivo (equazione 50);
1 Si noti che questa non è l'unica maniera in cui è possibile esprimere la relazione tra attributi di costo di
percorso ed attributi di costo di arco. Essa è sicuramente una ipotesi che permette di esprimere una relazione
semplice, ma sottintende alcune limitazioni: è implicitamente ipotizzato che un attributo di percorso si
componga in maniera lineare attraverso l'omologo attributo di arco. Ad esempio, il tempo complessivo
percorso a piedi “pesa” in maniera lineare rispetto ai tempi a piedi percorsi in ognuna delle fasi dello
spostamento. Tale ipotesi non sempre è ragionevole perché un attributo di percorso (che è una componente
di utilità o, più spesso, disutilità dello spostamento che lo rappresenta) potrebbe essere, ad esempio, più che
lineare rispetto alle omologhe singole componenti di disutilità delle fasi dello spostamento.
2
Si noti che la matrice Δi contiene implicitamente, per ogni coppia o/d, la descrizione di tutti gli archi della
rete e di come questi sono collegati tra di loro. Essa, dunque, è una rappresentazione del modello topologico
di offerta.
98
L’OFFERTA DI TRASPORTO
§ una legge lineare di composizione degli attributi di scelta (attributi di costo di percorso)
nella utilità (disutilità/costo) dei modelli di scelta del percorso (tale ipotesi, in realtà, è
stata espressa più in generale per i modelli basati sulla teoria delle scelte discrete –
relazione 13);
§ l'utilizzo dello stesso tipo di attributi di costo per la determinazione sia del costo
complessivo di arco che dei costi (disutilità) di percorso;
§ l'utilizzo degli stessi coefficienti di reciproca sostituzione sia per i costi complessivi di
arco che per le disutilità di percorso.
Un'altra delle funzioni del modello di offerta è quella di simulare il modo in cui gli utenti,
nel realizzare i loro spostamenti, caricano il sistema di offerta di trasporto, ovvero le modalità
con cui lo utilizzano. A tale scopo occorre rappresentare in che modo i percorsi scelti dagli
utenti si concretizzano nell'utilizzo della rete e come, quindi, i flussi di percorso si
ripartiscono sui diversi archi della rete che li compongono. Il modello di propagazione del
flusso è proprio finalizzato alla rappresentazione di tali fenomeni.
La legge di ripartizione dei flussi di percorso si assume lineare e, più in particolare, si
suppone che il flusso di ogni arco sia la somma dei flussi di tutti i percorsi che lo utilizzano.
In termini algebrici:
∀𝑎 ∈ 𝐿 𝑓<= = ∑) 𝛿<,) ℎ)
dove con Ii si è indicato l'insieme dei percorsi relativi alla i-esima coppia o/d), con hk il flusso
su uno di questi percorsi e con fia il contributo al flusso di arco del ramo a dovuto alla sola
i-esima coppia o/d. Si noti che la presenza dei valori della matrice di incidenza archi percorsi
fanno si che si sommi al flusso di arco solo il flusso dei percorsi che utilizzano l’arco stesso.
Nel precedente capitolo si è indicato con hi il vettore dei flussi di itinerario relativo alla i-
esima coppia o/d.
È facile verificare che in termini matriciali la precedente relazione algebrica può essere
scritta come:
fi = Δi hi
Volendo considerare la presenza di tutte le coppie o/d nel contributo ad ogni arco della rete:
f=åi Δi×hi 60
99
L’OFFERTA DI TRASPORTO
Si noti che, detto Shi l'insieme (nello spazio R+np) in cui si ipotizzano definiti i flussi di
itinerario relativi alla domanda (coppia o/d) i-esima, l'insieme (dello spazio R+na) in cui sono
contenuti i flussi di arco si ottiene dal primo per trasformazione lineare:
Sf = {f: f = åi Δi hi, hiÎShi " i}
L’insieme Shi, a sua volta è definito come l’insieme di tutti i flussi di itinerario ammissibili
(cioè di quelli che potrebbero verificarsi, anche se non è detto che si verifichino) per ogni i-
esima domanda (coppia o/d). L’ammissibilità deve essere verificata rispetto al fatto che i
flussi di itinerario non possono essere negativi e rispetto al fatto che la somma di tutti i flussi
di itinerario relativi ad una stessa domanda devono essere pari alla domanda di mobilità
stessa. In termini formali:
" i Shi = {hi: hi³0, åhÎIi hh = di }
100
L’INTERAZIONE TRA DOMANDA ED OFFERTA
Il fenomeno della interazione tra domanda ed offerta di trasporto1 può essere interpretato sia
con riferimento alla rappresentazione analitica che è stata costruita fino ad ora, sia attraverso
la descrizione della fenomenologia di un sistema di trasporto.
Nel seguito si preferisce dapprima percorrere la prima strada, per dimostrare in seguito che
le relazioni ottenute, in certe ipotesi, possono essere ritenute rappresentative del fenomeno
così come esso può essere osservato. La descrizione dell'interazione tra domanda ed offerta
verrà fatta con riferimento a sistemi stazionari (per i quali sono state ricavate fino ad ora le
formulazioni dei modelli di domanda ed offerta), in seguito si provvederà a descrivere un
approccio alternativo di tipo dinamico e ad illustrare, rispetto a questo, in che modo sia
necessario modificare i modelli fin qui introdotti e come, in tale formulazione alternativa,
può essere studiata l'interazione tra domanda ed offerta.
1 Il modello d'interazione tra domanda ed offerta è spessissimo chiamato modello di assegnazione. Nel
seguito parlare di assegnazione o di interazione domanda/offerta verrà considerato perfettamente
equivalente.
2 È qui il caso di dichiarare esplicitamente che il modello di scelta discreta sotteso al modello di domanda
per la stima dei flussi di percorso si ipotizza essere di tipo aleatorio. Nel caso di modelli di tipo
deterministico occorre, lo si farà nel seguito, puntualizzare diversamente alcune considerazioni.
101
L’INTERAZIONE TRA DOMANDA ED OFFERTA
La relazione 61 esprime la funzione1 che lega il costo dei rami della rete (le condizioni di
disutilità incontrate dagli utenti del sistema nelle loro fasi del viaggio) con il numero di utenti
che, in un dato periodo di riferimento, utilizzano la rete.
La mappa di carico della rete possiede alcune proprietà facilmente dimostrabili. La loro
utilità è finalizzata alla successiva discussione sulle proprietà teoriche del modello
d'interazione domanda/offerta.
definizione il campo R+na (dove, come al solito, na esprime il numero di archi della rete).
Si noti anche che i valori che possono essere assunti dalla mappa di carico della rete si
ottengono attraverso la trasformazione dei flussi di percorso e che quindi se questi ultimi
appartengono all’insieme Sh dei flussi di percorso ammissibili altrettanto vale per il flussi di
arco che non possono che appartenere ad Sf .I flussi di percorso calcolati all’interno della
mappa di carico della rete, d’altra parte, si ottengono proprio moltiplicando i flussi di
domanda per una matrice di probabilità e dunque sono valori sicuramente non negativi. La
matrice di probabilità delle scelte preventive, infine, è tale per cui, ovviamente, la somma
1 Come si chiarirà ulteriormente nel seguito, si tratta di una particolare “mappa” e cioè di una “funzione”
perché il modello di scelta dell'itinerario sotteso è di utilità aleatoria (non di utilità deterministica).
102
L’INTERAZIONE TRA DOMANDA ED OFFERTA
degli elementi di una stessa colonna ha valore unitario, dunque i flussi di percorso relativi
ad una stessa coppia origine/destinazione, ottenuti da essa e dai flussi di domanda, non
possono che sommare alla domanda relativa alla coppia o/d. Essi appartengono, dunque,
all’insieme Sh e quindi i flussi di arco ottenuti dalla mappa di carico della rete appartengono
a Sf .
"i "(V'i , V' 'i ) di × [ p(V'i ) - p(V' 'i )]T × (V'i -V' 'i ) ³ 0 Þ [h '-h ' '] × (V' -V' ' ) ³ 0
i i T
i i
Ne consegue che, sommando tra loro tutte le precedenti relazioni per tutte le coppie o/d:
"(V ' , V ' ') å [hi '-hi ' '] × (V'i -V' 'i ) ³ 0
T
dove:
[
V' = ..., Vi'T ,... ]
T
[ ]
V' ' = ..., Vi''T ,...
T
1 Sempre nell'ipotesi, tra l'altro, che il modello di scelta dei percorsi sia di tipo aleatorio e non deterministico.
103
L’INTERAZIONE TRA DOMANDA ED OFFERTA
Sostituendo allora all'utilità la sua espressione in termini di disutilità, e cioè l'opposto del
costo:
( )
T
æ T Tö
é i æ i ' ö i æ i ' ' öù
"çç w' = é..., w i ,...ù , w' ' = é..., w i. ,...ù ÷÷ å
'T ''T i i
êë úû êë úû êëh çè w ÷ø - h çè w ÷øúû × w '-w ' ' £ 0
è ø i
Ricordando che i costi di percorso possono essere ottenuti in funzione dei costi di arco:
-
∀ (𝑐 / , 𝑐 // ) ∑= Bℎ=/ − ℎ=// D ∙ ∆=- ∙ (𝑐 / , 𝑐 // )
A questo punto, utilizzando il modello di propagazione del flusso è possibile scrivere
-
∑=Bℎ=/ − ℎ=// D ∙ ∆=- = (𝑓 / − 𝑓 // )- e dunque:
La mappa di carico della rete, dunque, è monotona decrescente nei costi di arco.
Si noti, inoltre, a conferma di quanto precedentemente dimostrato, che:
𝐽𝑎𝑐[𝑓(𝑐)] = ∑= 𝑑 = ∙ ∆= ∙ 𝐽𝑎𝑐B𝑝= I𝑤 = KD ∙ ∆=-
e che, poiché, dalle proprietà dimostrate per le funzioni di soddisfazione:
"i = (k1, k1,...), Jac[ p(Vi )] è positivo semidefinito
allora:
"i = (k1, k1,...), Jac p wi [ ( )] è negativo semidefinito
e quindi:
"c Jac[ f (c)] è negativo semidefinito 63
104
L’INTERAZIONE TRA DOMANDA ED OFFERTA
costi di arco. In termini analitici, devono valere le due relazioni 51 e 61; esse devono, inoltre,
valere contemporaneamente:
𝑓L = ∑= ∆= ∙ 𝑝= I∆=- ∙ 𝑐̂ K ∙ 𝑑 =
0 64
𝑐̂ = 𝑐I𝑓LK
Nella precedente equazione 64 si è esplicitamente evidenziato che i costi risultanti dalle
funzioni di costo, i flussi argomento delle stesse, i flussi risultanti dalla mappa di carico della
rete ed i costi argomento della stessa si devono corrispondere. L'equazione 64 è anche detta
equazione dell'equilibrio, essa esprime la reciproca congruenza tra modello di domanda e
modello di offerta nel caso di rete congestionata. La equazione 64 può anche essere scritta
come equazione di punto fisso nei flussi. A tale scopo occorre sostituire la seconda
espressione dell'equazione 64 nella prima:
𝑓L = ∑= ∆= ∙ 𝑝= N∆=- ∙ 𝑐I𝑓LKO ∙ 𝑑 = 65
Sostituendo, invece la prima della 64 nella seconda si ottiene l'equazione di punto fisso nei
costi.
𝑐̂ = 𝑐I∑= ∆= ∙ 𝑝= I∆=- ∙ 𝑐̂ K ∙ 𝑑 = K 66
105
L’INTERAZIONE TRA DOMANDA ED OFFERTA
A sua volta, l'insieme dei flussi ammissibili di percorso è vincolato al fatto che i flussi
devono essere maggiori dell'unità e che la somma dei flussi relativi ai percorsi di ogni coppia
o/d deve riprodurre la domanda stessa:
Shi = {"i, hi: hi ³0, hiT 1 = di } 69
()
j ˆf : ˆf Î Sf ® ˆf Î CD Í Sf
Inoltre, la funzione di punto fisso è composta dalla mappa di carico della rete (che si è
dimostrato essere una funzione continua) e dalle funzioni di costo di cui, come detto nel
capitolo precedente, si richiede la continuità. In conclusione, la funzione di punto fisso è
definita in un insieme compatto, è continua ed ha valori in un insieme contenuto nell'insieme
di definizione. Tali condizioni sono quelle per cui vale il teorema di Browers che assicura la
esistenza della soluzione di punto fisso.
106
L’INTERAZIONE TRA DOMANDA ED OFFERTA
( f (c') - f (c' '))T × (c' -c' ' ) £ 0 "(c' , c' ' ) 70.a
inoltre, dalla stretta crescenza delle funzioni di costo che si sta ipotizzando:
(c(f ') - c(f ' '))T × (f' -f' ' ) > 0 "(f' , f' ' ) 70.b
Nell'ipotesi, procedendo per assurdo, in cui esistano due soluzioni di punto fisso risulta:
f' di punto fisso Þ c(f')=c' e, contemporaneamente, f(c')=f'
f'' di punto fisso Þ c(f'')=c'' e, contemporaneamente, f(c'')=f''
Le condizioni di monotonicità, dunque, consegnerebbero, contemporaneamente:
( f (c') - f (c' '))T × (c' -c' ' ) < 0 "(c' , c' ' ) 71a
(c(f ') - c(f ' '))T × (f' -f' ' ) ³ 0 "(f' , f' ' ) 71.b
107
L’INTERAZIONE TRA DOMANDA ED OFFERTA
1 Nella sua espressione originaria il principio di Wardrop è stato introdotto, per sistemi in condizioni
stazionarie, nel caso in cui i modelli utilizzati per la rappresentazione fossero di tipo deterministico. Esso,
però, nella sua espressione sostanziale è facilmente estensibile a qualunque tipo di approccio modellistico
relativo a sistemi in condizioni stazionare. In ogni caso, in questa sede, il principio di Wardrop viene riferito
direttamente alla descrizione della fenomenologia del sistema e non alla rappresentazione modellistica della
stessa.
108
L’INTERAZIONE TRA DOMANDA ED OFFERTA
altri utenti (e/o anche gli stessi) a cambiare le proprie scelte. Il fenomeno di cambiamento
innescato può propagarsi ed evolvere dinamicamente nel tempo. Ad ogni istante in cui le
scelte di itinerario possono essere ripetute, il sistema potrebbe assumere dunque, ogni volta,
una configurazione diversa. Questo fenomeno di propagazione dei cambiamenti può sia
evolvere verso un diverso funzionamento stazionario (in cui, dunque, gli utenti hanno trovato
un nuovo equilibrio nelle scelte di ognuno), sia evolvere indefinitamente attraverso
successivi (eventualmente ripetuti) stati di non equilibrio. In ogni caso, quello che si è
innescato è un processo dinamico. Evidentemente una condizione di funzionamento di
processo dinamico non è (per definizione) una condizione stazionaria ed alcuni degli
strumenti matematici utilizzati finora per rappresentare il sistema dei trasporti devono essere
opportunamente rivisti ed aggiornati. Tale trattazione sarà svolta più oltre.
1
In realtà, anche se si continua ad usare il termine di “probabilità di scelta”, esso andrebbe a rigore sostituito
con quello di “percentuale di scelta”:
109
L’INTERAZIONE TRA DOMANDA ED OFFERTA
()( )
T
c fˆ f - fˆ ³ 0 " f Î Sf 73
Ancorché la funzione di probabilità sia una mappa, dunque, è ugualmente possibile indicare
le condizioni che devono essere soddisfatte nel punto di equilibrio dal vettore dei flussi di
itinerario ( ĥ ) o dal vettore dei flussi di arco ( f̂ ). Le risultanti disuguaglianze variazionali
sono l'equivalente, nel caso deterministico, della espressione di punto fisso (67).
L'esistenza della soluzione di punto fisso può essere dimostrata con riferimento alle
diseguaglianze variazionali nell'ipotesi in cui le funzioni di costo degli archi siano continue
nell'insieme di fattibilità (Sf) degli archi stessi1. A tale scopo si può utilizzare una estensione
del teorema di Browers (già utilizzato nel caso di modello di scelta di tipo probabilistico).
La proprietà d'unicità dell'equilibrio deterministico può essere dimostrata solo con
riferimento alla diseguaglia variazionale scritta in termini di grandezze di arco. Ancora una
volta (come nel caso probabilistico), è necessario che le funzioni di costo siano
(vettorialmente) monotone crescenti rispetto ai flussi di arco. È da notare che il fatto che la
unicità può essere dimostrata solo in termini di grandezze di arco non permette di assicurare
l'unicità della soluzione in termini anche di grandezze di itinerario. Nel caso di modello di
scelta deterministico, infatti, uno stesso vettore di flussi di arco può essere determinato da
diversi vettori di flussi di itinerario.
Come già detto, i modelli d’assegnazione simulano l’interazione tra la domanda e l’offerta
di trasporto. Fino ad ora sono stati introdotti solo modelli di assegnazione in cui tale
interazione è di tipo stazionario, esistono, però, altri approcci che possono essere utilizzati,
a seconda delle circostanze, per la simulazione dell’interazione domanda/offerta. In questo
paragrafo se ne procederà ad una classificazione. Essi possono essere trattati e classificati in
1
Si tratta della stessa condizione del caso probabilistico ma deve essere dimostrata per altra via e con
riferimento alla disuguaglianza variazionale espressa in termini di flussi di arco.
110
L’INTERAZIONE TRA DOMANDA ED OFFERTA
base alle modalità rilevanti con cui avviene l’interazione tra i fenomeni indicati come
“domanda di trasporto” e quelli indicati come “offerta di trasporto” oppure, una volta
determinati i modelli (di domanda e d’offerta) che rappresentano tali fenomeni “reali”, in
funzione delle caratteristiche dei modelli stessi. Ovviamente, nell’ambito di una
modellizzazione rigorosa e congruente dei sistemi di trasporto, le due precedenti alternative
sono perfettamente equivalenti: il modello dell’interazione tra i fenomeni o l’interazione tra
i modelli che rappresentano i fenomeni sono, rispettivamente, l’approccio induttivo e
l’approccio deduttivo di una stessa analisi.
In questa nota si procederà deduttivamente, nell’ipotesi, cioè, di introdurre prima diverse
tipologie di modelli di domanda ed offerta e poi, in base alle diverse caratteristiche di tali
componenti ed alle modalità del loro utilizzo congiunto, classificare i modelli
d’assegnazione.
Come già studiato con riferimento al caso stazionario, le principali componenti dei modelli
di offerta che caratterizzano la rappresentazione del sistema (e quindi il modello di
assegnazione che ne deriva) sono:
• il modello delle funzioni di costo, che permette di determinare la disutilità associata
a ciascun ramo della rete (fase omogenea di uno spostamento) in funzione dei flussi
d’utenti che interessano i rami stessi;
• il modello di propagazione del flusso, che permette di determinare i flussi sugli
elementi della rete in funzione delle scelte di percorso degli utenti (e dei valori di
domanda sulle coppie o/d);
• il modello di calcolo dei costi di percorsi, che permette di aggregare le disutilità dei
rami della rete in modo da determinare le disutilità (costi) dei percorsi in base alle
quali avvengono le scelte degli utenti.
Tali componenti, finora specificate nel caso stazionario, sono anche specificabili, seppure in
maniera diversa, in condizioni non stazionarie (dinamiche) di funzionamento del sistema.
Le principali componenti dei modelli di domanda sono:
• il modello di calcolo delle scelte di percorso, che, in funzione delle disutilità (costi)
dei percorsi, permette di determinare le scelte degli utenti;
• il modello di calcolo dei valori (flussi) di domanda, che permette, in funzione delle
caratteristiche del sistema di trasporto, di simulare le scelte di viaggio degli utenti e
quindi di determinare i flussi di domanda.
Anche tali componenti sono specificabili anche in condizioni dinamiche. Il modello di
calcolo dei flussi di domanda, inoltre, può essere specificato in funzione di attributi di
111
L’INTERAZIONE TRA DOMANDA ED OFFERTA
Livello di Servizio considerati noti e fissi (come trattato fino ad ora) oppure rispetto ad
attributi di livello di servizio non noti a priori perché dipendenti dalle modalità di utilizzo
della rete da parte degli utenti (e quindi dal risultato del modello di assegnazione stesso).
Nel primo caso si parla di domanda rigida, nel secondo di domanda elastica.
In ogni caso, in funzione delle diverse caratteristiche che le componenti dei modelli di offerta
e di domanda possono avere e delle possibili (e significative) combinazioni tra esse, si
ottengono diverse famiglie di modelli di assegnazione, con caratteristiche e campi di
applicazione anche notevolmente differenti; esse sono rappresentate in forma sinottica nella
successiva tabella, in cui i modelli fino ad ora studiati ed il modello di processo dinamico
(modello E, nella successiva tabella) che sarà affrontato nel prossimo paragrafo sono indicati
in grassetto.
Modello Offerta Domanda
Modello di propagazione Modello di calcolo delle Modello di calcolo dei flussi Tipo Modello
Funzioni di costo
del flusso scelte di percorso di domanda
Statico 5.4.1.1.1 A
Costanti Statico Rigido
Dinamico B
Rigido 5.4.1.1.2 C
Statico
Elastico D
Statico
Rigido 5.4.1.1.3 E
Dinamico
Dipendenti dal Elastico F
flusso Rigido G
Statico
Elastico H
Dinamico
Rigido I
Dinamico
Elastico L
I modelli d’assegnazione indicati in tabella come di tipo A e B sono noti come “modelli di
carico della rete”, rispettivamente di tipo statico e di tipo (within-day) dinamico. Per essi, il
modello d’assegnazione si riduce alla determinazione della mappa di carico della rete, cosa
già studiata nel caso particolare dei modelli di tipo A1. I modelli di tipo C e D sono noti come
modelli di “equilibrio degli utenti” con caricamento statico della rete (sono generalmente
indicati come modelli “doppiamente statici”), rispettivamente “a domanda rigida” ed a
“domanda elastica”. I modelli di tipo C2 sono stati già analizzati sia nel caso di modello di
scelta dei percorsi di tipo stocastico che deterministico, ricorrendo rispettivamente alla
trattazione di punto fisso ed alla disuguaglianza variazionale. I modelli indicati con E ed F
sono modelli di processo dinamico (anche detti “modelli day-to-day-dinamic”) con
caricamento della rete di tipo statico, sempre, rispettivamente, a domanda rigida o elastica.
I modelli di tipo E, in particolare, saranno introdotti nel prossimo paragrafo. I modelli di tipo
G, H, I ed L sono tutti modelli con caricamento dinamico della rete (si dicono “within-day-
1
I modelli di tipo A caratterizzati da scelte di itinerario di tipo rispettivamente deterministico o stocastico sono
anche noti come modelli AoN (All-or-Nothing) e SUN (Stochastic Uncongested Network).
2
I modelli di tipo C caratterizzati da scelte d’itinerario di tipo rispettivamente deterministico o stocastico sono
anche noti come modelli DUE (Deterministic User Equilibrium) e SUE (Stochastic User Equilibrium).
112
L’INTERAZIONE TRA DOMANDA ED OFFERTA
1 In realtà è possibile formalizzare modelli di processo dinamico con approccio continuo nel tempo. Tale
formalizzazione, però, non è, ai fini pratici, particolarmente significativa.
113
L’INTERAZIONE TRA DOMANDA ED OFFERTA
Il modello di domanda viene modificato per tenere conto del fatto che in ognuno di tali istanti
gli utenti (non necessariamente tutti gli utenti) possono riconsiderare le loro scelte ed
eventualmente modificarle. Ad un generico istante di scelta t:
"i, pi,t = pi (Vi,t) e hi,t=(1-a) hi,t-1 + a pi(Vi,t) d con aÎ[0,1] 74
dove si è esplicitato il fatto che solo una quota (a) della domanda riconsidera le scelte fatte
nell'istante precedente (il che non esclude, evidentemente, che poi le scelte fatte possano
essere esattamente le stesse dell'istante precedente). Si noti che il modello di scelta dei
percorsi rimane formalmente lo stesso ma viene valutato in funzione delle utilità dei percorsi
relative all'istante di scelta considerato.
Nel caso particolare del primo istante da cui si procede alla simulazione del processo
dinamico:
pi,t0 = p(Vi,t0) e hi,t0=pi(Vi,t0) di 75
Nella precedente relazione compaiono, indirettamente, attraverso l'utilità Vt-1, tutti i costi di
percorso sperimentati dagli utenti in tutti gli istanti in cui hanno effettuato le loro scelte. Essa
esprime quella che viene definita la funzione di aggiornamento dell'esperienza degli utenti,
in qualche modo ne simula una sorta di comportamento di apprendimento.
Le altre componenti del sistema complessivo di modelli e cioè, in particolare, le componenti
modellistiche del modello di offerta (modello di calcolo dei costi di arco, modello di calcolo
dei costi di itinerario, modello di propagazione del flusso) rimangono strutturalmente
inalterate. Esse devono, comunque, essere valutate per ogni istante di tempo:
ci,t = c(ft); wi,t = DT ci,t; ft = åi Di hi,t 77
per completare il modello (dinamico) d'interazione occorre affiancare a tale mappa di carico
il modello di calcolo dei costi di arco:
ct = c(ft)
Si noti che le precedenti due relazioni non prevedono la congruenza, allo stesso istante, della
mappa di carico e delle funzioni di costo, giacché le ultime intervengono nelle scelte
dell'istante di tempo successivo.
114
L’INTERAZIONE TRA DOMANDA ED OFFERTA
È anche il caso di notare che tutte le quantità precedentemente trattate (flussi, utilità, costi,
quanto altro) sono i valori medi di variabili intrinsecamente aleatorie (tale aspetto è stato più
volte ampiamente discusso). Il processo dinamico che abbiamo definito riproduce
l'evoluzione temporale del sistema esclusivamente con riferimento a tali valori medi. Si
tratta, dunque, di un processo dinamico deterministico1.
I valori dei parametri a e b del processo dinamico determinano la velocità di evoluzione del
sistema, le sue proprietà di eventuale convergenza verso attrattori di punto fisso e la stabilità
di tali attrattori. Non è, però, questa la sede in cui definire tali proprietà in funzione del valore
dei parametri del processo dinamico. Basti pensare che anche la sola analisi della stabilità
degli attrattori di punto fisso (se esistenti) è un compito piuttosto arduo che può essere svolte
attraverso delle analisi sugli autovalori e gli autovettori del modello, in modo da investigare
sulla presenza di un opportuno intorno dell’attrattore in cui il sistema di relazioni composto
dalla mappa di carico dinamico della rete e dalle funzioni di costo tende ad “essere attratto”
verso il centro dell'intorno stesso.
Quello che si può dire in generale, a titolo esclusivamente indicativo, è che all’aumentare
del valore del parametro a il sistema tende ad evolvere in maniera sempre più instabile e che
altrettanto succede all’aumentare del valore di b.
1 È il processo dinamico che è deterministico, non il modello di scelta discreta con cui si determina la matrice
delle probabilità di scelta preventive, che può essere sia deterministico che probabilistico.
115