D.DSP Reti

FONDAMENTI DI INGEGNERIA DEI SISTEMI DI TRASPORTO
Fondamenti di Ingegneria dei Sistemi di Trasporto a.a. 2019-20

In verde, argomenti facenti parte del programma
In rosso, argomenti non facenti parte del programma
1 L’ingegneria dei trasporti per i sistemi a rete

2 I Modelli di Scelta Discreti
2.1 Formalizzazione dei Modelli di Utilità Aleatoria
2.1.1 Parametri di reciproca sostituzione, attributi generici e attributi specifici
2.1.2 Le costanti specifiche delle alternative
2.1.3 Alcune peculiarità dei modelli di tipo invariante
2.1.4 L’aleatorietà nei modelli di utilità casuale (il paradosso di Buridano)
2.1.5 La matrice di dispersione
2.2 Il modello Logit-multinomiale
2.3 Il modello nested-logit
2.4 Il modello Probit
2.4.1 La tecnica Montecarlo
2.5 Variabili di soddisfazione e loro proprietà matematiche
2.6 Metodi di aggregazione delle scelte
3 La Domanda di Trasporto
3.1 I modelli per la determinazione dei flussi di domanda
3.2 Specificazione, calibrazione e validazione dei modelli per la stima domanda
3.2.1 Calibrazione
3.2.2 Specificazione
3.2.3 Validazione
3.3 I modelli per la stima dei flussi di percorso
4 L’offerta di trasporto
4.1 Introduzione
4.2 Formalizzazione del modello di offerta
4.2.1 Il modello topologico (il grafo)
4.2.2 Il modello di calcolo dei costi di arco
4.2.3 Il modello di calcolo dei costi di percorso
4.2.4 Il modello di propagazione del flusso
5 L’interazione tra domanda ed offerta
5.1 La mappa di carico della rete
5.1.1 Proprietà della mappa di carico della rete
5.2 L’interazione come problema di punto fisso
5.2.1 Le proprietà teoriche del problema di punto fisso
5.2.2 La spiegazione fenomenologia
5.3 Il caso dei modelli deterministici di scelta del percorso
5.4 Una panoramica su modelli d’assegnazione alternativi a quelli di punto fisso.
5.5 I modelli dinamici di tipo day-to-day: processi dinamici.
ii
Sommario
1 L’ingegneria dei trasporti per i sistemi a rete ....................................................................... 5
2 I Modelli di Scelta Discreti .................................................................................................... 9
2.1 Formalizzazione dei Modelli di Utilità Aleatoria ...................................................................... 11

2.1.1 Parametri di reciproca sostituzione, attributi generici e attributi specifici .............................................. 14
2.1.2 Le costanti specifiche delle alternative .................................................................................................... 16
2.1.3 Alcune peculiarità dei modelli di tipo invariante ..................................................................................... 18
2.1.4 L’aleatorietà nei modelli di utilità casuale (ovvero, il paradosso dell’Asino di Buridano)........................ 19
2.1.5 La matrice di dispersione ......................................................................................................................... 21
2.2 Il modello Logit-multinomiale................................................................................................. 23
2.3 Il modello nested-logit............................................................................................................ 26
2.4 Il modello Probit..................................................................................................................... 37

2.4.1 La tecnica Montecarlo .............................................................................................................................. 38
2.5 Variabili di soddisfazione e loro proprietà matematiche ......................................................... 43
2.6 Metodi di aggregazione delle scelte ........................................................................................ 51
3 La Domanda di Trasporto .................................................................................................. 54
3.1 I modelli per la determinazione dei flussi di domanda ............................................................ 56
3.2 Specificazione, calibrazione e validazione dei modelli per la stima dei flussi di domanda........ 65
3.2.1 Calibrazione.............................................................................................................................................. 66
3.2.2 Specificazione ........................................................................................................................................... 75
3.2.3 Validazione ............................................................................................................................................... 77
3.3 I modelli per la stima dei flussi di percorso ............................................................................. 81
4 L’offerta di trasporto ......................................................................................................... 83
4.1 Introduzione........................................................................................................................... 83
4.2 Formalizzazione del modello di offerta ................................................................................... 88

4.2.1 Il modello topologico (il grafo) ................................................................................................................. 89
4.2.2 Il modello di calcolo dei costi di arco ....................................................................................................... 92
4.2.3 Il modello di calcolo dei costi di percorso ................................................................................................ 97
4.2.4 Il modello di propagazione del flusso....................................................................................................... 99
5 L’interazione tra domanda ed offerta .............................................................................. 101

5.1 La mappa di carico della rete ................................................................................................ 101
5.1.1 Proprietà della mappa di carico della rete ............................................................................................. 102
5.2 L’interazione come problema di punto fisso ......................................................................... 104

5.2.1 Le proprietà teoriche del problema di punto fisso................................................................................. 105
5.2.2 La spiegazione fenomenologia ............................................................................................................... 108
5.3 Il caso dei modelli deterministici di scelta del percorso......................................................... 109
5.4 Una panoramica su modelli d’assegnazione alternativi a quelli di punto fisso....................... 110
5.5 I modelli dinamici di tipo day-to-day: l’interazione congestionata come processo dinamico. 113
iv
L’INGEGNERIA DEI TRASPORTI PER I SISTEMI A RETE
1 L’INGEGNERIA DEI TRASPORTI PER I SISTEMI A RETE
Un sistema di trasporto a rete può essere definito come l'insieme:

§ delle infrastrutture, dei servizi e delle regole che permettono di spostarsi su un certo
territorio (offerta di trasporto);
§ degli utenti (e dei loro comportamenti e delle loro caratteristiche) che chiedono di
utilizzare l'offerta di trasporto (domanda);
§ delle interazioni tra domanda ed offerta.
L’ingegneria dei trasporti analizza e simula il funzionamento delle reti di trasporto.
L'individuazione di un sistema da sottoporre ad una procedura di analisi e simulazione è
un'operazione non banale. Un sistema di tipo territoriale, quale è il sistema dei trasporti, è
caratterizzato, infatti, da un ampio numero di interazioni spaziali, la cui portata ed estensione
non sempre è di facile individuazione. L'individuazione di un sistema, in generale, tende a
definire un insieme di entità fisiche e componenti funzionali che siano il più possibile
caratterizzate dal fatto di essere autocontenute. In altri termini, si tende a definire il sistema
in modo che la maggior parte delle entità e delle relazioni significative siano contenute al
suo interno. In tal modo è possibile procedere alla simulazione endogena (interna al modello
simulativo del sistema) della maggior parte dei fenomeni che lo caratterizzano ed il sistema
scambia con l'ambiente esterno (definito anche non-sistema) un numero definito,
controllabile ed il più possibile ridotto di relazioni. Tale aspirazione (di qualunque
modellista) ad una rigorosa delimitazione del sistema deve spesso fare i conti con la
complessità dei fenomeni reali e con i limiti degli strumenti modellistici a disposizione.
Si pensi, per fissare le idee, di volere simulare il funzionamento del sistema di trasporto della
città di Napoli. Delimitare l'analisi alla sola parte di sistema ricadente, ad esempio, all'interno
dei confini amministrativi del Comune, può essere una inaccettabile approssimazione,
giacché è evidente che buona parte degli spostamenti che interessano l'area urbana di Napoli
sono originati o destinati all'esterno della stessa. Si potrebbe, allora, pensare di estendere la
delimitazione del sistema a tutta la Provincia di Napoli ma, a rigore, neanche questo
basterebbe. Infatti, un numero elevato di spostamenti che interessano i servizi di trasporto
napoletani proviene da luoghi esterni alla provincia ed alla Regione Campania; per avere
una riprova di ciò potrebbe essere sufficiente vedere cosa succede ogni giorno alla stazione
ferroviaria di Napoli Centrale. D'altra parte, l'estensione del sistema all'intera regione
Campania o, anche, a tutto il territorio nazionale italiano ancora non conterrebbe il totale
degli spostamenti: un numero elevato di voli aerei (e di relativi passeggeri) atterra e decolla
5
continuamente dall’aeroporto di Capodichino (quasi 10 milioni di passeggeri all’anno nel

2019). A questo punto, l'unica possibilità sembrerebbe quella di includere nel sistema tutto
il globo terrestre!
In realtà, a tale quasi illimitata estensione vi è una soluzione che va a vantaggio anche della
successiva trattabilità modellistica del sistema che si vuole definire, che aumenta in maniera
più che lineare con la dimensione dell’area di studio e della porzione di rete sottoposta a
modellazione. Una serie di dati che abbiamo incontrato estendendo la nostra analisi, infatti,
possono essere considerati dei dati fissi del problema e non delle variabili da sottoporre a
modellizzazione. Ad esempio, il numero di passeggeri che dall’Australia (ma anche da assai
più vicino, da Milano) raggiungono Napoli è considerabile un dato fisso ed invariante
rispetto alle condizioni di funzionamento del sistema dei trasporti napoletano. Il fatto che a
Napoli vi sia più o meno traffico e congestione1 poco influenza il numero di passeggeri che
provengono dall'Australia (o da Milano), giacché essi molto probabilmente effettuerebbero
egualmente il loro spostamento (e con le stesse modalità) in quanto influenzati da fattori ben
diversi. Questo ragionamento, ripetuto restringendo progressivamente il campo, permette di
definire in maniera più ragionevole l'estensione del sistema. I dati del problema che, così,
possono essere considerati fissi (e quindi tenuti fuori dal sistema) rappresentano proprio le
relazioni che il sistema scambia con il non-sistema; tali relazioni non si vuole che siano nulle
ma che siano invarianti rispetto ad eventuali modifiche che l’analista/progettista vuole
testare sul sistema di trasporto. È evidente che tale processo di delimitazione dipende
fortemente dagli interventi che, come in qualsiasi applicazione ingegneristica, si intendono
realizzare e che motivano la messa a punto di un modello di simulazione. Se il modello di
simulazione intende verificare l’effetto della variazione di un numero limitato di schemi
semaforici e/o schemi di circolazione in una area ristretta, il confine oltre il quale non si
risentono gli effetti degli interventi è sicuramente limitato. La realizzazione, invece di un
collegamento ad alta velocità tra la Campania e la Puglia necessità della rappresentazione di
tutta la rete ferroviaria italiana perché potrebbe determinare una variazione di comportamenti
alquanto ampia.
Per quanto diversamente ampia possa essere una rete sottoposta a simulazione, il sistema
che essa rappresenta è comunque sicuramente intrinsecamente complesso. Le principali
cause di complessità sono:
§ la presenza all'interno del sistema di diverse componenti;
1 Entrambi i due precedenti termini sono per ora utilizzati nella loro accezione del linguaggio comune ma,
come si vedrà meglio in seguito, nel linguaggio rigoroso del nostro settore sono sbagliati.
6
§ la presenza di un numero notevole di interazioni reciproche tra queste componenti;

§ la natura non lineare di molte di tali interazioni;
§ la presenza di fenomeni intrinsecamente aleatori.
I sistemi di trasporto, così come precedentemente definiti (e caratterizzati rispetto alla loro
intrinseca complessità), possono trovarsi in diverse condizioni di funzionamento. Una
particolare condizione di funzionamento di un sistema di trasporto è quella di sistema
stazionario. Le ipotesi alla base di un sistema stazionario prevedono che nessuna delle
grandezze significative che descrivono il sistema stesso sia variabile nel tempo. Ovviamente,
non sempre una tale ipotesi può essere considerata realistica in maniera assoluta. Si può anzi
dire che, da un punto di vista di estremo rigore, l'ipotesi non può considerarsi mai verificata,
se non altro per l'intrinseca aleatorietà del ripetersi dei fenomeni di mobilità. Evidentemente,
dunque, la condizione di stazionarietà deve essere intesa rispetto ai valori medi delle variabili
ritenute significative. In conclusione, l'ipotesi di stazionarietà può essere interpretata come
una approssimazione (ove accettabile) delle condizioni di funzionamento del sistema nel
caso in cui le variabili descrittive del fenomeno non siano influenzate dal tempo in maniera
sistematica.
Giacché nei fenomeni che si vogliono simulare coesistono variazioni sistematiche (non
stazionarie) ed aleatorie, è importante riconoscere le cause di variabilità anche ai fini di una
buona significatività dei modelli.
Si noti, ad esempio, come nella successiva figura 1 una grandezza generica (X) possa essere
considerata indipendente dal tempo rispetto a tre intervalli ben separati. In ognuno di essi,
infatti la dispersione di valori osservati per la variabile (realizzazioni della variabile) può
essere considerata dovuta ai soli effetti aleatori.
X
µ3
µ
µ1
µ2
t
Figura 1 – Intervalli di stazionarietà di una variabile
7
Per ognuno di tali intervalli, dunque, è pensabile di rappresentare la variabile attraverso il

suo valor medio (µ1, µ2 ed µ3 rispettivamente per ognuno degli intervalli). Non sarebbe
altrettanto ragionevole rappresentare la stessa variabile con un valore (medio) ritenuto
costante in tutti gli intervalli di tempo (µ, nella figura 1), perché tale impropria aggregazione
nasconderebbe le variazioni sistematiche dovute alla non stazionarietà del fenomeno. Ciò è
evidenziato anche dal valore che assumerebbe la varianza della variabile, assai elevato nel
caso di rappresentazione unica per tutti i periodi di tempo (Var_tot, nella successiva figura
2), molto più ragionevole nel caso di valori ritenuti costanti per singoli intervalli
(rispettivamente Var_1, Var_2, Var_3, nella figura 2).
Var_1 Var_2 Var_3 Var_tot
Figura 2 – Dispersione di una variabile e campi di stazionarietà
È evidente che, ancorché l'aleatorietà dei fenomeni modellizzati sia intrinseca ed

ineliminabile (ed essa sarà tenuta in debito conto, come sarà evidente nel seguito), è interesse
degli analisti costruire dei modelli in cui lo scostamento rispetto ai valori medi simulati sia
contenuto in un ambito ragionevole; ciò assicura una maggiore capacità previsionale ai
modelli stessi. In ogni caso, poi, gli scostamenti attorno ai valori medi considerati devono
potere essere ritenuti imputabili a fenomeni il più possibile intrinsecamente aleatori e quanto
meno possibile ad errori di modellizzazione quali quello precedentemente illustrato.
Ad ogni buon conto, queste dispense affronteranno la simulazione di sistemi di trasporto in
condizioni stazionarie.
8
I MODELLI DI SCELTA DISCRETI
2 I MODELLI DI SCELTA DISCRETI
I modelli di scelta discreta sono un potente strumento a disposizione della Ingegneria dei
trasporti. Essi vengono utilizzati allo scopo di simulare un disparato e vario tipo di scelte a
cui possono trovarsi di fronte gli utenti d'un sistema di trasporto. L'applicazione alla
ingegneria dei trasporti è solo una tra le tante possibili applicazioni dei modelli di scelta
discreta, che sono ampiamente utilizzati in molte applicazioni dell'econometria: per la teoria
delle scelte discrete Daniel Mac Fadden ha vinto, insieme a James Heckman, il nobel per
l’economia.
In questo capitolo non vi saranno riferimenti all'oggetto delle scelte che i decisori
intraprendono. I decisori, le alternative di scelta e quanto altro serve per descrivere i modelli
di scelta discreta saranno introdotti, ove non diversamente specificato, senza riferirsi ad un
esplicito contesto applicativo. In altri termini, quanto verrà qui descritto potrebbe essere, in
linea di principio ed esemplificativamente, applicato ad un problema di scelta tra diverse
modalità di trasporto, così come alla scelta di una marca di frigorifero, o a quella di un
gestore telefonico, o quella tra diversi percorsi che collegano una coppia origine-
destinazione tra cui vi è una domanda di spostamento.
I modelli di scelta discreta sono basati sull'ipotesi di potere rappresentare attraverso uno
strumento di simulazione i risultati delle scelte effettuate da un decisore.
Il primo processo logico è quello di simulare il contesto di scelta del decisore. Per
definizione, in un modello di scelta discreto, tale contesto di scelta viene simulato con un
numero discreto (e finito) di alternative di scelta che l'analista considera essere nella
percezione del decisore. L'analista deve dunque come prima cosa identificare quali siano le
alternative discrete tra cui il decisore effettua la sua scelta. Ad esempio, per un decisore che
debba scegliere di acquistare un'automobile, l'analista può ipotizzare che l'insieme di scelta
sia costituito da tutte le marche ed i modelli disponibili sul mercato, a meno di quelli con un
costo superiore ad una certa cifra (che il decisore si suppone escluda sicuramente a priori)
e/o omologate per una capienza minore di 4 persone, ecc...
Il contesto di scelta si suppone definito in modo che il decisore sia di fronte ad un numero
finito di alternative. L'analista è in grado di applicare un paradigma formale di scelta che
simula il comportamento decisionale rispetto a tale insieme di scelta. È importante notare
come tale paradigma è uno strumento proprio dell'analista e non del decisore. Il paradigma
formale permette di simulare i comportamenti di scelta ma non è necessariamente la
9
riproduzione dei meccanismi individuali “psicologici” e dei processi mentali del decisore.
Si tratta di un meccanismo di rappresentazione per “simulazione” e non per “riproduzione”.
Nella simulazione dei sistemi di trasporto si possono in generale adottare modelli di tipo
descrittivo o comportamentale. I modelli di scelta discreta sono intrinsecamente
comportamentali e differiscono da modelli semplicemente descrittivi proprio per la presenza
del paradigma formale decisionale. Esso rappresenta un processo di scelta, pur non essendo
necessariamente il comportamento vero del decisore.
Un modello descrittivo è in grado di rappresentare le scelte fatte dall'utente in funzione di
una serie di variabili esplicative, così come è in condizioni di rappresentare scelte diverse in
funzione di diversi valori assunti dalle variabili esplicative; si tratta, quindi, di una funzione
analitica tra una o più variabili esplicative ed una variabile dipendente (la scelta). Tale
funzione (vista come modello descrittivo) permette la rappresentazione dei risultati del
comportamento di scelta indipendentemente dalla rappresentazione di un comportamento.
Un modello comportamentale, invece, quale quelli basati sulla teoria delle scelte discrete,
pur rappresentare anche esso da un punto di vista matematico una relazione tra variabili
esplicative e scelte, ma lo fa attraverso la mediazione della rappresentazione esplicita di un
comportamento. In altri termini, la specifica razionalità utilizzata all'interno del paradigma
formale di scelta e le esplicite relazioni di causa-effetto che esso sottende sono i fattori che
determinano, nel modello, le scelte. Ad esempio, non sarebbe mai possibile, nella
simulazione della scelta di un'automobile, che un modello comportamentale rappresenti le
scelte dei decisori utilizzando come variabile esplicativa il costo di un chilo di mele, mentre
nulla impedisce che un modello descrittivo “funzioni” (e magari anche bene) nel mostrare
un eventuale bizzarra relazione statistica tra costo delle mele e scelta dell’automobile.
Analogamente, sempre ad esempio, ben difficilmente un modello comportamentale potrebbe
mostrare una preferenza di scelta all'aumentare (al di là di altre considerazioni) del costo
sopportato per la scelta stessa, a meno che il paradigma formale non espliciti le ragioni di un
tale controintuitivo comportamento. Un modello descrittivo, nelle stesse condizioni,
potrebbe invece tranquillamente mostrare una preferenza nella scelta di automobili che
costino di più, al di là di ogni necessità di spiegazione e rappresentazione che giustifichi un
tale fenomeno.
I modelli di scelta discreta che tratteremo nel seguito sono basati sulle ipotesi che:
§ il decisore conosca tutte le alternative dell'insieme di scelta;
§ associ ad ognuna di esse una quantità scalare (modelli monocriterio) che è un
indicatore della utilità della alternativa;
10
§ scelga l'alternativa per cui l'indicatore di utilità attinge il valore massimo.

Le precedenti tre ipotesi definiscono quello che viene indicato come comportamento
razionale del decisore.
2.1 FORMALIZZAZIONE DEI MODELLI DI UTILITÀ ALEATORIA

Un particolare tipo di modelli di scelta discreta sono i modelli d'utilità aleatoria (o utilità
casuale, si tratta di sinonimi).
Nella formulazione più usuale dei modelli d'utilità aleatoria si suppone noto l'insieme delle
alternative discrete tra cui l'analista ritiene che il decisore effettui la sua scelta1.
§ I = insieme di scelta, insieme di tutte le alternative percepite dal decisore;
§ j = generica alternativa di scelta; jÎI
Il paradigma formale di comportamento ipotizzato è tale per cui l'analista suppone che ad
ogni alternativa appartenente all'insieme di scelta il decisore associ una grandezza scalare2
(detta utilità della scelta, Uj) e che la scelta avvenga per l'alternativa di massima utilità. Tale
paradigma formale si è già detto essere quello del decisore razionale. Inoltre, per una serie
di motivi che saranno analizzati poco più oltre, le utilità associate alle varie alternative
devono essere intese come delle grandezze aleatorie3. Esse vengono quindi, più
propriamente, denominate utilità percepite. Per motivi di trattabilità analitica è opportuno
che esse siano scomposte in due aliquote: una non è altro che la media (il valore atteso) della
utilità percepita stessa (e prende il nome di utilità sistematica), l'altra è la dispersione
aleatoria rispetto al valore medio.
Ponendo quindi:
Vj= E[Uj] 1
1 Esistono specificazioni sofisticate dei modelli d'utilità aleatoria in cui tale ipotesi è rilassata; in tali casi
occorre definire anche il modello con cui l'analista simula la percezione da parte del decisore (o la non
percezione, o il grado di percezione) delle diverse possibili alternative. Lo studio di tale tipo di modelli
esula dagli scopi di queste dispense.
2 Il fatto che l'utilità associata ad ogni alternativa sia espressa attraverso uno scalare che, in qualche modo,
riassume in un solo criterio diverse ragioni di scelta non è una ipotesi priva di motivazioni e di conseguenze.
Anzitutto, essa ha delle ragioni ben precise (non è facile fissare una metrica per delle grandezze vettoriali
e non sarebbe affatto facile definire con quali criteri un vettore può essere considerato maggiore di un altro).
Una delle conseguenze non banali è che, ad esempio, tale ipotesi permette (ma anche, impone) che nel
modello d'offerta, di cui si parlerà più oltre, gli attributi di costo dei percorsi siano omogeneizzati in un
costo di trasporto di percorso generalizzato.
3 In queste dispense si introducono modelli di scelta discreta di tipo aleatorio (o stocastico, o probabilistico,
o casuale, che dir si voglia), in cui, cioè, si considera una dispersione statistica delle utilità di scelta.
Evidentemente è possibile ragionare su modelli di scelta di tipo deterministico, in cui, cioè, si trascura la
dispersione statistica delle utilità. Nel seguito vi saranno numerosi accenni ai modelli deterministici che, da
un punto di visto logico, possono essere visti come un caso limite dei modelli aleatori al restringersi della
dispersione statistica.
11
risulta:
Uj= Vj+ej con ej~ v.a 2
avendo indicato con:

§ Uj = utilità percepita associata nel paradigma formale di comportamento alla generica
alternativa j;
§ Vj = utilità sistematica associata nel paradigma formale di comportamento alla generica
alternativa j;
§ ej = dispersione aleatoria dell'utilità percepita rispetto al suo valore medio.
È opportuno iniziare fin da subito ad introdurre una notazione vettoriale:
U = [U1 … Uj … Un]T V = [V1 … Vj … Vn]T e = [e1 … ej … en]T 3
In seguito alla quale risulta:

U=V+e con V = E[U] e con e~ v.a.m. (f(e), F(e)) 4
Avendo indicato con f(e) e F(e) rispettivamente la funzione di densità di probabilità

congiunta e la funzione di distribuzione congiunta1 del vettore aleatorio e.
Le utilità di scelta, in genere, non riescono ad essere direttamente osservate dall'analista. Si
suppone che esse possano essere espresse in funzione di altre grandezze che riescono a
“spiegare” le utilità. Tali grandezze vengono denominate attributi di scelta.
Si fa l'ipotesi che gli attributi di scelta contribuiscano a determinare il valore assunto dalla
parte sistematica dell'utilità e che in alcun modo essi contribuiscano a determinare le
caratteristiche della dispersione aleatoria2; in termini analitici:
Uj = Vj(Xj1, … Xjk, … Xjm) + ej = Vj(Xj)+ ej ® U = V(X) + e 5
f(e/V) = f(e) "eÎEn, 6
dove:
§ Xj,k = generico attributo di scelta (k-esimo) per la generica alternativa j;
§ Xj = vettore degli attributi di scelta per la generica alternativa j;
§ X = [... ,XjT, ...] T vettore complessivo degli attributi di scelta.
Il paradigma formale di comportamento prevede che la scelta del decisore avvenga per quella
alternativa (tra quelle dell'insieme di scelta) che presenti la maggiore utilità percepita.
L'ipotesi di aleatorietà delle utilità percepite implica che non è possibile determinare quale
1 Si ricorda che esiste una relazione tra funzione di densità di probabilità e funzione di distribuzione di
probabilità per una variabile aleatoria multivariata. In generale, dunque, una può essere espressa in funzione
dell'altra.
2 Tale ultima ipotesi caratterizza, in realtà, una particolare famiglia di modelli di utilità casuale. Si tratta dei
modelli d'utilità casuale di tipo invariante. Si introduce fin da subito tale caratterizzazione perché il seguito
della trattazione avverrà con esclusivo riferimento a modelli invarianti. Le particolari proprietà di tali tipi
di modelli saranno introdotte più oltre.
12
sia la alternativa con la utilità maggiore ma solo la probabilità che ogni alternativa sia quella
d'utilità maggiore1. La probabilità che una data alternativa sia quella di maggiore utilità
coincide con la probabilità che quella alternativa sia scelta dal decisore.
" jÎI p(j) = Prob[ Uj = maxhÎI(Uh) ] 7
avendo introdotto:
§ p(j) = probabilità di scelta2 della generica alternativa j.
La precedente equazione equivale a definire la probabilità che la generica alternativa j sia
maggiore di ogni altra diversa alternativa appartenente all'insieme di scelta e cioè:
" jÎI p(j) = Prob[ Uj > Uh , " hÎI, j≠h] 8
Esplicitando la relazione tra utilità percepita, utilità sistematica e dispersione aleatoria è

possibile scrivere:
" jÎI p(j) = Prob[ Vj - Vh > eh - ej , " hÎI, j≠h] 9
o anche:
" jÎI p(j) = Prob[eh < (Vj - Vh) + ej , " hÎI, j≠h] 10
la precedente relazione può essere facilmente espressa in funzione della densità di

probabilità congiunta del vettore di dispersione. A tale scopo basta calcolare la probabilità
che la dispersione eh di qualunque altra alternativa sia minore della dispersione ej più una
quantità Vh -Vh e che questo avvenga qualunque sia il valore probabilisticamente assunto
dalla quantità ej. In altri termini:
¥
" j p( j) = ò ... ò ... ò f (ε) de ...de ...de
1 j n
11
e j= -¥ e1 <e j + Vj - V1 e n <e j + Vj - Vn
Quanto detto precedentemente esaurisce la descrizione generale dei modelli d'utilità casuale.
Ciononostante, alcune delle ipotesi implicitamente od esplicitamente sottese alle precedenti
formule meritano d’essere approfondite per la loro influenza sulle proprietà teoriche che ne
derivano. In particolare, è il caso di introdurre fin da subito alcuni concetti legati a:
§ la specificazione dei modelli rispetto agli attributi di scelta, il ruolo degli attributi
specifici e di quelli generici ed il ruolo dei parametri di reciproca sostituzione;
1 Una quantità aleatoria, infatti, non ha un “valore”. Essa ha, piuttosto, una distribuzione statistica di valori
che possono essere assunti con una certa probabilità. Di conseguenza non è possibile dire quando una
quantità aleatoria è maggiore di un'altra; è invece possibile dire quale è la probabilità che essa assuma un
valore maggiore di un'altra. Estendendo tale ragionamento a più quantità aleatorie, prese a due a due, è
evidente che non è possibile dire quale sia la massima tra le quantità ma solo quale è la probabilità che essa
assuma il valore massimo. Si ipotizza, inoltre, esplicitamente che la probabilità che due qualunque delle
v.a. possano assumere lo stesso valore sia nulla. Ciò è assicurato nel caso in cui le v.a. siano di tipo continuo.
2 A rigore, si sarebbe dovuta indicare la probabilità come p(j/I), ad esplicitare la dipendenza di essa dalla
composizione dell'insieme di scelta.
13
§ le cosiddette “costanti specifiche delle alternative”, con particolare riferimento al loro

ruolo rispetto alla scomposizione dell'utilità percepita in una utilità sistematica ed in
una dispersione aleatoria;
§ alcune peculiarità dei modelli detti di tipo invariante;
§ le fonti di aleatorietà dei modelli di utilità casuale.
2.1.1 PARAMETRI DI RECIPROCA SOSTITUZIONE, ATTRIBUTI GENERICI E ATTRIBUTI

SPECIFICI
Evidentemente la specificazione completa di un modello di utilità casuale passa per la

esplicitazione delle due componenti che costituiscono l'espressione 4. La specificazione
delle possibili tipologie di distribuzione della dispersione aleatoria (si veda l'equazione 6)
sarà effettuata nei prossimi paragrafi e darà luogo a diverse famiglie di modelli d'utilità
casuale (come si vedrà in seguito, modelli Logit Multinomiali, Probit o altro). Le modalità
di specificazione, invece, dell'utilità sistematica sono oggetto di questo paragrafo. In
particolare, ci si riferirà alla parte di utilità sistematica che dipende dagli attributi di scelta,
introducendo in via generale una altra parte di tale utilità che è invece costante ed
indipendente dagli attributi, e di cui si tratterà più approfonditamente nel prossimo paragrafo.
In via convenzionale si identifichi la parte dell'utilità dipendente dagli attributi con VX.
Ne consegue che è possibile scrive:
V = VX(X)+COST. 12
Da un punto di vista teorico, l'utilità sistematica può dipendere dagli attributi secondo una
funzione qualsiasi, in generale, però, soprattutto per esigenze legate alla calibrazione dei
modelli di scelta (tale argomento sarà trattato più oltre), si ipotizza una relazione lineare tra
attributi di scelta ed utilità sistematica. In particolare, si è soliti ipotizzare che la parte di
utilità sistematica dipendente dagli attributi di scelta possa essere espressa come
combinazione lineare degli stessi secondo opportuni parametri. In termini formali, con
riferimento ad una generica alternativa di scelta:
m
V jX ( X j ) = å b j,k × X j,k 13
k =1
dove, come già detto (equazione 5), il generico elemento Xj,k è il k-esimo attributo di scelta
ritenuto esplicativo per la scelta j e bj,k è il relativo parametro nella combinazione lineare. Ci
si potrebbe chiedere: “In che unità di misura è espressa la utilità?”. Evidentemente l'utilità
non rappresenta una grandezza fisica e, quindi, si potrebbe dire che essa è espressa con una
unità di misura propria, diciamo così convenzionale. Si potrebbe dare un nome a tale unità
14
di grandezza e dire che l'utilità è espressa in “util”. Si può anche decidere convenzionalmente
(ed è l'ipotesi che si fa in queste dispense) che l'utilità sia una grandezza adimensionale.
Congruentemente con l'adozione di tale ipotesi, dalla equazione 13 si evidenza che i
parametri della combinazione lineare (b) con cui si esprime l'utilità non sono grandezze
adimensionali. Ognuno di essi ha una unità di misura che è l'inverso dell'unità di misura
dell'attributo che moltiplica.
I parametri b sono spesso detti coefficienti di omogeneizzazione; essi, infatti, permettono di
sommare grandezze diverse in una grandezza omogenea. I parametri b sono, però, anche
detti parametri di reciproca sostituzione. Il rapporto tra due di essi, infatti, permette di
ottenere un coefficiente atto a trasformare la grandezza moltiplicata dal parametro a
denominatore nella grandezza moltiplicata dal parametro a numeratore. Per fissare le idee su
questo punto si considerino due classici attributi, tipici delle scelte di mobilità: il tempo
impiegato per uno spostamento ed il costo monetario connesso con lo spostamento stesso,
siano essi indicati, rispettivamente con bt e bc. L'unità di misura di bt ha dimensioni tempo-1
mentre quella di bc ha dimensioni costo-1. Se, dunque, si moltiplica il rapporto bt/bc per un
tempo si ottiene un costo (e viceversa, se si moltiplica il rapporto bc/bt per un costo si ottiene
un tempo). In particolare, il rapporto bt/bc è una sorta di valore monetario del tempo1 ed è
una grandezza ricorrente (spesso indicata con l'acronimo inglese VOT – Value of Time) in
molti dei modelli d'utilità casuale utilizzati nell'ambito della simulazione dei sistemi di
trasporto.
Uno stesso attributo k che compaia, seppure con valori diversi, nell'utilità di più di una
alternativa ed a cui, per ognuna delle alternative in cui compare, sia associato uno stesso
ìb k
valore del parametro bk ( b j,k = í "j Î I ) si dice generico, altrimenti si dice specifico
î0
dell'alternativa in cui compare. Ad esempio, nella seguente specificazione relativa a tre
alternative di acquisto di un modello di moto, gli attributi Costo e Cilindrata sono generici,
mentre l’attributo Lunghezza è specifico.
§ Alternativa 1 = Moto da strada, cilindrata 900cc, costo 15.000,00 €, lunghezza 1.80mt.;
§ Alternativa 2 = Scooter da città, cilindrata 250 cc, costo 6.000,00 €, lunghezza 1.45mt.;
1 Sembrerebbe valere, dunque, il vecchio adagio per cui “il tempo è denaro”. Si noti, comunque, che il valore
monetario del tempo non vuole essere introdotto come concetto “assoluto” ma, appunto, come semplice
concetto di “sostituzione” di due diverse grandezze relativamente alla sola scelta modellizzata. Si
tratterebbe, insomma, solo ed unicamente di un indicatore di quanto, ad esempio, un decisore sarebbe
disposto a pagare in più un servizio di trasporto al solo scopo di impiegare meno tempo per il suo
spostamento. In termini assoluti il tempo non ha un valore monetario, se non altro perché nessuno di noi sa
quanto ne ha a disposizione. Almeno il tempo dovrebbe sfuggire a qualunque logica di mercato.
15
§ Alternativa 3 = Moto Custom, cilindrata 883cc, costo 20.000,00 €, lunghezza 2.35mt.

V1X = b cos to × Costo + b cilindrata × Cilindrata
V2X = b cos to × Costo + b lung _ 1 × Lunghezza
V3X = b cos to × Costo + bcilindrata × Cilindrata + b lung _ 2 × Lunghezza

Il lettore immagina come il costo della moto sia sempre considerabile, nel precedente
(scherzoso) esempio, un attributo disutile (il valore del relativo b è atteso, dunque, essere
negativo), la cilindrata un attributo presumibilmente utile (b presumibilmente positivo) e la
lunghezza del mezzo un attributo presumibilmente negativo per la moto destinata
prevalentemente ad uso cittadino ed un attributo molto probabilmente positivo per la moto
“Custom” 1.
Comunque, al di là dell'esempio, il segno algebrico dei parametri moltiplicativi degli attributi
è una caratteristica di fondamentale importanza per individuare un paradigma formale di
scelta “ben costruito”. Deve sempre risultare che attributi il cui aumento si immagina che
produca una maggiore attrattività della alternativa abbiano parametri di segno positivo ed
attributi il cui aumento si immagina producano una minore attrattività dell'alternativa
abbiano parametro di segno negativo.
Anche il valore assoluto dei parametri del modello ha una importanza non trascurabile. Esso,
in dipendenza anche dall'ordine di grandezza dell'attributo a cui è relativo, determina
l'incidenza che l'attributo stesso ha sul valore dell'utilità sistematica e, quindi, è una misura
dell'influenza dell'attributo nel paradigma formale di scelta.
2.1.2 LE COSTANTI SPECIFICHE DELLE ALTERNATIVE
Supponiamo sia perfettamente nota la distribuzione statistica delle utilità percepite e cioè, in
altri termini, che (cosa che non è) il vettore U possa essere osservato dall'analista.
Supponiamo che siano perfettamente noti e valutabili anche gli attributi che influenzano
l'utilità sistematica.
In questo caso si potrebbero valutare separatamente la media della utilità percepita (V=E[U])
e sottrarre ad essa la sola parte di utilità sistematica calcolata in funzione degli attributi
considerati (indicata con Vx(X)); ne potrebbe risultare un vettore di valori costanti ed
indipendenti dagli attributi. Tutto ciò non è altro che quanto già scritto nell’equazione 12. Al
1 La lunghezza di una moto Custom è in generale proporzionale alla lunghezza ed inclinazione della forcella
anteriore. Nessun amante del genere riesce a resistere ad una forcella anteriore spropositatamente lunga,
anche se la moto è tanto più inguidabile quanto più la forcella è lunga.
16
valore costante viene dato il nome, per ogni alternativa, di costante specifica dell'alternativa
(CSA).
CSAj = E[Uj] – VjX(Xj) 14
Se tale valore risultasse nullo, vorrebbe dire che gli attributi spiegano completamente il
paradigma comportamentale dell'utente (VjX = Vj). Le alternative per le quali questo valore
dovesse assumere valore non nullo sarebbero quelle (eventualmente anche tutte)
caratterizzate da una utilità (o disutilità) “per sé”, non spiegabile in funzione degli attributi
ma intrinseca dell’alternativa stessa e, soprattutto, costante.
Le costanti specifiche delle alternative sono, quindi, dei valori che permettono di spiegare
eventuali fenomeni per cui, a parità di utilità sistematica spiegata dagli attributi, una
alternativa potrebbe comunque essere sistematicamente preferibile rispetto ad altre.
La presenza delle CSA, inoltre, è anche una esigenza analitica; esse permettono di assicurarsi
che il valore atteso dei residui aleatori sia nullo. Per rendersi conto di questa esigenza si
supponga di trascurare nella specificazione del modello le costanti specifiche delle
alternative. Si supponga cioè di calcolare l’utilità sistematica come sola parte determinata
dagli attributi di scelta:
V_err = VX(X)
Nella realtà le utilità percepite non sono osservabili dall’analista e l’unico modo che egli ha
per stimarne la media è quella di stimare direttamente (con metodi che saranno spiegati più
oltre) l’utilità sistematica. Tutti gli errori che egli commette nella valutazione di questa utilità
sistematica devono potere cumularsi in maniera aggregata nel termine costante delle CSA.
Perché solo in questo caso il modello può compensare il valore “vero” ma inosservabile della
media delle utilità percepite in modo tale che il residuo aleatorio abbia effettivamente media
nulla. Le costanti specifiche delle alternative sono, dunque, anche una possibile camera di
compensazione di errori effettuati nella valutazione delle utilità sistematiche, per tale motivo,
da un punto di vista pratico, è opportuno analizzare ed approfondire con cautela modelli in
cui le costanti specifiche delle alternative tendessero a spiegare “troppa parte” dell'utilità
sistematica perché questo potrebbe risultare essere un indicatore del fatto di avere commesso
troppi errori modellistici.
Da un punto di vista formale, si è soliti uniformare la notazione relativa alle costanti
specifiche delle alternative a quella generalmente utilizzata per la specificazione dell'utilità
sistematica. In altri termini, si è soliti introdurre degli attributi, detti “attributi specifici
dell'alternativa” (ASA), che assumano valore unitario per l'alternativa a cui riferiscono e
valore nullo per tutte le altre alternative. Le costanti specifiche dell'alternativa vengono
17
trattate come se fossero i parametri (b) associati al relativo ASA. A scopo di esempio si
riporta di seguito la specificazione formale delle utilità sistematiche di un modello di scelta
tra tre alternative, due delle quali caratterizzate da costanti specifiche dell'alternativa.
V1 = V1X + CSA1 ASA1
V2 = V2X + CSA2 ASA2
V3 = V3 X
La precedente maniera di scrivere giustifica anche il nome dato agli ASA (e, di conseguenza,
alle CSA) che, come si vede, sono particolari attributi specifici.
Chi scrive preferisce che questa formalizzazione, che potrebbe portare a considerare gli ASA
alla stregua di “normali” attributi, non sia utilizzata. Non si consideri, quindi, l'introduzione
degli ASA e si considerino, invece, le CSA come la parte di utilità sistematica costante e non
spiegata dagli attributi.
2.1.3 ALCUNE PECULIARITÀ DEI MODELLI DI TIPO INVARIANTE
Una delle peculiarità dei modelli di tipo invariante consiste nel fatto che le probabilità di
scelta stimate dal modello sono invarianti rispetto alla aggiunta, all'utilità sistematica di tutte
le alternative, di una stessa quantità costante.
Infatti, si supponga di avere un modello additivo di utilità aleatoria in cui, per definizione,
la distribuzione del vettore di dispersione aleatoria (fe(e)) non sia dipendente dall'utilità
sistematica. Un modello, insomma, per cui valga l'equazione 6. Si considerino due diversi
vettori dell'utilità sistematica, differenti l'uno dall'altro per una sola quantità costante
(scalare) V0:
V1 , V2 = V1 + V0 1
Si espliciti, per entrambe le utilità sistematiche, la probabilità di scelta di una generica
alternativa j utilizzando la formula 10:
p(j/V) = Prob[eh < (Vj - Vh) + ej , " hÎI, j≠h]
p(j/(V+V0 1)) = Prob[eh < (Vj + V0 - Vh – V0) + ej , " hÎI, j≠h]
Ancorché all'interno dell'espressione della probabilità il termine aggiuntivo costante V0 si

semplifichi e quindi l'argomento della espressione stessa sia apparentemente identico, si noti
che le due precedenti espressioni non coincidono nel caso in cui la funzione di distribuzione
della dispersione aleatoria sia dipendente dall'utilità sistematica. Esse, infatti, in tale ultimo
caso, esplicitate secondo la equazione 11 (ed indicando in essa, esplicitamente, la ipotetica
dipendenza della funzione di densità di probabilità dalla utilità sistematica) darebbero luogo
alle due distinte espressioni:
18
¥
" j p( j / V ) = ò ... ò ... ò f (ε/V) de1 ...de j ...de n
e j= -¥ e1<e j + Vj -V1 e1<e j + Vj -Vn
¥
( (
" j p j / V + V ×1 = 0
)) ò ... ò ... ò f (ε/ (V + V
0
))
× 1 de1 ...de j ...de n
e j=-¥ e1<e j +Vj -V1 e1<e j + Vj -Vn
che, evidentemente, nel solo caso in cui f(e/V) = f(e) "eÎEn (equazione 6) certamente
coincidono.
Si noti che la precedente dimostrazione risulta ancora più semplice nel caso particolare in
cui la dispersione aleatoria sia costantemente nulla, nel caso in cui, cioè, Uj = Vj; si tratta di
un modello deterministico, la scelta si riduce alla determinazione dell'alternativa di massima
utilità sistematica e, come noto, i problemi deterministici di massimizzazione forniscono
risultati invarianti rispetto all'aggiunta di una quantità costante.
2.1.4 L’ALEATORIETÀ NEI MODELLI DI UTILITÀ CASUALE (OVVERO, IL PARADOSSO

DELL’ASINO DI BURIDANO)
Abbiamo introdotto una particolarizzazione dei modelli di scelta discreta che è quella dei
modelli d'utilità casuale. Per essi si è fatta l'ipotesi fondamentale che le utilità associate ad
ogni alternativa di scelta siano caratterizzate da una dispersione aleatoria attorno al valore
medio. Può essere utile analizzare quali siano le possibili fonti dell'aleatorietà introdotta nel
paradigma formale di scelta di un generico singolo1 utente.
Un primo intrinseco motivo di aleatorietà può essere legato alla natura stessa degli attributi
utilizzati nel paradigma formale che, seppure variabili aleatorie, vengono tenuti in conto
nell'utilità sistematica attraverso il loro valore medio2. Si pensi, ad esempio, ad un modello
di scelta di una automobile ed all'attributo del consumo di carburante. È evidente che il
consumo di un’automobile è verosimilmente uno degli attributi che contribuiscono alla
scelta. È altrettanto evidente che esso (ad esempio, per una data automobile, “15 chilometri
con un litro”), seppure riferito a condizioni standard di funzionamento non può che essere
una media degli effettivi consumi, tutti tra loro diversi, che (se anche nelle stesse condizioni
e per la stessa vettura) si realizzerebbero riutilizzandola più volte. Analogamente, con un
esempio più calzante da un punto di vista dell'ingegneria dei trasporti, il tempo che un utente
1 Si tratta, per ora, il caso in cui il modello di scelta discreta sia applicato ad un singolo utente. Aspetti di
aleatorietà (dispersione statistica dei valori delle utilità) legati al fatto che ben raramente un modello di
scelta discreta è applicato in maniera totalmente disaggregata (per un singolo utente) hanno un peso
tutt'altro che trascurabile e saranno analizzati più oltre.
2 E non potrebbe essere diversamente, altrimenti l'utilità sistematica non sarebbe più tale.
19
può impiegare per effettuare un certo spostamento, seppure valutato sempre per uno stesso
modo di trasporto, sullo stesso percorso ed alla stessa identica ora della giornata, non sarà
mai esattamente lo stesso ogni volta che l'utente compirà quello spostamento. In ultima
analisi, la intrinseca dispersione aleatoria di tutti gli attributi considerati nel paradigma
formale viene in maniera aggregata1 considerata come dispersione aleatoria della utilità
percepita attorno al suo valore medio, questo ultimo calcolato attraverso il valore medio
degli attributi stessi.
Un secondo motivo di aleatorietà è connesso con un tipico problema di misura, ancora una
volta riferito agli attributi. Se anche si ammettesse per un certo attributo un valore
intrinsecamente deterministico (senza alcuna dispersione aleatoria), l'analista dovrebbe
comunque operare una misura di tale valore. Ebbene, è noto che ogni misura è
intrinsecamente affetta da un errore e che, nella migliore delle ipotesi, ripetute misure
permetterebbero solo di ottenere uno stimatore statistico del valore cercato e che, infine, tale
stimatore sarebbe intrinsecamente associato da una dispersione aleatoria.
Un terzo motivo di aleatorietà associato al paradigma formale del singolo decisore è
connesso alla intrinseca dispersione dei risultati della decisione. In altri termini, non è detto
che uno stesso decisore, posto più volte di fronte alla necessità di ripetere lo stesso processo
decisionale nelle stesse condizioni, debba necessariamente ripetere identicamente sempre la
stessa scelta. Tali scelte potrebbero essere determinate da una serie di fattori casuali che non
sono esplicitamente modellati e per i quali vi è bisogno di ricorrere alla teoria della
probabilità; ad esempio, uno stesso utente di fronte a più ripetizioni di una scelta modale
potrebbe essere influenzato da fattori casuali quali la pioggia, un momentaneo malessere che
gli impedisca di camminare troppo, ecc.
Ma l'ultimo, fondamentale e decisivo, motivo per cui è bene che un modello di scelta discreta
sia di utilità aleatoria deriva dalla possibilità di dimostrare che un modello di scelta
deterministico non è sufficientemente profondo. La logica di tale dimostrazione ripercorre
(ma ribalta) quella del famoso paradosso dell'asino di Buridano2. Si supponga, di avere
costruito un modello in grado di rappresentare i risultati delle scelte di un decisore razionale
in maniera deterministica. Si supponga di applicare un tale modello alla scelta tra due
1 (ed indistinta rispetto ai vari contributi dei singoli attributi di scelta)

2 Giovanni Buridano nacque nel 1290 (circa) e mori... non prima del 1358. Fu maestro e rettore della Facoltà
delle Arti dell'Università di Parigi. A Buridano è attribuito, tra l'altro, il paradosso dell'asino, che posto tra
due mucchi uguali di fieno, rimarrebbe indeciso e morirebbe di fame. L’esempio non si trova nelle sue
opere, ma è ricavabile dalla sua dottrina secondo cui la volontà nelle sue scelte segue necessariamente il
giudizio dell’intelletto. Nel caso in cui si tratti di scegliere tra beni maggiori e minori, non c'è problema. La
difficoltà nasce quando i beni tra i quali occorre scegliere sono equivalenti: in tal caso l’intelletto non
fornisce indicazioni, la volontà resta indecisa, la scelta non ha luogo… e si fa la fine dell’asino.
20
alternative caratterizzate esattamente dallo stesso valore dell'utilità (sistematica, coincidente

in un modello deterministico con l'utilità tout court). Evidentemente, il modello non potrebbe
mai determinare quale delle due alternative, perfettamente equivalenti, risulta scelta. Si
potrebbe, allora, immaginare che la scelta avvenga in base a qualche considerazione
“esterna” al modello. In tale caso, però, sarebbe possibile pensare, in linea teorica, di
individuare (non importa con quale difficoltà, trattandosi di una possibilità solo teorica
finalizzata alla speculazione) tali considerazioni esterne e di includerle nel paradigma
decisionale. Se tali considerazioni “esterne” sono di carattere aleatorio vuole dire che il
modello adeguato è di tipo aleatorio e non deterministico. Se, invece, tali considerazioni
esterne sono di tipo deterministico, la loro inclusione nel modello dà ancora luogo ad un
modello deterministico. Ci si trova, però, a questo punto, nuovamente al punto di partenza
perché sarebbe infatti possibile immaginare che tali considerazioni deterministiche ora
incluse nel modello possano, sempre in linea teorica e generale, equivalersi perfettamente
per le due alternative considerate. Occorrerebbe, dunque, reiterare il ragionamento fino a
giungere ad un modello di tipo aleatorio oppure fino, all'infinito, a dovere negare la
possibilità di rappresentare i risultati delle scelte del decisore. Il precedente processo logico,
ovviamente, può essere esteso ad un modello in cui sia possibile scegliere tra più di due
alternative; basta considerare la perfetta equivalenza delle due “migliori” di esse. Ne
consegue che un modello di scelta di tipo deterministico non è sufficientemente profondo,
giacché non è in grado di rappresentare adeguatamente i risultati dei processi decisionali a
cui si applica in tutte le possibili condizioni in cui questi possono avere luogo1; tale
occorrenza ha anche un effetto matematico. Si supponga, ad esempio, di considerare un
modello di scelta discreta deterministico e di valutarlo in un punto in cui due alternative
assumono la stessa utilità; si supponga anche che tale utilità sia massima all’interno
dell’insieme di scelta. In una tale situazione è una possibile soluzione qualsiasi ripartizione
di probabilità tra le due alternative di massima utilità. In altri termini, ad un valore del vettore
di utilità sistematica corrispondono più valori del vettore di probabilità. La corrispondenza,
dunque, tra vettori di utilità e vettori di probabilità è una mappa anziché una funzione.
2.1.5 LA MATRICE DI DISPERSIONE
Accertata la maggiore profondità di un modello aleatorio ed esplicitate alcune delle

principali fonti di tale aleatorietà, è opportuno analizzare quali sono, al di là della
1 Si noti che, al contrario di quanto spesso può sembrare nel parlare comune, la razionalità e l’aleatorietà
riferiscono a concetti ben diversi e non sono in antinomia.
21
distribuzione aleatoria specifica (funzione di densità di probabilità e/o funzione di

distribuzione di probabilità congiunta del vettore di dispersione), le principali caratteristiche
del modello aleatorio (invariante).
Una buona parte delle caratteristiche di una qualunque distribuzione aleatoria, come si vedrà
anche nei prossimi paragrafi, sono abbastanza bene rappresentate dalla cosiddetta matrice di
dispersione (S), detta anche (per la sua struttura) matrice di varianza-covarianza. Un
generico elemento (sjh) della matrice di dispersione (SY) di una generica variabile aleatoria
multivariata (Y) è definito come la covarianza tra l'elemento aleatorio j-esimo e l'elemento
aleatorio h-esimo. In termini formali, con riferimento al caso particolare del vettore aleatorio
di dispersione (e), esplicitando la definizione di covarianza e considerando che la dispersione
aleatoria ha per costruzione media nulla:
sjh = Cov[ej, eh] = E[(ej – E[ej])( eh – E[eh])] = E[ej, ej] 15
Gli elementi della diagonale principale sono, in particolare, le varianze degli elementi della
variabile aleatoria multivariata:
sjh = sj2 = Var[ej] = E[(ej – E[ej])2] = E[ej2] 16
In definitiva:
é s12 s ... s1,n ù
1,2
ê 2
ú
ês 2 ,1 s 2 ... s 2 ,n ú
Se = ê 17
ê ! ! " ! úú
êës n ,1 s n ,2 ... s 2n úû
Si lascia al lettore la prova che tale matrice di dispersione può anche essere definita,
sfruttando i prodotti tra matrici, come:
Se = E[(e – E[e]) ( e – E[e])T] 18
Si noti che la matrice di dispersione è una matrice quadrata avente un numero di righe (e di
colonne) pari al numero di elementi del vettore di dispersione (e quindi pari al numero delle
alternative dell'insieme di scelta). È inoltre agevole dimostrare, dalla definizione di
covarianza, che la matrice di dispersione di una qualunque variabile aleatoria multivariata è
simmetrica1, dunque lo è anche la matrice varianza-covarianza del vettore di dispersione
aleatoria (Se =SeT). Si dimostra anche che la matrice di dispersione di una qualunque
1 Per una generica v.a. Y, sjh = E[(Yj – E[Yj] ) (Yh – E[Yh] )] = E[(Yh – E[Yh] ) (Yj – E[Yj] )] = shj
22
variabile aleatoria multivariata è una matrice positiva semidefinita1. Tale è, dunque, anche
la matrice varianza-covarianza del vettore della dispersione aleatoria. I modelli d'utilità
casuale, infine, sono sviluppati sotto le ulteriori ipotesi che le varianze di un qualunque
elemento del vettore di dispersione siano strettamente positive e che la matrice di dispersione
sia non singolare ( det(Se) ≠ 0 ).
Un modello di utilità deterministica può essere visto come il caso limite a cui tende un
modello di utilità aleatoria al tendere della matrice di dispersione alla matrice nulla (Se ® 0).
Ciononostante, molte delle proprietà teoriche dei modelli deterministici non possono essere
facilmente ottenute per banale estensione delle proprietà dei modelli aleatori e devono,
invece, essere specificamente analizzate.
2.2 IL MODELLO LOGIT-MULTINOMIALE

Il più semplice dei modelli di utilità aleatoria è il modello logit-multinomiale. Esso deriva
dalla ipotesi che tutti gli elementi del vettore e siano distribuiti in maniera identica ed
indipendente come variabili aleatorie di Gumble.
La funzione di densità di probabilità e la funzione di distribuzione di probabilità d'un
generico elemento ej del vettore di dispersione, distribuito come una v.a. di Gumble, sono
date da:
1 æ-e ö é æ-e öù
fej ( e ) = expç - F ÷ expê- expç - F ÷ú 19
J è J ø ë è J øû
é æ-e öù
Fe j ( e ) = Pr[ε j £ e] = exp ê- expç - F ÷ú 20
ë è J øû
dove:
§ F è la costante di Eulero (pari a circa 0.577);
§ J è il parametro caratteristico della distribuzione, diverse forme della distribuzione di
Gumble possono essere ottenute al variare del valore J2.
La varianza del generico elemento ej, distribuito come una v.a. di Gumble, è pari a:
1 Per una generica v.a. Y, " a (n´1) aT SY a = aT E[(Y – E[Y] ) (Y – E[Y] )T] a = E[aT (Y – E[Y] ) (Y – E[Y]
)T a] da cui si evince che "a(n´1) aT SY a = E[b bT] = b2 ³0, avendo posto b = aT (Y – E[Y] ). La forma
quadratica associata ad una qualunque matrice di dispersione è, allora, non minore di zero e dunque una
qualsiasi matrice di dispersione è positiva semidefinita.
2 Si noti, per inciso, che l'ipotesi di invarianza, già introdotta in generale per i modelli d'utilità casuale di cui
ci occupiamo, si concretizza, nel caso del modello logit-multinomiale, nell'ipotesi che il valore del
parametro J sia indipendente dal valore delle utilità sistematiche.
23
J2
Var[e j ] = s 2j = p 2
6
L'ipotesi di identica distribuzione degli elementi del vettore di dispersione sta a significare
che le varianze di tutti gli elementi sono identiche:
J2
2
Var[e j ] = p " jÎ I
6
L'ipotesi di indipendenza tra gli elementi del vettore di dispersione aleatoria sta a significare
che le covarianze tra due qualsiasi elementi del vettore di dispersione sono nulle:
Cov[e j , e h ] = s j,h = 0 " ( j, h ), j ¹ h
Ne deriva che la matrice di dispersione associata ad un modello di tipo logit-multinomiale è
una matrice diagonale con elementi tutti uguali e può dunque essere scritta come prodotto di
uno scalare per la matrice identità di dimensioni pari al numero d’alternative nell’insieme di
scelta:
é 2 J2 ù
êp 0 ! 0 ú
ê 6 ú é1 0 ! 0ù
ê J 2
ú 2 ê 1 ! 0úú 2
Se = ê 0 p2 ! 0 ú = p 2 J ê0 =p 2 J
I
6 6 ê" " # "ú 6
ê " " # " ú
ê 2ú
ê ú
ë0 0 ! 1û
ê 0 2 J ú
0 ! p
êë 6 úû
È possibile dimostrare che, nelle ipotesi precedenti sulla distribuzione del vettore di
dispersione aleatoria, la equazione 9 può essere esplicitata con un'espressione di facile
calcolo:
æV ö
expç j ÷
Jø
" j Î I p( j) = Pr[V j - Vh > e h - e j , " h Î I , j ¹ h ] = n è 21
å expæçè Vh J ö÷ø
h =1
La proprietà di indipendenza degli elementi del vettore di dispersione aleatoria, unita

all'ipotesi di avere a che fare con un modello invariante, ha una importante conseguenza.
Per un qualsiasi modello di scelta discreta1 è possibile definire la proprietà di Indipendenza
dalle Alternative Irrilevanti (o IIA, dalla dizione inglese Independence from Irrelevant
Alternatives). Tale proprietà è definita attraverso il fatto che il rapporto tra le probabilità di
1
Attenzione! La proprietà IIA non è definita per il modello Logit multinomiale, anche altri modelli potrebbero
possederla. La definizione di indipendenza dalle alternative irrilevanti è che il rapporto tra le probabilità di
scelta di due qualsiasi alternative è costante rispetto ad una variazione di utilità sistematica di tutte le altre
o, anche, rispetto all’aggiunta di un’alternativa all’insieme di scelta.
24
scelta di due qualsiasi alternative dell'insieme di scelta si mantiene costante al variare

dell'utilità sistematica di tutte le altre alternative e, anche, rispetto all'introduzione
nell'insieme di scelta di altre alternative.
𝑉 = [𝑉$ , 𝑉& , … , 𝑉( , … , 𝑉) … , 𝑉* ]- / /
𝑝(𝑗) 𝑝′(𝑗)
/ / / / / - 0 𝑉( = 𝑉( , 𝑉) = 𝑉) =
𝑉′ = [𝑉$ , 𝑉& , … , 𝑉( , … , 𝑉) … , 𝑉* ] 𝑝(𝑘) 𝑝′(𝑘)
𝑉 = [𝑉$ , 𝑉& , … , 𝑉( , … , 𝑉) … , 𝑉* ]- / /
𝑝(𝑗) 𝑝′(𝑗)
/ / / / / / - 0 𝑉( = 𝑉( , 𝑉) = 𝑉) =
𝑉′ = [𝑉$ , 𝑉& , … , 𝑉( , … , 𝑉) … , 𝑉* , 𝑉*6$ ] 𝑝(𝑘) 𝑝′(𝑘)
La proprietà può essere verificata valere per il modello Logit multinomiale utilizzando la
equazione 21, la cui espressione dipende, appunto, dalle ipotesi di indipendenza degli
elementi del vettore di dispersione e di invarianza del modello.
Infatti:
n
æV ö æV ö
expç j ÷ å expç h J ÷
p( j) J ø h =1 è ø æ Vj - Vk ö
I = {1,2,...,n} ® = n è = expçç ÷ "( j, k ), j ¹ k
÷
p(k ) æ Vk ö è J ø
å expæçè Vh J ö÷ø expçè J ÷ø
h =1
Al variare dell’utilità di una (o più) qualsiasi delle alternative diverse dalle due considerate
(j e k) (dato che, per l'ipotesi di invarianza, il valore di J non può che rimanere costante), la
precedente equazione non varia.
Si supponga, inoltre, di aggiungere all’insieme di scelta un'alternativa, caratterizzata da un
qualunque valore dell'utilità sistematica:
I’ = IÈ{n+1} = {1, 2,…, j, …, n, n+1}
Si noti anzitutto che il valore del parametro J non può che restare inalterato per l'ipotesi di
invarianza (J=J'). Se si calcola il rapporto tra le utilità delle stesse precedenti alternative j e
k in questo nuovo contesto di scelta si ottiene sempre:
n
æV ö
p( j)
expç j ' ÷ å expæçè Vh J' ö÷ø
æ Vj - Vk ö æ V - Vk ö
= è Jø h =1
= expç ÷ = expç j ÷ " j, k Î I' Ì I , j ¹ k
p(k ) n æ V ö ç J' ÷ ç J ÷
æ Vh ö expç k ÷ è ø è ø
å çè J' ÷ø è J ø
exp '
h =1
Il che verifica l'invarianza del rapporto di probabilità anche rispetto all'introduzione di una
ulteriore alternativa nell'insieme di scelta.
La proprietà d'indipendenza dalle alternative irrilevanti è a volte una caratteristica
penalizzante rispetto alla verosimiglianza della rappresentazione dei fenomeni reali. Per
fissare le idee, si consideri un classico esempio limite in cui l'insieme di scelta sia costituito
da due modi alternativi per compiere uno spostamento: l'autovettura privata ed una linea di
autobus. Si supponga di aggiungere all'insieme di scelta una seconda linea di autobus,
25
differente dalla precedente per il solo fatto (è un caso limite) che i mezzi impiegati per il suo
esercizio sono, per esempio, di colore blu anziché arancione. La linea con i mezzi di colore
blu, quindi, ha la stessa utilità di quella con i bus di colore arancione e la sua introduzione
non varia l’utilità né dell’autovettura né della linea arancione. L'utilizzo di un modello logit
multinomiale condurrebbe ad una variazione delle probabilità di scelta dell'autovettura e
della linea arancione tale che, però, il loro rapporto di probabilità rimane eguale. Se, ad
esempio, prima dell'introduzione dei bus di colore blu la probabilità di scelta della
automobile era il 67% e quella della linea arancione il 33% (rapporto 2:1), dopo
l'introduzione dei bus blu le probabilità di scelta potrebbero essere del 50% per l'automobile
e del 25% per la linea arancione (sempre in rapporto 2:1). Evidentemente, dunque,
l'introduzione d'una alternativa irrilevante (quale la linea blu) ha rosicchiato probabilità alle
due precedenti alternative in maniera proporzionale alle precedenti probabilità. Questo è un
risultato controintuitivo, giacché è evidente che la linea blu concorre direttamente con la
linea arancione e non certamente con l'autovettura privata: avrebbe dovuto rosicchiare
probabilità alla sola linea arancione. In altri termini, il risultato più verosimile sarebbe stato
quello che la percentuale di scelta dell'autovettura rimanesse praticamente invariata e che la
restante parte di probabilità di scelta venisse egualmente divisa tra la linea arancione e quella
blu. È il caso di notare che il risultato controintuitivo ottenuto è il frutto, principalmente,
dell'ipotesi di indipendenza degli elementi del vettore di dispersione aleatoria. Nei successivi
paragrafi, infatti, si dimostrerà come la rimozione di tale ipotesi limitativa permetta di
ottenere risultati di simulazione più aderenti alle aspettative.
È evidente, dunque, che una teoria che prevedesse solo l'utilizzo del modello di utilità
casuale di tipo logit-multinomiale sarebbe una teoria esternamente incongruente, perché
incapace di cogliere alcuni dei fenomeni del sistema che si intende simulare. L'utilizzo del
modello logit-multinomiale è legittimo, anzi è consigliabile per la sua estrema semplicità e
trattabilità analitica, previa, però, la verifica che il contesto di utilizzo sia adeguato e, in
particolare, che possa essere considerata accettabile l'ipotesi di indipendenza statistica tra le
alternative. I modelli nested-Logit e Probit che saranno introdotti nei successivi paragrafi
permettono di ampliare il campo. In particolare, il modello nested-Logit può essere
considerato una generalizzazione del modello logit-multinomiale.
2.3 IL MODELLO NESTED-LOGIT

Abbiamo visto che il limite fondamentale del modello Logit-multinomiale risiede nella sua
scarsa “ampiezza”. Nell'incapacità, cioè, di simulare alcuni contesti di scelta, in particolare
26
quelli in cui le alternative non possono essere considerate caratterizzate da distribuzioni

statisticamente indipendenti delle utilità percepite. Una estensione del modello Logit-
multinomiale che permette, quindi, di ottenere un modello di tipo più ampio, è il modello
nested-LOGIT1.
Si supponga di avere un insieme di scelta composto da 3 alternative:
I={1, 2, 3}
Si supponga di volere introdurre una correlazione tra 2 di esse; ad esempio le alternative 2 e
3. Si dimostrerà nel seguito che a tale scopo si può strutturare il problema secondo una
gerarchia di scelte, rappresentata graficamente nella seguente figura 3.
Si suppone, cioè, di fattorializzare la scelta introducendo un livello intermedio rispetto alla
scelta delle alternative elementari. Le alternative 2 e 3, infatti, sono accomunate in un “cesto”
(o “nest”) che è l'alternativa composta A={2, 3}. La scelta, dunque, avviene tra le alternative
1 e A e, all'interno di quest'ultima, tra le alternative 2 e 3 che, in questo modo, vengono in
qualche maniera accumunate. In un simile contesto è possibile, quindi, ricorrere alla
definizione di probabilità condizionata per calcolare le probabilità di scelta delle alternative
elementari. La scelta dell’alternativa 2, ad esempio, può essere espressa come probabilità
congiunta che sia scelto il gruppo A e all’interno di esso l’alternativa 2.
R
(Nodo Radice)
Livello 1
1 A
(alternativa semplice) (alternativa composta)
2 3
Livello 0
(alternativa semplice) (alternativa semplice)
Figura 3 – Esempio di struttura gerarchica ad 1 livello per un modello nested-LOGIT, ed albero delle scelte
corrispondenti
1 Il modello nested-LOGIT è spesso detto anche “LOGIT-gerarchizzato”, “tree-LOGIT” o “LOGIT a più

livelli”.
27
Si può procedere, dunque, con le probabilità condizionate. Risulta, infatti:

p(1) = p(1)
p(2) = p(2ÇA) = p(A) p(2/A)
p(3) = p(3ÇA) = p(A) p(3/A)
Dove p(A) è la probabilità che al primo livello di scelta venga scelta l'alternativa (composta)
A e p(2/A) e p(3/A) sono, rispettivamente, le probabilità che, data la scelta dell'alternativa
composta (“cesto” A), siano scelte le alternative elementari 2 e 3.
L’ipotesi fondamentale specifica del modello nested-logit è che ogni scelta simulata avvenga
tra alternative le cui utilità percepite siano identicamente ed indipendentemente distribuite
come variabili di Gumble. Le scelte tra alternative avvengono, però, all’interno di una
struttura gerarchica di scelta.
Al livello 1 la scelta avviene tra l’alternativa 1 ed il cesto A, supponendole identicamente e
indipendentemente distribuite secondo variabili di Gumble di parametro J0. Similmente, a
livello 0, il modello di scelta è anche in questo caso un modello Logit multinomiale, ma con
parametro JA.
In altri termini, a livello 0, per le alternative 2 e 3 si può scrivere:
U2/A = V2 + t2/A
U3/A = V3 + t3/A
t2/A = t3/A » G(0, p2/6 JA2), Cov[t2/A, t3/A]=0
Per tale scelta condizionata tra le alternative 2 e 3 ci si è posti, dunque, nelle ipotesi di un
modello di tipo LOGIT-multinomiale, con matrice di dispersione indicata con SA e pari a:
p2 é1 ù
SA = J A2 ê
6 ë 1úû
Le probabilità condizionate di scelta delle alternative elementari 2 e 3 sono dunque

calcolabili con le formule:
expæçV2 ö÷ expæç 3 ö÷
V
è JA ø è JA ø
p(2 / A) = ; p(3 / A) =
expæçV2 ö÷ + expæç 3 ö÷ expæçV2 ö÷ + expæç 3 ö÷
V V
è JA ø è JA ø è JA ø è JA ø
Occorre, a questo punto, determinare le probabilità di scelta di primo livello tra l'alternativa
(elementare) 1 e l'alternativa (composta) A. Per tale scopo, si associa alla alternativa
composta A una utilità percepita dipendente dalla massima utilità percepita tra le alternative
28
appartenenti al cesto1. Giacché sono aleatorie le utilità percepite delle alternative interne al
cesto, è aleatorio anche il loro massimo. Le alternative appartenenti al gruppo A, però, sono
state ipotizzate essere delle variabili di Gumble identicamente ed indipendentemente
distribuite con parametro JA e le variabili di Gumble godono di una importante proprietà
detta di “stabilità rispetto alla massimizzazione”. Il massimo di v.a. di Gumble identicamente
ed indipendentemente distribuite con parametro J è ancora una variabile di Gumble avente
ancora parametro J. È, inoltre, possibile dimostrare che il valore atteso del massimo di
variabili di Gumble identicamente ed indipendentemente distribuite può essere calcolato
come logaritmo della sommatoria degli esponenziali delle alternative di cui si cerca il
massimo. Nel caso del massimo tra le utilità delle alternative del gruppo A:
[ { }] æV
E max jÎA U j / A = J A × ln å expç j
J
ö
÷ = J A × YA
jÎA è Aø
Avendo evidentemente posto: YA = ln å expæçV j ö÷

J è Aø
jÎA
Ne deriva che il massimo tra le utilità percepite appartenenti al gruppo ha media JA YA e

residuo aleatorio t_maxD distribuito (stabilità alla massimizzazione) come una variabile di
Gumble di parametro JA.
In conclusione, l'utilità percepita associata alla alternativa A nelle scelte del livello 1 (cioè
nella scelta dalla radice R) è data da una parte sistematica e da un residuo aleatorio
rispettivamente pari a:
æ p2 2ö
V A = J A × YA ; e A = h A + t _ max A con t _ max A » Gçç 0, J A ÷÷
è 6 ø
Dove, per ipotesi, eA e e1 sono delle Gumble identiche ed indipendenti di parametro J0.
Inoltre, ricordando che le distribuzioni a tutti i livelli (e quindi hA e tutte le tj/A al variare di
j in A ed anche, di conseguenza, t_maxA) sono state ipotizzate tutte indipendenti:
Var [e A ] = Var [h A ] + Var [t _ max A ] = s A2 +

p2
6
J A2 Þ
p2
6
J02 = s A2 +
p2
6
J02 Þ s A2 =
p2
6
(J 2
0 - J A2 )
Giacché s2A è non-negativa per definizione di varianza:
s A2 =
p2 2
6
( )
J0 + J A2 ³ 0 Þ J02 - J A2 ³ 0 Þ J02 ³ J A2
Essendo i parametri J delle distribuzioni di Gumble dei valori non-negativi, deve risultare:
J0 ³ J A
1
Si suppone, in altri termini, di fare competere il cesto A con l’alternativa 1 in funzione del valore
(probabilisticamente) migliore di utilità tra le sue alternative 2 e 3.
29
Dunque, una importante proprietà del modello nested-Logit è quella che i valori dei
parametri devono decrescere dalla radice verso le foglie.
Al primo livello, ricapitolando:
U1 = V1 + e1 e1 ~ G (0, p2 J20 / 6)
UA = JA YA + eA eA ~ G (0, p2 J20 / 6)
e la matrice di dispersione del modello logit-multinomiale di primo livello vale:
p2 é1 ù
ΣR = J02 ê
6 ë 1úû
Le probabilità di scelta di livello 1, dunque, valgono rispettivamente:
expæçV1 ö÷
p(1) = è J0 ø
expæçV1 ö÷ + expæçJ A Y A ö÷
è J0 ø è J0 ø
expæçJ A Y A ö÷
è J0 ø
p ( A) =
expæçV1 ö÷ + expæçJ A YA ö÷
è J0 ø è J0 ø
da ciò deriva anche che:
expæçJ A Y A ö÷ expæçV2 ö
÷
è J0 ø è JA ø
p(2) = p( A) × p(2 / A) = ×
V J Y
expæç 1 ö÷ + expæç A A ö÷ expæç 2
V ö + expæV3 ö
÷ ç J ÷
è J0 ø è J0 ø è JA ø è Aø
expæçJ A Y A ö÷ expæç 3 ö
V
J0 ø ÷
è è JA ø
p(3) = p( A) × p(3 / A) = ×
V J Y
expæç 1 ö÷ + expæç A A ö÷ expæç 2
V ö + expæV3 ö
÷ ç J ÷
è J0 ø è J0 ø è JA ø è Aø
È il caso di calcolare la matrice di dispersione complessiva del modello, considerando

entrambi i livelli di scelta. La aleatorietà complessiva della alternativa 1 risulta essere
evidentemente e1~ G (0, p2 J20 / 6), quelle delle alternative 2 e 3 risultano invece essere,
rispettivamente, e2= hA + t2/A e e3= hA + t3/A
La varianza di un qualsiasi ej è Var[ej] = E[(ej-E[ej])2] = p2 J20 / 6.
La covarianza tra due alternative dello stesso gruppo può essere calcolata come:
Var[e2, e3] = E[ ((hA + t2/A) – E[hA + t2/A])) ((hA + t3/A) – E[hA + t3/A])) ] =
= E[(hA+t2/A) (hA + t3/A)] = E[hA2] + E[hA t3/A] + E[hA t2/A] + E[t2/A t3/A] =
= Var[hA]+ Cov[hA,t3/A] + Cov[hA,t2/A] + Cov[t2/A,t3/A] =
= σA2+ 0+ 0+ 0 = p2 (q02 – qA2) / 6
30
Le alternative 2 e 3, dunque, risultano correlate. Ripetendo i calcoli si evidenzia che, invece,

le alternative non appartenenti allo stesso gruppo hanno covarianza nulla. In particolare:
éJ02 0 0 ù éJ02 0 0 ù
p2 ê ú p2 ê ú
ΣR = ×ê 0 J02 s A2 ú = ×ê 0 J02
J0 - J A2 ú
2
6 ê 6
ë
0 s A2 J02 úû ê 0 J 2 -J 2
ë 0 A J02 úû
Allo scopo di evidenziare le proprietà di utilizzo del modello nested-logit si propone di

seguito un esempio numerico relativo alla struttura di scelta descritta nella figura 3.
Si ipotizzino i seguenti valori per le grandezze del modello:
JA = 1
JR = 2.24
V1 = V2 = V3 = 10
Da tali grandezze è possibile calcolare:
æ ö + expæV3 öö
Y A = lnç expæçV2 ÷ ç J ÷ ÷ = ln(2 exp(10)) = 10.693
è è JA ø è A øø
E quindi VA = JA YD = 10.693
Risulta, quindi:
expæçV2 ö÷
è JA ø exp(10)
p(2 / A) = = = 0.5
æ
expç V2 ö æ V
÷ + expç J ÷
3 ö 2 exp(10 )
è JA ø è Aø
expæç 3 ö÷
V
è JA ø exp(10)
p(3 / A) = = = 0.5 (ma anche p(3 / A) =1 - p(2 / A) )
æ
expç V2 ö æ V
÷ + expç J ÷
3 ö 2 exp(10 )
è JA ø è Aø
p(1) =
expæçV1 ö÷
è J0 ø exp 10 (
2.24
)
æ
expç V1 ö æ V
÷ + expç J ÷
A ö
=
exp 10(2.24
+ )
exp (
10.693
2.24
)
= 0.42310
è J0 ø è 0ø
p( A) =
expæçV A ö÷
è J0 ø (
exp 10.693
2.24
)
= 0.57690 (ma anche p( A) =1 - p(1))
æ
expç V1 ö æ V
÷ + expç J ÷
A ö
=
exp 10 (
2.24
+ )
exp 10.693 (
2.24
)
è J0 ø è 0ø
p(2) = p(2 / A) × p( A) = 0.5 × 0.57690 = 0.28845
p(3) = p(3 / A) × p( A) = 0.5 × 0.57690 = 0.28845
Si noti che, come atteso:

p(A) + p(B) + p(C) = 1
Vale la pena verificare sul precedente semplice esempio, alcuni casi particolari che possono
essere determinati dal variare dei parametri delle distribuzioni aleatorie JA e J0.
31
Si noti ad esempio cosa succederebbe rifacendo i precedenti calcoli ma facendo diminuire

J0 e facendolo tendere al valore JA (la diminuzione si legge da destra verso sinistra).
0,4500
0,4300
0,4100
p(1)
0,3900
0,3700
0,3500
0,3300
0,3100
p(2)=p(3)
0,2900
0,2700
0,90 1,10 1,30 1,50 1,70 1,90 2,10 2,30
Figura 4 – Andamento delle probabilità al tendere di J0 a JA
Al tendere ad uno del rapporto J0/JA si nota che le probabilità delle tre alternative tendo al
valore 1/3, cioè al valore che assumerebbero nel caso in cui fossero calcolato utilizzando un
modello logit-multinomiale anziché un modello nested-logit. Si dimostrerà più oltre in
maniera analitica che tale proprietà è una proprietà generale. In altri termini, un modello
nested-logit con parametri delle distribuzioni aleatorie tutti uguali non è nient’altro che un
modello logit-multinomiale. Ciò è confermato anche dal valore che assume la matrice di
dispersione del modello nel caso di parametri JA e J0 uguali:
éJ02 0 0 ù
p ê
2
2 ú p2 2
ΣR = ×ê 0 J0 J0 - J A2 ú ® J02 = Ja2 = J 2 Þ Σ R =
2
× J0 × I
6 ê 2 2 2 ú 6
0 J0 - J A J0 û
ë
Se, invece, si tende a fare aumentare il parametro J0 è facile verificare che la alternativa 1
tende ad assumere un valore di probabilità paria a 0.5 (indipendentemente dai valori delle
utilità sistematiche) e che le rimanenti due alternative (2 e 3 si ripartiscono equamente il
restante 50% di probabilità (questa volta nell’ipotesi che le loro utilità sistematiche siano
eguali).
32
p(1)
0,5000
0,4500
0,4000
0,3500
0,3000
p(2)=p(3)
0,2500
0,2000
2,0000 7,0000 12,0000 17,0000 22,0000 27,0000 32,0000 37,0000 42,0000 47,0000
Figura 5 – Andamento delle probabilità al crescere di J0
Il motivo di tale andamento è da ricercarsi nel fatto che la varianza del modello di scelta di
primo livello (tra l’alternativa 1 e l’alternativa composta A) tende a crescere. Al suo tendere
ad infinito la dispersione aleatoria tende a prevalere fortemente sui valori sistematici di utilità
e, dunque, le alternative 1 e A tendono a divenire equiprobabili, indipendemente dal valore
assunto dalle loro utilità sistematiche.
Se, ancora, si prova a fare tendere a zero il valore del parametro JA, è facile anche in questo
caso verificare che i valori delle probabilità delle alternative 1 e A tendono a divenire uguali
e pari a 0.5. Questa volta, però, il fenomeno si verifica solo se le utilità sistematiche delle
alternative 1, 2 e 3 sono uguali. Il fenomeno è evidente nella successiva figura (la
diminuzione di JA, ovviamente e leggibile da destra verso sinistra)
33
0,5000
0,4500
p(1)
0,4000
0,3500
0,3000
p(2)=p(3)
0,2500
0,2000
0,0000 0,2000 0,4000 0,6000 0,8000 1,0000 1,2000
Figura 6 – Andamento delle probabilità al tendere di JA a zero
Questa volta l’andamento è determinato dal fatto che la covarianza tra le scelte di livello 0
(scelta tra 2 e 3 all’interno del cesto A) tende a divenire sempre più deterministico. Accade
allora che il cesto A tende a competere con l’alternativa semplice 1 direttamente con la sua
migliore utilità sistematica. In altri termini, la scelta di primo livello (tra A e 1) non è
influenzata in alcun modo aleatorio dalla scelta di livello 0 perché questa diviene nota a
priori; è possibile confrontare direttamente la migliore tra le alternative 2 e 3 (in questo caso
egualmente buone) con l’alternativa 1 ed il risultato di tale semplice modello logit-
multinomiale che ne risulta determina le probabilità di scelta del cesto A (e dell’alternativa
1).
Si noti anche che in entrambi i casi rappresentati dalle figure 5 e 6 si è fatta crescere la
covarianza tra le alternative 2 e 3, perché è cresciuto il rapporto J0/JA o, se si preferisce, la
differenza (J20 – J2A); esse, dunque, tendono sempre di più a competere congiuntamente con
l’alternativa A e dunque cresce la probabilità complessiva di scelta dell’alternativa 1 e
decrescono le probabilità complessive di scelta delle alternative 2 e 3. Tale fenomeno già
configura una situazione in cui è evidente che la proprietà IIA non vale per il modello nested-
Logit. Per verificarlo in modo esplicito procediamo numericamente.
Si noti che, nelle ipotesi introdotte inizialmente circa i valori delle utilità sistematiche in
gioco e dei parametri delle dispersioni aleatorie, il rapporto tra le probabilità complessive di
scelta delle alternative 1 e 2 vale:
p(1)/p(2) = 0.42310/0.28845 = 1.47
34
Allo scopo di evidenziare come, nel caso del modello nested-logit, l'introduzione (nel
precedente esempio) di una covarianza tra le alternative 2 e 3 eviti il verificarsi della
proprietà IIA (Independence of Irrilevant Alternatives), si modifichi la utilità connessa con
l'alternativa 3 portandola a:
V3 = 11
A seguito di tale variazione è facile verificare numericamente che le probabilità complessive
delle alternative 1, 2 e 3 ed il rapporto tra le probabilità di scelta dell'alternativa 1 e 2
divengono, rispettivamente:
p(1) = 0.35725
p(2) = 0.17286
p(3) = 0.46989
p(1)/p(2) = 2.07
Il rapporto p(1)/p(2) è dunque variato al variare dell’utilità dell’alternativa 3 e, dunque, non
vale la proprietà IIA.
Il modello nested-logit può essere, ovviamente, generalizzato rispetto ad un numero qualsiasi

di livelli di scelta e ad una qualsivoglia struttura dell'albero delle scelte. A tale proposito si
introduca una notazione generale che fa riferimento alla successiva figura 7.
Albero di scelta (n livelli)
Radice
Livello m
w
Livello r
k
Livello r-1
j h
Livello 0
i a
Figura 7 – Esempio di struttura di scelta per un modello tree-LOGIT
Ad un generico livello si indichi con k una alternativa composta contenente più alternative
(semplici o composte). La generica delle alternative contenute in k sia indicata con j (j Î k).
Si ipotizzi che le alternative contenute in k siano indipendentemente ed identicamente
distribuite come variabili aleatorie di Gumble. In particolare:
"jÎk Uj/k = Vj/k + ej/k con ej/k i.i.d. G (0, p2 J2k /6)
La probabilità condizionata di scegliere una qualunque alternativa del gruppo k è data
dunque da:
35
æV ö
expç j / k ÷
è J kø
"j Î k p( j / k ) =
å expæçè Vh / k Jk ö÷ø
hÎk
Le utilità sistematiche che compaiono nella precedente espressione possono essere espresse
eventualmente (se l’alternativa j è composta) in funzione delle alternative incluse in j:
"j Î k V j = J j × Y j
Nel caso invece in cui j sia una alternativa semplice, la sua utilità sistematica è nota a priori.
A loro volta, tutte le alternative contenute nel gruppo k determinano la variabile inclusiva
(Yk) del gruppo k che le contiene:
é æV j öù
Yk = ln êå expç ÷ú
êë jÎk è J k øúû
La probabilità di scegliere una alternativa semplice è data dalla produttoria delle probabilità
condizionate che tutti i gruppi di livello superiore che indirettamente o direttamente la
contengono siano a loro volta scelti. Rispetto alla precedente figura 7, ad esempio, la
probabilità di scelta della alternativa i è data da:
p(i) = p(i/j) p(j/k) p(k/w) p(w/radice) p(radice) con p(radice)=1
Si può inoltre dimostrare facilmente che le covarianze tra due qualunque alternative
elementari (i e a, ad esempio) sono pari a:
s i ,a =
6
(
p2 2
J0 - Jk2 ) 22
dove si è indicato con J0 il parametro associato al nodo radice (alle scelte, cioè, di livello
più alto – nella figura 7 il livello m) e con Jk il parametro associato al primo “antenato
comune” ad entrambe le alternative elementari, cioè al gruppo di livello più basso che le
contiene entrambe (nel caso della figura 7 e delle alternative i e a è il gruppo k).
Evidentemente, se il primo antenato comune ad entrambe le alternative elementari è la
radice, le alternative hanno covarianza nulla e, come atteso per il fatto di non appartenere né
direttamente né indirettamente ad alcun gruppo comune, sono indipendenti.
È il caso di notare che il modello nested-logit è stato qui ricavato con una procedura
induttiva, per estensione del modello logit-multinomiale.
In realtà si sarebbe potuta applicare anche una procedura inversa, in cui si sarebbe potuto
dapprima introdurre il modello nested-logit e poi ricavare quale caso particolare il modello
logit-multinomiale. Si sarebbe, anzi, potuto fare ancora di più. Si sarebbero potuti introdurre
36
i modelli detti di “Valore Estremo Generalizzato” (GEV – Generalised Extreme Value), di

cui i modelli nested-logit sono un caso particolare e di cui, a loro volta, i modelli logit-
multinomiali sono un caso ancora più particolare. Tale ultima operazione di astrazione ed
ampliamento dei modelli di scelta basati sulla teoria dell'utilità casuale, pur caratterizzata da
una notevole eleganza del formalismo matematico utilizzato, travalica, però, i confini di un
normale corso di studi universitario. Per i modelli GEV, infatti, non si conoscono al
momento applicazioni di tipo professionale ed il loro stesso utilizzo in campo sperimentale
e di ricerca risulta molto limitato.
2.4 IL MODELLO PROBIT

Nel paragrafo precedente si è visto come il modello nested-logit permetta di superare il
principale limite del modello logit-multinomiale. Esso, infatti, permette di introdurre delle
covarianze tra le alternative di scelta. Si noti, però, che la struttura della matrice di
dispersione complessiva di un modello nested-logit, seppure diversa dalla forma “rigida” e
“banale” della matrice di dispersione del modello logit-multinomiale, mantiene comunque
una struttura bene definita. In altri termini, le varianze delle alternative elementari sono tutte
uguali e le covarianze che si possono introdurre tra esse non sono “qualsiasi” ma legate alla
struttura dell'albero delle scelte utilizzato.
Da questo punto di vista il modello Probit rappresenta il massimo degli ampliamenti
possibili. Il Probit, infatti, non necessità di alcuna ipotesi sulla struttura della matrice di
dispersione, essa può essere “qualsiasi”1, con qualunque valore possibile sia per le varianze
che per le covarianze.
Il modello Probit può essere introdotto utilizzando direttamente le definizioni studiate in
generale per i modelli di utilità casuale:
U = V + e con e~MVN(0, S) e con I={1, 2, …, j, …n}
Il vettore del residuo aleatorio, cioè, è distribuito come una variabile aleatoria normale
multivariata, di media nulla e matrice di dispersione S, la sua funzione di densità di
probabilità, dunque, è data da:
æ 1 T ö
expç - ε Σ -1 ε ÷
f e (ε ) = è 2 ø 23
(2p) det (Σ )
n
1 A patto, ovviamente, che sia simmetrica e positiva semidefinita (per definizione di matrice di dispersione)
ed anzi, nei casi di nostro interesse, come già detto, anche non singolare e positiva strettamente definita.
37
Purtroppo se si sostituisce l'espressione di fe(e) della precedente equazione 23 nella

equazione 11 (che si riporta di seguito per comodità di lettura), che permetterebbe in teoria
di calcolare la probabilità di scelta di ogni generica alternativa j dell'insieme di scelta, si
ottiene un integrale non risolvibile.
¥
" j p( j) = ò ... ò ... ò f e (ε) de1 ...de j ...de n 11
e j= -¥ e1<e j + Vj -V1 e1<e j + Vj -Vn
La maggiore ampiezza, dunque, del modello Probit si paga con l'impossibilità di avere una
espressione “chiusa” della probabilità di scelta delle alternative. Tali probabilità, infatti, nel
caso di utilizzo del modello Probit, devono essere ottenute attraverso l'impiego di opportuni
algoritmi1 basati su tecniche di tipo numerico.
2.4.1 LA TECNICA MONTECARLO
Il cosiddetto metodo Montecarlo viene discusso in questo paragrafo perché è una tecnica
classica per ottenere le probabilità di scelta di un modello di utilità casuale di tipo Probit. In
realtà non è assolutamente detto che possa essere utilizzato solo nel caso di funzioni di
densità di probabilità congiunte di tipo MVN, permette piuttosto di ottenere numericamente
una stima di probabilità a partire da qualunque tipo di legge di probabilità. L’utilizzo di tale
tecnica è piuttosto semplice. Verrà presentata in questo paragrafo direttamente con
riferimento alla soluzione numerica di un qualsiasi modello di utilità casuale.
Si supponga di avere un insieme di alternative di scelta:
I = {1, 2, …, j, …, n}
Si supponga di conoscere il vettore di utilità sistematiche delle alternative dell’insieme I:
" j ÎI Vj Þ V = [V1, V2, …, Vj, …, Vn]T
Si supponga anche nota la funzione di densità di probabilità congiunta del vettore dei residui
aleatori:
e = U – V, e » fe(e)
Si ipotizzi, infine, di avere uno strumento in grado di produrre delle realizzazioni aleatorie
distribuite proprio secondo la legge di distribuzione fe(e). Ad esempio, se il vettore aleatorio
e fosse composto da un solo elemento che può assumere, con uguali probabilità, tutti i valori
interi compresi tra 1 e 6, lo strumento in grado di produrre delle realizzazioni del vettore e
1 I metodi più diffusi in proposito sono il “Metodo di Clark” ed il “Metodo Monte Carlo”.
38
sarebbe un normale dado a 6 facce. Se, ancora ad esempio, il vettore aleatorio e fosse
composto da un solo elemento che può assumere con legge di probabilità uniforme tutti i
valori reali compresi tra 0 ed 1, lo strumento in grado di produrne delle realizzazioni aleatorie
sarebbe la funzione random() disponibile in tutti i linguaggi di programmazione di
calcolatori.
Più in generale, si indichi con r(fe) un realizzatore, cioè la funzione (tipicamente numerica
e non analitica) in grado di produrre realizzazioni con legge di probabilità fe(e). Una generica
di tali realizzazioni può, dunque, essere indicata con:
ē = r(fe).
Si immagini, a questo punto, di produrre un numero sufficientemente elevato di realizzazioni
del vettore aleatorio e. Ognuna di esse si ottiene da una applicazione del realizzatore:
" kÎ {1, 2, …, k, …, m} ēk = r(fe, k)
A tali realizzazioni corrispondono altrettante realizzazioni del vettore aleatorio delle utilità
percepite U:
" kÎ {1, 2, …, k, …, m} Ūk = V + ēk
Si indichi con Ūk,j la generica realizzazione k del generico elemento j del vettore delle utilità
percepite.
Si indichi mj il numero di volte (sulle m realizzazioni) in cui la realizzazione dell’utilità
percepita Ūk,j si è rivelata essere la massima all’interno del vettore Ūk.
Una stima della probabilità di scegliere l’alternativa j all’interno dell’insieme I può essere
espressa come:
mj
p( j / m ) =
m
È possibile dimostrare (e ciò è intuitivo se si pensa all’approccio cosiddetto “frequentistico”
alla teoria delle probabilità) che la stima ottenuta tende al valore “vero” della probabilità p(j)
al tendere ad infinito del numero di realizzazioni estratte (m):
m ® ¥ Þ p( j / m) ® p( j)
In altri termini:
p( j) = lim p ( j / m )
m =¥
A titolo di esempio ed esercitazione, si provi di seguito ad applicare la tecnica Montecarlo

ad un insieme di scelta composto da tre alternative i cui residui aleatori siano distribuiti come
delle variabili uniformi identiche ed indipendenti.
L’insieme di scelta è dunque:
I={1,2,3}
39
Le utilità percepite delle alternative siano:

U1 = V1 + e1; U2 = V2 + e2; U1 = V3 + e3
Si ipotizzi, per semplicità, ma senza perdita di generalità, che i valori di tutte le utilità
sistematiche siano uguali:
V1 = V2 = V3 = V = 10
Le leggi di probabilità dei residui aleatori siano indipendentemente ed identicamente
distribuite secondo una legge uniforme quale quella riportata nella seguente figura:
1/6
e1 = e2 = e3
-3 0 3
Figura 8 – Distribuzione uniforme dei residui aleatori
Calcoliamo preliminarmente in via analitica la probabilità di scegliere una qualunque di tali

alternative, ad esempio l’alternativa 1. Tenendo conto del fatto che le utilità sistematiche
sono tutte eguali e che le v.a. sono indipendentemente distribuite (e quindi la funzione
densità di probabilità congiunta è il prodotto delle 3 funzioni densità di probabilità
marginali), si può scrivere l’equazione 11 come:
3 e1 e1 3 e1
1 1 1 1
p(1) = ò ò ò ò (e + 3) de 2 de1 =
216 e1 =ò-3
× × de 3 de 2 de1 = 1
e1 = -3 e 2 = -3 e 3 = -3
6 6 6 e 2 = -3
( )
3 3
1
= ò (e1 + 3)2 de1 = 1 ò e1 2 + 6e1 + 9 de1 =
216 e1 = -3 216 e1 =-3
=
1 é1 3
216 êë 3
3 - (- (
3)3
+
6 2
2
3 - (- 3)) (
2
+ 9(3 + 3)ù
=
1
ú 216
û
(18 + 54)) =
1
3
Si noti che il risultato ottenuto è assolutamente congruente con le aspettative. Ogni

alternativa dell’esempio precedente, infatti, ha evidentemente la stessa probabilità di essere
scelta. Proviamo ad ottenere questa stessa probabilità utilizzando una tecnica di tipo
Montecarlo. A tale scopo è possibile, ad esempio utilizzare un foglio di calcolo elettronico1.
Nelle prime tre colonne del foglio di calcolo si introducano delle formule che permettono di
ottenere delle realizzazioni aleatorie (identiche ed indipendenti) di variabili uniformemente
1
Gli allievi sono invitati a ripetere l’esperimento qui descritto producendo, ad esempio, un opportuno foglio
di calcolo con il software Excel.
40
distribuite nell’intervallo1 [-3, +3]. Nelle seconde tre colonne del foglio di calcolo si
introducano delle formule che sommino i valori delle realizzazioni ottenute al valore di
utilità sistematica pari a 10, si ottengono così le realizzazioni delle utilità percepite. In una
terza terna di colonne del foglio di calcolo si introducano delle formule che diano risultato
unitario nel caso in cui la realizzazione di utilità percepita corrispondente sia la massima tra
le tre alternative. Alla fine, si sommino i valori ottenuti nell’ultima terna di colonne e li si
dividano per il numero di realizzazioni generate. I tre risultati così ottenuti sono una stima
delle probabilità di scelta delle tre alternative. Un esempio della procedura descritta, limitato
ad un numero di realizzazioni pari a sole 15 (m=15) è riportato nella seguente tabella.
Alternativa di max utilità

e1 e2 e3 Ū1 = V1 +e1 Ū 2 = V2 + e2 Ū 3 = V3 + e3 percepita
1 2 3
1 1,453664 -2,95915 -2,56998 11,45366 7,040847 7,430024 1 0 0
2 -1,16213 0,653916 -2,62126 8,837870 10,65392 7,378736 0 1 0
3 -0,01470 0,428013 -1,21606 9,985298 10,42801 8,78394 0 1 0
4 0,884577 1,454714 2,013709 10,88458 11,45471 12,01371 0 0 1
5 0,694634 -1,35613 2,692081 10,69463 8,643868 12,69208 0 0 1
6 1,272981 2,880458 0,249990 11,2730 12,88046 10,24999 0 1 0
7 -0,78366 -0,00634 -1,04632 9,216334 9,993655 8,953677 0 1 0
8 2,889709 0,28391 -0,49190 12,88970 10,28391 9,508106 1 0 0
9 0,9777 -2,20307 0,913628 10,9777 7,796930 10,91363 1 0 0
10 2,934589 2,449505 -2,14007 12,93459 12,44950 7,859926 1 0 0
11 -2,13029 1,012682 -1,18642 7,869712 11,01268 8,813576 0 1 0
12 1,714826 1,556133 2,050444 11,71483 11,55613 12,05044 0 0 1
13 0,577388 -2,43068 -2,44812 10,57739 7,569319 7,551877 1 0 0
14 1,79694 -0,05760 -0,40718 11,79694 9,942401 9,592818 1 0 0
15 2,980249 2,605780 2,63008 12,98025 12,60578 12,63008 1 0 0
Numero di volte in cui l’alternativa è di massima utilità percepita 7 5 3
Stima dei valori di probabilità 0,4667 0,3333 0,2000
È evidente che i valori ottenuti sono delle stime imprecise del valore 1/3 che si sarebbe
dovuto ottenere per tutte e tre le probabilità. La figura seguente mostra il variare delle stime
di probabilità ottenute al crescere del numero di estrazioni (fino a 1000, nella figura). Si noti
come progressivamente la stima tende al valore atteso di probabilità.
1
Utilizzando Excel (versione italiana) la formula da inserire per ottenere tale risultato è: 6*casuale()-3. La
funzione di Excel casuale(), infatti, permette di ottenere realizzazioni di una variabile aleatoria
uniformemente distribuita nell’intervallo [0,1]
41
Probabilità stimate con metodo Montecarlo

(variabili aleatorie uniformemente distribuite)
0,9 p(1)
0,8
p(2)
0,7
0,6 p(3)
Probabilità
0,5
1/3
0,4
0,3
0,2
0,1
0
1 39 77 115 153 191 229 267 305 343 381 419 457 495 533 571 609 647 685 723 761 799 837 875 913 951 989
n° Estrazioni
Figura 9 – Applicazione della tecnica Montecarlo (variabili uniformi identicamente ed indipendentemente

distribuite)
L’utilizzo della tecnica Montecarlo nel caso delle tre alternative con utilità percepite
identicamente ed indipendentemente distribuite in maniera uniforma è, ovviamente,
nient’affatto necessario, giacché, come visto, le probabilità di scelta potrebbero essere
calcolate in maniera analitica ed esatta.
Si provi, però, a ripetere lo stesso esperimento nel caso di tre alternative sempre di identica
utilità sistematica (10) ed i cui elementi del vettore dei residui aleatori siano (sempre
indipendentemente, per semplicità) distribuiti come delle variabili Normali aventi tutte la
stessa varianza (pari a 16). È evidente che, ancora una volta, le particolarità dell’esempio
permettono di attendersi fin da subito delle probabilità di scelta delle alternative tutte uguali
e pari al valore 1/3. Questa volta, però, non è più possibile, data la difficoltà di risoluzione
dei modelli Probit, calcolare tali probabilità analiticamente ed in forma esatta. Occorre,
dunque, necessariamente ricorrere a tecniche numeriche quali quella del metodo Montecarlo.
Se si ripete la costruzione del foglio elettronico già descritta precedentemente1 si può
1
Nel caso delle realizzazioni di variabili gaussiane, la formula delle prime tre colonne del foglio elettronico,
in caso di utilizzo del software Excel (versione italiana), è: INV.NORM( casuale(); 0; 4 ). La funzione
INV.NORM(x; y; z), infatti, è l’inversa della distribuzione normale cumulativa di media pari al suo secondo
argomento (y) e deviazione standard pari al suo terzo argomento (z) in corrispondenza del valore di
probabilità paria al suo primo argomento (x). Si stanno, dunque, generando in maniera uniforme dei valori
casuali di probabilità (la funzione x=casuale() è uniformemente distribuita nell’intervallo [0,1]) e poi a tali
valori casuali si fanno corrispondere delle realizzazione della variabile aleatoria Gaussiana con media nulla
e varianza 16.
42
ottenere, per un numero di estrazione pari a 15, un risultato simile a quello della seguente
tabella.
Alternativa di max utilità percepita
e1 e2 e3 Ū1 = V1 +e1 Ū 2 = V2 + e2 Ū 3 = V3 + e3
1 2 3
1 5,9981 -0,4458 -4,2970 15,9981 9,5542 5,7030 1 0 0
2 -1,5207 -1,9307 -0,0215 8,4793 8,0693 9,9785 0 0 1
3 1,8181 -5,6632 -1,6652 11,8181 4,3368 8,3348 1 0 0
4 0,6196 -4,0154 -2,7471 10,6196 5,9846 7,2529 1 0 0
5 -2,0023 -1,5165 -5,1559 7,9977 8,4835 4,8441 0 1 0
6 0,7661 0,8718 7,0428 10,7661 10,8718 17,0428 0 0 1
7 3,0559 1,1664 -2,8191 13,0559 11,1664 7,1809 1 0 0
8 4,8150 -2,7989 -1,2162 14,8150 7,2011 8,7838 1 0 0
9 0,9062 2,7577 -1,7671 10,9062 12,7577 8,2329 0 1 0
10 0,2389 0,8386 -4,2293 10,2389 10,8386 5,7707 0 1 0
11 -6,7547 -0,5430 -0,4306 3,2453 9,4570 9,5694 0 0 1
12 3,0491 1,8313 2,6234 13,0491 11,8313 12,6234 1 0 0
13 -1,0915 2,1469 3,7586 8,9085 12,1469 13,7586 0 0 1
14 -2,1564 -0,2463 1,3970 7,8436 9,7537 11,3970 0 0 1
15 3,3906 0,5426 0,6223 13,3906 10,5426 10,6223 1 0 0
Numero di volte in cui l’alternativa è di massima utilità percepita 7 3 5
Stima dei valori di probabilità 0,4667 0,2000 0,3333
I valori delle stime di probabilità migliorano all’aumentare del numero di estrazioni delle
realizzazioni aleatorie, come dimostrato dalla seguente figura.
Probabilità stimate con metodo Montecarlo

(variabili aleatorie normalmente distribuite)
0,9 p(1)
0,8
p(2)
0,7
0,6 p(3)
Probabilità
0,5
1/3
0,4
0,3
0,2
0,1
0
1 39 77 115 153 191 229 267 305 343 381 419 457 495 533 571 609 647 685 723 761 799 837 875 913 951 989
n° Estrazioni
Figura 10 – Applicazione della tecnica Montecarlo (variabili di Gauss identicamente ed indipendentemente

distribuite)
2.5 VARIABILI DI SODDISFAZIONE E LORO PROPRIETÀ MATEMATICHE

Un'importante grandezza associata ad un modello di scelta discreta è la variabile di
soddisfazione. Essa è definita come il valore atteso del massimo delle utilità aleatorie delle
alternative che compongono l'insieme di scelta. In termini formali:
I={1, 2, …, j, …, n}, "jÎI Uj=Vj+ej, ® s= E[maxjÎI{Vj+ej}] 24
43
Dalla precedente espressione 24 deriva che la soddisfazione è dipendente:

§ dalla legge di probabilità congiunta del residuo aleatorio (vettore e).
§ dal valore assunto dalle utilità sistematiche di tutte le alternative dell'insieme di scelta
(vettore V), per questo motivo è detta funzione di soddisfazione e si indica con s(V);
Si noti che la soddisfazione è sempre una funzione in senso proprio e non una mappa a più
valori. Ciò è vero anche nel caso in cui vi sia una probabilità non nulla che le utilità percepite
di due qualsiasi alternative di scelta sia uguale; vale, dunque, anche nel caso di modelli di
scelta deterministici.
La definizione 24, per alcune “semplici” distribuzioni del residuo aleatorio, permette di
ricavare un'espressione operativa per il calcolo della soddisfazione. In particolare, nel caso
in cui le utilità delle alternative di scelta siano identicamente ed indipendentemente
distribuite come variabili aleatorie di Gumble di parametro J (ci si trova dunque di fronte
ad un modello Logit-Multinomiale), la variabile di soddisfazione assume il valore1:
é æ V öù
s(V ) = J × lnêå expç j ÷ú = J × Y(V ) 25
êë jÎI è J øúû
Nel caso, invece, d'un modello di tipo nested-logit, data una alternativa composta (gruppo)
denominata con k, le cui alternative elementari sono distribuite (rispetto alla scelta
condizionata all'interno del gruppo k) con parametro Jk, la soddisfazione associata al gruppo
k stesso è data dall'espressione:
é æV öù
s k (Vk ) = J k × ln ê expç j ÷ú = Jk × Yk (Vk )
å êë jÎk è J k øúû
Dove si è indicato con Vk il vettore delle utilità sistematiche delle alternative j all'interno del
gruppo k.
Nel caso, di un modello Probit non è possibile dalla definizione 24 e dalla legge di probabilità
congiunta del residuo aleatorio (fe(e)) propria della variabile aleatoria normale multivariata,
ottenere una espressione in forma chiusa per la variabile di soddisfazione. In tale caso,
comunque, essa può essere calcolata ricorrendo a tecniche di tipo numerico, ad esempio
utilizzando un metodo di tipo Montecarlo2.
1 Si tratta di quanto già detto in fase di derivazione del modello nested-Logit, giacché la soddisfazione è il
valore atteso della massima utilità percepita e la variabile aleatoria di Gumble gode della proprietàdi
stabilità rispetto alla massimizzazione.
2
A tale scopo è sufficiente applicare normalmente la tecnica Montecarlo, ottenendo m realizzazioni del vettore
di utilità percepite. All’interno di ogni realizzazione ottenuta si considera il valore di utilità massima
percepita tra tutte le alternative. Di tutti questi valori di utilità percepite massime si fa poi la media
aritmetica rispetto al numero di realizzazioni estratte (m).
44
Nel caso, infine, di un modello deterministico, la soddisfazione coincide, per definizione,

con la massima tra le utilità sistematiche delle alternative dell’insieme di scelta
In ogni caso, qualunque sia la legge di probabilità utilizzata per il residuo aleatorio, purché
il modello sia additivo (fe(e/V)=fe(e) " eÎEn – equazione 6), la variabile di soddisfazione
gode di alcune importanti proprietà. Nel seguito tali proprietà (che pure possono in generale
essere ricavate con dimostrazioni analitiche non molto complesse) saranno enunciate, in
alcuni casi saranno dimostrate per il caso generale e spesso si procederà a verificarle nel caso
particolare (e semplice) del modello logit-multinomiale1.
Proprietà 1
Il valore della variabile di soddisfazione associata ad un certo insieme di scelta è non minore
della massima utilità sistematica presente nell'insieme di scelta stesso:
s(V)³maxjÎI{Vj}= Vjmax = Vmax 26
Dove si è indicato con Vmax la massima utilità sistematica all'interno dell'insieme di scelta
e con jmax l'alternativa cui è associato tale valore massimo d'utilità.
Si verifichi ora tale proprietà nel caso del modello logit multinomiale.
é æ V öù é æ V öù é J × Vmax öù
s(V ) - Vmax = J lnêå expç j ÷ú - Vmax = J lnêå expç j ÷ú - lnêexpæç
êë jÎI è J øúû êë jÎI è J øúû ë è J ÷øúû
é æ V öù é Jù
Þ s(V ) - Vmax = J lnêå expç j ÷ú - lnêexpæç max ö÷ ú
V
êë jÎI è J øúû ëê è
Jø ú
û
é æV öù
é ê å expç j ÷ ú
è J øú
æ V j öù é æ Vmax öù ê
Þ s(V ) - Vmax
jÎI
= J lnêå expç ÷ú - J × lnêexpç = J ln
êë jÎI è J øúû ë è J ÷øúû ê æV öú
ê expç max J ÷ ú
êë è øú
û
é æV öù
ê å expç j ÷ ú
è J øú
Þ s(V ) - Vmax = J lnê1 +
ê
jÎI , j¹ j max
ú
( )
= J × ln 1 + a 2 ³ 0 Þ s(V ) ³ Vmax
expæç max ö÷ ú
V
ê Jø
êë è úû
Nei precedenti passaggi algebrici si è utilizzata la caratteristica della funzione esponenziale
di avere valori (condominio) nell’insieme R+ e della funzione logaritmo di assumere valori
positivi per argomenti maggiori dell'unità.
1 L'estensione della verifica delle proprietà enunciate al caso delle scelte condizionate delle alternative di un
dato gruppo all'interno di un modello nested-logit è banale ed è lasciata come esercizio al lettore.
45
Proprietà 2
Il valore della variabile di soddisfazione associata ad un certo insieme di scelta è non minore
della media pesata (utilizzando le probabilità di scelta) dell'utilità sistematiche delle
alternative dell'insieme di scelta stesso:
s(V ) ³ å p( j) × V j = p(V ) × V
T
27
jÎI
Dove si è indicata con p(V) la funzione (vettoriale di vettore) di probabilità di scelta delle
alternative dell'insieme. Questa proprietà è assai facilmente dimostrabile per un qualunque
caso, infatti:
p(V )T × V = å p( j) × Vj £ å p( j) × Vmax = Vmax × å p( j) = Vmax × 1

jÎI jÎI jÎI
Þ p(V ) × V £= Vmax
T
ma per la precedente proprietà 1 Vmax £s (V) e dunque:
p(V ) × V £ s (V )
T
Proprietà 3
Se il modello di scelta, oltre ad essere additivo, è caratterizzato da una funzione di probabilità
p(V) continua1, la derivata parziale della variabile di soddisfazione rispetto all'utilità d'una
qualunque alternativa dell'insieme coincide con la probabilità di scelta dell'alternativa:
¶s(V )
= p( j) "j Î I 28
¶Vj
In forma vettoriale tale proprietà si può esprimere come:
Ñs(V) = p(V)
28b
Si verifichi tale proprietà nel caso del logit-multinomiale:
é é æ V öù ù
ê lnêå expç h J ÷ú å expæç h ö÷ ú
V
¶s(V ) ¶ é é æ V öù ù ê ëhÎI è øû hÎI è J ø ú
= êJ × lnêå expç h J ÷ú ú = J × ê¶ ×¶ ú
¶V j ¶V j êë ëhÎI è øû úû æ Vh ö
ê ¶ å expç J ÷
¶V j
ú
ê hÎI è ø ú
ë û
1 E' possibile dimostrare che è questo il caso sia per i modelli logit-multinomiale e nested-logit che per il
modello Probit (deriva dalla continuità delle relative funzioni di densità di probabilità fe (e)).
Evidentemente, dunque, questa proprietà e tutte quelle successive basate sulle stesse ipotesi, non sono
applicabili in generale nel caso in cui p(V) sia una mappa a più valori e non una funzione; non lo sono, per
esempio, nel caso di modelli di scelta deterministici.
46
¶s(V ) 1 1 æV ö
Þ = J× × × expç j ÷ = p( j)
¶V j J
å expæçè Vh J ö÷ø J è ø
hÎI
Proprietà 4
p(V) continua, la variabile di soddisfazione aumenta al crescere dell'utilità sistematica di una
qualunque alternativa:
¶s(V )
³ 0 "j Î I 29
¶V j
Questa proprietà è di facilissima dimostrazione Infatti, per la proprietà 3:
¶s(V ) ¶s(V )
= p( j) "j Î I e poiché la probabilità è positiva per definizione: ³0
¶Vj ¶V j
Si lascia al lettore la verifica di tale proprietà per il modello logit-multinomiale (a tale scopo
si ricordi che le funzioni logaritmo ed esponenziale sono entrambe monotone crescenti e che
la funzione esponenziale ha codominio nell'insieme R+).
Proprietà 5
p(V) continua, la variabile di soddisfazione cresce al crescere del numero d'alternative
nell'insieme di scelta:
[ ] [
s(V) < s(V' ) con V T = V1 ,V2 ,...,Vj ,...,Vn , V'T = V1 ,V2 ,...,Vj ,...,Vn ,Vn+1 ] 30
Questa proprietà si può intuire per estensione della proprietà 4. Aggiungere una alternative
all'insieme di scelta, infatti, può essere interpretato come il fare passare l'utilità sistematica
della alternativa n+1 dal valore -¥ al valore finito Vn+1.
Si verifichi questa proprietà nel caso del modello logit-multinomiale.
én æV ö ù én æ V öù
s(V') - s(V ) = J × lnêå expç j ÷ + expæç n +1 ö÷ú - J × lnêå expç j ÷ú =
V
ë j=1 è Jø è Jø
û ë j=1 è J øû
n
æ Vj ö é ù
å expçè + expæç Vn +1 ö÷ æ ö
J ÷ø ê V + ú
Jø expç n 1
J ÷ø ú
= J × ln
j=1
n
æV ö
è ê
= J × lnê1 + n è
ú [ ]
= J × ln 1 + a 2 > 0
å expçè j J ÷ø ê å expæç V j ö÷ ú
j=1 ê j=1
ë è J ø úû
[
Þ s(V') - s(V ) = J × ln 1 + a 2 > 0 ]
47
Dove si è tenuto conto del fatto che la funzione logaritmo assume valori positivi per
argomenti maggiori dell'unità e che la funzione esponenziale ha valori nell'insieme R+.
Proprietà 6
p(V) continua, con derivate parziali prime continue1, la variabile di soddisfazione è
convessa rispetto al vettore delle utilità sistematiche:
s(µ V + (1 - µ) V' ) £ µs(V) + (1 - µ)s(V' ) " V, V' "µ Î [0,1] 31
La dimostrazione generale, nonché la verifica di tale proprietà nel caso del logit-
multinomiale, richiedono entrambe un numero non banale di passaggi matematici.
Proprietà 7
p(V) continua, con derivate parziali prime continue, la variabile di soddisfazione ha matrice
Hessiana (simmetrica) positiva semidefinita.
aT Hess[s(V)] a ³ 0 "aÎEn 32
Tale proprietà deriva direttamente dalla proprietà 6. Infatti, condizione necessaria e

sufficiente di convessità è che la matrice Hessiana (simmetrica) sia positiva semidefinita.
Proprietà 8
p(V) continua, con derivate parziali prime continue, le probabilità di scelta delle alternative
hanno matrice Jacobiana (simmetrica) positiva semidefinita.
Tale proprietà deriva direttamente dalla proprietà 7 e dalla proprietà 3.
Infatti, la proprietà 3 esprime che Ñs(V) = p(V) e quindi Hess[s(V)]= Jac[p(V)], in termini
espliciti:
1 È possibile dimostrare che questo è il caso dei modelli logit-multinomiale, nested-logit e Probit.
Ovviamente, ancora una volta, questa proprietà e quelle che si basano sulle stesse ipotesi non sono
applicabili nel caso in cui p(V) sia una mappa a più valori e non una funzione; non sono applicabili, ad
esempio, al caso dei modelli deterministici.
48
é ¶ 2s ¶ 2s ¶ 2s ¶ 2s ù
ê ! ! ú
ê ¶V1
2 ¶V1¶V2 ¶V1¶V j ¶V1¶Vn ú
ê ¶ 2s ¶ 2s ¶ 2s ¶ 2s ú
ê ! ! ú
ê ¶V2 ¶V1 ¶V22 ¶V2 ¶V j ¶V2 ¶Vn ú
ê ú
Hess[s(V )] = ê "2 " # " # "
¶ s ¶ 2s ¶ 2s ¶ s ú
2
ê ! ! ú
ê ¶V j¶V1 ¶V j¶V2 ¶V j2 ¶V j¶Vn ú
ê " " # " # " ú
ê 2 ú
ê ¶ s ¶ 2s ¶ 2s ¶ 2s ú
! !
ê ¶Vn ¶V1 ¶Vn ¶V2 ¶Vn ¶V j ¶Vn2 úû
ë
Ed utilizzando l'espressione 28 della proprietà 3:
é ¶p(1) ¶p(1) ¶p(1) ¶p(1) ù

ê ¶V ! !
¶V2 ¶V j ¶Vn ú
ê 1 ú
ê ¶p(2 ) ¶p(2 )
!
¶p(2 )
!
¶p(2 ) ú
ê ¶V ¶V2 ¶V j ¶Vn ú
ê 1 ú
Hess[s(V )] = ê " " # " # " ú = Jac[p(V )]
ê ¶p( j) ¶p( j)
!
¶p( j)
!
¶p( j) ú
ê ¶V1 ¶V2 ¶V j ¶Vn ú
ê " " # " # " úú
ê ¶p(n ) ¶p(n ) ¶p(n ) ¶p(n ) ú
ê ! !
êë ¶V1 ¶V2 ¶V j ¶Vn úû
In definitiva, dunque, anche la matrice jacobiana Jac[p(V)] gode della stessa proprietà di
essere semidefinita positiva della matrice Hess[s(v)] a cui è equivalente.
Proprietà 9
p(V) continua, con derivate parziali prime continue, le probabilità di scelta delle alternative
sono monotone crescenti rispetto alle utilità sistematiche:
[p(V ) - p(V' )]T × (V - V' ) ³ 0 " V , V' 33
La dimostrazione generale di tale proprietà non è complessa. Infatti, dalla proprietà

6 sappiamo che la funzione di soddisfazione è convessa. Condizione necessaria e sufficiente
perché ciò accada è che: s(V ) ³ s(V' ) + Ñs(V' )T × (V - V' ) " V , V' che vale, ovviamente,
anche scambiando di posto V e V':
s(V') ³ s(V ) + Ñs(V )T × (V'-V ) " V ,V'

sommando membro a membro le due precedenti espressioni si ottiene:
s(V') + s(V ) ³ s(V') + s(V ) + [Ñs(V ) - Ñs(V')]T × (V'-V ) " V ,V'
Þ [Ñs(V ) - Ñs(V')]T × (V - V') ³ 0 " V ,V'
49
Ma, per la proprietà 3 risulta Ñs(V) = p(V) e Ñs(V’) = p(V’)
Þ [p(V ) - p(V')]T × (V - V') ³ 0 " V ,V'
Proprietà 10
p(V) continua, con derivate parziali prime continue, la probabilità di scelta di una data
alternativa dell'insieme di scelta cresce al crescere della sua utilità sistematica, se le utilità
di tutte le altre alternative restano costanti:
¶p( j)
³ 0 " jÎ I 34
¶Vj
o, in termini più espliciti:
[
V T = V1 , V2 ,...,V j ,...,Vn ] ü
ï
ý ® p' ( j) ³ p( j) " j Î I
V' T
= [V1 , V2 ,...,V j + DV j ,...,Vn ] con DV j ³ 0ï
þ
Anche la dimostrazione generale di tale proprietà è immediata. Infatti, dalla proprietà 9:
[p(V) - p(V')]T × (V - V') ³ 0 " V ,V' che può essere scritta per qualunque valore dei
[
vettori V e V', e quindi anche per V'T = V1 , V2 ,...,Vj + DVj ,...,Vn . ]
[ ]
Poiché V T - V'T = 0,0,...,-DVj ,...,0 , risulta:
[p(V) - p(V')]T × (V - V') = (p( j) - p' ( j)) × (- 1) × DVj ³ 0 Þ p( j) - p' ( j) £ 0

Verifichiamo, inoltre, tale proprietà nel caso del modello logit-multinomiale:
-1
æV ö é ù
expç j ÷ × êå expæç Vh ö÷ú
¶p( j) è J ø ëhÎI è J øû
=¶ =
¶Vj ¶Vj
æV ö é æ V öù
expç j ÷ -1 êå expç h J ÷ú
è J ø × é expæ Vh öù + expæ V j ö × ¶ ëhÎI è øû
=¶ êå ç J ÷ú ç J÷
¶V j ëhÎI è øû è ø ¶V j
æV ö æV ö æV ö
expç j ÷ expç j ÷ expç j ÷
= è J ø × +(- 1) è J ø è J ø = p( j) - p( j) × p( j) = p( j) (1 - p( j))
Jå expæç h ö÷
V é ù
2 J J J J
æ V ö
hÎI è Jø ê å expç h
Jø÷ ú
ëhÎI è û
¶p( j)
Þ ³0
¶Vj
Avendo considerato che, per definizione, la probabilità è un valore compreso tra 0 ed 1.
50
2.6 METODI DI AGGREGAZIONE DELLE SCELTE

Fino a questo momento si è discusso sulla simulazione, attraverso un paradigma formale di
comportamento, dei risultati delle scelte effettuate da un decisore posto di fronte ad un
numero discreto di alternative.
I fenomeni che la Teoria dei Sistemi di Trasporto intende rappresentare, però, sono il
risultato delle scelte di più decisori, tipicamente gli utenti (o i potenziali tali) di un sistema
di trasporto. Si pone, dunque, il problema di simulare i risultati delle scelte di più decisori.
Si supponga, anzitutto, che ogni decisore attui le proprie scelte in maniera indipendente dagli
altri (o che il modello simuli i risultati delle scelte nell'ipotesi che il paradigma formale di
ogni decisore sia indipendente da quello degli altri)1; si supponga, poi, che i decisori siano
di fronte allo stesso insieme di scelta (insieme I) e cioè che le alternative discrete di scelta
siano le stesse per ogni decisore; si ipotizzi, infine, che sia lecito ammettere che le utilità
(vettore U) associate a ciascuna possibile scelta da parte di ogni decisore, seppure non
direttamente osservabili, possano essere spiegate, almeno per la loro parte sistematica
(vettore V), dagli stessi attributi di scelta (vettore X) per ogni decisore.
Ferme restando le precedenti ipotesi, si supponga ancora, in prima approssimazione, che il
valore degli attributi di scelta sia perfettamente identico per tutti i decisori. Anche in un tale
ipotetico caso è evidente come, seppure in un contesto di scelta in tutto perfettamente
identico, esista una intrinseca dispersione di comportamenti tra i decisori, dovuta al fatto che
per ognuno di essi le preferenze di scelte sono inevitabilmente diverse.
La differenza, infatti, in un tale contesto, tra l'utilità associata ad ogni alternativa di scelta
(Uj) ed il relativo valore medio (E[Uj]= Vj), cioè la dispersione dell'utilità di ogni alternativa
rispetto al valore medio, è dovuta, oltre che a tutti i motivi già precedentemente ampiamente
discussi in un apposito paragrafo, anche dalla dispersione delle scelte tra i decisori. In altri
termini, in un contesto in cui valgano tutte le precedenti ipotesi (e soprattutto quella di
identico valore, per tutti i decisori, del valore degli attributi di scelta), è possibile continuare
ad utilizzare per l'insieme dei decisori lo stesso modello d'utilità casuale presentato per il
generico di essi, a patto, però, di considerare che le utilità aggregate2 risultano più disperse.
La probabilità di scelta aggregata dell'insieme dei decisori rispetto ad ogni alternativa,
quindi, si calcola con gli stessi modelli già studiati ma risulta più “dispersa” tra le alternative,
perché tali risultano le utilità in funzione della dispersione delle preferenze di scelta tra i
decisori. In pratica è come se, da un punto di vista concettuale, tutti i decisori fossero
1 Questa è l'unica ipotesi che, nel seguito, non sarà più rilassata.
2 Relative, cioè, all'insieme dei decisori.
51
rappresentati da una sorta di “decisore medio” e la dispersione delle preferenze di scelta

dell'insieme dei decisori rispetto a tale decisore medio viene inglobata nella aleatorietà del
modello utilizzato.
A questo punto della trattazione può ancora risultare poco verosimile, però, immaginare che
tutti gli attributi di scelta siano identici per tutti i decisori. In realtà esiste una dispersione
nella distribuzione degli attributi delle scelte ed, anche per questo, tende ad esserci una
dispersione nelle scelte degli utenti. L'approccio “esatto” per trattare tale dispersione nei
valori degli attributi dovrebbe essere quello di integrare le probabilità di scelta di ogni
alternativa, espresse in funzione degli attributi di scelta, in relazione alla legge di
distribuzione degli attributi. In termini formali, ipotizzando il numero di decisori abbastanza
ampio da potere ragionare con un approccio continuo anziché discreto:
p( j) = ò p( j / X ) f X (X ) dX " j Î I
X
dove si è indicato con:
§ p(j) la probabilità aggregata di scelta della alternativa j per l'insieme di decisori;
§ p(j/X) la probabilità di scelta dell'alternativa j condizionata al valore assunto per
ognuno dei decisori dal vettore degli attributi;
§ fX(X) la densità di probabilità congiunta della distribuzione del vettore degli attributi
di scelta (dispersi, appunto, tra i decisori).
Tale approccio non è agevole, se non altro perché per attuarlo occorrerebbe conoscere la
distribuzione della dispersione del vettore degli attributi e questa potrebbe portare a
complicazioni analitiche anche notevoli.
Ancora una volta, si preferisce ricorrere, nella pratica simulativa, all'approccio del “decisore
medio”. Gli attributi utilizzati, quindi, sono quelli medi ( X ) rilevati all'interno dell'insieme
dei decisori. Le probabilità di scelta delle alternative sono calcolate rispetto a tali attributi
medi, cumulando (in maniera aggregata) la dispersione del valore degli attributi nella
dispersione del residuo aleatorio associato alle alternative che ha, quindi, un motivo in più
per non essere identicamente nullo e che risulta, in questo caso, ancora più disperso rispetto
al caso in cui si consideri un solo decisore.
Nel caso in cui la dispersione degli attributi all'interno dell'insieme dei decisori presenti una
varianza troppo elevata, il metodo del decisore medio tende, ovviamente, a dare risultati
poco attendibili. Si ricorre, in questi casi, all'accortezza di partizionare l'universo dei decisori
in più sottoinsiemi, caratterizzati, ognuno, da una minore varianza nella dispersione dei
52
valori degli attributi. Le probabilità di scelta vengono calcolate per ognuno di tali insiemi di
decisori con il metodo del “decisore medio”. In termini formali:
I = {1,2,..., j,...,n} " i " j Î I p i ( j) = pæç j / Xi ö÷

è ø
Dove nella precedente espressione l’apice i riferisce alla generica delle categorie in cui sono
stati partizionati i decisori. Tale partizionamento dell'universo dei decisori viene utilizzato
anche allo scopo di rilassare le ipotesi limitative legate alla identica composizione
dell'insieme di scelta ed alla identica struttura del paradigma formale di scelta. In tale caso
occorre definire i diversi insiemi di decisori in modo che si possa riscontrare all'interno di
ognuno di essi una omogenea composizione dell'insieme di scelta, lo stesso paradigma
formale di scelta ed una composizione analoga del vettore degli attributi di scelta con una
varianza il più possibile ridotta dalla dispersione dei relativi valori. In termini formali:
I i = {1,2,..., j,...,n i } " i " j Î I i p i ( j) = p i æç j / X i ö÷

è ø
Si noti che, in tale caso, sono dipendenti dallo specifico gruppo di decisori (i) sia l'insieme
di scelta (Ii), che il vettore (medio) degli attributi di scelta ( X i ), che il paradigma formale di
scelta æç p i æç j / X i ö÷ ö÷ .
è è øø
Esistono metodi di aggregazione delle scelte per più decisori più raffinati di quello basato
sull'utente medio. Uno di questi metodi è quello cosiddetto della enumerazione campionaria
(in inglese sample enumeration). Tale metodo non è di difficile attuazione, la sua
descrizione, comunque, esula dagli scopi di questo modulo didattico.
53
LA DOMANDA DI TRASPORTO
3 LA DOMANDA DI TRASPORTO
La domanda di trasporto passeggeri1 può essere definita come la caratterizzazione analitica,

finalizzata alla rappresentazione modellistica, del fenomeno della mobilità. Essa risulta,
dunque, essere l'insieme degli utenti o dei potenziali tali (con i loro comportamenti e le loro
caratteristiche) che, in un intervallo di tempo di riferimento, chiedono di usufruire dei servizi
e delle infrastrutture di trasporto.
Giacché la mobilità può essere vista, nell’ambito del più generale sistema complessivo delle
attività territoriali, come una esigenza derivata da esigenze primarie legate allo svolgimento
delle attività economiche e sociali sul territorio, la domanda di trasporto è una domanda
indotta.
Ancorché la dislocazione delle attività sul territorio influenzi sempre la domanda di mobilità,
tale influenza può caratterizzarsi in maniera più o meno diretta e più o meno vincolante a
seconda dei motivi che caratterizzano gli spostamenti, a seconda, cioè, del tipo di esigenza
primaria che essi sono orientati a soddisfare.
Rispetto alla influenza più o meno diretta e vincolante esercitata dal sistema delle attività
economiche e sociali sulla domanda di mobilità e dunque sulle caratteristiche che essa
assume possono essere distinte due grandi categorie: i motivi di spostamento di tipo
sistematico e quelli di tipo non sistematico. I motivi dello spostamento di tipo sistematico
(tipico esempio è il motivo Lavoro) sono caratterizzati da un vincolo forte e diretto che
l’esigenza primaria (il lavorare) esercita sia sulle caratteristiche temporali che sulle
caratteristiche spaziali della domanda, per tale motivo vengono spesso anche indicati come
motivi vincolati. In generale, infatti, gli spostamenti per il motivo Lavoro sono vincolati
rispetto al periodo temporale in cui avvengono dall’organizzazione lavorativa (che in
generale prevede orari più o meno rigidi) e sono vincolati nella loro caratterizzazione
spaziale dal luogo di residenza degli individui (che vincola il luogo di origine dello
spostamento) e dal luogo in cui gli individui stessi esercitano la loro attività lavorativa
(vincolo sulla destinazione dello spostamento). Un esempio, invece, di spostamenti non
sistematici può essere visto nei motivi dello spostamento del tipo svago. Tali motivi sono
evidentemente meno vincolati rispetto sia alla caratterizzazione temporale (possono trovare
una più libera collocazione oraria) che a quella spaziale (la scelta della destinazione, ad
1
Nel seguito, per semplicità, sottenderemo che ci si riferisca esclusivamente alla mobilità di persone e non alla
mobilità delle merci.
54
esempio, non è imposta a priori). Per tale motivo, in luogo della definizione di “non
sistematici” si utilizza talvolta quella di non vincolati.
Una delle principali caratterizzazioni analitiche della mobilità avviene tipicamente
associando alla domanda di trasporto proprio la caratteristica motivazionale (legata, come
detto, alle esigenze primitive che la mobilità è intesa a soddisfare, ad esempio spostamenti
per il motivo Lavoro, Studio, Svago, …). Altre caratteristiche importanti sono quelle:
temporali (il periodo di riferimento cui la mobilità viene analizzata); spaziali (l’origine e/o
la destinazione degli spostamenti); di modalità degli spostamenti (il modo con cui gli
spostamenti vengono effettuati - ad esempio in auto, coi mezzi di trasporto collettivo, ecc.).
Di volta in volta, a seconda del particolare contesto di analisi e simulazione, ulteriori
caratterizzazioni possono essere ritenute rilevanti per l’individuazione modellistica del
fenomeno della mobilità.
Per l'analisi della domanda di trasporto esistono più approcci. In particolare, i due approcci
principali sono classificabili nelle grandi famiglie dei metodi di stima diretta e dei modelli
per la determinazione dei flussi di domanda.
I diversi approcci sono entrambi caratterizzati da limiti di utilizzo. Ad esempio, i metodi di
stima diretta possono essere utilizzati solo per l'analisi della domanda di un sistema di
trasporto nella sua configurazione attuale, o per quelle aliquote di domanda che sia
ragionevole ritenere invarianti rispetto all'evoluzione/modifica del funzionamento del
sistema. Non possono essere, invece, utilizzati per la stima della domanda da prevedere in
caso di evoluzione della configurazione del sistema esaminato. I modelli per la
determinazione dei flussi di domanda, d'altro canto, non hanno la precedente limitazione e
possono essere utilizzati sia per l'analisi della configurazione corrente che per la
stima/previsione di configurazioni future. Essi, però, presentano limiti d'applicazione legati
alla necessità di essere alimentati con i dati caratteristici della configurazione territoriale e
socioeconomica che si vuole analizzare; tipicamente, i modelli per la determinazione dei
flussi di domanda possono essere utilizzati per l'analisi (o per la previsione) della domanda
di trasporto scambiata tra il sistema individuato e l'esterno del sistema stessa (e viceversa)
solo con notevoli difficoltà ed approssimazioni. D’altra parte, le relazioni tra sistema ed
ambiente esterno dovrebbero essere invarianti per definizione e ad esse possono dunque
essere bene applicati approcci di stima diretta.
In questa sede, comunque, saremo interessati allo studio dell’approccio modellistico per la
determinazione dei flussi di domanda, trascureremo l’approccio di stima diretta.
55
3.1 I MODELLI PER LA DETERMINAZIONE DEI FLUSSI DI DOMANDA

Si indichino con k1, k2, ..., kx le caratteristiche associate alla domanda di trasporto, con ST
il vettore che rappresenta tutte le variabili del sistema di attività e socioeconomico che
inducono il fenomeno della mobilità, con LS il vettore di tutte le variabili rappresentative
del funzionamento del sistema di trasporto (dette variabili – o attributi – di livello di servizio)
che determinano le potenzialità d'utilizzo del sistema da parte della domanda ed, infine, si
indichi con d(k1, k2, ..., kx) una stima modellistica della domanda, così come essa s'intende
caratterizzata. Un modello di domanda, allora, è espresso formalmente dalla relazione:
d(k1, k2, ..., kx) = d(ST, LS) 35
Essa è la funzione analitica con cui la domanda può essere determinata in funzione delle
variabili che la determinano e che ne determinano le caratteristiche.
Esistono diverse approcci che possono essere utilizzati per la messa a punto di modelli di
domanda. L'approccio più completo (e complesso) consiste nel simulare esplicitamente per
i potenziali utenti del sistema dei trasporti la successione (temporale e spaziale) delle attività
che compiono ed, in conseguenza di queste, la successione congruente di spostamenti (con
le relative caratteristiche) che permette di compiere tali attività. Tale approccio, che è la
migliore esplicitazione del concetto di domanda di trasporto come esigenza derivata, è
denominato activity-based; esso è tutt'altro che di agevole formulazione ed applicazione e,
allo stato attuale, deve essere soprattutto considerato come un argomento di ricerca, ancora
in piena fase di maturazione. Nei modelli detti di tipo tour-based, invece, la successione
delle attività si ritiene nota (non viene esplicitamente simulate ma si assume esogenamente
al modello) ed in base ad essa i diversi spostamenti che ne derivano vengono simulati
facendo attenzione alla loro concatenazione1. I modelli più consolidati e maturi, infine, sono
basati su approcci cosiddetti trip-based. In essi la successione di attività è assunta
esogenamente al modello e non viene esplicitamente simulata la concatenazione degli
spostamenti che ne risultano; si preferisce, invece, semplificare il problema ipotizzando che
ogni spostamento avvenga indipendentemente dall'altro e che la presenza di attività sul
territorio induca indipendente ogni spostamento.
I modelli di domanda che si tratteranno nel seguito saranno esclusivamente di tipo trip-based;
essi, inoltre, saranno finalizzati alla sola simulazione delle caratteristiche della domanda
1
Questo significa, ad esempio, che si considera esplicitamente il fatto che due spostamenti di uno stesso tour
debbano essere tali che la destinazione del primo coincide con la origine del secondo e che, sempre ad
esempio, se il primo è stato effettuato con un mezzo pubblico (e non ha come destinazione un luogo in cui
si ha a disposizione la propria automobile), il secondo non può essere effettuato con la vettura privata.
56
associate con le cosiddette scelte di viaggio, non anche di quelle associate alle cosiddette
scelte di contesto, quali ad esempio la scelta del luogo di residenza, del luogo di lavoro, di
possedere la patente di guida, la scelta del numero di automobili possedute (in famiglia), ecc.
In particolare, nel seguito si farà riferimento proprio a modelli finalizzati alla
rappresentazione di una domanda caratterizzata da:
§ un periodo di riferimento (ad esempio l'ora di punta antimeridiana di un giorno feriale
medio);
§ una caratteristica motivazionale (ad esempio spostamenti che avvengono per il motivo
Casa-Acquisti);
§ una caratterizzazione spaziale, identificata con una coppia di luogo di origine e
destinazione, intesi come opportune aggregazioni discrete (in zone di origine e
destinazione) della continuità di localizzazioni spaziali possibili in un'area di studio;
§ una caratterizzazione modale (ad esempio distinguendo spostamenti che avvengono a
piedi da quelli che avvengono con autovettura privata, da quelli che avvengono con
servizi di trasporto collettivo, ecc.).
La precedente caratterizzazione della domanda è solo una delle possibili, nulla impedisce
caratterizzazioni diverse e/o più ampie, a patto, ovviamente, di mettere a punto modelli adatti
a simulare tali diverse caratterizzazioni. È il caso di notare, comunque, che la
caratterizzazione sopra elencata è tra le più utilizzate nella pratica. Essa dà luogo ai flussi di
domanda nella loro accezione più comune; ad esempio un flusso di domanda con le
caratteristiche precedenti può essere formalmente espresso come:
d(h, s, o, d, m)
dove:
§ h è il periodo di riferimento;
§ s è il motivo dello spostamento;
§ o l'origine;
§ d la destinazione;
§ m il modo di trasporto.
Insomma, un flusso di domanda del tipo precedente potrebbe essere: il numero di utenti che
nel periodo di riferimento h (l'ora antimeridiana di punta di un giorno feriale medio) si sposta
per il motivo s (Casa-Acquisti) dall'origine o (il quartiere Vomero di Napoli) alla
57
destinazione d (il quartiere Fuorigrotta di Napoli) utilizzando il modo m (l'autovettura

privata)1.
In ogni caso, le caratteristiche della domanda corrispondono ad altrettante scelte di viaggio
da parte degli utenti (o potenziali tali) del sistema.
Tali scelte possono essere rappresentate come il risultato dei comportamenti degli utenti
rispetto ad un ampio insieme di alternative discrete (Figura 11).
1 2 ... j ... n
Figura 11 – Insieme delle alternative di scelta per un modello di domanda
La j-esima alternativa di Figura 11, rispetto alla caratterizzazione della domanda adottata
come esempio, potrebbe assumere il significato: spostarsi per il motivo s, nel periodo di
riferimento h, compiendo x spostamenti, partendo dall'origine o, giungendo nella
destinazione d ed usando il modo m.
Con tale approccio, il modello di domanda potrebbe essere rappresentato attraverso un
modello di scelta discreta come:
d(h, s, o, d, m) = Nå x p( j = [h, s, o, d, m, x]) jÎ I
x
oppure
d(h, s, o, d, m) = å N i å x p i ( j = [h, s, o, d, m, x]) j Î I i
i x
a seconda che tutti i (potenziali) utenti del sistema siano rappresentati nel modello di scelta
discreto come un unico decisore collettivo (di numerosità N), oppure siano classificati in più
gruppi (il cui generico è indicato con i ed ha numerosità Ni) di decisori collettivi. Le
probabilità p(j) (o pi(j), a seconda dei casi) si ottengono con un modello di scelta discreta
utilizzando l'approccio del decisore medio. Il numero n di alternative di scelta discrete può
1 Spesso l'insieme (per una data area di studio) dei flussi di domanda, così come precedentemente
caratterizzati, viene rappresentato in forma matriciale, identificando le origini e destinazioni degli
spostamenti rispettivamente con le righe e colonne di una matrice, indicata con d(h, s, m). L'elemento di
riga o e di colonna d dod(h,s,m) corrisponde al flusso di domanda d(h,s,o,d,m).
58
tipicamente essere assai elevato ed è ottenibile da tutte le possibili combinazioni delle

possibili scelte associate alla caratterizzazione della domanda.
Il tipo di modello di scelta discreto utilizzato determina il tipo di modello di domanda. I
modelli per la determinazione dei flussi di domanda sono in genere di tipo logit-
multinomiale o di tipo nested-logit1. Il caso più generale tra i due è quello del modello
nested-logit. In tale caso si ipotizza che le scelte che caratterizzano la domanda avvengano
secondo una gerarchia ben definita; si potrebbe immaginare (con riferimento ad esempio alla
Figura 12) che gli utenti dapprima scelgano se spostarsi per il motivo s, poi (condizionato a
ciò) se farlo nel periodo di riferimento h, poi (condizionato alle precedenti due scelte) se
effettuare x spostamenti, poi (condizionato alle tre scelte precedenti) se partire dall'origine
o, poi (condizionato a tutte le precedenti scelte) se raggiungere la destinazione d ed infine
(sempre condizionato a tutte le scelte precedenti) se utilizzare il modo m.
In un tale contesto gerarchizzato, la probabilità di fare la scelta complessiva j risulta
fattorializzata nel prodotto di più probabilità condizionate.
Radice
E=[s] s ...
D=[s,h] h ...
C=[s,h,x] x ...
B=[s,h,x,o] o ...
A=[s,h,x,o,d] d ...
j=[s,h,x,o,d,m] ...
m
Figura 12 – Gerarchizzazione delle scelte di un modello di domanda
p(j) = p(m/d,o,x,h,s) p(d/o,x,h,s) p(o/h,h,s) p(x/h,s) p(h/s) p(s)

Come scrivere tali probabilità condizionate è già stato ampiamente trattato. Con riferimento
all’albero di scelta della figura 12 si può scrivere:
expæç m / d ö
v
J ÷
p(m / d , o , x , h ,s ) = è Aø
å expæçè v m' / d J A ö÷ø

m'
1 Nel seguito i modelli nested-logit e logit-multinomiale vengono riferiti al caso di una sola classe di decisori.
L'estensione al caso di più classi di decisori è banale, almeno utilizzando l'approccio del decisore medio.
59
(v + J A YA ) ù
exp é d / o
êë J B úû
con YA = ln åm' expæç m' / d ö
v
p(d / o , x , h ,s ) =
J A ÷ø
å expéêë(v d' / o + JA' YA' )JB ùúû è
d'
(v + J B YB ) ù
exp é o / x
p(o / x , h ,s ) =
êë J C úû
con YB = ln åd' exp é
(v d' / o + J A' YA' ) ù
å expéêë(v o' / x + JB' YB' )JC ùúû
êë J B úû
o'
(v + JC YC ) ù
exp é x / h
p(x / h ,s ) =
êë J D úû
con YC = ln åo' exp é
(v o' / x + J B' YB' ) ù
å expéêë(v x' / h + JC' YC' )J D ùúû
êë J C úû
x'
(v + J D YD ) ù
exp é h / s
p(h / s ) =
êë J E úû
con YD = ln åx' exp é
(v x' / h + JC' YC' ) ù
å expéêë(v h' / s + J D' YD' )JE ùúû
êë J D úû
h'
exp é s
(v + J E YE ) ù
p(s ) =
êë J úû
con YE = ln åh' exp é
(v h' / s + J D' YD' ) ù
å expéêë(v s' + JE' YE' )J ùúû
êë J E úû
s'
con J ³ JE ³ JD ³ JC ³ JB ³ JA³ 0 e con vs, vh/s, vx/h, vo/x, vd/o, vm/d il contributo alla utilità
sistematica complessiva di ogni livello di scelta.
È noto che la sequenza della gerarchia non è ininfluente sulla struttura del modello; essa,
infatti, corrisponde a ben precise ipotesi sulla dipendenza delle distribuzioni dei residui
aleatori e determina, attraverso la matrice di varianza-covarianza risultante, le probabilità di
scelta complessive delle alternative. Ad esempio, la gerarchia riportata nella figura 12
presuppone che l'alternativa di compiere lo spostamento per il motivo s sia indipendente da
quella di compiere lo spostamento per un qualsivoglia altro motivo e che alternative
comunque composte, ma caratterizzate da motivi dello spostamento diversi, abbiano
comunque distribuzioni indipendenti. Similmente, alternative relative, ad esempio, a diverse
origini sono statisticamente correlate solo se hanno frequenze di spostamento (x) o periodi
di riferimento (h) o motivi dello spostamento (s) in comune. Insomma, una diversa
gerarchizzazione conduce a modelli di domanda diversi1 ed occorre rifarsi, dunque, alla
gerarchizzazione più opportuna a seconda delle circostanze.
1 Diverse matrici complessive di dispersione ed anche diversi valori delle probabilità condizionate e
complessive di scelta.
60
In alternativa, nel caso in cui tutte le scelte che caratterizzano la domanda si considerino
indipendenti, è possibile utilizzare un modello logit-multinomimale. In tale caso, detto J il
parametro (unico) del modello, la probabilità di scelta della generica alternativa è data da:
æV ö
expç j ÷
p( j) = è Jø 36
æV ö
åj' expçè j' J ÷ø
È possibile utilizzare l'impostazione precedentemente vista per il caso nested-logit al fine di
ottenere una fattorializzazione anche per il modello logit-multinomiale.
L'utilità sistematica di ogni alternativa j è la somma di tante aliquote quante sono le decisioni
che la caratterizzano:
Vj = vs + vh/s + vx/h + vo/x + vd/o + vm/d j=[s,h,x,o,d,m] "jÎI
Rispetto alla precedente formulazione del modello nested-logit, però, si considerino i
parametri delle distribuzioni ai vari livelle tutti uguali e pari a J, ad esempio:
JE = JD = JC = JB = JA = J ³ 0
In tale caso è ancora possibile scrivere (perché il concetto di probabilità condizionata può
essere applicato in qualsiasi circostanza):
p(j) = p(m/d,o,x,h,s) p(d/o,x,h,s) p(o/h,h,s) p(x/h,s) p(h/s) p(s)
con:
expæç m / d ö÷
v
è Jø
p(m / d , o , x , h ,s ) =
å expæçè v m' / d J ö÷ø
m'
exp é
(v d / o + J YA ) ù
êë J úû
con YA = ln åm' expæç m' / d ö÷
v
p(d / o , x , h ,s ) =
å expéêë(v d' / o + J YA' )J ùúû è Jø
d'
exp é
(v o / x + JYB ) ù
p(o / x , h ,s ) =
êë J úû
con YB = ln åd' exp é
(v d' / o + J YA' ) ù
å expéêë(v o' / x + J YB' )J ùúû
êë J úû
o'
exp é
(v x / h + JYC ) ù
p(x / h ,s ) =
êë J úû
con YC = ln åo' exp é
(v o' / x + J YB' ) ù
(v + J YC' )
exp é x' / h ù êë J úû
å êë J úû
x'
61
exp é
(v h / s + J YD ) ù
p(h / s ) =
êë J úû
con YD = ln åx' exp é
(v x' / h + J YC' ) ù
å expéêë(v h' / s + J YD' )J ùúû
êë J úû
h'
exp é
(v s + J YE ) ù
p(s ) =
êë J úû
con YE = ln åh' exp é
(v h' / s + J YD' ) ù
å expéêë(v s' + J YE' )J ùúû
êë J úû
s'
Non è difficile dimostrare che tale fattorializzazione conduce esattamente alla relazione 36,
tipica del modello logit multinomiale. Infatti:
expæç m / d ö÷
v (v + J YA ) ù
exp é d / o
è Jø êë J úû
p(m / d , o , x , h ,s ) p(d / o , x , h ,s ) = =
æ v m' / d ö é (v d' / o + J YA' ) ù
å expçè J ÷ø å
exp
êë J úû
m' d'
expæç m / d ö÷ expæç d / o ö÷ exp(YA )

v v
è J ø è Jø
=
å expæçè v m' / d J ö÷ø å expæçè v d' / o J + YA' ö÷ø
m' d'
æ v d / o ö expæ v m' / d ö é(v m / d + v d / o ) ù

expæç m / d ö÷ expç J ÷ø å
v ç
J è è J ÷ø exp ê J úû
= è ø m'
= ë
å expæçè v m' / d J ö÷ø å expæçè v d' / o J + YA' ö÷ø å expæçè v d' / o J + YA' ö÷ø
m' d' d'
(v + v d / o ) ù expæç v o / x + Y ö÷
exp é m / d
êë J úû è J B
ø
p(m / d , o , x , h ,s ) p(d / o , x , h ,s ) p(o / x , h ,s ) =
å expæçè v d' / o J + YA' ö÷ø å expæçè v o' / x J + YB' ö÷ø
d' o'
(v + v d / o ) ù expæç v o / x ö÷ å expæç v d' / o + YA' ö÷

exp é m / d
êë J úû è Jø è J ø
d'
= =
æ v d' / o ö æ v o' / x ö
å expçè J
+ YA' ÷
ø
å expçè J
+ YB' ÷
ø
d' o'
exp é
(v m / d + v d / o + v o / x ) ù
êë J úû
=
å expæçè v o' / x J + YB' ö÷ø
o'
Proseguendo in maniera analoga si ottiene:

p(m / d,o, x ,h ,s) p(d / o, x ,h ,s) p(o / x ,h ,s) p(x / h ,s) p(h / s) p(s) =
62
exp é
(v m / d + v d / o + v o / x + v x / h + v h / s ) ù expæç s + YE ö÷
v
êë J úû è J ø =
=
å expæçè v h' / s J + YD' ö÷ø å expçè J + YE' ö÷ø
æ v s'
h' s'
exp é
(v m / d + v d / o + v o / x + v x / h + v h / s ) ù expæç v s ö÷ å expæç v h' / s + YD' ö÷
êë J úû è J ø h' è J ø
= =
å expæçè v h' / s J + YD' ö÷ø æ v s'
å expçè J + YE' ÷ø ö
h' s'
æV ö
expç j ÷
= è Jø
å expæçè v s' J + YE' ö÷ø
s'
Ma a sua volta
å expæçè v
s'
s'
J
+ YE ' ö÷ = exp(YE ' )å expæç s ' ö÷ =
ø s'
v
è Jø
v v (v + v h'' / s' ) + Y ù =
= å expæç s' ö÷å expæç h'' / s' + YD'' ö÷ = å expé s'
è J ø h'' è J ø s' h'' ê
ë J D'' ú
û
s'
= å expéêë(vs' + v h'' / s' )J + YD'' ùúûå expæçè v x''' / h'' J + YC'' ö÷ø =
s' h'' x'''
expé
(v s' + v h'' / s' + v x''' / h'' ) + YC'' ù =
= å êë J úû
s' h'' x'''
(v + v h'' / s' + v x''' / h'' ) ö÷ expæç v oIV / x''' + Y IV ö÷ =

expæç s'
= å è J øå ç J B ÷
s' h'' x''' oIV è ø
(
é v + v h'' / s' + v x''' / h'' + v oIV / x''' ù)
= å expê s'
J
+ YBIV ú =
s' h'' x''' oIV ë û
(
æ v + v h'' / s' + v x''' / h'' + v oIV / x''' ö )
æ v V IV ö
= å expçç s'
J
÷÷å expçç d / o
J
+ YAV ÷÷ =
s' h'' x''' oIV è ø dV è ø
(
é v + v h'' / s' + v x''' / h'' + v oIV / x''' + v d V / oIV ) ù
= å expê s'
J
+ YAV ú =
s' h'' x''' oIVd V ë û
(
æ v + v h'' / s' + v x''' / h'' + v oIV / x''' + v d V / oIV ö ) æ v VI V ö
= å expçç s' ÷÷ å expçç m / d
J ø VI è
÷=
J ÷ø
IV V
s' h'' x''' o d è m
(
é v + v h'' / s' + v x''' / h'' + v oIV / x''' + v d V / oIV + v mVI / dV ù )
= å expê s'
J úû
=
IV V VI
s' h'' x''' o d m ë
æV ö
= å expç j' ÷
è J ø
j'
63
Da cui consegue che:
æV ö
expç j ÷
p(m / d, o, x, h, s ) p(d / o, x, h, s ) p(o / x, h, s ) p(x / h, s ) p(h / s ) p(s ) = è J ø = p( j)
æV ö
åj' expçè j' J ÷ø
Si noti, inoltre, che in tal caso la matrice di dispersione complessiva del modello ha varianze
p2 2
(elementi della diagonale principale) tutte pari a J e covarianze tutte pari a
6
p2 2
6
( )
J - J 2 = 0 (si veda, in proposito, la relazione 22 del precedente capitolo). Anche la
matrice di dispersione, dunque è quella propria di un modello logit multinomiale.

Infine, si noti che l'ordine della gerarchizzazione, che nel caso del logit-multinomiale è
finalizzata alla sola fattorializzazione, non ha alcuna rilevanza né sulla matrice di dispersione
complessiva, né sulle probabilità complessive di scelta. L'unica cosa importante è che le
aliquote di utilità sistematica dei singoli fattori, quali che esse siano, diano come somma
l'utilità sistematica complessiva:
Vj = vs + vh/s + vx/h + vo/x + vd/o + vm/d j=[s,h,x,o,d,m] "jÎI
Il vantaggio d'introdurre una fattorializzazione nel caso del logit-multinomiale risiede nella
possibilità di lavorare per livelli. Cioè di scomporre un problema complesso rispetto al
numero di combinazioni possibili che individuano un numero elevato di alternative in tanti
problemi meno complessi.
Sia che il modello adottato sia di tipo logit-multinomiale che di tipo nested-logit, alcune
delle probabilità dei livelli di scelta hanno denominazioni particolari, ad esempio1:
§ la probabilità di scelta del numero di spostamenti (x) dà luogo al sottomodello di
frequenza degli spostamenti p(x);
§ le probabilità di scelta del motivo, del periodo di riferimento, del numero di
spostamenti e dell'origine danno luogo, insieme, al sottomodello di generazione
p(s,h,x,o)=p(s)p(h)p(x)p(o) Þ do.(s,h)=NSxp(s,h,x,o); dove con do.(s,h) si è indicato il
totale della domanda emessa dall'origine o, per il motivo s nel periodo di riferimento
h.
1 Nella notazione del seguente elenco, per semplicità, s'omette la esplicitazione dei livelli condizionanti che,
nel caso del modello nested-logit, è comunque uno dei fattori che determinano la natura del modello
complessivo.
64
§ la probabilità di scelta della destinazione dà luogo al sottomodello di distribuzione

p(d);
§ la probabilità di scelta del modo dà luogo al sottomodello di scelta modale p(m);
Si noti come la dipendenza introdotta con la relazione 35 della domanda rispetto alle variabili
descrittive del sistema socioeconomico e delle attività ed agli attributi di livello di servizio
del sistema di trasporto si realizzi attraverso la dipendenza delle utilità sistematiche dei
modelli (logit-multinomiale o nested-logit, che siano) da tali variabili. In altri termini, i
vettori ST e LS non sono niente altro che gli attributi (vettore X – si confronti la relazione 5
del precedente capitolo) del modello complessivo di scelta discreta utilizzato per
caratterizzare la domanda di trasporto.
3.2 SPECIFICAZIONE, CALIBRAZIONE E VALIDAZIONE DEI MODELLI PER LA

STIMA DEI FLUSSI DI DOMANDA
La procedura di specificazione, calibrazione e validazione dei modelli per la stima dei flussi
di domanda è finalizzata alla messa a punto di un modello che simuli in maniera appropriata
il fenomeno della mobilità, così come esso vuole essere caratterizzato dall'analista1.
La procedura nel suo complesso consiste nello:
§ specificare il modello, e cioè:
• definire le scelte corrispondenti alla caratterizzazione con cui si desidera analizzare
la mobilità;
• definire la forma funzionale del modello di domanda (o, se si preferisce, del
modello di scelta discreta utilizzato al suo interno);
• nel caso di una forma funzionale di tipo gerarchico (ad esempio modello nested-
logit), definire la gerarchia della successione di scelta;
• definire l'espressione dell'utilità sistematica attraverso l'individuazione degli
attributi di scelta che s'intende utilizzare al fine di “spiegare” le utilità sistematiche;
§ calibrare il modello, e cioè:
• individuare il valore dei parametri del modello di scelta discreta:
o coefficienti di reciproca sostituzione (b, comprensivi delle CSA);
o parametri della matrice di dispersione (J);
§ validare il modello, e cioè:
1 Nel seguito si farà esclusivamente riferimenti ad un modello relativo ad una sola classe di utenti. Nel caso
di più classi di utenti (i), fa parte della procedura anche l'individuazione delle stesse e quanto detto nel
seguito deve essere applicato ad ogni classe individuata.
65
• verificare che il modello riproduca in maniera “accettabile” il fenomeno che

s'intende simulare.
La procedura di specificazione, calibrazione, validazione, in genere, deve essere ripetuta più
volte (Figura 13), partendo da specificazioni “di tentativo”, finché la validazione non dà
risultati che possono essere ritenuti accettabili.
Osservazione del
Specificazione fenomeno “reale”
Parametri da
calibrare Calibrazione Osservazione dei
comportamenti “reali”
Risultanze
modellistiche
NO Esito
positivo? Validazione
SI
Utilizzo del modello per la simulazione
Figura 13 – Specificazione, calibrazione e validazione dei modelli per la stima dei flussi di domanda
La complicazione del processo è dovuta al fatto che non è possibile osservare direttamente
le utilità percepite dagli utenti del sistema dei trasporti nell'effettuare le loro scelta. Se fosse
possibile osservare tali utilità, si potrebbe, infatti, stimare con tecniche statistiche
direttamente la loro media e la loro distribuzione di probabilità (E[U]=V, fe (e) con U=V +
e) ma, nella “realtà”, le utilità percepite, semplicemente, “non esistono”: il paradigma
formale di scelta è una costruzione dell'analista. Ciò che nella realtà esiste sono i risultati
delle scelte dei decisori e ciò che l'analista può osservare sono proprio tali risultati di scelta,
nonché i valori degli attributi che egli ritiene significativi per spiegare le scelte. L'operazione
di stima dei modelli di domanda, dunque, è costituita dalla specificazione e calibrazione d'un
paradigma formale che possa simulare “sufficientemente bene” i risultati di tali scelte.
Anche se l'operazione di specificazione del modello deve necessariamente precedere quella
di calibrazione, per comodità didattica è opportuno iniziare a descrivere la fase di
calibrazione.
3.2.1 CALIBRAZIONE
Si supponga di avere già specificato il modello e cioè:

66
§ di avere ipotizzato la forma della distribuzione del vettore dei residui aleatori (fe(e)),
quindi di avere stabilito se si tratta di un modello, ad esempio, logit-multinomiale o
nested-logit;
§ nel caso di un modello nested-logit, di avere stabilito la gerarchia delle scelte, quindi
di avere ipotizzato quale sia la struttura della matrice di dispersione complessiva del
modello (quali alternative – o livelli di scelta – siano tra di loro dipendenti od
indipendenti – in altri termini, la forma dello “albero delle scelte”);
§ di avere ipotizzato quali siano gli attributi che “spiegano” le utilità sistematiche, si è
quindi identificata (a meno dei valori dei beta) la relazione Vj =Skbk Xjk, " j).
Rimangono incogniti i valori del parametro J (o dei parametri J, nel caso nested-logit) e dei
coefficienti di reciproca sostituzione b (comprensivi delle CSA); essi sono proprio l'oggetto
della calibrazione.
In queste condizioni le probabilità di scelta di ogni alternativa (e quindi il vettore delle
probabilità di scelta delle alternative) sono definiti a meno dei valori dei parametri J e b.
Diversi valori per tali parametri, quindi, possono dare luogo a diverse espressioni del vettore
delle probabilità di scelta:
p = p(X,β,J) 37
Lo scopo della calibrazione è quello di osservare i risultati delle scelte dei decisori (in
funzione degli attributi – X – di scelta, noti) e di trovare i J e b, non solo in modo da
riprodurre “al meglio” le percentuali complessive di scelta osservate, ma anche in modo da
riprodurre il più fedelmente possibile la distribuzione dei comportamenti (e quindi delle
scelte) osservati all'interno del gruppo di decisori considerato.
Un esempio dovrebbe aiutare a chiarire i concetti sopra esposti.
Si supponga, ad esempio, di trovarsi in un contesto di scelta in cui si debbano simulare gli
spostamenti tra le tre zone di una area di studio quale quella descritta nella seguente figura.
1 3
Si supponga di trascurare gli spostamenti interni a ciascuna delle zone e di considerare solo
quelli tra zone diverse e che per tali spostamenti siano disponibili tre modi di trasporto (auto,
bus, piedi). Quello che si vuole calibrare è, dunque, un modello di scelta modale.
67
Si supponga di avere scelto una specificazione di tipo logit-multinomiale1:

I={auto, bus, piedi} mÎI
æ p2 ö
" m, U m = Vm + e m e m i.i.d. » Gç 0, J2 ÷
ç 6 ÷
è ø
Si supponga di avere già specificato il modello in termini di individuazione degli attributi di
scelta e che per ognuno dei modi alternativi gli attributi medi, variabili a seconda delle zone
tra cui avviene lo spostamento, siano quelli riportati nella seguente tabella:
Auto Bus Piedi

Destinazione
Costo (Euro)
Costo (Euro)
Origine
Tpiedi (min)
Tpiedi (min)
Parcheggio
ASA Auto
ASA Bus
O/D
Tattesa
Tbordo
Tbordo
(min)
(min)
(min)
1 2 1-2 8 0,93 1 1 14 5 3 0,77 1 20
1 3 1-3 12 1,34 0 1 7 6 5 0,77 1 28
2 1 2-1 8 0,93 0 1 14 5 3 0,77 1 20
2 3 2-3 10 1,03 0 1 7 6 5 0,77 1 20
3 1 3-1 12 1,03 0 1 7 6 5 0,77 1 28
3 2 3-2 10 1,29 1 1 7 6 5 0,77 1 20
Si supponga di avere osservato i risultati delle scelte di un gruppo di utenti che costituiscono
gli elementi del campione necessario per la nostra calibrazione. Essi siano quelli riportati
nella seguente tabella:
1 Si farà in questo esempio l'ipotesi di essere interessati alla sola caratteristica modale della domanda; in altri
termini, le altre caratteristiche si ritengono già note esogenamente al modello. Siamo dunque interessati,
sempre a solo titolo di esempio, al solo modello di scelta modale.
68
Intervista O/D Alternativa scelta Intervista O/D Alternativa scelta

1 1-2 Piedi 31 2-3 Auto
2 1-2 Bus 32 2-3 Auto
3 1-2 Piedi 33 2-3 Auto
4 1-2 Piedi 34 2-3 Auto
5 1-2 Piedi 35 2-3 Auto
6 1-2 Bus 36 2-3 Auto
7 1-2 Auto 37 2-3 Auto
8 1-2 Bus 38 2-3 Bus
9 1-2 Piedi 39 2-3 Auto
10 1-2 Bus 40 2-3 Auto
11 1-3 Auto 41 3-1 Auto
12 1-3 Auto 42 3-1 Auto
13 1-3 Auto 43 3-1 Auto
14 1-3 Bus 44 3-1 Auto
15 1-3 Auto 45 3-1 Bus
16 1-3 Auto 46 3-1 Auto
17 1-3 Auto 47 3-1 Auto
18 1-3 Auto 48 3-1 Bus
19 1-3 Auto 49 3-1 Auto
20 1-3 Auto 50 3-1 Auto
21 2-1 Auto 51 3-2 Bus
22 2-1 Auto 52 3-2 Bus
23 2-1 Auto 53 3-2 Piedi
24 2-1 Auto 54 3-2 Bus
25 2-1 Auto 55 3-2 Piedi
26 2-1 Auto 56 3-2 Bus
27 2-1 Auto 57 3-2 Bus
28 2-1 Auto 58 3-2 Bus
29 2-1 Auto 59 3-2 Bus
30 2-1 Auto 60 3-2 Bus
Per il momento ci si occupi della sola calibrazione dei parametri b (comprensivi delle CSA),
supponendo noto e fisso il valore del parametro J della matrice di dispersione (J = 1, per
esempio).
È possibile adottare due approcci differenti per la calibrazione dei parametri b. Il primo
approccio prende il nome di calibrazione aggregata. Esso consiste nel limitarsi ad analizzare
le probabilità aggregate di scelta delle alternative osservate nel campione e nel fare variare i
parametri del modello in modo che le percentuali di scelta che consegna, in funzione di essi,
il modello siano il più possibili simili a quelle osservate. In altri termini, dall’osservazione
del campione si nota che sulla coppia O/D 1-2 il 10% degli elementi del campione sceglie il
modo auto, il 40% il modo bus ed il 50% il modo piedi. Analoghe osservazioni si possono
fare per tutte le coppie O/D ottenendo la seguente tabella delle probabilità osservate:
Probabilità da Campione al variare degli attributi medi (cioè della coppia O/D)
O/D
Auto Bus Piedi
1-2 10% 40% 50%
1-3 90% 10% 0%
2-1 100% 0% 0%
2-3 90% 10% 0%
3-1 80% 20% 0%
3-2 0% 80% 20%
69
Si tratta a questo punto di fare variare i parametri del modello in modo da riprodurre quanto
più è possibile le precedenti percentuali. È possibile verificare che a questo scopo il migliore
insieme di valori per i parametri b è dato da:
Auto Bus Piedi
Beta Tbordo Costo Parcheggio CSA Auto Tbordo Tattesa Tpiedi Costo CSA Bus Tpiedi
-1,5612 -13,4243 -29,9282 5,2706 -1,5612 -1,8375 -2,16911 -13,4243 4,2706 -2,1691
Essi, infatti, consentono di ottenere i valori di probabilità da modello riportati nella tabella
successiva e nella stessa tabella confrontati con i dati di probabilità osservati nel campione.
Probabilità da Campione Probabilità da Modello in caso di calibrazione aggregata
O/D
Auto Bus Piedi Auto Bus Piedi
1-2 10% 40% 50% 10% 44% 46%
1-3 90% 10% 0% 86% 14% 0%
2-1 100% 0% 0% 99% 0% 0%
2-3 90% 10% 0% 97% 2% 1%
3-1 80% 20% 0% 95% 5% 0%
3-2 0% 80% 20% 1% 75% 24%
È possibile calcolare come indicatore sintetico della vicinanza tra probabilità campionarie e
probabilità modellistiche la somma degli scarti quadratici. Tale indicatore, nel caso
precedente, assume un valore di circa 0,06.
Il metodo descritto della calibrazione aggregata è dunque in grado di riprodurre in maniera
soddisfacente le frequenze osservate delle scelte.
Un approccio alternativo a quello della calibrazione aggregata è quello della calibrazione
disaggregata. Esso si basa non sulle sole frequenze di scelta all’interno del campione
(probabilità di scelta aggregate) ma anche sulla distribuzione di tali scelte tra gli elementi
del campione. In altri termini, giacché in funzione del vettore dei parametri b (e delle CSA
e del/i parametro/i J) il modello è in grado di fornire la sua stima delle probabilità di scelta
di ogni alternativa da parte di ogni elemento del campione, è in grado anche, sempre in
funzione della variazione dei parametri, di fornire la probabilità di scelta dell’alternativa che
ogni elemento del campione ha effettivamente dichiarato di scegliere (nell’esempio che
stiamo considerando l’alternativa Piedi per il primo elemento del campione, l’alternativa
Bus per il secondo elemento, di nuovo l’alternativa Piedi per il terzo elemento, e così via).
Lo scopo della calibrazione, in questo caso, è quello di fare variare i parametri in modo che
siano massimi i valori di probabilità che il modello associa alle alternative effettivamente
scelte nel campione.
70
È possibile verificare che, nel nostro esempio, il vettore dei b che è possibile ottenere con
questo approccio è quello riportato nella seguente tabella:
Auto Bus Piedi
Beta Tbordo Costo Parcheggio CSA Auto Tbordo Tattesa Tpiedi Costo CSA Bus Tpiedi
-1,2213 -11,9566 -26,2374 4,4104 -1,2213 -1,4976 -1,8292 -11,9566 3,4104 -1,8292
Le probabilità fornite dal modello per le scelte osservate nel campione1 in funzione dei
precedenti valori dei parametri di reciproca sostituzione sono riportate nella seguente tabella:
Alternativa
Alternativa
ln(P(j(w)))
ln(P(j(w)))
Intervista
Intervista
P(j(w))
P(j(w))
scelta
scelta
O/D
O/D
1 1-2 Piedi 0,41472 -0,88015 31 2-3 Auto 0,94131 -0,06049
2 1-2 Bus 0,49567 -0,70184 32 2-3 Auto 0,94131 -0,06049
3 1-2 Piedi 0,41472 -0,88015 33 2-3 Auto 0,94131 -0,06049
4 1-2 Piedi 0,41472 -0,88015 34 2-3 Auto 0,94131 -0,06049
5 1-2 Piedi 0,41472 -0,88015 35 2-3 Auto 0,94131 -0,06049
6 1-2 Bus 0,49567 -0,70184 36 2-3 Auto 0,94131 -0,06049
7 1-2 Auto 0,08961 -2,41232 37 2-3 Auto 0,94131 -0,06049
8 1-2 Bus 0,49567 -0,70184 38 2-3 Bus 0,04321 -3,14158
9 1-2 Piedi 0,41472 -0,88015 39 2-3 Auto 0,94131 -0,06049
10 1-2 Bus 0,49567 -0,70184 40 2-3 Auto 0,94131 -0,06049
11 1-3 Auto 0,82273 -0,19513 41 3-1 Auto 0,92138 -0,08188
12 1-3 Auto 0,82273 -0,19513 42 3-1 Auto 0,92138 -0,08188
13 1-3 Auto 0,82273 -0,19513 43 3-1 Auto 0,92138 -0,08188
14 1-3 Bus 0,17565 -1,73928 44 3-1 Auto 0,92138 -0,08188
15 1-3 Auto 0,82273 -0,19513 45 3-1 Bus 0,07790 -2,55230
16 1-3 Auto 0,82273 -0,19513 46 3-1 Auto 0,92138 -0,08188
17 1-3 Auto 0,82273 -0,19513 47 3-1 Auto 0,92138 -0,08188
18 1-3 Auto 0,82273 -0,19513 48 3-1 Bus 0,07790 -2,55230
19 1-3 Auto 0,82273 -0,19513 49 3-1 Auto 0,92138 -0,08188
20 1-3 Auto 0,82273 -0,19513 50 3-1 Auto 0,92138 -0,08188
21 2-1 Auto 0,98581 -0,01429 51 3-2 Bus 0,72862 -0,31661
22 2-1 Auto 0,98581 -0,01429 52 3-2 Bus 0,72862 -0,31661
23 2-1 Auto 0,98581 -0,01429 53 3-2 Piedi 0,26099 -1,34327
24 2-1 Auto 0,98581 -0,01429 54 3-2 Bus 0,72862 -0,31661
25 2-1 Auto 0,98581 -0,01429 55 3-2 Piedi 0,26099 -1,34327
26 2-1 Auto 0,98581 -0,01429 56 3-2 Bus 0,72862 -0,31661
27 2-1 Auto 0,98581 -0,01429 57 3-2 Bus 0,72862 -0,31661
28 2-1 Auto 0,98581 -0,01429 58 3-2 Bus 0,72862 -0,31661
29 2-1 Auto 0,98581 -0,01429 59 3-2 Bus 0,72862 -0,31661
30 2-1 Auto 0,98581 -0,01429 60 3-2 Bus 0,72862 -0,31661
Ln(Likelihood) -27,92379
In altri termini, l’elemento 31 del campione, ad esempio, ha dichiarato di scegliere

l’alternativa piedi ed il modello, in funzione dei beta calibrati, è in grado di associare a tale
alternativa una probabilità di essere scelta pari a circa il 94%. Nella tabella precedente sono
stati riportati anche i logaritmi delle probabilità relative alle scelte osservate, nonché la
1
dove la generica di esse, riferita al generico elemento w del campione, viene indicata con j(w)
71
somma di tali logaritmi estesi a tutto il campione. Nel seguito, infatti, si dimostrerà che nel
caso della calibrazione disaggregata massimizzare le probabilità di tutte le scelte osservate
nel campione significa massimizzare la produttoria della singole probabilità di ogni scelta
osservata (tale produttoria prende il nome di verosimiglianza o likelihood) e che tale
operazione è equivalente a massimizzare la somma dei logaritmi delle probabilità delle
singole scelte osservate (logaritmo della likelihood).
In funzione dei parametri che massimizzano la likelihood le probabilità aggregate di scelta
modale al variare degli attributi (e quindi al variare, nel nostro caso, della coppia O/D)
possono essere comunque con notevole successo confrontate con le probabilità aggregate
ottenute dal campione:
Probabilità da Campione Probabilità da Modello in caso di calibrazione disaggregata
O/D
Auto Bus Piedi Auto Bus Piedi
1-2 10% 40% 50% 9% 50% 41%
1-3 90% 10% 0% 82% 18% 0%
2-1 100% 0% 0% 99% 1% 1%
2-3 90% 10% 0% 94% 4% 2%
3-1 80% 20% 0% 92% 8% 0%
3-2 0% 80% 20% 1% 73% 26%
In questo caso la somma degli scarti quadratici tra probabilità calcolate sul campione e
probabilità consegnate dal modello in seguito alla calibrazione disaggregata è pari a circa
0,07.
In termini riassuntivi, i risultati rispetto ai valori disaggregati (likelihood) ed aggregati
(somma degli scarti quadratici tra probabilità del modello e probabilità aggregate del
campione) dei due approcci sono riassunti nella seguente tabella.
Calibrazione likelihood ln(likelihood) Scarto quadratico %
Aggregata 5,25071E-13 -28,275242 0,0632
Disaggregata 7,46194E-13 -27,923790 0,0723
Da esse si vede che la calibrazione aggregata permette di ottenere scarti quadratici migliori
ma a scapito di una verosimiglianza minore, di converso la calibrazione disaggregata
permette di ottenere verosimiglianze migliori a scapito di scarti quadratici peggiori. In
generale, però, è possibile dire che calibrazioni disaggregate permettono di ottenere le
migliori verosimiglianze con risultati rispetto alle probabilità aggregate comunque buoni
(sub-ottimi). Spesso, invece, le calibrazioni aggregate associano a risultati ottimi in termini
di confronto di probabilità aggregate risultati mediocri in termini di verosimiglianza. Per
come è concepita, inoltre, è possibile dire che la calibrazione disaggregata è quella più
congruente con il modello comportamentale della teoria dell’utilità casuale. La calibrazione
72
aggregata, invece, tende a caratterizzare il modello ottenuto molto più in senso descrittivo
che non comportamentale.
Infine, occorre notare che spesso, però, la calibrazione aggregata anche se meno rigorosa
risulta più conveniente da un punto di vista pratico. È infatti possibile che siano disponibili
dati aggregati sulle percentuali di scelta dei decisori in un dato contesto di scelta e che quindi
sia possibile, nel caso di utilizzo di calibrazioni aggregate, evitare gli oneri di
campionamento e di intervista invece necessari per la calibrazione disaggregata.
Nel seguito, in ragione del suo più elevato tasso di congruità teorica, si formalizzerà, con
riferimento ad un caso generale, la sola metodologia relativa alla calibrazione disaggregata,
essa è nota in statistica come metodo della massima verosimiglianza.
In termini analitici il problema si può porre nel seguente modo:
βˆ = arg max L(β ), L(β ) = Õ p( j(w ), β) 38

wÎW
dove:
§ b è il vettore dei parametri modellistici, comprendente non solo i parametri di reciproca
sostituzione b ma anche le CSA ed il parametro del logit J (o tutti i parametri J del
logit multinomiale)
§ W è un insieme (di numerosità m) corrispondente ad campione di utenti intervistati,
rappresentativo dell’universo di decisori di cui si vogliono simulare i comportamenti;
§ w è il generico decisore tra quelli di cui si sono osservate le scelte;
§ j(w) è la scelta effettivamente osservata per il generico decisore w;
§ p(j(w), b) è la probabilità consegnata dal modello (che in fase di calibrazione è
funzione del solo vettore incognito dei parametri) di riprodurre la scelta osservata per
il generico decisore w;
§ Pwp(j(w), b) è la probabilità congiunta di riprodurre tutte le scelte osservate
(Likelihood);
§ β̂ è la soluzione del problema di calibrazione, cioè il vettore di parametri modellistici
che massimizza la likelihood.
In generale, invece di massimizzare la funzione di Verosimiglianza si massimizza il
logaritmo naturale di tale funzione; cioè comporta alcuni vantaggi di calcolo numerico1 ed è
un'operazione legittima, dato che la funzione logaritmo è una funzione strettamente
1
Essenzialmente, il logaritmo di un prodotto è pari alla somma dei logaritmi dei singoli fattori. Il problema si
trasforma dunque in quello di massimizzare una sommatoria (di termini tutti non positivi). Mentre la
funzione di verosimiglianza è tipicamente “piatta” e difficile da massimizzare, quella del logaritmo della
verosimiglianza è non-piatta e molto più agevole da massimzzare.
73
crescente e quindi il punto in cui la funzione ln(L(b)) assume il massimo coincide con quello
in cui lo assume la funzione L(b).
Nel caso in cui si stia calibrando un modello di tipo logit-multinomiale è possibile dimostrare
con considerazioni teoriche (non del tutto banali) che la funzione di verosimiglianza è una
funzione strettamente concava e quindi ammette un solo massimo globale. Nel caso si stia
calibrando un modello di tipo nested-logit, l'impostazione analitica del problema rimane la
stessa (variano, ovviamente, le formule per il calcolo delle probabilità di scelta – ed il vettore
b contiene i parametri di tutte le utilità sistematiche di tutti i livelli in cui si è considerata
gerarchizzata la scelta complessiva). Succede, però, in tale ultimo caso, che la funzione di
verosimiglianza non è più necessariamente una funzione concava; essa può presentare più
massimi locali ed occorre utilizzare opportuni accorgimenti numerici per assicurarsi di
ottenere il massimo globale della funzione stessa. Da un punto di vista operativo la
massimizzazione della funzione di verosimiglianza viene ottenuta attraverso opportuni
algoritmi di ottimizzazione quali, ad esempio, l'algoritmo di gradiente1.
Nel contesto del metodo di massima verosimiglianza appena descritto è il caso di fare alcune
precisazioni.
Anzitutto, nel precedente esempio relativo ad un semplice modello di tipo logit-
multinomiale, si è non casualmente incorporata la calibrazione del parametro J del modello
nel vettore b. Si noti, infatti, che la maniera utilizzata per calcolare l'utilità sistematica in
funzione degli attributi attraverso una combinazione lineare induce una particolarità del
modello logit che è facilmente verificabile:
æV ö
expç j ÷
" j Î I, p( j) = è Jø con Vj = å b k X jk Þ
æ V j' ö
åj' expçè J ÷ø k
Þ p( j) =
~
exp Vj ( ) ~ b ~
con Vj = å k X jk = å bk X jk
~
å exp Vj' ( ) k J k
j'
In altri termini, esiste una infinità di combinazioni di parametro J e vettore b che da luogo
esattamente alle stesse probabilità di scelta delle alternative. Ad esempio, con riferimento a
quanto finora utilizzato per illustrare la procedura di calibrazione, esattamente gli stessi
risultati, sia in termini di probabilità di scelta che di valore della likelihood, si sarebbero
ottenuti per un parametro J qualsiasi, diverso da quello implicitamente ipotizzato (J=1) ed
1 La trattazione di tali aspetti algoritmi, comunque, non è oggetto di questo modulo didattico.
74
in corrispondenza di un relativo vettore b ottenuto come b*(1/J). Ciò dimostra che la

calibrazione separata di b e J non è possibile. Il valore “vero” del J viene calibrato
congiuntamente con i b ed in essi (indistinguibilmente) inglobato. Ovviamente, nulla vieta
di immaginare unitario e quindi, convenzionalmente, di attribuire il significato di vettore b
a quello che in realtà è il vettore b/J. Ragionamenti equivalenti possono essere svolti nel
caso della calibrazione di un modello nested-logit; è possibile dimostrare che sono calibrabili
tutti i parametri J presenti nell’albero delle scelte ad eccezione di uno. Si può, dunque,
convenzionalmente supporre pari all'unità il parametro J0 associato alla radice dell'albero
delle scelte e calibrare i rimanenti valori J ed il vettore b relativo a tutti i livelli di scelta, I
valori di tali J e b ottenuti, in realtà, “scontano” l'avere ipotizzato noto il valore del J0 della
radice ed, in maniere diverse per ogni livello di scelta, ne inglobano (in modo indistinguibile)
il valore “vero”1.
È il caso di notare come le calibrazioni effettuate su un campione di utenti vengano poi estese
a tutto l’universo di utenti, avendo supposto i comportamenti del campione rappresentativi
di quelli dell’universo.
3.2.2 SPECIFICAZIONE
La fase di specificazione del modello, come già detto, consiste nell'identificarne

completamente la struttura matematica, cioè nel definirne il tipo (ad esempio logit-
multinomiale o nested-logit), nel definire la gerarachia delle scelte (nel caso nested-logit),
nel definire gli attributi di scelta per ogni alternativa disponibile2. Questa fase deve essere
svolta tentando di “indovinare” la struttura matematica che meglio rappresenta il fenomeno
reale. In generale è la sensibilità dell'analista che permette di specificare in maniera
opportuna un modello e non esistono metodi che permettano a priori di suggerire una buona
specificazione del modello. Solo a posteriori, dopo la calibrazione ed in funzione della fase
di validazione del modello, è possibile esprimere un giudizio sulla specificazione introdotta.
1 Una conseguenza immediata di tale ipotesi di assumere unitario il valore del J0 associato alla radice
dell'albero delle scelte è che tutti gli altri J calibrati devono essere minori dell'unità, oltre che decrescenti
muovendosi lungo l'albero in direzione delle foglie.
2 Come già osservato, ci si riferisce all'ipotesi di avere individuato una sola classe di utenti. Nell'ipotesi di
più classi la specificazione deve essere effettuata per ognuna di esse. In realtà, la individuazione delle classi
d'utenza è parte integrante della fase di specificazione, A tale scopo può essere d'aiuto una analisi di cluster
effettuata sui risultati dei comportamenti osservati degli utenti.
75
Se, infatti, la validazione non dà risultato favorevole, essendo la fase di calibrazione una
procedura matematica univoca, l’unica fonte di errore (ipotizzando corretto il campione) è
la specificazione.
Alcuni accorgimenti generali, comunque, devono sicuramente essere adottati. Non è
possibile, infatti, specificare modelli che presentino attributi di scelta cosiddetti collineari.
Nel seguito di questo paragrafo si presentano alcune classiche condizioni di collinearità che
devono essere evitate; esse, infatti, se si presentano, non permettono di calibrare in maniera
efficiente il modello.
In primo luogo, se il modello di scelta discreto associato al modello di domanda è (come è
sempre nella pratica) di tipo invariante, non è possibile introdurre costanti specifiche delle
alternative per tutte le alternative dell'insieme di scelta; se ne possono introdurre al massimo
in tutte le alternative di scelta meno una. Questa limitazione non è, in realtà, intrinseca ai
modelli invarianti; piuttosto, essa deriva dall'impossibilità di calibrare adeguatamente
modelli che introducano costanti specifiche per tutte le alternative. Infatti, con riferimento
al precedente esempio di calibrazione, sarebbe possibile verificare che, nel caso in cui si
introducesse una costante specifica per l'alternativa piedi (CSApiedi), tutte le soluzioni1
mostrate nella seguente tabella sarebbero equivalenti sia rispetto alle probabilità di scelta
date dal modello, sia, di conseguenza, al valore corrispondente della likelihood.
Auto Bus Piedi
Beta Ln(L)
Tbordo Costo Parch. CSA Auto Tbordo Tattesa Tpiedi Costo CSA Bus Tpiedi CSA Piedi
Caso 1 -1,221 -11,957 -26,237 4,4104 -1,221 -1,498 -1,829 -11,957 3,4104 -1,829 0 -27,92
Caso 2 -1,221 -11,957 -26,237 14,4104 -1,221 -1,498 -1,829 -11,957 13,4104 -1,829 10 -27,92
Caso 3 -1,221 -11,957 -26,237 1,4104 -1,221 -1,498 -1,829 -11,957 0,4104 -1,829 -3 -27,92
Più in generale, sarebbero equivalenti tutte le (infinite) soluzioni caratterizzate dagli stessi
valori dei parametri bbordo, bcosto, bparcheggio, battesa e bpiedi e valori qualsiasi delle costanti
specifiche, purché soddisfacenti le condizioni:
CSAauto-CSApiedi = 4.4104 e CSAbus-CSApiedi = 3.4104.
Questo fenomeno è dovuto al fatto che il modello utilizzato è di tipo invariante. Infatti, le
costanti specifiche sono valori sempre fissi nell'utilità sistematica, al contrario degli attributi
di scelta, la cui variazione determina la variazione del valore dell'utilità sistematica e la
possibilità di calibrare in funzione di essa il modello. Per le scelte osservate, dunque, le
costanti specifiche delle alternative contribuiscono all'utilità sistematica sempre nella stessa
maniera. Si considerino, dunque, le probabilità di scelta delle alternative in corrispondenza
1
Delle quali la prima, con CSAPiedi=0, è in pratica quella in cui la costante specifica per il modo piedi non era
stata introdotta.
76
di una qualsiasi osservazione; le probabilità sono invarianti rispetto alla soluzione in cui la
CSApiedi ha valore nullo se si aggiunge un qualunque valore alla CSApiedi e lo stesso valore
anche alle CSAauto ed alle CSAbus; infatti, in tale caso, si aggiungerebbe una stessa quantità
costante a tutte le alternative e, dunque, il modello invariante darebbe le stesse probabilità
di scelta e, soprattutto, la stessa probabilità di scegliere l'alternativa effettivamente scelta. In
più, tale fenomeno accade per tutte le probabilità di scelta delle alternative osservate, quindi
per la likelihood e quindi per la capacità complessiva del modello di rappresentare le scelte
effettivamente osservate. Essa risulta, dunque, invariante rispetto all'aggiunta di un
qualunque valore alla CSApiedi (inizialmente nulla) e dello stesso valore anche alle CSAauto
ed alle CSAbus. In altri termini, non è possibile calibrare contemporaneamente costanti
specifiche per tutte le alternative ma solo la differenza di tutte rispetto ad una presa a
riferimento, ne deriva che il modello deve essere specificato considerando delle CSA fittizie
i cui valori sarebbero ottenibili delle CSA “vere” a cui è stato sottratto il valore “vero” di
una di esse presa a riferimento; quest'ultima, quindi, nella specificazione e calibrazione del
modello, assume un valore fittizio nullo (perché sottratta a se stessa).
Allo stesso modo, si può ragionare per evidenziare la necessità di evitare nella specificazione
del modello (nel caso esso sia additivo) la presenza di qualunque quantità che sia costante
per tutte le alternative (e costante per tutte le scelte osservate su cui avviene poi la
calibrazione).
Altri accorgimenti per evitare fenomeni di collinearità nella specificazione degli attributi
(sempre in caso di modelli additivi) consistono nell'evitare di introdurre nelle utilità attributi
che possano essere linearmente dipendenti gli uni dagli altri.
3.2.3 VALIDAZIONE
Una serie di indicatori possono essere utilizzati per esprimere un giudizio sulla “bontà” del
modello specificato e calibrato. Alcuni di questi indicatori hanno una valenza qualitativa,
altri sono dei veri e propri test statistici1.
Un primo indicatore di “ragionevolezza” del modello specificato e calibrato riguarda il
“segno algebrico” dei parametri di reciproca sostituzione ottenuti. Dato che il modello di
scelta utilizzato nel modello di domanda è un modello comportamentale, i segni dei
1 Si suppone di trattare la validazione di un modello messo a punto per una sola classe di utenti. Nel caso di
più classi occorre validare il modello di scelta relativo ad ognuna di esse. Inoltre, un esito negativo della
validazione potrebbe essere anche dovuto alla errata individuazione delle classi d'utenza che, quindi, è una
delle ipotesi dell'analista che deve eventualmente essere modificata nella procedura complessiva (Trial-
and-Error) di specificazione, calibrazione e validazione.
77
parametri devono potere avere una corretta interpretazione comportamentale. Ad esempio

non è ragionevole che parametri che moltiplicano attributi “disutili” (ad esempio tempi e
costi di spostamento) abbiano valore positivo, in tale caso significherebbe che un aumento
di costo (generalizzato) di spostamento sarebbe visto dagli utenti come un incremento di
utilità, ciò non è ragionevole ed è sintomatico di una cattiva specificazione del modello
(tipicamente, in questi casi, mancano nella specificazione alcuni attributi esplicativi, o ne
vanno eliminati alcuni che sono distorcenti).
Un altro indicatore di qualità del modello è legato alla definizione stessa dei parametri b
come coefficienti di sostituzione reciproca. Il rapporto tra due b relativi a due diversi
attributi, infatti, è stato visto essere una misura della quantità necessaria dell'attributo il cui
b è a denominatore per sostituire, a parità di utilità, l'unità di attributo il cui coefficiente è a
numeratore. Ad esempio, se nel modello sono stati specificati quali attributi di scelta il tempo
ed il costo dello spostamento, il rapporto btempo/bcosto è stato detto essere il cosiddetto Valore
Monetario del Tempo. Se tale rapporto, sempre ad esempio, assume valori
ingiustificatamente bassi o elevati, occorre porsi il problema di avere male specificato il
modello.
Un altro indicatore di cattiva specificazione del modello potrebbe essere legato ai valori
assunti dalle costanti specifiche delle alternative. Se tali costanti assumono valori troppo
elevati, nel senso che da sole costituiscono parte preponderante del valore complessivo delle
utilità in cui sono inseriti, come già ampiamente discusso nel capitolo relativo ai modelli di
scelta discreta, può significare che errori sistematici sono stati introdotti nella specificazione
del modello. L'analista si troverebbe di fronte ad una costante specifica dell'alternativa che
non solo tiene conto dell'utilità (sistematica) “per sé” dell'alternativa stessa ma anche degli
errori modellistici effettuati nell'individuare il paradigma formale di comportamento del
decisore (cioè nella specificazione).
Un test statistico formale che viene sempre eseguito per validare la procedura di
specificazione e calibrazione dei coefficienti di reciproca sostituzione è quello di verificare
la cosiddetta “significatività” dei coefficienti stessi. La procedura di massimizzazione della
likelihood, infatti, può essere visto come un vero e proprio processo di stima statistica. Il test
di significatività consiste nel verificare che in tale procedura di stima non siano stati
erroneamente stimati dei coefficienti di reciproca sostituzione che avrebbero dovuto “nella
realtà” assumere valore nullo. Tale test è detto anche test t-Student sui singoli coefficienti.
Infatti è possibile dimostrare che, nel processo statistico corrispondente alla
massimizzazione della likelihood, l'ipotesi che un coefficiente di reciproca sostituzione sia
78
erroneamente stimato con un valore non nullo può essere verificato controllando una
variabile aleatoria di Student che deve risultare distribuita in maniera tale da avere alta
probabilità di assumere valori esterni ad un intervallo ben preciso (funzione della
accuratezza del test). Tutti i software di calibrazione dei parametri producono tali statistiche
di Student e l'analista deve verificare che per ogni parametro calibrato tale valore sia in
valore assoluto maggiore di 1.96 (che corrisponde ad una stima con un grado di accuratezza
del 95%, per un numero di scelte osservate su cui si esegue la calibrazione che sia
sufficientemente ampio1 da potere confondere la distribuzione di Student con la
distribuzione Normale).
Un'altra verifica che viene eseguita in maniera aggregata su tutto il vettore b dei coefficienti
calibrati è la verifica del rapporto di Verosimiglianza (Likelihood Ratio - LR). Tale test si
utilizza di solito per testare la “distanza” del vettore ottenuto dalla calibrazione da un vettore
di parametri tutti nulli. In tale caso occorre calcolare il valore della verosimiglianza che si
otterrebbe in corrispondenza di valori tutti nulli dei parametri b (quindi in corrispondenza di
alternative equiprobabili) e poi calcolare la quantità:
LR(0) = -2[ln(L(0)) - ln(L(β))]
È possibile dimostrare che tale quantità corrisponde nel processo di massimizzazione della
verosimiglianza ad una variabile aleatoria che, nell'ipotesi in cui il valore “vero” del vettore
b sia nullo (b=0), è distribuita con una distribuzione c2 con nb gradi di libertà (dove nb è il
numero di coefficienti di reciproca sostituzione stimati). Occorre, dunque, verificare che tale
rapporto di verosimiglianza assuma valori grandi abbastanza da rifiutare l'ipotesi nulla con
una buona probabilità. Tutti i software di calibrazione producono la statistica precedente e
l'analista deve verificare che essa assuma valori sufficientemente elevati.
Il rapporto di verosimiglianza può essere anche calcolato in corrispondenza dell'ipotesi di
volere testare che il valore “vero” sia quello con le sole costanti specifiche delle alternative.
In questo caso occorre calcolare il valore della likelihood in corrispondenza di soli valori
non nulli delle CSA e calcolare la quantità:
LR(CSA) = -2[ln(L(CSA)) - ln(L(β))]
In questo caso il rapporto di verosimiglianza, nell'ipotesi di sole CSA non nulle, è distribuito
come una variabile c2 con nb-nCSA gradi di libertà (dove nCSA è il numero di costanti
1
Bastano un centinaio di osservazioni, valore, questo, d’altra parte minore di quello necessario per assicurarsi
un campione sufficientemente significativo dell’universo i cui comportamenti si intendono simulare.
79
specifiche stimate). Come nel caso precedente occorre verificare che la precedente quantità
assuma valori sufficientemente elevati.
Un ulteriore test sulla qualità della calibrazione consiste nel calcolare la cosiddetta “bontà
dell'accostamento” (Goodness of Fit), essa è una misura (normalizzata nell'intervallo tra 0
ed 1) della capacità del modello di riprodurre le scelte effettuate dal campione di decisori
utilizzato per la calibrazione. Si può dimostrare che può essere calcolata come:
ln(L(β ))
r2 = 1 -
ln(L(0))
Occorre verificare che il suo valore sia il più possibile lontano dal valore nullo (in realtà, nei
casi pratici più frequenti, è sufficiente che tale rapporto assuma valori maggiori di 0.35,
0.40).
Nel caso di modelli di tipo nested-logit è, inoltre, possibile verificare le ipotesi fatte sulla
successione delle gerarchie di scelta. A tale scopo occorre verificare i risultati ottenuti dalla
calibrazione dei J, mano a mano che ci ci muove, infatti, verso le foglie dell'albero delle
scelte i valori di J devono decrescere, ove ciò non avvenisse potrebbe essere opportuno
scambiare di posto i livelli di scelta per cui si verifica l'inversione della decrescenza dei J.
Nel caso del modello logit-multinomiale, invece, è possibile utilizzare dei test statistici
appena un po' più complessi per verificare la bontà dell'ipotesi di indipendenza delle
alternative. In pratica è possibile utilizzare delle statistiche che individuano la presenza
all'interno delle scelte del campione utilizzato per la calibrazione del fenomeno della IIA
(Independence of Irrelevant Alternatives). Se tale proprietà non può ritenersi accettabile per
il campione vuole dire che l'avere specificato un modello di tipo logit-multinomiale non è
stata la scelta corretta.
In conclusione, la fase di validazione permette di valutare la bontà dei risultati ottenuti dalle
fasi di specificazione e calibrazione. Ove tale giudizio non fosse positivo, occorrerebbe
rispecificare (e ricalibrare) il modello in un processo di Trial-and-Error, come descritto nella
figura 13, fino a che la validazione non consegni un giudizio positivo.
80
3.3 I MODELLI PER LA STIMA DEI FLUSSI DI PERCORSO

Si definisce percorso una possibile alternativa d'utilizzo di una successione di elementi
infrastrutturali e/o di servizio del sistema di trasporto effettuata da utenti interessati a
compiere spostamenti (con certe caratteristiche) sulla rete di trasporto.
Il flusso che utilizza un percorso può essere stimato come la percentuale di utenti che, su una
coppia origine-destinazione (o/d), sceglie il percorso considerato tra tutti quelli (insieme
delle alternative di scelta) che collega la stessa coppia. In altri termini, il flusso di ogni
percorso è pari alla domanda di spostamento su una coppia o/d moltiplicata per la probabilità
che il percorso in esame sia scelto come alternativa di viaggio.
Il modello di scelta del percorso può essere scritto in maniera formale secondo
l'impostazione classica della teoria delle scelte discrete. Si indichi l'insieme dei percorsi
alternativi su una stessa coppia o/d come Ii = {1, 2, …, h, …}
Ad ogni percorso sia associata una utilità percepita, scomposta nel suo valore medio (utilità
sistematica) e nel residuo aleatorio.
" hÎI Uh = Vh + eh = -wh + eh 39
Nella precedente relazione con wh si è indicato l'opposto dell'utilità sistematica relativa alle
scelte di itinerario. Tale utilità, infatti, assume sempre un valore negativo e dunque si
preferisce introdurre il costo di itinerario, definito appunto come opposto dell'utilità
sistematica ed avente valore positivo. Inoltre, il costo di un percorso ha una diretta
interpretazione intuitiva. Si intende, ovviamente un costo generalizzato, composto da varie
voci di costo (che sono altrettanti attributi di scelta, per esempio: tempo speso sul percorso;
suo costo tariffario; costo monetario del carburante; ecc.).
Il decisore è un decisore razionale e tende dunque a scegliere in modo da massimizzare
l'utilità percepita o, se si preferisce, a minimizzare il costo percepito, somma del costo
(sistematico) e del residuo aleatorio:
" hÎIi p(h) = Pr[wh + eh = minhÎI (wh’ + eh)] 40
" hÎIi p(h) = Pr[wh + eh < wh’ + eh’ " h’ÎIi, h’≠h] 41
" hÎIi p(h) = Pr[wh - wh’ < eh’ - eh " h’ÎIi, h’≠h] 42
Supposti noti i costi, la individuazione della legge di distribuzione del residuo aleatorio
permette di definire compiutamente le probabilità di scelta dei percorsi. A tale proposito, la
distribuzione più frequentemente utilizzata è la Normale Multivariata, che conduce al
modello di tipo Probit. È infatti facile immaginare che, nel caso della scelta di percorso, le
alternative sono ben difficilmente indipendentemente distribuite. Considerazioni
81
algoritmiche ed evidenze modellistiche, inoltre, portano a preferire modelli di tipo Probit a

quelli di tipo logit gerarchizzati1.
Non è raro, nelle applicazioni pratiche, che si ricorra a modelli di tipo deterministico invece
che aleatorio. In tale caso l'espressione formale delle probabilità di scelta è:
p(h) >0 Þ wh £ wh’ " h’ÎIi 43
Si noti che l'implicazione inversa non è vera, giacché nulla esclude, in un modello
deterministico, che percorsi pure di costo minimo non vengano utilizzati2. Mentre per
l'approccio aleatorio, dunque, il vettore delle probabilità di scelta dei percorsi è una funzione
dei costi, nel caso deterministico, invece, p=p(-wi) è, come già detto, in genere una mappa a
più valori.
Una volta calcolato il vettore delle probabilità di scelta dei percorsi è possibile utilizzare tale
vettore per calcolare i flussi di percorso.
Detto di il flusso di domanda della i-esima coppia o/d e detto pi il vettore di probabilità di
scelta dei percorsi che uniscono tale coppia (insieme di scelta Ii) è possibile scrivere:
hi = di pi 44
dove con hi si è indicato il vettore dei flussi di percorso della i-esima coppia origne-
destinazione.
1 Negli ultimi anni sono stati messi a punto, proprio a partire dai modelli per il calcolo dei flussi di itinerario
delle particolarizzazioni dei modelli della famiglia Logit, noti come modelli C-Logit. Il loro studio,
comunque, esula dagli scopi di questo modulo didattico.
2 Ciò avviene, in particolare, nel caso in cui vi siano più percorsi di costo minimo. Non è possibile dire, da
modello, quali di questi viene scelto o, nel caso in cui ne venga scelto più di uno, come si ripartiscono i
diversi utenti tra quelli scelti.
82
L’OFFERTA DI TRASPORTO
4 L’OFFERTA DI TRASPORTO
4.1 INTRODUZIONE
I modelli (analitici) di offerta per i sistemi di trasporto sono finalizzati alla descrizione
astratta (attraverso un insieme congruente di relazioni matematiche) delle opportunità di
spostamento offerte da un sistema di trasporto (considerato come l'insieme delle
infrastrutture fisiche, dei servizi di trasporto che su di esse insistono, delle regole
organizzative e normative e delle prestazioni che derivano anche dall'interazione con gli
utenti che ne usufruiscono). La determinazione, all'interno del sistema di trasporto “reale”
delle parti (infrastrutturali e funzionali) di interesse per l'analista (e quindi soggette alla
modellizzazione) è una astrazione logica che, come già detto, concorre alla determinazione
del “sistema” oggetto delle analisi.
Una volta individuate le infrastrutture e le funzioni da sottoporre a modellizzazione, scopo
della operazione logica di astrazione del modello di offerta è quello di individuarne anzitutto
le caratteristiche salienti e le funzioni che occorre sottoporre ad una esplicita descrizione
formale. Occorre, altresì, individuare le modalità e gli strumenti con cui tali caratteristiche
salienti devono essere formalmente descritte. È il caso di sottolineare, infatti, che uno stesso
sistema di trasporto (individuato sia nelle infrastrutture che nelle funzioni, sia nei servizi che
nelle regole da sottoporre a modellizzazione) è suscettibile di diverse rappresentazioni
analitiche a seconda delle caratteristiche salienti scelte per la modellizzazione e delle
modalità di formalizzazione che si utilizzano. Ad esempio, avendo individuato che la
funzione del trasporto con la modalità individuale (auto) dei passeggeri all'interno di un certo
territorio afferisce alle funzioni da includere all'interno del sistema oggetto dell'analisi (e che
a tale fine è rilevante un certo numero di infrastrutture e servizi), una delle caratteristiche
che si può intendere modellizzare potrebbe essere la velocità con cui i veicoli riescono a
muoversi all'interno del sistema stesso, mentre l'accelerazione degli stessi veicoli, sempre ad
esempio, potrebbe non essere considerata tra le caratteristiche rilevanti per la
modellizzazione. Inoltre, le funzioni analitiche con cui modellizzare la caratteristica della
velocità dei veicoli potrebbero essere in vario modo scelte. È evidente, dunque, che uno
stesso sistema (di offerta) di trasporto può essere rappresentato da modelli di offerta
differenti, più o meno opportuni a seconda delle finalità dell'analista.
In generale, un modello di offerta di trasporto dovrebbe essere formalizzato in modo che
risultino simulabili sia le proprietà intrinseche del sistema stesso, sia la maniera in cui il
funzionamento del sistema è influenzato dall'utilizzo che gli utenti ne fanno. Le proprietà
83
del primo tipo potrebbero essere chiamate proprietà intrinseche del sistema, quelle del
secondo tipo potrebbero essere definite come proprietà esposte. Proprietà intrinseche al
sistema potrebbero, ad esempio, essere riferite alla capienza (o capacità) degli elementi dei
servizi di trasporto offerti, oppure ad elementi tecnologici (e/o normativi) quali, ad esempio,
le velocità massime ottenibili (e/o consentite) sugli elementi infrastrutturali e/o del servizio
offerto. Proprietà esposte del sistema potrebbero essere le velocità che si riescono
effettivamente a realizzare sugli elementi infrastrutturali (e/o di servizio offerto) in funzione
della reciproca interazione tra gli utenti che ne usufruiscono (basti pensare a quella che,
comunemente, nel linguaggio familiare, viene indicata come congestione stradale).
Un modello di sistema di trasporto può essere di tipo continuo, di tipo discreto o di tipo
misto. La continuità può essere riferita, in generale, all'insieme di definizione oppure ai
valori assunti dalle variabili utilizzate per la modellizzazione. Nel nostro caso definiremo
come continuo un modello in cui tutte le caratteristiche modellizzate sono individuate
attraverso variabili esplicative definite su un dominio continuo, indipendentemente dai
valori continui o discreti che esse possono assumere. Evidentemente un modello di tipo
discreto sarà un modello in cui le variabili che ne definiscono la rappresentazione analitica
sono tutte definite su un dominio discreto mentre un modello misto utilizza per la descrizione
analitica del sistema sia variabili definite su domini discreti che variabili definite su domini
continui. I modelli di offerta di solito utilizzati sono modelli di tipo misto. Esistono casi
particolari di modelli di tipo completamente discreto mentre la modellizzazione continua di
un intero sistema d'offerta di trasporto (e non di un solo elemento dello stesso) ben
difficilmente è stata affrontata. La tipologia di variabili che più difficilmente si presta ad una
modellizzazione continua, infatti, è quella relativa alla topologia (cioè alla forma) del
sistema. La descrizione topologica del sistema, infatti, deve essere effettuata sia rispetto ai
singoli elementi infrastrutturali (e di servizio) che compongono il sistema, sia rispetto alle
relazioni tra tali entità. Mentre la prima esigenza può essere soddisfatta attraverso l'utilizzo
di variabili continue (e tale rappresentazione è tutt'altro che rara), la seconda è generalmente
affrontata con grandezze di tipo discreto, giacché le relazioni topologiche tra elementi del
sistema sono intrinsecamente discretizzabili. Ciononostante, non è superfluo sottolineare che
ciò a cui ci riferiamo è il modello di offerta di trasporto, cioè la rappresentazione di una
realtà fisica che è per definizione caratterizzata, almeno, dalla intrinseca continuità dello
spazio fisico su cui il sistema insiste e dal fatto che il tempo è una grandezza anche essa
continua per definizione. È anche opportuno ricordare, in questa sede, che stiamo definendo
il modello analitico di rappresentazione, indipendentemente da come poi (ed è tutt'altro
84
problema, di tipo tipicamente algoritmico) questo modello sarà maneggiato da un punto di

vista risolutivo e cioè con l'impiego di strumenti di calcolo elettronico la cui “matematica”
è, per natura, discreta e finita.
Nella seguente figura 14 è mostrata la rappresentazione visiva d'una porzione di un generico
sistema di trasporto (in questo caso una parte del sistema stradale urbano della città di
Napoli).
In linea teorica sarebbe possibile formalizzare un modello di tipo continuo per la descrizione
analitica di tale rappresentazione. Ad esempio (ma si consideri quanto segue un mero gioco
di formalizzazione, senza alcuna pretesa di completezza e/o rigore scientifico), si ipotizzi di
potere studiare il sistema con riferimento ad una sua proiezione su un piano orizzontale, su
cui sia stato fissato un opportuno sistema di riferimento cartesiano. Inoltre, si immagini di
fissare una scala temporale di riferimento. Le grandezze descrittive dell'offerta di trasporto,
in questa rappresentazione continua, potrebbero essere definite rispetto ad un campo spaziale
(x,y), la cui configurazione evolve nel tempo (t). Una delle proprietà (intrinseche) ritenute
significative per il modello d'offerta potrebbe essere per ogni punto del dominio spazio-
temporale (x,y,t) una grandezza vettoriale che rappresenti la presenza (o meno) della
possibilità di spostamento s(x,y,t).
Figura 14 – Porzione di un sistema d'offerta

Tale grandezza vettoriale potrebbe essere caratterizzata rispetto a due componenti principali
(sx(x,y,t) ed sy(x,y,t)) che permettono di individuare anche la direzione in cui è possibile lo
85
spostamento (nel punto di coordinate x, y ed al tempo t). Il valore del modulo assunto dalla
grandezza s potrebbe essere una misura, ad esempio, della quantità di servizio disponibile
per effettuare lo spostamento. In ogni punto del dominio spazio-temporale potrebbe essere
anche definita (proprietà esposta del modello di offerta) la quantità di utenti presenti nel
sistema (o meglio, la densità in quel punto – ed in quel tempo – di utenti presenti), essa
potrebbe essere una grandezza scalare: r(x, y, t). Ancora, in ogni punto del dominio spazio
temporale potrebbe essere definita la velocità con cui il servizio di trasporto è in grado di
trasportare utenti, tale grandezza potrebbe essere di tipo vettoriale (con direzione analoga
alla grandezza s definita nello stesso punto del dominio spazio-temporale) e potrebbe essere
caratterizzata dalle due componenti principali ( vx(x,y,t), vy(x,y,t) ). Tale velocità, inoltre,
potrebbe essere dipendente dalla densità d'utenti nel punto (e nell'istante) considerato,
giacché una maggiore densità di utenti potrebbe fare abbassare le prestazioni del servizio
(v(x,y,t)=fV(r(x,y,t)). Oppure, complicando un po' la rappresentazione del fenomeno, allo
scopo di potere avere un modello più aderente alla realtà, si potrebbe pensare che la velocità
sia una grandezza dipendente non dalla densità di utenti puntuale, ma da quella in un
opportuno insieme spaziale e temporale (ad esempio tutti gli utenti che utilizzano la stessa
infrastruttura elementare di trasporto in un certo intervallo di tempo):
t
v(x, y, t ) = ò òò r(x, y, t ) × dx dy dt
t - Dt A ( x , y )
dove A(x,y) è l'opportuno intorno spaziale del punto (x,y) che ne influenza la velocità.
Evidentemente, molte altre grandezze dovrebbero essere definite per una rappresentazione
compiuta, così come dovrebbero essere definite tutte le (non banali) relazioni che legano
tali variabili all'interno del dominio spazio-temporale di definizione. La variazione della
densità di utenti, ad esempio, nello spazio e nel tempo, non può che essere funzione sia
della disponibilità e della capacità di trasporto dei servizi offerti che della velocità di
trasporto degli stessi (a sua volta funzione della densità). Analogamente dovrebbero essere
attentamente definiti i valori, ad esempio spaziali, che le variabili possono assumere in
parti del dominio in cui non è mai possibile spostarsi (ad esempio una porzione di spazio in
cui non vi sono strade né altri servizi di trasporto di tipo collettivo); il modello ha una sua
congruenza esterna rispetto alla realtà se, in tali parti, le densità, le velocità e la presenza
del servizio assumono costantemente valori nulli; ha una congruenza interna rispetto a se
stesso se le relazioni definite tra le varie variabili non possono in alcune modo indurre tali
caratteristicamente ad assumere valori non nulli dove, invece, tali dovrebbero essere.
86
Evidentemente la precedente non vuole essere la descrizione compiuta (né rigorosa, anzi è
volutamente parziale ed incongruente) di un modello di tipo assolutamente continuo per la
offerta di trasporto. Anche perché un tale tipo di modello non solo non è mai stato sviluppato
ma sarebbe anche assai complesso da sviluppare.
Nelle successive figure 15 e 16 è invece rappresentato, sempre visivamente, il modello
topologico discreto (grafo) che si è soliti utilizzare per la rappresentazione analitica di un
sistema d'offerta.
Figura 15 - Porzione di un sistema d'offerta con grafo sovrapposto
I sistemi di trasporto sono generalmente rappresentati dal punto di vista del modello d'offerta
ricorrendo agli strumenti dei grafi (e delle reti). Infatti, occorre sottolineare come l'offerta di
trasporto sia in qualche modo intrinsecamente una rete, formata da elementi (infrastrutture)
che possono essere considerati puntuali (ad esempio gli incroci) ed elementi di tipo lineare
(ad esempio una strada, o una tratta ferroviaria) che si integrano, appunto, in una struttura di
rete. È indicatore di tale natura il fatto stesso che anche nel linguaggio familiare, non tecnico,
quella dei trasporti viene spesso indicata appunto come rete (così come si è adusi riferirsi ad
altri sistemi quali le reti elettriche, le reti idriche, le reti di calcolatori che, anch'essi, sono
intuitivamente percepiti, appunto, come delle reti, al di là del modello formale con cui
vengono rappresentate).
87
Figura 16 – Rappresentazione del solo Grafo
Gli aspetti formali di descrizione del modello d'offerta attraverso una rappresentazione
analitica “a grafo” (e poi “a rete”) saranno approfonditi nel prossimo paragrafo. A tale
rappresentazione ci riferiremo nel prosieguo della trattazione, pur non essendo questa l'unica
possibile. È anche opportuno sottolineare, a scanso di equivoci, che l'illustrazione di nodi ed
archi (anche questi concetti, per ora lasciati alla loro significato comune ed intuitivo, per poi
introdurli e formalizzarli in seguito) riportata nella figura 16 non è “il grafo”, ne è soltanto
una sua illustrazione.
4.2 FORMALIZZAZIONE DEL MODELLO DI OFFERTA

La formalizzazione del modello di offerta che sarà descritta in questo capitolo utilizzerà
ampiamente elementi derivati dalla teoria dei grafi e delle reti. Per la formalizzazione,
inoltre, di alcune delle proprietà esposte del modello d'offerta si farà riferimento, senza
entrarne nel merito, ai risultati della Teoria del Deflusso, branca tradizionale (e caratterizzata
da autonoma dignità) della Ingegneria dei Trasporti.
Il modello di offerta consta anzitutto di un modello topologico del sistema. Su tale
rappresentazione si costruiscono, poi, alcune componenti modellistiche il cui insieme forma
il modello di offerta. Il modello topologico viene in genere costruito attraverso l'utilizzo di
un grafo, composto di nodi ed archi. Le componenti modellistiche su di esso definite sono:
88
§ il modello di calcolo dei costi di arco;

§ il modello di calcolo dei costi di itinerario;
§ il modello di propagazione del flusso.
4.2.1 IL MODELLO TOPOLOGICO (IL GRAFO)
Il modello topologico del sistema di trasporto consiste nell'individuazione delle componenti

elementari del sistema e nella descrizione del modo in cui esse sono reciprocamente
collegate. L'offerta di trasporto è ciò che consente agli utenti di utilizzare le infrastrutture ed
i servizi in modo da soddisfare la propria domanda di trasporto. Sono dunque gli elementi
(fisici ed astratti) che permettono il realizzarsi degli spostamenti degli utenti. Da tale
definizione è opportuno partire per l'individuazione delle componenti elementari di un
modello d'offerta di trasporto. Tali componenti, infatti, possono essere definite come fasi
elementari di un potenziale spostamento durante le quali tutte le caratteristiche che
definiscono la modalità d'esecuzione dello spostamento stesso possono essere con buona
approssimazione ritenute dall'analista costanti ed omogenee in valore medio1. Ad esempio,
se le velocità (medie) consentite dal sistema sono considerabili costanti per una determinata
fase di un potenziale spostamento, essa può essere ritenuta una fase elementare. Similmente,
una fase di spostamento (potenziale) in cui la capacità di trasporto sia costante può essere
una fase elementare. Ovviamente una fase è elementare se possono essere ritenute
contemporaneamente costanti in valore medio tutte le caratteristiche con cui possono
(potenzialmente) avvenire gli spostamenti.
Tali fasi elementari, riferite e tutti i possibili spostamenti che possono avvenire in un sistema
di trasporto si dicono archi (o rami). Le soluzioni di continuità tra fasi elementari
definiscono i nodi, che possono essere quindi visti come gli inizi e le fini delle fasi elementari
degli spostamenti e quindi come gli estremi iniziali e finali degli archi.
Si noti che le definizioni ora date sono più generali ed astratte di quelle intuitive spesso
sottointese nella descrizione dei modelli di trasporto. Ad esempio, la tipica identificazione
dei rami e dei nodi di un grafo stradale con i tronchi di strade compresi tra due successive
intersezioni può essere compatibile con le definizioni date che, però, possono essere
facilmente verificate anche rispetto ad altre interpretazioni che di nodi ed archi vengono date,
ad esempio, per i sistemi di trasporto collettivi e/o per i sistemi ferroviari.
1 Tale omogeneità si intende originata da caratteristiche intrinseche dell'offerta di trasporto e non dovuta al
risultato delle modalità di utilizzo da parte degli utenti, che dovrebbero, in linea di principio, potere essere
considerate “qualsiasi”.
89
Gli insiemi dei nodi e degli archi (che sono, evidentemente, elementi tra loro congruenti per
definizione) nella teoria dei grafi definiscono, appunto, un grafo:
G=(N,L) 45
§ G = Grafo
§ N= insieme dei nodi;
§ L= insieme degli archi.
I nodi, nei grafi di trasporto possono essere utilizzati per individuare gli archi. Ogni arco, in
altri termini, può essere identificato attraverso un nome attribuito al suo inizio (nodo iniziale)
ed alla sua fine (nodo finale). Gli archi che si utilizzano nella rappresentazione dei sistemi
di trasporto sono sempre archi orientati (e quindi i grafi di trasporto si dicono orientati), nel
senso che l'arco avente come inizio il nodo i e come fine il nodo j è sempre considerato
distinto dall'arco avente come inizio il nodo j e come fine il nodo i.
Se, ad esempio, gli elementi del modello di offerta individuati e le loro interconnessioni sono
quelle rappresentate dalla seguente figura 17, il grafo è formato dai seguenti insiemi:
G=(N,L)
N= {1, 2, 3, 4, 5, 6};
L= {(1,3), (2,4), (3,4), (4,3), (4,6), (5,1), (5,3), (5,6), (6,5), (6,2)}
3 4
1 2
5 6
Figura 17 – Grafo di esempio
Sono possibili rappresentazioni analitiche della topologia dei grafi di più agevole trattazione
di quella legata alla definizione. Un esempio di esse è la cosiddetta matrice di Adiacenza
nodi/nodi. Il generico elemento (i, j) di essa assume valore unitario nel caso in cui esista
l'arco avente come inizio il nodo i e come fine il nodo j, assume valore nullo altrimenti. Nel
caso dell'esempio precedente tale matrice risulta essere:
é0 0 1 0 0 0ù
ê0 0 0 1 0 0úú
ê
ê0 0 0 1 0 0ú
ADN = ê ú
ê0 0 1 0 0 0ú
ê1 0 1 0 0 0ú
ê ú
êë0 1 0 0 1 0úû
90
Una rappresentazione analitica più compatta ed assai più spesso utilizzata è quella della
cosiddetta Forward-Star (FWS). La Forward-Star di un generico nodo i è un insieme
contenente tutti i rami aventi come inizio il nodo i (quindi “uscenti” dal nodo i):
" iÎN, FW(i) = {(i,j): (i,j) Î L, "jÎN)} 46
La Forward-Star dell'intero grafo si ottiene unendo le Forward-Star di tutti i nodi del grafo.
Per l'esempio precedente le Forward-Star che rappresentano il grafo sono:
FW(1) = {(1,3)}
FW(2) = {(2,4)}
FW(3) = {(3,4)}
FW(4) = {(4,3), (4,6)}
FW(5) = {(5,1), (5,3), (5,6)}
FW(6) = {(6,2), (6,5)}
La Fw-Star dell’intero grafo può essere indicata come:

n a =6
FW = ! FW (i)
i =1
Molto usata è anche la rappresentazione cosiddetta Backward-Star (BWS). La Backward-

Start di un generico nodo i è un insieme contenente tutti i rami aventi come fine il nodo i
(quindi “entranti” in i):
" iÎN, FW(i) = {(j,i): (j,i) Î L, "jÎN)} 47
Per l'esempio precedente la Backward-Star è:

BW(1) = {(5,1)}
BW(2) = {(6,2)}
BW(3) = {(1,3), (4,3), (5,3)}
BW(4) = {(2,4), (3,4)}
BW(5) = {(6,5)}
BW(6) = {(4,6), (5,6)}
La Backward-Star dell'intero grafo è l'insieme delle Backward-Star di tutti i nodi del grafo.
Ovviamente il contenuto informativo di una rappresentazione tramite FW-Star o BW-Star è
assolutamente identico. È, altrettanto ovviamente, possibile costruire la BW-Star se è nota
91
la FW-Star o viceversa. L’una o l’altra vengono preferite in funzione di contingenti comodità

operative ed algoritmiche.
In generale, per semplicità di notazione, si preferisce associare ad ogni arco un indice
univoco che ne permette una identificazione alternativa a quella effettuata attraverso il suo
inizio e la sua fine. Per il grafo di esempio si potrebbe utilizzare la corrispondenza:
Indice di Ramo Nodi Iniziale e Finale

1 (1,3)
2 (2,4)
3 (3,4)
4 (4,3)
5 (4,6)
6 (5,1)
7 (5,3)
8 (5,6)
9 (6,2)
10 (6,5)
Ne consegue che:
a º (inizio(a), fine(a))
dove:
§ a = indice di un generico ramo della rete;
§ inizio(a) = estremo iniziale dell'arco a;
§ fine(a) = estremo finale dell'arco a.
4.2.2 IL MODELLO DI CALCOLO DEI COSTI DI ARCO
Ad ogni componente elementare del modello di offerta (arco del grafo) può essere associata
una componente quantitativa (detta costo) che rappresenta la disutilità recepita dagli utenti
nell'effettuare la fase dello spostamento che l'arco rappresenta (e nel passare da tale fase alla
fase successiva dello spostamento). Un grafo ai cui archi siano stati associati tali costi è un
grafo pesato o rete. L'aliquota di disutilità associata a ciascuna fase dello spostamento (a
ciascun arco) può essere composta da diverse voci. Alcune di queste possono essere dei costi
monetari, altre possono rappresentare il tempo speso per compiere quella fase dello
spostamento, ecc. Le diverse componenti del costo prendono il nome di attributi di costo. In
generale, dunque, ad ogni arco è possibile associare una serie di attributi di costo ed il costo
dell'arco è l'insieme di tali attributi. In termini formali:
" aÎL, costoa=[xa1, xa2, …] 48
dove con:
§ costoa si è indicato il costo del generico ramo a;
92
§ xa,k il generico attributo di costo del generico ramo a.

Si preferisce supporre che il costo del ramo possa essere espresso come una opportuna
combinazione lineare degli attributi di costo1. In termini formali:
"a Î L, ca = å b w xa , k 49
k
dove:
§ bk è un coefficiente di reciproca sostituzione che permette di convertire tutti gli attributi
di costo in grandezze adimensionali (ogni coefficiente è dunque espresso in unità di
misura che sono l'inverso di quelle dell'attributo di costo che moltiplica) che si suppone
possano essere sommate per ottenere il costo associato all'arco2; ne consegue che il
costo di arco può essere considerato una grandezza scalare ed adimensionale.
Il vettore costituito dai costi associati a tutti i rami della rete (c) prende il nome di vettore
dei costi di arco ed i vettori costituiti dagli attributi di costo di tutti i rami della rete (xw)
prendono il nome di vettori degli attributi di costo di arco. Vale, dunque, la relazione
vettoriale:
c = å bk xk = x × β 50
k
dove si è , inoltre, indicato con:

§ x la matrice degli attributi di costo di arco, avente un numero di righe pari al numero
di archi della rete ed un numero di colonne pari al numero di attributi considerati ed il
cui generico elemento xa,k è il valore assunto dal k-esimo attributo di costo per l'a-
esimo ramo della rete;
§ b il vettore colonna di dimensioni pari al numero di attributi di costo considerati, il cui
generico elemento bk è il valore del coefficiente di reciproca sostituzione relativo
all'attributo k.
In generale gli attributi di costo associati agli archi dovrebbero essere considerati delle
grandezze aleatorie. Uno stesso utente, infatti, che effettui più volte uno stesso spostamento,
rispetto ad una qualunque fase di esso, ben difficilmente recepirà gli stessi attributi di costo,
sia perché molti di essi sono delle grandezze intrinsecamente aleatorie (basti pensare al
1 I costi degli archi saranno utilizzati per determinare i costi degli itinerari, introdotti nel capitolo precedente.
Questi ultimi sono le disutilità del modello di scelta preventivo e, quindi, per ogni itinerario, devono essere
delle grandezze scalari.
2 Tale ipotesi sottointende la compensatorietà degli attributi di costo. Esiste cioè sempre una opportuna
quantità per un certo attributo di costo che è equivalente (attraverso il rapporto dei coefficienti di reciproca
sostituzione) ad una quantità unitaria di un altro degli attributi di costo. Ad esempio, una certa quantità di
tempo speso per effettuare la fase dello spostamento rappresentata dall'arco può essere compensata da
un'opportuna altra quantità di denaro.
93
tempo impiegato per compiere una certa fase dello spostamento), sia perché potrebbe ogni
volta percepirli (stimarli) in maniera diversa, sia, infine, perché più utenti che compiono una
stessa fase dello spostamento sono sicuramente caratterizzati da una dispersione del modo
in cui percepiscono gli attributi di costo. Le grandezze precedentemente introdotte (costi ed
attributi di costo) devono, dunque, essere considerate come i valori medi delle relative
grandezze aleatorie.
In generale gli attributi di costo relativi ad una fase di viaggio (arco) potrebbero non essere
indipendenti (in valore medio) rispetto alle condizioni in cui la fase del viaggio avviene. In
particolare, ci si vuole qui riferire al fenomeno per cui l'offerta di trasporto è quasi sempre
caratterizzata da un limite superiore (capacità) alla quantità di servizio di trasporto che è
intrinsecamente in condizioni di offrire. Al crescere del numero di utenti che, in un
determinato periodo di riferimento, usufruisce del servizio, progressivamente, quindi, che si
tende a raggiungere il limite superiore di capacità offerta, scade la qualità del servizio stesso
o, in altri termini, aumenta il costo generalizzato degli utenti nell'usufruirne. Ad esempio, è
esperienza comune che all’aumentare del numero di veicoli che, contemporaneamente,
chiedono di impegnare un tratto di una infrastruttura stradale, diminuisce la velocità con cui
gli stessi riescono a defluire sull'infrastruttura stessa, aumenta, dunque, il tempo impiegato
per spostarsi ed aumenta, di conseguenza, il costo generalizzato di trasporto relativo a quella
fase del viaggio. Un siffatto fenomeno prende il nome di congestione ed è definito come il
fenomeno per cui il costo di trasporto sugli archi della rete dipende dalla quantità di utenti
che, in un certo periodo di riferimento, usufruisce degli archi stessi. Una rete caratterizzata
da archi che risentono del fenomeno della congestione si dice rete congestionata. A volte la
crescita del costo di trasporto con l’aumento del numero di utenti che ne vogliono fruire può
essere un fenomeno non intrinseco alla rete e dipendente dalla sua capacità ma un fenomeno
volutamente indotto da chi controlla la rete. È sempre meno raro ricorrere a politiche di
controllo della circolazione che impongano per l'utilizzo della rete stradale delle tariffe
(road-pricing) che non sono costanti ma che dipendono dalla quantità di utenti che
usufruiscono del servizio. Ad esempio, è possibile utilizzare dei sistemi di esazione per
l'utilizzo di particolari arterie stradali (anche in ambito urbano) che sono crescenti con il
numero di utenti in quel momento presenti nel sistema sottoposto a tariffazione. In questo
modo si tende a mantenere sotto controllo costante la qualità, in termini di tempo di
percorrenza o di inquinamento generato sulla tratta stradale, del servizio sottoposto a
tariffazione, offrendo agli utenti una buona qualità di deflusso in cambio della disponibilità
94
a pagare; in altri termini si mantiene un equilibrio compensatorio tra il costo monetario di

percorrenza di alcune infrastrutture stradali ed il tempo impiegato per percorrerle.
In ogni caso, quello che conta è che, sia che si tratti di congestione intrinseca, sia che si tratti
di politiche di controllo del deflusso, occorre esplicitare la legge di dipendenza dei costi dei
rami della rete rispetto al numero di utenti che, in periodo di riferimento, ne usufruiscono.
In termini formali:
c=c(f) 51
dove con:
§ f si è indicato il vettore dei flussi di arco, cioè l'insieme ordinato dei flussi relativi ad
ogni arco della rete, definendo come flusso del generico arco a (fa) il numero di utenti
che impegnano l'arco1 in un periodo di riferimento predeterminato;
§ c(f) la legge di dipendenza tra il vettore dei costi di arco ed il vettore dei flussi di arco,
tale legge di dipendenza si dice modello di congestione e la sua specializzazione per
ogni arco (ca(f)) prende il nome di funzione di costo dell’arco.
Per la congestione indotta da chi esercisce il sistema tali leggi di dipendenza sono una scelta
di politica di controllo e sono, dunque, per definizione note all'analista (che spesso, anzi, le
utilizza come variabile di progetto del sistema). Nel caso, invece, della congestione
intrinseca e dipendente dalla capacità di servizio del sistema di offerta occorre studiare tali
leggi di dipendenza, ad esempio attraverso la teoria del deflusso.
In particolare, dalla teoria del deflusso è possibile individuare le leggi con cui il tempo di
utilizzo del sistema di offerta, relativamente ad una generica fase dello spostamento (arco),
dipende dal flusso (o dai flussi) e quindi come uno degli attributi di costo contribuisce alla
dipendenza funzionale espressa dalla precedente relazione 51. La dipendenza dei tempi dai
flussi per ogni arco definisce le cosiddette funzioni di ritardo, che dunque contribuiscono
alla definizione delle funzioni di costo. La teoria del deflusso viene generalmente studiata in
maniera diversa in corrispondenza di diversi tipi di infrastrutture (o tratti di infrastrutture)
che contribuiscono a determinare l'offerta di servizio di trasporto. Ad esempio, esiste una
teoria del deflusso ininterrotto ed una teoria del deflusso alle intersezioni. Inoltre, per ogni
tipo di elemento infrastrutturale esistono diversi tipi di approccio analitico allo studio del
deflusso: approcci di tipo analogico, approcci basati su leggi di tipo macroscopico,
mesoscopico o microscopico. Perché i risultati della teoria del deflusso possano essere
1
Il modello che si sta sviluppando vale per sistemi in condizioni stazionarie; ci si riferisce, dunque, ad una
qualunque sezione dell’arco e ad un qualunque istante di tempo. In condizioni stazionarie, infatti, il flusso
è indipendente dal tempo e identico in tutte le sezioni dell’arco.
95
utilizzati nell'ambito della rappresentazione delle reti (si ricordi sempre che si sta discutendo
la simulazione di un sistema in contesto stazionario), occorre che le funzioni di ritardo messe
a punto abbiano le seguenti caratteristiche:
§ devono potere essere riferite esclusivamente agli archi1;
§ devono avere proprietà teoriche2 tali che:
• il modello di congestione c(f) sia continuo nell'insieme di definizione del vettore
dei flussi di arco (si vedrà in seguito quale è questo insieme di definizione);
• il modello di congestione c(f) sia monotono crescente rispetto al vettore dei flussi
di arco (in tutto l'insieme di definizione del vettore dei flussi di arco);
o la precedente proprietà è assicurata nel caso in cui la matrice Jacobiana (delle
derivate parziali prime) della funzione vettoriale di ritardo rispetto al vettore
dei flussi di arco sia positiva definita;
ü a sua volta la precedente proprietà è assicurata nel caso in cui le funzioni
di ritardo di ogni arco siano separabili (dipendano, cioè dal solo flusso
sull'arco stesso ed in alcun modo dal flusso su qualunque altro arco) e
monotone crescenti.
Più in dettaglio, si supponga, per comodità, di dividere la funzione di costo di ogni arco in
due aliquote, di cui una caratterizzata da una dipendenza rispetto al flusso ed un'altra
costante:
"a Î L , ca (f ) = cv a (f ) + c 0a Þ c(f ) = cv (f ) + c 0 52
Si vuole che valgano le proprietà di continuità della funzione cv(f), da cui deriva quella di
continuità della c(f), e la proprietà di monotona crescenza della cv(f), da cui quella di
monotona crescenza della c(f). Questa ultima in termini analitici può essere espressa come:
[cv(f1)-cv(f2)]T (f1-f2)>0 " f1 , f 2 53
È possibile dimostrare che condizione sufficiente (non necessaria) per il verificarsi della
precedente è che sia:
1 Occorre che le funzioni di ritardo associate alle intersezioni siano attribuite ad una opportuna
rappresentazione esplosa in cui il tempo di attesa sia associato agli archi che esplicitamente rappresentano
gli accessi dell’intersezione. In alternativa, per intersezioni semplici, si può immaginare la presenza di un
solo accesso e il tempo di attesa può essere aggiunto al tempo di percorrenza del ramo che giunge
nell’intersezione. In tale modo la funzione di ritardo di un ramo rappresenta il tempo (in funzione del flusso)
necessario sia per compiere la fase dello spostamento rappresentato che per passare da questa a quella
successiva.
2 Vengono qui elencate proprietà “standard” richieste alle funzioni di ritardo. La ricerca si sta orientando
negli ultimi tempi verso il rilassamento di alcune delle proprietà elencate. Ad esempio, si stanno studiando
le proprietà di funzioni di ritardo “non ovunque continue” e/o non ovunque monotone crescenti. Tali
proprietà “avanzate”, però, sono ancora oggetto di ricerca scientifica.
96
xT Jac[cv(f)] x >0 "f "xÎRn 54
e cioè che la matrice jacobiana della funzione vettoriale di costo sia definita positiva, dove:
é ¶cv1 (f ) ¶cv1 (f ) ¶cv1 (f ) ¶cv1 (f ) ù

ê ¶f ! !
¶f 2 ¶f a ¶f na ú é x1 ù
ê 1 ú
ê ¶cv 2 (f ) ¶cv 2 (f )
!
¶cv 2 (f )
!
¶cv 2 (f ) ú êx ú
ê ¶f1 ¶f 2 ¶f a ¶f na ú ê 2ú
ê ú ê ... ú
Jac[cv (f )] = ê " " # " # "
ú , x=ê ú 55
¶cv a (f ) ¶cv a (f ) ¶cv a (f ) ¶cv a (f )
ê ! ! ú ê xa ú
ê ¶f1 ¶f 2 ¶f a ¶f na ú ê ... ú
ê " " # " # " ú ê ú
ê ¶cv na (f ) ¶cv na (f ) ¶cv na (f ) ¶cv na (f )ú ê
ë x na ûú
ê ! ! ú
ë ¶f1 ¶f 2 ¶f a ¶f na û
Condizione a sua volta sufficiente (e sempre non necessaria) per la precedente è che risulti:
¶cv a (f ) ¶cv a (f )
"a Î L >0 e = 0 "j Î L : j ¹ a 56
¶f a ¶f j
che esprime la cosiddetta proprietà di separabilità delle funzioni di costo e che può essere
alternativamente scritta nella forma equivalente:
¶cva (f a )
"a Î L cv a = cva (f a ) con >0
¶f a
In tale caso, infatti, la matrice Jacobiana è diagonale e con elementi positivi ed è dunque
sicuramente definita positiva.
Le proprietà della funzione vettoriale di costo testé introdotte risulteranno essere cruciali nel
momento in cui, più oltre, si tratterà il problema dell'interazione tra domanda ed offerta.
4.2.3 IL MODELLO DI CALCOLO DEI COSTI DI PERCORSO
Si è detto che un generico arco della rete di offerta di trasporto è una tra tutte le possibili fasi
di tutti i possibili spostamenti che avvengono (o possono avvenire) utilizzando il sistema di
trasporto stesso. Un intero spostamento, dunque, è rappresentato su rete da una successione
di archi, cioè dalla successione di tutte le fasi che lo compongono. Una tale successione di
archi è un percorso. Il concetto di percorso era già stato introdotto nel capitolo precedente
ed era stato lì definito proprio come una delle alternative elementari di spostamento che si
realizzano utilizzando l'offerta di trasporto.
Il modello di calcolo dei costi di percorso permette di determinare gli attributi di costo dei
percorsi elementari in funzione degli attributi di costo degli archi della rete. Sotto opportune
ipotesi relative alla scelta degli attributi di costo d'arco ed a quella degli attributi di costo dei
percorsi e nell'ipotesi in cui i coefficienti di reciproca sostituzione del modello di domanda
97
per il calcolo dei flussi di itinerario e quelli di reciproca sostituzione per il calcolo dei costi
generalizzati d'arco coincidano, i costi di percorso sono esprimibili in funzione dei costi di
arco.
Detto xr il vettore degli attributi di costo di arco relativo ad un generico attributo r (ad
esempio il tempo di pecorrenza) e XPr il vettore degli attributi di costo di percorso relativo
alla stessa componente di costo, si cerca la funzione:
"r XPr = XPr (xr)
La precedente relazione viene di solito espressa attraverso dei modelli di tipo lineare1; in
particolare si fa di solito l'ipotesi che gli attributi di costo relativi ad un percorso siano la
somma degli attributi di costo degli archi che lo compongono. In tale caso è facile verificare
che risulta:
"r XPr = ΔiT xr "r 57
dove Δi è la matrice d'incidenza archi/percorsi relativi a tutti i percorsi della i-esima coppia
origine-destinazione.
Il generico elemento δak della matrice di incidenza archi/percorsi assume valore unitario nel
caso in cui l'arco a appartiene al percorso k, valore nullo altrimenti2.
La stessa relazione può essere scritta, in forma matriciale:
"r XPr = ΔiT xr 58
Se si suppone che le stesse leggi lineari semplificate di composizione (58) valide per gli
attributi di costo siano valide anche per il costo complessivo, risulta:
wi = ΔiT c 59
La precedente relazione 59 è la forma più utilizzata del modello di calcolo dei costi di
percorso. È il caso di notare che essa non è l'unica forma possibile per tale modello e che la
espressione estremamente semplice cui si è giunti è il risultato di una serie di ipotesi
semplificative. Infatti, è possibile scrivere la 59 solo avendo assunto:
§ una legge lineare di composizione degli attributi di costo di arco nella formazione del
costo complessivo (equazione 50);
1 Si noti che questa non è l'unica maniera in cui è possibile esprimere la relazione tra attributi di costo di
percorso ed attributi di costo di arco. Essa è sicuramente una ipotesi che permette di esprimere una relazione
semplice, ma sottintende alcune limitazioni: è implicitamente ipotizzato che un attributo di percorso si
componga in maniera lineare attraverso l'omologo attributo di arco. Ad esempio, il tempo complessivo
percorso a piedi “pesa” in maniera lineare rispetto ai tempi a piedi percorsi in ognuna delle fasi dello
spostamento. Tale ipotesi non sempre è ragionevole perché un attributo di percorso (che è una componente
di utilità o, più spesso, disutilità dello spostamento che lo rappresenta) potrebbe essere, ad esempio, più che
lineare rispetto alle omologhe singole componenti di disutilità delle fasi dello spostamento.
2
Si noti che la matrice Δi contiene implicitamente, per ogni coppia o/d, la descrizione di tutti gli archi della
rete e di come questi sono collegati tra di loro. Essa, dunque, è una rappresentazione del modello topologico
di offerta.
98
§ una legge lineare di composizione degli attributi di scelta (attributi di costo di percorso)
nella utilità (disutilità/costo) dei modelli di scelta del percorso (tale ipotesi, in realtà, è
stata espressa più in generale per i modelli basati sulla teoria delle scelte discrete –
relazione 13);
§ l'utilizzo dello stesso tipo di attributi di costo per la determinazione sia del costo
complessivo di arco che dei costi (disutilità) di percorso;
§ l'utilizzo degli stessi coefficienti di reciproca sostituzione sia per i costi complessivi di
arco che per le disutilità di percorso.
4.2.4 IL MODELLO DI PROPAGAZIONE DEL FLUSSO
Un'altra delle funzioni del modello di offerta è quella di simulare il modo in cui gli utenti,
nel realizzare i loro spostamenti, caricano il sistema di offerta di trasporto, ovvero le modalità
con cui lo utilizzano. A tale scopo occorre rappresentare in che modo i percorsi scelti dagli
utenti si concretizzano nell'utilizzo della rete e come, quindi, i flussi di percorso si
ripartiscono sui diversi archi della rete che li compongono. Il modello di propagazione del
flusso è proprio finalizzato alla rappresentazione di tali fenomeni.
La legge di ripartizione dei flussi di percorso si assume lineare e, più in particolare, si
suppone che il flusso di ogni arco sia la somma dei flussi di tutti i percorsi che lo utilizzano.
In termini algebrici:
∀𝑎 ∈ 𝐿 𝑓<= = ∑) 𝛿<,) ℎ)
dove con Ii si è indicato l'insieme dei percorsi relativi alla i-esima coppia o/d), con hk il flusso
su uno di questi percorsi e con fia il contributo al flusso di arco del ramo a dovuto alla sola
i-esima coppia o/d. Si noti che la presenza dei valori della matrice di incidenza archi percorsi
fanno si che si sommi al flusso di arco solo il flusso dei percorsi che utilizzano l’arco stesso.
Nel precedente capitolo si è indicato con hi il vettore dei flussi di itinerario relativo alla i-
esima coppia o/d.
È facile verificare che in termini matriciali la precedente relazione algebrica può essere
scritta come:
fi = Δi hi
Volendo considerare la presenza di tutte le coppie o/d nel contributo ad ogni arco della rete:
f=åi Δi×hi 60
La precedente relazione 60 è il modello di propagazione del flusso nel caso di propagazione

di tipo lineare.
99
Si noti che, detto Shi l'insieme (nello spazio R+np) in cui si ipotizzano definiti i flussi di
itinerario relativi alla domanda (coppia o/d) i-esima, l'insieme (dello spazio R+na) in cui sono
contenuti i flussi di arco si ottiene dal primo per trasformazione lineare:
Sf = {f: f = åi Δi hi, hiÎShi " i}
L’insieme Shi, a sua volta è definito come l’insieme di tutti i flussi di itinerario ammissibili
(cioè di quelli che potrebbero verificarsi, anche se non è detto che si verifichino) per ogni i-
esima domanda (coppia o/d). L’ammissibilità deve essere verificata rispetto al fatto che i
flussi di itinerario non possono essere negativi e rispetto al fatto che la somma di tutti i flussi
di itinerario relativi ad una stessa domanda devono essere pari alla domanda di mobilità
stessa. In termini formali:
" i Shi = {hi: hi³0, åhÎIi hh = di }
100
L’INTERAZIONE TRA DOMANDA ED OFFERTA
5 L’INTERAZIONE TRA DOMANDA ED OFFERTA
Il fenomeno della interazione tra domanda ed offerta di trasporto1 può essere interpretato sia
con riferimento alla rappresentazione analitica che è stata costruita fino ad ora, sia attraverso
la descrizione della fenomenologia di un sistema di trasporto.
Nel seguito si preferisce dapprima percorrere la prima strada, per dimostrare in seguito che
le relazioni ottenute, in certe ipotesi, possono essere ritenute rappresentative del fenomeno
così come esso può essere osservato. La descrizione dell'interazione tra domanda ed offerta
verrà fatta con riferimento a sistemi stazionari (per i quali sono state ricavate fino ad ora le
formulazioni dei modelli di domanda ed offerta), in seguito si provvederà a descrivere un
approccio alternativo di tipo dinamico e ad illustrare, rispetto a questo, in che modo sia
necessario modificare i modelli fin qui introdotti e come, in tale formulazione alternativa,
può essere studiata l'interazione tra domanda ed offerta.
5.1 LA MAPPA DI CARICO DELLA RETE

Un primo passo per la descrizione analitica del problema dell'interazione tra domanda ed
offerta è quello di iniziare, seppure per ora in maniera parziale, a comporre tali due modelli.
Dal modello di offerta (modello di propagazione del flusso) è noto che:
f = åi Δi hi
Inoltre, sempre dal modello di offerta (modello di calcolo dei costi di percorso) è noto che:
"i, wi = ΔiT c
Infine, dal modello di domanda per la stima dei flussi di percorso2 è noto che:
"i, hi = pi (wi) di
Integrando le tre precedenti equazioni si ottiene:
f = åi Δi pi (ΔiT c) di 61
La precedente relazione 61 prende il nome di mappa di carico della rete.
1 Il modello d'interazione tra domanda ed offerta è spessissimo chiamato modello di assegnazione. Nel
seguito parlare di assegnazione o di interazione domanda/offerta verrà considerato perfettamente
equivalente.
2 È qui il caso di dichiarare esplicitamente che il modello di scelta discreta sotteso al modello di domanda
per la stima dei flussi di percorso si ipotizza essere di tipo aleatorio. Nel caso di modelli di tipo
deterministico occorre, lo si farà nel seguito, puntualizzare diversamente alcune considerazioni.
101
La relazione 61 esprime la funzione1 che lega il costo dei rami della rete (le condizioni di
disutilità incontrate dagli utenti del sistema nelle loro fasi del viaggio) con il numero di utenti
che, in un dato periodo di riferimento, utilizzano la rete.
5.1.1 PROPRIETÀ DELLA MAPPA DI CARICO DELLA RETE
La mappa di carico della rete possiede alcune proprietà facilmente dimostrabili. La loro
utilità è finalizzata alla successiva discussione sulle proprietà teoriche del modello
d'interazione domanda/offerta.
5.1.1.1 CONTINUITÀ DELLA MAPPA DI CARICO DELLA RETE

Si noti anzitutto che la mappa di carico della rete è costituita da:
§ il modello di propagazione del flusso, che fissa una relazione continua (in particolare
lineare) tra flussi di arco e flussi di percorso;
§ il modello di calcolo dei costi di percorso, che fissa una relazione continua (in
particolare lineare) tra costi di arco e costi di percorso;
§ il modello di domanda per la stima dei flussi di percorso che, nell'ipotesi che il modello
di scelta discreta sotteso sia di tipo aleatorio (ed in particolare uno di quelli da noi
studiati – in generale si utilizza il modello Probit), esprime una funzione continua tra
costi di percorso e probabilità di scelta degli stessi e quindi fissa una funzione continua
tra costi di percorso e flussi di percorso.
Ne consegue che la mappa di carico della rete è una funzione composta da funzioni continue
e quindi esprime essa stessa una funzione continua dei flussi di arco rispetto ai costi di arco.
Inoltre, si noti che la mappa di carico della rete ha come insieme di definizione l'insieme dei
valori che possono assumere i costi di arco e quindi, potenzialmente, ha come insieme di
definizione il campo R+na (dove, come al solito, na esprime il numero di archi della rete).
Si noti anche che i valori che possono essere assunti dalla mappa di carico della rete si
ottengono attraverso la trasformazione dei flussi di percorso e che quindi se questi ultimi
appartengono all’insieme Sh dei flussi di percorso ammissibili altrettanto vale per il flussi di
arco che non possono che appartenere ad Sf .I flussi di percorso calcolati all’interno della
mappa di carico della rete, d’altra parte, si ottengono proprio moltiplicando i flussi di
domanda per una matrice di probabilità e dunque sono valori sicuramente non negativi. La
matrice di probabilità delle scelte preventive, infine, è tale per cui, ovviamente, la somma
1 Come si chiarirà ulteriormente nel seguito, si tratta di una particolare “mappa” e cioè di una “funzione”
perché il modello di scelta dell'itinerario sotteso è di utilità aleatoria (non di utilità deterministica).
102
degli elementi di una stessa colonna ha valore unitario, dunque i flussi di percorso relativi
ad una stessa coppia origine/destinazione, ottenuti da essa e dai flussi di domanda, non
possono che sommare alla domanda relativa alla coppia o/d. Essi appartengono, dunque,
all’insieme Sh e quindi i flussi di arco ottenuti dalla mappa di carico della rete appartengono
a Sf .
5.1.1.2 MONOTONICITÀ DELLA MAPPA DI CARICO DELLA RETE

In conseguenza di tutte le ipotesi fatte finora relativamente sia al modello di domanda per la
stima dei flussi di percorso che al modello di offerta, la mappa di carico della rete gode1 di
una particolare, importantissima proprietà. Essa, infatti, è monotona decrescente (in senso
vettoriale) rispetto ai costi di arco.
Dimostreremo la proprietà considerando una qualunque coppia o/d:
§ i = (o, d) è una qualunque coppia o/d del grafo.
Dalle proprietà dimostrate per la soddisfazione di un qualunque modello di scelta discreto
additivo con funzione di probabilità continua e con derivate parziali prime continue risulta
(proprietà 9, equazione 33):
"i "(V'i , V' 'i ) [ p(V'i ) - p(V' 'i )]T × (V'i -V' 'i ) ³ 0
dove si è indicato con:
§ V'i e V''i due qualunque diversi vettori di utilità sistematiche relativi alla scelta di
percorso per la i-esima coppia o/d;
§ pi = p(Vi) la funzione (vettoriale) di probabilità di scelta di percorso.
La precedente espressione, ovviamente, rimane valida se ad essa viene moltiplicato un
qualunque numero reale positivo e, dunque, rimane tale se viene moltiplicata per la domanda
della coppia o/d. Giacché la domanda, moltiplicata per i vettori di scelta dei percorsi con
essa compatibili, consegna proprio i flussi di percorso relativi alla coppia (equazione 44).
"i "(V'i , V' 'i ) di × [ p(V'i ) - p(V' 'i )]T × (V'i -V' 'i ) ³ 0 Þ [h '-h ' '] × (V' -V' ' ) ³ 0
i i T
i i
Ne consegue che, sommando tra loro tutte le precedenti relazioni per tutte le coppie o/d:
"(V ' , V ' ') å [hi '-hi ' '] × (V'i -V' 'i ) ³ 0
T
dove:
[
V' = ..., Vi'T ,... ]
T
[ ]
V' ' = ..., Vi''T ,...
T
sono i vettori di utilità di tutti i percorsi e di tutte le coppie o/d.
1 Sempre nell'ipotesi, tra l'altro, che il modello di scelta dei percorsi sia di tipo aleatorio e non deterministico.
103
Sostituendo allora all'utilità la sua espressione in termini di disutilità, e cioè l'opposto del
costo:
( )
T
æ T Tö
é i æ i ' ö i æ i ' ' öù
"çç w' = é..., w i ,...ù , w' ' = é..., w i. ,...ù ÷÷ å
'T ''T i i
êë úû êë úû êëh çè w ÷ø - h çè w ÷øúû × w '-w ' ' £ 0
è ø i
Ricordando che i costi di percorso possono essere ottenuti in funzione dei costi di arco:
-
∀ (𝑐 / , 𝑐 // ) ∑= Bℎ=/ − ℎ=// D ∙ ∆=- ∙ (𝑐 / , 𝑐 // )
A questo punto, utilizzando il modello di propagazione del flusso è possibile scrivere
-
∑=Bℎ=/ − ℎ=// D ∙ ∆=- = (𝑓 / − 𝑓 // )- e dunque:
"(c' , c' ') ( f (c') - f (c' '))T × (c'-c' ') £ 0 62
La mappa di carico della rete, dunque, è monotona decrescente nei costi di arco.
Si noti, inoltre, a conferma di quanto precedentemente dimostrato, che:
𝐽𝑎𝑐[𝑓(𝑐)] = ∑= 𝑑 = ∙ ∆= ∙ 𝐽𝑎𝑐B𝑝= I𝑤 = KD ∙ ∆=-
e che, poiché, dalle proprietà dimostrate per le funzioni di soddisfazione:
"i = (k1, k1,...), Jac[ p(Vi )] è positivo semidefinito
allora:
"i = (k1, k1,...), Jac p wi [ ( )] è negativo semidefinito
e quindi:
"c Jac[ f (c)] è negativo semidefinito 63
D’altra parte, la precedente è condizioni sufficiente perché risulti:

"(c' , c' ') ( f (c') - f (c' '))T × (c'-c' ') £ 0
il che, per altra via, ridimostra la decrescenza della mappa di carico della rete.
5.2 L’INTERAZIONE COME PROBLEMA DI PUNTO FISSO

Nel precedente paragrafo si è iniziato ad integrare (in maniera parziale) il modello di
domanda e quello di offerta. Si è quindi iniziata a studiare l'interazione tra domanda ed
offerta. Fino a questo punto, però, l'integrazione è stata fatta senza tenere conto di una
componente del modello di offerta che è il modello di congestione.
In altri termini, la mappa di carico della rete esaurisce il problema dell'interazione tra
domanda ed offerta nel solo caso in cui le funzioni di costo possano essere considerate
invarianti rispetto al flusso (e quindi il modello di calcolo dei costi di arco banalizza in una
relazione costante – reti non congestionate). Se questo non è il caso, occorre considerare che
la mappa di carico della rete deve, appunto, essere integrata con il modello di calcolo dei
104
costi di arco. In termini analitici, devono valere le due relazioni 51 e 61; esse devono, inoltre,
valere contemporaneamente:
𝑓L = ∑= ∆= ∙ 𝑝= I∆=- ∙ 𝑐̂ K ∙ 𝑑 =
0 64
𝑐̂ = 𝑐I𝑓LK
Nella precedente equazione 64 si è esplicitamente evidenziato che i costi risultanti dalle
funzioni di costo, i flussi argomento delle stesse, i flussi risultanti dalla mappa di carico della
rete ed i costi argomento della stessa si devono corrispondere. L'equazione 64 è anche detta
equazione dell'equilibrio, essa esprime la reciproca congruenza tra modello di domanda e
modello di offerta nel caso di rete congestionata. La equazione 64 può anche essere scritta
come equazione di punto fisso nei flussi. A tale scopo occorre sostituire la seconda
espressione dell'equazione 64 nella prima:
𝑓L = ∑= ∆= ∙ 𝑝= N∆=- ∙ 𝑐I𝑓LKO ∙ 𝑑 = 65
Sostituendo, invece la prima della 64 nella seconda si ottiene l'equazione di punto fisso nei
costi.
𝑐̂ = 𝑐I∑= ∆= ∙ 𝑝= I∆=- ∙ 𝑐̂ K ∙ 𝑑 = K 66
Le 65 e 66 sono delle equazioni di punto fisso perché esprimono il problema matematico di

trovare l'argomento di una data funzione che riproduce sé stesso come valore. Esprimere
l'equilibrio come un problema di punto fisso comporta notevoli vantaggi analitici. Di seguito
si studiano le principali proprietà teoriche del particolare problema di punto fisso che
rappresenta l'interazione tra domanda ed offerta in un modello di sistema di trasporto.
5.2.1 LE PROPRIETÀ TEORICHE DEL PROBLEMA DI PUNTO FISSO
Le più importanti proprietà teoriche del problema di punto fisso sono:

§ l'esistenza della soluzione;
§ l'unicità della soluzione.
Nel seguito esse verranno esaminate con riferimento alla espressione 65 che esprime il punto
fisso nei flussi. Ovviamente, se esse sono dimostrate per la 65 valgono per il problema di
punto fisso in generale, potrebbero, infatti, essere facilmente dimostrate anche con
riferimento all'espressione 66 (punto fisso nei costi).
Per comodità di trattazione formale si esprima la funzione di punto fisso in maniera compatta
come:
ˆf = j ˆf() 67
105
5.2.1.1 ESISTENZA DELLA SOLUZIONE DI PUNTO FISSO

Si noti anzitutto che l'insieme di definizione della funzione 67 è l'insieme di tutti i possibili
flussi di arco che si possono realizzare sulla rete. Tale insieme, come già accennato nel
capitolo precedente, può essere ottenuto per trasformazione lineare dall'insieme di tutti i
possibili flussi di percorso:
Sf = {f : f = åi Δi hi, hiÎShi} 68
A sua volta, l'insieme dei flussi ammissibili di percorso è vincolato al fatto che i flussi
devono essere maggiori dell'unità e che la somma dei flussi relativi ai percorsi di ogni coppia
o/d deve riprodurre la domanda stessa:
Shi = {"i, hi: hi ³0, hiT 1 = di } 69
L'insieme Shi, dunque, è ottenuto dall'applicazione di vincoli lineari di uguaglianza e

diseguaglianza ed è dunque convesso. Inoltre, i valori che possono assumere i flussi di
percorso sono limitati inferiormente dal valore nullo e superiormente da un valore anch’esso
finito giacché la somma dei flussi di percorso di una stessa coppia origine/destinazione deve
eguagliare il valore (finito) di flusso di domanda sulla coppia o/d stessa. Dunque, Shi è
limitato. Infine, i vincoli che definiscono l’insieme Shi sono non stretti e dunque l’insieme
stesso contiene la sua frontiera. In conclusione, Shi è un insieme convesso, limitato e chiuso,
cioè un insieme convesso e compatto. L'insieme Sf, essendo una trasformazione lineare di
Shi, ne eredita le precedenti caratteristiche ed è, dunque, anch'esso un insieme convesso e
compatto. La funzione di punto fisso è quindi definita in un insieme convesso e compatto. I
valori della funzione di punto fisso si ottengono, dati i costi, dalla mappa di carico della rete
e, come già dimostrato in paragrafi precedenti, sono sicuramente contenuti nell’insieme Sf.
Il codominio della funzione di punto fisso 67, dunque, è sicuramente contenuto nel dominio:
()
j ˆf : ˆf Î Sf ® ˆf Î CD Í Sf
Inoltre, la funzione di punto fisso è composta dalla mappa di carico della rete (che si è
dimostrato essere una funzione continua) e dalle funzioni di costo di cui, come detto nel
capitolo precedente, si richiede la continuità. In conclusione, la funzione di punto fisso è
definita in un insieme compatto, è continua ed ha valori in un insieme contenuto nell'insieme
di definizione. Tali condizioni sono quelle per cui vale il teorema di Browers che assicura la
esistenza della soluzione di punto fisso.
106
5.2.1.2 UNICITÀ DELLA SOLUZIONE DI PUNTO FISSO

Se le funzioni di costo sono (vettorialmente) strettamente crescenti, allora la soluzione di
punto fisso è unica. Infatti, dalla monotonicità della mappa di carico della rete (equazione
62, qui riscritta per comodità del lettore):
( f (c') - f (c' '))T × (c' -c' ' ) £ 0 "(c' , c' ' ) 70.a
inoltre, dalla stretta crescenza delle funzioni di costo che si sta ipotizzando:
(c(f ') - c(f ' '))T × (f' -f' ' ) > 0 "(f' , f' ' ) 70.b
Nell'ipotesi, procedendo per assurdo, in cui esistano due soluzioni di punto fisso risulta:
f' di punto fisso Þ c(f')=c' e, contemporaneamente, f(c')=f'
f'' di punto fisso Þ c(f'')=c'' e, contemporaneamente, f(c'')=f''
Le condizioni di monotonicità, dunque, consegnerebbero, contemporaneamente:
(c' -c' ' )T × (f' -f' ' ) £ 0

(c' -c' ' )T × (f' -f' ' ) > 0
Che è un'evidente contraddizione dell'ipotesi che possano esistere due soluzioni di punto
fisso.
Si noti che la ipotesi di stretta crescenza delle funzioni di costo è stata discussa nel capitolo
relativo al modello d'offerta di trasporto (unitamente ad alcune condizioni a loro volta
sufficienti perché tali ipotesi sia verificata) e che l'ipotesi di monotonia della mappa di carico
della rete deriva dall'avere adottato un modello di scelta degli itinerari (scelte preventive) di
tipo additivo (ad esempio della famiglia Logit o del tipo Probit).
Inoltre, se i modelli di scelta additiva sono proprio di tipo Logit-Multinomiale, Nested-Logit
o Probit (se le probabilità di scelta delle alternative, quindi, sono strettamente positive) è
possibile dimostrare che la matrice jacobiana delle probabilità di scelta rispetto alle utilità è
positiva strettamente definita e che dunque la matrice jacobiana delle probabilità di scelta
rispetto ai costi di itinerario è negativa strettamente definita e che quindi la mappa di carico
della rete è monotona strettamente decrescente. In tali condizioni, dunque, è sufficiente che
le funzioni di costo siano monotone (anche non strettamente) crescenti. In termini analitici,
poiché risulterebbe:
( f (c') - f (c' '))T × (c' -c' ' ) < 0 "(c' , c' ' ) 71a
Sarebbe sufficiente che fosse:
(c(f ') - c(f ' '))T × (f' -f' ' ) ³ 0 "(f' , f' ' ) 71.b
107
5.2.2 LA SPIEGAZIONE FENOMENOLOGIA
L'interazione tra domanda ed offerta è determinata dall'incontro di due diversi fenomeni. Da

un lato c'è la domanda di trasporto che, per soddisfare le proprie esigenze di mobilità, deve
usare l'insieme delle infrastrutture, dei servizi e delle regole di trasporto, deve, cioè utilizzare
il sistema di offerta di trasporto. Nel realizzarsi delle modalità con cui la domanda utilizza il
sistema di offerta sono cruciali, ovviamente, le prestazioni offerte dal sistema stesso, esse
infatti determinano convenienze ed opportunità che influenzano le scelte di viaggio degli
utenti. Dall'altro lato, però, il sistema di offerta di trasporto non è insensibile alle modalità
con cui viene utilizzato da parte della domanda. In particolare, le sue prestazioni possono
essere (nella maggior parte dei casi lo sono) influenzate dalla quantità di utenti che chiedono
di utilizzare ogni elemento del sistema e dal modo in cui essi si distribuiscono sul sistema
stesso. In altri termini, le scelte di viaggio degli utenti vengono fatte in funzioni delle
prestazioni del sistema di offerta, tali prestazioni, però, dipendono a loro volta dalle scelte
di viaggio degli utenti. Se le scelte cambiano, cambiano le prestazioni, dunque cambiano a
loro volta le scelte, e così via. Se il sistema di trasporto nel suo complesso deve essere in
condizioni di funzionamento stazionario (come si è finora ipotizzato) deve necessariamente
verificarsi (in realtà è una condizione sia necessaria che sufficiente) che le scelte degli utenti
e le prestazioni del sistema di offerta siano reciprocamente congruenti. In pratica, ogni volta
che avviene una scelta, questa si ripete (in valore medio) identicamente e quindi
identicamente si ripetono le prestazioni dell'offerta che hanno determinato le scelte ed il
sistema deve essere nelle condizioni espresse dal cosiddetto principio di Wardrop1, per cui
ogni utente non può aumentare la sua utilità cambiando unilateralmente itinerario. Il sistema
tende dunque a riprodurre nel tempo il suo comportamento. Non è detto, però, che un sistema
si trovi nelle condizioni del principio di Wardrop, non è detto cioè che sia in condizioni di
equilibrio e che si ripeta in maniera stazionaria il suo funzionamento. Ad esempio, una
condizione di punto fisso potrebbe essere instabile, cioè un funzionamento stazionario del
sistema potrebbe essere soggetto ad una perturbazione che induce la possibilità per alcuni
utenti di migliorare la propria utilità cambiando unilateralmente itinerario. Tale
cambiamento può determinare a sua volta delle diverse opportunità nel sistema che inducono
1 Nella sua espressione originaria il principio di Wardrop è stato introdotto, per sistemi in condizioni
stazionarie, nel caso in cui i modelli utilizzati per la rappresentazione fossero di tipo deterministico. Esso,
però, nella sua espressione sostanziale è facilmente estensibile a qualunque tipo di approccio modellistico
relativo a sistemi in condizioni stazionare. In ogni caso, in questa sede, il principio di Wardrop viene riferito
direttamente alla descrizione della fenomenologia del sistema e non alla rappresentazione modellistica della
stessa.
108
altri utenti (e/o anche gli stessi) a cambiare le proprie scelte. Il fenomeno di cambiamento
innescato può propagarsi ed evolvere dinamicamente nel tempo. Ad ogni istante in cui le
scelte di itinerario possono essere ripetute, il sistema potrebbe assumere dunque, ogni volta,
una configurazione diversa. Questo fenomeno di propagazione dei cambiamenti può sia
evolvere verso un diverso funzionamento stazionario (in cui, dunque, gli utenti hanno trovato
un nuovo equilibrio nelle scelte di ognuno), sia evolvere indefinitamente attraverso
successivi (eventualmente ripetuti) stati di non equilibrio. In ogni caso, quello che si è
innescato è un processo dinamico. Evidentemente una condizione di funzionamento di
processo dinamico non è (per definizione) una condizione stazionaria ed alcuni degli
strumenti matematici utilizzati finora per rappresentare il sistema dei trasporti devono essere
opportunamente rivisti ed aggiornati. Tale trattazione sarà svolta più oltre.
5.3 IL CASO DEI MODELLI DETERMINISTICI DI SCELTA DEL PERCORSO

Ancorché tutti i concetti precedentemente esposti siano validi anche nel caso di modelli di
scelta degli itinerari (modelli di scelta preventiva) di tipo deterministico, è comunque il caso
di sottolineare esplicitamente che alcune proprietà matematiche devono essere riconsiderate
e diversamente esposte.
Anzitutto, nel parlare del modello di domanda relativo alle scelte degli itinerari (modello di
scelta preventiva) si è già sottolineato che la condizione che deve essere verificata dalla
probabilità1 di scelta per un modello deterministico è la seguente:
ph >0 Þ wh£wh’ "h’ÎIi 44
Sempre come già detto, essa determina una matrice delle probabilità di scelta in funzione dei
costi di itinerario che non è una funzione ma una mappa a più valori. Ne consegue che anche
la mappa di carico della rete non è una funzione ma una mappa a più valori. Non sono dunque
più valide per essa le dimostrazioni di continuità e di monotonicità (in senso vettoriale)
precedentemente dimostrate. Più in generale, la stessa funzione di punto fisso non sarebbe
più una funzione e risulterebbero alcune complicazioni analitiche dal continuare la
trattazione dell'equilibrio attraverso un approccio di punto fisso. Non sono più utilizzabili in
ogni caso le dimostrazioni di esistenza ed unicità della soluzione di punto fisso finora
dimostrate.
1
In realtà, anche se si continua ad usare il termine di “probabilità di scelta”, esso andrebbe a rigore sostituito
con quello di “percentuale di scelta”:
109
Fortunatamente, il principio di Wardrop utilizzato nel precedente paragrafo per la

descrizione fenomenologica dell'equilibrio trova una sua traduzione in termini analitici
formali e conduce a potere formulare il modello d'interazione domanda/offerta
deterministico attraverso la cosiddetta diseguaglianza variazionale:
-
N∆=- ∙ 𝑐I∆= ∙ ℎ= KO ∙ Iℎ= − ℎP= K ≥ 0 ∀ ℎ= ∈ 𝑆TU 72
o, equivalentemente, in termini di grandezze di arco:
()( )
T
c fˆ f - fˆ ³ 0 " f Î Sf 73
Ancorché la funzione di probabilità sia una mappa, dunque, è ugualmente possibile indicare
le condizioni che devono essere soddisfatte nel punto di equilibrio dal vettore dei flussi di
itinerario ( ĥ ) o dal vettore dei flussi di arco ( f̂ ). Le risultanti disuguaglianze variazionali
sono l'equivalente, nel caso deterministico, della espressione di punto fisso (67).
L'esistenza della soluzione di punto fisso può essere dimostrata con riferimento alle
diseguaglianze variazionali nell'ipotesi in cui le funzioni di costo degli archi siano continue
nell'insieme di fattibilità (Sf) degli archi stessi1. A tale scopo si può utilizzare una estensione
del teorema di Browers (già utilizzato nel caso di modello di scelta di tipo probabilistico).
La proprietà d'unicità dell'equilibrio deterministico può essere dimostrata solo con
riferimento alla diseguaglia variazionale scritta in termini di grandezze di arco. Ancora una
volta (come nel caso probabilistico), è necessario che le funzioni di costo siano
(vettorialmente) monotone crescenti rispetto ai flussi di arco. È da notare che il fatto che la
unicità può essere dimostrata solo in termini di grandezze di arco non permette di assicurare
l'unicità della soluzione in termini anche di grandezze di itinerario. Nel caso di modello di
scelta deterministico, infatti, uno stesso vettore di flussi di arco può essere determinato da
diversi vettori di flussi di itinerario.
5.4 UNA PANORAMICA SU MODELLI D’ASSEGNAZIONE ALTERNATIVI A QUELLI

DI PUNTO FISSO.
Come già detto, i modelli d’assegnazione simulano l’interazione tra la domanda e l’offerta
di trasporto. Fino ad ora sono stati introdotti solo modelli di assegnazione in cui tale
interazione è di tipo stazionario, esistono, però, altri approcci che possono essere utilizzati,
a seconda delle circostanze, per la simulazione dell’interazione domanda/offerta. In questo
paragrafo se ne procederà ad una classificazione. Essi possono essere trattati e classificati in
1
Si tratta della stessa condizione del caso probabilistico ma deve essere dimostrata per altra via e con
riferimento alla disuguaglianza variazionale espressa in termini di flussi di arco.
110
base alle modalità rilevanti con cui avviene l’interazione tra i fenomeni indicati come
“domanda di trasporto” e quelli indicati come “offerta di trasporto” oppure, una volta
determinati i modelli (di domanda e d’offerta) che rappresentano tali fenomeni “reali”, in
funzione delle caratteristiche dei modelli stessi. Ovviamente, nell’ambito di una
modellizzazione rigorosa e congruente dei sistemi di trasporto, le due precedenti alternative
sono perfettamente equivalenti: il modello dell’interazione tra i fenomeni o l’interazione tra
i modelli che rappresentano i fenomeni sono, rispettivamente, l’approccio induttivo e
l’approccio deduttivo di una stessa analisi.
In questa nota si procederà deduttivamente, nell’ipotesi, cioè, di introdurre prima diverse
tipologie di modelli di domanda ed offerta e poi, in base alle diverse caratteristiche di tali
componenti ed alle modalità del loro utilizzo congiunto, classificare i modelli
d’assegnazione.
Come già studiato con riferimento al caso stazionario, le principali componenti dei modelli
di offerta che caratterizzano la rappresentazione del sistema (e quindi il modello di
assegnazione che ne deriva) sono:
• il modello delle funzioni di costo, che permette di determinare la disutilità associata
a ciascun ramo della rete (fase omogenea di uno spostamento) in funzione dei flussi
d’utenti che interessano i rami stessi;
• il modello di propagazione del flusso, che permette di determinare i flussi sugli
elementi della rete in funzione delle scelte di percorso degli utenti (e dei valori di
domanda sulle coppie o/d);
• il modello di calcolo dei costi di percorsi, che permette di aggregare le disutilità dei
rami della rete in modo da determinare le disutilità (costi) dei percorsi in base alle
quali avvengono le scelte degli utenti.
Tali componenti, finora specificate nel caso stazionario, sono anche specificabili, seppure in
maniera diversa, in condizioni non stazionarie (dinamiche) di funzionamento del sistema.
Le principali componenti dei modelli di domanda sono:
• il modello di calcolo delle scelte di percorso, che, in funzione delle disutilità (costi)
dei percorsi, permette di determinare le scelte degli utenti;
• il modello di calcolo dei valori (flussi) di domanda, che permette, in funzione delle
caratteristiche del sistema di trasporto, di simulare le scelte di viaggio degli utenti e
quindi di determinare i flussi di domanda.
Anche tali componenti sono specificabili anche in condizioni dinamiche. Il modello di
calcolo dei flussi di domanda, inoltre, può essere specificato in funzione di attributi di
111
Livello di Servizio considerati noti e fissi (come trattato fino ad ora) oppure rispetto ad
attributi di livello di servizio non noti a priori perché dipendenti dalle modalità di utilizzo
della rete da parte degli utenti (e quindi dal risultato del modello di assegnazione stesso).
Nel primo caso si parla di domanda rigida, nel secondo di domanda elastica.
In ogni caso, in funzione delle diverse caratteristiche che le componenti dei modelli di offerta
e di domanda possono avere e delle possibili (e significative) combinazioni tra esse, si
ottengono diverse famiglie di modelli di assegnazione, con caratteristiche e campi di
applicazione anche notevolmente differenti; esse sono rappresentate in forma sinottica nella
successiva tabella, in cui i modelli fino ad ora studiati ed il modello di processo dinamico
(modello E, nella successiva tabella) che sarà affrontato nel prossimo paragrafo sono indicati
in grassetto.
Modello Offerta Domanda
Modello di propagazione Modello di calcolo delle Modello di calcolo dei flussi Tipo Modello
Funzioni di costo
del flusso scelte di percorso di domanda
Statico 5.4.1.1.1 A
Costanti Statico Rigido
Dinamico B
Rigido 5.4.1.1.2 C
Statico
Elastico D
Statico
Rigido 5.4.1.1.3 E
Dinamico
Dipendenti dal Elastico F
flusso Rigido G
Statico
Elastico H
Dinamico
Rigido I
Dinamico
Elastico L
I modelli d’assegnazione indicati in tabella come di tipo A e B sono noti come “modelli di
carico della rete”, rispettivamente di tipo statico e di tipo (within-day) dinamico. Per essi, il
modello d’assegnazione si riduce alla determinazione della mappa di carico della rete, cosa
già studiata nel caso particolare dei modelli di tipo A1. I modelli di tipo C e D sono noti come
modelli di “equilibrio degli utenti” con caricamento statico della rete (sono generalmente
indicati come modelli “doppiamente statici”), rispettivamente “a domanda rigida” ed a
“domanda elastica”. I modelli di tipo C2 sono stati già analizzati sia nel caso di modello di
scelta dei percorsi di tipo stocastico che deterministico, ricorrendo rispettivamente alla
trattazione di punto fisso ed alla disuguaglianza variazionale. I modelli indicati con E ed F
sono modelli di processo dinamico (anche detti “modelli day-to-day-dinamic”) con
caricamento della rete di tipo statico, sempre, rispettivamente, a domanda rigida o elastica.
I modelli di tipo E, in particolare, saranno introdotti nel prossimo paragrafo. I modelli di tipo
G, H, I ed L sono tutti modelli con caricamento dinamico della rete (si dicono “within-day-
1
I modelli di tipo A caratterizzati da scelte di itinerario di tipo rispettivamente deterministico o stocastico sono
anche noti come modelli AoN (All-or-Nothing) e SUN (Stochastic Uncongested Network).
2
I modelli di tipo C caratterizzati da scelte d’itinerario di tipo rispettivamente deterministico o stocastico sono
anche noti come modelli DUE (Deterministic User Equilibrium) e SUE (Stochastic User Equilibrium).
112
dinamic”), in particolare i modelli di tipo I ed L sono modelli detti “doppiamente dinamici”

(perché anche “day-to-day-dinamic”); i modelli di tipo G ed I sono, inoltre, modelli “a
domanda rigida” e quelli di tipo H ed L sono caratterizzati da una “domanda elastica”.
Come si vede, i modelli di assegnazione studiati fino ad ora sono solo una piccola parte delle
specificazioni possibili. L’estensione dei modelli di offerta al caso della dinamica
intraperiodale (within-day) od al caso della domanda elastica è tutt’altro che agevole. Nel
prossimo paragrafo, invece, si procederà ad estendere il modello di domanda per il calcolo
dei flussi di percorso al caso della dinamica interperiodale (day-to-day), si procederà,
dunque, alla formalizzazione dei modelli di domanda di tipo E.
5.5 I MODELLI DINAMICI DI TIPO DAY-TO-DAY: L’INTERAZIONE

CONGESTIONATA COME PROCESSO DINAMICO.
Prima di introdurre una delle possibili formalizzazioni di processo dinamico è opportuno

notare che la differenziazione di approccio nel caso di sistemi stazionari (approccio di punto
fisso) e di sistemi in condizioni non stazionarie (approccio di processo dinamico) ha senso
nel solo caso in cui il sistemo stesso sia interessato da fenomeni di congestione. In caso
contrario, le prestazioni del sistema non dipendono dalle scelte di mobilità degli utenti, esse
sono costanti e, dunque, non ha significato parlare di evoluzione dinamica del sistema; in
caso di assenza di congestione la mappa di carico della rete esaurisce il problema
(intrinsecamente stazionario) dell'interazione tra domanda ed offerta.
Si noti anche che un modello di processo dinamico è un modello più ampio e profondo (ma
più complicato) di un modello di punto fisso. Lo stato di equilibrio (o gli stati, nel caso in
cui non ne esista uno solo) di un sistema possono essere visti come gli attrattori di punto
fisso di un processo dinamico. In qualche modo un modello d'interazione statico può essere
visto come un caso particolare di un modello di processo dinamico.
Per formalizzare il modello d'interazione di processo dinamico si ipotizza anzitutto che le
scelte di viaggio degli utenti avvengano secondo una successione numerabile di istanti
temporali1. La successione di istanti temporali in cui avvengono le scelte sia identificata
come:
{t0, t1, …, tn, …}
1 In realtà è possibile formalizzare modelli di processo dinamico con approccio continuo nel tempo. Tale
formalizzazione, però, non è, ai fini pratici, particolarmente significativa.
113
Il modello di domanda viene modificato per tenere conto del fatto che in ognuno di tali istanti
gli utenti (non necessariamente tutti gli utenti) possono riconsiderare le loro scelte ed
eventualmente modificarle. Ad un generico istante di scelta t:
"i, pi,t = pi (Vi,t) e hi,t=(1-a) hi,t-1 + a pi(Vi,t) d con aÎ[0,1] 74
dove si è esplicitato il fatto che solo una quota (a) della domanda riconsidera le scelte fatte
nell'istante precedente (il che non esclude, evidentemente, che poi le scelte fatte possano
essere esattamente le stesse dell'istante precedente). Si noti che il modello di scelta dei
percorsi rimane formalmente lo stesso ma viene valutato in funzione delle utilità dei percorsi
relative all'istante di scelta considerato.
Nel caso particolare del primo istante da cui si procede alla simulazione del processo
dinamico:
pi,t0 = p(Vi,t0) e hi,t0=pi(Vi,t0) di 75
Occorre, a questo punto, identificare il valore dell'utilità da impiegare, in ogni istante di

tempo, per effettuare le scelte. L'ipotesi più frequente in proposito è che tale valore dipenda
linearmente dalle utilità degli istanti di tempo precedenti e dai valori dei costi di percorso
che si realizzano all'istante precedente. In termini formali:
Vi,t = (1-b) Vi,t-1 - b wi,t-1 con bÎ[0,1] 76
Nella precedente relazione compaiono, indirettamente, attraverso l'utilità Vt-1, tutti i costi di
percorso sperimentati dagli utenti in tutti gli istanti in cui hanno effettuato le loro scelte. Essa
esprime quella che viene definita la funzione di aggiornamento dell'esperienza degli utenti,
in qualche modo ne simula una sorta di comportamento di apprendimento.
Le altre componenti del sistema complessivo di modelli e cioè, in particolare, le componenti
modellistiche del modello di offerta (modello di calcolo dei costi di arco, modello di calcolo
dei costi di itinerario, modello di propagazione del flusso) rimangono strutturalmente
inalterate. Esse devono, comunque, essere valutate per ogni istante di tempo:
ci,t = c(ft); wi,t = DT ci,t; ft = åi Di hi,t 77
La mappa di carico della rete all'istante generico t diviene, dunque:
ft= åi Di ( (1-a) hi,t-1 + a pi((1-b)Vi,t-1 – b DiT ci,t-1) di ) 78
per completare il modello (dinamico) d'interazione occorre affiancare a tale mappa di carico
il modello di calcolo dei costi di arco:
ct = c(ft)
Si noti che le precedenti due relazioni non prevedono la congruenza, allo stesso istante, della
mappa di carico e delle funzioni di costo, giacché le ultime intervengono nelle scelte
dell'istante di tempo successivo.
114
È anche il caso di notare che tutte le quantità precedentemente trattate (flussi, utilità, costi,
quanto altro) sono i valori medi di variabili intrinsecamente aleatorie (tale aspetto è stato più
volte ampiamente discusso). Il processo dinamico che abbiamo definito riproduce
l'evoluzione temporale del sistema esclusivamente con riferimento a tali valori medi. Si
tratta, dunque, di un processo dinamico deterministico1.
I valori dei parametri a e b del processo dinamico determinano la velocità di evoluzione del
sistema, le sue proprietà di eventuale convergenza verso attrattori di punto fisso e la stabilità
di tali attrattori. Non è, però, questa la sede in cui definire tali proprietà in funzione del valore
dei parametri del processo dinamico. Basti pensare che anche la sola analisi della stabilità
degli attrattori di punto fisso (se esistenti) è un compito piuttosto arduo che può essere svolte
attraverso delle analisi sugli autovalori e gli autovettori del modello, in modo da investigare
sulla presenza di un opportuno intorno dell’attrattore in cui il sistema di relazioni composto
dalla mappa di carico dinamico della rete e dalle funzioni di costo tende ad “essere attratto”
verso il centro dell'intorno stesso.
Quello che si può dire in generale, a titolo esclusivamente indicativo, è che all’aumentare
del valore del parametro a il sistema tende ad evolvere in maniera sempre più instabile e che
altrettanto succede all’aumentare del valore di b.
1 È il processo dinamico che è deterministico, non il modello di scelta discreta con cui si determina la matrice
delle probabilità di scelta preventive, che può essere sia deterministico che probabilistico.
115

D.DSP Reti

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

D.DSP Reti

Caricato da

Copyright:

Formati disponibili

FONDAMENTI DI INGEGNERIA DEI SISTEMI DI TRASPORTO

Fondamenti di Ingegneria dei Sistemi di Trasporto a.a. 2019-20

1 L’ingegneria dei trasporti per i sistemi a rete

2 I Modelli di Scelta Discreti .................................................................................................... 9

2.1 Formalizzazione dei Modelli di Utilità Aleatoria ...................................................................... 11

2.2 Il modello Logit-multinomiale................................................................................................. 23

2.3 Il modello nested-logit............................................................................................................ 26

2.4 Il modello Probit..................................................................................................................... 37

2.5 Variabili di soddisfazione e loro proprietà matematiche ......................................................... 43

2.6 Metodi di aggregazione delle scelte ........................................................................................ 51

3 La Domanda di Trasporto .................................................................................................. 54

3.1 I modelli per la determinazione dei flussi di domanda ............................................................ 56

3.3 I modelli per la stima dei flussi di percorso ............................................................................. 81

4 L’offerta di trasporto ......................................................................................................... 83

4.2 Formalizzazione del modello di offerta ................................................................................... 88

5 L’interazione tra domanda ed offerta .............................................................................. 101

5.2 L’interazione come problema di punto fisso ......................................................................... 104

5.3 Il caso dei modelli deterministici di scelta del percorso......................................................... 109

1 L’INGEGNERIA DEI TRASPORTI PER I SISTEMI A RETE

Un sistema di trasporto a rete può essere definito come l'insieme:

continuamente dall’aeroporto di Capodichino (quasi 10 milioni di passeggeri all’anno nel

§ la presenza di un numero notevole di interazioni reciproche tra queste componenti;

Per ognuno di tali intervalli, dunque, è pensabile di rappresentare la variabile attraverso il

Var_1 Var_2 Var_3 Var_tot

Figura 2 – Dispersione di una variabile e campi di stazionarietà

È evidente che, ancorché l'aleatorietà dei fenomeni modellizzati sia intrinseca ed

2 I MODELLI DI SCELTA DISCRETI

§ scelga l'alternativa per cui l'indicatore di utilità attinge il valore massimo.

2.1 FORMALIZZAZIONE DEI MODELLI DI UTILITÀ ALEATORIA

avendo indicato con:

In seguito alla quale risulta:

Avendo indicato con f(e) e F(e) rispettivamente la funzione di densità di probabilità

f(e/V) = f(e) "eÎEn, 6

Esplicitando la relazione tra utilità percepita, utilità sistematica e dispersione aleatoria è

la precedente relazione può essere facilmente espressa in funzione della densità di

§ le cosiddette “costanti specifiche delle alternative”, con particolare riferimento al loro

2.1.1 PARAMETRI DI RECIPROCA SOSTITUZIONE, ATTRIBUTI GENERICI E ATTRIBUTI

Evidentemente la specificazione completa di un modello di utilità casuale passa per la

§ Alternativa 3 = Moto Custom, cilindrata 883cc, costo 20.000,00 €, lunghezza 2.35mt.

V2X = b cos to × Costo + b lung _ 1 × Lunghezza

V3X = b cos to × Costo + bcilindrata × Cilindrata + b lung _ 2 × Lunghezza

2.1.2 LE COSTANTI SPECIFICHE DELLE ALTERNATIVE

2.1.3 ALCUNE PECULIARITÀ DEI MODELLI DI TIPO INVARIANTE

Ancorché all'interno dell'espressione della probabilità il termine aggiuntivo costante V0 si

2.1.4 L’ALEATORIETÀ NEI MODELLI DI UTILITÀ CASUALE (OVVERO, IL PARADOSSO

1 (ed indistinta rispetto ai vari contributi dei singoli attributi di scelta)

alternative caratterizzate esattamente dallo stesso valore dell'utilità (sistematica, coincidente

2.1.5 LA MATRICE DI DISPERSIONE

Accertata la maggiore profondità di un modello aleatorio ed esplicitate alcune delle

distribuzione aleatoria specifica (funzione di densità di probabilità e/o funzione di

2.2 IL MODELLO LOGIT-MULTINOMIALE

La proprietà di indipendenza degli elementi del vettore di dispersione aleatoria, unita

scelta di due qualsiasi alternative dell'insieme di scelta si mantiene costante al variare

2.3 IL MODELLO NESTED-LOGIT

quelli in cui le alternative non possono essere considerate caratterizzate da distribuzioni

1 Il modello nested-LOGIT è spesso detto anche “LOGIT-gerarchizzato”, “tree-LOGIT” o “LOGIT a più

Si può procedere, dunque, con le probabilità condizionate. Risulta, infatti:

Le probabilità condizionate di scelta delle alternative elementari 2 e 3 sono dunque

Avendo evidentemente posto: YA = ln å expæçV j ö÷

Ne deriva che il massimo tra le utilità percepite appartenenti al gruppo ha media JA YA e

Var [e A ] = Var [h A ] + Var [t _ max A ] = s A2 +

Le probabilità di scelta di livello 1, dunque, valgono rispettivamente:

da ciò deriva anche che: