Sei sulla pagina 1di 16

POLITECNICO DI TORINO

Reti e Sistemi Complessi: Fenomeni Fisici e Interazioni Sociali

Modello epidemico SIR applicato all’influenza A (H1N1)


Kolkata, Bengala Occidentale, India, 2010

Professore:
Igor Simone Stievano

Svolto da:
Marco Accorinti
Alberto Amore
Simona Cucchiara

Anno Accademico 2017-2018


Introduzione
Recentemente, la matematica applicata ha dato un grande contributo alla biologia e
all’epidemiologia attraverso l’implementazione di modelli di diffusione virale che permettono
di analizzare e prevedere gli effetti di un possibile scoppio epidemico. In questo modo è
possibile valutare quali sono le difese necessarie da attuare da parte di enti sanitari, nazioni e
organizzazioni internazionali.
Nella trattazione verrà analizzato un particolare caso di influenza A (H1N1) sviluppatosi nel
2010 a Kolkata, nel Bengala Occidentale in India, dal quale studio si cercherà di generalizzare i
risultati ottenuti, per poi comprendere quali condizioni comportano il verificarsi e il
diffondersi di un'epidemia. Ciò verrà fatto studiandone il comportamento sia attraverso
l'analisi matematica, sia con l'ausilio del calcolatore tracciando l'andamento della popolazione
colpita nello scorrere del tempo. Questo per rispondere ai quesiti più importanti che si pone lo
studio epidemiologico, ovvero: il numero di infetti è destinato a crescere o a calare nel tempo?
Quale sarà il numero massimo di persone colpite? È possibile contrastare la malattia? Come
variano le varie classi con l'evolversi della patologia? L'epidemia si estingue o persiste
comunque nel tempo?
È importante sottolineare come, durante la trattazione, si cercherà di rendere i risultati più
generali possibili. Per cui, partendo dall’ analisi di un caso particolare, le varie classi analizzate
saranno espresse in percentuali, come ogni risultato che ne deriverà. Inoltre, si cercherà di
sviluppare l’analisi attraverso un punto di vista prettamente matematico che porterà ad
un’adeguata esplicitazione, in tal senso, di ogni aspetto.
Lo sviluppo dell’epidemia verrà analizzato attraverso il modello epidemico SIR che
permetterà di costruire opportunamente un sistema di equazioni differenziali risolte tramite
il metodo di Eulero, implementato in Matlab.
Nella prima sezione si cercherà di presentare i modelli adottati e la relativa costruzione
matematica nonché l’esplicitazione delle variabili di interesse, seguite dalla descrizione dei
dati sperimentali utilizzati durante le analisi che seguiranno.
Nella seconda sezione, invece, verrà analizzato il fenomeno di diffusione rappresentando il
comportamento attraverso alcuni grafici. Di questi verranno discussi gli andamenti in
relazione al valore dei parametri che caratterizzano il modello.
Epidemie e SIR Epidemic model

Il termine "epidemia" deriva dal greco e significa "sulla popolazione", ovvero sta ad indicare il
verificarsi di una malattia che colpisce un certo numero di individui, chiamati anche "casi",
superiore a quello che ci si sarebbe aspettato, e può verificarsi in un certo intervallo
temporale, colpire una determinata popolazione oppure un'intera area geografica. Se l'area
colpita è particolarmente estesa si parla anche di "pandemia". Formulare un modello
matematico in grado di descrivere una certa epidemia diventa quindi di fondamentale
importanza per determinare le strategie migliori in grado di contrastare la sua trasmissione e,
di conseguenza, organizzarne l'individuazione, la prevenzione, la terapia ed il controllo.
Un’epidemia può avete tre diversi comportamenti:

• può estinguersi
• può diffondersi (stato endemico)
• può avere un comportamento ciclico, aumentando e diminuendo il suo effetto sulla
popolazione
Uno dei modelli più semplici utilizzati per analizzare un fenomeno epidemico è il modello
SIR, il quale può essere applicato ad ogni rete.
È un modello epidemiologico che calcola il numero teorico di persone in una popolazione
infette da una malattia contagiosa.

Uno dei modelli SIR di base è quello di Kermack-McKendrick, il quale fu il primo modello di
tipo differenziale, proposto nel 1927.
“SIR” è l’acronimo di suscettibile, infetto, rimosso. Infatti, per modellizzare la diffusione delle
malattie o di una epidemia, la popolazione deve essere suddivisa in diverse classi. Ad esempio,
per la maggior parte delle comuni malattie, ha senso suddividere la popolazione in quelle che
sono sensibili alla malattia (S), quelli che sono infetti (I) e quelli che hanno recuperato e sono
immuni (R). Il passaggio da una classe all'altra è determinato da specifici parametri che
possono essere estrapolati esclusivamente da dati empirici.

Schema evoluzione modello SIR


Costruzione del modello matematico
Si descrivono di seguito le osservazioni e le assunzioni fatte per costruire il modello
matematico probabilistico che ci permetta di analizzare opportunamente il fenomeno
considerato. Durante la trattazione si assume che gli eventi coinvolti siano indipendenti.

Si definiscono le seguenti funzioni:

• S(t) percentuale di individui suscettibili;


• I(t) percentuale di individui infetti;
• R(t) percentuale di individui rimossi;

Si useranno i seguenti parametri:

1. α: recovery rate, cioè il tasso con il quale un individuo infetto guarisce e viene rimosso.
([α]=giorni-1)
2. 𝛽: attack rate, cioè la frazione di individui che contraggono la malattia, attraverso il
contatto suscettibile-infetto, per unità di persone e giorni.
([𝛽]= giorni-1 persone-1 )

Indicando poi con  la percentuale di persone che un individuo incontra in media al giorno, si
suppone questa una costante, in quanto si assume N (numero di individui della popolazione)
costante durante il periodo di studio, da cui segue che ogni individuo incontri statisticamente
lo stesso numero di persone. Questo implica che ogni individuo incontrerà un numero  t
I(t)N di infetti per ogni lasso di tempo considerato t .

Sia, poi, P la probabilità che un individuo suscettibile, venendo a contatto con uno infetto,
contragga la malattia. Definiti tali parametri si ha che, in media, al giorno t-esimo un
individuo suscettibile ha probabilità P I(t) di contrarre la malattia e si può quindi assumere
che il numero di contagi nell’ intervallo di tempo t sia:

𝑃𝜈t 𝐼(𝑡) ∙ 𝑆(𝑡)𝑁

Probabilità Numero individui


di suscettibili al
contrarre la malattia tempo t

A partire da queste considerazioni si può ottenere il numero di casi suscettibili relativi al


tempo “t+t” come differenza tra il numero di individui suscettibili e quello di contagi relativi
al tempo t:

𝑆(𝑡 + ∆𝑡)𝑁 = 𝑆(𝑡)𝑁 − 𝑃𝜈Δ𝑡𝐼(𝑡) 𝑆(𝑡)𝑁

Numero di persone Numero di persone Numero di contagi al


suscettibili al tempo suscettibili al tempo t
t+t tempo t
Da cui dividendo per N e ponendo =Pν, si ha la seguente relazione:

(1) 𝑆(𝑡 + Δ𝑡) = 𝑆(𝑡) − 𝛽Δ𝑡𝐼(𝑡)𝑆(𝑡)

Supponendo che ogni giorno in media una percentuale  di individui infetti passi alla classe
dei rimossi, significa che, al tempo t-esimo il numero di individui rimossi dallo studio clinico è
 I(t)N. Queste considerazioni permettono di sviluppare tali uguaglianze:

(2) 𝐼(𝑡 + Δ𝑡)𝑁 = 𝐼(𝑡)𝑁 + 𝛽Δ𝑡𝑆(𝑡)𝐼(𝑡)𝑁 − 𝛼𝐼(𝑡)𝑁

Numero di Numero di Numero di persone Numero di


persone infette persone infette che hanno contratto persone guarite
al tempo t+t al tempo t l’epidemia al tempo t

(3) 𝑅(𝑡 + Δ𝑡)𝑁 = 𝑅(𝑡)𝑁 + 𝛼𝐼(𝑡)𝑁

Numero di persone Numero di Numero di


non a rischio persone non persone guarite
contagio al tempo a rischio al tempo t
t+t contagio al
tempo t

Dividendo le relazioni (2) e (3) per N ed ricordando la (1) si ottiene un primo risultato
descrittivo del modello matematico su cui si costruirà l’ analisi:

S(t + t) = S(t) − βtI(t)S(t)


{ I(t + t) = I(t) + βtS(t)I(t) − tI(t)
R(t + t) = R(t) + tI(t)

Dividendo per t e rielaborando le relazioni si ottiene:

S(t + t) − S(t)


= − βI(t)S(t)
t
I(t + t) − I(t)
= βS(t)I(t) − I(t)
t
R(t + t) − R(t)
= I(t)
{ t

Considerando ora il limite per t → 0 :

̇ = − βI(t)S(t)
𝑆(𝑡)
{ ̇ = βS(t)I(t) − I(t)
𝐼(𝑡) t[0, T]
̇ = I(t)
𝑅(𝑡)
Dove le funzioni S(t), I(t), R(t) risultano derivabili con continuità nell’intervallo di tempo
considerato ed è semplice verificare come una tale costruzione del modello matematico
permetta di avere esistenza ed unicità della soluzione in virtù della regolarità e limitatezza
delle funzioni considerate nell’ intervallo compatto [0, T].

E’ interessante osservare che, avendo ipotizzato N costante, la funzione (t)=S(t)+I(t)+R(t)


risulta essere costante rispetto al tempo:

𝑑(𝜁(𝑡)) 𝑑𝑆(𝑡)
= + 𝐼(𝑡) + 𝑅(𝑡) = 𝑆̇(𝑡) + 𝐼 (̇ 𝑡) + 𝑅̇ (𝑡) = 0
𝑑𝑡 𝑑𝑡

Osservazione (): Fissato un giorno, dato che N è molto grande, dire che  è la percentuale di
infetti che vengono rimossi equivale a dire che ogni infetto ha probabilità  di essere rimosso
dallo studio in quel giorno. Si consideri un individuo che è appena stato contagiato e si indichi
con X la variabile aleatoria che assume valore n se la permanenza nel compartimento degli
infetti dura n giorni. Se denotiamo con τ la durata media della malattia, avremo che τ = E[X] e
X risulta essere una variabile geometrica con valore atteso E[X] = , da cui  = τ−1. Quindi il
1

modello formulato può essere ottenuto anche conoscendo la durata media della malattia
invece della percentuale giornaliera di rimozione dalla classe degli infetti.

Dati sperimentali
Per definire le variabili di interesse β ,  , τ (si ricorda che τ rappresenta l’inverso del recovery
rate) sono stati raccolti i dati sperimentali dettagliati riferiti al periodo in cui si è verificato lo
sviluppo dell’ epidemia, in particolare, i dati raccolti di cui si riporta la rappresentazione
fanno riferimento al lasso di tempo che va dal 5 luglio al 15 agosto del 2010 e sono reperibili
tramite l’ articolo scientifico [2]:
I risultati di tale articolo hanno fornito degli intervalli di confidenza riguardanti il valore di β
in relazione all’ area geografica considerata e sono stati riportati nella seguente immagine:

L’ analisi sarà limitata alla popolazione dell’area geografica di Kolkata Metropolitan


Corporation, la quale presenta una popolazione intorno ai 4,5 milioni come descritto in [2] e
rispetto alla quale è stato fornito un intervallo per β che comprende i valori 20-29/100.000
mentre per τ da 5 a 7 da cui si ricava quello di  sfruttando l′ 𝑜𝑠𝑠𝑒𝑟𝑣𝑎𝑧𝑖𝑜𝑛𝑒 () . Le unità e i
valori per le variabili saranno le seguenti:

• N = 4500 [persone] definendo la sua unità per 103 persone;


25
• β/N = 106 [giorni]−1 [persone]−1;
• τ = 6 [giorni];
1
•  = 6  0.167 [giorni]−1 ;
Risoluzione numerica: metodo di Eulero
Il metodo più semplice di integrazione numerica per equazioni differenziali è quello di Eulero.
Si consideri come riferimento una singola equazione differenziale del primo ordine del tipo:

𝑑𝑥
= 𝑓(𝑡, 𝑥)
𝑑𝑡
con condizione iniziale: 𝑥(0) = 𝑥𝑜 .
L’incognita del problema è la funzione 𝑥(𝑡) e la soluzione numerica sarà rappresentata da un
vettore di punti campionati nel tempo: 𝑥(𝑡𝑖 ).

Costruzione metodo:
𝑑𝑥
• La derivata prima viene approssimata con il rapporto incrementale:
𝑑𝑡

𝑥(𝑡 + ∆𝑡) − 𝑥(𝑡)


∆𝑡

• Il termine ∆𝑡 rappresenta il passo.


• L’equazione differenziale, con queste approssimazioni diventa:

𝑥(𝑡 + ∆𝑡) − 𝑥(𝑡)


=𝑓 → 𝑥(𝑡 + ∆𝑡) = 𝑥(𝑡) + 𝑓∆𝑡
∆𝑡

Il metodo di Eulero è un metodo iterativo, in cui viene assegnato 𝑡𝑓 , il tempo finale da


raggiungere.
Si parte dalla condizione iniziale 𝑥𝑜 al tempo iniziale 𝑡𝑜 ,

Algoritmo
o Passo 1:
Se 𝑡1 = 𝑡𝑜 + ∆𝑡 < 𝑡𝑓
Sia 𝑥1 = 𝑥(𝑡1 ) = 𝑥(𝑡𝑜 ) + 𝑓(𝑡𝑜 , 𝑥𝑜 )∆𝑡 = 𝑥0 + 𝑓(𝑡𝑜 , 𝑥𝑜 )∆𝑡

o Passo2:
Se t 2 = t1 + ∆t < 𝑡𝑓
Sia 𝑥2 = 𝑥(𝑡2 ) = 𝑥(𝑡1 ) + 𝑓(𝑡1 , 𝑥1 )∆𝑡 = 𝑥1 + 𝑓(𝑡1 , 𝑥1 )∆𝑡

.
.
.

o Passo i
Se 𝑡𝑖 = 𝑡𝑖−1 + ∆𝑡 < 𝑡𝑓
Sia 𝑥𝑖 = 𝑥(𝑡𝑖 ) = 𝑥(𝑡𝑖−1 ) + 𝑓(𝑡𝑖−1 , 𝑥𝑖−1 )∆𝑡 = 𝑥𝑖−1 + 𝑓(𝑡𝑖−1 , 𝑥𝑖−1 )∆𝑡
Analisi numerica

Il metodo generale consiste nel seguente sistema di equazioni differenziali:

̇ = − βI(t)S(t)
𝑆(𝑡)
{ ̇ = βS(t)I(t) − I(t)
𝐼(𝑡)
̇ = I(t)
𝑅(𝑡)

Chiamando 𝑋 = ( 𝑆(𝑡), 𝐼(𝑡), 𝑅(𝑡) ) possiamo determinare i punti di equilibrio del seguente
sistema ponendo:

𝑑𝑋(𝑡) 𝑑𝑆(𝑡) 𝑑𝐼(𝑡) 𝑑𝑅(𝑡)


=0 ⇒ = = = 0 ⇒ 𝐼(𝑡) = 0
𝑑𝑡 𝑑𝑡 𝑑𝑡 𝑑𝑡

Perciò, all’equilibrio la percentuale delle persone infette sarà 0. Si nota sostituendo I(t)=0 al
sistema che la percentuale di persone suscettibili all’equilibrio non risulta essere
necessariamente 0 % , così come quella delle persone che hanno rimosso il virus non sarà
necessariamente 100 %. Si noterà che le curve S(t) e 𝑅(𝑡) tendono ad un valore costante.

La velocità di convergenza verso il punto di equilbrio e l’andamento qualitativo delle


soluzioni con lo scorrere del tempo sono influenzati dai parametri  e β. L’ analisi di tali
parametri sarà al centro della simulazione numerica.

Di seguito verranno riportati dei grafici qualitativi del comportamento della percentuale di
individui suscettibili, infetti e guariti al variare dei parametri  e β che caratterizzano
l’epidemia, ottenti risolvendo il sistema attraverso il metodo di Eulero.
I grafici qualitativi seguenti rappresentano l’andamento di S(t), I(t) ed R(t) al variare del
tempo mantenendo fisso il recovery rate  e facendo variare l’attack rate β e viceversa.

• Si considera  = 0.167, β = 0.00005, 0.00025 e 0.0025.

Dai grafici precedenti si nota che se β cresce, si ha uno sviluppo sempre più rapido
dell’epidemia e, conseguentemente, ad una crescita di I(t) che raggiunge un massimo sempre
più alto in un intervallo di tempo sempre più breve [0, 𝑡𝑚𝑎𝑥 ].
Inoltre si osserva che l’epidemia si estingue sempre più rapidamente, in quanto la pendenza
della funzione I(t) per 𝑡 > 𝑡𝑚𝑎𝑥 , è crescente in modulo al crescere di β.
• Si considera β = 0.00025 e  = 0.1, 0.3, 0.5.

Dai grafici si evince il significato fisico del parametro . Infatti, all’aumentare del recovery
rate il numero di persone infettate diminuisce e la percentuale di persone che hanno rimosso
il virus cresce più rapidamente. Inoltre, si nota che il massimo valore di I(t) viene raggiunto
nello stesso tempo 𝑡 = 𝑡𝑚𝑎𝑥 in tutti i grafici.
Effetto soglia
Un altro parametro importante è definito come il rapporto tra il recovery rate e l’attack rate,
indicato con:
α
𝛾=
β

Verrà chiamato threshold number, in quanto come si vedrà dopo, rappresenta una soglia
caratteristica per lo studio dell’andamento degli individui infetti.
Il suo reciproco indica il numero atteso di infetti generati da ciascun individuo infetto in una
grande popolazione di suscettibili. Nello studio epidemiologico è una quantità molto
importante e misura essenzialmente il massimo potenziale riproduttivo per una malattia.
Si riprenda in esame il sistema di equazioni differenziali caratterizzante il modello:
̇ = − βI(t)S(t)
𝑆(𝑡)
{ ̇ = βS(t)I(t) − I(t)
𝐼(𝑡)
̇ = I(t)
𝑅(𝑡)

Riscrivendo la seconda equazione del sistema, si nota che la variazione della percentuale di
individui infetti dipende dal parametro 𝛾:

𝑑𝐼(𝑡) 𝛽 1
=  𝐼(𝑡) ( 𝑆(𝑡) − 1) = 𝐼(𝑡) ( 𝑆(𝑡) − 1)
𝑑𝑡  𝛾

Si possono avere i seguenti casi:


𝑑𝐼(𝑡)
• 𝑆(𝑡) > 𝛾 ⇒ > 0 ⇒ ci sarà una crescita di giorno in giorno di individui infetti,
𝑑𝑡
finchè 𝐼(𝑡) raggiunge un picco .
𝑑𝐼(𝑡)
• 𝑆(𝑡) < 𝛾 ⇒ < 0 ⇒ il numero di individui infetti diminuisce nel tempo e
𝑑𝑡
indipendentemente dal numero iniziale di individui suscettibili non ci potrà essere
sviluppo dell’epidemia.

Tenuto conto che il numero dei suscettibili S(t) diminuisce al passare del tempo, prima o
poi esso finirà sotto il valore soglia 𝛾 e il numero di ammalati comincerà a calare. Questo
implica che l’epidemia tenderà ad estinguersi.
Inoltre, dividendo la prima equazione per la terza si ottiene:

𝑑𝑆(𝑡) β 1 𝑆(𝑡) 𝑑𝑆(𝑡) 1 𝑅(𝑡)


= −  𝑆(𝑡) = − 𝛾 𝑆(𝑡) ∫𝑆(0) = − 𝛾 ∫𝑅(0) 𝑑𝑅(𝑡)
𝑑𝑅(𝑡) 𝑆(𝑡)
integrando
Quindi si ottiene:
1
− (𝑅(𝑡)−𝑅(0))
𝑆(𝑡) = 𝑆(0) 𝑒 𝛾

Nello studio di un epidemia è importante saper stimare la percentuale della popolazione che
sarà colpita dalla malattia. Questo equivale a studiare il limite di S(t) per valori di t molto
grandi e quindi trovare il numero massimo di individui contagiati in modo da avere una
misura dell’impatto che l’epidemia ha sulla popolazione.
Quindi, durante lo sviluppo dell’epidemia, il numero di suscettibili diminuisce e il numero di
rimossi aumenta. Dall’equazione si vede che il numero di suscettibili è sempre positivo in
1
− (𝑅(𝑡)−𝑅(0))
quanto 𝑒 𝛾 è sempre positiva.

Da questo possiamo affermare che ci sarà sempre un numero di suscettibili che sfugge
all’infezione. Quindi la catena trasmissiva dell’infezione si fermerà non per la mancanza di
suscettibili ma per la diminuzione e il declino degli infetti.

Di seguito riporteremo dei grafici al variare di 𝛾. Si terrà conto anche di 𝑆(0), cioè della
percentuale iniziale di persone suscettibili. La risposta grafica sarà la seguente:

(a) (b)
(c) (d)

Fissato 𝑆(0), più 𝛾 diventa grande, più la percentuale di persone infette fa fatica ad aumentare
con il passare dei giorni. Infine quando 𝛾 è prossimo o anche superiore a 𝑆(0), praticamente
l’epidemia non si sviluppa (d).

Ritratto di fase
Il ruolo di 𝛾 è importante in quanto permette di capire se i suscettibili finiranno comunque,
prima o poi, per ammalarsi o una parte di essi sfuggirà al contagio.
Al fine di ribadire il significato del threshold number, viene trovata la relazione tra I(t) ed S(t)
in modo tale da tracciarne il diagramma di fase. Considerando nuovamente il sistema di
equazioni differenziali e dividendo la seconda equazione per la prima si ottiene:

𝑑𝐼(𝑡) 𝛼 1 𝐼(𝑡) 𝑆(𝑡) 1


= 1−𝛽 = 1 − 𝛾 𝑆(𝑡) ∫𝐼(0) 𝑑𝐼(𝑡) = ∫𝑆(0) ( 1 − 𝛾 ) 𝑑𝑆(𝑡)
𝑑𝑆(𝑡) 𝑆(𝑡) 𝑆(𝑡)
integrando

𝑆(𝑡)
𝐼(𝑡) = 𝐼(0) + 𝑆(0) − 𝑆(𝑡) + 𝛾𝑙𝑛 | |
𝑆(0)

Rappresentando graficamente il ritratto di fase al variare di 𝛾 (figura seguente) si deduce che


al crescere di tale parametro le orbite tendono più rapidamente a raggiungere lo zero per
valori alti di S(t). Conseguentemente a questo risultato deriva che l’epidemia coinvolge un
numero di individui suscettibili sempre minore ed è possibile quantificare il numero di
suscettibili che sfugge al contagio.
Inoltre si evidenzia che al crescere di 𝛾, il suo reciproco, ovvero il massimo potenziale
riproduttivo, decresce e questo implica che l’epidemia ha un impatto inferiore sulla
popolazione.
Conclusioni
Al termine di questa analisi si evince che il modello SIR applicato all’influenza A (H1N1) è,
nonostante le dovute semplificazioni, uno strumento efficace per lo studio dell’evolversi della
malattia.
Dall’analisi numerica si deduce che i risultati ottenuti dipendono intrinsecamente dai
parametri di contagio e di guarigione 𝛽 e , che influenzano, come detto in precedenza,
velocità di contagio della malattia, picco di persone infette e velocità di guarigione.
Inoltre, si è dedotto che questi parametri non influenzano in modo indipendente lo stato
𝛼
dell’epidemia, bensì il loro rapporto 𝛽 è il parametro che caratterizza la misura dell’impatto
epidemico sulla popolazione.
In conclusione, lo studio di questo modello, ed in generale la matematica applicata, può dar
spunti per eventuali misure cautelative in modo tale da ridurre al massimo lo sviluppo della
malattia, aiutando enti sanitari, nazioni e società internazionali coinvolte nel suo studio.
Bibliografia
[1] SIR Epidemic model for influenza A (H1N1): Modeling the outbreak of the pandemic in
Kolkata, West Bengal, India, 2010;
[2] An outbreak of pandemic influenza A (H1N1) in Kolkata, West Bengal, India,2010;
[3] Optimal Fuzzy control of SIR epidemic with state dependent cost function;
[4] Controllo ottimale di epidemie di tipo SIR mediante vaccinazione;
[5] Metodo di Eulero, Wikipedia, the free encyclopedia;
[6] Basic Statistics, Kolkata Municipal Corporation;

Potrebbero piacerti anche