Sei sulla pagina 1di 19

Deep learning

I ricercatori del laboratorio di Google nel 2012 hanno costruito una rete neurale
composta da 16.000 processori per computer con un miliardo di connessioni. Questo
sviluppo è stato particolarmente significativo per il campo del riconoscimento
facciale e delle immagini, compiti che oggi vengono regolarmente completati dalle
reti neurali.
Col termine deep learning intendiamo quella sottocategoria del machine learning
facente parte del mondo dell’intelligenza artificiale.
Andando più a fondo, il deep learning fa riferimento agli algoritmi ispirati alla
struttura e alla funzione del cervello chiamate reti neurali artificiali. Questo studio è
volto all’apprendimento da parte di specifiche macchine attraverso dati appresi grazie
all’utilizzo di tali algoritmi, i quali usano vari livelli di unità non lineari a cascata
per svolgere compiti di estrazione di caratteristiche e di trasformazione e sono
basati sull’apprendimento non supervisionato di livelli gerarchici multipli di
caratteristiche (e di rappresentazioni) dei dati apprendendo multipli livelli di
rappresentazione che corrispondono a differenti livelli di astrazione; questi livelli
formano una gerarchia di concetti.
Applicando il Deep Learning, avremo quindi una “macchina” che riesce
autonomamente a classificare i dati ed a strutturarli gerarchicamente, trovando quelli
più rilevanti e utili alla risoluzione di un problema (esattamente come fa la mente
umana), migliorando le proprie prestazioni con l’apprendimento continuo.
Per cui, esattamente come fa il nostro cervello biologico, il deep learning pone una
classificazione dei dati più rilevanti per giungere ad una conclusione e sfrutta le reti
neurali artificiali, modelli di calcolo matematico-informatici basati sul funzionamento
delle reti neurali biologiche, ossia modelli costituiti da interconnessioni di
informazioni, che si presentano come un sistema “adattivo” in grado di modificare la
sua struttura (i nodi e le interconnessioni) basandosi sia su dati esterni sia su
informazioni interne che si connettono e passano attraverso la rete neurale durante la
fase di apprendimento e ragionamento.

Reti neurali artificiali


Le reti neurali artificiali sono modelli di calcolo matematici- informatici composti da
neuroni artificiali, ossia modelli costituiti da interconnessioni di informazioni, che si
ispirano al funzionamento biologico del cervello umano. Tali interconnessioni si
basano su un modello di scienze cognitive chiamato PDP, ovvero Parallel Distributed
Processing (elaborazione a parallelismo distribuito delle informazioni).
L’idea di poter replicare artificialmente il cervello umano, simulandone il
funzionamento, attraverso delle reti neurali artificiali inizia dai primi anni ’40 del XX
secolo → il primo neurone artificiale fu proposto da W.S. McCulloch e W. Pitts in un
famoso lavoro del 1943 intitolato “A Logical Calculus of the Ideas Immanent in
Nervous Activity”.

Rete neurale biologica Rete neurale artificiale

Ricevere dati esterni Attraverso i sensi Attraverso nodi


d’ingresso che
costituiscono il
processore.
Elaborazione dei dati in Attraverso i neuroni Attraverso strutture non
informazioni interconnessi in una lineari di dati statistici.
struttura non lineare e
variabile
Le reti neurali sono formate da tre strati:
1. lo strato degli ingressi (I – Input): è quello che ha il compito di ricevere ed
elaborare i segnali in ingresso adattandoli alle richieste dei neuroni della rete;
2. il cosiddetto strato H – hidden (strato nascosto): è quello che ha in carica il
processo di elaborazione vero e proprio (e può anche essere strutturato con più
colonne-livelli di neuroni);
3. lo strato di uscita (O – Output): qui vengono raccolti i risultati
dell’elaborazione dello strato H e vengono adattati alle richieste del successivo
livello-blocco della rete neurale.
Affinché tali reti funzionino, è necessario che questi apprendano come comportarsi
quando si risolve un problema ingegneristico; esempio classico è l’evoluzione della
tecnologia del riconoscimento facciale. L’apprendimento delle reti neurali è collegato
al Machine Learning, che utilizza vari modelli matematico-computazionali per
apprendere informazioni dall’esperienza, quindi in modo automatico.
I principali modelli sono:
- Apprendimento supervisionato (Supervised Learning): all’algoritmo vengono
forniti sia set di dati come input sia le informazioni relative ai risultati
desiderati con l’obiettivo che la rete identifichi una regola generale che
colleghi i dati in ingresso con quelli in uscita;
- Apprendimento non supervisionato (Unsupervised Learning)
- Apprendimento per rinforzo
- Apprendimento semi-supervisionato: è un modello “ibrido” dove al computer
viene fornito un set di dati incompleti per l’allenamento/apprendimento.

Come funziona il deep learning


Il deep learning sfrutta le reti neurali artificiali per insegnare alle macchine ad
apprendere in modo automatico e profondo ovvero su più livelli, definiti come
hydden layer (livelli nascosti) che possono essere anche un centinaio e oltre. Questi
vengono sfruttati per costruire più livelli di estrazione. I molteplici livelli di
estrazione possono dare alle reti neurali profonde un vantaggio enorme nell’imparare
a risolvere complessi problemi di riconoscimento di schemi proprio perché ad ogni
livello intermedio aggiungono informazioni e analisi utili a fornire un output
affidabile. Una applicazione che utilizza algoritmi di Deep Learning può mostrare e
ordinare milioni di immagini, identificando con precisione quali immagini
contengono i set di dati, in pochi minuti pur non avendo avuto alcun tipo di
indirizzamento sulla correttezza o meno dell’identificazione di determinate immagini
nel corso del training. Questi sistemi si basano, in sostanza, su un processo di
apprendimento “trial-and-error” ma perché l’output finale sia affidabile sono
necessarie enormi quantità di dati. L’accuratezza dell’output richiede, almeno nella
prima fase di addestramento, l’utilizzo di dati “etichettati” (contenenti dei meta tag)
che significa che l’utilizzo di dati non strutturati potrebbero rappresentare un
problema. I dati non strutturati possono essere analizzati da un modello di
apprendimento profondo una volta formato e raggiunto un livello accettabile di
accuratezza, ma non per la fase di training del sistema.

Deep learning Sistemi di


apprendimento
superficiale (Machine
learning)
Aumentando i dati Le prestazioni La performance rimane
migliorano uguale (vi è un limite)
Sistemi di L ‘estrazione delle Le caratteristiche di un
riconoscimento visivo caratteristiche avviene oggetto vengono estratte
in automatico manualmente per creare
un modello di
categorizzazione degli
oggetti
Dal punto di vista Il suo funzionamento è Più accessibili
economico più impattante (CPU e
GPU costano ancora
migliaia di dollari)
Algoritmi di Sono impilati in una lineari
apprendimento gerarchia di crescente
complessità

I sistemi basati su Deep Learning sono difficili da addestrare a causa del numero
stesso di strati nella rete neurale. Il numero di strati e collegamenti tra i neuroni nella
rete è tale che può diventare difficile calcolare le “regolazioni” che devono essere
apportate in ogni fase del processo di addestramento (un problema indicato come
problema della scomparsa del gradiente); questo perché per il training comunemente
si usano i cosiddetti algoritmi di retro propagazione dell’errore (backpropagation)
attraverso il quale si rivedono i pesi della rete neurale (le connessioni tra i neuroni) in
caso di errori (la rete propaga all’indietro l’errore in modo che i pesi delle
connessioni vengano aggiornati in modo più appropriato).

Nell’ambito della ricerca sull’Artificial Intelligence, l’apprendimento automatico ha


riscosso un notevole successo negli ultimi anni, consentendo ai computer di superare
o avvicinarsi alle prestazioni umane corrispondenti in aree che vanno dal
riconoscimento facciale al riconoscimento vocale e linguistico. L’apprendimento
profondo invece consente ai computer di fare un passo in avanti, in particolare di
risolvere una serie di problemi complessi.

CASI DI APPLICAZIONE
Gli ambiti in cui oggi viene utilizzato il deep learning sono molto vari; dalla
computer vision per le auto senza conducente, fino robot droni impiegati per la
consegna di pacchi o anche per l’assistenza in casi di emergenza. E ancora:
riconoscimento e sintesi vocale e linguistica per chatbot e robot di servizio,
riconoscimento facciale per sorveglianza in paesi come la Cina; riconoscimento
immagini per aiutare i radiologi a individuare i tumori nei raggi X, oppure la visione
del computer che rende possibile il supermercato Amazon Go senza cassa.
Ad oggi il DP è largamente utilizzato anche nell’ambito medico e i suoi punti di forza
includono la capacità di automatizzare l'interpretazione delle immagini mediche,
migliorare il processo decisionale clinico, identificare nuovi fenotipi e selezionare
percorsi di trattamento migliori in malattie complesse. Il deep learning può essere
adatto alla medicina cardiovascolare in cui gli indici emodinamici ed
elettrofisiologici sono sempre più catturati su base continua da dispositivi indossabili
e dalla segmentazione delle immagini nell'imaging cardiaco. Tuttavia, DL ha anche
debolezze significative, tra cui difficoltà nell'interpretazione dei suoi modelli, la
mancanza di standardizzazione nella progettazione, la mancanza di efficienza dei dati
nella formazione, l'applicabilità limitata agli studi clinici e altri fattori. Pertanto,
l'applicazione clinica ottimale della DL richiede un'attenta formulazione di problemi
risolvibili, la selezione degli algoritmi e dei dati DL più appropriati e
un'interpretazione equilibrata dei risultati.
Guardando invece ai compiti che una macchina può svolgere grazie al Deep
Learning si possono riportare:

1) Colorazione automatica delle immagini in bianco e nero (per la rete neurale


significa riconoscere bordi, sfondi, dettagli e conoscere i colori tipici di una farfalla,
per esempio, sapendo esattamente dove collocare il colore corretto);
2) Aggiunta automatica di suoni a filmati silenziosi;
3) Traduzione simultanea (per il sistema di Deep Learning significa ascoltare e
riconoscere il linguaggio naturale, riconoscere la lingua parlata e tradurre il
significato in un’altra lingua);
4) Classificazione degli oggetti all’interno di una fotografia (il sistema in questo caso
è in grado di riconoscere e classificare tutto ciò che vede in un’immagine;
5) Generazione automatica della grafia.
ARTICOLO

Stratificazione del rischio cardiovascolare basata


sull’apprendimento profondo utilizzando i punteggi del calcio
dell’arteria coronarica previsti dalle fotografie della retina
Tyler Hyungtaek Rim, Chan Joo Lee, Yih-Chung Tham, Ning Cheung, Marco Yu, Geunyoung Lee, Youngnam Kim, Daniel S W Ting, Crystal Chun
Yuen Chong, Yoon Seong Choi, Tae Keun Yoo, Ik Hee Ryu, Su Jung Baik, Young Ah Kim, Sung Kyu Kim, Sang-Hak Lee, Byoung Kwon Lee, Seok-Min
Kang, Edmund Yick Mun Wong, Hyeon Chang Kim, Sung Soo Kim, Sungha Park, Ching-Yu Cheng, Tien Yin Wong,

Deep-learning-based cardiovascular risk stratification using coronary artery calcium scores predicted from retinal photographs,

The Lancet Digital Health,

Volume 3, Issue 5, 2021

Le malattie cardiovascolari (CVD) causano la più alta mortalità a livello globale. Con
l'aumento dei costi sanitari, la valutazione precoce del rischio di CVD non invasiva è
vitale. I metodi convenzionali hanno mostrato scarse prestazioni rispetto ai metodi di
intelligenza artificiale (AI) più recenti e in rapida evoluzione. La causa principale
della CVD è la deposizione aterosclerotica nelle arterie coronarie del cuore. A causa
di diversi tipi di comorbidità come il diabete, la malattia renale cronica, l'artrite
reumatoide, l'ipertensione, i lipidi elevati e le malattie cerebrali, il rischio di CVD è in
aumento, mettendo i pazienti a più alto rischio di malattie cardiache e ictus.
Con il progresso dell'IA nel campo dell'assistenza sanitaria, in particolare
nell'apprendimento automatico (ML), nell'apprendimento profondo (DL), combinato
con soluzioni mobili come l'e-health e le tecnologie basate su cloud, la valutazione
del rischio CVD ha mostrato segni promettenti.
La biologia e la medicina sono discipline ricche di dati, ma i dati sono complessi e
spesso mal compresi, quindi, le tecniche di deep learning possono essere
particolarmente adatte per risolvere i problemi di questi campi. I recenti progressi
nell'intelligenza artificiale, in particolare nel deep learning, hanno dimostrato la sua
fattibilità in diverse applicazioni mediche come la diagnostica e l'imaging medico, la
gestione del rischio o gli assistenti virtuali. Soprattutto nell'imaging medico c'è un
grande potenziale in quanto il deep learning può essere utilizzato con successo per
identificare e segmentare oggetti all'interno dello spazio di immagine tridimensionale.
Ciò rende il deep learning una tecnologia promettente per automatizzare la previsione
degli eventi cardiovascolari dall'imaging.
In questo articolo osserviamo come il calcio coronarico (CAC) sia un marker
preclinico di aterosclerosi molto importante ed è fortemente associato al rischio di
malattie cardiovascolari cliniche. La misurazione dei punteggi CAC, pertanto, è stata
sempre più utilizzata per la stratificazione del rischio di malattie cardiovascolari,
insieme ai modelli di previsione del rischio clinico nelle linee guida internazionali. Le
linee guida dell'American College of Cardiology/American Heart Association
(ACC/AHA) raccomandano l'uso dell'equazione PCE per classificare le persone a
rischio di malattie cardiovascolari e determinare a chi dovrebbe essere somministrata
la terapia con statine.
Per il gruppo a rischio intermedio, le linee guida raccomandano di misurare il calcio
coronarico (CAC) per aiutare nella decisione della terapia con statine. In questo
articolo si è creato uno score CAC basato sull'apprendimento profondo previsto
dalle fotografie retiniche (RetiCAC) e viene utilizzato questo nuovo punteggio
RetiCAC per la stratificazione del rischio cardiovascolare. La ricerca consiste in studi
che applicano il deep learning alle fotografie retiniche per la previsione di eventi
cardiovascolari attraverso la combinazione dei termini di ricerca di intelligenza
artificiale ("apprendimento profondo" o "apprendimento automatico"), immagine
retinica ("retina") e "calcio coronarico”. Valore aggiunto di questo studio è lo
sviluppo del RetiCAC per predire la presenza di CAC misurato con scansione TC.
Basato su RetiCAC, una nuova fotografia retinica a tre livelli fornisce informazioni
sulla vascolarizzazione umana e approfondimenti sulla salute cardiovascolare. Ampi
studi sulla popolazione hanno dimostrato che un evidente danno vascolare retinico
(segni di retinopatia come microaneurismi ed emorragie retiniche) e alterazioni più
sottili (restringimento arteriolare della retina) sono marker di malattia cardiovascolare
subclinica (stenosi dell'arteria carotidea) e possono predire i principali eventi di
malattie cardiovascolari e la mortalità.

L’applicazione dell'intelligenza artificiale attraverso algoritmi di deep learning


ha suggerito che le fotografie retiniche possono fornire stime sui tradizionali
fattori di rischio di malattie cardiovascolari, come età, sesso e pressione
sanguigna, e possono prevedere eventi di malattie cardiovascolari sviluppando
un algoritmo di apprendimento profondo per prevedere la probabilità della
presenza di CAC sulla base di fotografie retiniche.
Metodo

È stata definita la presenza del CAC pari a zero come assenza di CAC e superiore a
zero come presenza di CAC, rivelando un basso rischio di malattie cardiovascolari
tra gli individui con un punteggio CAC pari a zero.
Sono stati utilizzati dati clinici e 216.152 fotografie retiniche da cinque set di dati o
studi indipendenti provenienti da Corea del Sud, Singapore e Regno Unito per
convalidare gli algoritmi. Nello specifico abbiamo; il centro di ricerca sull'eziologia
delle malattie cardiovascolari e metaboliche ad alto rischio (CMERC-HI), lo studio
Singapore Epidemiology of Eye Diseases (SEED), e la UK Biobank.
Utilizzando un set di dati di un centro di screening sanitario sudcoreano, è stato
addestrato un algoritmo di apprendimento profondo per prevedere la probabilità della
presenza di CAC. Sono stati stratificati i punteggi RetiCAC in terzili e utilizzato
modelli di rischi proporzionali per valutare la capacità di RetiCAC di prevedere
eventi cardiovascolari sulla base di set di test esterni provenienti da Corea del Sud,
Singapore e Dalla Biobanca del Regno Unito. Sono stati, quindi, valutati i valori
incrementali di RetiCAC e aggiunti alla Pooled Cohort Equation (PCE) per i
partecipanti alla Biobanca del Regno Unito.
L’incidenza cumulativa degli eventi cardiovascolari è stata valutata nei tre gruppi (a
basso, moderato e alto rischio) definiti dai punteggi RetiCAC e in tre gruppi
stratificati in base ai punteggi CAC misurati con la TC cardiaca (0,>0-100 e >100)
utilizzando il metodo di Kaplan-Meier e Cox modello proporzionale di pericoli per
stimare i rapporti di pericoli (HR).
Il valore prognostico incrementale del RetiCAC rispetto alla PCE nella previsione
degli eventi di malattie cardiovascolari è stato valutato utilizzando il metodo di
Kaplan-Meier, la statistica C di Harrell e NRI Continua nei gruppi a rischio
borderline e intermedio della UK Biobank. L’incidenza cumulativa degli eventi di
malattia cardiovascolare è stata valutata in quattro gruppi a rischio stratificati in base
al PCE (<5% [basso rischio]; 5%-<7,5% [rischio limite]; 27,5%-<20% [rischio
intermedio]; e ≥20% [rischio elevato]) e nei tre gruppi (rischio basso, moderato e
elevato) secondo il RetiCAC.
L’analisi è stata ripetuta includendo individui sotto trattamento con statine. Inoltre, è
stata posta un’ultima analisi includendo tutti i partecipanti (neri, cinesi, misti o di
altre origini etniche, sud asiatiche e bianchi).
RISULTATI
RetiCAC ha sovraperformato tutti i modelli a singolo parametro clinico nel predire la
presenza di CAC (area sotto la curva caratteristica operativa del ricevitore di 0,742,
IC 95% 0,732-0,753). Tra i 527 partecipanti alla coorte clinica sudcoreana, 33 (6,3%)
hanno avuto eventi cardiovascolari durante il follow-up di 5 anni. Nella coorte basata
sulla popolazione di Singapore (n = 8551), 310 (3,6%) partecipanti hanno avuto
eventi cardiovascolari fatali per 10 anni e i tre strati RetiCAC sono stati
significativamente associati ad un aumentato rischio di eventi cardiovascolari fatali.
Nella Biobanca del Regno Unito (n = 47 679), 337 (0,7%) partecipanti hanno avuto
eventi cardiovascolari fatali per 10 anni. Quando aggiunto al PCE, il RetiCAC a tre
strati ha migliorato la stratificazione del rischio cardiovascolare nel gruppo a rischio
intermedio e nel gruppo a rischio borderline.
Il modello di punteggio RetiCAC ha mostrato prestazioni superiori, rispetto a modelli
mono parametri, quali l’età e il glucosio.
Eventi di malattie Persona- Incidenza* Modello aggiustato per età e per Modello corretto per il rischio †

cardiovascolari/n anno sesso


RISORSE UMANE (IC 95%) valore RISORSE UMANE (IC valore
p 95%) p
Set di dati CMERC-HI
Punteggio CAC
0 6/217 895·2 0·7 1 (rif) NA 1 (rif) NA
>0–100 9/145 604·5 1·5 2·35 (0·80–6·89) 0·159 2·19 (0·74–6·50) 0·159
>100 18/165 664·7 2·7 4·18 (1·53–11·38) 0·005 3·34 (1·20–9·36) 0·021
Andamento delle risorse umane NA NA NA 1·51 (1·14–2·02) 0·005‡ 1·40 (1·04–1·88) 0·024 ‡

Statistica C NA NA NA 0·67 (0·57–0·76) NA 0·71 (0·61–0·80) NA


Punteggio RetiCAC
Basso 5/176 721·7 0·7 1 (rif) NA 1 (rif) NA
Moderato 8/176 727·2 1·1 1·90 (0·58–6·77) 0·274 1·71 (0·49–5·98) 0·399
Alto 20/175 715·6 2·8 5·43 (1·63–18·07) 0·006 4·10 (1·22–13·77) 0·023
Andamento delle risorse umane NA NA NA 2·37 (1·37–4·09) 0·002 ‡ 2·02 (1·18–3·46) 0·009 ‡

Statistica C NA NA NA 0·68 (0·58–0·79) NA 0·71 (0·59–0·82) NA


Set di dati SEED
Punteggio RetiCAC per eventi cardiovascolari SCORE
Basso 29/2327 24 547·2 0·1 1 (rif) NA 1 (rif) NA
Moderato 52/2966 30 944·4 0·2 1·26 (0·79–2·01) 0·338 1·04 (0·65–1·67) 0·856
Alto 229/3258 31 594·7 0·7 2·28 (1·38–3·77) 0·001 1·63 (0·98–2·69) 0·058
Andamento delle risorse umane NA NA NA 1·57 (1·22–2·01) <0·001 ‡ 1·33 (1·04–1·71) 0·023 ‡

Statistica C NA NA NA 0·77 (0·75–0·80) NA 0·81 (0·79–0·83) NA


Punteggio RetiCAC per eventi ACC/AHA ASCVD
Basso 152/2327 23 862·6 0·6 1 (rif) NA 1 (rif) NA
Moderato 240/2966 29 988·3 0·8 1·34 (1·09–1·66) 0·007 1·15 (0·93–1·42) 0·201
Alto 600/3258 29 675·9 2·0 2·07 (1·61–2·65) <0·001 1·53 (1·19–1·96) <0·001
Andamento delle risorse umane NA NA NA 1·45 (1·28–1·64) <0·001 ‡ 1·25 (1·10–1·41) <0·001 ‡

Statistica C NA NA NA 0·71 (0·70–0·73) NA 0·76 (0·74–0·77) NA


Set di dati della Biobanca del Regno Unito
Punteggio RetiCAC per gli eventi di malattia cardiovascolare SCORE
Basso 76/22 431 216 303·7 0·4 1 (rif) NA 1 (rif) NA
Moderato 140/14 624 136 340·1 1·0 1·60 (1·20–2·13) 0·001 1·51 (1·14–2·02) 0·005
Alto 121/10 624 95 520·9 1·3 1·64 (1·21–2·22) 0·001 1·54 (1·14–2·08) 0·005
Andamento delle risorse umane NA NA NA 1·25 (1·08–1·44) 0·002 ‡ 1·21 (1·05–1·40) 0·008 ‡

Statistica C NA NA NA 0·77 (0·75–0·79) NA 0·80 (0·77–0·82) NA


Punteggio RetiCAC per eventi ACC/AHA ASCVD
Basso 360/22 431 213 039·3 1·7 1 (rif) NA 1 (rif) NA
Moderato 419/14 624 133 693·0 3·1 1·18 (1·02–1·37) 0·025 1·13 (0·98–1·31) 0·097
Alto 405/10 624 93 326·6 4·3 1·41 (1·21–1·64) <0·0001 1·35 (1·16–1·57) 0·0001
Andamento delle risorse umane NA NA NA 1·19 (1·10–1·28) <0·0001 ‡ 1·16 (1·08–1·25) 0·0001 ‡

Statistica C NA NA NA 0·71 (0·70–0·73) NA 0·74 (0·73–0·76) NA


Discussione
In questo studio è stato sviluppato un algoritmo di apprendimento profondo
(RetiCAC) che utilizza fotografie retiniche per prevedere la presenza di CAC. I
punteggi di RetiCAC hanno mostrato prestazioni superiori rispetto ad un singolo
parametro clinico, come l’età, il glucosio o il fumo, nella previsione della presenza di
CAC. È stato, quindi, proposto un nuovo sistema di stratificazione del rischio di
malattie cardiovascolari a tre livelli basato sul punteggio RetiCAC, che era
paragonabile agli attuali punteggi CAC misurati con la TAC a tre livelli nella
previsione degli eventi di malattie cardiovascolari in una coorte clinica sudcoreana. Il
punteggio RetiCAC è stato anche in grado di stratificare il rischio di malattie
cardiovascolari in una popolazione generale asiatica comprendente più etnie (cinese,
malese e indiano) a Singapore. Inoltre, in una grande coorte britannica della UK
Biobank, è stato dimostrato che RetiCAC poteva stratificare ulteriormente il rischio
di malattie cardiovascolari negli individui classificati dalla PCE come gruppi a
rischio borderline e intermedio. Lo studio conferma che il punteggio di RetiCAC è
migliore dell'età e di qualsiasi altro parametro clinico, per predire la presenza di CAC
e ha confermato i legami noti tra danni vascolari retinici (ad esempio, restringimento
arteriolare retinica). Il deep learning nella medicina di precisione è un'area in rapido
sviluppo, ma è anche necessaria una stretta collaborazione tra esperti umani e
algoritmi di deep learning.
Referenze
1 Suri JS, Bhagawati M, Paul S, et al. Un potente paradigma per la stratificazione del
rischio cardiovascolare utilizzando paradigmi di apprendimento automatico
multiclasse, multi-etichetta e basati su ensemble: una revisione narrativa. Diagnostica
(Basilea). 2022;12(3):722. Pubblicato 2022 Mar 16. DOI:
10.3390/diagnostics12030722
2 Zeleznik R, Foldyna B, Eslami P, et al. Reti neurali convoluzionali profonde per
prevedere il rischio cardiovascolare dalla tomografia computerizzata. Nat Commun.
2021;12(1):715. Pubblicato 2021 gen 29. DOI: 10.1038/s41467-021-20966-2
3 Ching, T., Himmelstein, D. S., Beaulieu-Jones, B. K., Kalinin, A. A., Do, B. T.,
Way, G. P., Ferrero, E., Agapow, P.M., Zietz, M., Hoffman, M.M., Xie, W., Rosen,
G. L., Lengerich, B. J., Israeli, J., Lanchantin, J., Woloszynek, S., Carpenter, A. E.,
Shrikumar, A., Xu, J., Cofer, E.M., ... Greene, C. S. (2018). Opportunità e ostacoli
per il deep learning in biologia e medicina. Journal of the Royal Society, Interface,
15(141), 20170387. https://doi.org/10.1098/rsif.2017.0387
I GRAFI
Un grafo è la naturale estrazione e relativo formalismo matematico di un insieme di
oggetti che devono relazionarsi tra loro. Il grafo dipende della natura degli oggetti da
cui è composto.

Definizione
Un grafo (o rete) G è una coppia (V, E) dove V è un insieme finito i cui elementi
sono detti vertici o nodi ed E è un sottoinsieme i cui elementi, detti archi o lati, sono
coppie di oggetti in V. I matematici, utilizzano la lettera n per denotare il numero dei
nodi di un grafo, e la lettera m per denotare invece il numero di archi. Dato un grafo
G = (V, E) quindi, possiamo denotare la cardinalità di V con n e la cardinalità di E
con m. I grafi sono quindi utili strumenti per modellare contesti “di relazione”.

Esempio

Vertice V: [A, B, C, D]
Archi E: [(A, B), (B. A), (B, D), (D, B),
(D, C), (C, D), (B, C), (C, B)

Un grafo può essere:


➢ direzionato, orientato, diretto (sequenza ordinata di nodi)
➢ semplice, non direzionato, non orientato.
SORGENTE E DESTINAZIONE
Nel grafo orientato → si ha un nodo sorgente (testa) e un nodo destinazione (coda)
Nel grafo semplice → i nodi possono essere considerati sia come sorgente che come
destinazione
Il numero dei nodi determina l’ordine del grafo
Il numero degli archi determina la dimensione del grafo.

Gli archi del grafo:


Un arco è una relazione binaria tra due nodi ed è indicato in questo modo:
• α = (a, b) αϵE
α ϵ V, a ϵ e
b ϵ V, b ϵ e
Dove a e b sono due nodi V del grafo e sono detti estremi dell'arco. L'arco tra due
vertici è detto incidente.

➢ Ogni relazione forma una coppia ordinata se è indicata una direzione, oppure
formerà una coppia non ordinata.
Differenza tra coppie ordinate e non ordinate
Nel caso delle coppie non ordinate, le coppie (a,b) e (b, a) indicano lo stesso spigolo
del grafo. Viceversa, nel caso delle coppie ordinate le coppie (a, b) e (b, a) indicano
un verso differente sullo stesso spigolo, rispettivamente a→b e b→a.
Esistono due categorie principali di grafi: orientati e non orientati.
Grafo orientato. I grafi orientati hanno gli archi con una direzione. In questo caso gli
archi sono frecce. Ad esempio, si può andare dal nodo 1 al nodo 2 ma non viceversa,
non si può passare dal nodo 2 al nodo 1.

Grafo non orientato. I grafi non orientati hanno gli archi con una relazione biunivoca
tra i nodi. In altri termini, il nodo 1 collega il nodo 2 e il nodo 2 collega il nodo 1. Si
può scorrere in entrambe le direzioni.

La differenza tra grafi orientati e non orientati è importante nello sviluppo


dell'algoritmo di calcolo per elaborare la rete dei nodi del grafo, perché la
complessità dell'algoritmo è molto diversa.

Un altro concetto chiave della teoria dei grafi riguarda la direzione degli archi.
Diremo che un arco è indiretto, se esiste un arco tra il nodo N1 e il nodo N2
percorribile da N1 a N2 e viceversa in maniera del tutto equivalente. Diremo invece
che un arco è diretto, se esiste un arco tra il nodo N1 e il N2 percorribile solo in un
senso (da N1 a N2 oppure da N2 a N1).
Sviluppare un grafo
Per sviluppare un grafo in un programma informatico si utilizzano due metodi.
La lista di adiacenze. I nodi del grafo sono memorizzati in una variabile array. Ogni
elemento dell'array indica un nodo del grafo e contiene la lista delle sue connessioni
(archi ).

La matrice di adiacenze. In nodi e gli archi sono memorizzati in una matrice


quadrata nxn. Dove le n righe indicano i nodi di origine e le n colonne quelli di
destinazione. Ogni elemento della matrice indica se i due nodi sono collegati tra loro
(1) oppure no (0)
TERMINOLOGIA

• vertici adiacenti→ vertici connessi da un arco


• grado (di un vertice) → numero di vertici adiacenti; in degree(v) e out
degree(v) in un grafo orientato
• cammino → sequenza di vertici v1, v2, …, vx tale che vertici consecutivi
sono adiacenti; cammino semplice → se tutti gli archi e vertici sono
distinti.
• La somma dei gradi di ciascun vertice di un grafo non orientato è pari al
doppio del numero m di archi del grafo.
• Un sotto grafo sotto grafo di G (V, E) è un grafo G’ = (V’, E’) in cui V’ ⊆
V è un sottoinsieme dei vertici V(G) ed E’ ⊆ E è un sottoinsieme degli
archi E(G)
• Uno spanning subgraph di G (V, E) è un sotto grafo G’ = (V, E) che
contiene tutti i vertici di G
• Una digrafo → grafo che possiede almeno un arco orientato, cioè un arco
caratterizzato da un verso che non può essere percorso nel verso opposto.
• Albero → grafo connesso senza cicli
• Foresta → collezione di alberi
• Grafo completo → ogni vertice è adiacente ad ogni altro
• Grafo ciclico → se la sorgente del cammino coincide con la destinazione
• Grafo segnato → ogni arco ha un segno +/-
• Grafo pesato → ogni arco ha un numero che ne definisce il peso; posso
massimizzare o minimizzare il peso del percorso.
- Cammino minimo→ in un grafo pesato considerando tutti cammini e
calcolando il peso di questi si sceglierà il cammino col peso minimo.
• Grafo connesso → ogni coppia di vertici è connessa da un qualche
cammino; ogni vertice è raggiungibile da qualunque altro vertice.
• Grafo fortemente connesso → ogni coppia ordinata di vertici è unita da un
cammino. Per cui
- in un grafo orientato: si ha la componente fortemente connessa.
- In un grafo non orientato: si ha la componente connessa.
Componenti
Analizzare le componenti di un grafo fornisce informazioni globali sulla struttura
della rete:
- Se un grafo non è connesso può essere diviso in sotto grafi che sono a
loro volta connessi
- Componente connessa→ grafo non diretto
- Componente fortemente connessa → grafo diretto
- Un arco di una componente è un bridge se la sua cancellazione
sconnette la componente.
- Componenti giganti → componente che contiene alta percentuale di
nodi della rete

Mariarita Di Benedetto,
Studentessa di terzo anno del corso TFC e PC
Cod. matricola: 1000006318

Potrebbero piacerti anche