Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Anche se per definizione il DNA può apparire come una molecola particolarmente statica, esso è
costantemente soggetto a cambiamenti. Nella lezione precedente si è accennato al concetto di
Epigenetica, e quindi a come il DNA possa essere manipolato ai fini della regolazione, ma gran
parte delle modificazioni che subisce nel corso della vita sono proprio le varianti genetiche:
rientrano in questa categoria tutti quegli eventi che contribuiscono a garantire una variabilità nel
genoma, da quelli autoindotti come il Crossing-Over o lo Splicing Alternativo alle mutazioni vere
e proprie, quelle che insorgono per motivi non premeditati e che, se vantaggiose, possono essere
trasmesse alle generazioni successive come un’eredità funzionale.
In generale le varianti di questo tipo possono essere dovute al caso, quindi spontanee (indotte da
agenti chimici o fisici esterni) oppure dovute a errori nei meccanismi di replicazione o di
trascrizione. In ogni caso il loro impatto sul DNA è enorme: ogni individuo conserva milioni di
varianti nel proprio genoma e gran parte di esse viene espressa nel fenotipo come caratteristica
somatica unica.
Tendenzialmente, quindi, nessuno si sottopone a un’analisi del DNA per capire esattamente quali
varianti abbia, perché questo non avrebbe un reale significato dal punto di vista medico, ma
potrebbe rendersi necessario nel momento in cui queste varianti dimostrassero una tendenza
patologica.
Infatti, sebbene ci siano moltissime varianti che non hanno alcun effetto perché non portano
cambiamenti nella sequenza amminoacidica (e quindi non alterano in nessun modo la proteina),
nel caso strettamente opposto c’è la possibilità che si generino varianti definite “letali” quando il
prodotto proteico risulta totalmente assente e si perde quindi la capacità di svolgere una
funzione; di solito queste situazioni non sono compatibili con la vita.
In realtà, nella maggior parte dei casi la presenza di una variante dannosa non compromette la
vita, ma coincide con l’insorgenza di una patologia legata al malfunzionamento della proteina in
questione, spesso dovuto alla sostituzione di uno o più dei suoi amminoacidi nella catena.
Polimorfismi
Acquisiscono l’attributo di “polimorfismo” tutte quelle varianti che si dimostrano abbastanza
frequenti all’interno di una determinata popolazione da poter essere considerate una sua
caratteristica. Se quindi il termine “variante” è strettamente legato al singolo portatore (che viene
chiamato mutante), per definizione il “polimorfismo” va sempre riferito a una popolazione
campione.
In particolare, perché una variante possa definirsi polimorfismo di una popolazione, deve essere
presente con un’incidenza minima dell’1-2% negli individui appartenenti a essa.
I polimorfismi sono stati a lungo sfruttati come sistema di marcamento del DNA in fase di
sequenziamento, quando gli strumenti e le tecniche di oggi ancora non esistevano: conoscere le
varianti tipiche di una popolazione permette di riconoscere con una certa specificità alcuni tratti
precisi di DNA, che risultano quindi marcabili e rintracciabili.
● varianti patogeniche: sono quelle che hanno delle conseguenze negative sul fenotipo e
portano a condizioni patologiche.
In base a ciò, in diagnostica è stata coniata una scala di pericolosità delle varianti, che consiste
in una classificazione a cinque categorie, utilizzata a livello internazionale e consapevole di tutta
una serie di criteri che bisogna tenere presenti nel momento in cui si riscontrano delle nuove
varianti da refertare.
Quando viene scoperta una nuova variante, a seconda di quanto sia implicata in una o più
condizioni patologiche e di quanto ciò sia comprovato, essa viene inserita in una delle cinque
categorie della scala:
Le due sezioni “Benigne” e “Verosimilmente benigne” a sinistra sono pressoché inutili dal punto di
vista diagnostico, perché riguardano tutte le varianti che non hanno impatti patologici sul fenotipo.
Al contrario, è molto difficile che una variante venga declassata da patogenica a benigna o
viceversa, proprio perché l’assegnazione a ogni categoria avviene solo su basi certe e comprovate
dall’incrocio di diversi studi.
Esiste poi una quinta categoria centrale dedicata alle “varianti di significato incerto”: molte si
conoscono ma non si sa realmente quale sia il loro ruolo, quindi non possono ancora essere
classificate come causative o non causative di fenotipi malattia; si tratta di varianti che vengono
tenute in stand-by, fino a che qualcuno non dia un risultato certo sulla loro natura.
- Inserzioni e Delezioni sono le tipologie più pericolose di mutazioni, puntiformi o no, perché
portano a uno slittamento della cornice di lettura a livello della traduzione (frame-shift), che il
più delle volte ha come conseguenza la produzione di proteine tronche o mRNA inefficienti;
sono quindi mutazioni che comportano una perdita di funzione.
- Silenti: non hanno nessun effetto sul prodotto proteico, e quindi sul fenotipo.
- Nonsenso: solitamente sono le più gravi, perché creano dei codoni di stop prematuri e quindi si
perdono molti domini amminoacidici; per questo sono classificate come patogeniche o
potenzialmente patogeniche. Anche in questo modo si può fare una predizione sulla stabilità
dell’RNA messaggero: se il codone di stop è molto prematuro, l’mRNA risulta troppo corto per
essere tradotto e viene subito degradato, o in alternativa entra nel ciclo di traduzione ma la
proteina prodotta non è abbastanza funzionale e va incontro a denaturazione.
- Varianti di splicing: coinvolgono il sito donatore o il sito accettore dello splicing: durante il
processo di maturazione dell’RNA accade che per via del cambio di sequenza di queste porzioni
possano essere eliminati alcuni esoni o conservati degli introni. Anche questo si traduce,
nella maggior parte dei casi, in uno slittamento della cornice di lettura. Ciò è pericoloso perché
si produce una proteina completamente diversa. Ancora una volta il gene è nella sua forma
standard wild-type, ma non viene trascritto correttamente per via di errori dovuti alla maturazione
dell’mRNA. Solitamente questi tipi di varianti rientrano nella classificazione delle Patogeniche (o
Verosimilmente patogeniche).
- Varianti dei sistemi di riparazione del DNA: esiste tutta una serie di enzimi che pattugliano
costantemente il DNA e cercano di evitare eventuali errori nei suoi processi di replicazione. Non
sempre essi sono in grado di riparare tutto ed esistono dei meccanismi che portano la cellula in
apoptosi nel caso avvengano troppi errori. Quando si presentano delle variazioni in alcuni dei
geni che codificano per questi enzimi di controllo, allora si verificano dei fenotipi malati
incapaci di riparare gli errori di replicazione.
Questo può essere un vantaggio, nel caso i caratteri siano particolarmente funzionali o, nel caso
contrario, uno svantaggio; in generale, una popolazione formatasi per effetto fondatore risulta
sicuramente più vulnerabile alle pressioni selettive e perciò è più difficile che possa subire una
selezione a collo di bottiglia.
La selezione ad effetto fondatore è il motivo per cui molte etnie conservano, nel loro genoma,
polimorfismi tipici che in altre zone del mondo sono considerati estremamente rari.
C’è un altro sistema che ora è stato in parte dismesso, ma che per anni si è usato per identificare
in modo mirato le varianti genomiche: si tratta della tecnica che sfrutta i polimorfismi, a cui si è
già accennato. Essa prende il nome di RFLP (Restriction Fragment Lenght Polymorphism) e si
basa sulla complementarietà dei “pattern di bande” che si ottengono per elettroforesi di campioni di
DNA tagliati con la stessa combinazione di enzimi di restrizione. La RFLP permette di mappare le
varianti tipiche di una popolazione e quindi di avere una base solida per un referto genetico:
individua la presenza di polimorfismi e permette di valutare la loro localizzazione con enzimi di
restrizione ed elettroforesi, andando a tagliare delle sequenze specifiche e distribuendole mediante
un campo magnetico in pattern di bande.
In genetica forense, questo si traduce in un confronto tra il DNA raccolto sulla scena del crimine e
quello dei sospettati: i campioni di acido nucleico vengono tutti tagliati con gli stessi enzimi di
restrizione specifici, in corrispondenza di polimorfismi noti, e poi trattati in elettroforesi su gel, al
fine di valutare le somiglianze tra le bande orizzontali che si ottengono come risultato (equivalenti a
una sorta di mappatura delle varianti presenti nei campioni di DNA utilizzati).
Tutto questo, oggi, è stato in realtà sostituito da sistemi automatizzati, collegati a enormi database
in grado di risalire a priori alle varianti polimorfiche di interesse…
Nel corso dei decenni, le procedure di sequenziamento e le attrezzature si sono evolute in maniera
esponenziale e al giorno d’oggi i laboratori genetici dispongono di macchinari piuttosto sofisticati,
chiamati NGS (Next-Generation Sequencing), che permettono di sequenziare tutto un genoma nel
giro di circa una notte, al costo di poche migliaia di euro (1500-2000). È un risultato storicamente
colossale, se si pensa che il primo sequenziamento è costato svariati milioni di dollari ed è stato
realmente concluso solo l’anno scorso.
Uno dei presupposti di queste tecnologie è che di base sequenziano per frammenti singoli, che
vanno poi riassemblati fino a risalire alla sequenza originale. Per questo motivo vengono utilizzati a
priori dei genomi di riferimento, provenienti da migliaia di campioni di pazienti in tutto il mondo e
memorizzati in enormi database informatici, pronti a essere usati come parametro universale di
comparazione.
Bisogna ricordare che l’obiettivo, in generale, è sempre determinare nuove varianti patogeniche e,
soprattutto, capire se siano rare o polimorfiche, A questo proposito è molto utile avere a
disposizione una tale quantità di dati provenienti da tutto il mondo: l’impiego di questi sistemi ha
permesso di capire quali sono i “geni malattia”, ovvero di associare a ogni fenotipo un determinato
genotipo. Esiste un database in continuo rinnovamento che ha in memoria tutte le malattie
genetiche conosciute, associate alle loro varianti, il cui nome è OMIM gene map statistics.
(http://www.ncbi.nlm.nih.gov/omim)
Esso è costantemente aggiornato di tutte le varianti che progressivamente vengono identificate nei
soggetti con un determinato fenotipo malattia Questo è importante soprattutto nel campo delle
malattie rare, perché avere dei risultati concreti su un singolo database permette di determinare
con rapidità e sicurezza se la causa sia, ad esempio, una sola mutazione o un’eterogeneità di più
varianti sparse magari su più geni diversi.
Concretamente, i parametri che vengono incrociati per giungere a delle conclusioni solide sono
sempre di tipo probabilistico, basati su frequenze e tassi di insorgenza; a questo proposito occorre
fare chiarezza su alcuni termini:
- Tasso di mutazione: è la frequenza con cui si passa dalla condizione wild-type a quella
alterata.
- Frequenza di mutazione: è il rapporto tra il numero di individui che presentano una determinata
variante e il totale della popolazione presa a campione. Le varianti possono essere frequenti in
modo diverso nelle popolazioni, tant’è vero che ognuna di esse viene associata a tutta una serie
di polimorfismi tipici, sfruttati poi dalla genetica come marcatori selettivi.
- Frequenza allelica: definisce quanto la variante è presente nel genotipo di un singolo individuo.
Ciò che fa è valutare in quanti alleli sia presente la variante, e quindi se si trova in eterozigosi
(50%) o in omozigosi (100%), permettendo ad esempio di studiarne la dominanza o la
recessività (come si approfondirà nelle lezioni successive).
Il costo di queste tecnologie è crollato negli ultimi anni fino a qualche migliaia di euro a
sequenziamento; per lo Stato Italiano, che vanta un sistema sanitario nazionale, questo è un gran
vantaggio perché permette di prescrivere il test genetico per qualunque paziente a un prezzo
estremamente ragionevole. Si apre quindi la possibilità di utilizzare un approccio definito come
“medicina personalizzata”, la quale comprende dei sistemi che verificano la malattia da un punto
di vista genetico (quindi inoppugnabile) e contemporaneamente forniscono dati utili ai fini di una
terapia adatta alla fisiologia del singolo paziente.
L’importanza di una cosa del genere si percepisce soprattutto in ambito oncologico: se tempo fa la
chemioterapia era una prassi quasi obbligatoria per tutti i pazienti, adesso c’è la possibilità di
programmare ex novo un percorso terapeutico completamente individuale, che nella maggior parte
dei casi si rivela meno rischioso e più efficace della classica chemioterapia.
È davvero conveniente una lettura per intero del genoma, dal punto di vista diagnostico?
Se i costi non sono un problema e i tempi nemmeno, in realtà una difficoltà sta nel fatto che,
effettivamente, solo piccole percentuali di DNA sono davvero chiare fino in fondo alla comunità
scientifica, in termini di funzionalità: la maggior parte del DNA è comunemente definito
“regolatorio”, perché si dà per scontato che abbia una funzione (anche se non è ancora
assolutamente chiaro quale sia). Quindi avere sotto mano un sequenziamento completo è
solitamente sconsigliato, perché la maggioranza delle varianti che si identificherebbero non
avrebbero una reale valenza clinica.
Per questo motivo in medicina si tende a fare dei sequenziamenti mirati detti “a pannello”, che
sono concentrati solo sulle porzioni codificanti o regolatorie di interesse, a seconda della malattia
riscontrata. Per esempio, se il soggetto ha sviluppato un tumore al seno, sapendo che i geni
responsabili sono solamente due (malattia poligenica), conviene procedere a un sequenziamento
mirato di quegli unici due geni, per un costo di poche decine di euro e qualche minuto di attesa dei
risultati.