Sei sulla pagina 1di 5

SEQUENZIAMENTO DEL DNA

Per studiare l’organizzazione dei vari genomi di fondamentale importanza è stato il


sequenziamento.
Sequenziare significa conoscere dal primo all’ultimo nucleotide l’ordine dei nucleotidi stessi.
Nel momento in cui conosciamo l’ordine dei nucleotidi si deve vedere qual è l’organizzazione, quindi
quali sono le regioni geniche (promotore= regione che serve a regolare la funzione del gene,
sequenza codificante= regione che contiene l’informazione per dare il prodotto genico e sequenza
di terminazione= regione che comunica agli enzimi che devono analizzare la regione dove si devono
fermare).
Negli eucarioti il promotore si trova a monte dei geni, poi c’è la sequenza codificante fatta da regioni
introniche ed esoniche che sono le regioni che serviranno a produrre le proteine o che non
serviranno e poi c’è la regione di terminazione.
Il sequenziamento del DNA può essere utilizzato per:
- identificare particolari sequenze: geni, regioni regolatorie della replicazione, trascrizione e
traduzione
- capire quali sono i prodotti proteici di ciascun gene
- analizzare la struttura secondaria e terziaria degli acidi nucleici (tRNA)
- studiare delle mutazioni genetiche che determinano delle patologie
- fare studi evolutivi
I primi metodi di sequenziamento risalgono al 1977 e hanno consentito di consegnare il premio
Nobel per la chimica a Maxam e Gilbert e a Sanger che entrambi, seguendo due strade differenti,
hanno potuto sequenziare il DNA:
o Maxam e Gilbert > hanno utilizzato un metodo di analisi per idrolisi chimica, questa tecnica è
stata abbandonata presto perché era molto complicata
o Sanger > ha utilizzato un metodo di analisi per replicazione enzimatica, la sua tecnica è stata
quella più utilizzata e successivamente venne chiamata “Sanger modificata”
Cronistoria: nel 1869 è stato scoperto il DNA, circa 100 anni dopo nel 1977 è stato possibile fare il
sequenziamento del DNA. Nel 1980 ci sono stati i primi clonaggi, nel 1986 c’è stata la scoperta della
PCR e dal 1989 c’è stata l’automazione parziale delle tecniche di biologia molecolare.
Dal 2000 ad oggi siamo automatizzati.

PCR.
Quando il DNA deve essere duplicato prima deve essere svolto dalla sua doppia elica.
Il DNA ha una polarità antiparallela 5’-3’/3’-5’, tra le basi del DNA lungo i pioli della scala a doppia
elica ci sono dei legami idrogeno che devono essere rotti, quindi deve avvenire la denaturazione del
DNA.
Una volta rotti i legami e separata la doppia elica, ciascuna elica del DNA deve essere copiata ad
opera della DNA polimerasi che necessita di un innesco posizionato dalla parte dell’elica 3’-5’ e uno
posizionato dalla parte dell’elica 5’-3’, questi inneschi si chiamano primer ed è da qui che le
polimerasi partono e copiano i filamenti.
La doppia elica si separa grazie all’energia che proviene dall’ATP e GTP, la primasi sintetizza gli
inneschi che nel caso della cellula sono di RNA che poi devono essere rimossi, una volta sintetizzati
gli inneschi la polimerasi può copiare i filamenti cioè se c’è una citosina per complementarità deve
sintetizzare una guanina, se c’è un’adenina per complementarità deve sintetizzare una timina.
Questa tecnica che ha consentito di vincere il premio Nobel a Miullis ed è stata riprodotta in vitro.
Adesso in vitro si esegue la PCR cioè la polimerizzazione a catena del DNA.
La PCR consiste nel fatto che all’interno di una provetta si inserisce il DNA da copiare, un primer (uno
che va in un verso e uno che va nell’altro), una polimerasi estratta dal batterio capace di resistere
alle alte temperature, il magnesio (serve per far funzionare correttamente il DNA), una soluzione
salina contenuta all’interno di un buffer e i nucleotidi trifosfati.
Una volta preparata la provetta la molecola del DNA deve essere copiata e viene copiata tante volte
grazie all’ausilio di uno strumento chiamato termociclatore.
È importante avere tante copie perché se si vogliono fare degli studi su un gene raro è meglio avere
tante copie del gene quindi si dice che è amplificato.
Le temperature che servono al termociclatore sono:
 una temperatura per denaturare il DNA > maggiore o uguale a 95°
 una temperatura per far attaccare i primer > variabile da 35 a 63°
 una temperatura per far agire la DNA polimerasi > 72°
Una volta impostate nella macchina le temperature e il tempo per ogni temperatura (95° per 30 sec/
35-63° per 30 sec/ 72° per 30 sec max 1 min) deve essere ripetuto il tutto 30-40 volte.
La temperatura dipende dalla composizione dei primer, cioè dalla sequenza: se è molto ricco in G e C
la temperatura sarà più alta perché tra guanina e citosina ci sono 3 legami e quindi serve più energia
per separarli mentre se è molto ricco in A e T la temperatura sarà più bassa perché tra timina e
adenina ci sono 2 legami.
Sulla tecnica della PCR è nato il sequenziamento secondo Sanger.

Il sequenziamento secondo Sanger.


È una tecnica basata sulla PCR con una differenza: per poter fare l’amplificazione del DNA, quindi la
PCR oltre che uno stampo servono 2 copie di primer uno per ogni elica mentre per il
sequenziamento basta solo un primer perché si sequenzia prima un’elica in una reazione e poi l’altra
elica nell’altra reazione.
Dopo che abbiamo il frammento da sequenziare e il primer c’è bisogno della taq polimerasi, i
nucleotidi e di deossi nucleotidi (ddNTP).
Questo è un nucleotide del DNA modificato perché il nucleotide
normale differisce in posizione 3’: nel nucleotide modificato c’è
l’idrogeno mentre nel nucleotide normale c’è l’OH.
Si chiama di deossi nucleotide perché è stato privato del gruppo
ossidrilico.
Il gruppo ossidrilico serve perché quando si deve copiare il DNA e
ottenere una nuova elica grazie al gruppo ossidrilico in posizione 3’ si
possono unire i nucleotidi tra di loro.
Questo è ciò che avviene in una replicazione normale di DNA.
Nella provetta si inseriscono sia i nucleotidi normali che consentono il
normale allungamento della catena sia i di deossi nucleotidi che
consentono alla catena di stopparsi.
I di deossi nucleotidi devono essere riconoscibili quindi vengono prima
colorati: all’estremità del nucleotide viene aggiunto un fluoroforo o un
fluorocromo che sono agenti coloranti che quando vengono colpiti da un raggio laser possono
andare incontro ad eccitamento ed emettere una radiazione luminosa che viene individuata dal
computer.
Il di deossi nucleotide per la citosina viene colorato di blu, per l’adenina di verde, per la timina di
rosso e per la guanina di giallo.
Dopo aver fatto i 30-40 cicli il tutto deve essere analizzato su gel di elettroforesi: si utilizza un
sequenziatore automatico che è capace di separare i segmenti che si differenziano.

Sequenziamento di nuova generazione.


Con il sequenziamento di nuova generazione si riduce notevolmente il tempo.
Tre aziende: Roche, Illumina e Applied Biosystems hanno messo a punto strumenti che consentono
di fare questo sequenziamento e gli strumenti si chiamano rispettivamente 454, Illumina/Solexa e
Solid system.
Il sequenziamento di nuova generazione si basa sul principio del sequenziamento di cluster clonali
cioè tutto il DNA presente in un nucleo rappresenta la molecola target non solo una parte del DNA.
Tutto il DNA viene amplificato non un pezzettino alla volta, si ottengono tante copie e a questo
punto si può fare un sequenziamento mediante sintesi oppure un sequenziamento mediante
ligazione.
Si prende tutto il DNA genomico, si amplifica, si fa la frammentazione del DNA, una volta ottenuti
tanti pezzetti sopra ognuno si devono mettere degli adattatori cioè dei pezzi di DNA noti che
possono essere riconosciuti successivamente, per fare tutto questo ci vogliono 1-3 giorni.
Successivamente tutti i frammenti vengono amplificati e poi si può fare il sequenziamento mediante
sintesi o ligazione e questo processo impiega 1-6 giorni.
Dopo di che si vanno ad analizzare i risultati ottenuti.
Una volta che è stata preparata la libreria (tutto il procedimento prima spiegato) si sono ottenuti
tanti pezzettini chiamati reads (letture) che hanno dimensioni differenti, a questo punto si deve
comporre tutto il genoma e capire qual è il primo pezzo, il secondo, ecc.
Per fare questo assemblamento si deve avere un DNA di confronto presente in una banca dati.
Vantaggi delle piattaforme di nuova generazione:
- nel sequenziamento secondo Sanger per avere conferma che tutto è stato eseguito
correttamente si deve eseguire il clonaggio mentre con il nuovo sequenziamento non c’è
bisogno di farlo
- se si devono fare sequenziamenti di piccoli genomi come piccoli RNA, analisi di espressione,
sequenziamento di DNA precipitato questo metodo fornisce ottimi risultati
- richiede meno tempo e costi inferiori
Svantaggi delle piattaforme di nuova generazione:
- pur essendo un’analisi molto processiva cioè nella stessa reazione si riesce ad analizzare
tutto il genoma, si ottengono dei pezzettini molto piccoli e quindi si producono sequenze
corte e i dati sono moltissimi
- avendo tanti dati c’è la necessità di utilizzare dei server specifici con memorie molto grandi
- una volta che il sequenziamento è stato fatto e sono stati assemblati tutti i pezzi si può
eseguire il ri-sequenziamento per avere la certezza che sia avvenuto tutto correttamente
Molti studi permettono di capire quante mutazioni si accumulano nel genoma cioè se all’interno di
una determinata specie ci possono essere delle mutazioni che si accumulano e cosa comportano
nell’evoluzione di quella specie.
Infatti, si può utilizzare il sequenziamento come orologio molecolare per capire una determinata
specie da chi si è originata, per poterne studiare l’evoluzione, per capire cosa è successo ad una
specie che si è estinta ecc.
Quindi l’orologio molecolare ci permette di vedere nel tempo che differenziamento abbiamo avuto.
Grazie a questo studio sappiamo che la velocità di mutazione e di fissazione della mutazione è di
circa una mutazione ogni 10.000 anni.
Il DNA mitocondriale però è più veloce a mutare rispetto al DNA nucleare.
Vedendo quante mutazioni si sono accumulate e sulla base di queste mutazioni si può vedere la
distanza che intercorre tra le varie specie cioè si va a costruire l’albero filogenetico che ci dice
quanto gli individui appartenenti alla stessa specie o a specie diverse possono divergere o essere
accomunati tra di loro.
Per vedere se c’è una mutazione si va a vedere nelle banche dati che sono depositarie delle
sequenze delle varie specie e attraverso uno strumento di confronto tra sequenze si possono
linearizzare le sequenze e vedere quali sono le parti uguali.
Facendo degli studi su popolazioni africane si è visto che l’uomo moderno si potrebbe essere
differenziato 200.000 anni fa: andando ad estrarre il DNA mitocondriale da un gruppo di pigmei
africani e facendo il sequenziamento del DNA mitocondriale si è visto che l’imparentamento tra la
modernità e quelli più vecchi risale a 200.000 anni fa.
Dall’africa queste popolazioni si sono spostate in tutto il mondo.

Progetti genoma.
Sono i progetti che hanno consentito di conoscere il sequenziamento delle specie più importanti.
Nel 2001 è stato pubblicato l’articolo sul genoma umano su “Science”.
Una delle applicazioni più importanti è che si può utilizzare il genoma per fare la terapia genica: si sta
cercando di capire se si può sostituire un gene malato con uno sano.
Per fare questa terapia genica si deve conoscere la sequenza del gene, sintetizzare in vitro il gene,
metterlo all’interno di un vettore capace di fare il clonaggio, fare l’iniezione nel midollo e il gene
funzionante si può esprimere e quindi il gene può funzionare.

Bioinformatica.
Dopo aver fatto il sequenziamento si può procedere con delle analisi bioinformatiche.
La bioinformatica nasce agli inizi degli anni ’80 con lo sviluppo dei metodi di sequenziamento rapido
degli acidi nucleici.
Le informazioni biologiche correlate alla bioinformatica sono:
o sequenze nucleotidiche
o sequenze proteiche
o strutture 3D delle proteine e degli acidi nucleici
o dati di mappaggio genomico
o profili di espressione > come i geni funzionano in relazione allo stimolo ambientale
o dati metabolici > dati che ci consentono di capire quali sono i pattui metabolici di
funzionamento dei vari geni
o informazioni bibliografiche
I dati relativi a tutte queste cose che abbiamo elencato e che rientrano nelle informazioni biologiche
li troviamo nelle banche dati.
Le banche dati possono essere suddivise in diverse tipologie, la più importante è la banca dati
primaria, quella che contiene le sequenze basilari e quindi le informazioni base relative alla struttura
degli acidi nucleici.
Le banche dati sono interconnesse tra di loro.
La prima banca di sequenze di acidi nucleici, sorta nel 1980, è l'EMBL Data Library costituita
nell'omonimo laboratorio di Heidelberg in Germania.
Successivamente è stata creata nel 1982 la Banca Dati Americana, la GenBank, avente un formato
differente da quello adottato nella banca dati EMBL e sviluppata parallelamente a quest'ultima.
Solo nel 1986 è stata istituita la banca dati giapponese DDBJ.
Nella banca dati troviamo: database informatico, database con tutte le sequenze nucleotidiche,
strumenti che consentono di condurre delle analisi sulle sequenze, progetti, ecc.

Potrebbero piacerti anche