Sei sulla pagina 1di 10

STRUTTURA DEGLI ACIDI NUCLEICI Propriet di nucleotidi e nucleosidi. Le unit monomeriche degli acidi nucleici sono chiamate nucleotidi.

Questi consistono di un estere fosfato, di una zucchero e di una base purinica o pirimidinica (Fig. 36).
2-

O3PO CH2 base O CH2OH O base

CH2OH O

base

OH

OH

OH

OH

2-

OH

O3P 3'-Nucleotide

Tutti gli zuccheri negli acidi nucleici hanno la configurazione stereoisomerica D. Le basi azotate che si trovano comunemente, cos come quelle che ricorrono pi raramente, sono strutture planari senza possibilit di stereoisomerismo. Pochissime basi, poco comuni (p.es. quella chiamata Y), portano attaccata una catena con atomi di carbonio asimmetrici. L'unit chimica che comprende solo lo zucchero e la base viene chiamata nucleoside e quindi i nucleotidi sono semplicemente gli esteri fosfato dei nucleosidi. Nella nomenclatura corrente i nucleosidi sono abbreviati combinando una lettera maiuscola, che rappresenta la base, con una minuscola, che rappresenta lo zucchero. P. es. l'adenosina (che formata da una zucchero ribosio e dalla base adenina) viene chiamata rA, mentre la deossiguanosina (che formata da uno zucchero 2'-deossiribosio e da una guanina) viene chiamata dG. Il prefisso r viene usualmente omesso ove risulta chiaro dal contesto quale tipo di zucchero sia coinvolto. I nucleotidi sono indicati in modo abbreviato aggiungendo una p per rappresentare ciascun gruppo fosfato. Di conseguenza un polinucleotide viene abbreviato in questo modo: .. Questa simbologia sottolinea che lo scheletro del polimero costituito da un alternarsi di zuccheri e di gruppi fosfodiesterici. Nel polinucleotide detto RNA gli zuccheri sono tutti ribosi e predominano quattro nucleotidi: A, U, C, G. Va detto che c' la possibilit di ricorrenza di alcuni nucleosidi rari, specialmente nel polinucletide chiamato "RNA di trasferimento". Nel polinucleotide DNA gli zuccheri sono tutti 2'-deossiribosio e quattro nucleotidi (dA, dT, dC, dG) costituiscono usualmente tutta la struttura chimica di ogni DNA conosciuto, fatta eccezione per quelli di alcuni virus dove qualche nucleoside pi raro sostituisce in parte o totalmente un componente pi comune. P. es., il DNA di

Nucleoside

5'-Nucleotide

37

qualche batteriofago contiene il nucleoside 5-idrossimetil-dC al posto di dC ed inoltre spesso alcuni monosaccaridi o disaccaridi sono legati chimicamente attraverso il gruppo ossidrile. Nel seguito, a meno di non dichiararlo esplicitamente, useremo la convenzione che una singola catena di polinucleotide sia scritta nel modo seguente: ApBpCpDp...pZ, cosicch ciascun legame fosfodiestere va dall'idrossile 3' all'idrossile 5', da sinistra verso destra. Nel caso di un doppio nastro antiparallelo i terminali vengono marcati con la scritta 3' o 5' cos da rimuovere ogni ambiguit nella direzione del nastro. Equilibri di ionizzazione per nucleosidi e nucleotidi. A pH neutro tutti i nucleosidi comuni sono scarichi; anche molti dei nucleosidi pi rari sono scarichi a pH 7, fa eccezione il 7-metil-G che carico positivamente. Al contrario tutti i gruppi fosfato nei nucleotidi o nei polinucleotidi sono carichi negativamente ad ogni pH al quale si lavora normalmente. Un fosfodiestere un acido forte. Il pKa del singolo protone ionizzabile attorno ad 1: O P RO OR' OH H
+

O + RO P

OR'

in questo modo in una catena polinucleotidica, tralasciando gli effetti terminali, ci sar una carica negativa per ogni residuo. Questa carica totale cos alta molto diversa da quella delle proteine dove molti residui sono scarichi e nelle quali le cariche positive e negative sono generalmente presenti in numero comparabile, sebbene non uguale. Il gruppo fosfomonoestere che si trova nei mononucleotidi isolati, o a volte alla fine delle catene polinucleotidiche, ha due protoni ionizzabili:
O P RO OH OH pKa=0.9 H
+ -

O + RO P

pKa=6.2

2H

O + RO P

O O

OH

Risulta, quindi, che a pH 7 ciascun fosfomonoestere ha una doppia carica negativa. Nella titolazione di un mononucleotide i valori di pKa vicini ad 1 e 6 sono assegnati facilmente al gruppo fosfato poich queste titolazioni sono assenti nei corrispondenti nucleosidi. Inoltre questi valori sono simili a quelli osservati in uno zucchero-fosfato semplice: p.es. il glucosio-3-fosfato ha un pKa vicino a 0.8 ed uno vicino a 5.7.
38

Nei nucleosidi possibile mettere in evidenza un protone con un pK a di circa 12.4: questo valore dovuto alla ionizzazione di un ossidrile dello zucchero. A titolo di paragone si osservi che nel glucosio esiste un protone ossidrilico che ha un pKa = 12.1. In un nucleotide la presenza della carica negativa sposter il pKa del gruppo ossidrile ad un valore pi alto a causa della repulsione elettrostatica delle cariche risultanti; a causa di ci questa titolazione non mai stata osservata poich probabilmente avviene prima l'idrolisi del nucleotide. Il comportamento delle basi nei nucleosidi e nei nucleotidi durante una titolazione molto complesso poich essi contengono un gran numero di siti potenziali donatori o accettori di protoni. Si deve notare anche che in una base non-ionizzata non ci sar una sola posizione del protone sugli eteroatomi, piuttosto ciascuna base esister sotto forma di un insieme di tautomeri: qualcuno di questi equilibri mostrato in figura 37. Da dati cristallografici, spettroscopici ed elettronici disponibili sembra chiaro che i tautomeri cheto-amminici predominano in soluzione acquosa. Le spettroscopie NMR ed IR sono particolarmente efficaci per assegnare le forme tautomeriche poich spesso vengono viste bande spettrali di singoli protoni. Queste bande possono essere assegnate al gruppo chimico che le genera attraverso il paragone con composti appropriati dove la possibilit di tautomerizzazione viene eliminata (p.es. sostituendo qualche protone con gruppi metile). In genere le differenze in energia tra le forme tautomeriche pi stabili sono piccole, rimane tuttavia aperto il problema di verificare che qualche tautomero non-usuale non giochi un ruolo importante nella struttura o nella funzione degli acidi nucleici. Gli acidi nucleici pi comuni sono tutti simili per quanto riguarda le propriet chimico-fisiche fondamentali. P.es., per tutti stato predetto o osservato un alto momento di dipolo che va da 2.5 ad almeno 7 D (Debye). Quindi alla luce di considerazioni elettrostatiche semplici, essi devono essere considerati composti polari. Al contrario, tutte le basi pi comuni, eccetto l'uracile, sono piuttosto insolubili in acqua: le purine sono meno solubili delle pirimidine di un fattore che va da 5 a 10. Va ricordato che non vi sono tentativi di classificare i residui di nucleotidi cos come stato fatto per i residui di amminoacidi.

39

STRUTTURA PRIMARIA DEGLI ACIDI NUCLEICI Composizione degli acidi nucleici: Regola di Chargaff. Molti DNA esistono sotto forma di doppia catena complementare, questo impone una restrizione alla composizione delle basi e cio XA = XT e XG = XC, dove X rappresenta la frazione molare delle diverse basi azotate (A, T, C, G). Questo fatto, notato e studiato a lungo da Chargaff, stato un risultato che ha contribuito al concepimento della struttura a doppia elica del DNA. Esso implica che in una struttura del DNA che sia completa sotto forma di doppia catena necessaria una sola variabile: XG+C (= 1 - XA+T) per descrivere la composizione. I DNA naturali hanno contenuti diversi di G+C: in qualche batterio esiste il 75% di G+C. Forse la "degenerazione" del codice genetico, (pi il fatto che qualche sequenza di DNA pu non codificare per sequenze proteiche) permette questo largo spettro di composizione senza abbassare seriamente l'abilit di un organismo di immagazzinare l'informazione genetica necessaria. Nei mammiferi XG+C ha un valore intorno a 4045% ed in generale si trova che organismi evoluzionalisticamente molto vicini hanno la composizione in basi di DNA molto simili. Pochissime frazioni di DNA di eucarioti, fra quelle che possono essere purificate, mostrano una composizione in basi veramente inconsueta: quando esistono, vengono chiamati DNA "satelliti". Il satellite di granchio, p.es., ha una frazione molare di G+C pari a solo il 5%. Il ruolo biologico di questi satelliti non ancora ben conosciuto; nei casi in cui sono stati esaminati pi in dettaglio si visto che le sequenze generalmente consistono per lo pi di unit corte che si ripetono regolarmente. Alcuni DNA hanno delle basi anormali che rimpiazzano una (o pi) pirimidina o purina. P. es., nel fago T-even il DNA mostra la prevalenza di 5-idrossimetil-C glicosilata: questa base pu ancora accoppiarsi con G e quindi la regola di Chargaff ancora obbedita purch in X C siano inclusi tutti gli analoghi di C. Il DNA del fago SP2 ha dU al posto di dT ed inoltre sono noti altri DNA con pirimidine non-usuali. In qualche caso il DNA contiene alcune basi metilate in sequenze molto specifiche: questo avviene a causa di un meccanismo di protezione contro nucleasi di restrizione intracellulari che, in assenza di metilazione, taglierebbero il DNA in queste posizioni. Qualche DNA devia dalla regola di Chargaff: p. es. il DNA del batteriofago X174 ha la seguente composizione in basi XA = 0.25, XT = 0.33, XG = 0.24 e XC = 0.18. Questo significa che al massimo (0.18 + 0.25)x2 = 0.86 del totale delle basi pu essere coinvolto in una struttura a doppia catena formata con il normale accoppiamento A-T e G-C. In realt, differentemente dalla maggior parte dei DNA, il DNA di -X174 formato da una sola catena legata covalentemente. Non ci sono
40

evidenze che la sequenza sia organizzata in modo tale da permettere un accoppiamento efficace di basi tra catene; in pratica sembra che l'accoppiamento tra basi coinvolga molto meno dell'86% della struttura. Si noti, infine, che se il DNA obbedisce alla regola di Chargaff, non necessariamente la sua struttura deve essere a doppia catena. Quest'ultima propriet dipender dalla sequenza reale e pu essere messa in evidenza attraverso alcune propriet fisiche. Composizione in basi dell'RNA. L'analogo della regola di Chargaff per l'RNA sarebbe: XA = XU e XG = XC. Nessuno dei principali tipi di RNA cellulare obbedisce a questa regola (RNA di trasferimento o t-RNA; RNA messaggero o m-RNA; RNA eterogeneo nucleare o hn-RNA; RNA ribosomiale o r-RNA). Questo si spiega poich quasi tutti gli RNA sono formati da una catena singola legata covalentemente. Qualche RNA di origine virale obbedisce alla regola di Chargaff: alcuni di questi sono infatti molecole a doppia catena. La composizione in basi di molti RNA implica che un ripiegamento della catena non pu portare all'accoppiamento di tutti i residui nucleotidici; inoltre alcune delle basi non usuali contenute nella struttura sono talmente complicate che il normale accoppiamento chimicamente impossibile. E' stato mostrato che in pratica, sebbene molti RNA contengano una quantit notevole di basi accoppiate, essi raramente contengono il massimo possibile di accoppiamento. Non ci sono evidenze che la composizione in basi, nel suo complesso, sia per l'RNA che per il DNA, sia correlata in modo significativo con la funzione biologica. Tuttavia alcune delle propriet fisiche della struttura a doppia catena, come la stabilit termica o la densit, variano in effetti linearmente in funzione della frazione molare di G + C. Questa relazione viene sfruttata in un certo numero di tecniche analitiche e preparative, inoltre sembra ragionevole aspettarsi che la natura abbia imparato a sfruttare la relativa facilit con la quale si separano le catene nelle regioni con XA + T alta ed utilizzi queste regioni per funzioni specifiche. Rimane comunque da provare se questa idea abbia validit generale. Altri costituenti degli acidi nucleici. Gli acidi nucleici possono contenere alcuni altri costituenti oltre che gli zuccheri, i fosfati e le basi. Qualche RNA possiede un certo numero di siti di legame forte per cationi bivalenti. In vivo, questi siti sono occupati presumilbilmente da Mg2+ e da poliammine. Essendo polianioni, gli acidi nucleici possono dar luogo ad una l'associazione forte con policationi aventi le dimensioni appropriate.
41

Le poliammine, come la spermina e la spermidina, possono giocare ruoli importanti nella funzione del DNA o dell'RNA in vivo, ed esistono evidenze in vitro di una localizzazione altamente specifica di queste sostanze sul t-RNA. A parte questi cationi, sembra che gli acidi nucleici siano totalmente privi di gruppi prostetici che vengano sintetizzati ed attaccati specificamente ad essi. Tuttavia, deve essere tenuto presente che all'interno della cellula gli acidi nucleici esistono raramente come molecole isolate; essi sono quasi invariabilmente associati strettamente con proteine specifiche (nucleoproteine). Esiste un'interazione covalente nota e specifica tra amminoacidi ed acidi nucleici: l'amminoacilazione del t-RNA. Ciascuna specie di t-RNA pu essere riconosciuta da un particolare "amminoacil-t-RNA sintetasi" che esegue reazioni del tipo: H OH ATP + t - RNA -CpCpA OH AMP + PPi + t-RNA - CpCpA OCOCHRNH2 Si sa che in qualche caso l'acilazione avviene specificatamente, sia in 2' che in 3', sugli ossidrili dell'adenosina terminale. Tuttavia la migrazione acilica tra le posizioni 2' e 3' dello zucchero rapida e pu essere sfruttata come parte del meccanismo della sintesi proteica che coinvolge il t-RNA. + H3N
+

R C COO OH
-

Struttura primaria. Il numero di catene polinucleotidiche in un acido nucleico viene determinato sottoponendo al molecola nativa a condizioni che rompono tutti gli accoppiamenti delle basi, p. es. alta temperatura, solventi organici o pH alcalino (nel caso del DNA); viene quindi misurato il peso molecolare e la quantit di ciascuna delle singole catene. Quasi tutti gli RNA consistono di una singola catena.

Un'eccezione forse consiste nell'RNA ribosomiale 28 S degli eucarioti che sembra contenere una catena corta 5.8 S legata non covalentemente. Un'altra eccezione l'RNA di alcuni virus tumorali che sembra sia un dimero formato da due catene identiche. Il DNA pi comune consiste in due catene singole della stessa lunghezza con sequenze complementari che permettono un appaiamento completo delle basi lungo tutta la lunghezza della
42

catena. A volte possibile separare e studiare separatamente ciascuna delle due catene. Mediante esperimenti di separazione di catene in vitro, alcuni DNA duplex (cio con struttura a doppia catena) hanno dato origine a catene singole che possono avere delle interruzioni. Il pi studiato il DNA T5 nel quale una catena intera, ma quella complementare composta di quattro pezzi differenti che si ordina perfettamente lungo la catene intatta. Alcune catene di DNA naturale sono circolari, altre lineari; sono stati osservati anche DNA circolari concatenati. Non sono stati trovati ancora DNA naturali con struttura a "forcina di capelli" ("hairpin") ripiegata su s stessa in modo che tutte le basi siano appaiate tranne qualcuna situata nel pezzo che forma il ripiegamento che permette alla catena di tornare su s stessa. Tuttavia strutture di questo tipo possono essere preparate sinteticamente. La determinazione delle composizioni in basi non in grado di distinguere questa forma dalla "doppia catena duplex", ma la determinazione dei pesi molecolari delle forme denaturate possono risolvere questo problema. Le dimensioni degli acidi nucleici variano enormemente. LRNA naturale pi corto il tRNA con 75-84 residui. I pi lunghi RNA sono gli RNA eterogenei nucleari che possono contenere fino a 2x105 residui. La pi piccola catena di DNA trovata contiene solo poche migliaia di residui, mentre la pi lunga pu comprendere lintero cromosoma di eucariota e contenere fino a 108 residui. Sono conosciute anche molecole a doppia catena nelle quali una di RNA e laltra di DNA. Queste si formano come intermedi quando la trascrittasi inversa sintetizza il DNA complemento usando come stampo una catena di RNA: Questi ibridi sono forse anche presenti come strutture transienti almeno nelle piccole regioni della trascrizione dellRNA dal DNA. Ibridi DNA-RNA possono essere facilmente ottenuti in vitro riscaldando due catene con sequenze complementari. Sono conosciuti pochi casi nei quali sezioni del DNA e RNA sono attaccate covalentemente alla stessa catena: questo avviene allinizio della sintesi delle catene di DNA da parte della trascrittasi inversa perch questo enzima usa un RNA stampo per iniziare la sintesi del DNA. Se ci si chiede perch la natura ha scelto due nucleotidi diversi per diverse catene invece di usare entrambi contemporaneamente la risposta che i nucleotidi ribosidici e deossiribosidici formano doppie eliche con geometrie differenti.
43

Sequenze degli acidi nucleici. Le sequenze di basi sono note per un certo numero di RNA pi corti e parecchi RNA lunghi. Questo pu essere fatto attraverso il metodo classico, ma macchinoso, della digestione con nucleasi che hanno una specificit sovrapponibile, esattamente analogo a quello col quale sono state determinate le sequenze di molte proteine. Tuttavia procedure nuove ed eleganti basate sulla sintesi enzimatica di catene di acidi nucleici a lunghezza variabile e sulla separazione dei relativi oligomeri con tecniche elettroforetiche ad alta risoluzione hanno accelerato di molto il processo. Fino a poco tempo fa il sequenziamento del DNA era un lavoro impossibile non tanto per la lunghezza della molecola, quanto perch non erano conosciuti nucleasi specifiche. Oggi con le moderne tecniche dellingegneria genetica e con le procedure sopra menzionate si sta lavorando sul sequenziamento dellintero genoma umano ed gi interamente conosciuto il genoma del lievito. Linformazione sulla sequenza degli acidi nucleici di aiuto diretto per capire le propriet biologiche e chimico-fisiche di DNA e RNA. Poich il codice genetico noto quasi sempre possibile decidere quali sequenze proteiche possano essere sintetizzate sotto la direzione di una particolare sequenza nucleotidica. Lunica ambiguit quella di selezionare la fase del codice a triplette, ma questa viene determinata sulla base di considerazioni statistiche circa la lunghezza del frammento peptidico codificato tra un codon di start ed una di fine. Oltre a queste regioni il DNA ne possiede alcune coinvolte nella regolazione della espressione dei geni. Una comprensione completa di queste regioni deve essere ancora ottenuta, ma quelle conosciute hanno simmetrie speciali, p.es sono palindrome su catene opposte: questo porta alla presenza di assi di simmetria locali C 2 o pseudo C2. Altre regioni, che probabilmente servono solo da spaziatori tra geni, appaiono come semplici modificazioni di sequenze corte e ripetute. Queste caratteristiche danno una buona probabilit di riconoscere regioni che non codificano per proteine, ma ancora non possibile predire la presenza di certe propriet funzionali di controllo della sola sequenza. La sequenza di nucleotidi di una catena singola d immediatamente dei modelli plausibili per la struttura secondaria approssimata. ripiegamento. STRUTTURA SECONDARIA DEGLI ACIDI NUCLEICI Gli schemi degli accoppiamenti tra basi sono abbastanza facilmente riconoscibili ed alcune regole semplici possono guidare la selezione dei modelli di

44

Nel parlare della struttura primaria non stato possibile evitare di parlare di schemi di accoppiamento tra basi anche per classificare e paragonare delle sequenze. Infatti, possibile assegnare delle strutture secondarie preliminari sulla base della conoscenza della struttura primaria. In questo capitolo siamo interessati ad aspetti pi quantitativi della struttura secondaria degli acidi nucleici. Molto di quello che noto si sa da dati di diffrazione dei raggi X di fibra su strutture a doppia catena. Strutture a catena singola danno difficilmente buone fibre e quindi la conoscenza della loro struttura secondaria meno diretta. Alcuni aspetti delle doppie catene polinucleotidiche indicano immediatamente che la loro organizzazione di base molto differente dalla struttura secondaria delle proteine. In una doppia elica alcune posizioni delle unit ripetitive sono rese quasi uniformemente inaccessibili a diversi reagenti chimici e questo suggerisce che le basi siano localizzate allinterno della struttura. Al contrario tutte le catene laterali delle proteine sono localizzate allesterno delle eliche o dei foglietti beta. Tutti gli acidi nucleici, indipendentemente dalla loro sequenza, sono capaci di formare la stessa struttura a doppia elica. Lidea di una struttura degli acidi nucleici nei quali tutte le catene laterali sono allinterno e contemporaneamente qualsiasi tipo di sequenza possa essere compatibile con la struttura secondaria sembrata allinizio paradossale. La regola di Chargaff d un indizio importante, ma questa vale solo per la struttura totale dellacido nucleico e non per le catene singole. Per tener conto di tutte queste informazioni James Watson e Francis Crick concepirono lidea di interazioni specifiche tra basi complementari: A va con T e G va con C. E bene ricordare che a quel tempo non cerano evidenze dirette dellinterazione tra basi e nemmeno gli esatti equilibri di tautomeria cheto-amminica erano noti. La caratteristica critica delle coppie A-T e G-C riconosciuta da Watson e Crick era solamente la formazione di buoni legami idrogeno, infatti possono essere formati altri tipi di accoppiamenti tra basi e questi sono prevalenti in complessi tra monomeri isolati. La caratteristica particolare dello schema di accoppiamento di Watson e Crick che la geometria delle coppie A-T e G-C, misurata al punto in cui le basi si attaccano agli zuccheri, praticamente identica. Quindi una stessa geometria a doppia elica pu accomodare entrambe le coppie di basi senza distorsioni o perdita di simmetria. Una seconda caratteristica importante dellaccoppiamento Watson e Crick che esiste un asse di pseudo-simmetria C2 nel piano delle coppie di basi. Questo asse sovrappone il legame glicosidico della purina N9-C1 con il legame N1-C1 della pirimidina complementare. Lo stesso asse esiste sia in A-T che in GC: questo significa che la stessa geometria pu accomodare sia A-T che T-A.

45

Struttura a doppia elica degli acidi nucleici. Attorno allaccoppiamento Watson e Crick possono essere costruite molte geometrie differenti tra cui quelle di interesse biologico sono le strutture molecolari dei DNA A e B. La doppia elica dell'RNA molto simile a quella del DNA B. Tutte le strutture hanno caratteristiche in comune: tutte sono eliche destre, tutte hanno assi di simmetria binari e questi sono assi reali di simmetria se applicati alla sola catena fosfodiesterica, mentre sono assi di pseudosimmetria per le basi. Poich sono assi di rotazione le due catene devono andare in direzione opposta. Le due estremit della doppia elica sono quindi chimicamente e strutturalmente simili poich ciascuna contiene una catena che termina in 3 ed una che termina in 5. Una struttura a catene antiparallele importante per lappaiamento di basi allinterno di una catena singola (come il t-RNA). Accoppiamenti a catene parallele non permettono la formazione di ripiegamenti a forcina di capelli. Le strutture a doppia elica possiedono anche un secondo asse C2 di pseudosimmetria che passa tra ogni coppia di basi: per sequenze autocomplementari o palindrome questo asse un vero asse di simmetria.

46