Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Il genoma è l’insieme di tutto l’assetto cromosomico presente all’interno di un individuo, per cui si
può parlare di genoma umano, genoma batterico, genoma vegetale ecc.
Quindi rappresenta tutto il DNA dalla prima all’ultima base presente all’interno di un organismo
vivente.
Il genoma umano è stato il primo genoma di un vertebrato ad essere sequenziato nel 2001 ma c’è un
antefatto: alla fine del progetto genoma si conosceva l’ordine dal primo all’ultimo nucleotide
presente sul DNA dell’uomo ma diversi anni prima era partito un progetto mondiale chiamato
progetto genoma umano che prevedeva che ogni istituzione sequenziasse uno dei 23 cromosomi
che compongono il genoma e un’azienda americana comprò una batteria di sequenziatori
automatici grazie ai quali riuscirono a battere in tempo tutte le restati istituzioni pubbliche.
Questa impresa ha fornito molte informazioni sulla composizione genetica della nostra specie e
sull’evoluzione dei genomi in generale, inoltre ha reso possibile il confronto delle sequenze del
genoma umano con quelle di altri vertebrati che erano stati già sequenziati ed è nata un’altra branca
della genomica chiamata genomica comparata.
Il DNA contenuto all’interno delle 23 coppie di cromosomi umani (in realtà sono 22 coppie di
cromosomi somatici e 1 coppia di cromosomi sessuali quindi 22+y oppure 22+x) nelle cellule aploidi
cioè le cellule in cui il DNA è stato dimezzato e quindi i gameti (spermatozoi della cellula uovo che poi
si devono unire per formare i cromosomi) variano in dimensioni dal più piccolo 45 Mb (mega basi,
quindi sarebbero milioni di basi) a 279 Mb.
In totale un genoma umano è costituito da 3.286 Mb circa 3.3 x 10 9 bp = paia di basi.
Si è capito che grazie al meccanismo messo in atto dai geni del nostro organismo è possibile che lo
splicing alternativo possa far aumentare la quantità di proteine presenti nel nostro organismo e
quindi far aumentare le dimensioni del proteoma umano fino ad 80.000-100-000 membri.
Molti geni umani in base alla loro sequenza possono essere raggruppati in famiglie, dei circa 25.000
geni umani soltanto 3.500 sono geni unici, la restante parte è rappresentata da coppie di geni o in
famiglie geniche.
Si studiano delle sequenze presenti nei geni e si utilizzano degli strumenti bioinformatici: si allineano
le sequenze e si va a vedere se ci sono delle similitudini nella sequenza, dopo si possono raggruppare
i geni per famiglie.
Per esempio, i geni che producono le proteine istoniche (proteine che servono per dare la struttura
al DNA) o i geni degli rRNA (RNA ribosomiale) fanno parte di una famiglia.
Ci sono altre famiglie geniche che sono raggruppate in quanto codificano per prodotti che hanno dei
domini altamente conservati come domini che svolgono delle funzioni vitali come quelli implicati
nello sviluppo: PAX, SOX.
Poi sono famiglie geniche che codificano per prodotti che hanno brevissime sequenze
amminoacidiche conservate, per esempio ci sono dei geni che producono delle proteine che hanno
una conformazione a dita di zinco oppure alcune che hanno 56 residui amminoacidici in cui è
presente la cisteina coinvolte nello sviluppo del citoscheletro.
Molti trasposoni non svolgono una funzione ma si pensa che alcuni geni si sono trasformati in geni
a partire da trasponi.
Molte volte però possono causare dei problemi perché spesso nella loro trasposizione possono
inserirsi all’interno di una regione codificante e alterarne la funzionalità.
I trasposoni li possiamo trovare nei lieviti, nell’uomo ecc.
Una porzione molto grande del nostro genoma che fa parte della frazione ripetitiva è
rappresentata da due regioni: LINEs e SINEs.
Le LINEs sono sequenze ripetute anche 500.000 volte e hanno una funzione non del tutto nota.
Le SINEs possono codificare per una regione che deve essere trascritta ma anche questa funzione
non è ancora del tutto nota, sono grandi 500 bp e sono distribuite soprattutto nelle regioni ricche in
G-C del genoma.
Tra le SINEs la componente più importante è costituita dagli elementi ALU che sono dei trasposoni
quindi delle regioni in grado di spostarsi da una parte all’altra.
Queste regioni hanno una lunghezza media di circa 300 bp, sono chiamate così perché all’interno
della loro regione sono presenti delle sequenze (AGCT) che formano un sito per l’enzima di
restrizione Alu1.
Gli enzimi di restrizione sono stati scoperti all’interno
delle cellule batteriche che spesso sono infettate da
virus fagici; quando nella cellula batterica arriva un
ospite la cellula si difende andando a mettere in atto il
sistema di enzimi di restrizione che sono capaci di
riconoscere un acido nucleico estraneo e tagliarlo in un
punto ben preciso.
Tutti gli organismi viventi sono dotati di questo sistema
enzimatico che riconoscono una doppia elica del DNA
estraneo e lo tagliano in un punto ben preciso.
Se c’è una mutazione nella sequenza l’enzima non è
capace di riconoscere la sequenza e non la taglia.
Quindi se l’agente patogeno che entra nella cellula
subisce delle mutazioni l’organismo non si può più
difendere.
Queste sequenze ripetute ALU presenti nell’organismo umano sono presenti all’interno di geni e
possono essere correlate con delle malattie ereditarie e con la presenza di forme cancerose.
Queste sequenze sono state studiate molto sia per la loro correlazione alle malattie sia per la
genetica di popolazione ossia quella genetica che va a capire com’è organizzato il DNA in una
popolazione di una determinata specie e quindi vedere se DNA di una specie sono comuni o hanno
subito delle modificazioni nel corso dell’evoluzione della specie.
Questo è quello che viene chiamato cariotipo umano in particolare questo rappresentato è il
cariotipo di un individuo di sesso femminile perché sono presenti le 22 coppie di autosomi e la
coppia di cromosomi sessuali femminili.
Le regioni colorate in verde contengono le sequenze ALU.
Essendo capaci di spostarsi da una zona all’altra, una volta che si sono spostate le sequenze ALU
possono generare dei danni a livello del DNA come l’alterazione dell’espressione di un gene,
l’alterazione della lettura corretta del gene (reading frame) e l’alterazione del processo di splicing
cioè di rimozione delle regioni non codificanti.
Le malattie con cui sono correlate la presenza di elementi ALU sono l’ipercolesterolemia familiare, il
diabete mellito di tipo 2, il carcinoma mammario, il sarcoma di Ewing, emofilia e neurofibromatosi.
Spesso le malattie possono essere associate con singole mutazioni che possono avere ripercussioni
gravi come l’Alzheimer, il carcinoma del polmone e il tumore dello stomaco.
Un’altra parte del genoma umano è costituita da DNA ripetitivo il cui 5% è rappresentato da grandi
duplicazioni e il 3% da ripetizioni semplici.
Una parte del DNA ripetuto può essere presente in regioni terminali del DNA chiamate telomeri
oppure nelle regioni centromeriche cioè vicine al centromero.
Ci sono regioni cromosomiche duplicate e in alcuni casi possiamo trovare anche delle delezioni cioè
regioni del cromosoma che vengono perse.
Le regioni ripetute che possono essere rappresentate da geni funzionali sono correlate con dei geni
che devono svolgere funzioni importanti.
Sebbene molta parte del DNA ripetuto non abbia una funzione precisa c’è una piccola parte, il 5%
che richiede necessariamente una ripetizione delle porzioni geniche, cioè è necessario che un gene
sia presente in più copie perché deve svolgere funzioni fondamentali come i geni che codificano per i
processi digestivi, geni per i recettori dell’olfatto, geni per la risposta immunitaria ma anche gli
oncosoppressori e i geni per il metabolismo degli ormoni e dei farmaci.
I geni presenti all’interno del DNA ripetuto vengono chiamati CNV cioè copy number variation.
Invece per quanto riguarda le ripetizioni semplici (DNA satellite), è la parte di DNA formata da
piccole regioni nucleotidiche ripetute n volte.
Queste regioni possono avere delle dimensioni più o meno grandi: possono essere ripetizioni molto
corte e in questo caso si chiamano microsatelliti o ripetizioni più lunghe che si chiamano
minisatelliti.
Si presume che queste ripetizioni hanno origine dagli errori che vengono fatti quando il DNA umano
si duplica.
Nelle piante questo DNA satellite è stato utilizzato per fare studi di popolazione, nell’uomo è stata
studiata la correlazione tra queste ripetizioni e alcune forme tumorali.
Altre volte possono svolgere delle funzioni di protezione del cromosoma perché spesso si trovano
nelle parti terminali del cromosoma.
È stato scoperto che i microsatelliti sono ereditari e tutti noi li abbiamo solamente che cambia il
numero di ripetizioni.
Oltre agli introni, esoni, trasposoni, ripetizioni semplici e grandi duplicazioni abbiamo una parte del
genoma rappresentata dagli pseudogeni.
Gli pseudogeni sono regioni geniche che possono aver perso la funzione, infatti sono geni inattivi
che non producono nessun prodotto genico.
Possono essere assimilati a geni ma mancano di alcune parti, per esempio possono esserci codoni di
stop quindi il prodotto genico non viene prodotto correttamente o non presentano il promotore,
quindi non possono essere copiati dall’RNA.
Si possono essere originati a causa di una duplicazione di un gene funzionale e la copia del gene
viene integrata in una nuova localizzazione genomica oppure processati cioè si parte sempre da un
gene funzionale che in seguito a trascrizione si è formato RNA che è stato trasformato in cDNA e
inserito all’interno del genoma e quindi non essendo un gene completo non ha una funzionalità.
Dopo l’integrazione gli pseudogeni accumulano un sacco di mutazioni e possono essere riconosciuti
facilmente.
L’ultima parte del genoma è rappresentata da un altro DNA intergenico che può essere
rappresentato da piccole sequenze di RNA non codificanti oppure da lunghe sequenze di RNA non
codificanti.