Sei sulla pagina 1di 6

APPUNTI DI BIOINFORMATICA

Concetto di Vita e di Organismo Vivente


Un qualsiasi organismo, ha un ciclo di vita articolato in 3 fasi: nascita, sviluppo, morte. Un
organismo, si dice vivente se durante la sua fase di sviluppo è in grado di riprodursi, cioè di
effettuare delle copie di sé stesso,.
Lo sviluppo di un organismo, è assimilabile alla funzione di un pc; è cioè inteso come la
possibilità di acquisire informazioni dall’esterno e di elaborarle: nel caso di un essere umano,
questo può essere paragonato all’azione del mangiare, dell’ascoltare, del respirare, ecc.
Un'altra caratteristica importante di un organismo vivente, è quella di essere soggetto ad
infezioni da parte di altre entità, i cosiddetti virus, che penetrano nel nostro organismo e influenzano
lo svolgimento delle funzioni vitali.
Un essere vivente, per poter svolgere al meglio le sue funzioni, deve essere racchiuso in uno
spazio limitato; ciò favorisce la vicinanza tra le diverse strutture che lo compongono, quindi una
migliore interazione e di conseguenza, un miglior funzionamento.

L’organismo vivente per eccellenza: la Cellula!

Definizione
La cellula, è l’organismo vivente per eccellenza.
Una cellula è l’organismo vivente più piccolo al mondo ed è in grado di provvedere a se stessa.

Struttura
La cellula è formata da un nucleo centrale, da diverse stanze e da una membrana che la separa
dall’ambiente esterno.
Il nucleo, è la parte più importante, in quanto contiene tutte le informazioni necessarie alla
cellula per sopravvivere.
Le stanze, sono invece dei settori della cellula compresi nello spazio tra il nucleo e la membrana.
In ogni settore, si trovano diversi organismi che svolgono diverse funzioni utili per la cellula
(vedere ad esempio la stanza dei mitocondri, nella quale viene prodotta l’energia per lo svolgimento
delle funzioni cellulari).
La membrana, è il confine della cellula con l’esterno. Essa è formata da un doppio strato
lipidico, all’interno del quale si trovano delle proteine. Queste ultime, devono permettere la
comunicazione della cellula con il mondo esterno, cioè devono permettere il passaggio di
determinate molecole dall’esterno all’interno e viceversa.

Cellule Eucariote e Cellule Procariote


Quelle di cui si è parlato finora, sono le cellule eucariote. Ogni cellula eucariota, contiene nel
nucleo parte delle informazioni genetiche relative al padre e alla madre (DNA).
Le cellule procariote, a differenza delle prime, non contengono il DNA ricombinato relativo al
padre e alla madre, ma solo quello della cellula madre da cui derivano (e al quale sarà identico), che
si troverà libero all’interno della cellula stessa in quanto questa è anche priva di nucleo.
Un elemento importante per la cellula: l’Acqua!
Una cellula senza acqua (spora), è una cellula inattiva che, se immersa nell’acqua, può prendere
vita.
L’acqua, è quindi l’elemento più importante per la vita della cellula, in quanto questa è per la
maggior parte formata d’acqua ed è immersa nell’acqua. In un sistema multicellulare, l’acqua che si
trova fra le cellule stesse, è necessaria per favorire la comunicazione tra di esse.

Le Origini della Vita


Miliardi di anni fa, non c’era traccia di vita. Sulla terra erano presenti solamente dei composti
gassosi formati da metano, idrogeno, anidride carbonica, ossigeno, ecc.
Alcuni studi, hanno dato origine all’ipotesi che queste sostanze, sollecitate da scariche elettriche,
abbiano dato vita al primo essere vivente. Quindi, tenendo conto delle nostre attuali caratteristiche,
si suppone che il fenomeno di cui si è parlato prima, abbia dato origine in qualche modo, al primo
modello di DNA. Quest’ultimo, in milioni di anni, dopo varie duplicazioni, mutazioni e
ricombinazioni, ha portato alla situazione attuale: ovvero, migliaia di individui diversi appartenenti
a regni diversi.

Il DNA
Il DNA (Deossid Nucleic Acid), non è altro che il codice genetico proprio di ogni individuo, cioè
è quell’insieme di informazioni che caratterizzano un organismo vivente.
Il DNA è composto da 4 basi azotate (monomeri): A (adenina), G (guanina), C (citosina), T
(timina). Il legame tra le basi, è favorito dal libosio fosfato. Alcune combinazioni (precisamente
delle triplette dette codon) di queste 4 basi, danno origine agli aminoacidi che, messi insieme,
codificano una proteina.

La Duplicazione del DNA


Un individuo, nel creare una copia identica di sé stesso, effettua principalmente una duplicazione
del suo DNA.
Il processo di Duplicazione del DNA (o sintesi proteica), sfrutta principalmente il principio di
complementarietà, per il quale ognuna delle 4 basi azotate, si può completare con una delle altre tre
rimaste: in particolare
AT
CG

Essendo il DNA composto da una catena di aminoacidi molto lunga, è difficile che riesca ad
uscire dal nucleo della cellula e partecipare quindi attivamente al processo di duplicazione. In
questo caso, intervengono delle apposite molecole.

Fase 1: dal DNA all’ mRNA (trascrizione)


Il processo di trascrizione, viene regolato dall’enzima RNA polimerasi. Questo, all’inizio, si
lega a una regione del DNA detta promotore e favorisce lo srotolamento della doppia elica e la
separazione dei 2 filamenti che la formano. Uno di questi 2 filamenti (quello codificante), viene
utilizzato per la produzione dell’mRNA secondo il principio di complementarietà (da notare che
nell’RNA la T è sostituita dalla U (uracile). Alla fine del processo, il DNA si riavvolge a doppia
elica e l’RNA libera la molecola di mRNA completa.
Fase 2: dall’mRNA alla proteina (traduzione)
In questa fase, entrano in gioco i ribosomi contenuti nel tRNA, che servono a fabbricare delle
catene polipeptidiche (cioè delle catene di proteine).
La traduzione, ha inizio quando l’estremità della molecola di mRNA, quella che contiene il
codone di inizio AUG, entra nella zona di elaborazione delle informazioni del ribosoma.
Il tRNA, che presenta l’anitcodone complementare a quello di inizio, cioè UAC, si lega tramite
questo al codone di inizio AUG: inizia la traduzione!
Andando avanti, nel ribosoma entra anche la successiva tripletta dell’mRNA a cui verrà legata la
tripletta di tRNA complementare corrispondente, e così via… stiamo assistendo alla traduzione!
Man mano che si procede con la traduzione, tra le varie molecole di tRNA, grazie ad un
catalizzatore, si instaura un legame peptidico.
Nel ribosoma, possono essere contenute 2 molecole di mRNA per volta e, man mano che si và
avanti, le molecole già utilizzate vengono rilasciate.
Il processo, ha termine nel momento in cui, nella regione di elaborazione delle informazioni,
entra il codone di arresto UAA, che segnala che la traduzione è terminata.
Il ribosoma e la molecola di mRNA, rimangono disponibili per essere riutilizzati altre volte, ma
non hanno una durata eterna.

Un aspetto importante da tenere in considerazione, è che non tutta la sequenza di DNA è


codificante. Le stringhe codificanti, prendono il nome di esoni ed iniziano per AUG, mentre quelle
non codificanti prendono il nome di introni. Ma se per puro caso, nella mia stringa trovo più
triplette AUG?
Il sistema di duplicazione, deve quindi prevedere un metodo per il riconoscimento delle stringhe
codificanti: per questo motivo, prima dell’inizio di una stringa codificante (con AUG all’inizio),
troveremo delle sottosequenze di TA consecutive (i cosiddetti TATA BOX).
Durante la lettura, si dovrà fare attenzione anche al metodo della stessa: dato che si prendono in
considerazione delle triplette, potranno esserci 3 possibilità di “leggere” le stringhe, dipende da
quale lettera si inizia a leggere:

1° frame ATCGCCGTAATGTGACATGA (se si inizia a leggere dalla prima lettera)


2° frame ATCGCCGTAATGTGACATGA (se si inizia a leggere dalla seconda lettera)
3° frame ATCGCCGTAATGTGACATGA (se si inizia a leggere dalla terza lettera)

Dato che il DNA è composto da 2 filamenti (la doppia elica), allora avremo un totale di 6 frame di
lettura possibili (3 frame da 5’ a 3’ e 3 frame da 3’ a 5’).
Gli aminoacidi
Gli aminoacidi, sono delle componenti che si vengono a formare dalle varie combinazioni in
triplette delle basi azotate.
In natura, esistono comunemente 20 aminoacidi diversi. Tutti hanno in comune il fatto che sono
composti da un atomo di carbonio centrale (carbonio α), al quale si legano un atomo di idrogeno,
un gruppo carbossilico e un gruppo amminico. Ciò che invece contraddistingue i diversi
aminoacidi, è il cosiddetto gruppo R (o catena laterale), che è quello che determina la forma della
proteina grazie alla sua polarità e quindi al modo di legarsi con gli altri aminoacidi.

La proteina
Un gene, è un frammento di DNA che codifica una proteina, quindi, essa non è altro che una
sequenza di aminoacidi.
Durante l’evoluzione, numerosi aminoacidi sono stati sostituiti: una sostituzione tra aminoacidi
con indice di distribuzione dell’idrofobicità pressoché uguale, non ha comportato sostanziali
differenze nel funzionamento di una proteina. Se un aminoacido, non è stato mai sostituito, allora si
parla di conservazione (che è sempre preferibile a qualsiasi sostituzione).
Negli organismi, sono presenti migliaia di proteine, ognuna delle quali, svolge una specifica
funzione.
La struttura primaria e la funzione di una proteina, sono determinate, come già detto, dalla
sequenza di aminoacidi che la compongono. Una volta formata, la struttura primaria si ripiega
spontaneamente e assume delle forme ad andamento regolare (tipo α-eliche o β-sheet): tali forme
sono le strutture secondarie della proteina. Alcuni tratti della struttura, possono anche assumere
andamento casuale: questi, insieme a quelli di forma regolare, contribuiscono alla forma finale della
proteina, la cosiddetta struttura terziaria. Più proteine legate tra loro, formano una catena
polipeptidica, che è la struttura quaternaria delle proteine.
Alcuni esempi di proteina, sono la DNA polimerasi e l’emoglobina umana.
In natura, esistono 3 tipi diversi di proteina:

1. Enzimatiche (o catalizzatrici): servono ad accelerare le reazioni chimica all’interno di


un organismo. Lo studio di queste proteine, è basato su tecniche come la
spettrofotometria e la cinetica enzimatica. Queste tecniche richiedono un sacco di tempo,
mentre in informatica, esistono degli appositi programmi che producono il risultato in
pochi secondi

2. Proteine di membrana: incastrate nelle membrane cellulari, favoriscono il passaggio di


informazioni dall’interno della cellula all’esterno e viceversa, cioè permettono alle cellule
di comunicare con l’ambiente circostante e quindi anche con altre cellule. Lo studio di
queste proteine, è basato su tecniche come la cromatografia o su tecniche che utilizzano
detergenti (essendo grasse, le separano e ne permettono l’analisi nell’acqua). In
informatica, si ricorre all’analisi dell’idrofobicità, che richiede poco tempo, in quanto si
tratta di analizzare solamente l’attitudine della proteina a dimorare in acqua o non (questo
dipende dagli aminoacidi di cui è formata)

3. Proteine Strutturali: sono più complesse delle altre e hanno il compito di formare e
mantenere delle strutture.
Duplicazione e Mutazione Genica
Si parla di duplicazione genica, quando da un gene se ne vengono a formare due uguali ed
identici al primo.
La mutazione, avviene quando da un gene, se ne forma uno completamente diverso. In questo
caso il gene originale, viene perso, a meno che al fenomeno di mutazione non si aggiunga quello di
duplicazione, allora, in questo caso, c’è la possibilità che una copia del gene originale rimanga.
Due geni, sono omologhi se discendono dallo stesso ancestore.
Dobbiamo poi fare un’ulteriore distinzione dei geni omologhi, questo perchè nella discendenza,
possono esserci state duplicazioni o mutazione. Nel caso ci sia stata duplicazione, allora si parlerà
di geni omologhi e paraloghi, perchè appartenenti alla stessa specie e codificanti la stessa proteina.
Nel caso, invece, di una mutazione, allora avremo due geni omologhi e ortologhi, in quanto
appartenenti a specie diverse e codificanti proteine diverse.

Alcuni cenni sulle proteine di membrana


Come abbiamo visto in precedenza, la membrana cellulare è composta da 2 strati a contatto con
l’acqua (quello esterno e quello interno) e da 1 strato idrofobico compreso tra gli altri due: questo
sandwich, prende il nome di fosfolipide. In questo modo, la cellula è perfettamente isolata dal
mondo esterno, in quanto niente può passare attraverso la membrana, ma in questo modo la cellula
non avrebbe contatti con l’esterno e la sua sopravvivenza sarebbe compromessa. E’ per questo
motivo che esistono le proteine di membrana; la loro funzione principale, è quella di veicolare
determinate molecole dall’esterno all’interno della cellula e viceversa. Per ovviare a questo scopo, è
chiaro che queste proteine dovranno possedere 2 caratteristiche particolari: la prima, è che devono
avere delle zone idrofiliche (cioè delle zone che possono stare a contatto con l’acqua, all’interno e
all’esterno della cellula) e delle zone idrofobiche (che possono stare all’interno della membrana
cellulare).

La genomica
Come descritto in precedenza, un gene è una sequenza di DNA che codifica una proteina. Il
genoma, è dunque l’insieme di tutti i geni che si trovano nel corpo umano. Lo studio del genoma, è
chiamato genomica.
Questa, segue due strade: la prima è quella tradizionale, cioè tramite la manipolazione genetica
su dei semplici batteri, è possibile far sì che questi producano la proteina umana che verrà poi
studiata; la seconda, quella che ormai ha trovato larga diffusione, è quella informatica, che prevede
il paragone della proteina trovata con altre proteine già studiate (quindi note), contenute nelle
banche dati di tutto il mondo.
Paragone con Proteine Note
Il paragone con proteine note, consiste sostanzialmente nell’allineare due o più proteine tra loro
e farle scorrere fino a rilevare l’allineamento con maggiore somiglianza. Nel paragone, è di
particolare influenza un’eventuale mutazione genica che cambia completamente il codice di una
proteina (aggiunte, eliminazioni, cambiamenti), quindi l’allineamento potrebbe saltare. In questo
caso, è necessario aggiungere dei gap(-) nelle sequenze.
Un altro metodo, potrebbe essere quello di costruire una matrice dot, in cui le due sequenze sono
poste ai margini della matrice (in alto e a lato) e ogni casella viene marcata se le due lettere delle
sequenze ad essa corrispondenti combaciano.
E’ inoltre buona norma, tenere conto delle sostituzioni avvenute nel tempo: a questo scopo sono
state introdotte le matrici di sostituzione (ad esempio la pam), che consentono di attribuire un
punteggio tra due aminoacidi appaiati in un allineamento: più sarà alto questo punteggio, più sarà
alta la possibilità che quell’aminoacido sia stato modificato.

Metodi di Allineamento Esatto - Allineamenti Globali e Locali


L’allineamento globale tra due sequenze, è utilizzato per la ricerca di similarità a livello globale,
mentre l’allineamento locale, viene usato per ricercare similarità fra determinate regioni di 2 geni:
in poche parole, si tiene conto anche della lunghezza della regione in cui esiste la somiglianza.

Metodi di Allineamento Euristico – Ricerca di similarità in banche dati


Per comprendere il funzionamento di una proteina, avrei bisogno di trovare una proteina identica
e studiarla. Questa operazione, fatta manualmente richiede molto tempo. Al giorno d’oggi, esistono
dei software capaci di velocizzare questa procedura, tanto da farla durare pochi secondi; questo
grazie alla divisione della sequenza in tante sottosequenze e al confronto con altre proteine note
presenti in banche dati.

Se da un confronto di 2 proteine di organismi diversi, risulta un’identità maggiore del 30%,


allora queste proteine, con una probabilità del 95%, avranno la stessa funzione; se l’identità
superasse fosse compresa tra il 25% e il 30%, allora potrebbe esserci (ma non è detto) un’eventuale
probabilità che le due proteine abbiano la stessa funzione; un’identità superiore alla soglia del 95%,
significa che si è verificato qualche errore nell’algoritmo, perché una situazione del genere non
dovrebbe esistere.

Allineamento Multiplo (MultiAllineamento)


Il Multialliniamento (che coinvolge, quindi, tre o più sequenze), viene effettuato nell’ipotesi che
le sequenze da allineare, siano evolutivamente correlate, siano cioè omologhe. Il multiallineamento,
si basa su una procedura di allineamenti progressivi. Questa, a volte, può purtroppo dar luogo a dei
problemi, nel senso che se avvenisse un errore durante un singolo allineamento, questo si
propagherebbe anche nelle fasi successive. D’altro canto, questa procedura è molto veloce e
consente di allineare un numero piuttosto elevato di sequenze in un tempo ridotto.
Con il multiallineamento, si può osservare come la natura abbia operato su più organismi
filogeneticamente distanti nel tempo. Ad esempio, se allineiamo tre sequenze e notiamo che in tutte
e tre c’è una zona codificante che è rimasta perfettamente uguale, vorrà dire che avremo trovato la
firma della proteina, cioè quella parte che contraddistingue la proteina da tutte le altre (se cambia, la
proteina non avrebbe più la stessa funzione).

Potrebbero piacerti anche