Trasporto:
Alcune proteine trasportano varie Lemoglobina
trasporta
sostanze, come lossigeno, gli ioni, lossigeno
ecc.
catena R
H R laterale R
carbonio
C
+ COO
H 3N COO NH 3 COO
NH 3
CH 3 CH 3 CH 3 S gruppiRcarichipositivamente
CH 3 COO COO COO
LeucinaIsoleucinaMetionina H 3N C H H 3N C H H 3N C H
CH 2 CH2 CH 2
gruppiRpolarinoncarichi CH 2 CH2 C NH
CH 2 CH
COO COO COO CH 2
C N
H 3N C H H 3N C H H 3N C H CH 2 NH H
H 3N C H H 3N C H COO COO
CH2 CH 2 H 3N C H H 3N C H
C CH2 CH2 CH2
H 2N O C COO CH2
H 2N O COO
Asparagina Glutammina Aspartato Glutammato
Alcune propriet degli amminoacidi
H 2O H 2O
R1 H R2
H 3N CH C N C H COO
O
Diverso comportamento acido-base
In un peptide, il gruppo carbossilico e quello amminico non sono pi vicinali, per
cui il loro comportamento acido-base pu anche differire da quello dei singoli
amminoacidi costituenti. I gruppi carbossilici e amminici coinvolti nei legami
peptidici non possono pi ionizzare. I gruppi ionizzabili nelle catene laterali
possono ionizzare (le loro propriet possono comunque subire variazioni rispetto
a quelle negli amminoacidi isolati).
OH
CH 3 CH 3
CH
CH 2 OH H H H CH 2 H CH 3 H CH 2
H 3N C C N C C N C C N C C N C COO
H O H O H O H O H
terminaleamminico terminale carbossilico
Gli amminoacidi sono molecole chirali
Tutti gli amminoacidi naturali hanno chiralit L
(come la L-gliceraldeide)
Esistono amminoacidi nella configurazione D, ma
non sono abitualmente trovati nelle proteine
Lunghezza e composizione dei polipeptidi in natura
I polipeptidi si trovano in natura con precise dimensioni (peso molecolare) e
composizione in amminoacidi. Questa evidenza storica pu essere desunta
anche semplicemente idrolizzando i polipeptidi con acidi, in modo da poter
analizzare la miscela di amminoacidi risultante.
Le proteine possono essere semplici o coniugate
Le proteine semplici sono costituite solo da una o pi catene polipeptidiche,
mentre quelle coniugate contengono anche parti non proteiche associate,
necessarie per la loro funzione. Queste parti sono chiamate gruppi prostetici e
le proteine coniugate possono essere catalogate sulla base dei loro gruppi
prostetici.
Un concetto chiave:
I livelli della struttura proteica
Struttura Struttura Struttura Struttura
primaria secondaria terziaria quaternaria
Lys
Lys
Gly
Gly
Leu
Val
Ala
His
H R
N
gruppo in
catena laterale
C
O
C piano del
legame peptidico
= 180 , =180
Angoli diedri importanti
La forma geometrica della catena polipeptidica dipende da tutti gli angoli e
che si susseguono lungo la catena
C N
ON H H
raggio di C C O
contatto
per atomi N H O C
C C
non legati N N
O C O H
H
C H C H H
C
R O
H R
O
C H R
N
C N
R raggio di C N
C N contatto
H
per atomi C H
H non legati
O C C
O
C C C
O
= 60 , = 180
= 0 , = 0
C unaltra rotazione di 120 di
muove il carbonile ingombrante
= 0 , = 180 = 180 , = 0 il pi lontano possibile dalla catena
laterale
Ramachandran e collaboratori hanno
pensato di diagrammare gli angoli e
-elica
delle proteine note e hanno verificato la foglietto parallelo
tripla elica del levogira
presenza di zone consentite e zone non foglietto antiparallelo
collagene
consentite del piano . Tra le zone si 180
+4
trovano motivi strutturali caratteristici. II
C +5
(gradi)
2
90 +3
+4
+5
5
4
180
180 90 0 90 180
(gradi)
anello chiuso
-elica
destrogira
Diagramma di Ramachandran ideale e reale (da dati
strutturali)
Ideal Real(akinase)
Ramachandran Plots
Il legame idrogeno nelle proteine
Dalla discussione fatta in precedenza
risulta che il gruppo carbonilico delle
proteine contiene un ossigeno che
pu accettare un legame idrogeno,
mentre allazoto ammidico legato un
idrogeno che pu fungere da donatore
di legame idrogeno.
Questi legami idrogeno possono
avvenire con molecole di acqua o,
convenientemente, tra parti diverse di
una proteine (lidrogeno di un azoto
ammidico con un ossigeno carbonilico
sulla stessa catena o su altre catene
polipeptidiche). Spesso in una
proteina molti legami idrogeno si
formano allo stesso tempo
Un legame idrogeno tra gruppi di
due catene polinucleotidiche
L-elica
uno dei motivi strutturali pi diffusi (e prima scoperti). Grazie a legami idrogeno,
gli amminoacidi si organizzano un unelica DESTROGIRA che compie un giro
completo ogni 3.6 ammminoacidi (residui), equivalente a 13 atomi (si dice anche
elica 3.613).
Ogni amminoacido si estende per 1.5 lungo la catena (ogni giro quindi 1.5 x
3.6 = 5.4 , il passo dellelica).
Diverse
rappresentazioni
dell -elica.
L-elica
Lelica (senza considerare le catene laterali, che
puntano verso lesterno) ha un diametro di 6 .
Il carbonile di CIASCUN peptide forma un legame
idrogeno con lN-H che sta 4 residui pi in alto lungo la
catena.
I legami idrogeno sono nella direzione dellasse
dellelica, tutti i carbonili puntano verso una direzione
(lalto) mentre tutti I legami N-H puntano nella direzione
opposta.
Gli angoli di torsione per ottenere unelica di questo tipo
sono =-60 e tra -45 e -50.
Il numero di residui coinvolto in unelica pu variare.
La subunit dellemoglobina
Un modello ideale di -elica (poly-Ala)
Solo n-4 legami ad idrogeno intra--elica si
possono formare in unelica lunga n, mentre i
primi 4 ossigeni carbonilici e gli ultimi 4 idrogeni
ammidici alle estremit dellelica possono
formarli con altri gruppi non parte dellelica
(capping dellelica)
Dallo studio dei poliamminoacidi
(polipeptidi fatti da un tipo di
amminoacido) si vede che non tutti
gli amminoacidi hanno la stessa
propensione a formare -eliche:
particolarmente frequente trovare
residui con gruppi R poco
ingombranti (Ala) mentre si
trovano a fatica gruppi carichi, la
cui repulsione disordina lelica. Si
vede, ad esempio, che a valori di
pH in cui i gruppi carichi si
scaricano (protonazione dei
carbossili, deprotonazione degli
ammoni) la propensione a formare
la doppia elica di tali amminoacidi
aumenta. La prolina deforma (o
interrompe) l-elica.
Le proteine fibrose e le -eliche
Le proteine possono essere distinte, sulla base della loro solubilit, in proteine fibrose,
globulari e di membrana.
Nelle proteine fibrose, le catene polipeptidiche sono allungate e allineate parallelamente alla
direzione della fibra. Sono proteine spesso insolubili e con grande resistenza meccanica, che
ricoprono ruoli strutturali in natura.
-elica
Antiparallel -sheet
Foglietti paralleli o antiparalleli
Ogni catena del foglietto pu essere pensata come unelica con passo 2 (2 residui
ogni giro). Poich il carbonio tetraedrico, ogni piano del legame peptidico
piegato rispetto a quello successivo (ed il foglietto risulta piegato).
I legami idrogeno in questa
struttura sono essenzialmente
inter-strand. La catena
polipeptidica nella
conformazione pi estesa
possibile (detta talvolta
conformazione ).
Il foglietto antiparallelo un po
pi esteso di quello parallelo
(che pi piegato, per formare i
legami H, che sono piegati).
I residui sono distanti 0.347 nm
nel foglietto antiparallelo (0.325
nm in quello parallelo).
I gruppi R si estendono
perpendicolarmente rispetto al
piano del foglietto.
In genere si trovano foglietti paralleli in -eliche e zone disordinate danno flessibilit
strutture grandi (almeno 5 catene per
foglietto) mentre foglietti antiparalleli
possono anche essere costituiti di 2 catene.
Ci sono proteine costituite prevalentemente
residui idrofobici in
verde
Una proteina globulare pi tipica la ribonucleasi A bovina (bovine ribonuclease
A) una piccola proteina (14.6 kD, 129 residui) che contiene alcune eliche corte,
una sezione importante di -sheets antiparalleli e alcuni ripiegamenti , oltre ad
alcuni segmenti senza struttura definita.
Codice colori amminoacidi:
Struttura della calmodulina (una proteina che lega il calcio Struttura della flavodoxina (uno scambiatore di elettroni con
Con unelica totalmente esposta al solvente) unelica anfipatica esposta al solvente solo su una faccia)
Limpaccamento delle proteine
Calcolando il volume delle proteine globulari e la
somma dei volumi di van der Waals dei singoli
amminoacidi, si pu vedere che la densit di
impaccamento delle proteine in genere 0.72-0.77. Stabilizzazione del -sheet
Questo significa che ci sono spazi vuoti (molto
piccoli) nellinterno della proteina che possono
conferire un certo grado di flessibilit meccanica. La
Stabilizzazione dell-elica
maggior parte di queste cavit non sono grandi a
sufficienza per ospitare molecole (acqua).
I coil o random coil (gomitolo statistico, in Italiano)
sono quelle parti di catena polipeptidica non
interessata da una struttura secondaria. Queste parti
sono, spesso, ugualmente strutturate, ma in maniera
pi variabile, grazie alle interazioni delle loro catene
laterali (i gruppi R). Queste interazioni sono molto
importanti per stabilizzare le strutture proteiche (vedi
modello a destra)
La calmodulina (di Paramecio) che lega il calcio mediante regioni a loop non
strutturate
Parallelo, destrogiro
rara
Oltre che per gli strati, le proteine sono classificabili sulla base della struttura
secondaria che contengono (-eliche antiparall, -sheet paralleli o misti, -sheet
antiparall. proteine ricche di metalli o disolfuri). Le similitudini della struttura
terziaria non devono ingannare su similitudini di funzione: lomologia funzionale
spesso dipendente da similitudini strutturali su una scala molto pi piccola che
lintera proteina.
Proteine di eliche antiparallele.
il modo pi semplice per impaccare -eliche. Le proteine quindi consistono di
mazzetti (bundle) di eliche, spesso con una torsione levogira.
La maggior parte di queste proteine fatta di 4 eliche.
Le globine sono un gruppo importante di proteine di -eliche: sono costituite da
due strati di eliche, uno perpendicolare allaltro e la catena polipeptidica che passa
continuamente da uno strato allaltro.
esokinasi
Proteine con foglietti antiparalleli
I foglietti antiparalleli dispongono, di solito, i residui idrofobici su un solo lato, per cui
possono avere un lato esposto al solvente.
La struttura minimale a 2 strati, per proteggere il nucleo idrofobico. A volte la
geometria a barile (i barili contengono in genere un numero pari di catene e
possono essere o tutti paralleli o antiparalleli).
A volte le catene sono interbloccate con topologie complicate che ricordano le
Greche.
Insulina ferrodoxina
I coiled-coil
Il motivo strutturale dell-cheratina detto coiled-coil. un motivo presente
anche in altri tipi di proteine non costituite esclusivamente di eliche. In un mazzo
di eliche ce ne possono essere 2, 3 o 4 e possono essere parallele o
antiparallele.
-Emolisina di
Staphilococcus aureus:
una proteina con un -
barrel che protrude e
che si inserisce nella
membrana cellulare
creando un buco che
porta alla lisi della
cellula.
Helix- turn- helix
Beta sandwiches
4 bundle
Le proteine di membrana si sono adattate ad un
ambiente idrofobico
La struttura della
batteriorodpsina, una
proteina pompa che sposta
protoni attraverso la
membrana (verso fuori)
La struttura quaternaria
non lineare
tridimensionale
formata da legami
idrogeno, legami
covalenti (disolfuri),
impaccamento idrofobico
ed esposizione di
superfici idrofiliche
le strutture favorevoli
sono frequenti e sono
state catalogate
Esempi di altre strutture quaternarie
Interazioni idrofobiche
Legami idrogeno inter-
catene
Affollamento intracellulare
Proteina
Incotra GroEL Nativa
aggregati
10-15%
Problematica con alto riscontro
nellespressione di proteine ricombinanti
eterologhe
La sovraespressione porta ad un livello di aggregazione
proteica elevato:
CORPI DINCLUSIONE
"All crystallographic models are not equal. ... The brightly colored stereo views
Utilizzare la densit elettronica of a protein model, which are in fact more akin to cartoons than to
e le conoscenze biochimiche molecules, endow the model with a concreteness that exceeds the
intentions of the thoughtful crystallographer. It is impossible for the
sulla proteina per raffinare le crystallographer, with vivid recall of the massive labor that produced the
model, to forget its shortcomings. It is all too easy for users of the model to
informazioni ed ottenere un be unaware of them. It is also all too easy for the user to be unaware that,
through temperature factors, occupancies, undetected parts of the protein,
modello and unexplained density, crystallography reveals more than a single
molecular model shows.
Alcuni cristalli non diffrangono affatto o troppo poco (disordine intrinseco), altri
sono troppo piccoli o troppo fragili.
Le proteine nei cristalli tendono a impaccarsi lasciando fra loro larghi spazi
Impaccamento
della glicolato
ossidasi
Struttura nativa
Diffusione di ligandi, metalli pesanti
Diffrazione a raggi X
Risoluzione
Spettroscopia NMR
I protoni risuonano ad una frequenza che
dipende dal loro intorno chimico.
Questo pu essere impiegato per
caratterizzare una struttura.
Non ha bisogno di cristalli, la proteina pu
essere in soluzione (anche se in genere
molto concentrata).
A risoluzione pi bassa della cristallografia
ai raggi X.
Spettroscopia NMR
NMR:7,400
Xray:58,000
Utili portali di ricerca per strutture
http://www.ncbi.nlm.nih.gov/sites/gquery
http://www.pdb.org
Il problema del ripiegamento delle proteine
il ripiegamento di una
proteina una reazione
chimica, il meccanismo tale
che lo stato di transizione
abbia bassa energia libera
In principio,
le leggi della fisica determinano per intero come una catena lineare di
amminoacidi si ripieghi in una struttura tridimensionale complessa
dotata di propriet biochimiche utili.
In pratica,
predire la struttura partendo dalla sequenza un grande problema
irrisolto.
Perch il ripiegamento un problema?
STATO FONDAMENTALE
STATO NATIVO
Paradosso di Levinthal (1968):
Se la ricerca casuale:
83 58
=5 ~ 10
fold = 58
~ 10 sec
12
k0 10
fold >> et delluniverso !!
2CI2 N= 83 residui
~ 5 stati ogni residuo
panorama di energia
conformazionale simile ad un
coordinata(e) di reazione campo da golf
Teoria della superficie di energia potenziale
La proteina cerca
CONFORMAZIONI ad
ENERGIA PI BASSA
altamente corrugata
lento!
coordinata(e) di reazione
Studi teorici hanno mostrato come
superfici di energia potenziale fatte
ad imbuto con un minimo unico
possano guidare efficientemente
una proteina verso strutture native
grazie alla progressiva
organizzazione delle strutture
parzialmente ripiegate che si
formano lungo il cammino.
Limbuto corrugato da
impedimenti locali (impedimenti
sterici, contatti non nativi, ecc.) che
producono barriere di potenziale
alcune volte maggiori delle
fluttuazioni termiche. Durante il
ripiegamento, questa corrugazione
dellimbuto comanda la cinetica del
processo intrappolando le molecole
che si stanno ripiegando.
Si ipotizza che i processi di
ripiegamento/denaturazione
possano avvenire su questa
complessa superficie di energia
potenziale, caratterizzata da
numerosi intermedi.
Cartoons by Larry Gonick
Una proteina guidata verso la sua struttura nativa da
superfici di energia potenziale con una struttura
globalmente ad imbuto
Le molecole individuali seguono
cammini differenti.
denaturazione meccanica
denaturazione
termica
mediante microscopia a forza atomica: Rief et al. Science 1997, 276, 1109-1112
Titina: la denaturazione e
la rinaturazione
procedono su due
traiettorie diverse. Il
tempo richiesto per
campionare tutte le
possibili interazioni e
scegliere i minimi di
energia ottimali diventa
sempre pi lungo
da: http://www.ch.embnet.org/MD_tutorial/
The Structural Prediction Problem
Given a protein sequence, compute its structure.
Possible in principle.
Astronomical, highly under-constrained search space.
Biophysics complex and incomplete.
Next to impossible in practice.
Secondary Structure Prediction
Much simpler to predict a small set of
classes than to predict 3-D coordinates of
atoms.
Amino acids have different propensities for
alpha helices, turns and beta sheets.
Homology can also be used since fold is
more conserved than sequence.
A Major Challenge of Bio-informatics
The challenge: Understand the relationship between amino acid
sequence and the 3D structure of proteins;
Predict 3D structure from sequence.
http://www.idi.ntnu.no/grupper/KS-grp/microarray/slides/drablos/Fold_recognition/sld004.htm
Predicting Protein Structure
Principle: Look for the structure with minimum free energy.
Despite substantial
improvements, success
is still very limited.
Talvolta qualcosa non perfettamente razionale
PARADIGMA STRUTTURA-FUNZIONE
SEQUENZA
STRUTTURA 3D FUNZIONE
AMMINOACIDICA
ESPERIMENTI DI DENATURAZIONE
Gomitolo statistico
IUPs
CONFORMAZIONE ESTESA
BASSA IDROFOBICITA
ALTA CARICA NETTA
MANCANZA DI Cys
ABBONDANZA DI Pro
ORDINE STRUTTURALE
CONFORMAZIONE ESTESA
SARA SBD DOMAIN
La PRINCIPALE PROPRIET
strutturale delle IUPs che non
posseggono una struttura ben
foldata in condizioni fisiologiche.
HIF-1
COMPOSIZIONE AMMINOACIDICA
DISTINTIVA
FREQUENZE DI AMMINOACIDI IN %
BASSA IDROFOBICITA
ALTA CARICA NETTA
human proteins have evolved to resist aggregation and to functio n efficiently, but
with almost no margin of safety to respond to genetic and environmental factors
that decrease their solubility or increase their concentration i n vivo.
1 61 95 140
oligomers
?
fibrils
(sheets)
Interacting with
membranes
it acquires Lewy body
-helix
structure
Syn is a natively The transition from the
unfolded protein natively unfolded monomeric
state to fibril is a process of
acquiring a -structure.
This process is still under
strong debate.
Amyloid fibrils
The name comes from the early mistaken identification of the substance
as starch (amylum in Latin)
SPETTROSCOPIA DI FLUORESCENZA
Il principale fluoroforo nelle proteine lamminoacido triptofano: esso ha
un massimo di assorbanza prossimo a 280 nm e un massimo di
emissione altamente dipendente dalla polarit dellambiente. Lintensit di
fluorescenza del triptofano dipende inoltre dallinterazione con i gruppi
vicini. Lo spettro di fluorescenza di una IUP fornisce perci utili
informazioni sullambiente del fluoroforo, e quindi sulla presenza di
struttura proteica ordinata in sua vicinanza.
z
z z
z
z z
z
z z
Interpretation
is due to:
is due to: