Sei sulla pagina 1di 60

Le proteine sono organizzate secondo quattro livelli strutturali

Struttura primaria: è la
sequenza lineare degli aminoacidi
dal –N terminale al –C terminale

Struttura secondaria:
conformazioni regolari dovute
principalmente ripiegamento
della catena polipeptidica su se
stessa

Struttura terziaria:
ripiegamento della catena
Struttura terziaria
Arrangiamento spaziale
dell’intera catena polipeptidica Tratti a struttura
che conferisce una forma disordinata (random
globulare alla molecola proteica coiled)

Elementi di struttura
secondaria che si
ripiegano in modo
specifico

Tratti con struttura beta

Tratti ad α-elica

Aminoacidi che si trovano lontani nella


sequenza polipeptidica possono trovarsi
piruvatochinasi vicini e interagire tra di loro
Legami che stabilizzano la struttura terziaria

interazioni
idrofobiche
forze di van der Waals
catena
polipeptidica
legami
idrogeno

ponti disolfuro

legami ionici
Ponte disolfuro

Cisteina Cistina

Si formano dopo che viene raggiunta la struttura tridimensionale


Stabilizzano la struttura nativa
Più frequenti in proteine destinate alla secrezione
Nella struttura terziaria quasi tutte le catene laterali idrofobiche
si trovano all'interno e quasi tutte le catene laterali idrofiliche
sull'esterno della proteina dove interagiscono con l'acqua

In bianco sono gli


aminoacidi idrofobici

I gruppi fortemente polari C=O e N-H devono


essere neutralizzati all’interno del core idrofobico
organizzandoli nelle strutture secondarie
Le molecole d’acqua sono parte integrante della
struttura di una proteina, essenziali per la stabilità
strutturale e per la funzione biologica

L’effetto stabilizzante sulla


struttura della proteina può
derivare dal semplice
riempimento dei vuoti interni
alla molecola proteica

Possono formare una


rete di legami H che
collegano tra loro parti
distanti della proteina
La superficie di una proteina globulare può essere vista
come un paesaggio articolato di diversi elementi
strutturali

Interazione con altre


molecole che abbiano
complementarietà di
carica o di struttura

Sono alla base delle interazioni enzima-


substrato, proteina-proteina, antigene-anticorpo
La complessità delle strutture proteiche diminuisce se si
prendono in considerazione le sottostrutture

La maggior parte
delle proteine Tutto α
globulari Tutto β
appartiene ad una α/β
di quattro classi α+β
strutturali

La struttura terziaria delle proteine si è


maggiormente conservata rispetto alla struttura
primaria
Tutto α: proteine formate quasi esclusivamente da α eliche

ferritina
Tutto β: proteine formate quasi esclusivamente da foglietti β

chimotripsina
α/β proteine formate da una serie di foglietti β circondati da α eliche

Alcool deidrogenasi
α + β proteine costituite da una combinazione
di foglietti β e α eliche distanti tra loro

Ribonucleasi A
L’unità fondamentale della struttura terziaria è il dominio
La struttura terziaria delle proteine di grandi dimensioni è spesso
suddivisa in regioni globulari o fibrose dette domini

I domini sono definiti come


una parte di una catena
polipeptidica di per sé
stabile, che potrebbe
comportarsi come un’unità
indipendente dal resto della
molecola

Hanno dimensione variabile, di


solito 100-200 aminoacidi

Sono stati trovati fino a 13


ZPR1 proteina che domini in una proteina
partecipa alla traduzione

Se esiste una significativa omologia di sequenza fra due domini di


proteine diverse, questi domini hanno struttura terziaria simile
I domini sono unità funzionali e spesso a domini diversi di una
proteina sono associate funzioni diverse

La gliceraldeide 3-
fosfato deidrogenasi ha
un dominio che lega il
NAD+ e un dominio per
legare il substrato

GDH
Lo stesso dominio funzionale puo’ essere
“riutilizzato” dall’evoluzione

Nelle varie deidrogenasi NAD+


dipendenti i domini che legano
il nucleotide sono simili, mentre
quelli che legano il substrato
sono differenti permettendo la GDH
diversa di specificità di reazione

LDH
Nella fosfofruttochinasi un
dominio contiene il sito
attivo, l’altro il sito regolatore.
Quando un
attivatore o un inibitore si
lega al sito regolatore, c’e’ un
cambiamento di forma che
viene trasmessa all’altro
dominio rendendolo piu’ o
meno attivo

Fosfofruttochinasi
Un dominio si può inserire in un altro dominio
Spesso domini simili ricorrono in proteine diverse che hanno funzioni
diverse e sequenza amminoacidica completamente diversa

domini omologhi all’Epidermal Growth Factor (EGF)

dominio delle proteasi a serina

dominio Krinkle con tre ponti disolfuro interni

dominio legante il Ca

Le proteine di grandi dimensioni tendono ad essere un mosaico di


domini diversi e perciò possono svolgere diverse funzioni
simultaneamente
Evoluzione

Il proteoma degli eucarioti consiste principalmente di proteine


multidominio che si sono create attraverso fusioni, delezioni e
ripetizioni interne di geni o di parti di essi.

La frazione di proteine multidominio è simile in eucarioti di


differente complessità, dal lievito all’uomo, ed è significativamente
più alta che nei procarioti.

Si pensa che l’espansione dei domini ripetuti nelle proteine abbia


avuto una particolare importanza nell’evoluzione degli eucarioti
superiori poiché larghe porzioni dei loro proteomi consistono in
domini proteici ripetuti.

Un dominio proteico è un’unità fondamentale dell’evoluzione


P53 uno dei più importanti oncosoppressori
Gli elementi di struttura secondaria, motivi e domini, e la loro
organizzazione permettono di classificare le proteine secondo
uno schema gerarchico

Ad esempio nella classificazione di SCOP (Structural Classification Of


Protein) i quattro livelli della gerarchia sono:
Classe
Ripiegamento
Superfamiglia
famiglia

Nella classificazione CATH


Class
Architectur
Topology
Homologous superfamily
Esempi di classificazione
gerarchica
Classe Composizione generale
degl elementi di struttura
secondaria

Ripiegamento Descrive il numero,


la disposizione degli elementi di
struttura secondaria

Superfamiglia Include domini


aventi avvolgimenti simili e
generalmente funzioni simili

Famiglia Domini aventi


sequenze amminoacidiche
strettamente correlate

Proteina
Famiglie di proteine
Le proteine con strutture
più complesse sono presenti
alle estremità degli assi

Finora sono state identificate


circa 10.000 famiglie diverse di
proteine
Le proteine sono organizzate secondo quattro livelli strutturali

Struttura primaria: è la
sequenza lineare degli aminoacidi
dal –N terminale al –C terminale

Struttura secondaria:
conformazioni regolari dovute
principalmente ripiegamento
della catena polipeptidica su se
stessa

Struttura terziaria:
ripiegamento della catena

Struttura quaternaria:
associazioni tra più catene
polipetidiche
STRUTTURA QUATERNARIA
Associazione di più catene polipeptidiche che vengono dette SUBUNITA’

Le subunità possono essere:

uguali, struttura quaternaria omogenea

diverse, struttura quaternaria eterogenea

Le forze che tengono associati i monomeri sono le stesse


che stabilizzano la struttura terziaria
L’organizzazione in polimeri è molto diffusa
Gli enzimi della glicolisi sono quasi tutti polimerici
Vantaggi dell’associazione in polimeri

Stabilità
Una diminuzione del rapporto superficie/volume, diminunendo le
interazioni con l’acqua, rende le proteine più stabili

Economia genetica
E’ richiesto meno DNA per codificare un monomero che si
assembla in multimero, rispetto a un grande polipeptide di analoga
massa molecolare

Avvicinamento di siti cataliti


Negli enzimi multimerici può accadere che ogni monomero possieda
un’attività catalitica diversa. L’associazione aumenta l’efficienza
perché non vi è dispersione dei prodotti

Cooperatività
Le varie subunità possono avere ruoli differenziati catalitici e
regolatori
Michael Lynch
The Evolution of Multimeric Protein Assemblages
Mol. Biol. Evol. 29(5):1353–1366. 2012

On the other hand, proteins with oligomerization potential can also


be dangerous, human disorders involving the production of
inappropriate protein aggregates (e.g., Alzheimer's and Parkinson's
disease and amyotrophic lateral sclerosis) being prime examples.

Overexpression of genes encoding adhesion-prone proteins often


encourages deleterious promiscuous protein–protein interactions, and
such negative selection pressure seems to be reflected in the fact
that many highly expressed genes have features that minimize the
propensity for self-aggregation.
Una visione più moderna dei livelli strutturali presenti nelle proteine

Caetano-Anollés G, Wang M, Caetano-Anollés D, Mittenthal JE.


The origin, evolution and structure of the protein world
Biochem J. 2009 Feb 1;417(3):621-37.
Alcune proteine possono contenere tratti intrinsecamente non strutturati

Small Ubiquitin-like Modifier (SUMO)

Hanno una composizione in aminoacidi caratteristica

molti aminoacidi polari o ionizzabili


Pro e Gly che tendono a distruggere le strutture ordinate
pochi aminoacidi idrofobici
Different secondary
structures adopted by
the same C-terminus
segment of human p53
when bound to
different partners

Possono più facilmente adattare la loro struttura per permettere il legame


con diversi ligandi e svolgere così funzioni diverse
Esiste una notevole correlazione tra l’aumento della quantità di
disordine di un proteoma e la complessità dell’organismo
considerato
Alcune proteine raggiungono la loro conformazione biologicamente
attiva solo dopo aver subito una o più modificazioni
Modificazioni di singoli aminoacidi

fosforilazione
enzimatica dei gruppi metilazione di Lys e Glu
ossidrilici di Ser, Thr
e Tyr
regolazione
dell’attività di enzimi
e proteine regolatrici

carbossilazione di Glu la protrombina


contiene molti residui di γ-
carbossiglutammato che legano Ca++,
indispensabile per dare inizio alla
reazione di coagulazione
Aggiunta di catene laterali di carboidrati

Formazione di legami covalenti con carboidrati durante o dopo la


sintesi della catena polipeptidica
-residui di Asn (legame con N)
-residui di Ser o Thr (legame a O)

Proteine che svolgono la loro funzione al di fuori della cellula:


proteoglicani, lubrificanti che ricoprono le membrane mucose,
proteine di riconoscimento

Aggiunta di radicali alchilici

Consente l’ancoraggio alla


membrana plasmatica
Ma come si studia la struttura delle proteine?

cristalli di proteina

mappe di densità elettronica

analisi ai raggi X
Mappe di densità elettronica
Il numero delle strutture note sta aumentando esponenzialmente!
Protein Data Bank un archivio di strutture tridimensionali

Contiene più di 1.200.000 file


Gare di predizione di struttura delle proteine

CASP Critical Assessment of Structural Prediction


Le proteine sono organizzate secondo quattro livelli strutturali
Struttura primaria: è la
sequenza lineare degli Legame covalente:
aminoacidi dal –N terminale
al –C terminale legame peptidico

Struttura secondaria:
conformazioni regolari dovute
principalmente ripiegamento
della catena polipeptidica su
se stessa Legami deboli:
legami idrogeno
legami idrofobici
Struttura terziaria: legami ionici
ripiegamento della catena Forze di van
der Waals

Struttura quaternaria:
associazioni tra più catene
polipetidiche
Si dice che le proteine sono denaturate
Denaturazione reversibile

Esperimento di C.Anfinsen
Ribonucleasi A
da pancreas bovino
Le informazioni
necessarie per il
ripiegamento di una
proteina risiedono
interamente nella
sequenza
aminoacidica della
proteina stessa

The Nobel Prize in Chemistry


1972
"for his work on
ribonuclease, especially
concerning the connection
between the amino acid
sequence and the
biologically active
conformation"
Folding

Variamo phi e psi ad intervalli di 120 gradi


2 amino acidi: 3x3=9 alternative
3 amino acidi: 3x3x3x3=81 alternative
..…
N amino acidi: 32(n-1) alternative
50 aminoacidi: 1046 alternative
Se ogni tentativo richiede 1 femtosecondo (10–12
secondi)
provare tutte le combinazioni richiede:
1046 femtosecondi = 1032 secondi = 2 x 1027
giorni = 1024 anni
Ma cosa spinge una proteina a ripiegarsi?
E’ un valore
calore scambiato relativamente
durante la trasformazione piccolo

∆G= ∆H - T∆
∆S -20/-40 kJ/mol

funzione di Gibbs variazione del


variazione di energia libera disordine molecolare

Il processo di ripiegamento, comportando il passaggio


da tante strutture a una sola struttura ripiegata,
determina una diminuzione del disordine molecolare e
quindi dell’entropia

Il ripiegamento sfavorisce se stesso!!


Quando i residui idrofobici si legano
Effetto Idrofobico tra di loro le molecole di acqua
vengono rilasciate con un guadagno
generale di entropia

L’acqua
tende a
formare
delle gabbie
ordinate
intorno ai
residui non
polari

Questo fenomeno dà un grande


contributo all’energia libera di
stabilizzazione della struttura proteica
insulina

aldo-cheto
reduttasi

Le proteine sono strutture dinamiche per potersi


adattare rapidamente alle diverse situazioni
funzionali

DNA girasi
emoglobina

platelet activating factor


Le proteine si ripiegano seguendo vie dirette invece di ricercare
casualmente la conformazione nativa tra le molte possibili
Alcuni elementi strutturali si
formano per primi e molto
rapidamente

Residui non polari si


aggregano in un processo
denominato collasso Il ripegamento è un
idrofobico processo cooperativo

Simulazione del
processo di
ripiegamento di un
polipeptide
Gli elementi strutturali che si formano guidano il resto della
catena polipeptidica nell’assumere la conformazione nativa
passando attraverso degli stadi intermedi denominati globuli fusi
Processo gerarchico
Per ogni proteina ci possono essere molteplici vie di ripiegamento

Energy landscape
Cinetica di folding di una proteina

Proteina unfolded tante


conformazioni alta entropia e
alta energia

Proteina parzialmente folded


meno conformazioni minore
entropia ed energia

Molte conformazioni transitorie


che persistono finchè con
attivazione termica casuale
viene superata la barriera
energetica con decadimento a
conformazione ad energia
minore
Struttura nativa minima energia
e minima entropia
Il ripiegamento delle proteine è favorito dalla presenza di alcune
proteine

Heat Shock proteins


Hanno la funzione di prevenire
interazioni non appropriate con
altre proteine durante la loro
sintesi, il ripiegamento e il
trasporto

Chaperonine
Hanno una cavità centrale in cui
le proteine possono completare il
loro processo di folding al riparo
da interazioni idrofobiche
aspecifiche
Le proteine si ripiegano seguendo vie dirette invece di ricercare
casualmente la conformazione nativa tra le molte possibili
Alcuni elementi strutturali si
formano per primi e molto
rapidamente

Residui non polari si


aggregano in un processo
denominato collasso Il ripegamento è un
idrofobico processo cooperativo

Simulazione del
processo di
ripiegamento di un
polipeptide
Gli elementi strutturali che si formano guidano il resto della
catena polipeptidica nell’assumere la conformazione nativa
passando attraverso degli stadi intermedi denominati globuli fusi
Processo gerarchico
Cinetica di folding di una proteina

Proteina unfolded tante


conformazioni alta entropia e
alta energia

Proteina parzialmente folded


meno conformazioni minore
entropia ed energia

Molte conformazioni transitorie


che persistono finchè con
attivazione termica casuale
viene superata la barriera
energetica con decadimento a
conformazione ad energia
minore
Struttura nativa minima energia
e minima entropia
Più di 10000 proteine diverse
Proteostasi devono strutturarsi efficientemente
e mantenere il loro stato
funzionalmenete attivo in un vasto
ambito di condizioni ambientali e
metaboliche

Un comportamento
anormale di queste
proteine instabili può
dar luogo alla
formazione di
aggregati fibrillari

A temperatura fisiologica le proteine sono


poco stabili e sono costantemenete a rischio
di misfolding
Struttura delle fibre amiloidi

Fibrilla amiloide
6-12 nm diametro

2-6 Protofilamenti
avvolti uno sull’altro

Foglietti β
perpendicolari all’asse
Ipotesi di struttura della beta amiloide
Protein Misfolding,Functional Amyloid,and Human Disease

1. A variety of human diseases is now thought to be associated with the


formation of highly organized and generally intractable thread-like aggregates
termed amyloid o amyloid-like fibrils.

2. Amyloid fibril formation is preceded by formation of a wide range of


aggregates such as unstructured oligomers and structured protofibrils.

3. At least in some cases, prefibrillar aggregates, rather than the mature fibrils
into which they convert, are the likely origins of pathological behavior.
Despite obvious differences in detail, the pathogenic nature of these species
lies in the exposure of groups that are normally buried in a folded protein or
dispersed in an unfolded ensemble.

4. Proteins are present at concentrations at which they are only marginally


soluble and stress or aging can lead to widespread aggregation in living
organisms.

5. It is becoming increasingly clear that protein homeostasis is crucially


associated with the maintenance of proteins in their soluble state, and that
even relatively small impairments in the quality control mechanisms that
regulate the concentration of proteins in living systems will eventually lead to
disease. If this view is correct, an effective type of therapeutic intervention
will involve the biological and chemical regulation of protein solubility.

Chiti, F. and Dobson C.M. (2006)Annual Review of BiochemistryVol. 75: 333-366


Probabilmente
all’origine delle
malattie
neurodegenerative
sono più gli
aggregati
prefibrillari che le
fibre amiloidi

L’esposizione di
gruppi chimici
normalmente
presenti all’interno
della molecola
proteica può
determinare una
serie di interazioni
aberranti con varie
componenti cellualri
Proposed mechanism of how compound binding increases fiber stability and decreases
fiber toxicity.BAFs (green) bind to the side of amyloid fibers, stabilizing the fiber,
and shifting the equilibrium from smaller and more toxic oligomers towards fibers.
This shift in equilibrium reduces amyloid toxicity.

Kathryn E Tiller, and Peter M Tessier eLife Sciences


2013;2:e01089