Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Nota Tcnica
PEPTIDE SEQUENCING USING MASS SPECTROMETRY: A PRACTICAL GUIDE. This paper introduces the basics of peptide
mass spectra interpretation applied to proteomics and is directed to chemists, biochemists and biologists. The manuscript presents
a well detailed protocol aiming to serve as a first choice guide for understanding peptide sequencing. The tutorial was elaborated
based on both a thorough bibliographic revision and the authors experience. In order to prove the applicability of the proposed
guide, spectra obtained on different instruments have been successfully interpreted by applying the presented rational.
Keywords: proteomic analysis; mass spectrometry; peptide sequencing.
INTRODUO
A anlise protemica, definida como sendo o conjunto de
metodologias analticas empregadas para caracterizar (quali e
quantitativamente) um proteoma, trata-se de uma rea interdisciplinar da cincia, a qual agrega principalmente qumica, biologia
e informtica. O sinergismo oriundo de tamanha interdisciplinaridade faz-se necessrio num cenrio onde se pretende estudar a
funo/comportamento dos genes com base nas identificaes das
protenas por eles expressas. Neste contexto, muitas vezes necessrio no somente determinar o conjunto de protenas presentes
em uma amostra, o que por si s algo bastante desafiador, mas
tambm caracterizar as inmeras e comumente presentes isoformas
das protenas, produtos de modificaes ps-traducionais sofridas
pelas mesmas e, por fim, como essas protenas interagem entre
si.1,2 Devidamente dimensionada a complexidade do assunto, a
espectrometria de massas (MS) emerge como uma tecnologia indispensvel para a interpretao da informao codificada pelos
genes, ou seja, o proteoma.
Uma das foras que impulsiona a protemica a habilidade de
usar dados de espectrometria de massas inerentes a peptdeos para
identificar protenas em bancos de dados. Para tal fim, dois tipos de
resultados so usados. O primeiro usa a informao relativa massa molecular dos peptdeos oriundos da digesto enzimtica (Peptide
Mass Fingerprint PMF), enquanto o segundo faz uso de resultados obtidos pela fragmentao de peptdeos individuais previamente
detectados.3
ESPECTROMETRIA DE MASSAS APLICADA ANLISE
PROTEMICA
Em linhas gerais, a MS uma tcnica capaz de determinar a
relao entre massa e carga (m/z) de espcies ionizadas em fase gasosa.2 Um espectrmetro de massas um instrumento constitudo
por uma fonte de ons, um analisador de massas, um detector e um
*e-mail: emanuel@iqsc.usp.br
670
Cant et al.
Quim. Nova
671
672
Cant et al.
Quim. Nova
Gly
Ala
Ser
Pro
Val
Thr
Cys
Leu
Ile
Asn
Asp
Gln
Lys
Glu
Met
His
Phe
Arg
Tyr
Trp
G
A
S
P
V
T
C
L
I
N
D
Q
K
E
M
H
F
R
Y
W
Massa mdia
Massa monoisotpica
on imnio
57,052
71,079
87,078
97,117
99,133
101,105
103,145
113,160
113,160
114,104
115,089
128,131
128,174
129,116
131,199
137,141
147,177
156,188
163,176
186,213
57,02146
71,03711
87,03203
97,05276
99,06841
101,04768
103,00919
113,08406
113,08406
114,04293
115,02694
128,05858
128,09496
129,04259
131,04048
137,05891
147,06841
156,10111
163,06333
186,07931
30
44
60
70
72
74
76
86
86
87
88
101
101
102
104
110
120
129
136
159
on relacionados
72
72
70
84, 129
70, 84, 112, 129
61
82, 121, 123, 138, 166
91
59, 70, 73, 87, 100, 112
91, 107
117, 130, 170, 171
Tabela 2. Lista das massas de dipeptdeos, teis para a determinao de ons -b2. Os valores correspondem soma das massas dos resduos
dos aminocidos acrescidos de uma unidade23
G
A
S
P
V
T
C
I/L
N
D
Q/K
E
M
H
F/M*
R
C**
Y
W
57
71
87
97
99
101
103
113
114
115
128
129
131
137
147
156
161
163
186
G
57
A
71
S
87
P
97
V
99
T
101
C
103
I/L
113
N
114
D
115
Q/K
128
E
129
M
131
H F/M* R
137 147 156
C**
161
Y
163
W
186
114
129
145
155
157
159
161
171
172
173
186
187
189
195
205
214
219
221
244
143
159
169
171
173
175
185
186
187
200
201
203
209
219
228
233
235
258
175
185
187
189
191
201
202
203
216
217
219
225
235
244
249
251
274
195
197
199
201
211
212
213
226
227
229
235
245
254
259
261
284
199
201
203
213
214
215
228
229
231
237
247
256
261
263
286
203
205
215
216
217
230
231
233
239
249
258
263
265
288
207
217
218
219
232
233
235
241
251
260
265
267
290
227
228
229
242
243
245
251
261
270
275
277
300
229
230
243
244
246
252
262
271
276
278
301
231
244
245
247
253
263
272
277
279
302
257
258
260
266
276
285
290
292
315
259
261
267
277
286
291
293
316
263
269
279
288
293
295
318
275
285
294
299
301
324
323
325
348
327
350
361
295
304
309
311
334
313
318
320
343
* Oxidao; ** carbamidometilcistena
das massas de dipeptdeos ionizados. Geralmente esses ons podem ser identificados por meio da seguinte razo: on -b2/ on -a2
separados por 28 u (inerente perda neutra de CO por parte de um
on b). Novamente, uma vez encontrada a razo m/z do on -b2, esta
usada para calcular a m/z do correspondente on -ym-2 fazendo uso
da relao: ym-2 = (M+H)1+ - b2 + 1
Em instrumentos do tipo ion-traps tal informao pode, em
alguns casos, no ser medida.
Extenso das seqncias de ons -b e y
Tendo definido os aminocidos posicionados nas extremidades
do peptdeo e usando a massa dos resduos dos aminocidos, iniciar
o seqenciamento analisando a regio de altas massas do espectro.
O menor nmero de picos nessa regio do espectro ir tornar o trabalho mais simples. No entanto, deve-se ter cuidado com a regio
em torno de 60 u abaixo do on precursor, que pode ser confundida
com picos referentes a mltiplas perdas de gua e amnia. Todavia,
no se pode descartar a hiptese que G pode ser o primeiro resduo
de aminocido da seqncia, de modo que o pico inerente a essa
possibilidade pode estar presente.
A partir desse ponto pode-se sistematicamente estender as seqncias de ons -b ou -y. Em outras palavras, a partir de um determinado on (seja ele -b ou -y) basta acrescer ou subtrair (dependendo da massa do on em questo) a massa dos resduos de
aminocidos sucessivamente a partir da G at o W. Uma vez determinada a massa de um on -b ou -y, o correspondente on -y ou -b
pode ser calculado usando as seguintes relaes gerais: ym-n =
(M+H)1+ - bn + 1 e bn-m = (M+H)1+ - ym + 1.
Sempre que um on determinado (por exemplo, um on -b) apresenta o on correspondente (on -y), a determinao ganha muito
em confiabilidade.
Considerando que o on -b1 raramente observado no espectro,
a determinao da ordem dos dois primeiros aminocidos da regio
N-terminal bastante difcil. Uma soluo para tal problema a
determinao do aminocido N-terminal empregando-se a Qumica
Degradativa de Edman, estratgia plausvel desde que a protena
em questo no apresente o aminogrupo N-terminal bloqueado.
INFORMAES PERTINENTES QUE CORROBORAM
PARA A CORRETA DETERMINAO DA SEQNCIA
DE AMINOCIDOS
Perda neutra de amnia (NH3) e gua (H2O)
As informaes apresentadas a seguir so bastante importantes
no tocante confirmao de identificao de certos aminocidos:
ons fragmento -y e -b contendo os resduos de aminocidos R, K,
Q e N podem apresentar perda neutra de amnia (-17 u). O on
inerente a essa perda neutra no raramente mais intenso que os
prprios ons -b ou -y correspondentes e, ons-fragmento -y e -b
contendo os resduos de aminocidos S, T e E podem apresentar
perda neutra de gua (-18 u). No caso do cido glutmico, tal fato
ser mais notrio caso esse aminocido esteja na posio do Nterminal do fragmento. Tais informaes corroboram para que a
certeza inerente a uma determinao seja aumentada.
Intensidades dos picos no espectro
Nos peptdeos gerados a partir de digesto trptica, os ons da
srie -y geralmente sero os de maior intensidade no espectro. Sempre que um peptdeo trptico contiver D em sua seqncia (no
importando a posio) e o nmero de cargas for igual ou menor ao
673
Massa (Da)
GG
N
AG
Q
K
GV
R
AD
EG
W
SV
114,04293
114,04293
128,05858
128,05858
128,09496
156,08988
156,10111
186,06406
186,06406
186,07931
186,10044
674
Cant et al.
Quim. Nova
Conhecendo-se o on -b2, possvel calcular o on -yn-2 correspondente, que nesse caso se trata do on de m/z 1569, o qual tambm no foi observado no espectro. Alm disso, pode-se usar tal
informao para tentar determinar a seqncia dos resduos de
aminocidos da regio N-terminal. Com as informaes obtidas at
esse ponto sabe-se que os dois primeiros resduos da regio N-terminal so P e G. Logo, para determinar a ordem correta basta fazer
a suposio que a P seja o resduo N-terminal. Se isso for verdade,
um on com m/z aproximadamente igual a 98,03 (155.047 57,021)
deveria ser observado, o que no ocorre. Portanto, no h evidncia
que a P seja o aminocido N-terminal. A outra possibilidade que
G esteja na posio N-terminal e nesse caso o on com m/z em torno
de 57,99 deveria ser verificado, o que tambm no ocorre. Assim,
apesar de saber que os dois primeiros resduos de aminocidos da
regio N-terminal do peptdeo so a P e a G, no possvel
determin-los pela interpretao desse espectro de massas.
Uma vez determinados os ons -y1 e -b2, foi possvel estender
as seqncias de aminocidos. A srie -b foi estendida desde o on
-b2 (m/z 155,05) at o on -b7 (m/z 782,42). Por outro lado, a srie -y
pde ser estendida a partir do on -y1 (m/z 175,07) at o on -y7 / -b6
(m/z 1028,70). Assim sendo, o completo seqenciamento do peptdeo foi obtido, fazendo uso da srie -y e/ou da srie -b (Figuras
4SC e 4SD). Neste exemplo, ons complementares (os pares -y7 / -b6
e -y6 / -b7) puderam ser identificados, aumentando a confiabi-lidade
da seqncia proposta (veja Figura 4S).
A seqncia de aminocidos determinada para o peptdeo em
estudo, bem como os ons que foram detectados no espectro, permitiu predizer a seqncia de aminocidos do peptdeo, com exceo dos dois primeiros aminocidos na regio N-terminal, que permanece desconhecida (veja Figura 5S).
O espectro de fragmentao para o mesmo peptdeo em questo foi obtido usando-se o instrumento do tipo ion-trap
tridimensional. Neste caso, o modo de ionizao foi o ESI e o on
precursor era duplamente carregado ([M+2H]2+, m/z = 812,5). Ao
contrrio do espectro obtido no TOF-TOF, esse espectro apresenta
muitos picos, inclusive picos inerentes s perdas neutras de H2O e
NH3, o que facilita o seqenciamento do peptdeo, porm ao mesmo tempo torna maior a chance de que erros sejam cometidos devido a equvocos na assinalao das sries. Tal possibilidade ainda aumentada devido ao fato do espectro oriundo desse tipo de
instrumento no ser desconvoludo, o que significa que ons relativos a espcies multicarregadas podem estar presentes, dificultando a interpretao.
Deve-se lembrar tambm que os espectros obtidos em ion-traps
possuem baixa resoluo e exatido de massas, o que torna impossvel, por exemplo, fazer a correta distino entre os resduos Q ou K.
A limitao inerente regra do 1/324 verificada e por esse motivo
ons com relao m/z inferiores a 270 no so sequer detectados.
Nesse caso, como no se tem acesso regio de baixas massas, fica
impossvel verificar os ons imnio presentes, bem como os ons
diagnstico -y1. Sabendo-se de antemo que o resduo de aminocido
C-terminal se trata de R ou K, deve-se supor que se trata da K (por
exemplo) e calcular o on -bn-1 correspondente, que nesse exemplo
teria m/z igual a 1477,5. Avaliando a Figura 6SC pode-se concluir
que esse on no est presente e, portanto, a suposio de K
corresponde ao resduo de aminocido C-terminal no se mostrou
consistente. Como prxima tentativa deve-se supor que R o resduo C-terminal, situao na qual o on -bn-1 deveria ter m/z igual a
1449,4. A anlise da Figura 6SC mostra que esse on est presente e,
portanto, o aminocido C-terminal trata-se da R.
Uma anlise criteriosa mostra que o on de m/z 268,11 se trata
de um fragmento do tipo -b. Tal fato pde ser concludo uma vez
que o on -a correspondente facilmente identificado (m/z 240,89).
O presente artigo apresenta um guia prtico para a interpretao de espectros de fragmentao de peptdeos obtidos usando
espectrometria de massas em tandem. O conjunto de regras e informaes relatadas foi compilada a partir de uma profunda reviso
bibliogrfica sobre o assunto, bem como usando o conhecimento
prtico adquirido pelos autores. A fim de melhor enfatizar a
aplicabilidade do guia proposto, dois exemplos foram apresentados. Espectros de fragmentao para um mesmo peptdeo foram
obtidos atravs de dois espectrmetros de massas diferentes, sendo eles um TOF-TOF e um ion-trap (tridimensional). Alm de
exemplificar com exemplos prticos e reais o seqenciamento de
675
19.
20.
21.
22.
23.
24.
25.
26.
0DUFHOR'HOPDU&DQW~H(PDQXHO&DUULOKR
,QVWLWXWRGH4XtPLFDGH6mR&DUORV8QLYHUVLGDGHGH6mR3DXOR&36mR&DUORV63%UDVLO
1HOVRQ$UQR:XOII
)XQGRGH'HIHVDGD&LWULFXOWXUD$Y$GKHPDU3HUHLUDGH%DUURV$UDUDTXDUD63%UDVLO
0DULR6pUJLR3DOPD
'HSDUWDPHQWRGH%LRORJLD,QVWLWXWRGH%LRFLrQFLDVGH5LR&ODUR8QLYHUVLGDGH(VWDGXDO3DXOLVWD$Y$
5LR&ODUR63%UDVLO
0DWHULDO6XSOHPHQWDU
4XLP1RYD9RO1R66
6(48(1&,$0(172'(3(37'(2686$1'2(63(&7520(75,$'(0$66$680*8,$357,&2
6
&DQW~HWDO
4XLP1RYD
)LJXUD6(VTXHPDLOXVWUDGRGDVVHLVHWDSDVTXHFRPXPHQWHLQWHJUDPXPHVWXGRSURWH{PLFRTXHHPSUHJDHVSHFWURPHWULDGHPDVVDV
)LJXUD6$(VWUXWXUDTXtPLFDJHUDOGHXPSHSWtGHRDSUHVHQWDQGRDQRPHQFODWXUDSURSRVWDSRU5RHSVWRUII)RKOPDQQ%LHPDQQGRVIUDJPHQWRVIRUPDGRV
GHYLGRjWUDQVIHUrQFLDGHHQHUJLDSDUDRSHSWtGHR%RVtRQVIRUPDGRVVmRHQXPHUDGRVDSDUWLUGRDPLQRiFLGR1WHUPLQDO&DIUDJPHQWDomRGDVSRUo}HV
DPLQRHFDUER[LWHUPLQDOGHXPPHVPRDPLQRiFLGRSURGX]RVtRQVLP{QLR
9RO1R
6HTXHQFLDPHQWRGHSHSWtGHRVXVDQGRHVSHFWURPHWULDGHPDVVDVXPJXLDSUiWLFR
6
6
&DQW~HWDO
4XLP1RYD
)LJXUD6 6HTrQFLDGHDPLQRiFLGRVGHWHUPLQDGDSDUDRSHSWtGHRHPHVWXGREHPFRPRRVtRQVEH\
HQFRQWUDGRVQRHVSHFWUR$VFDGHLDVODWHUDLVGRV
UHVtGXRVHVWmRUHSUHVHQWDGDVSRUPHLRGRVFyGLJRVGHXPDOHWUDGRVUHVSHFWLYRVDPLQRiFLGRV;UHSUHVHQWD,RX/
9RO1R
6HTXHQFLDPHQWRGHSHSWtGHRVXVDQGRHVSHFWURPHWULDGHPDVVDVXPJXLDSUiWLFR
6
)LJXUD66HTrQFLDGHDPLQRiFLGRVGHWHUPLQDGDSDUDRSHSWtGHRHPHVWXGREHPFRPRRVtRQVEH\HQFRQWUDGRVQRHVSHFWUR$VFDGHLDVODWHUDLVGRVUHVtGXRV
HVWmRUHSUHVHQWDGDVSRUPHLRGRVFyGLJRVGHXPDOHWUDGRVUHVSHFWLYRVDPLQRiFLGRV;UHSUHVHQWD,RX/