Sei sulla pagina 1di 51

PROTEOMICA

Usos y aplicaciones

Dra. Pia Valacco

cequibiem-servicios@qb.fcen.uba.ar
PROTEOMICA
Estudio completo de la estructura, localización, modificaciones post traduccionales,
funciones e interacciones de todas las proteínas expresadas por una determinada célula, tejido
u organismo en un dado momento bajo ciertas condiciones.

Genoma humano (2003)

Técnicas OMICAS para entender procesos celulares que no se explican por genómica

40000 genes Splicing alternativo 10 isoformas por gen


Activación
Vida media
PTM (Modificaciones post traduccionales) 430 PTM
Expresión
Conformación
Localización subcelular
1X106 Proteoformas

Proteómica Global: Identificar y catalogar todas las posibles proteínas


Proteómica Dirigida: Identificar y deducir mutaciones y cambios de proteínas individuales,
a partir de mezclas complejas en alguna condición particular (durante el desarrollo de una
enfermedad)
PROTEOMICA Estudio completo del conjunto de proteínas producido por una especie.

Las proteínas y sus modificaciones pueden ser identificadas por espectrometría de masa a
través de la medida exacta de sus masas

Generar iones del analito en fase gaseosa


Separar los iones en base a su m/z
Contar iones

Principales elementos de un espectrómetro de masa

FUENTE ANALIZADOR DETECTOR

(iones en fase gaseosa) (separación de iones) (detección de iones)


MALDI Matrix Assisted Laser Desorption Ionization

Placa con la muestra Laser


hn
1. La muestra se mezcla con una
matriz (X) y se cocristaliza
sobre la placa por evaporación
MH+ del solvente
2. Las moléculas de la matriz son
ionizadas al incidir un laser
3. Las moléculas del analito (M)
son ionizadas por
transferencia de protones
desde la matriz:
XH+ + M  MH+ + X.
+/- 20 kV Grid (0 V) Carga +1 porque la transf no es muy eficiente
ESI ElectroSpray Ionization

Péptidos disueltos en fase líquida, se vaporizan en finas gotas de iones


múltiplemente cargados

Sample Inlet Nozzle Partial


Pressure = 1 atm vacuum
Inner tube diam. = 100 um (Lower Voltage)

N2 MH+
+
++++ + ++ + +
++ + +
++
++ + +
Sample in solution
++
+
+ ++ +
+
++
+ +
+ +
MH2+
++ ++ + ++ +
N2 gas ++ + +

MH3+

High voltage applied Charged droplets


to metal sheath (~4 kV)
MALDI ESI

•Rápido y fácil-Mayor “Throughput” •Puede ser fácilmente acoplada a


(>1000 muestras por hora) LC.
•Análisis de mezclas complejas

•Estabilidad de las muestras una vez •Muestra se consume en el


sembradas momento

•Espectros más faciles de •Iones con carga múltiple


interpretar (iones monocargados)
Detección directa de masas de
mayor m/z
•Permite medición de moléculas de
bajo PM, ya que no hay matriz que
interfiera
Espectros MALDI y ESI de RNasa (13700 Da)
1+

MALDI-MS
2+ RNase A
Intensity (arbitrary units)

6+
7+
ESI-MS
5+ RNase Sa
8+
1000 m/z 3000
2283
Peak charge determination

Isotope distribution patterns

Natural
Isotopes
Abundances
MALDI-TOF TOF ULTRAFLEX II
(Bruker Daltonics)

Q EXACTIVE
(Thermo Scientific)
Abordaje clásico para identificación de proteínas:
Enzimas proteolíticas utilizadas para digestión en gel:

• Situaciones donde pueden darse missed cleavages


dependientes del contexto de la secuencia

xxxxxR/KPxxxR/K
• Presencia de amino ácidos básicos o ácidos
cercanos al sitio de corte
• Presencia de Prolinas
Por que usamos tripsina generalmente?

•Porque la mayoría de los péptidos que genera son de 8-20 aa

•Tiene alta especificidad de corte (corta todas las lisinas


y argininas, excepto las seguidas por Prolina)

•Produce péptidos con extremos c-terminales básicos,


lo que genera buenas series de fragmentación

•Puede ser modificada para que no genere péptidos de


autodigestión (se metilan sus residuos lisina)
Peptide Mass Fingerprinting (PMF)
La tripsina no es siempre la mejor opción:

Digestión tríptica
de Betahemoglobina

Digestión de p8 con quimotripsina


Digestión tríptica de p8
Mascot - principios

• Scoring basado en probabilidad.


• Significancia p< 0.05 (la probabilidad de que el evento
observado se pueda dar por azar es menor al 5%)
Cobertura de secuencia proteica por MS

Cobertura de secuencia

Péptidos encontrados
Principales puntos a destacar:
-No todos los péptidos del espectro que pertenecen a la misma proteína tienen la
misma señal de intensidad a pesar que debieran estar en cantidades equimolares
- Peptidos que terminan en in Arg (R ) dan mejor señal que los que terminan en
Lys (K), porque la Arg tiene una señal positiva más fuerte y ioniza mejor
-El número de péptidos que se identifican para la misma proteina depende de la
cantidad de la proteína.
-La cobertura de la secuencia de la proteína con los péptidos identificados no es
completa
- No hay necesidad de que la secuencia esté toda cubierta para tener un buen
score en la identificación

m/z m/z m/z m/z


Espectrometría de masas en tandem MSMS:

1. Generar espectro completo de MS


trypm yo01 #294 RT: 9.89 AV: 1 NL: 1.12E7
T: + c Full m s [ 300.00-1600.00]
661.6
100

95
e
c 90
n
a 85
d
n 80
u
b 75
A

e
v
i
70

65 2. Seleccionar un ion
t
a
l
e
R
60

55

50
3. Aislar el ion
45

40

35
496.4 704.2
30

25

20
528.3
15 342.7 618.7 991.7
705.1
10
992.6
5 464.4
580.4 799.9 927.1 952.3 1128.2 1289.8 1387.1 1485.0
1541.3
0
400 600 800 1000 1200 1400 1600
m /z

4. Fragmentar el ion

MS/MS

Source: Peter James


Espectrometría de masa en tandem MS/MS

A B C D E F
F E D C B A
b6
b5 y6
b4 y5
b3 y4
b2 y3
b1 y2
y1
single peptide

Fragment ions are


Los fragmentos designated
cargados b or y series
se denominan depending
serie b o y deon which aend
acuerdo of
si provienen
the
del peptide
extremothey
N- oare derived from
C-terminal (N andrespectivamente
del péptido C-terminus respectively)

Los péptidos de las series y son más abundantes


Ejemplo de MS/MS y de secuenciación de novo
Intens. [a.u.]

DLHKTETYLR
6000

110.061 1275.75

4000 I/L Y T E

175.084

266.105 366.131

2000 1059.918 Parent ion


552.242 1275.750
451.161
D
703.916
1160.706

200 400 600 800 1000 1200


m/z
Secuencias en bases de datos
PFF- peptide fragmentation fingerprinting
…MAIILAGGHSVRFGPKAF
AEVNGETFYSRVITLESTNM
FNEIIISTNAQLATQFKYPNV
VIDDENHNDKGPLAGIYTIM
KQHPEEELFFVVSVDTPMIT
GKAVSTLYQFLV …

digestión
In-silico
- MAIILAGGHSVR
- FGPK
Péptidos - AFAEVNGETFYSR
Proteolíticos - VITLESTNMFNEIIIK
- YPNVVIDDENNDK
teoricos …

fragmentación
In-silico
-MAIILAG
-MAIILA
-MAIIL
Fragmentos -MAII
teóricos -MAI
-M
-M
-AIILAG

361.107346
338.695086
676.96063
498.8283
Peaklist 1045.564
teórica 1171.967066
342.51458
457.827405
263.268453
Resumen:
-La identificación por MS se basa en la coincidencia entre las m/z
experimentales de los péptidos proteolíticos derivados de una proteína, con
los fragmentos virtuales derivados del corte de todas las proteínas contenidas
en una determinada base de datos con la misma proteasa
- La identificación por MS/MS está basada en la comparación del patrón de
fragmentación experimental de un péptido tríptico de un cierto m/z con la
fragmentación in silico de todos los peptidos de la base de datos que tengan el
mismo m/z
- Los dos abordajes está basados en diferentes criterios
- Para identificar una proteína por MS uno tiene que tener el m/z de varios
péptidos derivados de ella (estrategia usada en MALDI-TOF)
- La identificación de una proteína por MS/MS está basada en la
fragmentación de uno o más peptidos si es que sus series y y b están
completas.
Como digerimos una proteina in-gel

Cortar la banda del gel,


transferir a tubo
eppendorf

Rehidratar con
DTT para Lavados y
reducir volver a
Lavarla con puentes
ABC y ACN Desteñir Deshidratar deshidratar
disulfuro-
para con ABC:ACN con ACN
Luego alquilar
eliminar con
SDS y iodoacetamida
colorantes
Rehidratar en
tripsina y
digerir ON a 37C
Extraer péptidos con
ACN:TFA, secar
Complicaciones a evitar:
Keratina:
Es la proteína mas identificada en proteómica.
Hay 20 tipos diferentes, del pelo y de la piel.
Solución:
Guantes para cualquier manipulación de buffers, geles o muestras.
Limpiar superficies con Agua y Etanol.
No dejar geles, ni soluciones destapados.

Detergentes/polímeros:
Ionizan mucho mejor que los péptidos y suprimen la señal de la muestra.
Pueden prevenir la cristalización adecuada.
Solución:
Algunos detergentes no-iónicos y no poliméricos son compatibles.

Sales:
Forman aductos con los péptidos.
Previenen cristalización. Tapan HPLC.
Solución:
Fase reversa (zip-tip)
Estrategias Top-down y bottom-up

‘bottom-up’ ‘top-down’
•Los péptidos se fragmentan mejor por CID •Permite observar perfil total
que las proteínas enteras •100% cobertura de secuencia
•Separación cromatográfica de péptidos •Identificación de variantes de splicing y PTM
•Sensible
Abordajes proteómicos:
Consideraciones para LC-MSMS
 complejidad de la muestra
 análisis cualitativo o cuantitativo
 alcance: análisis comprehensivo (mg y meses) > 1000 hits
análisis de espectro amplio (mg y semanas) 100-1000 hits
análisis enfocados (ng y dias) 10-100 hits
 modificaciones postraduccionales (PTM)
proteina pura (mg y semanas)
análisis global (mg y meses)
IDENTIFICACION DE UNA PROTEINA
AISLADA
1D 2D
Digestión
tríptica en
gel

MALDI- MS

digestión
tríptica en
solución

Proteina
purificada en
solución
Estrategias para la identificación proteica bottom up

mezcla de proteínas
SDS-PAGE 2D o 1D
digestión
Proteolítica
Cortar banda o spot en solución
Cortar todo el gel 1D
en rodajas
LC1D o 2D-MS/MS

Digestion “in-gel” on-line

Separación
péptidos
por HPLC
off-line

MALDI TOF MS
Estudio de la diversidad funcional de un consorcio bacteriano degradador de fenantreno
utilizando un enfoque proteómico
Suelo crónicamente contaminado con hidrocarburos policíclicos aromáticos (PAH)

Consorcio bacteriano degradador de fenantreno (CON).

Composición por métodos dependientes de cultivo


independientes de cultivo (pirosecuenciación de
fragmentos del gen 16S rRNA)

8 órdenes bacterianos: Sphingomonadales, Burkholderiales, Rhodospirillales, Pseudomonadales,


Enterobacteriales, Rhizobiales y Xanthomonadales.

Enfoque metagenómico funcional: presencia de genes codificantes de enzimas involucradas en la ruta


de degradación de PAH en fragmentos asignados taxonómicamente al orden Burkholderiales.

Experimento: Cultivos de CON en medio mineral líquido con fenantreno como única fuente de
carbono y energía.
Extracción de proteínas totales a los 4 y 15 días de incubación.
Electroforesis bidimensional: Rango de pH 4-7. PM: 6,5 - 200 kDa.
Se seleccionaron los spots que mostraron mayor discrepancia en la expresión y se analizaron por
MALDI TOF/TOF MS/MS para su identificación.
Muestra: 20006FA en fenantreno 0,84g/L

t: 24 hs t: 96 hs

F H K P
E G N
I J M
L O
C A S
Q B
D

U R
T

7 4
7 4

21 proteínas identificadas: 66,67% Familia Sphingomonadaceae


33,33% Familia Burkholderiaceae,.
A ambos días de incubación se identificaron proteínas glutatión S-transferasa, Chaperona GroEL y
GroES, Aconitato Hidratasa y dos enzimas dioxigenasa, la subunidad pequeña de antranilato 1,2-
dioxigenasa y la subunidad pequeña de la enzima benzeno dioxigenasa.

Se confirmó que los órdenes Sphingomonadales y Burkholderiales se encontraban metabólicamente


activos dentro de la comunidad estudiada.
Identificar el interactoma de una determinada proteína a traves de abordajes de “pull
down” o co-IP

AntiFLAGM2-agarosa
Eluído final Eluído final
células que células control
600 x 106 sobreexpresan p8
células confluentes

Níquel-agarosa
45
30

20.1

p8: Proteína de 8 kDa 14.3


Localizacion N-C diferencial
Funciones pro y anti tumorales
* 3-4 ug
Inicialmente: 600 X 106 células
%
#
Acceso
#max
pept
Cober
tura
best e-
value
Peso
molecular Nombre
FUS, TLS, 75 kDa DNA-pairing protein, CHOP, FUS1, FUS-CHOP, hnRNP-
# experim
15 proteínas diferenciales
P2, Oncogene FUS, Oncogene TLS, POMp75, RNA-binding protein FUS, 2
P35637 4 8.5 2.50E-07 53426.2 TLS/CHOP, Translocated in liposarcoma protein
p100 co-activator, 100 kDa coactivator, EBNA2 coactivator p100, p100,
staphylococcal nuclease domain containing 1, Staphylococcal nuclease
2
domain-containing protein 1, TDRD11, Tudor domain-containing protein
Q7KZF4 1 1.2 1.60E-04 101997.8 11
YY-1, DELTA, Delta transcription factor, INO80S, NF-E1, Transcriptional
repressor protein YY1, UCRBP, Yin and yang 1, YIN-YANG-1 2
P25490 1 1.9 0.0019 44712.9
2
Q676U5 1 2.1 0.013 68265.6 Apg16, Autophagy-related protein 16-1
AIM2, Absent in melanoma 2, Interferon-inducible protein AIM2, PYHIN4
2
O14862 1 4.4 0.14 38953.9
Q9H3K6 2 20.9 9.40E-05 10116.6 BolA-like protein 1, CGI-143, MGC75015, RP11-196G18.18 1
UBC9, C358B7.1, p18, P18, SUMO-1-conjugating enzyme, SUMO-1-
protein ligase, SUMO-conjugating enzyme UBC9, SUMO-protein ligase,
2
UBCE9, Ubiquitin carrier protein 9, Ubiquitin carrier protein I, Ubiquitin-
P63279 2 7.6 2.40E-04 18007 conjugating enzyme E2 I, Ubiquitin-protein ligase I
KNP1, ES-1, D21S2048E, ES1 protein homolog, mitochondrial precursor,
GT335, HES1, KNPH, KNPI, KNP-I, KNP-Ia, Protein GT335, Protein KNP-I 1
P30042 6 31 1.30E-08 28142.6
Galectin-7, GAL7, Gal-7, HKL-14, LGALS7A, p53-induced protein 1, PI7,
1
P47929 4 33.3 6.10E-06 14944 PIG1, TP53I1
SRP9, ALURBP, MGC110981, Signal recognition particle 9 kDa protein
1
P49458 2 25.9 3.10E-05 9980.6
Septin-2, DIFF6, hNedd5, KIAA0158, NEDD5, Pnutl3, Protein NEDD5
1
Q15019 3 10.5 4.90E-05 41487.8
LSM12 homolog (S. cerevisiae), FLJ30656, MGC104211, PNAS-135
1
Q3MHD2 2 9.9 4.20E-04 14328.4
RAE1, Migration-inducing gene 14, RAE1 RNA export 1 homolog (S.
pombe), dJ481F12.3, dJ800J21.1, FLJ30608, MGC117333, MGC126076,
MGC126077, MIG14, Mnrp41, mRNA-associated protein mrnp 41, mRNA 1
export factor, MRNP41, Rae1 protein homolog
Q5J8M4 2 8 8.80E-04 39478.9
FHL1 protein, bA535K18.1, FHL1B, FLH1A, Four and a half LIM domains
protein 1, KYO-T, MGC111107, Skeletal muscle LIM-protein 1, SLIM, 1
Q6IB30 2 8.2 0.0015 31895.1 SLIM1, SLIM 1, XMPMA
BCAS2, Breast carcinoma amplified sequence 2, DAM1, DNA amplified in
mammary carcinoma 1 protein, Spliceosome-associated protein SPF 27 1
O75934 2 11.6 0.0031 26131.7
Identificar el interactoma de una determinada proteína a traves de abordajes de
“pull down” o co-IP

Proteína de respuesta a stress, mediador de homeostasis celular


HO-1 Cancer: Sobreexpresión HO-1 inhibe proliferación, migración. Inhibe crecimiento
tumoral e inflamación.
Modulación de adhesión celular hacie fenotipo mas adhesivo
Protein Interaction Network

56 proteínas interconectadas-53% por interacciones físicas.


Proteínas asociadas a citoesqueleto por regulación de filamentos de actina
Proteómica cuantitativa diferencial
Cuantificación relativa de péptidos en mezclas complejas mediante LC-MS/MS
Se marcan los péptidos con isótopos estables de los átomos que componen la mezcla

SILAC iCAT iTRAQ

Purificación de proteínas

Digestión de proteínas

Se distinguen por un cambio definido de masa.


Isotope Tagging for Relative and Absolute protein Quantitation (iTRAQ)
Tandem Mass Tags (TMT)

- Pueden marcarse diferencialmente hasta 10 muestras


- Las proteínas se digieren antes de marcarse
- La marca reacciona con el N-terminal
- Se marcan todos los peptidos independientemente de su composicion
- La masa del ion peptidico es la misma para
todas las muestras y se selecciona para MS/MS
- El grupo reportero se pierde durante la
fragmentación
- usado para determinar la abundancia relativa
del peptido de interes en las 10 muestras
Proteomica cuantitativa vía iTRAQ aplicada a la búsqueda de firmas de
pronóstico de recurrencia
• Estudiar la expresión de genes en biopsias tumorales de pacientes con cáncer de
mama de reciente diagnóstico
• Estudios de expresión de ARN (microarreglos) y de proteínas (iTRAQ)
Buscar patrones de expresión de genes mediante técnicas de búsqueda de firmas
moleculares que clasifiquen molecularmente a las pacientes
• Corroborar si los patrones encontrados están correlacionados con la sobrevida a 3 y
5 años, para explorar la posibilidad de utilizarlos como firmas moleculares de
pronóstico de recurrencia.

Cirugía
primaria
Congelación de Microarreglos
muestra de tumor
e iTRAQ
Firma pronóstica
ER de recurrencia
PR
Biopsia Seguimiento
HER2
Ki-67 por 5 años
• Análisis similar para ver si hay genes que discriminan los de mejor progresión de
los de peor progresión.
• Realizar un analisis ontológico de vías comunes a los dos approaches
experimentales (microarreglos y iTRAQ)
• Combinar la información para seleccionar la mejor combinación de genes y
proteínas que seleccionen discriminen la progresión de la enfermedad.
Label-free quantitative proteomics

Triplicados
Misma cantidad de proteína
total por inyección
Ejemplos del uso de abordajes proteómicos

Identificación y localización de modificaciones Post-traduccionales

Fosforilación Regulan:
Glicosilación Localización subcelular
Acetilación Función
Metilación Actividad
Ubiquitinación Cascadas de transducción de señales

Métodos de enriquecimiento
Distintas estrategias de fragmentación
Tratamiento con enzimas (glicosidasas, fosfatasas etc.)
Biosimilar: Producto que es similar a un medicamento biológico que ya ha sido
aprobado para su uso en pacientes.

• Sustancias terapéuticas semejantes a las proteínas humanas


• Proteína formada por una cadena de cientos de aminoácidos
estructura tridimensional que afectará su actividad
heterogéneo: alta diversidad de PTM
• Origen:
Difíciles
Biológico: extraído de microorganismos, órganos, tejidos, células o
de carac-
fluidos de origen vegetal o animal. terizar
y de
Biotecnológico: proteínas obtenidas a partir de células o replicar.
microorganismos modificados genéticamente (se introduce una
secuencia de código genético que produzca la proteína).
Estudios de Biosimilaridad
. RemsimaTM e InflectraTM
1)CARACTERIZACIÓN FISICOQUÍMICA (ICH Q6B, 6.1) Primer anticuerpo
monoclonal biosimilar
aprobado por EMA
A)Caracterización estructural (ICH Q6B, 6.1.1) 27 de junio de 2013.

i) Secuencia primaria y PTMs (Digestión enzimática con una o varias proteasas sitio específicas e
interpretación de datos y análisis de cobertura y PTM obtenida por enzima(Tripsina, Quimotripsina,
Lys-C, Arg-C, Glu-C/V8)
ii) Estructura de carbohidratos
iii) Estudios de puentes disulfuro (Análisis comparativo de proteína reducida y oxidada)

B) Propiedades fisicoquímicas (ICH Q6B, 6.1.2)

i) Masa, carga, patrones electroforéticos (Determinación de masa molecular de proteína intacta)


ii) Estructura de alto orden (Intercambio HXD)

2) PUREZA, IMPUERZAS Y CONTAMINANTES


i) Impurezas relacionadas con el proceso (células hospedadoras, medio de cultivo)
ii) Impurezas relacionadas con el producto (variantes moleculares de producto deseado)
iii) Contaminantes introducidos sin intención durante el proceso (especies microbianas)

3) PROPIEDADES INMUNOQUÍMICAS

4) ACTIVIDAD BIOLOGICA
Servicios con metodologia MALDI TOF-TOF
Servicios comunes sobre proteinas
• Identificación de proteínas obtenidas de geles 2D con genoma conocido
• Identificación de proteínas obtenidas de geles 2D genoma desconocido (secuenciación de novo)
(actualmente en suspenso por fallas en el equipo)
• Determinación de masas de proteínas hasta 300 kDa
• Determinación de masas peptídicas de hidrolizados proteicos
• Verificación de la expresión de proteínas recombinantes: gel o solución
• Estudios estructurales de proteínas puras o de Biosimilares:
 masa intacta
 secuencia primaria a través de mapeo peptidico
 puentes S-S, número y posición
 mutaciones puntuales
 modificaciones postraduccionales estables
Servicios actuales con el Q Exactive
• Identificación de proteínas en mezclas complejas o subcomplejas
• Si se quiere mayor cobertura simplificar antes las muestras gel 1D o SCX
• Experimentos de co-IP o pull down. Siempre contra un control
• Experimentos de cuantificación relativa entre varias condiciones, “LFQ” (Label
Free Quantitation); triplicado metodológico para cada condición.
• Entrenamiento en la interpretación de los datos de LFQ
• Cobertura completa de la secuencia de un biosimilar por análisis de digestiones
separadas con una bateria de enzimas proteóliticas
• Determinación de masa exacta de proteinas de hasta 30 kDA, con deconvolución
de los datos

http://www.qb.fcen.uba.ar/cequibiem/

cequibiem-servicios@qb.fcen.uba.ar
MUCHAS GRACIAS

Potrebbero piacerti anche