Presente y Futuro de la Protemica por Jess Vzquez Cobos
I.- Introduccin a la Protemica La Protemica es, junto a la Genmica, una de las nuevas tecnologas que ms inters estn despertando ltimamente. El auge actual de la Protemica se debe a dos razones fundamentales. Por un lado, los grandes proyectos de secuenciacin de genomas han generado una enorme cantidad de informacin; en la actualidad se ha secuenciado el genoma completo de alrededor de 90 especies, de las cuales cinco corresponden a organismos eucariticos, y la tasa de anlisis tiende a superar la treintena de genomas por ao. La necesidad de descifrar esta ingente cantidad de informacin genmica ha estimulado considerablemente el estudio directo y a gran escala de los productos codificados por los genes, es decir, las protenas. De forma paralela se ha estimulado el desarrollo de nuevas herramientas bioinformticas para analizar y procesar esta informacin. Por otra parte, en los ltimos aos las tcnicas de anlisis qumico de protenas han experimentado un desarrollo espectacular. Hasta hace muy poco las herramientas que se disponan para este fin (principalmente el Anlisis de Aminocidos y la Secuenciacin de Edman) slo permitan el anlisis de protenas de una forma poco sensible y excesivamente lenta y costosa. El reciente desarrollo de las llamadas tcnicas de ionizacin suave (MALDI y electrospray) abri el camino al estudio de macromolculas mediante espectrometra de masas. Estos mtodos de ionizacin, en combinacin con diversas tcnicas de anlisis de masas (tales como el TOF, el cuadrupolo o la trampa inica) permiten hoy en da la identificacin y secuenciacin de protenas con unos niveles de rapidez, sensibilidad y versatilidad sin precedentes. La aparicin de herramientas que por primera vez en la historia de las biociencias permiten el anlisis sistemtico de los agentes fundamentales de la vida, las protenas, ha dado lugar al desarrollo de la moderna Protemica. II.- Concepto de Protemica. El trmino proteoma se us por primera vez en 1995, para describir el conjunto de protenas que se expresan a partir de un genoma. El proteoma es un elemento altamente dinmico, cuyos componentes varan en un organismo, tejido, clula o compartimiento subcelular dados, como consecuencia de cambios en su entorno, situaciones de estrs, administracin de drogas, efectores o seales bioqumicas o su estado fisiolgico o patolgico. Estos factores incrementan de forma considerable la complejidad del proteoma, como consecuencia de la activacin o supresin de la expresin de genes, las alteraciones en la intrincada pauta de interacciones intracelulares entre las protenas, o los cambios en sus modificaciones postraduccionales. Aunque el trmino proteoma se aplica indiscriminadamente a cualquier conjunto de protenas, su acepcin ms precisa es la que refiere al conjunto de protenas que componen una clula o tipo celular dado, en unas condiciones determinadas. El proteoma de una clula es la expresin de su fenotipo caracterstico, y las diferencias entre un tipo celular y otro, o entre un mismo tipo celular en diferentes situaciones, se pueden, con cierta propiedad, asignar a los cambios que tienen lugar en la expresin y funcionalidad de sus protenas. El crecimiento en el nmero de proyectos de investigacin orientados a estudiar proteomas de forma sistemtica ha dado lugar a la aparicin de un nuevo concepto, Protemica, con el que se trata de describir la ciencia o conjunto de tecnologas que estudian el proteoma. Algunos autores prefieren definir la Protemica como la parte de la Genmica Funcional que centra su atencin en el estudio directo de las protenas. III.- Tcnicas experimentales en las que se basa la Protemica Los proyectos de Protemica se basan en el uso sinrgico de una serie de tcnicas, que se suelen clasificar en tres categoras: i) herramientas para el anlisis global y la separacin de los componentes del proteoma; ii) herramientas para el anlisis individual de los componentes del proteoma; iii) tcnicas para el proceso e interpretacin de los datos. Laboratorio de Protemica, Universidad autonoma de Madrid 28049 Cantoblanco. Madrid. Espaa. Tel.: 91 397 83 64, fax: 91 397 80 87.
- PRESENTE Y FUTURO DE LA PROTEMICA -
En la primera categora, la herramienta ms empleada es la electroforesis en geles de acrilamida en presencia de dodecil-sulfato sdico (SDS), que permite la separacin de las protenas de acuerdo a su peso molecular. Esta tcnica se suele combinar con la separacin previa de las protenas en base a su punto isoelctrico (isoelectroenfoque); la separacin en funcin de sus propiedades elctricas y su tamao permite aislar prcticamente todas las protenas de un proteoma en una matriz bidimensional (electroforesis bidimensional).
Figura 1
Esquema de las tcnicas clsicas en que se basa la Protemica
Las protenas as separadas pueden ser analizadas directamente mediante espectrometra de masas, que constituye, en sus mltiples variantes, la herramienta fundamental de la segunda categora. En la aproximacin ms comn, las protenas se recortan directamente del gel bidimensional donde han sido aisladas, y se digieren con una proteasa, que produce un conjunto de pptidos (Fig. 1). Estos pptidos se analizan directamente mediante espectrometra de masas tipo MALDI-TOF (Matrix Asisted Laser Desorption Ionization-Time of Flight). Esta tcnica es particularmente til para obtener el espectro de masas del conjunto de pptidos, tambin denominado huella peptdica. Alternativamente, los pptidos producidos, tras un proceso de eliminacin de contaminantes, se analizan mediante espectrometra de masas tipo electrospray en combinacin con un triple cuadrupolo o una trampa inica. Estas tcnicas permiten el anlisis en tiempo real de pptidos individuales presentes en la mezcla, sin necesidad de separarlos del resto, el cual consiste en la fragmentacin del pptido (Fig. 1) y la generacin de un espectro de masas, tambin llamado espectro de fragmentacin o espectro MS/MS. Las huellas peptdicas son caractersticas de cada una de las protenas, y permiten identificarlas una a una en la base de datos (Fig. 1), utilizando tcnicas bioinformticas, que constituyen las herramientas de la tercera categora. De la misma manera, los espectros MS/MS son tambin caractersticos de cada uno de los pptidos, y permiten su identificacin in silico en la base de datos (Fig. 1). Ninguna de las dos tcnicas (huella peptdica o fragmentacin) es de aplicabilidad universal, y cada una de ellas tiene sus ventajas e inconvenientes. Sin embargo, la disponibilidad sinrgica de ambas tcnicas hace de la espectrometra de masas una formidable herramienta para la identificacin sistemtica de protenas.
IV.- Aplicaciones de la Protemica en el Area de Biociencias. En este rea, la Protemica se ha aplicado fundamentalmente a tres tipos de estudios: A.- La microcaracterizacin sistemtica de protenas, con el objetivo de abordar la identificacin a gran escala de los componentes de un proteoma. La identificacin a gran escala de los componentes de un proteoma permite la catalogacin de los mismos y la construccin de bases de datos, que suelen organizarse en base a la imagen del proteoma que resulta de su separacin mediante electroforesis bidimensional. Estas bases de datos tienen una Laboratorio de Protemica, Universidad autonoma de Madrid 28049 Cantoblanco. Madrid. Espaa. Tel.: 91 397 83 64, fax: 91 397 80 87.
- PRESENTE Y FUTURO DE LA PROTEMICA -
enorme utilidad para los proyectos de investigacin que necesiten un conocimiento detallado de esos proteomas. B.- La identificacin de los componentes del proteoma que sufren alteraciones en sus niveles de expresin a consecuencia de alteraciones fisiopatolgicas o inducidas por agentes externos (Protemica de Expresin Diferencial). Estos proyectos abordan la identificacin de protenas que sufren alteraciones en sus niveles de expresin a consecuencia de cambios en su entorno, situaciones de estrs, administracin de drogas, efectores o seales bioqumicas o su estado fisiolgico o patolgico, permitiendo as determinar cules son las protenas que intervienen en esos procesos (caracterizacin del mecanismo molecular; identificacin de dianas farmacolgicas) o identificar protenas cuyos cambios de expresin resulten caractersticos del proceso (identificacin de marcadores diagnsticos). Este tipo de estudios puede tambin llevarse a cabo mediante la tecnologa de los chips de DNA aunque, en la prctica, se trata de dos aproximaciones complementarias. Los niveles de expresin de mRNA no siempre reflejan adecuadamente el nivel de expresin real de las protenas correspondientes, por lo que la aproximacin protemica permite obtener resultados ms concluyentes desde un punto de vista tanto fisiolgico como farmacolgico. Sin embargo, la tecnologa de los chip de DNA permite concentrar el anlisis en el nivel de expresin de determinados genes, con una sensibilidad superior. C.- La caracterizacin de las interacciones subcelulares existentes entre la protenas y la determinacin de los componentes de complejos macromoleculares (Protemica de Mapa Celular). Estos proyectos pretenden investigar la funcin de las protenas caracterizando las interacciones que sufren en el interior de la clula. Estos proyectos responden a la nocin cada vez ms extendida de que las protenas no actan de forma aislada sino a travs de grandes complejos macromoleculares, los cuales agrupan conjuntos de factores que realizan las diferentes etapas de un mismo proceso celular, de forma que su proximidad aumenta la eficiencia de cada etapa. Muchas veces, la identificacin de los componentes de un complejo macromolecular o de los factores que interaccionan con una protena dada resulta el camino ms rpido para determinar su funcionalidad. Mediante este tipo de proyectos, aplicados de forma sistemtica, los investigadores pretenden construir un mapa fsico de las interacciones existentes entre las protenas celulares. V.- Las nuevas tecnologas El inters que despierta actualmente la Protemica se traduce en un desarrollo tecnolgico continuo, que da lugar a aproximaciones novedosas. Desde el punto de vista de la espectrometra de masas, se estn comenzando a usar nuevos aparatos, que se basan principalmente en la combinacin hbrida de tcnicas ya conocidas. Por ejemplo, los aparatos basados en la combinacin de un doble cuadrupolo y un TOF (qQ-TOF) mejoran sensiblemente la resolucin de los espectros de fragmentacin, y la combinacin de la ionizacin MALDI con el analizador qQ-TOF o la trampa inica permite fragmentar pptidos directamente una vez obtenida la huella peptdica. La espectrometra de masas denominada MALDI-TOF/TOF conjuga todas las ventajas de la espectrometra MALDI-TOF convencional con la capacidad de producir espectros de fragmentacin de pptidos de forma rpida y robusta. Esta tcnica est comenzando a ser utilizada para la identificacin a gran escala de protenas. Otras aproximaciones de la espectrometra de masas se basan en el acoplamiento de un sistema de cromatografa lquida bidimensional con un analizador de trampa inica o del tipo qQ-TOF. Este procedimiento, capaz de identificar millares de pptidos en un solo experimento, permite analizar de forma automtica los componentes de mezclas muy complejas de pptidos, tales como las producidads por la digestin directa de un proteoma (Fig. 2). Esta tcnica (tambin denominada shotgun proteomics) se ha aplicado a la identificacin directa de componentes de complejos macromoleculares e incluso al anlisis de proteomas enteros sin necesidad de separar sus componentes mediante electroforesis. Laboratorio de Protemica, Universidad autonoma de Madrid 28049 Cantoblanco. Madrid. Espaa. Tel.: 91 397 83 64, fax: 91 397 80 87.
- PRESENTE Y FUTURO DE LA PROTEMICA -
Figura 2
Anlisis a gran escala de los componentes de un proteoma mediante cromatografa bidimensional automatizada. El proteoma completo de levadura se digiere con tripsina, y los pptidos producidos se analizan mediante cromatografa de intercambio inico. Eluyendo a las concentraciones de sal indicadas, se obtienen sucesivas fracciones de pptidos, las cuales se analizan mediante cromatografa de fase reversa en tndem con trampa inica. Los pptidos que van eluyendo de esta columna con un gradiente de fase orgnica se fragmentan e identifican automticamente en la base de datos; cada pico de los cromatogramas que se muestran corresponde aproximadamente a un pptido. En este experimento se identificaron unas 1500 protenas diferentes. Otra variante de esta metodologa permite realizar estudios de expresin diferencial de protenas al nivel de proteoma sin necesidad de realizar electroforesis bidimensional. Esta tcnica (denominada ICAT, por isotope-coded affinity tag) se basa en el uso de reactivos de protenas en forma de istopos estables, que permiten determinar la proporcin relativa de los pptidos derivados de los proteomas a comparar (Fig. 3). Utilizando programas informticos desarrollados para este fin, este procedimiento permite la identificacin automtica y simultnea de cambios relativos en las concentraciones de protenas y de la naturaleza de las protenas que experimentan expresin diferencial.
Figura 3 Esquema de la tcnica ICAT. Las protenas procedentes de dos proteomas distintos se hacen reaccionar con dos istopos diferentes de un reactivo especfico de cistenas. Los dos proteomas se mezclan y se digieren conjuntamente con una proteasa; los pptidos modificados se purifican mediante cromatografa de afinidad y se analizan mediante cromatografa lquida en tndem con espectrometra de masas. La proporcin relativa de pptidos equivalentes en cada uno de los proteomas se determina a partir de la intensidad relativa de las formas derivatizadas con cada istopo; los pptidos que muestran cambios en su intensidad relativa se fragmentan e identifican automticamente. Finalmente, estas metodologas, en combinacin con procedimientos de purificacin selectiva por afinidad, han permitido el anlisis de pptidos modificados, tales como fosfopptidos, a partir de proteomas completos, lo que ha dado lugar al concepto de fosfoproteoma. VI.- El Futuro de la Protemica Una de las razones que explican el creciente inters por la Protemica es el hecho de que muchas propiedades de las protenas, sobre todo sus interacciones y sus modificaciones postraduccionales, no pueden, en general, predecirse a partir de la secuencia de DNA. En un proyecto reciente de particular inters, se ha efectuado un estudio a gran escala de las interacciones entre protenas en levadura, que ha dado lugar a la construccin de un mapa de interacciones (Fig. 4). La evidente complejidad de este mapa sugiere que la funcionalidad de las protenas no debe considerarse de forma aislada, sino dentro de una red global de componentes que interactan mutuamente. Laboratorio de Protemica, Universidad autonoma de Madrid 28049 Cantoblanco. Madrid. Espaa. Tel.: 91 397 83 64, fax: 91 397 80 87.
- PRESENTE Y FUTURO DE LA PROTEMICA -
Figura 4 Mapa de las interacciones existentes entre protenas de levadura, determinadas de forma experimental mediante tcnicas de Protemica. Todava no se han desarrollado herramientas bioinformticas capaces de interpretar el significado de esta compleja red de interacciones, y, por otra parte, esta metodologa no puede todava aplicarse a clulas eucariotas, es decir, clulas de los organismos superiores. Sin embargo, este trabajo pionero sugiere que en un futuro prximo la Protemica nos permitir analizar las propiedades de sistemas complejos de protenas desde una perspectiva global e integradora. Resultarn apasionantes los resultados que se deriven de aplicar esta estrategia experimental al estudio de procesos celulares de alta complejidad, tales como las cascadas de transduccin de seales, la diferenciacin celular, la degeneracin neuronal, la apoptosis o el cncer. Una de las asignaturas pendientes de la Protemica es que, en su concepcin actual, no puede aplicarse de forma efectiva al estudio de especies, como muchos microorganismos o especies de inters en biotecnologa o tecnologa de alimentos, cuyas protenas no estn suficientemente representadas en las bases de datos. El desarrollo de nuevos algoritmos informticos capaces de interpretar de forma inteligente la informacin generada por la espectrometra de masas (interpretacin de novo de espectros de fragmentacin), permitir en un futuro prximo aplicar la Protemica al estudio de estas especies. Estos nuevos desarrollos bioinformticos podran tambin aplicarse al estudio sistemtico de modificaciones postraduccionales (Fig. 5). Estas tcnicas, en combinacin con los mtodos de cromatografa lquida bidimensional, podran abrir el camino al estudio de modificaciones postraduccionales a gran escala y de forma dinmica, y a la manera como stas modulan, desde una perspectiva global, el control de la inmensa mayora de los procesos celulares. Figura 5 Caracterizacin de la modificacin postraduccional de un pptido (en este caso fosforilacin) mediante espectrometra de masas de trampa inica. El pptido se asla en tiempo real a partir de una mezcla de pptidos (A) y se somete a fragmentacin (B); el fragmento principal as obtenido, que corresponde a la cadena polipeptdica que permanece despus la rotura del grupo fosfato, se vuelve a someter a fragmentacin (C). Este espectro de fragmentacin se interpreta en base a la secuencia del pptido, la modificacin producida por el grupo fosfato y el peso molecular esperado de los fragmentos. En la figura se muestra que la fosforilacin tiene lugar en el aminocido Serina situado en posicin 2, que se indica como una s minscula. Esta interpretacin fue realizada utilizando el programa DeNovoX, desarrollado en el laboratorio del autor.
Jess Vzquez Director del Laboratorio de Qumica de Protenas y Protemica Centro de Biologa Molecular Severo Ochoa (CBM), CSIC-UAM ISSN 1695-0623 Laboratorio de Protemica, Universidad autonoma de Madrid 28049 Cantoblanco. Madrid. Espaa. Tel.: 91 397 83 64, fax: 91 397 80 87.