Análisis in Silico: Modelado de Proteínas.: Unidad Académica Preparatoria No. 9, Universidad Autónoma de Guerrero

Tlamati Sabiduría Volumen 8 Número Especial 2, Octubre 2017
4°r. Encuentro de Jóvenes en la Investigación de Bachillerato-CONACYT

Acapulco, Guerrero 4, 5 y 6 de octubre 2017
Memorias
Análisis in silico: Modelado de Proteínas.
Jesús Omar Velázquez Moreno (Becario)

jesus_velazquezm@hotmail.com
Unidad Académica Preparatoria No. 9, Universidad Autónoma de Guerrero
Dra. Olga Lilia Garibay Cerdenares (Asesora)

olgaribay@hotmail.com
Profesor Investigador por Cátedras CONACyT
Jefe del Laboratorio de Biomedicina Molecular
Facultad de Ciencias Químico Biológicas,
Universidad Autónoma de Guerrero
Introducción
En la actualidad, es la tecnología de mucha importancia para realizar varias tareas a la vez; facilita
la vida del hombre y hace que algunas actividades sean mucho más sencillas, tales como la
comunicación, el entretenimiento y el estar informados. No solamente ha influido en las actividades
cotidianas que realizamos, sino que también ha tenido gran peso sobre la Ciencia, en especial en
las áreas de Medicina Moderna y la Biología Molecular.
Como sabemos, la informática es el procesamiento, recopilación y presentación de la información
por medio de los ordenadores; la estadística es considerada como una rama de las matemáticas que
se encarga de la recopilación e interpretación de datos. La combinación de estas dos áreas del saber,
ha dado como resultado la llamada bioinformática. La bioinformática ha sido de mucha utilidad
principalmente para el área de las Ciencias de la Salud.
Actualmente, muchos proyectos denominados in silico se han llevado a cabo gracias a esta rama
de la ciencia y es utilizada principalmente para hacer predicciones por medio de tres principales
herramientas: el modelado, la simulación y la visualización.
El modelado fue la herramienta de la Biología molecular que se llevó a cabo en un análisis in silico
durante la estancia realizada en la Facultad de Ciencias Químico Biológicas para la representación
tridimensional de la estructura de las proteínas para su estudio y relación que guarda con otras.
Tlamati Sabiduría Volumen 8 Número Especial 2, 2017
Plegamiento de Proteínas
Las proteínas son el resultado de dos procesos fundamentales que se llevan a cabo a nivel celular,
éstos son la transcripción y la traducción. Están formadas por una secuencia de aminoácidos, los
cuales tienen una estructura química descrita a continuación: poseen un carbono quiral que tiene
ocupados sus cuatro enlaces disponibles por un grupo carboxilo (COOH), un grupo amino (NH3),
un átomo de Hidrogeno (H) y un grupo de cadena lateral que será el responsable de la naturaleza
que vaya a tener el aminoácido (refiriéndose a la carga que tenga, si será hidrofóbico o hidrofílico,
etc.). Éstos están unidos por enlaces peptídicos muy resistentes entre el grupo carboxilo y el grupo
amino, dando como residuo al momento de su formación, una molécula de agua (H2O).
Dependiendo del número de aminoácidos que formen una cadena, se pueden dar diferentes
nombres: cuando la cadena tiene pocos aminoácidos (a.a.) se denominan péptidos, puede haber
oligopéptidos conformados por menos de 10 a.a. y polipéptidos conformados por más de 10
unidades de a.a. Se debe señalar que una cadena de aminoácidos es considerada una proteína
cuando la cadena supera los 50 a.a.
Las proteínas comienzan siendo una simple cadena de a.a. y pueden tener distintas formas en su
plegamiento, dando origen a estructuras primarias, secundarias, terciarias y cuaternarias.
Estructura Primaria.
La estructura primaria de las proteínas se refiere a la cadena
sencilla de aminoácidos decodificada por un RNA mensajero
en los ribosomas. Estos aminoácidos están unidos entre sí por
enlaces peptídicos.
Estructura Secundaria.
La estructura secundaria posee enlaces por puentes de
hidrógeno entre átomos de Hidrogeno y Oxigeno que
permiten el plegamiento en forma de escalera de caracol,
denominada α-hélice y también una forma de hoja doblada,
llamada β-lámina.
Memorias del 4° Encuentro de Jóvenes en la Investigación de Bachillerato-CONACYT
Estructura Terciaria.
La estructura terciaria posee enlaces disulfuro que permiten la
estabilidad de las proteínas con esta estructura. Resulta de la
“combinación” de las dos estructuras secundarias (α-hélice y β-
lámina).
Estructura Cuaternaria.
La estructura cuaternaria posee los tres tipos de enlace
mencionados anteriormente (peptídico, puente de hidrógeno y
disulfuro). Surge de la unión de varias cadenas polipeptídicas
denominadas protómeros y así dan lugar a dímeros, trímeros,
tetrámeros, etc.
Principales funciones de las proteínas

Las proteínas se encuentran localizadas en distintas partes del organismo en cantidades
determinadas. Cada una de ellas cumple una función específica a nivel molecular que propician
diversas actividades celulares de suma importancia para la vida. El ejemplo más claro de esta
situación, es que en procesos como la replicación del DNA se requiere la intervención de proteínas
que lleven a cabo funciones importantes: la Girasa es la responsable de relajar las hebras del DNA
para que posteriormente sean separadas por la Helicasa, la Polimerasa construye una nueva cadena
de nucleótidos y la Ligasa sella los espacios que queden entre ellos. Estos procesos complejos se
llevan a cabo cada vez que la célula entra en proceso de división. Además, muchas funciones
celulares que realizarán un tipo de proteínas, serán activadas gracias a otras proteínas, dando lugar
así a las llamadas: “Cascadas de señalizaciones”.
La estructura, soporte y elasticidad de algunos tejidos del cuerpo también están vinculadas a la
intervención y funcionamiento de las proteínas, estas propiedades son fundamentales para la
correcta operatividad del cuerpo humano.
Bases de Datos de Proteínas

Una base de datos es el lugar donde se reúne todo la información que se tiene acerca de un objeto
de estudio; se accede a ellas por medio de un ordenador con la ayuda de buscadores universales,
tales como: Google, Yahoo!, etc.
Gracias a la gran cantidad de descubrimientos que se han hecho en el área de la biología, surge la
necesidad de recopilar toda la información en bases de datos biológicas y que comprenden diversas
áreas: el estudio de la secuenciación del genoma, estructura de las proteínas, taxonomía, etc.
UniProt
UniProt es una base de datos que es de gran ayuda para la comunidad científica ya que en ella están
registradas las secuenciaciones de proteínas que se han estudiado en diversos organismos vivos;
además es de fácil acceso y cuenta con apartados para cada proteína que hacen más fácil encontrar
la información requerida. UniProt, nace por la unión de tres bases de datos previas: Swiss-prot,
TrEMBL y PIR-PSD. Swiss-Prot y TrEML continúan siendo dos secciones en UniProt.
Protein Data Bank
Es una base datos que cuenta con un gran número de estructuras tridimensionales de proteínas y
ácidos nucleicos; también contiene información acerca de la secuencia de cada estructura que son
de gran ayuda para investigadores y alumnos. Ayuda a la comprensión de la Biología, Medicina,
Biología Molecular, Biología Celular, entre otras ramas de las Ciencia de la salud.
Análisis in silico
El análisis in silico difiere de los procesos in vivo, que son realizados en organismos vivos; e in
vitro, los cuales se llevan a cabo fuera de seres vivos en instrumentos como tubos de ensayo u otro
ambiente artificial. In silico se refiere a los distintos procesos que se realizan a través de
ordenadores computacionales gracias a programas y bases de datos. Este tipo de análisis tiene base
en la bioinformática, cuenta con diversas aplicaciones, de las cuales, tres son muy importantes: el
modelado, la simulación y la visualización.
Modelado Computacional de Proteínas
La secuencia de aminoácidos en una proteína nos permite saber su función dentro de los
organismos; con el apoyo de la bioinformática se pueden realizar estructuras tridimensionales por
medio de diferentes técnicas. Estos modelos tridimensionales son de gran importancia para la
Medicina y las empresas farmacéuticas, ya que son utilizados para predecir la interacción de alguna
proteína con otras proteínas, o bien para desarrollar (o probar) algún tipo de fármaco.
Las interacciones proteína-proteína (PPI) generadas de manera in silico permiten comprender los
efectos que tienen sobre nuestro cuerpo las modificaciones que ocurren en las proteínas o la forma
en la que los fármacos actúan sobre ellas, entre otras muchas situaciones.
Algunas veces, las interacciones resultantes llegan a ser perjudiciales porque favorecen al
desarrollo de algunas enfermedades o desórdenes al afectar el correcto funcionamiento de procesos
biológicos a nivel celular.
Modelado por Homología
El modelado por homología también recibe el nombre de “modelado por comparación” y esto se
debe a que esta técnica consiste en crear una estructura tridimensional a partir de una secuencia de
aminoácidos mayormente parecida a otra de la cual ya se tenga la estructura 3D.
A lo largo de las dos secuencias, habrá largas regiones en las que los aminoácidos constituyentes
serán los mismos y, por ende, su estructura será igual; a estas regiones se les denomina “estructuras
molde”. Por otra parte, la “secuencia problema” se refiere a las partes en las que las secuencias no
son idénticas y que se tendrán de completar por medio de algún software especializado.
I-TASSER es un servidor de modelado por homología que genera estructuras tridimensionales con
la búsqueda de una secuencia lo suficientemente parecida a la ingresada, para conocer su estructura.
La información acerca de toda la composición en la estructura tridimensional de una proteína, se

presenta a través de formatos denominados PDB (Protein Data Bank). El formato cuenta con
diversas columnas que muestran la composición química y fisicoquímica de la proteína: el número
de cada átomo, las iniciales de los nombres químicos, a qué aminoácido corresponden ese total de
átomos, el número del aminoácido y algunas propiedades físicas.
Método basado en el plegamiento
A diferencia del método expuesto anteriormente, éste tiene como finalidad la formación de una
estructura tridimensional a partir de las similitudes entre estructura sin importar la secuencia de los
aminoácidos que éstas tengan. Se utiliza este método cuando las homologías entre secuencias no
son suficientes como para hallar alguna proteína con composición semejante.
Los programas computacionales que son utilizados para llevar a cabo estas acciones son de tipo
Threading y están disponibles por el servidor: Fisher`s Fold Recognition que es capaz de comparar
resultados por medio de bases de datos de estructuras proteicas.
Métodos de ab initio
También son llamados métodos de novo. Consiste en formar la estructura secundaria de una
proteína en forma tridimensional basándose sólo con las propiedades físicas y fisicoquímicas de
cada átomo de un elemento, para así determinar qué aminoácido es más susceptible de unirse con
otro. Se llevan a cabo por medio de estrategias como Chou-Fasman method y GOR method.
Éstos pertenecen a la primer generación de métodos de predicción que surgieron alrededor de la

década de los 70´s, durante esta época no había mucha información disponible acerca de estructuras
de proteínas, por lo que eran de baja confiabilidad y se basaban en proteínas conocidas mediante
cristalografía.
Modelo HP
Este modelo consiste en construir la estructura de la proteína mediante el conocimiento de la

secuencia de aminoácidos (cadena lineal) y de propiedades físicas, otorgando así la letra H para los
aminoácidos Hidrofóbicos y la letra P para los aminoácidos Polares o Hidofílicos.
Docking de proteínas
El término Docking hace referencia a las simulaciones in silico que se llevan a cabo para observar
las interacciones entre las moléculas blanco y otros agentes, por ejemplo, algunos fármacos para
su estudio. Muchas veces, las proteínas se utilizan como moléculas blanco y forman complejos
mediante la interacción con moléculas u otras proteínas.
Lo que interesa saber a cerca de esas interacciones es saber cuáles son las partes de las proteínas
que interaccionan entre si y cuál es la función que desempeñan juntas. La relación suele ser la
forma en que mejor se completan tomando en cuenta su estructura y forma geométrica.
La metodología del Docking de proteínas suele dividirse en tres procesos importantes:
Primera etapa: consiste en tener claro cuál va a ser la proteína que se va a manejar y establecer el
lugar de unión entre esta molécula blanco y otra proteína.
Segunda etapa: Aquí se requiere tener listas las moléculas con las que se desea tener la asociación
y conocer su estructura tridimensional. Se pueden obtener desde una base de datos, los cuales son
capaces de reconocer a la molécula blanco y adherirse a ella.
Tercera etapa: Se forma el complejo y se observa la función que la unión de estas dos proteínas
llevan a cabo.
Interacciones Proteína-Proteína (PPI)
Las interacciones dan lugar a los llamados complejos proteicos y éstos tienen una función
específica a nivel celular. Se encargan de procesos fundamentales como la replicación,
transcripción y traducción; a su vez, son capaces de formar redes de transducción de señales en las
cuales se lleva a cabo una reacción en cadena que activan o desactivan ciertas proteínas implicadas
en la realización de alguna acción específica.
Tan sólo dentro de la célula, se tienen que llevar a cabo señalizaciones por medio de proteínas entre
los diversos organelos, también son capaces de regular la entrada y salida de substancias por la
membrana plasmática, tiene que ver también con los procesos metabólicos para la obtención de
energía, el transporte de macromoléculas, entre muchas otras funciones.
Objetivos.
1: Generar mediante un análisis in silico la estructura tridimensional de la proteína RCN2.
2: Evaluar mediante Docking in silico la interacción de E6 y RCN2.
Metodología
Como primera fase para llevar a cabo la realización del Docking entre las dos proteínas, se tuvo
que obtener la secuencia de aminoácidos de la proteína RCN2 desde la base de datos UniProt,
posteriormente se introdujo toda la secuencia al servidor I-TASSER para que generara la estructura
3D por medio de la técnica por homología. El servidor solicita tu correo electrónico para enviar ahí
los resultados. Pasados unos días, los resultados se te hacen llegar y te muestran 5 estructuras
tridimensionales, cada una acompañada de un formato PDB, de las cuales tendrás que escoger la
mejor opción de acuerdo a los criterios que tomes en cuenta.
El siguiente paso es visualizar la estructura de la proteína por medio del programa VMD donde
puedes modificar el color del fondo y de la proteína, su representación y el ángulo en el que desea
observar, las sombras, entre otros elementos. Una vez conseguida la estructura 3D de RCN2, se
necesita también la estructura de la oncoproteína E6. Ésta se me proporcionó por el Laboratorio de
Biomedicina Molecular, en la Facultad de Ciencias Químico Biológicas. Brevemente, esta proteína
fue diseñada mediante un análisis in sílico utilizando como estructura molde la proteína E6 VPH16
mutada presente en el modelo tridimensional PDB: 4XR8 (Martinez-Zapien et al., 2016).
Finalmente, para llevar a cabo el Docking, se necesita la introducción de los dos formatos PDB a
un servidor llamado ClusPro, que hace una predicción de los lugares en que interaccionarían las
dos proteínas. Nuevamente, por medio del programa VMD, se visualiza dicha interacción y se
modifica la representación de acuerdo a un criterio propio.
Resultados
A) B)
N
C) D)
N
Figura 1. Estructuras tridimensionales que se utilizaron para realizar el Docking entre RCN2 y E6.
A) Estructura 3D de la proteína de unión al calcio RCN2 en la que se pueden observar las α-hélice
y las β-láminas que la conforman. En color amarillo se puede observar el grupo amino representado
con la letra N y de color azul el grupo carboxilo terminal representado con la letra C. B) Estructura
3D de la oncoproteína E6 en la que se pueden observar las α-hélices y β-láminas que la conforman.
C) Estructura 3D de la proteína RCN2 en su representación de superficie; se incluyen las letras N

y C para tratar de representar la altura a las que se encuentran el grupo amino y carboxilo terminal.
D) Rotación de la estructura 3D de la proteína RCN2; se conservan las letras N y C a la altura en
que estarían los grupos amino y carboxilo terminal respectivamente.
E)
Figura 2. Docking realizado entre las proteínas RCN2 y E6 en la que se muestra la forma de
interacción. E6 interactúa con RCN2 y favorece la inmortalización de células infectadas con el
VPH.
Conclusiones.
1. El Docking entre las proteínas RCN2 y E6 puede servir para el desarrollo de algún fármaco
al observar la manera en que éste pueda interactuar con el complejo impidiendo su unión o
cambiando sus funciones y así impedir que las células infectadas con VPH16 se vuelvan
inmortales y, por ende, se pueda prevenir el desarrollo de cáncer. Todo lo anterior mediante
una simulación por análisis in silico.
2. El análisis in silico permite a la comunidad científica tener una idea más acertada acerca de
la forma en que algún fármaco pueda actuar dentro del organismo de alguna persona.
Después de analizar la forma de interacción, es necesario continuar las pruebas en análisis
in vivo.
3. Con el apoyo de los tres tipos de análisis in vivo, in vitro e in silico, se pueden llevar a cabo
diferentes técnicas que tienen un mismo objetivo: la detección y prevención de
enfermedades que aquejan al ser humano.
Bibliografía
Martinez-Zapien, D., Ruiz, F.X., Poirson, J., Mitschler, A., Ramirez, J., Forster, A., Cousido-
Siah, A., Masson, M., Pol, S.V., Podjarny, A., Travé, G., Zanier, K., 2016. Structure of the
E6/E6AP/p53 complex required for HPV-mediated degradation of p53. Nature 529, 541–545.
doi:10.1038/nature16481.
The UniProt Consortium. UniProt: the universal protein knowledgebase.
Boutet E, Lieberherr D, Tognolli M, Schneider M, Bansal P, Bridge AJ, Poux S, Bougueleret

L, Xenarios I. UniProtKB/Swiss-Prot, the Manually Annotated Section of the UniProt
KnowledgeBase: How to Use the Entry View. Methods Mol. Biol. 1374:23-54 (2016).
(http://www.uniprot.org/uniprot/Q14257).
The I-TASSER server. I-TASSER: Protein Structure & Function Predictions.
Yang, R Yan, un Roy, D Xu, J Poisson, Y Zhang. La serie I-TASSER: Estructura de la proteína
y predicción de la función. Nature Methods, 12: 7 - 8 (2015).
Un Roy, un Kucukural, Y Zhang. I-TASSER: una plataforma unificada para la estructura
automatizada de proteínas y la predicción de funciones. Nature Protocols, 5: 725-738 (2010).
Y Zhang. Servidor I-TASSER para la predicción de la estructura de la proteína 3D. BMC

Bioinformatics, vol. 9, 40 (2008).
(https://zhanglab.ccmb.med.umich.edu/I-TASSER/).
The ClusPro server. ClusPro: Protein-Protein Docking.
Kozakov D, Hall DR, Xia B, Porter KA, Padhorny D, Yueh C, Beglov D, Vajda S. The ClusPro
web server for protein-protein docking. Nature Protocols. 2017 Feb; 12(2):255-278.
Kozakov D, Beglov D, Bohnuud T, Mottarella S, Xia B, Hall DR, Vajda, S. How good is
automated protein docking? Proteins: Structure, Function, and Bioinformatics, 2013 Aug.
Kozakov D, Brenke R, Comeau SR, Vajda S. PIPER: An FFT-based protein docking program
with pairwise potentials. Proteins. 2006 Aug 24.
Comeau SR, Gatchell DW, Vajda S, Camacho CJ. ClusPro: an automated docking and
discrimination method for the prediction of protein complexes. Bioinformatics. 2004 Jan 1.
Comeau SR, Gatchell DW, Vajda S, Camacho CJ. ClusPro: a fully automated algorithm for
protein-protein docking Nucleica Acids Research. 2004 Jul 1.
(https://cluspro.bu.edu/login.php).
The VMD program. VMD: Visual Molecular Dynamics.
Humphrey, W., Dalke, A. y Schulten, K., "VMD - Visual Molecular Dynamics", J. Molec.
Graphics, 1996, vol. 14, págs. 33-38.
(http://www.ks.uiuc.edu/Research/vmd/).

Análisis in Silico: Modelado de Proteínas.: Unidad Académica Preparatoria No. 9, Universidad Autónoma de Guerrero

Caricato da

Informazioni sul documento

Descrizione originale:

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Análisis in Silico: Modelado de Proteínas.: Unidad Académica Preparatoria No. 9, Universidad Autónoma de Guerrero

Caricato da

Copyright:

Formati disponibili

Tlamati Sabiduría Volumen 8 Número Especial 2, Octubre 2017

4°r. Encuentro de Jóvenes en la Investigación de Bachillerato-CONACYT

Análisis in silico: Modelado de Proteínas.

Jesús Omar Velázquez Moreno (Becario)

Dra. Olga Lilia Garibay Cerdenares (Asesora)

Principales funciones de las proteínas

Bases de Datos de Proteínas

Protein Data Bank

Modelado Computacional de Proteínas

Modelado por Homología

La información acerca de toda la composición en la estructura tridimensional de una proteína, se

Método basado en el plegamiento

Éstos pertenecen a la primer generación de métodos de predicción que surgieron alrededor de la

Este modelo consiste en construir la estructura de la proteína mediante el conocimiento de la

La metodología del Docking de proteínas suele dividirse en tres procesos importantes:

Interacciones Proteína-Proteína (PPI)

C) Estructura 3D de la proteína RCN2 en su representación de superficie; se incluyen las letras N

The UniProt Consortium. UniProt: the universal protein knowledgebase.

Boutet E, Lieberherr D, Tognolli M, Schneider M, Bansal P, Bridge AJ, Poux S, Bougueleret

The I-TASSER server. I-TASSER: Protein Structure & Function Predictions.

Y Zhang. Servidor I-TASSER para la predicción de la estructura de la proteína 3D. BMC

The ClusPro server. ClusPro: Protein-Protein Docking.

The VMD program. VMD: Visual Molecular Dynamics.

Potrebbero piacerti anche