Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Ribeiro Preto
2008
Universidade de So Paulo
Faculdade de Filosofia, Cincias e Letras de Ribeiro Preto
Faculdade de Medicina de Ribeiro Preto
Departamento de Gentica
Informtica Biomdica
Ribeiro Preto
2008
AGRADECIMENTOS
Agradeo as pessoas que mais amo nesse mundo: meus pais, grandes responsveis por eu
estar aqui hoje, e meus irmos. Obrigada por terem tido pacincia nas minhas horas instveis,
me dado carinho nas horas que precisava e puxes de orelha nas horas necessrias.
Agradeo minha av e madrinha, que sempre estar presente, por tudo que ela me ensinou.
minha famlia por todo o apoio e incentivo.
Ao Vitor, por sempre estar ao meu lado.
Agradeo aos amigos com quem pude contar nas horas boas e ruins. Ao pessoal do GBi, pelos
momentos que convivemos juntos, pelas risadas e ensinamentos.
minha orientadora Profa. Silvana e meu co-orientador Daniel. Obrigada pela orientao e
amizade.
Enfim, agradeo a Deus por ter colocado no meu caminho essas pessoas to especiais, com
quem aprendi e ainda aprendo muito sobre a vida. Obrigada por tudo.
RESUMO
As abelhas existem no planeta h mais de 50 milhes de anos. Apesar de terem evoludo
dentro das famlias de insetos, como as formigas, cupins e as vespas, aparentemente no
modificaram suas atividades e funes em prol da manuteno e preservao do planeta. Seu
ferro conduz o veneno que a sua nica arma de defesa contra seus inimigos e que, em
grandes quantidades, fatal ao homem. O veneno da abelha composto por vrias
substncias qumicas como peptdeos, enzimas, aminas biognicas e outras molculas, que
apresentam atividades farmacolgicas e alrgicas. A Apis mellifera, popularmente conhecida
como abelha africanizada ou abelha do mel, a mais agressiva, enxameia vrias vezes ao ano
e utiliza uma grande variedade de locais para nidificar. Esse comportamento aumenta o
contato direto entre o inseto e a populao, aumentando o nmero de acidentes. Reaes
alrgicas s picadas de abelhas so comuns e, mesmo que raramente, podem levar morte. A
possibilidade de usar essas substncias, compostas de protenas, contidas no veneno das
abelhas de grande importncia para a sade pblica e indstrias de frmacos. As protenas
so compostos orgnicos, formados pela ligao de aminocidos, que possuem funes
especficas dentro do organismo, estando ligadas a determinadas atividades, como o caso
das enzimas, hormnios e anticorpos. Uma seqncia de aminocidos ao se enovelar resulta
em estruturas tridimensionais. A estrutura terciria est intimamente relacionada funo das
molculas e, portanto, sua determinao parte fundamental no estudo das protenas. Essas
estruturas podem ser obtidas por mtodos experimentais como cristalografia de raios-X e
espectroscopia de ressonncia magntica nuclear (RMN), mas esses mtodos despendem
muito tempo e recursos financeiros, alm de que muitas estruturas so difceis ou at mesmo
impossveis de serem determinadas por esses mtodos. Surge assim a proposta da modelagem
molecular comparativa ou por homologia. O presente projeto prope estudar as estruturas
tercirias das protenas de veneno de Apis mellifera atravs de modelagem por homologia e o
desenvolvimento de uma base de dados e interface web para a integrao entre dos dados
obtidos e disponibilizao dos resultados ao usurio.
LISTA DE FIGURAS
Figura 1 - Modelagem Molecular por Satisfao de Restries Espaciais. (1) Alinhamento
entre as seqncia-alvo e a molde (que possui estrutura); (2) Extrao de restries
espaciais; (3) Satisfao das restries espaciais. ............................................................16
Figura 2 - Estrutura protica e seus trs ngulos principais, omega (), phi () e psi ().
Como o ngulo fixo os ngulos e so os responsveis por toda a variao
conformacional da cadeia principal, pois tornam a cadeia polipeptdica flexvel............17
Figura 3 - Grfico de Ramachandran gerado pelo Procheck. As regies representadas em
vermelho, so as mais favorveis, as representadas em amarelo, so as favorveis, as
representadas em bege, so as menos favorveis e as regies brancas, so as
desfavorveis. ...................................................................................................................18
Figura 4 - Esquema geral do mtodo terico da modelagem por homologia, baseado em
MART-RENOM et al., 2000. ........................................................................................20
Figura 5 - Arquitetura do sistema. O usurio faz uma requisio ao servidor, o servidor web
recebe essa requisio e interagindo com scripts php gera resultados que retornaro ao
usurio atravs de um navegador web..............................................................................22
Figura 6 - Alinhamento global entre seqncia-alvo (gi 229389) e seqncias-molde. ..........26
Figura 7 - Alinhamento global entre seqncia-alvo (gi 229230) e seqncias-molde. ..........26
Figura 8 - Alinhamento global entre seqncia-alvo (gi 126956) e seqncias-molde. ..........26
Figura 9 - Alinhamento global entre seqncia-alvo (gi 69552) e seqncias-molde. ............27
Figura 10 - Alinhamento global entre seqncia-alvo (gi 126955) e seqncias-molde. ........27
Figura 11 - Grfico de Ramachandran da seqncia de gi 229389, gerado pelo software
Procheck, onde so correlacionados os ngulos torcionais da cadeia principal, Phi e Psi,
para cada resduo. As regies de classificao esto divididas por cores distintas. .........29
Figura 12 - Representao dos grficos de cinco propriedades estruturais da cadeia principal.
Os valores do modelo gerado so marcados por quadrados. As bandas escuras em cada
grfico representam os resultados das estruturas resolvidas conhecidas, e a linha central
representa uma mdia dos valores em funo da resoluo. As linhas das extremidades
representam o desvio em relao mdia. .......................................................................30
Figura 13 - Modelo para seqncia de gi 229389. Em amarelo, est a localizao do resduo
com baixa qualidade de contato........................................................................................31
Figura 14 - Representao do perfil 3D do modelo de gi 229389. So desconsiderados os 11
resduos das extremidades. ...............................................................................................32
LISTA DE TABELAS
Tabela 1 - Algumas ferramentas de bioinformtica e servidores da Internet com seus
respectivos endereos web teis na modelagem por homologia (acessados em maio
2008). *S: Servidor; P: Programa (software). ....................................................................8
Tabela 2 - Levantamento de seqncias no GenBank e de estruturas depositadas no PDB. ...11
Tabela 3 - Relao entre Protenas-alvo e Protenas-molde. ....................................................25
Tabela 4 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural
gerado para o alvo gi 229389 e o ndice total do modelo.................................................31
Tabela 5 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural
gerado para o alvo gi 229230 e o ndice total do modelo.................................................34
Tabela 6 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural
gerado para o alvo gi 126956 e o ndice total do modelo.................................................37
Tabela 7 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural
gerado para o alvo gi 126955 e o ndice total do modelo.................................................40
Tabela 8 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural
gerado para o alvo gi 69552 e o ndice total do modelo...................................................43
Tabela 9 - Descrio das tabelas apresentadas no Diagrama Entidade-Relacionamento do
sistema em desenvolvimento ............................................................................................46
Tabela 10 - Descrio dos atributos das entidades do Diagrama Entidade - Relacionamento do
sistema em desenvolvimento ............................................................................................47
Tridimensional
BDModel
BLAST
NCBI
PDB
RMN
Rx
Raios x
SGBD
SNC
SNP
SUMRIO
1
INTRODUO..................................................................................................................1
1.1
O GNERO APIS E AS ABELHAS AFRICANIZADAS ........................................1
1.2
COMPOSIO DO VENENO E MECANISMOS FISIOPATOLGICOS............2
1.3
APITOXINA E SUAS APLICAES ......................................................................3
1.4
PROTENAS HOMOLGAS....................................................................................3
1.5
MODELAGEM DE PROTENAS.............................................................................3
2.2.1
Modelagem por Homologia................................................................................4
1.6
JUSTIFICATIVA .......................................................................................................5
1.7
OBJETIVO .................................................................................................................5
1.8
ORGANIZAO DA MONOGRAFIA ....................................................................6
2
MATERIAIS E MTODOS...............................................................................................7
2.1
FERRAMENTAS DE BIOINFORMTICA.............................................................7
2.1.1
Banco de Dados Pblicos para Bioinformtica ..................................................8
2.1.2
Fonte de Protenas Moldes ...............................................................................11
2.1.3
Alinhamento das Seqncias ............................................................................12
2.1.4
Construo dos Modelos ..................................................................................14
2.1.5
Validao dos Modelos ....................................................................................16
2.1.6
Visualizao dos Modelos ................................................................................19
2.2
MODELAGEM DAS PROTENAS POR HOMOLOGIA......................................19
2.3
ARQUITETURA DO SISTEMA.............................................................................21
2.4
IMPLEMENTAO ...............................................................................................22
2.4.1
Plataforma.........................................................................................................22
2.4.2
Linguagem de Programao .............................................................................23
2.4.3
Confeco do Banco de Dados.........................................................................24
3
RESULTADOS E DISCUSSES....................................................................................25
3.1
MODELAGEM DAS PROTENAS ........................................................................25
3.1.1
Busca de seqncias homlogas.......................................................................25
3.1.2
Alinhamento entre seqncias-alvo e molde ....................................................26
3.1.3
Construo dos modelos...................................................................................27
3.1.4
Validao dos modelos.....................................................................................28
3.2
ESTRUTURA DO BANCO DE DADOS................................................................45
3.2.1
DER ..................................................................................................................45
3.2.2
Dicionrio de dados ..........................................................................................45
3.3
DESENVOLVIMENTO DO SISTEMA BDMODEL .............................................47
3.3.1
Interfaces do Sistema........................................................................................48
4
CONCLUSES ................................................................................................................56
REFERNCIAS BIBLIOGRFICAS .....................................................................................58
1 INTRODUO
1.1 O GNERO APIS E AS ABELHAS AFRICANIZADAS
As abelhas so descendentes das vespas e, cerca de 135 milhes de anos,
algumas espcies deixaram de se alimentar de pequenos insetos e passaram a coletar nctar e
plen das flores para a produo do mel. H relatos que constatam a relao entre os homens
e as abelhas pela prtica da apicultura desde a pr-histria (SCHIRMER, 1986).
Entre as espcies produtoras de mel, as do gnero Apis so as mais conhecidas. O
gnero Apis apresenta nove espcies1: Apis mellifera, Apis florea, Apis dorsata, Apis cerana,
Apis korchevniskov, Apis andreniformis, Apis laboriosa, Apis nuluensis e Apis nigrocincta..
Dentre elas, a Apis mellifera sempre despertou interesse devido a sua grande importncia
econmica (DAVILA et al., 2005) e, sobretudo, pelas novas possibilidades de usos de seus
produtos na rea mdica (MAIA, 2002; COSTA NETO & PACHECO, 2005).
Por volta de 1950, a subespcie africana Apis mellifera scutellata foi trazida para o
Brasil pelo Prof. Dr. Warwick Estevam Kerr, um renomado cientista que, posteriormente,
veio a fundar o Departamento de Gentica da Faculdade de Medicina de Ribeiro Preto2, no
intuito de aumentar a produo nacional de mel, pois essas abelhas apresentavam uma alta
produtividade e uma alta capacidade de adaptao. Mas, tambm apresentavam aspectos
negativos, como a grande capacidade de enxamear e o comportamento agressivo.
Por esses motivos, as colmias do apirio experimental contendo as abelhas
africanas, localizado no municpio de Rio Claro SP, eram protegidas por uma tela, para
evitar a fuga das rainhas e, conseqente, disperso da colmia. Por um acidente, essas telas
foram removidas e as abelhas se dispersaram por todo Brasil, onde, ao cruzarem com abelhas
nativas e europias que aqui se encontravam, deram origem as, popularmente, conhecidas
abelhas africanizadas (GONALVES, 1974).
A Apis mellifera, popularmente conhecida como abelha africanizada ou abelha de
mel, manteve as caractersticas das africanas como a agressividade, a ocorrncia de enxames
vrias vezes ao ano e a utilizao de uma grande variedade de locais para nidificar. Esse
comportamento aumenta o contato direto entre o inseto e a populao, aumentando o nmero
de acidentes.
1
2
http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=7459
http://rge.fmrp.usp.br/historico.php
1.2 COMPOSIO
DO
VENENO
MECANISMOS
FISIOPATOLGICOS
Os acidentes causados por picadas de abelhas apresentam manifestaes clnicas
distintas, dependendo da sensibilidade do indivduo ao veneno e do nmero de picadas. O
acidente mais freqente aquele no qual um indivduo no sensibilizado ao veneno
acometido por poucas picadas. A composio dos venenos e a conseqente ao aps a picada
das abelhas melferas vm sendo estudado desde a dcada de 50 (HABERMANN, 1972).
O veneno da abelha composto por uma mistura complexa de substncias
qumicas como peptdeos, enzimas e aminas biognicas, que apresentam atividades
farmacolgicas e alrgicas. Os fatores alergnicos so enzimas como fosfolipases,
hialuronidases, lipases e fosfotases, protenas antignicas que, uma vez inoculadas durante a
ferroada, iniciam respostas imunes responsveis pela hipersensibilidade de alguns indivduos
e pelo incio da reao alrgica. So agentes bloqueadores neuromusculares e possuem
poderosa ao hemoltica, alm de propriedades antiarrtmicas.
A Fosfolipase A2, uma das mais ativas fosfolipases conhecidas, provoca ruptura
dos fosfolipdios da membrana celular com contrao do msculo liso, hipertenso e aumento
da permeabilidade vascular.
A Hialuronidase, mesmo no sendo muito txica, potencia a difuso e os efeitos
nocivos dos outros componentes do veneno das abelhas, sendo conhecida como fator
propagador (FRANA & MEDEIROS, 2003).
A
Melitina
componente
predominante
no
veneno
apresentando,
aproximadamente, 50 % da matria seca. (OWEN & PFAFF, 1995). a toxina mais ativa no
veneno das abelhas causando hemlise. Em ao com a Fosfolipase A2, compromete a
integridade da membrana celular e da membrana mitocondrial, comprometendo, assim a
fosforilao oxidativa e a cadeia respiratria, ocasionando dano tecidual.
A Apamina est presente em apenas 2% da matria seca, tendo a menor
neurotoxina conhecida. Age nos sistemas nervoso central (SNC) e perifrico (SNP),
bloqueando a transmisso de impulsos inibitrios.
O Peptdeo Degranulador de Mastcitos responsvel pela intoxicao
histamnica observada nas fases iniciais do acidente e liberao de mediadores qumicos.
As pequenas molculas de peptdeos como a Secapina e a Tertiapina parecem no
apresentar toxidade em mamferos. Um provvel papel desses peptdeos repelir outros
animais, como artrpodes e insetos.
2
Protein Data Bank3 (PBD) estejam crescendo exponencialmente nos ltimos anos, ainda no
h dados estruturais para a maioria das protenas eleitas como atrativos alvos teraputicos
(BERMAN et al., 2000).
Os mtodos experimentais, como Cristalografia de Raios-X e espectroscopia de
Ressonncia Magntica Nuclear (RMN), esto a cada dia determinando novas estruturas
proticas, mas nem sempre possvel devido a limitaes tcnicas, alm de que muitas
estruturas so difceis ou at mesmo impossveis de serem determinadas por esses mtodos.
Estudos demonstram que, aproximadamente, apenas uma em cada vinte protenas, produz
cristais adequados para a resoluo da estrutura 3D (MAGGIO & RAMNARAYAN, 2001).
Isso torna a utilizao da modelagem molecular computacional um grande atrativo.
A Bioinformtica apresenta mtodos para que essas estruturas proticas possam
ser preditas. Os mtodos mais aplicados podem ser divididos em dois (RSSLE, 2004):
- Mtodos Fsicos, que baseiam-se nas interaes entre os tomos e incluem
mtodos de modelagem molecular, como dinmica molecular e minimizao de energia. So
chamados tcnicas de primeiros princpios ou Ab-initio.
- Mtodos Empricos dependem de estruturas de protenas que possuem suas
estruturas determinadas por mtodos experimentais e que esto armazenadas em um banco de
dados, por exemplo, PDB (WESTBROOK et al., 2002). So as tcnicas de modelagem
comparativa.
modelagem
por
homologia,
estruturas
de
protenas
determinadas
http://www.rcsb.org/pdb/home/home.do
1.6 JUSTIFICATIVA
O nmero de resoluo de estruturas proticas no acompanha o nmero de
seqenciamento de genomas. Nem todas as seqncias proticas, depositadas em bancos de
dados como o GenBank4, possuem estrutura terciria conhecida. Muitas delas so atrativos
teraputicos, e sabe-se que a estrutura terciria de uma protena e sua interao com outras
molculas esto diretamente relacionadas sua funcionalidade (SNCHEZ & ALI, 1999).
A obteno de estruturas proticas geradas em laboratrios, usando mtodos
prticos, demorada e despende de muitos recursos financeiros. Contudo, o mtodo terico
de modelagem por homologia atravs de modelos computacionais permitiu de maneira
eficiente e mais econmica a descoberta de estruturas tercirias de protenas.
Um grande interesse em estudar estruturas do veneno das abelhas, vem se
tornando cada vez mais comum. Como j comprovado em estudos (WESSELIUS et al.,
2005), a apitoxina (veneno de abelha) utilizada na terapia de diversas doenas, obtendo
timos resultados.
Sendo o veneno da abelha de grande importncia, conhecer as estruturas tercirias
dos componentes proticos do veneno, possibilitaria novos estudos para potencializao
desses efeitos teraputicos e tambm possibilitaria novas aplicaes visando frmacos para
pessoas alrgicas a esses componentes.
1.7 OBJETIVO
Este projeto de concluso de curso teve como objetivo estudar as estruturas
tercirias das protenas de veneno de Apis mellifera atravs de modelagem por homologia. O
projeto tambm previu o desenvolvimento de uma base de dados que armazena as seqncias
primrias das protenas escolhidas, contidas nos venenos das abelhas, as estruturas 3D j
determinadas dessas protenas, e aquelas estruturas de protenas que foram modeladas durante
o desenvolvimento do projeto. Foi desenvolvida uma interface Web para a integrao entre
dos dados obtidos e disponibilizao dos resultados para acesso pblico, para que possam ser
realizadas diversos tipos de buscas no sistema.
http://www.ncbi.nlm.nih.gov/
2 MATERIAIS E MTODOS
2.1 FERRAMENTAS DE BIOINFORMTICA
Com o avano da tecnologia, a bioinformtica, essa recente cincia, tem se
mostrado cada vez mais eficiente na resoluo de problemas, antes complicados de serem
resolvidos por mtodos experimentais. E com essa crescente demanda por resultados rpidos
e menores custos, o desenvolvimento de softwares para essa rea, torna-se cada vez mais
comum. Muitas dessas ferramentas so livres, podendo ser utilizadas por qualquer
pesquisador sem que isso gere custos para ele.
Para cada uma das etapas no processo de modelagem por homologia existe um
grande nmero de mtodos, programas e servidores. Todos que foram utilizados durante o
projeto so livres, e disponveis na rede mundial de computadores (Internet).
Na tabela 1, encontram-se as ferramentas de bioinformtica que foram utilizadas
durante o projeto. Elas esto divididas em programas que realizam determinadas tarefas,
como por exemplo, o Modeller5 responsvel por gerar estruturas 3D, e servidores que
disponibilizam informaes, fornecendo dados e servios para a Internet, compartilhando seus
recursos, como por exemplo, o BLAST6. Essas ferramentas sero discutidas a seguir.
5
6
http://salilab.org/modeller/
www.ncbi.nlm.nih.gov/BLAST/
TIPO*
ENDEREO NA Internet
GenBank
www.ncbi.nlm.nih.gov/GenBank
PDB
www.rcsb.org/pdb/
BLAST
www.ncbi.nlm.nih.gov/BLAST/
PDB
www.rcsb.org/pdb/
HHpred
http://toolkit.tuebingen.mpg.de/hhpred
BLASTP
www.ncbi.nlm.nih.gov/BLAST/
CLUSTALW
www.ebi.ac.uk/clustalw/
MODELLER
http://salilab.org/modeller/modeller.html
MODWEB
http://salilab.org/modweb
SWISS-MODEL
www.expasy.org/swissmod/SWISS-MODEL.html
PROCHECK
www.biochem.ucl.ac.uk/~roman/procheck/procheck.html
WHATIF
http://swift.cmbi.ru.nl/servers/html/oldqua.html
VERIFY3D
http://nihserver.mbi.ucla.edu/Verify_3D/
DS Visualizer
http://accelrys.com/downloads/freeware/
PyMol
http://pymol.sourceforge.net/
Chimera
http://www.cgl.ucsf.edu/chimera/
SwissPdbViewer
Ca.expasy.org/spdbv/
NOME
Bancos de dados
Alinhamento de seqncias
Validao de modelos
Visualizao de modelos
2.1.1.1
GenBank
2.1.1.2
PDB
http://www.ncbi.nlm.nih.gov/
2.1.1.3
10
Toxina Pesquisada
Seqncias Encontradas
Estrutura no PDB
1 Melittin
19
2 - Phospholipase A2
20
1 (1POC)
3 Apamin
----
4 Secapin
----
5 Hyaluronidase
----
7 - Acid phosphatase
21
----
8 - Protease venom
----
9 Tertiapin
1 (1TER)
TOTAL
95
2.1.2.1
BLAST
O Basic Local Alignment Search Tool BLAST, foi uma das ferramentas
utilizadas para a busca de estruturas molde. Na escolha da seqncia mais similar com a
seqncia alvo, o BLAST utiliza valores de pontuao (score) e parmetros. Para o clculo de
score, o BLAST alinha a seqncia alvo com as seqncias depositadas nos bancos de
dados e calcula valores obtidos atravs do somatrio das identidades, similaridades, e pelo
somatrio dos valores dos gaps. Quanto maior for este valor, maior similaridade existe
11
entre as seqncias. O BLAST ser detalhado a seguir, quando ser discutido o alinhamento
local entre as seqncias.
2.1.2.2
PDB
O PDB foi o banco de dados de estruturas de protenas que foi utilizado durante o
projeto. Atravs dele tambm possvel realizar buscas por possveis modelos, utilizando a
seqncia primria da protena molde, no formato fasta. Na pgina inicial do PDB, ao lado
do menu Home encontra-se a opo Search. Quando clicado, abre-se um menu de
pesquisa, Search Database. Nesse menu escolhe-se a opo Sequence. Atravs dessa
busca por seqncias moldes, se obtm um alinhamento entre a seqncia alvo e as
seqncias que possuem estruturas depositadas no PDB. Esse alinhamento pode ser realizado,
utilizando o algoritmo do BLAST ou o algoritmo FASTA .
2.1.2.3
HHpred
http://toolkit.tuebingen.mpg.de/hhpred
http://toolkit.tuebingen.mpg.de/modeller
12
2.1.3.1
BLAST
10
11
http://www.ncbi.nlm.nih.gov/blast/producttable.shtml#blastp
http://align.genome.jp/
13
2.1.3.2
CLUSTAL
14
2.1.4.1
Modeller
15
Figura 1 - Modelagem Molecular por Satisfao de Restries Espaciais. (1) Alinhamento entre as
seqncia-alvo e a molde (que possui estrutura); (2) Extrao de restries espaciais; (3) Satisfao das
restries espaciais.
2.1.4.2
Swiss-Model
O SWISS-MODEL
12
http://swissmodel.expasy.org/SWISS-MODEL.html
16
2.1.5.1
Procheck
17
2.1.5.2
Whatif
13
, do
software Whatif, o qual compara a distribuio das posies de tomos em torno de cada
resduo. Um escore menor do que -5,0 para um resduo significa contatos atmicos ruins ou
13
http://swift.cmbi.ru.nl/servers/html/index.html
18
2.1.5.3
Verify 3D
O modelo protico pode ser avaliado tambm quanto qualidade dos ambientes
qumicos, determinando o nvel de confiabilidade do enovelamento protico do modelo
virtual. O Verify 3D pode realizar essa tarefa, determinando os ambientes qumicos de cada
resduo do modelo e atribuindo scores com referncia a uma matriz construda a partir de
uma anlise estatstica envolvendo estruturas de protenas armazenadas no PDB. Essa
ferramenta de validao est disponvel para utilizao on-line no endereo do Laboratory for
Structural Genomics and Proteomics, University of Califrnia14.
Vrias outras metodologias capazes de estimar a qualidade da estrutura terciria
dos modelos de protenas tm sido testadas, como clculos de energia livre de solvatao ou
mtodos estatsticos (SAUDER et al., 2000).
15
http://nihserver.mbi.ucla.edu/Verify_3D/
http://doc.accelrys.com/doc/life/dstudio/dsv20/
16
http://pymol.sourceforge.net/
17
http://www.cgl.ucsf.edu/chimera/
15
19
Figura 4 - Esquema geral do mtodo terico da modelagem por homologia, baseado em MART-RENOM
et al., 2000.
18
http://www.python.org/
http://salilab.org/modeller/9v3/release.html
20
http://br.mozdev.org/
21
http://www.apache.org/
22
http://www.php.net
23
http://www.mysql.org
19
21
Figura 5 - Arquitetura do sistema. O usurio faz uma requisio ao servidor, o servidor web recebe essa
requisio e interagindo com scripts php gera resultados que retornaro ao usurio atravs de um
navegador web.
2.4 IMPLEMENTAO
Durante a etapa de implementao, o projeto do software implementado como
um conjunto de unidades de uma linguagem de programao. Esta etapa baseia-se totalmente
no uso de ferramentas e ambientes de apoio programao, como por exemplo, compiladores,
depuradores de cdigo e editores sintticos (PRESSMAN, 1991).
2.4.1 Plataforma
A plataforma utilizada no desenvolvimento um servidor, Hp ProLiant ML150
Pentium Xeon 3.0 com 2GB de memria e 4 Hard Disk de 70GB. Compe ainda a plataforma
o Servidor Web Apache 2.0, instalado no sistema GNU/Linux Fedora 6.0 onde sero
disponibilizados os resultados. A escolha do Apache se deve ao fato dele ser o mais bem
sucedido servidor web livre.
22
2.4.2.1
PHP
2.4.2.2
JAVASCRIPT
2.4.2.3
HTML
23
2.4.2.4
CSS
Cascading Style Sheet (CSS), que em portugus foi traduzido para Folha de Estilo
em Cascata, um mecanismo simples para marcar e estruturar o contedo do documento
HTML, ou seja, a alterao da apresentao no feita por elementos HTML. A tarefa de
estilizao fica a cargo das CSS, arquivos independentes dos arquivos HTML, nos quais so
declaradas propriedades e valores de estilizao para os elementos do HTML (como
alinhamento, espaamento, cores, fontes, margens, backgrounds, etc). Facilitam o
desenvolvimento de pginas Web, pois padronizam o estilo e tornam o cdigo mais limpo.
24
http://www.fabforce.net/dbdesigner4/
24
3 RESULTADOS E DISCUSSES
3.1 MODELAGEM DAS PROTENAS
A motivao para a escolha das protenas e suas respectivas seqncias primrias
se deu importncia das protenas, contidas no veneno das abelhas, para estudos
farmacolgicos. Para a modelagem molecular, inicialmente, foram escolhidas 5 seqncias da
protena melitina, por se tratar do principal composto do veneno. Na primeira e segunda
coluna da tabela 3 pode se observar os cdigos de acesso ao Genbank e as seqncias em
formato fasta das protenas escolhidas para serem modeladas.
Protena-Alvo
Possveis Protenas-Molde
gi
Cdigo PDB
Fasta
Similaridade
Resoluo
Organismo
[]
229389
229230
126956
126955
69552
GIGAVLKVLTTGLPALISWISRKKRQQ
GIGAVLKVLTTGLPALISWIKRKRQQ
GIGAILKVLATGLPTLISWIKNKRKQ
GIGAILKVLSTGLPALISWIKRKRQE
GIGAVLKVLTTGLPALISWISRKKRQQ
2mlt(A,B)
92%
2.00
1bh1(A)
92%
RMN
2mlt(A,B)
100%
2.00
1bh1(A)
100%
RMN
2mlt(A,B)
88%
2.00
1bh1(A)
88%
RMN
2mlt(A,B)
100%
2.00
1bh1(A)
100%
RMN
2mlt(A,B)
92%
2.00
1bh1(A)
92%
RMN
Apis Mellifera
Apis Mellifera
Apis flrea
Apis dorsata
Apis mellifera
Para todas as protenas alvo, foram encontrados trs possveis moldes. A estrutura
2MLT, cadeia A e cadeia B, e a estrutura 1BH1, cadeia A. As trs possveis estruturas moldes
25
25
http://www.mbio.ncsu.edu/BioEdit/page2.html
26
3.1.4.1
Seqncia-alvo: gi 229389
Figura 11 - Grfico de Ramachandran da seqncia de gi 229389, gerado pelo software Procheck, onde
so correlacionados os ngulos torcionais da cadeia principal, Phi e Psi, para cada resduo. As regies de
classificao esto divididas por cores distintas.
29
Figura 12 - Representao dos grficos de cinco propriedades estruturais da cadeia principal. Os valores
do modelo gerado so marcados por quadrados. As bandas escuras em cada grfico representam os
resultados das estruturas resolvidas conhecidas, e a linha central representa uma mdia dos valores em
funo da resoluo. As linhas das extremidades representam o desvio em relao mdia.
Tabela 4 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural gerado para
o alvo gi 229389 e o ndice total do modelo.
1 GLY ( 1) : -0.532
2 ILE ( 2) : 0.881
3 GLY ( 3) : 1.911
4 ALA ( 4) : 1.399
5 VAL ( 5) : 1.605
6 LEU ( 6) : 1.855
7 LYS ( 7) : 2.009
8 VAL ( 8) : -0.381
9 LEU ( 9) : -0.854
Nem sempre um valor abaixo de cinco significa que o resduo esteja incorreto. O
resduo 27 do modelo gerado, apresentou um valor abaixo de -5,0, que pode ser observado na
Figura 13. Mas resduos pequenos realizam menos contatos que resduos grandes, assim seus
ndices tendem a serem menores, mesmo quando empacotados corretamente. Da mesma
forma, resduos encontrados na superfcie das protenas, realizam menos contatos, quando
comparados com resduos encontrados no interior das protenas, por esse motivo, tambm
apresentam ndices menores (SILVA, 2007).
Figura 13 - Modelo para seqncia de gi 229389. Em amarelo, est a localizao do resduo com baixa
qualidade de contato.
31
32
Figura 15 - Grfico de Ramachandran da seqncia de gi 229230, gerado pelo software Procheck, onde
so correlacionados os ngulos torcionais da cadeia principal, Phi e Psi, para cada resduo. As regies de
classificao esto divididas por cores distintas.
33
Figura 16 Representao dos grficos de cinco propriedades estruturais da cadeia principal. Os valores
do modelo gerado so marcados por quadrados. As bandas escuras em cada grfico representam os
resultados das estruturas resolvidas conhecidas, e a linha central representa uma mdia dos valores em
funo da resoluo. As linhas das extremidades representam o desvio em relao mdia.
Tabela 5 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural gerado para
o alvo gi 229230 e o ndice total do modelo.
1 GLY ( 1) : 0.007
2 ILE ( 2) : 1.260
3 GLY ( 3) : 1.738
4 ALA ( 4) : 1.084
5 VAL ( 5) : 1.301
6 LEU ( 6) : 1.808
7 LYS ( 7) : 1.230
8 VAL ( 8) : -1.069
9 LEU ( 9) : -1.016
34
Figura 17 - Modelo para seqncia de gi 229230. Em amarelo, esto localizados os resduos com baixa
qualidade de contato.
3.1.4.3
Seqncia-alvo: gi 126956
35
qualidade para contatos atmicos seria um valor maior que -1,0. Para o modelo analisado, o
ndice total -0.036, que est acima do valor mdio para uma boa qualidade (-0,5).
O modelo gerado pode ser observado na Figura 21, onde se encontra destacado em
amarelo, um resduo que possui um valor menor que -5,0 para o ndice da qualidade de
contato.
Figura 19 - Grfico de Ramachandran da seqncia de gi 126956, gerado pelo software Procheck, onde
so correlacionados os ngulos torcionais da cadeia principal, Phi e Psi, para cada resduo. As regies de
classificao esto divididas por cores distintas.
36
Figura 20 - Representao dos grficos de cinco propriedades estruturais da cadeia principal. Os valores
do modelo gerado so marcados por quadrados. As bandas escuras em cada grfico representam os
resultados das estruturas resolvidas conhecidas, e a linha central representa uma mdia dos valores em
funo da resoluo. As linhas das extremidades representam o desvio em relao mdia.
Tabela 6 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural gerado para
o alvo gi 126956 e o ndice total do modelo.
1 GLY ( 1) : 0.436
2 ILE ( 2) : 0.927
3 GLY ( 3) : 2.013
4 ALA ( 4) : 1.541
5 ILE ( 5) : 1.832
6 LEU ( 6) : 1.720
7 LYS ( 7) : 2.243
8 VAL ( 8) : -0.752
9 LEU ( 9) : -0.646
37
Figura 21 - Modelo para seqncia de gi 126956. Em amarelo, est localizado o resduo com baixa
qualidade de contato.
3.1.4.4
Seqncia-alvo: gi 126955
38
Figura 23 - Grfico de Ramachandran da seqncia de gi 126955, gerado pelo software Procheck, onde
so correlacionados os ngulos torcionais da cadeia principal, Phi e Psi, para cada resduo. As regies de
classificao esto divididas por cores distintas.
39
Figura 24 - Representao dos grficos de cinco propriedades estruturais da cadeia principal. Os valores
do modelo gerado so marcados por quadrados. As bandas escuras em cada grfico representam os
resultados das estruturas resolvidas conhecidas, e a linha central representa uma mdia dos valores em
funo da resoluo. As linhas das extremidades representam o desvio em relao mdia.
Tabela 7 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural gerado para
o alvo gi 126955 e o ndice total do modelo.
1 GLY ( 1) : 0.309
2 ILE ( 2) : 1.004
3 GLY ( 3) : 1.696
4 ALA ( 4) : 1.459
5 ILE ( 5) : 0.328
6 LEU ( 6) : 1.178
7 LYS ( 7) : 1.800
8 VAL ( 8) : -0.439
9 LEU ( 9) : -1.648
40
Figura 25 - Modelo para seqncia de gi 126955. Em amarelo, est localizado o resduo com baixa
qualidade de contato.
3.1.4.5
Seqncia-alvo: gi 69552
41
Figura 27 - Grfico de Ramachandran da seqncia de gi 69552, gerado pelo software Procheck, onde so
correlacionados os ngulos torcionais da cadeia principal, Phi e Psi, para cada resduo. As regies de
classificao esto divididas por cores distintas.
42
Figura 28 - Representao dos grficos de cinco propriedades estruturais da cadeia principal. Os valores
do modelo gerado so marcados por quadrados. As bandas escuras em cada grfico representam os
resultados das estruturas resolvidas conhecidas, e a linha central representa uma mdia dos valores em
funo da resoluo. As linhas das extremidades representam o desvio em relao mdia.
Tabela 8 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural gerado para
o alvo gi 69552 e o ndice total do modelo.
1 GLY ( 1) : -0.581
2 ILE ( 2) : 1.275
3 GLY ( 3) : 2.007
4 ALA ( 4) : 1.271
5 VAL ( 5) : 1.744
6 LEU ( 6) : 1.894
7 LYS ( 7) : 2.408
8 VAL ( 8) : -0.537
9 LEU ( 9) : -1.265
43
Figura 29 - Modelo para seqncia de gi 69552. Em amarelo, esto representados os resduos com baixa
qualidade de contato.
44
Descrio
Seqncia
Estrutura_PDB
Estrutura_Modelada
Para que se possa apresentar uma variedade de resultados, ser necessrio fazer
vrios tipos de consultas relacionais no banco de dados, para isso sero utilizados scripts em
PHP, como dito anteriormente. A variedade de resultados est relacionada com os atributos
contidos em cada tabela do BDModel. Como por exemplo, na tabela Seqncia, temos os
seguintes atributos:
- idsequencia: identificador da seqncia primria das protenas no DBMoldel;
- gi: identificador da seqncia no GenBank;
- ref: cabealho da seqncia, quando ela est em formato fasta;
- fasta: seqncia primria da protena no formato fasta, menos o cabealho;
- definicao: definio que a seqncia primria da protena possui no GenBank;
- autor: pessoa que publicou a seqncia primria da protena no GenBank.
- tipo: classificao da protena segundo as toxinas selecionadas, como por exemplo,
Melitina, Fosfolipase A2, Apamina, Secapina, Hyaluronidase, Peptdeo Degranulador de
Mastcitos, Fosfatase cida, Veneno Protease e Tertiapina (ver Tabela 2);
- nro_amino: nmero de aminocidos que formam a seqncia primria da protena;
- organismo: classificao taxonmica do organismo;
- referencia: campo onde armazenado, o ttulo da primeira publicao sobre a
seqncia, juntamente com o peridico que foi publicado.
Segue na Tabela 10, as tabelas (entidades) contidas no BDModel, com seus
respectivos atributos e suas descries.
46
Tabela 10 - Descrio dos atributos das entidades do Diagrama Entidade - Relacionamento do sistema em
desenvolvimento
Entidade
Atributo
Seqncia
Estrutura_PDB
Estrutura_Modelada
47
3.3.1.1
A interface home a tela inicial do sistema, e pode ser visualizada na Figura 32.
Nela h uma breve introduo do projeto que foi desenvolvido com as modelagens. Apresenta
layout definido em blocos constituindo o topo, menu horizontal, colunas e base.
No topo so apresentados o logotipo e o nome do sistema. O menu horizontal
exibido abaixo do topo da interface, contendo links direcionados para a prpria pgina (link
Home), para busca de informaes contidas no sistema (link Seqncias), e para sugestes e
informaes de contato do laboratrio e responsveis pela manuteno do sistema (link Fale
Conosco).
H trs colunas na tela inicial, sendo que a primeira contm um menu vertical e
imagens ilustrativas dinmicas, a segunda exibe o contedo acessado e a terceira exibe uma
caixa para pesquisa na rede e links para as instituies vinculadas ao projeto.
No menu vertical esto listados os links Home, Pesquisa, Seqncias, Ajuda,
Contato, Fale Conosco, Links, que redirecionam para pginas de contedo informativo,
buscas no banco de dados e links para pginas de temtica relacionada ao sistema. Os crditos
do desenvolvedor do sistema esto na base da pgina.
26
27
http:// www.mozillafirefox.com/
http://www.microsoft.com/
48
Figura 32 - Tela inicial do sistema BDModel. Em A) menu vertical contendo links para busca de
informaes, ajuda na utilizao do sistema, contato, fale conosco (atravs de mensagens) e links
relacionados com o projeto; B) menu Horizontal contendo links para busca de informaes e fale conosco;
C) caixa para pesquisa na rede (internet); D) links para as entidades relacionadas com o projeto.
3.3.1.2
49
Figura 33 Tela inicial de pesquisa. O usurio deve optar por seqncia primria ou estrutura 3D.
Se a opo escolhida for seqncia primria, uma tela com os atributos referentes a
seqncias primrias so mostrados. Esses campos de pesquisa, inicialmente, esto
desabilitados. O usurio pode escolher pesquisar apenas por um atributo, ou fazer uma busca
utilizando vrios atributos. Como mostra a Figura 34, possvel buscar uma seqncia
primria habilitando apenas 2 campos, tipo da protena e nmero de aminocidos. Essa busca
ir varrer o banco de dados do sistema, e exibir todas as seqncias primrias de melitinas que
possuem em sua cadeia 27 aminocidos.
De forma anloga, o mesmo acontece para busca por estruturas 3D. Na Figura 35,
ocorre uma busca especfica por estrutura 3D. Atravs do cdigo PDB da estrutura possvel
realizar a pesquisa no sistema.
50
Figura 35 - Pesquisa de estruturas 3D. Os campos so os atributos referentes a uma estrutura 3D. Esses
campos inicialmente esto desabilitados, e quando habilitados podem realizar buscas especficas.
51
Figura 36 Tela Seqncia. Quando o usurio deseja exibir todas as informaes referentes a seqncias
primrias, ele apenas deve escolher o tipo da protena que est buscando.
No caso, se for escolhida o tipo Melitina, uma tela contendo todas as informaes
de todas as seqncias primrias de melitina so retornadas. Representado pela Figura 37,
encontra-se uma parte da exibio do tipo melitina.
Quando uma protena possui estrutura terciria (experimentalmente resolvida ou
modelada durante o projeto) estar indicado no resultado, um link para as informaes da
estrutura 3D dessa protena. Na Figura 37, pode-se observar que a primeira seqncia
retornada possui estrutura 3D. Quando usurio acessar este link, outra tela de exibio se
abrir para apresentar os dados referentes quela estrutura, como representado na Figura 38.
52
Figura 37 Exibio das informaes de seqncias de melitinas. Quando uma protena possuir estrutura
3D, haver um link, que quando acessado disponibilizar as informaes sobre a estrutura.
28
http://jmol.sourceforge.net/
53
Figura 38 Informaes sobre estrutura 3D. Alm dessas informaes o usurio pode realizar o download
da estrutura, em formato fasta, e tambm interagir com a estrutura atravs de um plugin do JMol.
Figura 39 Representao da estrutura de cdigo PDB 1bh1, utilizando um plugin do JMol. O usurio
pode interagir com a estrutura de diversas maneiras, dependendo da informao que busca.
54
55
4 CONCLUSES
Mesmo com o grande nmero de depsitos, de novas resolues de estruturas
proticas, que esto ocorrendo atualmente, o nmero total de estruturas conhecidas bem
inferior ao nmero de seqenciamentos que foram realizados e armazenados em bancos de
dados. Para tentar equilibrar esses nmeros, a modelagem molecular computacional vem
sendo utilizada, e por apresentar os melhores resultados, a modelagem comparativa, tambm
conhecida por modelagem por homologia, vem sendo aplicada cada vez mais, na predio de
estruturas proticas de possveis frmacos.
Embora este mtodo terico seja limitado devido dependncia por estruturas
resolvidas, a modelagem por homologia foi aplicada neste trabalho e apresentou dados
satisfatrios e a validao dos modelos apresentou bons resultados. Os modelos obtidos no
projeto e apresentados aqui podem ser aplicados em estudos de mecanismos catalticos e
tambm no desenho racional de frmacos baseados em estruturas.
Bancos de dados biolgicos so de extrema importncia para o armazenamento e
gerenciamento das mais diversas informaes provindas das pesquisas atuais. Seja com
genomas, proteomas, resoluo de estruturas, eles so o ponto central para que as informaes
sejam propagadas. Todas as informaes coletadas durante o projeto, juntamente com os
melhores modelos gerados esto armazenados no sistema BDModel. Este sistema, que
tambm apresentado aqui, foi um dos objetivos do projeto.
O sistema BDModel centraliza informaes de estruturas proticas que compem
o veneno das Apis mellifera, armazenando seqncias primrias, estruturas 3D e modelos 3D
gerados durante o projeto. Encontram-se armazenados no banco de dados do sistema, 95
seqncias primrias contendo suas informaes principais, relacionadas com 9 estruturas 3D
com suas principais informaes. Tambm faz parte do banco de dados os 5 melhores
modelos gerados para as seqncias-alvo, com algumas informaes, como por exemplo, os
arquivos de validao.
Disponvel
na
Internet
atravs
do
endereo
eletrnico
57
REFERNCIAS BIBLIOGRFICAS
ALTSCHUL, S. F.; GISH, W.; MILLER, W.; MEYERS, E. W.; LIPMAN, D.J. Basic
local alignment search tool. Journal of Molecular Biology. v. 215, p. 403-410, 1990.
ANDERSON, A.C. The Process of Structure-Based Drug Design. Chemistry &
Biology. 10, 787-797, 2003.
BENNER, S. A.; CANNAROZZI, G.; GERLOFF, D.; TURCOTTE, M.;
CHEVANAYAGAM, G. Chemical Reviews. p. 2725-2844, 1997.
BERMAN, H. M.; WESTBROOK, J.; FENG, G.; GILLILAND, G.; BHAT, T.N.;
WEISSIG, H.; SHINDYALOV, I. N.; BOURNE, P. E. The Protein Data Bank. Nucleic Acids
Res. V. 28, p. 235-242, 2000.
BROADMAN, J. Bee Venom - The Natural Curative for Arthritis and Rheumatism.
New York: Putnam and Sons. p.224, 1962.
CHANG,Y.H. & BLIVEN,M.L. Anti-arthritic effect of bee venom, Agents Actions,
9: 205-11. 1979.
COSTA NETO, E. M.; PACHECO, J. M. Utilizao medicinal de insetos no povoado
de Pedra Branca, Santa Terezinha, Bahia, Brasil. Biotemas. v.18, p. 113 - 133, 2005.
DALFONSO, G.; TRAMONTANO, A.; LAHM, A. Structural conservation in singledomain proteins: implications for homology modeling. Journal of Structural Biology. v.
134, p. 246-256, 2001.
DAVILA, M.; MARCHINI L. C., Polinizao realizada por abelhas em culturas de
importncia econmica no Brasil. Boletim da Indstria animal. Nova Odessa, v.62, n.1,
p.79-90, 2005.
DEANE, C. M.; BLUNDELL, T. L. Protein comparative modelling and drug
discovery. In WERMUTH, C. G. The Practice of Medicinal Chemistry. London, Elsevier
Academic Press, 2003.
58
59
L.
T.,
2004,
Modelagem
Estrutural
da
PHA
Sintase
de
60
SWISS-MODEL: an
61
crossover
study
of
bee
sting
therapy
for
multiple
sclerosis
62