Sei sulla pagina 1di 72

Universidade de So Paulo

Faculdade de Filosofia, Cincias e Letras de Ribeiro Preto


Faculdade de Medicina de Ribeiro Preto
Informtica Biomdica

Modelagem por Homologia de Estruturas Proticas do


Veneno de Apis mellifera

Mariana Laureano de Souza

Ribeiro Preto
2008

Universidade de So Paulo
Faculdade de Filosofia, Cincias e Letras de Ribeiro Preto
Faculdade de Medicina de Ribeiro Preto
Departamento de Gentica
Informtica Biomdica

Modelagem por Homologia de Estruturas Proticas do Veneno de


Apis mellifera

Mariana Laureano de Souza


Orientadora: Profa. Dra. Silvana Giuliatti
Co-Orientador: Msc. Daniel Macedo de Melo Jorge

Monografia apresentada Faculdade de Filosofia,


Cincias e Letras de Ribeiro Preto e Faculdade de
Medicina de Ribeiro Preto, para obteno do ttulo de
Bacharel em Informtica Biomdica.

Ribeiro Preto
2008

AGRADECIMENTOS
Agradeo as pessoas que mais amo nesse mundo: meus pais, grandes responsveis por eu
estar aqui hoje, e meus irmos. Obrigada por terem tido pacincia nas minhas horas instveis,
me dado carinho nas horas que precisava e puxes de orelha nas horas necessrias.
Agradeo minha av e madrinha, que sempre estar presente, por tudo que ela me ensinou.
minha famlia por todo o apoio e incentivo.
Ao Vitor, por sempre estar ao meu lado.
Agradeo aos amigos com quem pude contar nas horas boas e ruins. Ao pessoal do GBi, pelos
momentos que convivemos juntos, pelas risadas e ensinamentos.
minha orientadora Profa. Silvana e meu co-orientador Daniel. Obrigada pela orientao e
amizade.
Enfim, agradeo a Deus por ter colocado no meu caminho essas pessoas to especiais, com
quem aprendi e ainda aprendo muito sobre a vida. Obrigada por tudo.

RESUMO
As abelhas existem no planeta h mais de 50 milhes de anos. Apesar de terem evoludo
dentro das famlias de insetos, como as formigas, cupins e as vespas, aparentemente no
modificaram suas atividades e funes em prol da manuteno e preservao do planeta. Seu
ferro conduz o veneno que a sua nica arma de defesa contra seus inimigos e que, em
grandes quantidades, fatal ao homem. O veneno da abelha composto por vrias
substncias qumicas como peptdeos, enzimas, aminas biognicas e outras molculas, que
apresentam atividades farmacolgicas e alrgicas. A Apis mellifera, popularmente conhecida
como abelha africanizada ou abelha do mel, a mais agressiva, enxameia vrias vezes ao ano
e utiliza uma grande variedade de locais para nidificar. Esse comportamento aumenta o
contato direto entre o inseto e a populao, aumentando o nmero de acidentes. Reaes
alrgicas s picadas de abelhas so comuns e, mesmo que raramente, podem levar morte. A
possibilidade de usar essas substncias, compostas de protenas, contidas no veneno das
abelhas de grande importncia para a sade pblica e indstrias de frmacos. As protenas
so compostos orgnicos, formados pela ligao de aminocidos, que possuem funes
especficas dentro do organismo, estando ligadas a determinadas atividades, como o caso
das enzimas, hormnios e anticorpos. Uma seqncia de aminocidos ao se enovelar resulta
em estruturas tridimensionais. A estrutura terciria est intimamente relacionada funo das
molculas e, portanto, sua determinao parte fundamental no estudo das protenas. Essas
estruturas podem ser obtidas por mtodos experimentais como cristalografia de raios-X e
espectroscopia de ressonncia magntica nuclear (RMN), mas esses mtodos despendem
muito tempo e recursos financeiros, alm de que muitas estruturas so difceis ou at mesmo
impossveis de serem determinadas por esses mtodos. Surge assim a proposta da modelagem
molecular comparativa ou por homologia. O presente projeto prope estudar as estruturas
tercirias das protenas de veneno de Apis mellifera atravs de modelagem por homologia e o
desenvolvimento de uma base de dados e interface web para a integrao entre dos dados
obtidos e disponibilizao dos resultados ao usurio.

Palavras-chave: Apis mellifera. Veneno. Modelagem de Protenas.

LISTA DE FIGURAS
Figura 1 - Modelagem Molecular por Satisfao de Restries Espaciais. (1) Alinhamento
entre as seqncia-alvo e a molde (que possui estrutura); (2) Extrao de restries
espaciais; (3) Satisfao das restries espaciais. ............................................................16
Figura 2 - Estrutura protica e seus trs ngulos principais, omega (), phi () e psi ().
Como o ngulo fixo os ngulos e so os responsveis por toda a variao
conformacional da cadeia principal, pois tornam a cadeia polipeptdica flexvel............17
Figura 3 - Grfico de Ramachandran gerado pelo Procheck. As regies representadas em
vermelho, so as mais favorveis, as representadas em amarelo, so as favorveis, as
representadas em bege, so as menos favorveis e as regies brancas, so as
desfavorveis. ...................................................................................................................18
Figura 4 - Esquema geral do mtodo terico da modelagem por homologia, baseado em
MART-RENOM et al., 2000. ........................................................................................20
Figura 5 - Arquitetura do sistema. O usurio faz uma requisio ao servidor, o servidor web
recebe essa requisio e interagindo com scripts php gera resultados que retornaro ao
usurio atravs de um navegador web..............................................................................22
Figura 6 - Alinhamento global entre seqncia-alvo (gi 229389) e seqncias-molde. ..........26
Figura 7 - Alinhamento global entre seqncia-alvo (gi 229230) e seqncias-molde. ..........26
Figura 8 - Alinhamento global entre seqncia-alvo (gi 126956) e seqncias-molde. ..........26
Figura 9 - Alinhamento global entre seqncia-alvo (gi 69552) e seqncias-molde. ............27
Figura 10 - Alinhamento global entre seqncia-alvo (gi 126955) e seqncias-molde. ........27
Figura 11 - Grfico de Ramachandran da seqncia de gi 229389, gerado pelo software
Procheck, onde so correlacionados os ngulos torcionais da cadeia principal, Phi e Psi,
para cada resduo. As regies de classificao esto divididas por cores distintas. .........29
Figura 12 - Representao dos grficos de cinco propriedades estruturais da cadeia principal.
Os valores do modelo gerado so marcados por quadrados. As bandas escuras em cada
grfico representam os resultados das estruturas resolvidas conhecidas, e a linha central
representa uma mdia dos valores em funo da resoluo. As linhas das extremidades
representam o desvio em relao mdia. .......................................................................30
Figura 13 - Modelo para seqncia de gi 229389. Em amarelo, est a localizao do resduo
com baixa qualidade de contato........................................................................................31
Figura 14 - Representao do perfil 3D do modelo de gi 229389. So desconsiderados os 11
resduos das extremidades. ...............................................................................................32

Figura 15 - Grfico de Ramachandran da seqncia de gi 229230, gerado pelo software


Procheck, onde so correlacionados os ngulos torcionais da cadeia principal, Phi e Psi,
para cada resduo. As regies de classificao esto divididas por cores distintas. .........33
Figura 16 Representao dos grficos de cinco propriedades estruturais da cadeia principal.
Os valores do modelo gerado so marcados por quadrados. As bandas escuras em cada
grfico representam os resultados das estruturas resolvidas conhecidas, e a linha central
representa uma mdia dos valores em funo da resoluo. As linhas das extremidades
representam o desvio em relao mdia. .......................................................................34
Figura 17 - Modelo para seqncia de gi 229230. Em amarelo, esto localizados os resduos
com baixa qualidade de contato........................................................................................35
Figura 18 - Representao do perfil 3D do modelo de gi 229230. So desconsiderados os 11
resduos das extremidades. ...............................................................................................35
Figura 19 - Grfico de Ramachandran da seqncia de gi 126956, gerado pelo software
Procheck, onde so correlacionados os ngulos torcionais da cadeia principal, Phi e Psi,
para cada resduo. As regies de classificao esto divididas por cores distintas. .........36
Figura 20 - Representao dos grficos de cinco propriedades estruturais da cadeia principal.
Os valores do modelo gerado so marcados por quadrados. As bandas escuras em cada
grfico representam os resultados das estruturas resolvidas conhecidas, e a linha central
representa uma mdia dos valores em funo da resoluo. As linhas das extremidades
representam o desvio em relao mdia. .......................................................................37
Figura 21 - Modelo para seqncia de gi 126956. Em amarelo, est localizado o resduo com
baixa qualidade de contato. ..............................................................................................38
Figura 22 - Representao do perfil 3D do modelo de gi 126956 desconsiderados os 11
resduos das extremidades. ...............................................................................................38
Figura 23 - Grfico de Ramachandran da seqncia de gi 126955, gerado pelo software
Procheck, onde so correlacionados os ngulos torcionais da cadeia principal, Phi e Psi,
para cada resduo. As regies de classificao esto divididas por cores distintas. .........39
Figura 24 - Representao dos grficos de cinco propriedades estruturais da cadeia principal.
Os valores do modelo gerado so marcados por quadrados. As bandas escuras em cada
grfico representam os resultados das estruturas resolvidas conhecidas, e a linha central
representa uma mdia dos valores em funo da resoluo. As linhas das extremidades
representam o desvio em relao mdia. .......................................................................40
Figura 25 - Modelo para seqncia de gi 126955. Em amarelo, est localizado o resduo com
baixa qualidade de contato. ..............................................................................................41
Figura 26 - Representao do perfil 3D do modelo de gi 126955 desconsiderados os 11
resduos das extremidades. ...............................................................................................41
Figura 27 - Grfico de Ramachandran da seqncia de gi 69552, gerado pelo software
Procheck, onde so correlacionados os ngulos torcionais da cadeia principal, Phi e Psi,
para cada resduo. As regies de classificao esto divididas por cores distintas. .........42

Figura 28 - Representao dos grficos de cinco propriedades estruturais da cadeia principal.


Os valores do modelo gerado so marcados por quadrados. As bandas escuras em cada
grfico representam os resultados das estruturas resolvidas conhecidas, e a linha central
representa uma mdia dos valores em funo da resoluo. As linhas das extremidades
representam o desvio em relao mdia. .......................................................................43
Figura 29 - Modelo para seqncia de gi 69552. Em amarelo, esto representados os resduos
com baixa qualidade de contato........................................................................................44
Figura 30 - Representao do perfil 3D do modelo de gi 69552 desconsiderados os 11
resduos das extremidades. ...............................................................................................44
Figura 31 - Diagrama entidade-relacionamento do sistema. ....................................................45
Figura 32 - Tela inicial do sistema BDModel. Em A) menu vertical contendo links para busca
de informaes, ajuda na utilizao do sistema, contato, fale conosco (atravs de
mensagens) e links relacionados com o projeto; B) menu Horizontal contendo links para
busca de informaes e fale conosco; C) caixa para pesquisa na rede (internet); D) links
para as entidades relacionadas com o projeto...................................................................49
Figura 33 Tela inicial de pesquisa. O usurio deve optar por seqncia primria ou estrutura
3D. ....................................................................................................................................50
Figura 34 Pesquisa de seqncias primrias. Os campos so os atributos referentes a uma
seqncia primria. Esses campos inicialmente esto desabilitados, e quando habilitados
podem realizar buscas especficas. ...................................................................................51
Figura 35 - Pesquisa de estruturas 3D. Os campos so os atributos referentes a uma estrutura
3D. Esses campos inicialmente esto desabilitados, e quando habilitados podem realizar
buscas especficas.............................................................................................................51
Figura 36 Tela Seqncia. Quando o usurio deseja exibir todas as informaes referentes a
seqncias primrias, ele apenas deve escolher o tipo da protena que est buscando. ...52
Figura 37 Exibio das informaes de seqncias de melitinas. Quando uma protena
possuir estrutura 3D, haver um link, que quando acessado disponibilizar as
informaes sobre a estrutura. ..........................................................................................53
Figura 38 Informaes sobre estrutura 3D. Alm dessas informaes o usurio pode realizar
o download da estrutura, em formato fasta, e tambm interagir com a estrutura atravs de
um plugin do JMol............................................................................................................54
Figura 39 Representao da estrutura de cdigo PDB 1bh1, utilizando um plugin do JMol.
O usurio pode interagir com a estrutura de diversas maneiras, dependendo da
informao que busca. ......................................................................................................54

LISTA DE TABELAS
Tabela 1 - Algumas ferramentas de bioinformtica e servidores da Internet com seus
respectivos endereos web teis na modelagem por homologia (acessados em maio
2008). *S: Servidor; P: Programa (software). ....................................................................8
Tabela 2 - Levantamento de seqncias no GenBank e de estruturas depositadas no PDB. ...11
Tabela 3 - Relao entre Protenas-alvo e Protenas-molde. ....................................................25
Tabela 4 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural
gerado para o alvo gi 229389 e o ndice total do modelo.................................................31
Tabela 5 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural
gerado para o alvo gi 229230 e o ndice total do modelo.................................................34
Tabela 6 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural
gerado para o alvo gi 126956 e o ndice total do modelo.................................................37
Tabela 7 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural
gerado para o alvo gi 126955 e o ndice total do modelo.................................................40
Tabela 8 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural
gerado para o alvo gi 69552 e o ndice total do modelo...................................................43
Tabela 9 - Descrio das tabelas apresentadas no Diagrama Entidade-Relacionamento do
sistema em desenvolvimento ............................................................................................46
Tabela 10 - Descrio dos atributos das entidades do Diagrama Entidade - Relacionamento do
sistema em desenvolvimento ............................................................................................47

LISTA DE ABREVIATURAS E SIGLAS


3D

Tridimensional

BDModel

Banco de Dados de Modelos de Protenas de veneno de Apis mellifera

BLAST

Basic Local Alignment Search Tool

NCBI

National Center for Biotechnology Information

PDB

Banco de dados de protenas

RMN

Ressonncia Magntica Nuclear

Rx

Raios x

SGBD

Sistema Gerenciador de Banco de Dados

SNC

Sistema Nervoso Central

SNP

Sistema Nervoso Perifrico

SUMRIO
1

INTRODUO..................................................................................................................1
1.1
O GNERO APIS E AS ABELHAS AFRICANIZADAS ........................................1
1.2
COMPOSIO DO VENENO E MECANISMOS FISIOPATOLGICOS............2
1.3
APITOXINA E SUAS APLICAES ......................................................................3
1.4
PROTENAS HOMOLGAS....................................................................................3
1.5
MODELAGEM DE PROTENAS.............................................................................3
2.2.1
Modelagem por Homologia................................................................................4
1.6
JUSTIFICATIVA .......................................................................................................5
1.7
OBJETIVO .................................................................................................................5
1.8
ORGANIZAO DA MONOGRAFIA ....................................................................6
2
MATERIAIS E MTODOS...............................................................................................7
2.1
FERRAMENTAS DE BIOINFORMTICA.............................................................7
2.1.1
Banco de Dados Pblicos para Bioinformtica ..................................................8
2.1.2
Fonte de Protenas Moldes ...............................................................................11
2.1.3
Alinhamento das Seqncias ............................................................................12
2.1.4
Construo dos Modelos ..................................................................................14
2.1.5
Validao dos Modelos ....................................................................................16
2.1.6
Visualizao dos Modelos ................................................................................19
2.2
MODELAGEM DAS PROTENAS POR HOMOLOGIA......................................19
2.3
ARQUITETURA DO SISTEMA.............................................................................21
2.4
IMPLEMENTAO ...............................................................................................22
2.4.1
Plataforma.........................................................................................................22
2.4.2
Linguagem de Programao .............................................................................23
2.4.3
Confeco do Banco de Dados.........................................................................24
3
RESULTADOS E DISCUSSES....................................................................................25
3.1
MODELAGEM DAS PROTENAS ........................................................................25
3.1.1
Busca de seqncias homlogas.......................................................................25
3.1.2
Alinhamento entre seqncias-alvo e molde ....................................................26
3.1.3
Construo dos modelos...................................................................................27
3.1.4
Validao dos modelos.....................................................................................28
3.2
ESTRUTURA DO BANCO DE DADOS................................................................45
3.2.1
DER ..................................................................................................................45
3.2.2
Dicionrio de dados ..........................................................................................45
3.3
DESENVOLVIMENTO DO SISTEMA BDMODEL .............................................47
3.3.1
Interfaces do Sistema........................................................................................48
4
CONCLUSES ................................................................................................................56
REFERNCIAS BIBLIOGRFICAS .....................................................................................58

1 INTRODUO
1.1 O GNERO APIS E AS ABELHAS AFRICANIZADAS
As abelhas so descendentes das vespas e, cerca de 135 milhes de anos,
algumas espcies deixaram de se alimentar de pequenos insetos e passaram a coletar nctar e
plen das flores para a produo do mel. H relatos que constatam a relao entre os homens
e as abelhas pela prtica da apicultura desde a pr-histria (SCHIRMER, 1986).
Entre as espcies produtoras de mel, as do gnero Apis so as mais conhecidas. O
gnero Apis apresenta nove espcies1: Apis mellifera, Apis florea, Apis dorsata, Apis cerana,
Apis korchevniskov, Apis andreniformis, Apis laboriosa, Apis nuluensis e Apis nigrocincta..
Dentre elas, a Apis mellifera sempre despertou interesse devido a sua grande importncia
econmica (DAVILA et al., 2005) e, sobretudo, pelas novas possibilidades de usos de seus
produtos na rea mdica (MAIA, 2002; COSTA NETO & PACHECO, 2005).
Por volta de 1950, a subespcie africana Apis mellifera scutellata foi trazida para o
Brasil pelo Prof. Dr. Warwick Estevam Kerr, um renomado cientista que, posteriormente,
veio a fundar o Departamento de Gentica da Faculdade de Medicina de Ribeiro Preto2, no
intuito de aumentar a produo nacional de mel, pois essas abelhas apresentavam uma alta
produtividade e uma alta capacidade de adaptao. Mas, tambm apresentavam aspectos
negativos, como a grande capacidade de enxamear e o comportamento agressivo.
Por esses motivos, as colmias do apirio experimental contendo as abelhas
africanas, localizado no municpio de Rio Claro SP, eram protegidas por uma tela, para
evitar a fuga das rainhas e, conseqente, disperso da colmia. Por um acidente, essas telas
foram removidas e as abelhas se dispersaram por todo Brasil, onde, ao cruzarem com abelhas
nativas e europias que aqui se encontravam, deram origem as, popularmente, conhecidas
abelhas africanizadas (GONALVES, 1974).
A Apis mellifera, popularmente conhecida como abelha africanizada ou abelha de
mel, manteve as caractersticas das africanas como a agressividade, a ocorrncia de enxames
vrias vezes ao ano e a utilizao de uma grande variedade de locais para nidificar. Esse
comportamento aumenta o contato direto entre o inseto e a populao, aumentando o nmero
de acidentes.

1
2

http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=7459
http://rge.fmrp.usp.br/historico.php

1.2 COMPOSIO

DO

VENENO

MECANISMOS

FISIOPATOLGICOS
Os acidentes causados por picadas de abelhas apresentam manifestaes clnicas
distintas, dependendo da sensibilidade do indivduo ao veneno e do nmero de picadas. O
acidente mais freqente aquele no qual um indivduo no sensibilizado ao veneno
acometido por poucas picadas. A composio dos venenos e a conseqente ao aps a picada
das abelhas melferas vm sendo estudado desde a dcada de 50 (HABERMANN, 1972).
O veneno da abelha composto por uma mistura complexa de substncias
qumicas como peptdeos, enzimas e aminas biognicas, que apresentam atividades
farmacolgicas e alrgicas. Os fatores alergnicos so enzimas como fosfolipases,
hialuronidases, lipases e fosfotases, protenas antignicas que, uma vez inoculadas durante a
ferroada, iniciam respostas imunes responsveis pela hipersensibilidade de alguns indivduos
e pelo incio da reao alrgica. So agentes bloqueadores neuromusculares e possuem
poderosa ao hemoltica, alm de propriedades antiarrtmicas.
A Fosfolipase A2, uma das mais ativas fosfolipases conhecidas, provoca ruptura
dos fosfolipdios da membrana celular com contrao do msculo liso, hipertenso e aumento
da permeabilidade vascular.
A Hialuronidase, mesmo no sendo muito txica, potencia a difuso e os efeitos
nocivos dos outros componentes do veneno das abelhas, sendo conhecida como fator
propagador (FRANA & MEDEIROS, 2003).
A

Melitina

componente

predominante

no

veneno

apresentando,

aproximadamente, 50 % da matria seca. (OWEN & PFAFF, 1995). a toxina mais ativa no
veneno das abelhas causando hemlise. Em ao com a Fosfolipase A2, compromete a
integridade da membrana celular e da membrana mitocondrial, comprometendo, assim a
fosforilao oxidativa e a cadeia respiratria, ocasionando dano tecidual.
A Apamina est presente em apenas 2% da matria seca, tendo a menor
neurotoxina conhecida. Age nos sistemas nervoso central (SNC) e perifrico (SNP),
bloqueando a transmisso de impulsos inibitrios.
O Peptdeo Degranulador de Mastcitos responsvel pela intoxicao
histamnica observada nas fases iniciais do acidente e liberao de mediadores qumicos.
As pequenas molculas de peptdeos como a Secapina e a Tertiapina parecem no
apresentar toxidade em mamferos. Um provvel papel desses peptdeos repelir outros
animais, como artrpodes e insetos.
2

1.3 APITOXINA E SUAS APLICAES


Reaes alrgicas s picadas de abelhas so comuns e, mesmo que raramente,
podem levar morte. Entretanto, pequenas doses do veneno da abelha podem ser utilizadas
como terapia. Ao longo da segunda metade do sculo XX, estudos cientficos comprovaram
as propriedades teraputicas da apitoxina, entre eles no tratamento da artrite (CHANG &
BLIVEN,1979).
Suas propriedades anti-artrticas so historicamente reconhecidas. Sabe-se que
Hipcrates (460 a.C.) empregava ferroadas de abelha em seus procedimentos teraputicos.
Carlos Magno, no sculo VIII, foi tratado com ferroadas de abelha para combater inflamaes
nas juntas (BROADMAN,1962).
No Brasil, o uso da apitoxina como terapia ainda bem limitado, pois h poucos
estudos que resultem na purificao do veneno, de modo que a parte alergnica, no atue no
organismo.

1.4 PROTENAS HOMOLGAS


O mecanismo evolutivo da duplicao de genes, associado s mutaes leva a
divergncias moleculares e, conseqentemente, formao de famlias de protenas
estruturalmente relacionadas, que derivam de um ancestral comum sendo chamadas de
homlogas, que apresentam algumas diferenas nas suas seqncias de aminocidos, mas
possuem alto grau de similaridade estrutural (HOLTJE et al., 2003). Assim, quando se
conhece a estrutura de pelo menos um representante de uma famlia, geralmente possvel
modelar, por homologia, os demais membros.
A conservao da estrutura tridimensional crucial para a manuteno e
desempenho de funes especficas da protena. Assim, por exemplo, se ocorrer uma
mudana randmica de 70% dos aminocidos que constituem uma protena, isso acarretaria
em uma grande mudana conformacional e possvel perda da funo (BENNER et al., 1997).

1.5 MODELAGEM DE PROTENAS


Projetos de genomas esto seqenciando uma grande quantidade de seqncias de
aminocidos, mas para que se possa entender o papel biolgico desempenhado por essas
protenas necessrio que se conhea sua estrutura, pois sabe-se que ela est intimamente
relacionada com sua funo. Embora bases de dados de estruturas de protenas como o
3

Protein Data Bank3 (PBD) estejam crescendo exponencialmente nos ltimos anos, ainda no
h dados estruturais para a maioria das protenas eleitas como atrativos alvos teraputicos
(BERMAN et al., 2000).
Os mtodos experimentais, como Cristalografia de Raios-X e espectroscopia de
Ressonncia Magntica Nuclear (RMN), esto a cada dia determinando novas estruturas
proticas, mas nem sempre possvel devido a limitaes tcnicas, alm de que muitas
estruturas so difceis ou at mesmo impossveis de serem determinadas por esses mtodos.
Estudos demonstram que, aproximadamente, apenas uma em cada vinte protenas, produz
cristais adequados para a resoluo da estrutura 3D (MAGGIO & RAMNARAYAN, 2001).
Isso torna a utilizao da modelagem molecular computacional um grande atrativo.
A Bioinformtica apresenta mtodos para que essas estruturas proticas possam
ser preditas. Os mtodos mais aplicados podem ser divididos em dois (RSSLE, 2004):
- Mtodos Fsicos, que baseiam-se nas interaes entre os tomos e incluem
mtodos de modelagem molecular, como dinmica molecular e minimizao de energia. So
chamados tcnicas de primeiros princpios ou Ab-initio.
- Mtodos Empricos dependem de estruturas de protenas que possuem suas
estruturas determinadas por mtodos experimentais e que esto armazenadas em um banco de
dados, por exemplo, PDB (WESTBROOK et al., 2002). So as tcnicas de modelagem
comparativa.

2.2.1 Modelagem por Homologia


O mtodo mais bem sucedido de predio de estruturas a modelagem por
homologia, tambm conhecida como modelagem comparativa (DEANE & BLUNDELL,
2003).
Na

modelagem

por

homologia,

estruturas

de

protenas

determinadas

experimentalmente so utilizadas como moldes para se predizer a conformao de outra


protena que apresenta similaridade na sua seqncia de aminocidos. A qualidade da nova
estrutura gerada depender do grau de similaridade seqencial entre a protena com estrutura
j determinada (protena-molde) e a protena a qual se deseja modelar (protena-alvo). Essa
abordagem pode ser utilizada na predio funcional, identificao e validao de alvos
teraputicos, bem como na identificao e otimizao de prottipos (HILLISCH et al., 2004).

http://www.rcsb.org/pdb/home/home.do

1.6 JUSTIFICATIVA
O nmero de resoluo de estruturas proticas no acompanha o nmero de
seqenciamento de genomas. Nem todas as seqncias proticas, depositadas em bancos de
dados como o GenBank4, possuem estrutura terciria conhecida. Muitas delas so atrativos
teraputicos, e sabe-se que a estrutura terciria de uma protena e sua interao com outras
molculas esto diretamente relacionadas sua funcionalidade (SNCHEZ & ALI, 1999).
A obteno de estruturas proticas geradas em laboratrios, usando mtodos
prticos, demorada e despende de muitos recursos financeiros. Contudo, o mtodo terico
de modelagem por homologia atravs de modelos computacionais permitiu de maneira
eficiente e mais econmica a descoberta de estruturas tercirias de protenas.
Um grande interesse em estudar estruturas do veneno das abelhas, vem se
tornando cada vez mais comum. Como j comprovado em estudos (WESSELIUS et al.,
2005), a apitoxina (veneno de abelha) utilizada na terapia de diversas doenas, obtendo
timos resultados.
Sendo o veneno da abelha de grande importncia, conhecer as estruturas tercirias
dos componentes proticos do veneno, possibilitaria novos estudos para potencializao
desses efeitos teraputicos e tambm possibilitaria novas aplicaes visando frmacos para
pessoas alrgicas a esses componentes.

1.7 OBJETIVO
Este projeto de concluso de curso teve como objetivo estudar as estruturas
tercirias das protenas de veneno de Apis mellifera atravs de modelagem por homologia. O
projeto tambm previu o desenvolvimento de uma base de dados que armazena as seqncias
primrias das protenas escolhidas, contidas nos venenos das abelhas, as estruturas 3D j
determinadas dessas protenas, e aquelas estruturas de protenas que foram modeladas durante
o desenvolvimento do projeto. Foi desenvolvida uma interface Web para a integrao entre
dos dados obtidos e disponibilizao dos resultados para acesso pblico, para que possam ser
realizadas diversos tipos de buscas no sistema.

http://www.ncbi.nlm.nih.gov/

1.8 ORGANIZAO DA MONOGRAFIA


Esta monografia est organizada da seguinte forma: no captulo 1, h uma breve
introduo dos principais tpicos abordados no projeto, objetivo e justificativa. No captulo 2,
so expostos os materiais e a metodologia utilizados durante o desenvolvimento do projeto, e
descrio das ferramentas utilizadas. No captulo 3, so apresentados os resultados e
discusses. No captulo 4, encontram-se as concluses. Por fim, so listadas as bibliografias
utilizadas.

2 MATERIAIS E MTODOS
2.1 FERRAMENTAS DE BIOINFORMTICA
Com o avano da tecnologia, a bioinformtica, essa recente cincia, tem se
mostrado cada vez mais eficiente na resoluo de problemas, antes complicados de serem
resolvidos por mtodos experimentais. E com essa crescente demanda por resultados rpidos
e menores custos, o desenvolvimento de softwares para essa rea, torna-se cada vez mais
comum. Muitas dessas ferramentas so livres, podendo ser utilizadas por qualquer
pesquisador sem que isso gere custos para ele.
Para cada uma das etapas no processo de modelagem por homologia existe um
grande nmero de mtodos, programas e servidores. Todos que foram utilizados durante o
projeto so livres, e disponveis na rede mundial de computadores (Internet).
Na tabela 1, encontram-se as ferramentas de bioinformtica que foram utilizadas
durante o projeto. Elas esto divididas em programas que realizam determinadas tarefas,
como por exemplo, o Modeller5 responsvel por gerar estruturas 3D, e servidores que
disponibilizam informaes, fornecendo dados e servios para a Internet, compartilhando seus
recursos, como por exemplo, o BLAST6. Essas ferramentas sero discutidas a seguir.

5
6

http://salilab.org/modeller/
www.ncbi.nlm.nih.gov/BLAST/

Tabela 1 - Algumas ferramentas de bioinformtica e servidores da Internet com seus respectivos


endereos web teis na modelagem por homologia (acessados em maio 2008). *S: Servidor; P: Programa
(software).

TIPO*

ENDEREO NA Internet

GenBank

www.ncbi.nlm.nih.gov/GenBank

PDB

www.rcsb.org/pdb/

Fontes de protenas molde

BLAST

www.ncbi.nlm.nih.gov/BLAST/

PDB

www.rcsb.org/pdb/

HHpred

http://toolkit.tuebingen.mpg.de/hhpred

BLASTP

www.ncbi.nlm.nih.gov/BLAST/

CLUSTALW

www.ebi.ac.uk/clustalw/

MODELLER

http://salilab.org/modeller/modeller.html

MODWEB

http://salilab.org/modweb

SWISS-MODEL

www.expasy.org/swissmod/SWISS-MODEL.html

PROCHECK

www.biochem.ucl.ac.uk/~roman/procheck/procheck.html

WHATIF

http://swift.cmbi.ru.nl/servers/html/oldqua.html

VERIFY3D

http://nihserver.mbi.ucla.edu/Verify_3D/

DS Visualizer

http://accelrys.com/downloads/freeware/

PyMol

http://pymol.sourceforge.net/

Chimera

http://www.cgl.ucsf.edu/chimera/

SwissPdbViewer

Ca.expasy.org/spdbv/

NOME
Bancos de dados

Alinhamento de seqncias

Construo dos modelos

Validao de modelos

Visualizao de modelos

2.1.1 Banco de Dados Pblicos para Bioinformtica


Devido ao crescente nmero de projetos de seqenciamentos surgiram repositrios
mais robustos para abrigar a exploso no nmero de seqncias obtidas pelos pesquisadores.

Principalmente as bases pblicas, tm apresentado crescimentos exponenciais em seus


tamanhos nos ltimos anos.
Um exemplo dessa robustez o International Nucleotide Sequence Database
Collaboration (INSDC), um projeto colaborativo que compartilha informaes de seqncias.
formado pelas bases GenBank (USA), European Molecular Biology Laboratory - EMBL
(Laboratrio Europeu de Biologia Molecular) e DNA Database of Japan DDBJ (Banco de
Dados de DNA, do Japo).
Esses bancos trocam informaes entre si diariamente, de modo que todos os trs
possuem informaes atualizadas de todas as seqncias de DNA e aminocidos depositadas
em todo o mundo. Apesar disso, cada centro apresenta seus dados de forma particular, apesar
de bastante semelhante. Atualmente a maioria das revistas exige que as seqncias
identificadas pelos laboratrios sejam submetidas a um destes bancos antes mesmo da
publicao do artigo (PIEMOLINI, 2004).

2.1.1.1

GenBank

O mais conhecido banco de seqncias primrias o GenBank. Construdo e


administrado pelo National Center for Biotechnology Information NCBI7 (Centro Nacional
de Informaes sobre Biotecnologia, dos Estados Unidos). Inicialmente, seu objetivo era de
abrigar seqncias submetidas diretamente pelos autores de publicaes cientficas. No
entanto, houve uma grande oferta de seqncias, no s de autores como de centros de
pesquisa, que passaram a depositar regularmente seus dados.

2.1.1.2

PDB

O banco de dados de estruturas proticas Protein Data Bank PDB foi


estabelecido no Brookhaven National Laboratories BNL, em 1971, como um repositrio
para estruturas de cristais de biologia macromolecular (WESTBROOK et al., 2000).
Apesar de a primeira estrutura protica ter sido determinada dcadas antes da
primeira seqncia de DNA, o banco de dados de estrutura protica cresceu mais lentamente
nesse nterim do que o banco de dados de seqncias (GIBAS & JAMBECK, 2001).
No PDB possvel encontrar todas as estruturas tercirias de protenas, que j
foram resolvidas. Hoje, esto armazenadas, no apenas estruturas preditas por cristalografia
de Rx, mas tambm estruturas preditas por RMN.
7

http://www.ncbi.nlm.nih.gov/

2.1.1.3

Seqncias Primrias e Estruturas Tercirias encontradas

Aps um levantamento bibliogrfico, foram escolhidas as principais toxinas


encontradas no veneno das abelhas. Entre essas toxinas encontram-se peptdeos, enzimas e
aminas biognicas. Como pode-se observar na Tabela 2, nove diferentes tipos do componente
do veneno foram escolhidos para serem estudados, so eles: Melitina, Fosfolipase A2,
Apamina, Secapina, Hialuronidase, Peptdeo Degranulador de Mastcito, Fosfatase cida,
Veneno de Protease e Tertiapina.
Partindo da escolha dessas toxinas, foi feito um levantamento das seqncias
primrias dessas protenas depositadas no GenBank. Essas seqncias foram obtidas aps a
utilizao de filtros especiais. Na pgina principal do NCBI, no campo Search (busca) foi
escolhida a opo Taxonomy (taxonomia). Foram ento pesquisadas informaes sobre o
gnero Apis. Vrias informaes foram retornadas pelo sistema, mas o link escolhido foi
Protein (Protena). Na data do acesso (06/03/2008) foram retornadas 10.699 seqncias de
protenas depositadas, esse nmero atualmente de 10.758.
Assim, aps o retorno desse primeiro filtro (taxonomia), a busca foi refinada
utilizando um conector lgico and a cada toxina selecionada o tipo de protena
pesquisado, como observado da primeira coluna da Tabela 1, est em ingls, pois o GenBank
um banco internacional - o que limitou o nmero de seqncias que foram obtidas. Na
segunda coluna da Tabela 2 podemos observar que o nmero de seqncias encontradas
diminuiu significativamente, passando para 95 seqncias no total. O maior nmero de
seqncias foi retornado na busca por Acid phosphatase (Fosfatase cida), 21 seqncias
primrias.
As seqncias encontradas que j apresentam estrutura terciria conhecida foram
selecionadas tambm no PDB, para tambm, servirem de moldes para as futuras protenasalvo. Verifica-se na terceira coluna da Tabela 2 que o nmero de estruturas conhecidas
muito pequeno comparado com o nmero de seqncias primrias que foram selecionados.
De 95 seqncias primrias selecionadas apenas 9 possuem estrutura conhecida e armazenada
no PDB. Dessas 8 estruturas, a toxina Hyaluronidase apresentou 4 estruturas tercirias j
obtidas.

10

Tabela 2 - Levantamento de seqncias no GenBank e de estruturas depositadas no PDB.

Toxina Pesquisada

Seqncias Encontradas

Estrutura no PDB

1 Melittin

19

3(1BH1, 2MLTA, 2MLTB)

2 - Phospholipase A2

20

1 (1POC)

3 Apamin

----

4 Secapin

----

5 Hyaluronidase

4 (1FCQ, 1FCU, 1FCV, 2J88)

6 - Mast cell degranulating

----

7 - Acid phosphatase

21

----

8 - Protease venom

----

9 Tertiapin

1 (1TER)

TOTAL

95

2.1.2 Fonte de Protenas Moldes


Como j citado na Figura 1, e ser detalhado a seguir, o primeiro passo para se
modelar uma estrutura protica por homologia identificar protenas que possuam estruturas
tridimensionais resolvidas, que possam atuar como moldes para a protena-alvo. Essa primeira
etapa funciona como uma triagem, pois, a identificao de seqncias-molde, obedece a
critrios, como o grau mnimo de similaridade entre os fragmentos das seqncias. O grau
mnimo de similaridade entre protena-alvo e molde, escolhido para a modelagem durante o
projeto, foi o valor mnimo de 70% de similaridade.
Para a busca dos moldes, alinhamentos locais foram realizados, atravs do BLAST
e tambm do PDB.

2.1.2.1

BLAST

O Basic Local Alignment Search Tool BLAST, foi uma das ferramentas
utilizadas para a busca de estruturas molde. Na escolha da seqncia mais similar com a
seqncia alvo, o BLAST utiliza valores de pontuao (score) e parmetros. Para o clculo de
score, o BLAST alinha a seqncia alvo com as seqncias depositadas nos bancos de
dados e calcula valores obtidos atravs do somatrio das identidades, similaridades, e pelo
somatrio dos valores dos gaps. Quanto maior for este valor, maior similaridade existe

11

entre as seqncias. O BLAST ser detalhado a seguir, quando ser discutido o alinhamento
local entre as seqncias.

2.1.2.2

PDB

O PDB foi o banco de dados de estruturas de protenas que foi utilizado durante o
projeto. Atravs dele tambm possvel realizar buscas por possveis modelos, utilizando a
seqncia primria da protena molde, no formato fasta. Na pgina inicial do PDB, ao lado
do menu Home encontra-se a opo Search. Quando clicado, abre-se um menu de
pesquisa, Search Database. Nesse menu escolhe-se a opo Sequence. Atravs dessa
busca por seqncias moldes, se obtm um alinhamento entre a seqncia alvo e as
seqncias que possuem estruturas depositadas no PDB. Esse alinhamento pode ser realizado,
utilizando o algoritmo do BLAST ou o algoritmo FASTA .

2.1.2.3

HHpred

O HHpred8 um servidor que realiza buscas por protenas homlogas com


estruturas preditas atravs de algoritmos baseados em alinhamentos HMM-HMM.
Alinhamentos que utilizam Hidden Markov Model HMM (Modelos ocultos de Markov)
conseguem tratar de forma probabilstica a variao estrutural de uma seqncia. O HHpred
aceita, tanto uma nica seqncia para consulta, como tambm mltiplas seqncias como
entrada. Dentro de apenas alguns minutos ele retorna os resultados da pesquisa em um
formato fcil de ser interpretado e com dados semelhantes ao do algoritmo PSI-BLAST.
Atravs dos dados de sada do HHpred e do seu servidor possvel, no mesmo momento,
construir um modelo para a estrutura alvo, utilizando o Modeller on line.9

2.1.3 Alinhamento das Seqncias


O alinhamento um processo importante na busca por modelos de qualidade,
gerados por homologia. Pois, no alinhamento de seqncias, identifica-se equivalncia dos
resduos existentes entre as seqncias alvo e molde, tendo por objetivo medir a similaridade
entre elas.
O alinhamento pode ser local ou global. No alinhamento local, apenas algumas
regies de duas seqncias de nucleotdeos ou aminocidos, so alinhadas. Alinham-se
8
9

http://toolkit.tuebingen.mpg.de/hhpred
http://toolkit.tuebingen.mpg.de/modeller

12

somente as regies mais conservadas, independente da localizao relativa de cada regio em


sua seqncia. geralmente usado na procura por seqncias homlogas em banco de dados.
No alinhamento global, o alinhamento de duas ou mais seqncias, de
nucleotdeos ou aminocidos, realizado sobre o comprimento da seqncia por inteiro.
Assim, as seqncias envolvidas devem ser alinhadas de um extremo ao outro. Esse
alinhamento , freqentemente, utilizado para determinar regies mais conservadas de
seqncias homlogas, que apresentam alto grau de similaridade em todo seu comprimento
(MUNIZ, 2003).
O alinhamento pode ser gerado atravs de mais de duas seqncias. Esse tipo de
alinhamento conhecido como alinhamento mltiplo, que considerado mais confivel que o
alinhamento simples, pois um grande grupo de protenas ser alinhado e as regies
semelhantes se destacaro (PROSDOCIMI et al., 2003).
Para o alinhamento das seqncias primrias das protenas foram utilizados o
BLASTP10 e o CLUSTALW11 que so algoritmos de cdigo-fonte aberto (softwares livres). O
alinhamento entre as seqncias, tambm pode ser obtido atravs do Modeller. Que atravs do
comando ALIGN2D, realiza um alinhamento baseado no algoritmo de programao
dinmica, proposto por Needleman e Wunsch para alinhamento global de seqncias
(NEEDLEMAN & WUNSCH, 1970).

2.1.3.1

BLAST

O BLAST um mtodo heurstico que realiza um alinhamento local entre a


seqncia alvo e um banco de dados. Ele composto por vrios algoritmos, que diferem entre
si, de acordo com o tipo de seqncia de entrada (nucleotdeo ou aminocido) e com o tipo de
resultado esperado (ALTSCHUL et al., 1990). Pode ser usado para inferir as relaes
funcionais e evolucionrias entre as seqncias, assim como para ajudar a identificar
membros de uma mesma famlia de genes.
Alguns dos principais algoritmos encontrados no BLAST so:
BLASTP: compara seqncias de aminocidos com o banco de dados de protenas.
Este programa identifica tambm possveis domnios conservados nas protenas analisadas.
BLASTN: compara uma seqncia de DNA como entrada com um banco de dados
de DNA.

10
11

http://www.ncbi.nlm.nih.gov/blast/producttable.shtml#blastp
http://align.genome.jp/

13

BLASTX: compara uma seqncia de nucleotdeos, com um banco de dados de


protenas.
O algoritmo utilizado no projeto, BLASTP, compara as seqncias da protena
alvo (que se deseja modelar) com seqncias de possveis moldes, depositadas no PDB, e
calcula a significncia estatstica dos erros de alinhamento. Ele busca por regies com maior
densidade de resduos idnticos ou similares. Para a escolha dos moldes, apenas as protenas
que apresentaram uma similaridade maior que 70% com a seqncia alvo foram escolhidas.
As seqncias primrias dessas protenas foram salvas no formato fasta, formato de arquivo
utilizado como parmetro de entrada para o CLUSTALW, para que fosse realizado o
alinhamento global.

2.1.3.2

CLUSTAL

O CLUSTAL trata-se de um programa de alinhamento mltiplo de seqncias que,


identifica resduos ou regies conservadas, ou equivalentes em estruturas, para relacionar por
ordem funcional ou estrutural a similaridade entre elas (HIGGINS et al., 1994).
H trs verses do CLUSTAL:
CLUSTAL: Ele atribui pesos iguais a todas as seqncias.
CLUSTALW: Ele atribui pesos diferentes s seqncias fornecendo ao usurio
uma grande quantidade de parmetros e de sadas diferentes. Possui interface grfica onde os
alinhamentos podem ser visualizados de forma agradvel e alterados.
CLUSTALX: Ele proporciona uma interface grfica para o CLUSTALW.
A verso utilizada durante o projeto foi o CLUSTALW. Ele realiza um
alinhamento entre as seqncias alvo e molde, em toda a sua extenso, buscando coincidir o
maior nmero de resduos idnticos ou similares entre elas. Para esse alinhamento, foram
utilizadas as seqncias das protenas, no formato fasta, que foram encontradas durante o
alinhamento local, utilizando o BLAST. No CLUSTALW possvel selecionar o arquivo de
sada. O formato do arquivo de sada escolhido foi o formato pir, que ser utilizado como
parmetro de entrada para o Modeller, durante a construo do modelo.

2.1.4 Construo dos Modelos


A modelagem por homologia um mtodo terico confivel para a obteno de
estruturas de protenas (SNCHEZ et al., 2000). Esse mtodo consiste basicamente de quatro

14

etapas: identificao e seleo de protenas-molde, alinhamento das seqncias, construo


das coordenadas, e validao do modelo. Essas etapas sero detalhadas a seguir.

2.1.4.1

Modeller

O Modeller (ALI e BLUNDELL, 1993) o software mais utilizado atualmente


para a modelagem estrutural de protenas por homologia. Ele utiliza estruturas-molde, para
construir modelos tridimensionais da seqncia-alvo, atravs de um alinhamento. Apesar do
Modeller incorporar ferramentas de alinhamento de seqncias e at mesmo de busca pelo
banco de dados, o ponto inicial para o Modeller um alinhamento seqencial mltiplo entre a
seqncia alvo e as seqncias proticas do modelo (GIBAS e JAMBECK, 2001).A partir do
alinhamento entre alvo e estrutura-molde, gerado um conjunto de restries que so
aplicadas seqncia a ser modelada. O clculo destas restries baseado em anlises
estatsticas entre estruturas de protenas homologas. Estas restries limitam, por exemplo, a
distncia entre dois resduos no modelo, sendo esta restrio baseada na distncia entre dois
resduos equivalentes na estrutura molde. Restries tambm so aplicadas nas ligaes
angulares (entre trs tomos) e nos ngulos diedrais (entre quatro tomos). Alm destas
restries, um campo de fora controla as propriedades estereoqumicas entre os tomos,
aplicando restries qumicas (RSSLE, 2004). Todas as restries qumicas e espaciais
aplicadas ao modelo so combinadas em uma funo, chamada funo objetivo, que
otimizada durante o processo de construo do modelo (FISER & SALI, 2003). Um resumo
da metodologia utilizada pelo Modeller pode ser visualizado na figura 2 (ALI e
BLUNDELL, 1993).

15

Figura 1 - Modelagem Molecular por Satisfao de Restries Espaciais. (1) Alinhamento entre as
seqncia-alvo e a molde (que possui estrutura); (2) Extrao de restries espaciais; (3) Satisfao das
restries espaciais.

2.1.4.2

Swiss-Model

O SWISS-MODEL

12

um servidor, automatizado na Web, de modelagem por

homologia, baseado no Instituto Suo de Bioinformtica. O SWISS-MODEL permite que


voc submeta uma seqncia e receba de volta, automaticamente, uma estrutura (GIBAS e
JAMBECK, 2001). Ele utiliza mtodos de construo de modelos, utilizando corpos rgidos.
O modelo construdo por partes, utilizando as regies estruturalmente conservadas das
protenas homologas. A cadeia principal destas regies pode ser obtida atravs de bancos de
dados de estruturas proticas, e as cadeias laterais podem ser encontradas em bibliotecas de
rotmeros (GUEX & PEITSCH, 1997).

2.1.5 Validao dos Modelos


Aps a construo do modelo, necessrio identificar possveis erros relacionados
escolha das estruturas de referncia, e ao alinhamento entre seqncia-alvo e molde. Caso o
modelo seja caracterizado de m qualidade, todo o processo de modelagem deve ser revisto,
no intuito de se melhorar o alinhamento inicial ou utilizar outros mtodos.
So avaliadas as qualidades dos modelos, principalmente se houver diferentes
orientaes referentes aos resduos do stio ligante nos modelos gerados (SCHAFFERHANS
12

http://swissmodel.expasy.org/SWISS-MODEL.html

16

& KLEBE, 2001). Um grande nmero de propriedades de diferentes graus de organizao


estrutural, como: exatido estereoqumica, qualidade do empacotamento e confiabilidade do
enovelamento, so verificadas durante a etapa de validao (SILVA & SILVA, 2007).
Os softwares que foram utilizados para a validao dos modelos gerados, foram:
Prochek (LASKOWSKI et al., 1993), Whatif (VRIEND & SANDER, 1993) e o Verify3D
(LUTHY et al., 1992). Eles so apresentados a seguir.

2.1.5.1

Procheck

O Prochek avalia diversos parmetros estereoqumicos, de importncia


fundamental, como os comprimentos de ligao, os ngulos planos, a planaridade dos anis de
cadeias laterais, os ngulos torcionais da cadeia principal, gerando o grfico de
Ramachandran (RAMACHANDRAN & SASISEKHARAN, 1968), que muito til, pois,
define os resduos que se encontram nas regies energeticamente mais favorveis e
desfavorveis, alm de orientar a avaliao da qualidade para modelos tericos e
experimentais de protenas.
A estrutura protica possui trs ngulos principais, , e . Como o ngulo
fixo os ngulos e so os responsveis por toda a variao conformacional da cadeia
principal, pois tornam a cadeia polipeptdica flexvel. Observa-se na Figura 3, a estrutura
protica e seus ngulos principais.

Figura 2 - Estrutura protica e seus trs ngulos principais, omega (


), phi () e psi (). Como o ngulo
fixo os ngulos e so os responsveis por toda a variao conformacional da cadeia principal, pois
tornam a cadeia polipeptdica flexvel.

O grfico de Ramachandram uma representao grfica de ngulos versus


ngulos . Para que se garanta uma maior preciso dos modelos gerados, no mnimo 90% dos

17

ngulos e da cadeia principal devem estar na regio mais favorvel do grfico de


Ramachandran (ANDERSON, 2003).
Na Figura 4, observa-se um grfico de Ramachandran. Os pontos quadrados
representam os resduos de aminocidos da protena modelada, as glicinas so representadas
por tringulos. As reas em vermelho compreendem as regies mais favorveis para resduos
se encontrarem, em amarelo as regies favorveis, em bege as regies pouco favorveis e em
branco, as regies desfavorveis. A regio branca desfavorvel para todos os aminocidos,
com exceo da glicina.

Figura 3 - Grfico de Ramachandran gerado pelo Procheck. As regies representadas em vermelho, so as


mais favorveis, as representadas em amarelo, so as favorveis, as representadas em bege, so as menos
favorveis e as regies brancas, so as desfavorveis.

2.1.5.2

Whatif

O Whatif (VRIEND, 1990), avalia a qualidade dos contatos atmicos envolvendo


os tomos de cada resduo. Foi utilizado o mdulo Coarse Packing Quality Control

13

, do

software Whatif, o qual compara a distribuio das posies de tomos em torno de cada
resduo. Um escore menor do que -5,0 para um resduo significa contatos atmicos ruins ou

13

http://swift.cmbi.ru.nl/servers/html/index.html

18

incomuns, mas no implica, necessariamente, em uma estrutura incorreta. Existe a


necessidade, entretanto, de examinar o resduo (VRIEND & SANDER, 1993).

2.1.5.3

Verify 3D

O modelo protico pode ser avaliado tambm quanto qualidade dos ambientes
qumicos, determinando o nvel de confiabilidade do enovelamento protico do modelo
virtual. O Verify 3D pode realizar essa tarefa, determinando os ambientes qumicos de cada
resduo do modelo e atribuindo scores com referncia a uma matriz construda a partir de
uma anlise estatstica envolvendo estruturas de protenas armazenadas no PDB. Essa
ferramenta de validao est disponvel para utilizao on-line no endereo do Laboratory for
Structural Genomics and Proteomics, University of Califrnia14.
Vrias outras metodologias capazes de estimar a qualidade da estrutura terciria
dos modelos de protenas tm sido testadas, como clculos de energia livre de solvatao ou
mtodos estatsticos (SAUDER et al., 2000).

2.1.6 Visualizao dos Modelos


Para realizar a visualizao tridimensional dos modelos gerados a partir da
modelagem, utilizaram-se os softwares que permitem essa visualizao, como o DS
Visualizer

15

, o PyMol16, e o Chimera17, este ltimo, tambm foi utilizado sobrepor as

estruturas obtidas, com suas estruturas-molde, para uma melhor visualizao.

2.2 MODELAGEM DAS PROTENAS POR HOMOLOGIA


A modelagem das protenas pelo mtodo de homologia segue etapas, como pode
se observar na Figura 4. O incio da modelagem por homologia est na identificao de
estruturas 3D de protenas, que possam atuar como base estrutural para a modelagem da
protena-alvo. Nessa primeira etapa, foram realizadas buscas no PDB, atravs do algoritmo
BLASTP. Alguns dos aspectos levados em considerao, durante a escolha dos alvos, foram o
conhecimento estrutural, a similaridade seqencial e a correlao evolutiva entre as protenas
(DEANE & BLUNDELL, 2003).
14

http://nihserver.mbi.ucla.edu/Verify_3D/
http://doc.accelrys.com/doc/life/dstudio/dsv20/
16
http://pymol.sourceforge.net/
17
http://www.cgl.ucsf.edu/chimera/
15

19

Um valor aceitvel, na modelagem por homologia, de similaridade acima de


30% de identidade seqencial entre protena-molde e protena-alvo (SALI, 1998;
DALFONSO et al., 2001; VITKUP et al., 2001). Entretanto, as protenas escolhidas como
molde, apresentaram similaridade maior que 75%.

Figura 4 - Esquema geral do mtodo terico da modelagem por homologia, baseado em MART-RENOM
et al., 2000.

Aps, o alinhamento local realizado pelo BLASTP, as protenas selecionadas


como molde, tiveram suas seqncias alinhadas em toda sua extenso (alinhamento global),
pelo CLUSTALW.
O objetivo desse alinhamento reconhecer regies estruturalmente conservadas e
regies variveis, observando-se os resduos estruturalmente equivalentes na seqncia
primria.
Aps obtido o alinhamento das seqncias, o arquivo de sada gerado pelo
CLUSTALW est no formato pir. Esse arquivo contendo o alinhamento das seqncias,
utilizado como entrada para o Modeller, que atravs das restries espaciais, determina as
coordenadas cartesianas da protena, gerando um modelo3D.
Assim que termina a execuo do Modeller, a estrutura modelada j est pronta para a
validao. O arquivo de sada do Modeller, um arquivo pdb, utilizado como entrada para
os softwares de validao. Quando necessrio, ocorre uma otimizao do modelo, atravs de
20

um script de otimizao, escrito na linguagem Python18, encontrado no prprio Modeller, na


verso Modeller 9 v319, que foi a verso utilizada para gerao dos modelos durante o projeto.
Para que a estrutura seja visualizada necessria a utilizao de softwares que
interpretam os arquivos gerados pdb, como por exemplo, o Chimera, o Pymol e o DS
Visualizer.

2.3 ARQUITETURA DO SISTEMA


A arquitetura de software uma estrutura que serve para o melhor entendimento
de componentes de um sistema e seus inter-relacionamentos (SILVA FILHO, 2002).
No sistema em desenvolvido, a arquitetura utilizada pode ser observada na Figura
6. Essa arquitetura prope que, o usurio, atravs de um navegador tambm conhecido
como Web browser, como por exemplo, o Internet Explorer ou o Mozilla Firefox20, acessa o
sistema atravs de requisies HTTP para o servidor. O servidor Apache21 interage com
scripts desenvolvidos na linguagem de programao PHP22, uma linguagem de programao
muito utilizada na web e em banco de dados. Esses scripts contem comandos para acessar o
banco de dados MySQL23, acessando os dados contidos neste banco.
O modelo proposto baseado na arquitetura cliente-servidor, no qual o servidor
um servidor web, representando o gerenciador de dados, e os usurios sero representados
atravs de clientes que utilizaro navegadores para acessar as informaes.

18

http://www.python.org/
http://salilab.org/modeller/9v3/release.html
20
http://br.mozdev.org/
21
http://www.apache.org/
22
http://www.php.net
23
http://www.mysql.org
19

21

Figura 5 - Arquitetura do sistema. O usurio faz uma requisio ao servidor, o servidor web recebe essa
requisio e interagindo com scripts php gera resultados que retornaro ao usurio atravs de um
navegador web.

2.4 IMPLEMENTAO
Durante a etapa de implementao, o projeto do software implementado como
um conjunto de unidades de uma linguagem de programao. Esta etapa baseia-se totalmente
no uso de ferramentas e ambientes de apoio programao, como por exemplo, compiladores,
depuradores de cdigo e editores sintticos (PRESSMAN, 1991).

2.4.1 Plataforma
A plataforma utilizada no desenvolvimento um servidor, Hp ProLiant ML150
Pentium Xeon 3.0 com 2GB de memria e 4 Hard Disk de 70GB. Compe ainda a plataforma
o Servidor Web Apache 2.0, instalado no sistema GNU/Linux Fedora 6.0 onde sero
disponibilizados os resultados. A escolha do Apache se deve ao fato dele ser o mais bem
sucedido servidor web livre.

22

2.4.2 Linguagem de Programao


O desenvolvimento do sistema abrange dois mdulos: desenvolvimento do banco
de dados e anlise de dados. A integrao destes mdulos ser feita atravs das linguagens de
programao Hypertext Preprocessor - PHP e a linguagem de marcao Hypertext Markup
Language - HTML.

2.4.2.1

PHP

O PHP um mdulo de pr-processamento de hipertexto para o servidor web, que


permite ler e interpretar cdigos PHP incorporados em pginas da web. Apesar de ser uma
linguagem de fcil aprendizagem e de utilizao para pequenos scripts dinmicos simples, o
PHP uma poderosa linguagem orientada a objetos. um cdigo aberto que permite fcil
conexo ao banco de dados. Um programa ou script PHP um aplicativo que reside em um
servidor Web. Desta maneira possvel interagir com bancos de dados e aplicaes existentes
no servidor, com a vantagem de no expor o cdigo fonte para o cliente.
Quando um script PHP chamado por um usurio remoto, o aplicativo
executado no servidor que, em seguida, encaminha ao usurio (cliente) a resposta em formato
HTML, linguagem de marcao de hipertexto. O HTML uma linguagem de marcao
utilizada para produzir pginas web que facilita a navegao. Para o desenvolvimento do
banco de dados ser utilizado o sistema gerenciador de banco de dados, MySQL, que ser
discutido a seguir .

2.4.2.2

JAVASCRIPT

O JavaScript uma linguagem de programao interpretada e gratuita, que pode


ser embutida em pginas HTML. Ela oferece formas de controle e interatividade na pgina,
como validao de campos e chamadas a eventos. Por sem uma linguagem client-side, ou
seja, interpretada e executada no prprio navegador, no necessita realizar requisies ao
servidor.
Para sua utilizao a mquina que acessa a pgina deve possuir um interpretador
de JavaScript e este necessita estar ativo ou habilitado.

2.4.2.3

HTML

O HTML (acrnimo para a expresso inglesa HyperText Markup Language) uma


linguagem pblica de marcao utilizada para produo de pgina na Web, que utiliza os

23

conceitos do HyperTexto e da Hipermdia para apresentar, num mesmo ambiente: dados,


imagens, vdeos, sons e grficos. Uma das principais propriedades do documento HTML a
possibilidade de fazer hiperligaes, links que fazem referncia a outros contedos presentes
na mesma ou em diferentes pginas Web.

2.4.2.4

CSS

Cascading Style Sheet (CSS), que em portugus foi traduzido para Folha de Estilo
em Cascata, um mecanismo simples para marcar e estruturar o contedo do documento
HTML, ou seja, a alterao da apresentao no feita por elementos HTML. A tarefa de
estilizao fica a cargo das CSS, arquivos independentes dos arquivos HTML, nos quais so
declaradas propriedades e valores de estilizao para os elementos do HTML (como
alinhamento, espaamento, cores, fontes, margens, backgrounds, etc). Facilitam o
desenvolvimento de pginas Web, pois padronizam o estilo e tornam o cdigo mais limpo.

2.4.3 Confeco do Banco de Dados


Para a confeco do banco de dados foi utilizada a ferramenta DBDesigner 4.0.5.6 24,
que se trata de um sistema livre de design que integra modelagem, criao e manuteno de
banco de dados, entre outras funcionalidades. Possui portabilidade, podendo ser executado em
diferentes plataformas. No DBDesigner, o modelo de dados foi estruturado de forma simples
e prtica sendo, posteriormente, exportado para um banco de dados do MySQL.
MySQL o Sistema Gerenciador de Banco de Dados (SGBD) que ser utilizado para
dar suporte ao software desenvolvido. Ele um SGBD relacional que oferece integrao com
diversas aplicaes atravs de um subconjunto da popular linguagem de consulta SQL. Possui
grande portabilidade, praticamente suporta qualquer plataforma atual, oferece um excelente
desempenho e estabilidade. Alm de exigir poucos recursos de hardware ele um software
livre.

24

http://www.fabforce.net/dbdesigner4/

24

3 RESULTADOS E DISCUSSES
3.1 MODELAGEM DAS PROTENAS
A motivao para a escolha das protenas e suas respectivas seqncias primrias
se deu importncia das protenas, contidas no veneno das abelhas, para estudos
farmacolgicos. Para a modelagem molecular, inicialmente, foram escolhidas 5 seqncias da
protena melitina, por se tratar do principal composto do veneno. Na primeira e segunda
coluna da tabela 3 pode se observar os cdigos de acesso ao Genbank e as seqncias em
formato fasta das protenas escolhidas para serem modeladas.

3.1.1 Busca de seqncias homlogas


A busca por seqncias homlogas foi realizada atravs do software BLAST. As
seqncias encontradas que apresentaram similaridade superior a 70% foram escolhidas como
potenciais moldes. Na terceira coluna da tabela 3, pode se observar, quais foram as protenas
selecionadas para servirem de molde. Na quarta coluna, encontra-se a similaridade entre
seqncia-alvo e molde, e na quinta coluna, encontra-se o valor, em Angstroms, da resoluo
das estruturas selecionadas para molde.
Tabela 3 - Relao entre Protenas-alvo e Protenas-molde.

Protena-Alvo

Possveis Protenas-Molde

gi

Cdigo PDB

Fasta

Similaridade

Resoluo

Organismo

[]
229389

229230

126956

126955

69552

GIGAVLKVLTTGLPALISWISRKKRQQ

GIGAVLKVLTTGLPALISWIKRKRQQ

GIGAILKVLATGLPTLISWIKNKRKQ

GIGAILKVLSTGLPALISWIKRKRQE

GIGAVLKVLTTGLPALISWISRKKRQQ

2mlt(A,B)

92%

2.00

1bh1(A)

92%

RMN

2mlt(A,B)

100%

2.00

1bh1(A)

100%

RMN

2mlt(A,B)

88%

2.00

1bh1(A)

88%

RMN

2mlt(A,B)

100%

2.00

1bh1(A)

100%

RMN

2mlt(A,B)

92%

2.00

1bh1(A)

92%

RMN

Apis Mellifera

Apis Mellifera

Apis flrea

Apis dorsata

Apis mellifera

Para todas as protenas alvo, foram encontrados trs possveis moldes. A estrutura
2MLT, cadeia A e cadeia B, e a estrutura 1BH1, cadeia A. As trs possveis estruturas moldes
25

tiveram suas informaes coletadas no Genbank e no PDB, juntamente com o arquivo


contendo suas coordenadas. As informaes sobre as estruturas e suas seqncias primrias
foram armazenadas no banco de dados do sistema.

3.1.2 Alinhamento entre seqncias-alvo e molde


Com o conhecimento das possveis estruturas-molde, foi realizado o alinhamento
global entre as seqncias primrias, das protenas-molde e das protenas-alvo. Para gerar os
alinhamentos foi utilizado o CLUSTALW, e o formato de sada do alinhamento foi o formato
pir, arquivo que ser utilizado para a construo dos modelos pelo Modeller. Para uma melhor
visualizao dos alinhamentos, foi utilizado o software BioEdit25.
As figuras abaixo apresentam o alinhamento de cada seqncia de protena-alvo com as
respectivas seqncias das estruturas-molde. Na Figura 7 se tem o alinhamento da seqncia,
com gi 229389, e seus moldes. Observa-se que a seqncia-alvo possui 27 aminocidos,
enquanto que as seqncias-molde possuem 26 aminocidos. O melhor alinhamento realizado
pode ser observado abaixo, onde 25 dos 27 aminocidos da seqncia-alvo foram alinhados.

Figura 6 - Alinhamento global entre seqncia-alvo (gi 229389) e seqncias-molde.

Na Figura 8, observa-se o alinhamento entre a seqncia-alvo, de gi 229230, com


suas possveis estruturas-molde. Nota-se que, 100% dos resduos so idnticos.

Figura 7 - Alinhamento global entre seqncia-alvo (gi 229230) e seqncias-molde.

Na Figura 9, observa-se o alinhamento entre a seqncia-alvo, de gi 126956, com


suas possveis estruturas-molde. Nota-se que, 21 dos 26 resduos das seqncias so idnticos

Figura 8 - Alinhamento global entre seqncia-alvo (gi 126956) e seqncias-molde.

25

http://www.mbio.ncsu.edu/BioEdit/page2.html

26

Na Figura 10, observa-se o alinhamento entre a seqncia-alvo, de gi 69552, com


suas possveis estruturas-molde. Nota-se que, 25 dos 27 resduos da seqncia-alvo so
idnticos aos das seqncias-molde.

Figura 9 - Alinhamento global entre seqncia-alvo (gi 69552) e seqncias-molde.

Na Figura 11, observa-se o alinhamento entre a seqncia-alvo, de gi 126955, com


suas possveis estruturas-molde. Nota-se que, 23 dos 26 resduos das seqncias so idnticos.

Figura 10 - Alinhamento global entre seqncia-alvo (gi 126955) e seqncias-molde.

3.1.3 Construo dos modelos


Com os resultados obtidos do alinhamento das seqncias, o Modeller, programa
escolhido para as modelagens, atravs de seus comandos gerou os modelos de estruturas 3D.
A principal caracterstica do Modeller a obteno emprica das restries espaciais,
expressas por funes densidade de probabilidade (PDFs) que, utilizam informaes das
estruturas-molde. As restries espaciais e os termos de energia so combinados em uma
funo objetivo, que atravs de mtodos de otimizao por gradiente conjugado, visaram
minimizao das violaes das restries espaciais (SNCHEZ; SALI, 1997).
Foram executados vrios scripts na busca por um modelo com qualidade. Esses
scripts esto armazenados na biblioteca do Modeller. Atravs do script model-multi.py, a
estrutura foi obtida utilizando mltiplos moldes. As trs estruturas conhecidas, 1BH1,
2MLT_A, 2MLT_B, foram alinhadas e utilizadas ao mesmo tempo como moldes, mas os
resultados obtidos, no foram satisfatrios, pois, os modelos gerados no obtiveram uma
qualidade mnima.
Optou-se ento por escolher um nico modelo para cada seqncia-alvo. Para a
determinao do melhor molde, as trs estruturas, 2mlt(cadeia A e B) e 1bh1(cadeia A), foram
utilizadas gerando para cada seqncia-alvo, 10 modelos. Esses modelos foram comparados
entre si, e os que possuam menor valor para a funo objetivo foram otimizados e analisados
27

nos programas de validao. So apresentados a seguir, os melhores modelos para cada


seqncia-alvo, juntamente com os resultados da validao desses modelos. Apesar de todas
as restries impostas pelo Modeller, alguns modelos podem apresentar maus contatos entre
seus tomos e enovelamentos incorretos (SALI ; BLUNDELL, 1993).

3.1.4 Validao dos modelos


Todos os modelos gerados pelo Modeller durante o projeto foram analisados por
trs softwares de validao, responsveis cada qual a avaliar uma propriedade diferente.
- Procheck: Avalia a qualidade estereoqumica dos modelos;
- Whatif : Avalia a qualidade dos modelos finais por anlise dos contatos atmicos
dos resduos;
- Verify 3D: Avalia os ambientes qumicos dos resduos.

3.1.4.1

Seqncia-alvo: gi 229389

Os resultados do Procheck exibem uma grande quantidade de informaes


referentes aos parmetros estereoqumicos dos modelos proticos. So gerados vrios
grficos, que permitem uma avaliao completa da qualidade estereoqumica dos modelos em
comparao estruturas resolvidas experimentalmente no mesmo nvel de resoluo. Ser
apresentado o grfico de Ramachandran e os grficos de avaliao das propriedades da cadeia
principal.
Para ser considerado um bom modelo, o resultado do grfico de Ramachandran
deve apresentar, na regio mais favorvel (A, B, L), mais de 90% dos resduos,
desconsiderando os resduos de glicina (no possuem cadeia lateral), prolina (o C est ligado
cadeia lateral) e os resduos das extremidades (C-terminal e N-terminal) que apresentam
padres estereoqumicos diferentes dos outros resduos (LASKOWSKI, et al., 1993).
Inicialmente, foram construdos 30 modelos da estrutura de gi 229389, 10 modelos
para cada molde encontrado. Com isso, os melhores modelos foram gerados utilizando a
estrutura 2mlt cadeia B, como molde. Esses modelos foram otimizados, atravs de um script
para a minimizao do valor da funo objetivo. No total 40 modelos foram gerados para a
estrutura de gi 229389. Desses, apenas os modelos que apresentaram menor valor para a
funo objetivo foram selecionados e avaliados.
Em relao ao Procheck, o modelo gerado apresentou 100% de seus resduos na
regio mais favorvel (em vermelho), como pode se observar na Figura 11. As propriedades
28

estereoqumicas da cadeia principal, que so verificadas pelo Procheck so cinco: (a)


Avaliao do grfico de Ramachandran, (b) Planaridade de ligao peptdica, (c) Maus
contatos atmicos, (d) Distoro do carbono , (e) Energia das ligaes de hidrognio, (f)
Qualidade estereoqumica total. Na Figura 12, so apresentados os resultados referentes a
essas propriedades, e observa-se que estes resultados esto dentro da mdia ou em melhores
condies que parmetros de estruturas proticas encontradas no PDB, com nvel de
resoluo estrutural semelhante, onde se ressalta a qualidade estereoqumica total do modelo,
representada pelo fator-G, que se apresenta acima da mdia.

Figura 11 - Grfico de Ramachandran da seqncia de gi 229389, gerado pelo software Procheck, onde
so correlacionados os ngulos torcionais da cadeia principal, Phi e Psi, para cada resduo. As regies de
classificao esto divididas por cores distintas.

29

Figura 12 - Representao dos grficos de cinco propriedades estruturais da cadeia principal. Os valores
do modelo gerado so marcados por quadrados. As bandas escuras em cada grfico representam os
resultados das estruturas resolvidas conhecidas, e a linha central representa uma mdia dos valores em
funo da resoluo. As linhas das extremidades representam o desvio em relao mdia.

Para se verificar a qualidade dos contatos atmicos, o mdulo Coarse Packing


Quality Control do software Whatif (VRIEND; SANDER, 1993) foi utilizado. Esse mdulo
analisa os contatos atmicos do molde obtido utilizando estruturas resolvidas, depositadas no
PDB, como referncia. Ele calcula o chamado ndice da qualidade de contato. Normalmente, a
escala do ndice da qualidade de contato para cada resduo abrange valores entre -5 e 5. Um
valor menor que -5 pode significar algum tipo de erro, como: empacotamento improvvel ou
coordenadas atmicas incorretas (VRIEND; SANDER, 1993).
Um modelo classificado como (SILVA, 2007):
- timo, se apresentar valor mdio que -0,5;
- bom, se apresentar valor mdio entre -0,5 e -1,5;
- pobre, se apresentar valor mdio menor que -2,0;
- ruim, se apresentar valor mdio menor que -3,0.
Pode-se analisar na Tabela 4, os ndices da qualidade de contato calculados para
cada um dos resduos do modelo de gi 229389, e tambm o ndice total do modelo. Pelo
ndice total (-0,451), conclui-se que o modelo apresenta uma boa qualidade segundo a
classificao anterior.
30

Tabela 4 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural gerado para
o alvo gi 229389 e o ndice total do modelo.
1 GLY ( 1) : -0.532

10 THR ( 10) : -3.680

19 TRP ( 19) : 0.258

2 ILE ( 2) : 0.881

11 THR ( 11) : -2.794

20 ILE ( 20) : 0.580

3 GLY ( 3) : 1.911

12 GLY ( 12) : -3.298

21 SER ( 21) : 0.488

4 ALA ( 4) : 1.399

13 LEU ( 13) : 1.045

22 ARG ( 22) : -0.970

5 VAL ( 5) : 1.605

14 PRO ( 14) : 0.722

23 LYS ( 23) : -0.524

6 LEU ( 6) : 1.855

15 ALA ( 15) : 1.496

24 LYS ( 24) : -1.378

7 LYS ( 7) : 2.009

16 LEU ( 16) : 1.273

25 ARG ( 25) : -3.593

8 VAL ( 8) : -0.381

17 ILE ( 17) : 2.125

26 GLN ( 26) : -5.642

9 LEU ( 9) : -0.854

18 SER ( 18) : 2.290

27 GLN ( 27) : -4.830

ndice do modelo: -0.451

Nem sempre um valor abaixo de cinco significa que o resduo esteja incorreto. O
resduo 27 do modelo gerado, apresentou um valor abaixo de -5,0, que pode ser observado na
Figura 13. Mas resduos pequenos realizam menos contatos que resduos grandes, assim seus
ndices tendem a serem menores, mesmo quando empacotados corretamente. Da mesma
forma, resduos encontrados na superfcie das protenas, realizam menos contatos, quando
comparados com resduos encontrados no interior das protenas, por esse motivo, tambm
apresentam ndices menores (SILVA, 2007).

Figura 13 - Modelo para seqncia de gi 229389. Em amarelo, est a localizao do resduo com baixa
qualidade de contato.

Para avaliar a compatibilidade da estrutura do modelo com sua seqncia primria,


o software Verify 3D foi utilizado. Como a posio de cada resduo no modelo 3D
caracterizada pelo seu ambiente qumico, o software determina os ambientes qumicos de
cada resduo do modelo e atribui scores com referncia a uma matriz construda a partir de
uma anlise estatstica envolvendo estruturas de protenas armazenadas no PDB.

31

Na Figura 14, est a avaliao do modelo de gi 229389, onde os 11 primeiros


resduos de cada extremidade so desconsiderados. Mesmo apresentando um resduo com
valor negativo, este foi o melhor modelo gerado para a seqncia-alvo de gi 229389, pois esse
modelo passou pro um protocolo de minimizao de energia.

Figura 14 - Representao do perfil 3D do modelo de gi 229389. So desconsiderados os 11 resduos das


extremidades.

3.1.4.2 Seqncia-alvo: gi 229230

O grfico de Ramachandran revelou que 100% dos resduos deste modelo se


encontram na regio mais favorvel, garantindo assim, qualidade dos ngulos torcionais da
cadeia principal. Pode-se verificar na Figura 15 e Figura 16 que, pelos resultados do
Procheck, este modelo para a seqncia-alvo de gi 229230, considerado vlido.

32

Figura 15 - Grfico de Ramachandran da seqncia de gi 229230, gerado pelo software Procheck, onde
so correlacionados os ngulos torcionais da cadeia principal, Phi e Psi, para cada resduo. As regies de
classificao esto divididas por cores distintas.

As propriedades estereoqumicas da cadeia principal do modelo construdo para


esta seqncia, em comparao com estruturas do PDB, so mostradas na Figura 16. Os
resultados para essas propriedades mostram que a qualidade total do modelo est acima da
mdia.

33

Figura 16 Representao dos grficos de cinco propriedades estruturais da cadeia principal. Os valores
do modelo gerado so marcados por quadrados. As bandas escuras em cada grfico representam os
resultados das estruturas resolvidas conhecidas, e a linha central representa uma mdia dos valores em
funo da resoluo. As linhas das extremidades representam o desvio em relao mdia.

Na Tabela 5, observa-se a anlise dos ndices da qualidade de contato para o


modelo da seqncia de gi 229230. Como classificado anteriormente, um bom nvel de
qualidade para contatos atmicos seria um valor maior que -1,0. Para o modelo analisado, o
ndice total -0,279, que est acima do valor mdio para uma boa qualidade (-0,5). Os
resduos que apresentam ndices abaixo de -5,0 esto destacados de amarelo, na Figura 17.

Tabela 5 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural gerado para
o alvo gi 229230 e o ndice total do modelo.
1 GLY ( 1) : 0.007

10 THR ( 10) : -3.951

19 TRP ( 19) : 0.609

2 ILE ( 2) : 1.260

11 THR ( 11) : -2.685

20 ILE ( 20) : 1.551

3 GLY ( 3) : 1.738

12 GLY ( 12) : -2.404

21 LYS ( 21) : 2.242

4 ALA ( 4) : 1.084

13 LEU ( 13) : 1.107

22 ARG ( 22) : 0.726

5 VAL ( 5) : 1.301

14 PRO ( 14) : -0.499

23 LYS ( 23) : -0.425

6 LEU ( 6) : 1.808

15 ALA ( 15) : 0.336

24 ARG ( 24) : -2.951

7 LYS ( 7) : 1.230

16 LEU ( 16) : 2.011

25 GLN ( 25) : -5.668

8 VAL ( 8) : -1.069

17 ILE ( 17) : 1.654

26 GLN ( 26) : -5.238

9 LEU ( 9) : -1.016

18 SER ( 18) : 1.296

ndice do modelo: -0.279

34

Figura 17 - Modelo para seqncia de gi 229230. Em amarelo, esto localizados os resduos com baixa
qualidade de contato.

Na Figura 18, est a avaliao do modelo de gi 229230, segundo o Verify 3D .Os


11 primeiros resduos de cada extremidade so desconsiderados, por isso, se encontram no
mesmo patamar. Mesmo sendo utilizado um protocolo de minimizao energia para este
modelo, o resultado apresentado, sugere valores negativos de escore, uma informao que no
possibilita classificar este como um bom modelo.

Figura 18 - Representao do perfil 3D do modelo de gi 229230. So desconsiderados os 11 resduos das


extremidades.

3.1.4.3

Seqncia-alvo: gi 126956

O grfico de Ramachandran revelou que 100% dos resduos deste modelo se


encontram na regio mais favorvel, garantindo assim, qualidade dos ngulos torcionais da
cadeia principal. Pode-se verificar na Figura 19 e Figura 20 que, pelos resultados do
Procheck, este modelo para a seqncia-alvo de gi 126956, considerado vlido.
Na Tabela 6, observa-se a anlise dos ndices da qualidade de contato para o
modelo da seqncia de gi 126956. Como classificado anteriormente, um bom nvel de

35

qualidade para contatos atmicos seria um valor maior que -1,0. Para o modelo analisado, o
ndice total -0.036, que est acima do valor mdio para uma boa qualidade (-0,5).
O modelo gerado pode ser observado na Figura 21, onde se encontra destacado em
amarelo, um resduo que possui um valor menor que -5,0 para o ndice da qualidade de
contato.

Figura 19 - Grfico de Ramachandran da seqncia de gi 126956, gerado pelo software Procheck, onde
so correlacionados os ngulos torcionais da cadeia principal, Phi e Psi, para cada resduo. As regies de
classificao esto divididas por cores distintas.

36

Figura 20 - Representao dos grficos de cinco propriedades estruturais da cadeia principal. Os valores
do modelo gerado so marcados por quadrados. As bandas escuras em cada grfico representam os
resultados das estruturas resolvidas conhecidas, e a linha central representa uma mdia dos valores em
funo da resoluo. As linhas das extremidades representam o desvio em relao mdia.

Tabela 6 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural gerado para
o alvo gi 126956 e o ndice total do modelo.
1 GLY ( 1) : 0.436

10 ALA ( 10) : -3.251

19 TRP ( 19) : 1.867

2 ILE ( 2) : 0.927

11 THR ( 11) : -2.796

20 ILE ( 20) : 1.616

3 GLY ( 3) : 2.013

12 GLY ( 12) : -3.205

21 LYS ( 21) : 2.238

4 ALA ( 4) : 1.541

13 LEU ( 13) : 1.688

22 ASN ( 22) : -0.345

5 ILE ( 5) : 1.832

14 PRO ( 14) : 0.394

23 LYS ( 23) : -0.712

6 LEU ( 6) : 1.720

15 THR ( 15) : 0.396

24 ARG ( 24) : -2.975

7 LYS ( 7) : 2.243

16 LEU ( 16) : 1.049

25 LYS ( 25) : -4.252

8 VAL ( 8) : -0.752

17 ILE ( 17) : 1.779

26 GLN ( 26) : -5.642

9 LEU ( 9) : -0.646

18 SER ( 18) : 1.428

ndice do modelo: - 0.036

37

Figura 21 - Modelo para seqncia de gi 126956. Em amarelo, est localizado o resduo com baixa
qualidade de contato.

Na Figura 22 est a avaliao do modelo de gi 126956, segundo o Verify 3D. Os


11 primeiros resduos de cada extremidade so desconsiderados, por isso, se encontram no
mesmo patamar. Mesmo sendo utilizado um protocolo de minimizao energia para este
modelo, o resultado apresentado pelo Verify 3D, sugere valores negativos de score, uma
informao que no possibilita classificar este como um bom modelo, segundo este validador,
contrariando os resultados do Procheck e Whatif.

Figura 22 - Representao do perfil 3D do modelo de gi 126956 desconsiderados os 11 resduos das


extremidades.

3.1.4.4

Seqncia-alvo: gi 126955

O grfico de Ramachandran revelou que 100% dos resduos deste modelo se


encontram na regio mais favorvel, garantindo assim, qualidade dos ngulos torcionais da
cadeia principal. Pode-se verificar na Figura 23 e Figura 24 que, pelos resultados do
Procheck, este modelo para a seqncia-alvo de gi 126955, considerado vlido.

38

Na Tabela 7, observa-se a anlise dos ndices da qualidade de contato para o


modelo da seqncia de gi 126955. Como classificado anteriormente, um bom nvel de
qualidade para contatos atmicos seria um valor maior que -1,0. Para o modelo analisado, o
ndice total -0.023, que est acima do valor mdio para uma boa qualidade (-0,5).
O modelo gerado pode ser observado na Figura 25, onde se encontra destacado em
amarelo, um resduo que possui um valor menor que -5,0 para o ndice da qualidade de
contato.

Figura 23 - Grfico de Ramachandran da seqncia de gi 126955, gerado pelo software Procheck, onde
so correlacionados os ngulos torcionais da cadeia principal, Phi e Psi, para cada resduo. As regies de
classificao esto divididas por cores distintas.

39

Figura 24 - Representao dos grficos de cinco propriedades estruturais da cadeia principal. Os valores
do modelo gerado so marcados por quadrados. As bandas escuras em cada grfico representam os
resultados das estruturas resolvidas conhecidas, e a linha central representa uma mdia dos valores em
funo da resoluo. As linhas das extremidades representam o desvio em relao mdia.

Tabela 7 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural gerado para
o alvo gi 126955 e o ndice total do modelo.
1 GLY ( 1) : 0.309

10 SER ( 10) : -4.295

19 TRP ( 19) : 1.476

2 ILE ( 2) : 1.004

11 THR ( 11) : -0.365

20 ILE ( 20) : 1.125

3 GLY ( 3) : 1.696

12 GLY ( 12) : -2.197

21 LYS ( 21) : 2.659

4 ALA ( 4) : 1.459

13 LEU ( 13) : 1.339

22 ARG ( 22) : 1.229

5 ILE ( 5) : 0.328

14 PRO ( 14) : -0.077

23 LYS ( 23) : -0.293

6 LEU ( 6) : 1.178

15 ALA ( 15) : 0.868

24 ARG ( 24) : -3.025

7 LYS ( 7) : 1.800

16 LEU ( 16) : 1.579

25 GLN ( 25) : -5.611

8 VAL ( 8) : -0.439

17 ILE ( 17) : 1.903

26 GLU ( 26) : -3.604

9 LEU ( 9) : -1.648

18 SER ( 18) : 1.087

ndice do modelo: -0.023

40

Figura 25 - Modelo para seqncia de gi 126955. Em amarelo, est localizado o resduo com baixa
qualidade de contato.

Na Figura 26 est a avaliao do modelo de gi 126955, segundo o Verify 3D. Os


11 primeiros resduos de cada extremidade so desconsiderados, por isso, se encontram no
mesmo patamar. Mesmo sendo utilizado um protocolo de minimizao energia para este
modelo, o resultado apresentado pelo Verify 3D, sugere valores negativos de score, uma
informao que no possibilita classificar este como um bom modelo, segundo este validador,
contrariando os resultados do Procheck e Whatif.

Figura 26 - Representao do perfil 3D do modelo de gi 126955 desconsiderados os 11 resduos das


extremidades.

3.1.4.5

Seqncia-alvo: gi 69552

O grfico de Ramachandran revelou que 100% dos resduos deste modelo se


encontram na regio mais favorvel, garantindo assim, qualidade dos ngulos torcionais da
cadeia principal.
Pode-se verificar na Figura 27 e Figura 28 que, pelos resultados do Procheck, este
modelo para a seqncia-alvo de gi 69552, considerado vlido.

41

Figura 27 - Grfico de Ramachandran da seqncia de gi 69552, gerado pelo software Procheck, onde so
correlacionados os ngulos torcionais da cadeia principal, Phi e Psi, para cada resduo. As regies de
classificao esto divididas por cores distintas.

42

Figura 28 - Representao dos grficos de cinco propriedades estruturais da cadeia principal. Os valores
do modelo gerado so marcados por quadrados. As bandas escuras em cada grfico representam os
resultados das estruturas resolvidas conhecidas, e a linha central representa uma mdia dos valores em
funo da resoluo. As linhas das extremidades representam o desvio em relao mdia.

Na Tabela 8, observa-se a anlise dos ndices da qualidade de contato para o


modelo da seqncia de gi 69552.

Tabela 8 - Valores dos ndices da qualidade de contato para os resduos do modelo estrutural gerado para
o alvo gi 69552 e o ndice total do modelo.
1 GLY ( 1) : -0.581

10 THR ( 10) : -3.716

19 TRP ( 19) : 0.962

2 ILE ( 2) : 1.275

11 THR ( 11) : -2.754

20 ILE ( 20) : 1.826

3 GLY ( 3) : 2.007

12 GLY ( 12) : -3.208

21 SER ( 21) : 0.990

4 ALA ( 4) : 1.271

13 LEU ( 13) : 1.288

22 ARG ( 22) : 0.722

5 VAL ( 5) : 1.744

14 PRO ( 14) : 0.779

23 LYS ( 23) : 0.126

6 LEU ( 6) : 1.894

15 ALA ( 15) : 1.392

24 LYS ( 24) : -1.873

7 LYS ( 7) : 2.408

16 LEU ( 16) : 1.054

25 ARG ( 25) : -5.747

8 VAL ( 8) : -0.537

17 ILE ( 17) : 1.275

26 GLN ( 26) : -5.177

9 LEU ( 9) : -1.265

18 SER ( 18) : 1.688

27 GLN ( 27) : -7.800

ndice do modelo: -0.500

43

Como classificado anteriormente, um bom nvel de qualidade para contatos


atmicos seria um valor maior que -1,0. Para o modelo analisado, o ndice total -0.500,
coincidindo com o valor mdio para uma boa qualidade.
O modelo gerado pode ser observado na Figura 29, onde se encontra destacado em
amarelo, resduos que apresentam valores menores que -5,0 para o ndice da qualidade de
contato.

Figura 29 - Modelo para seqncia de gi 69552. Em amarelo, esto representados os resduos com baixa
qualidade de contato.

Na Figura 30, est a avaliao do modelo de gi 69552, onde os 11 primeiros


resduos de cada extremidade so desconsiderados. Mesmo apresentando um resduo com
valor negativo, este foi o melhor modelo gerado para a seqncia-alvo de gi 69552, pois esse
modelo passou pro um protocolo de minimizao de energia, e segundo resultado do
Procheck e Verify 3D, classificado como um bom modelo.

Figura 30 - Representao do perfil 3D do modelo de gi 69552 desconsiderados os 11 resduos das


extremidades.

44

Aps analisar todos os modelos obtidos e otimizados, e valid-los, conclui-se que


o melhor molde utilizado foi a estrutura 2mlt cadeia B. Mas, necessrio, aplicar tcnicas,
como por exemplo de dinmica molecular, para melhorar os moldes gerados, obtendo
melhores resultados para a validao atravs do Verify 3D.

3.2 ESTRUTURA DO BANCO DE DADOS


3.2.1 DER
O Diagrama Entidade-Relacionamento (DER) um modelo em rede que descreve
de forma abstrata os dados armazenados de um sistema (TEOREY et al., 2007). De acordo
com o diagrama entidade-relacionamento do Banco de Dados de Protenas de Apis mellifera BDModel, que se encontra na Figura 31, pode-se observar o relacionamento entre as tabelas
criadas. Esses relacionamentos podem gerar as mais diversas consultas, utilizando suporte
linguagem de consulta SQL. As informaes so retornadas, utilizando PHP e HTML,
podendo visualizar diversos resultados

Figura 31 - Diagrama entidade-relacionamento do sistema.

3.2.2 Dicionrio de dados


O Dicionrio de Dados a descrio das caractersticas e atributos dos objetos
do modelo apresentado no Diagrama Entidade-Relacionamento. Na primeira coluna da Tabela
9 pode-se encontrar as entidades contidas no BDModel.
45

O banco de dados do sistema formado por trs tabelas. So elas: Seqncia,


Estrutura_PDB, Estrutura_Modelada. Elas so descritas na segunda coluna da Tabela 9.

Tabela 9 - Descrio das tabelas apresentadas no Diagrama Entidade-Relacionamento do sistema em


desenvolvimento
Entidade

Descrio

Seqncia

Armazena as seqncias primrias das protenas buscadas no GenBank.

Estrutura_PDB

Armazena as estruturas tercirias das protenas encontradas no PBD.

Estrutura_Modelada

Armazena as estruturas tercirias modeladas durante o desenvolvimento do


sistema.

Para que se possa apresentar uma variedade de resultados, ser necessrio fazer
vrios tipos de consultas relacionais no banco de dados, para isso sero utilizados scripts em
PHP, como dito anteriormente. A variedade de resultados est relacionada com os atributos
contidos em cada tabela do BDModel. Como por exemplo, na tabela Seqncia, temos os
seguintes atributos:
- idsequencia: identificador da seqncia primria das protenas no DBMoldel;
- gi: identificador da seqncia no GenBank;
- ref: cabealho da seqncia, quando ela est em formato fasta;
- fasta: seqncia primria da protena no formato fasta, menos o cabealho;
- definicao: definio que a seqncia primria da protena possui no GenBank;
- autor: pessoa que publicou a seqncia primria da protena no GenBank.
- tipo: classificao da protena segundo as toxinas selecionadas, como por exemplo,
Melitina, Fosfolipase A2, Apamina, Secapina, Hyaluronidase, Peptdeo Degranulador de
Mastcitos, Fosfatase cida, Veneno Protease e Tertiapina (ver Tabela 2);
- nro_amino: nmero de aminocidos que formam a seqncia primria da protena;
- organismo: classificao taxonmica do organismo;
- referencia: campo onde armazenado, o ttulo da primeira publicao sobre a
seqncia, juntamente com o peridico que foi publicado.
Segue na Tabela 10, as tabelas (entidades) contidas no BDModel, com seus
respectivos atributos e suas descries.

46

Tabela 10 - Descrio dos atributos das entidades do Diagrama Entidade - Relacionamento do sistema em
desenvolvimento
Entidade

Atributo

Seqncia

- idsequencia: identificador da seqncia primria das protenas no DBMoldel;


- gi: identificador da seqncia no GenBank;
- ref: cabealho da seqncia, quando ela est em formato fasta;
- fasta: seqncia primria da protena no formato fasta, menos o cabealho;
- definicao: definio que a seqncia primria da protena possui no GenBank;
- autor: pessoa que publicou a seqncia primria da protena no GenBank.
- tipo: classificao da protena segundo as toxinas selecionadas;
- nro_amino: nmero de aminocidos que formam a seqncia primria da protena;
- organismo: classificao taxonmica do organismo;
- referencia: campo onde armazenado, o ttulo da primeira publicao sobre a
seqncia, juntamente com o peridico que foi publicado.

Estrutura_PDB

- isEstruturaPDB: identificador da estrutura 3D no BDModel;


- codigoPDB: identificador da estrutura no banco de dados PDB;
- arquivoPDB: campo texto que armazena o caminho onde se encontra o arquivo
pdb da estrutura 3D;
- autor: responsvel pela publicao da estrutura
- titulo: ttulo da estrutura 3D no PDB
- metodo_obtencao: mtodo experimental pelo qual a estrutura 3D foi determinada;
- classificacao: classificao da protena segundo o PDB;
-dt_deposito: data de depsito da estrutura 3D no PDB

Estrutura_Modelada

- idEstruturaModelada: identificador da estrutura modelada no BDModel;


- arquivoPDB: campo texto que armazena o caminho para o arquivo pdb da
estrutura modelada;
- dt_modelagem: data que foi realizada a modelagem da estrutura;
- autor: nome do responsvel por modelar a estrutura 3D;
- similaridade: valor de similaridade a partir do alinhamento das seqncias alvo e
molde;

3.3 DESENVOLVIMENTO DO SISTEMA BDMODEL


O sistema, denominado BDModel, foi desenvolvido com a finalidade de
disponibilizar os resultados que foram recolhidos, analisados e desenvolvidos durante o
projeto. O sistema pode ser acessado atravs do endereo http://gbi.fmrp.usp.br/bdmodel.

47

3.3.1 Interfaces do Sistema


A interface com o usurio representa a principal interao ser humanocomputador, e se torna extremamente importante medida que a dependncia de tarefas
informatizadas aumenta. O projeto de interface de usurio prov os mecanismos de interao
e layout para auxiliarem a relao homem-mquina. Representa tambm a associao de
fatores humanos, tais como, modelo de usurio, percepo e imagem do sistema com
tecnologias de interface.
A interface grfica do sistema foi desenvolvida, com a preocupao, de mant-las
amigveis e intuitivas para facilitar as interaes com os usurios, e tambm compatveis aos
navegadores mais utilizados atualmente, como Mozilla Firefox26 e Internet Explorer27.
Inicialmente, foram criados diversos prottipos de interface que, ao longo do
projeto, sofreram algumas modificaes, para que a interao entre usurio e sistema, fosse a
mais intuitiva possvel. A seguir so apresentadas as principais interfaces do BDModel.

3.3.1.1

Home: Pgina Inicial

A interface home a tela inicial do sistema, e pode ser visualizada na Figura 32.
Nela h uma breve introduo do projeto que foi desenvolvido com as modelagens. Apresenta
layout definido em blocos constituindo o topo, menu horizontal, colunas e base.
No topo so apresentados o logotipo e o nome do sistema. O menu horizontal
exibido abaixo do topo da interface, contendo links direcionados para a prpria pgina (link
Home), para busca de informaes contidas no sistema (link Seqncias), e para sugestes e
informaes de contato do laboratrio e responsveis pela manuteno do sistema (link Fale
Conosco).
H trs colunas na tela inicial, sendo que a primeira contm um menu vertical e
imagens ilustrativas dinmicas, a segunda exibe o contedo acessado e a terceira exibe uma
caixa para pesquisa na rede e links para as instituies vinculadas ao projeto.
No menu vertical esto listados os links Home, Pesquisa, Seqncias, Ajuda,
Contato, Fale Conosco, Links, que redirecionam para pginas de contedo informativo,
buscas no banco de dados e links para pginas de temtica relacionada ao sistema. Os crditos
do desenvolvedor do sistema esto na base da pgina.

26
27

http:// www.mozillafirefox.com/
http://www.microsoft.com/

48

Figura 32 - Tela inicial do sistema BDModel. Em A) menu vertical contendo links para busca de
informaes, ajuda na utilizao do sistema, contato, fale conosco (atravs de mensagens) e links
relacionados com o projeto; B) menu Horizontal contendo links para busca de informaes e fale conosco;
C) caixa para pesquisa na rede (internet); D) links para as entidades relacionadas com o projeto.

3.3.1.2

Pesquisa : Uma pgina de busca

As informaes armazenadas no banco de dados do sistema podem ser resgatadas


de duas maneiras. Atravs de uma pesquisa por atributos (Figura 33) ou por exibio de todas
as informaes, de todas as seqncias primrias depositadas (Figura 36). Atravs do link
Pesquisa, que est fixado no menu vertical, abre-se uma tela, onde se inicia a pesquisa. A
qualquer momento, uma nova pesquisa pode ser iniciada. Nessa tela de Pesquisa (Figura 33),
o usurio deve informar o tipo de informao que busca, optando por buscas de seqncias
primrias e estruturas 3D.

49

Figura 33 Tela inicial de pesquisa. O usurio deve optar por seqncia primria ou estrutura 3D.

Se a opo escolhida for seqncia primria, uma tela com os atributos referentes a
seqncias primrias so mostrados. Esses campos de pesquisa, inicialmente, esto
desabilitados. O usurio pode escolher pesquisar apenas por um atributo, ou fazer uma busca
utilizando vrios atributos. Como mostra a Figura 34, possvel buscar uma seqncia
primria habilitando apenas 2 campos, tipo da protena e nmero de aminocidos. Essa busca
ir varrer o banco de dados do sistema, e exibir todas as seqncias primrias de melitinas que
possuem em sua cadeia 27 aminocidos.
De forma anloga, o mesmo acontece para busca por estruturas 3D. Na Figura 35,
ocorre uma busca especfica por estrutura 3D. Atravs do cdigo PDB da estrutura possvel
realizar a pesquisa no sistema.

50

Figura 34 Pesquisa de seqncias primrias. Os campos so os atributos referentes a uma seqncia


primria. Esses campos inicialmente esto desabilitados, e quando habilitados podem realizar buscas
especficas.

Figura 35 - Pesquisa de estruturas 3D. Os campos so os atributos referentes a uma estrutura 3D. Esses
campos inicialmente esto desabilitados, e quando habilitados podem realizar buscas especficas.

51

Quando o usurio deseja verificar todas as informaes, de todas as seqncias


depositadas, ele pode realizar uma busca geral atravs da tela Seqncia. Quando essa busca
realizada, todas as informaes, referentes ao tipo da protena escolhida, so retornados
numa tela. Na Figura 36, est representada a tela Seqncia, apresentando todos os diferentes
tipos de protenas armazenados no sistema.

Figura 36 Tela Seqncia. Quando o usurio deseja exibir todas as informaes referentes a seqncias
primrias, ele apenas deve escolher o tipo da protena que est buscando.

No caso, se for escolhida o tipo Melitina, uma tela contendo todas as informaes
de todas as seqncias primrias de melitina so retornadas. Representado pela Figura 37,
encontra-se uma parte da exibio do tipo melitina.
Quando uma protena possui estrutura terciria (experimentalmente resolvida ou
modelada durante o projeto) estar indicado no resultado, um link para as informaes da
estrutura 3D dessa protena. Na Figura 37, pode-se observar que a primeira seqncia
retornada possui estrutura 3D. Quando usurio acessar este link, outra tela de exibio se
abrir para apresentar os dados referentes quela estrutura, como representado na Figura 38.

52

Figura 37 Exibio das informaes de seqncias de melitinas. Quando uma protena possuir estrutura
3D, haver um link, que quando acessado disponibilizar as informaes sobre a estrutura.

A primeira seqncia demonstrada na Figura 37 possui estrutura conhecida.


possvel, se o usurio desejar, visualizar essas informaes.
Na Figura 38, observa-se as informaes referentes estrutura 1bh1. Alm dessas
informaes e da representao grfica da estrutura, o sistema permite, que seja realizado o
download da estrutura no formato PDB. Tambm possvel, ao usurio, interagir com a
estrutura atravs do plugin do JMol28 implementado no sistema, que permite essa interao. O
JMol, permite a visualizao grfica da protena, e diversas interaes esto disponveis ao
usurio. Essas opes esto representadas na Figura 39.

28

http://jmol.sourceforge.net/

53

Figura 38 Informaes sobre estrutura 3D. Alm dessas informaes o usurio pode realizar o download
da estrutura, em formato fasta, e tambm interagir com a estrutura atravs de um plugin do JMol.

Figura 39 Representao da estrutura de cdigo PDB 1bh1, utilizando um plugin do JMol. O usurio
pode interagir com a estrutura de diversas maneiras, dependendo da informao que busca.

54

O sistema possui tambm, um link de Ajuda, onde so encontradas as perguntas


mais freqentemente respondidas (FAQs), um pequeno manual do sistema, e algumas
informaes sobre a realizao das modelagens.
Uma tela de Contato onde constam os e-mails dos responsveis pelo sistema e
tambm uma tela onde o usurio pode interagir atravs de mensagens, na tela Fale Conosco.
E por fim, nos Links, encontram-se os principais endereos na rede, de
laboratrios, softwares e afins, relacionados com o projeto.

55

4 CONCLUSES
Mesmo com o grande nmero de depsitos, de novas resolues de estruturas
proticas, que esto ocorrendo atualmente, o nmero total de estruturas conhecidas bem
inferior ao nmero de seqenciamentos que foram realizados e armazenados em bancos de
dados. Para tentar equilibrar esses nmeros, a modelagem molecular computacional vem
sendo utilizada, e por apresentar os melhores resultados, a modelagem comparativa, tambm
conhecida por modelagem por homologia, vem sendo aplicada cada vez mais, na predio de
estruturas proticas de possveis frmacos.
Embora este mtodo terico seja limitado devido dependncia por estruturas
resolvidas, a modelagem por homologia foi aplicada neste trabalho e apresentou dados
satisfatrios e a validao dos modelos apresentou bons resultados. Os modelos obtidos no
projeto e apresentados aqui podem ser aplicados em estudos de mecanismos catalticos e
tambm no desenho racional de frmacos baseados em estruturas.
Bancos de dados biolgicos so de extrema importncia para o armazenamento e
gerenciamento das mais diversas informaes provindas das pesquisas atuais. Seja com
genomas, proteomas, resoluo de estruturas, eles so o ponto central para que as informaes
sejam propagadas. Todas as informaes coletadas durante o projeto, juntamente com os
melhores modelos gerados esto armazenados no sistema BDModel. Este sistema, que
tambm apresentado aqui, foi um dos objetivos do projeto.
O sistema BDModel centraliza informaes de estruturas proticas que compem
o veneno das Apis mellifera, armazenando seqncias primrias, estruturas 3D e modelos 3D
gerados durante o projeto. Encontram-se armazenados no banco de dados do sistema, 95
seqncias primrias contendo suas informaes principais, relacionadas com 9 estruturas 3D
com suas principais informaes. Tambm faz parte do banco de dados os 5 melhores
modelos gerados para as seqncias-alvo, com algumas informaes, como por exemplo, os
arquivos de validao.
Disponvel

na

Internet

atravs

do

endereo

eletrnico

(http://gbi.fmrp.usp.br/bdmodel), qualquer usurio que desejar pode interagir com o sistema


sem restries.
Novas estruturas 3D, e at mesmo, novas seqncias primrias podero ser
inseridas pelo administrador do sistema, para atualizao e enriquecimento do banco de dados
estruturado.
56

Como prosseguimento deste trabalho, melhorias, como a possibilidade de incluir


mdulos automatizados para gerao de modelos 3D, ou ento, viabilizar o sistema para
interao com os usurios atravs de depsitos de modelos gerados por eles, podem ser
realizadas, e mecanismos de administrao podem ser aperfeioados. Outras tcnicas de
otimizao dos modelos gerados, tambm podem ser empregadas, buscando modelos
melhores.
A participao de pesquisadores das reas biolgicas proporcionou confiabilidade
nos dados armazenados, tornando o sistema BDModel mais familiar e claro queles usurios
que realmente iro interagir com o sistema.
Assim, as modelagens realizadas e o sistema BDModel, cumpre os requisitos e os
objetivos previamente propostos do projeto, os modelos obtidos foram validados e o sistema
mostra-se eficiente em suas principais funcionalidades, como busca e exibio das
informaes de estruturas e seqncias de protenas contidas no veneno de abelhas.

57

REFERNCIAS BIBLIOGRFICAS
ALTSCHUL, S. F.; GISH, W.; MILLER, W.; MEYERS, E. W.; LIPMAN, D.J. Basic
local alignment search tool. Journal of Molecular Biology. v. 215, p. 403-410, 1990.
ANDERSON, A.C. The Process of Structure-Based Drug Design. Chemistry &
Biology. 10, 787-797, 2003.
BENNER, S. A.; CANNAROZZI, G.; GERLOFF, D.; TURCOTTE, M.;
CHEVANAYAGAM, G. Chemical Reviews. p. 2725-2844, 1997.
BERMAN, H. M.; WESTBROOK, J.; FENG, G.; GILLILAND, G.; BHAT, T.N.;
WEISSIG, H.; SHINDYALOV, I. N.; BOURNE, P. E. The Protein Data Bank. Nucleic Acids
Res. V. 28, p. 235-242, 2000.
BROADMAN, J. Bee Venom - The Natural Curative for Arthritis and Rheumatism.
New York: Putnam and Sons. p.224, 1962.
CHANG,Y.H. & BLIVEN,M.L. Anti-arthritic effect of bee venom, Agents Actions,
9: 205-11. 1979.
COSTA NETO, E. M.; PACHECO, J. M. Utilizao medicinal de insetos no povoado
de Pedra Branca, Santa Terezinha, Bahia, Brasil. Biotemas. v.18, p. 113 - 133, 2005.
DALFONSO, G.; TRAMONTANO, A.; LAHM, A. Structural conservation in singledomain proteins: implications for homology modeling. Journal of Structural Biology. v.
134, p. 246-256, 2001.
DAVILA, M.; MARCHINI L. C., Polinizao realizada por abelhas em culturas de
importncia econmica no Brasil. Boletim da Indstria animal. Nova Odessa, v.62, n.1,
p.79-90, 2005.
DEANE, C. M.; BLUNDELL, T. L. Protein comparative modelling and drug
discovery. In WERMUTH, C. G. The Practice of Medicinal Chemistry. London, Elsevier
Academic Press, 2003.

58

FRANA, F.O.S.; MEDEIROS, C. R. Acidentes por Abelhas e Vespas. In: Cardoso J.


L. C., Frana F. O. S., Mlaque C. M. S., Jr. Haddad V., Wen F. H..Animais Peonhentos no
Brasil. 1 Edio. Sarvier, c. 26, p. 244-245, 2003.
FISER, A.; SALI, A. MODELLER: generation and refinement of homology-based
protein structure models. In Methods in Enzymology, C.W. Carter and R.M. Sweet, eds.
Academic Press, San Diego, 374, p. 463-493, 2003.
GIBAS, C.; JAMBECK, P. Desenvolvendo Bioinformtica: ferramentas de
software para aplicaes em biologia. Traduo Milarepa Ltda.- Rio de Janeiro: Campus,
2001.
GONALVES, L.S. Expanso da apicultura brasileira e suas perspectivas em
relao ao mercado apcola internacional. Anais do XV Congresso Brasileiro de Apicultura
- Natal-RN, 2004.
GUEX, N.; PEITSCH, M.C. Swiss-model and swiss-pdb viewer: Na environment for
comparative protein modeling. Electrophoresis, 18, p.2714, 1997.
HABERMANN, E. Bee and wasp venoms. Science. 1, p.314, 1972.
HIGGINS, D.; THOMPSON, J.; GIBSON, T.; THOMPSON, J.D.; HIGGINS, D.G.;
GIBSON, T.J. CLUSTAL W: improving the sensitivity of progressivemultiple sequence
alignment through sequence weighting,position-specific gap penalties and weight matrix
choice. Nucleic Acids Research. 22 p. 4673-4680, 1994.
HILLISCH, A.; PINEDA, L. F.; HILGENFELD, R. Utility of homology models in the
drug discovery process. Drug Discovery Today. v. 09, p. 659-669, 2004.
HLTJE, H. D.; SIPPL, W.; ROGNAN, D.; FOLKERS, G. Introduction to
comparative protein modeling. In Molecular Modeling: Basic Principles and Applications.
Weinheim: Wiley-VCH, 2003.
HOOFT, R. W. W.; VRIEND, G.; SANDER, C.; ABOLA, E. E.; Nature. 381, p. 272,
1996

59

LASKOWSKI, R. A.; MACARTHUR, M. W.; MOSS D. S.; THORNTON, J. M..


PROCHECK: a program to check the stereochemical quality of protein structures. Journal of
Applied Crystallography. 26, p.283-291, 1993.
LUTHY, R., BOWIE, J.U.; EISENBERG, D. Assessment of protein models with
three-dimentional profiles. Nature. 356: 83-85, 1992.
MAIA, A. B. O potencial teraputico da apitoxina. Mensagem Doce. 66: 15-22. 2002.
MART-RENOM, M.A.; STUART, A.C.; FISER, A.; SNCHEZ, R.; MELO, F.;
ALI, A. Comparative protein structure modeling of genes and genomes. Annu. Rev.
Biophys. Biomol. Struct., 29, 291325, 2000.
MUNIZ, J. R. C. Aplicao da bioinformtica nos estudos dos genes e enzimas
envolvidos na sntese da gomafastidiana produzida pela Xylela fastidiosa. 124p.
Dissertao (Mestrado) - Instituto de Fsica de So Carlos, Universidade de So Paulo, So
Carlos, 2003.
NEEDLEMAN, S.B. & WUNSCH, C.D. A General Method Applicable to the Search
for Similarites in the Amino Acid Sequence of Two Proteins. Journal of Molecular Biology.
48:443-453., 1970.
OWEN, M. D.; PFAFF, L. A. Melittin synthesis in the venom system of the honey bee
(Apis mellifera L.). Toxicon. 33, 1181-8, 1995.
PIEMOLINI,

L.

T.,

2004,

Modelagem

Estrutural

da

PHA

Sintase

de

Chromobacterium violaceum para Estudos de Mutao Stio-Dirigida, Departamento de


Engenharia Qumica e Engenharia de Alimentos, Universidade Federal de Santa Catarina,
Florianpolis, Brasil.
PONTIUS, J.; RICHELLE, J.; WODAK, S. J. Journal of Molecular Biology. v. 264,
p 121, 1996.
PRESSMAN, R. S. Software Engineering: A Practitioner's Approach. Thirth
Edition, McGraw-Hill, 1991.

60

RAMACHANDRAN, G. N.; SASISEKHARAN, V.; Advances in Protein


Chemistry. v. 23, p. 283, 1968.
RSSLE, S. C. S., Desenvolvimento de um Sistema Computacional para a
Modelagem Comparativa em Genmica Estrutural: Anlise de Seqncias do Genoma da
Gluconacetobacter diazotrophicus. D.Sc., Instituto de Biofsica Carlos Chagas Filho,
Universidade Federal do Rio de Janeiro, Rio de Janeiro, Brasil, 2004.
SALI, A. 100,000 protein structures for the biologist. Nature Structural &
Molecular Biology. v. 05, p. 1029-1032, 1998.
SALI, A.; BLUNDELL, T. L. Comparative protein modeling by satisfaction of spatial
restraints. Journal of Molecular Biology. v. 234, p. 779-815, 1993.
SNCHEZ, R.; SALI, A. Evaluation of comparative protein structure modeling by
modeler-3. PROTEINS: Structure, Function and Genetics, 29: 50-58, 1997.
SAUDER, J. M.; ARTHUR, J. W.; DUNBRACK, R. L. Proteins. 40, 6, 2000.
SCHAFFERHANS, A.; KLEBE, G. Docking ligands onto binding site representations
derived from proteins. Journal of Molecular Biology. v. 307, p. 407-427, 2001.
SCHIRMER, L.R. Abelhas ecolgicas. So Paulo. Nobel, p. 218, 1986.
SCHWEDE, T.; KOPP, J.; GUEX, N.; PEITSCH, M. C.

SWISS-MODEL: an

automated protein homology-modeling server. Nucleic Acids Research. v. 31, p. 3381-3385,


2003.
SILVA FILHO, A. Arquitetura de Software, Editora Campus, 2002.
SILVA, V. B.; Estudos de modelagem molecular e relao estrutura atividade da
oncoprotena hnRNP K e ligantes. Faculdade de Cincias Farmacuticas de Ribeiro Preto,
Universidade de So Paulo, Brasil, 2007.
SILVA, V. B.; SILVA, C. H. T. P. Modelagem molecular de protenas-alvo por
homologia estrutural. Revista Eletrnica de Farmcia, v. 04, p. 15-26, 2007.

61

TEOREY, T.; LIGHTSTONE, S.; NADEAU, T. Projeto e modelagem de bancos de


dados. Rio de Janeiro. Elsevier, 2007.
VITKUP, D.; MELAMUD, E.; MOULT, J.; SANDER, C. Completeness in structural
genomics. Nature Structural & Molecular Biology. v. 08, p. 559-566, 2001.
VRIEND, G. WHAT IF: A molecular modeling and drug design program. Journal
Molecular Graphics. p. 52-56, 1990.
VRIEND, G.; SANDER, C. Quality control of protein models: directional atomic
contact analysis. Journal of Applied Crystallography, v. 26, p. 47-60, 1993.
WESSELIUS, T.; HEERSEMA, D. J.; MOSTERT, J. P.; HEERINGS, M.;
ADMIRAAL-BEHLOUL, F.; TALEBIAN, A.; VAN BUCHEM, M. A.; DE KEYSER, J. A
randomized

crossover

study

of

bee

sting

therapy

for

multiple

sclerosis

Neurology, 65: 1764 1768, 2005.

62

Potrebbero piacerti anche