Sei sulla pagina 1di 35

Introduo Bioinformtica

Ronaldo Rodrigues Ferreira


Centro de Biologia Genmica e Molecular (PUCRS) Instituto de Informtica (UFRGS)

Uberaba, junho de 2005

Objetivos

O que Bioinformtica Bioinformtica versus Biocomputao Dilogo entre bilogos moleculares e cientistas da computao Bioinformtica: protemica e genmica A Bioinformtica no Brasil caso Genesul A Bioinformtica e a iniciativa privada Sequenciamento de genomas: tcnicas e equipamentos Bases de Dados biolgicos Anotao de Genomas Softwares Principais locais de pesquisa no Brasil em Bioinformtica Congressos

O que Bioinformtica

Desenvolvimento de ferramentas e mtodos computacionais para anlise, manipulao, construo, edio e gerenciamento de dados biolgicos. Anlise em laboratrio de dados biolgicos difcil e custosa. Portanto, tcnicas computacionais so essenciais [1].

[1] Machine Learning Approaches to Gene Recognition Mark W. Craven and Jude W. Shavlik IEEE AI in Molecular Biology (1994)

Bioinformtica
versus

Biocomputao

... Or to come right to the point, how do we train bacteria to make transistors? Seymour Cray pai do supercomputador [2]

[2] FORBES, Nancy / Imitation of Life: How Biology is Inspiring Computing / MIT Press (2004)

Dilogo entre bilogos moleculares e cientistas da computao

Falta de uma formao multidisciplinar Objetos de estudo diferentes

Bioinformtica: Protemica e Genmica

Protemica ou Bioinformtica Estrutural: Predio de estrutura de protenas Visualizao 3D de estruturas proticas

Genmica: Anlise, edio, manipulao de Genomas Banco de Dados biolgicos Genmica funcional Anotao de genomas

A Bioinformtica no Brasil: caso Genesul

Comeou como uma iniciativa da Coopercitrus e Fapesp com o objetivo de sequenciar o genoma completo da Xylella fastidiosa. http://www.xylella.lncc.br/

Diversos projetos de sequenciamento esto em curso no Pas: brGene - http://www.brgene.lncc.br/ OMM - http://www.omm.lncc.br/ PIGS - http://www.genesul.lncc.br/ Leifsonia xyli - http://www.leifsonia.lncc.br/ Genoma Caf - http://www.cenargen.embrapa.br/biotec/genomacafe/index.html Genoma Banana - http://genoma.embrapa.br/musa/index.html/ RioGene - http://www.riogene.lncc.br/ entre outros

A Bioinformtica no Brasil: caso Genesul

Genesul
Rede de laboratrios de Bioinformtica, de Sequenciamento e de Dignstico dos Estados de Santa Catarina, do Paran e do Rio Grande do Sul. O projeto financiado pelo MCT e pela FAPERGS. O projeto tem como objetivo sequenciar a bactria Mycoplasma hyopneumoniae. Essa bactria causa grandes danos ao porco, o que prejudica a produo no Sul do Pas. Aps o sequenciamento, o objetivo o desenvolvimento de vacinas. ESTADO ATUAL: Mycoplasma hyopneumoniae, Mycoplasma hyopneumoniae 7448 e Mycoplasma hyopneumoniae 7442 j sequenciados

A Bioinformtica e a iniciativa privada

O sequenciamento de genomas atrai grande interesse comercial. Coopercitrus e Embrapa so hoje as principais empresas que usam da bioinformtica para auxiliar o estudo dos genomas. A Bioinformtica acelera os estudos do genoma. Velocidade imprescindvel no mercado.

Sequenciamento de genomas: tcnicas e equipamentos

Sequenciamento: tcnicas

Extenso direta da fita a partir do primer de uma fita de nica face. Utiliza-se uma DNA polimerase. Os primers tm comprimento de 18 a 25 bases.

Sequenciamento de genomas: tcnicas e equipamentos

Sequenciamento: tcnicas

Terminaes em 4 didexidos (uma para cada base). A polimerase no se extende aps essas terminaes. So formadas diversas sequncias de vrios tamanhos. Produzem sequncias terminadas sempre em A, C, G e T.

10

Sequenciamento de genomas: tcnicas e equipamentos

Sequenciamento: tcnicas

Utiliza-se marcadores com ndices de refrao diferentes (um para cada base). Utilizado para sequenciamento automatizado. Os produtos so separados por tamanho.

11

Sequenciamento de genomas: tcnicas e equipamentos

Shotgun

Particionar pequenas pores de DNA em vetores e depois montar a sequncia

12

Sequenciamento de genomas: tcnicas e equipamentos

Shotgun

O DNA Genmico partido em pedaos de tamanho estipulado

13

Sequenciamento de genomas: tcnicas e equipamentos

Shotgun

O DNA inserido em vetores universais

14

Sequenciamento de genomas: tcnicas e equipamentos

Shotgun

Reaes de sequenciamento so realizadas com um primer universal. As reaes so aleatrias.

15

Sequenciamento de genomas: tcnicas e equipamentos

Shotgun

Os reads so montados em contigs e regies single-stranded (h sequncia para somente uma fita). Essas regies so identificadas para posterior sequenciamento, produzindo assim a sequncia completa.

16

Sequenciamento de genomas: tcnicas e equipamentos

Shotgun A tcnica Shotgun aplicvel a tamanhos diversos de DNA. A nica considerao sobre o tamanho da poro do vetor de clonagem. Essa deve ser a menor possvel. Por exemplo, a porcentagem de DNA do Cosmdio de aproximadamente 20%. Com isso, ao resequenciar um DNA que usa o Cosmdio como vetor de clonagem, 20% dos reads desse DNA so perdidos.

17

Bases de Dados Biolgicos

Nucleotdeos / Aminocidos: GenBank Protenas: Swiss-Prot TrEMBL Motivos: Prosite Interpro Estruturas 3D: PDB

18

Bases de Dados Biolgicos

NCBI - GenBank
O National Center of Biotechnology Information comeou suas atividades em 1988. Seus principais objetivos so: Estabelecimento de Banco de Dados pblicos Pesquisa em Biologia Computacional e processos ligados doenas Desenvolvimento de Software Anlise de dados de genomas e informtica mdica

OBS: Ao contrrio do Swiss-Prot, o Genbank no curado. Portanto, os seus dados podem possuir inconsistncias.

19

Bases de Dados Biolgicos

NCBI - GenBank

20

http://www.ncbi.nlm.nih.gov/

Bases de Dados Biolgicos

Swiss-Prot - TrEMBL
O Swiss-Prot uma base de dados curada de protenas que tem como objetivo: prover um alto nvel de anotao (descrio da funo de protenas, seus domnios estruturais, modificaes ps-translacionais, variantes, etc.) um nvel mnimo de redundncia alta integrao com outras bases de dados. O TrEMBL um suplemento de anotao por computador do Swiss-Prot que contm todas as sequncias de nucleotdeos do EMBL ainda no integradas no Swiss-Prot.

21

European Molecular Biology Laboratory (EMBL) http://www.embl.org

Bases de Dados Biolgicos

Swiss-Prot - TrEMBL

Incio: 1986

22

http://br.expasy.org/sprot/

Bases de Dados Biolgicos

PDB

O Protein Data Bank armazena estruturas 3D de protenas e macromolculas. http://www.rcsb.org/pdb/index.html

23

Bases de Dados Biolgicos

PDB

24

http://www.rcsb.org/pdb/index.html

Anotao de genomas

Descubrir, analisar, mapear, pesquisar as funes e caractersticas dos genes no genoma dos organismos

25

Softwares de Bioinformtica

Montagem e Consenso Phred Phrap Consed Alinhamento Sequencher ClustalW Staden Edio BioEdit Sequencher Propsitos Gerais EMBOSS

26

Softwares de Bioinformtica

Phred
Interpreta os arquivos de sequenciamento de DNA, verifica os nucleotdeos e designa valores de qualidade para cada base.

Phrap
Montagem de sequncias de DNA obtidas atravs do processo de Shotgun.

Consed
Visualizao, edio e acabamento da montagem de sequncias criadas com o Phrap.

27

http://www.phrap.org

Softwares de Bioinformtica

Staden Package
Pacote de softwares de Bioinformtica para: Montagem (gap, pregap, vectorClip, screenSeq, findRenz, trev) Deteco de Mutaes (traceDiff, hetscan, gap4) Anlise de Sequncias (spin, makeWeights) Manipulao e Leitura de arquivos de sequenciamento (convertTrace, getComment)

28

http://staden.sourceforge.net/

Softwares de Bioinformtica

ClustalW
Software de propsitos gerais para alinhamento mltiplo de DNA ou protenas. Ele produz alinhamentos mltiplos de sequncias divergentes com significado biolgico. Ele calcula o melhor alinhamento para as sequncias, alinha-as umas com as outras.Assim, as identidades, similaridades e diferenas entre as sequncias podem ser vistas. Relao evolutiva pode ser visualizada atravs de Cladogramas ou Filogramas.

29

Softwares de Bioinformtica

EMBOSS

European Molecular Biology Open Software Suite


Nasceu da necessidade dos bilogos moleculares por softwares especficos para o seu campo de estudos e da necessidade de uma plataforma de propsitos gerais para o desenvolvimento acadmico de software de anlise de sequenciamento [4]. O EMBOSS composto por mais de cem aplicativos [4]. H a possibilidade da utilizao de qualquer formato de sequncias. Novos formatos so facilmente adicionados. Alm do suporte s bases pblicas, possvel utilizar o EMBOSS com bases privadas [4].

http://emboss.sourceforge.net/

30

[4] EMBOSS: The European Molecular Biology Open Software Suite / Rice,P. Longden,I. and Bleasby,A. Trends in Genetics 16, (6) pp276277

Locais de Pesquisa em Bioinformtica no Brasil

Nordeste: Laboratrio de Bioinformtica da UFPE http://biolab.cin.ufpe.br/ Centro Oeste: EMBRAPA http://asparagin.cenargen.embrapa.br/pt/ Sudeste: UFRJ http://www.bioinfo.ufrj.br/ LNCC http://www.lncc.br/~labinfo USP So Paulo http://www.ime.usp.br/posbioinfo/ UFMG http://www.ufmg.br/bioinformatica/ FIOCRUZ UNICAMP http://www.lbi.ic.unicamp.br Sul: PUCRS UFRGS http://www.inf.ufrgs.br/~crym/LabBioInf/

31

Locais de Pesquisa em Bioinformtica no Brasil

Congresso Nacionais Congresso Brasileiro de Gentica Sociedade Brasileira de Gentica http://www.sbg.org.br Simpsio Brasileiro em Bioinformtica Sociedade Brasileira de Computao http://www.unisinos.br/simposio/bsb/index_port.php Congressos Internacionais ISMB http://www.iscb.org/ismb2005/sigs.html RECOMB http://www.broad.mit.edu/recomb2005/ International Society for Computational Biology http://www.iscb.org/

32

Referncias Bibliogrficas

[1] Machine Learning Approaches to Gene Recognition Mark W. Craven and Jude W. Shavlik IEEE AI in Molecular Biology (1994) [2] Imitation of Life: How Biology is Inspiring Computing FORBES, Nancy / MIT Press (2004) [3] Slides da disciplina Tpicos Especiais em Computao VI: Introduo Bioinformtica do semestre 2005/1 do Insituto de Informtica da UFRGS Prof. Dra. Ana Lcia C. Bazzan (2005) [4] EMBOSS: The European Molecular Biology Open Software Suite Rice,P. Longden,I. and Bleasby,A. -Trends in Genetics 16, (6) pp276277 [5] Bioinformatic tools for DNA/protein sequence analysis, functional assignment of genes and protein classification Rehm, B.H.A . -Applied Microbiology Biotechnology 57, pp579-592 (2001)

33

www.inf.ufrgs.br/~rrferreira/bioinf rrferreira@inf.ufrgs.br

Potrebbero piacerti anche