Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Francisco Couto
Processamento de Dados
2015/16
Pgina Disciplina
http://moodle.ciencias.ulisboa.pt/course/view.php?id=2177
Quantidade
Growth of entries in DNA-sequence databases
Fonte: http://www.nature.com/nrg/journal/v5/n11/fig_tab/nrg1474_F1.html
Artigos cientficos
MEDLINE
over 21 million citations in total
Fonte: http://www.nlm.nih.gov/bsd/medline_cit_counts_yr_pub.html
Variedade
EBI: a data hub for bioinformatics in Europe
Source: http://www.slideshare.net/saymaztoma/emblebi
Multidisciplinariedade
Fonte: http://dbdmg.polito.it/twiki/bin/view/Public/Bioinformatics
Objetivo da Disciplina
Vantagens Extra
An Explosion Of Bioinformatics Careers
in Science of June 13, 2014 DOI
http://dx.doi.org/10.1126/science.opms.r1400143
http://www.finances.com/analyses-and-opinions/analysis-opinions/49771-global-bioinformatics-market-will-reach-usd-12542-4-million-2020.htm
Testemunhos
Experts agree that
the most successful bioinformaticians (and the ones
who land the jobs) are those who have a multitude of
skills
At Roche,
we offer continuous training in various areas and
encourage our staff to attend conferences, publish, or
pursue higher degrees
In An Explosion Of Bioinformatics Careers in Science of June 13, 2014
Docentes
Francisco Couto
Cordenador, T12, T11, TP11, TP12, TP15, TP16, TP17a
e TP17b
Sala 6.3.23
Horrio de Dvidas: Quintas, 15h30 - 16h30
http://www.di.fc.ul.pt/~fjmc
Joo Ferreira
Planeamento Tericas
1.
2.
3.
4.
5.
6.
7.
Manipulao de Texto
Manipulao de Ficheiros
Listas e Ciclos
Condies
Expresses Regulares
Bases de dados
Linguagens de Interrogao s Bases de
Dados (SQL)
Planeamento TPs
1.
2.
3.
4.
5.
Os trabalhos so individuais
Submeter todas as semanas um zip com o
material produzido
Faam os tutorias do Codecademy antes
Ferramentas:
Python e Access
Codecademy python
Bibliografia
Livros
Python for Biologists, by Dr. Martin Jones, 2013
Database Management Systems (third edition), R.
Ramakrishnan and J. Gehrke, McGraw-Hill, 2007
Introduction to Bioinformatics by Arthur M. Lesk, 2008
Tutorials:
Python from scratch
http://userpages.fu-berlin.de/digga/
W3Schools
http://www.w3schools.com/
Codeacademy
https://www.codecademy.com/
Avaliao
Trabalhos nas TPs
Peso 30% na nota final;
Nota individual de 0 a 2 em cada TP.
Avaliao periodica, ou seja no est disponvel na
poca especial.
Exame Escrito
Peso 70% nota final;
Nota individual de 0 a 20;
Nota mnima 8,5
Exame
Ideia
Conjunto de perguntas (tericas e prticas) de
resposta mltipla
Mais um ou dois exerccios de desenvolvimento
PYTHON
O que o Python?
Linguagem popular de programao
Muito usada na bioinformtica
Python (interpretador) tambm uma aplicao que
se instala no computador:
Freeware
traduz as instrues do python para instrues que o
computador entende e executa.
20
O que um programa?
Conjunto de instrues escritas numa linguagem
(python) que pode ser interpretada pelo computador
Pode ser to simples como imprimir uma sequencia
de DNA no ecr:
print ('ACCTGGTAACCCGGAGATTCCAGCT');
21
22
Vantagens do Python
Linguagens de programao esto sobre-valorizadas
se depois precisar de usar Perl a adaptao ser fcil
Fcil iniciao
Syntax consistente
Paragrafao obrigatria
Biblioteca de funes extensa
Tem uma forma obvia de se resolver
Muito usada em biologia e no s
23
Instalar o Python
https://www.python.org/getit/
Verso 2.7
Mac OSX e Linux
Na maior parte dos casos j est instalado
Editor de texto
Notepad++
No usar Word
Usam caracteres especiais
24
DICAS DE PROGRAMAO
26
Erros sintticos
Erros tipogrficos como esquecer de um
Numa receita culinria: aroz em vez de arroz
Simples de corrigir
Leia as mensagem de erro com ateno e corrija
Verifique apenas os primeiros erros deixe os outros
para a prxima execuo
27
Erros Semnticos
O interpretador consegue executar o programa mas
no devolve o que estava espera
Numa receita culinria: acar em vez de arroz
28
DADOS
Armazenamento de Dados
DBMS
Uma base de dados uma coleco de dados
SGBD (Sistema de Gesto de Base de Dados)
DBMS (Database Management System)
Aplicao que apoia a manuteno e acesso a
grandes coleces de dados
SGBD Desvantagens
Aplicaes complexas de software
Desempenho inaceitvel para algumas
aplicaes
Aplicaes de tempo-real
Modelo Relacional
Composto por relaes
O esquema para uma relao especifica:
O seu nome
O nome de cada atributo (ou campo)
O tipo de cada atributo
Exemplo:
Students( sid: string, name: string, login: string, age:
integer, gpa: real)
* Age est incorrecto usado apenas para no complicar
Interrogaes ao SGBD
Exemplo:
Qual a fraco de estudantes na disciplina CS564 que
obteve uma nota superior a B7?
DML
insert, delete, update, select os dados
EXCEL vs CSV
EXCEL
Formato proprietrio
acesso restrito
CSV
Menos opes (formulas, formatao)
Mas acesso universal (qualquer editor de texto)
Tem o SQL
Est includo no Microsoft Office
Interface fcil
um SGBD muito limitado