Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Anlisis de secuencias
Anlisis de secuencias
1)Introduccin
2)Secuenciacin
3)Como utilizar las tcnicas de secuenciacin
4)Anlisis de secuencias
Introduccin
METAGENMICA
Definicin:
El estudio de metagenomas:
Metagenoma: el conjunto de todos los genomas de
todos los (micro)organismos en un medio ambiente
determinado Handelsman et al., 1998 Chemistry & Biology.
Genoma: Conjunto de los genes de un individuo o de una
especie.
Gen: Secuencia de ADN que constituye la unidad funcional
para la transmisin de los caracteres hereditarios.
Introduccin
Transcripcin
Traduccin
Protena
adeninaA timinaT citosinaC guaninaG
Introduccin
Introduccin
Diversidad filogentica:
Que hay all?
Metagenmica funcional
Que hace all?
Cmo vive y convive?
Enzimas
Rutas metablicas
Problemas y
consideraciones
Tcnicas
Lisis, extraccin, purificacin y obtencin de ADN
Tipo de vector
Enriquecer ?
La bacteria hospedadora
Tamao de la librera
Secuenciar
Secuenciar
Secuenciacin: Clsica
Secuenciar
Secuenciacin
Primer walking
Cebador del vector
Secuenciar
Secuenciar
Secuenciacin
Estrategias de secuenciacin
Shotgun sequencing
Librera
(meta)genmica
Secuenciacin: tamaos
5) Diseo experimental
1) Diseo de cebadores
2) Cuanto ADN, etc.
Metagenmica filogentica
Objetivo y estrategia:
Metagenmica filogentica
Identificacin y clasificacin de bacterias
Se basa en genes conservados que pueden ser utilizados como anclas
filogenticos
Basada en homologa con genes conocidas
Estrategia:
1) Crear libreras de genes conservados
2) Buscar en los datos obtenidas tras la secuenciacin masiva
Basada en la secuenciacin masiva
1) Ensamblar genomas enteras
2) Identificar la presencia de organismos segn las secuencias
obtenidas tras la secuenciacin masiva
Metagenmica filogentica
Genes conservados:
Necesarios para el funcionamiento normal de la bacteria
Una copia
No transferencia horizontal
Genes
Actividad
Produccin de energa
Asimilacin de nitrgeno
recA (recombinasa)
radA (protena de reparacin ADN )
Sistemas de recombinacin y
reparacin de ADN
hsp70 ( chaperona)
Plegamiento de protenas
Metagenmica filogentica
16S rARN
Problemas:
1.- Amplificacin preferencial durante PCR
a.- primer mismatches
b.- hibridacin diferencial por oligmeros
a ADN molde
2.- Formacin de artefactos en el PCR
a.- formacin de heteroduplexes
b.- formacin de quimeras
3.- Mltiple secuencias de 16S rARN en un
genoma
Metagenmica funcional
Objetivo y estrategia:
Metagenmica funcional
Identificacin de protenas, actividades enzimticas, rutas
metablicas o productos
Basada en homologa con genes conocidas
Estrategia:
1) Crear libreras de genes utilizando cebadores (semi)especificas
2) Buscar en los datos obtenidas tras la secuenciacin masiva
3) Buscar en libreras metagenmica mediante sondas (hibridacin)
Basada en funcin
Estrategia:
1) Analizar libreras metagenmica por la funcin (escrutinios)
2) Bsquedas de funciones segn anotacin o profile en los datos
obtenidas tras la secuenciacin masiva
ln (1-P)
ln (1- (T-X/Gz))
ln (1-P)
ln (1- (T-X/Gz))
El factor G
Tamao medio
Animales
5000 Mb
Planta
5000 Mb
Hongo
10 Mb
Protozoa
1000 Mb
Bacteria
5 Mb
Archea
3 Mb
1
1x102
1x104
Tamao genmico
1x106 Mb
ln (1-P)
ln (1- (T-X/Gz))
El factor z
Estimaciones de nmeros de especies y bacterias en
distintos medio ambientes
1.- suelo 10000 especies o 1x106-9 bacteria /g
2.- marino 2000 especies o 1x106 bacteria/ml
3.- intestino humano 1000 especies o 1x10 13-14 bacteria
ln (1-0,9)
ln (1- ((10-1,5)/ (6x103 1))
= 1624 clones 16 Mb
Incrementa el factor z
T = 40 kb
X = 1,5 kb
G 5x103 kb
z = 2000 genomas
ln (1-0,9)
= 6,0 x 105 clones 24 Gb
ln (1- ((40-1,5)/ (5x103 2000))
Incrementa el factor G
ln (1-0,9)
= 7,5 x 105 clones 30 Gb
ln (1- (((40-1,5)/ ((5x103 2000) + (100x103 20) + (50x103 10) )
Amplificacin en emulsin
454 Pirosecuenciacin
Regiones
Numero de lecturas
1000000
450000- 650000
160000 250000
80000 120000
16
20000- 32000
454 Pirosecuenciacin
Imagen de
las seales
luz
Escalar
Unin a nanopartculas amplificacin en emulsin
Diseo experimental
Pirosecueciacin ILLUMINA
Tcnica
Aplicacin
Divisiones posible
del placa
Shotgun libraras
Amplicon libraras
Re-secuenciacin
Secuenciacin
Transcriptomica
SOLiD
1,1/2,1/4,1/8
8 carriles
1, 1/4,1/8
Diseo experimental
Calidad del ADN:
- doble cadena, no degradado, y sin partculas
- pura (purificado por columna o de gel de agarosa
- A260/280 valor de 1,8 o ms
Cantidad de ADN
1.Pirosecuenciacin
HMW(>1.5kb)
LMW(70~500bp)
Paired End
5~10g
1~5g
5~10g
Metagenmica filogentica
V7
V6
V4
V5
V8
V3
V1
V1
aaattgaagagtttgatcatggctcagattgaacgctggcggcaggcctaacacatgcaagtcgaacgGTAACAGGAAGAAGCTTGCTCTTTGCTGACGAGtggcggacgggtgagtaatgt
V2
ctgggaaactgccTGATGGAGGGGGATAACTACTGGAAACGGTAGCTAATACCGCATAACGTCGCAAGACCAAAGAGGGGGACCTTCGGGCCTCTTGCCATCGgatgtgcccagatgggatt
agctagtaggtggggtaacggctcacctaggcgacgatccctagctggtctgagaggatgaccagccacactggaactgagacacggtccagactcctacgggaggcagcagtggggaatat
V3
tgcacaatgggcgcaagcctgatgcagccatgccgcgtgtatgaagaaggccttcgggttgtaaagtactttCAGCGGGGAGGAAGGGAGTAAAGTTAATACCTTTGCTCATTGACGTTACC
V9
CGCAGAAgaagcaccggctaactccgtgccagcagccgcggtaatacggagggtgcaagcgttaatcggaattactgggcgtaaagcgcacgcaggcggtTTGTTAAGTCAGATGTGAAATC
V2
V4
CCCGGGCTCAACCTGGGAACTGCATCTGATACTGGCAAGCttgagtctcgtagaggggggtagaattccaggtgtagcggtgaaatgcgtagagatctggaggaataccggtggcgaaggcg
V5
gccccctggacgaagactgacgctcaggtgcgaaagcgtggggagcaaacaggattagataccctggtagtccacgccgtaaacgatgtcgacttGGAGGTTGTGCCCTTGAGGCGTGGCTT
CCggagctaacgcgttaagtcgaccgcctggggagtacggccgcaaggttaaaactcaaatgaattgacgggggcccgcacaagcggtggagcatgtggtttaattcgatgcaacgcgaaga
V6
V7
accttacctggtcttgacatccACGGAAGTTTTCAGAGATGAGAATGTGCCTTCGGGAAccgtgagacaggtgctgcatggctgtcgtcagctcgtgttgtgaaatgttgggttaagtcccg
caacgagcgcaacccttaTCCTTTGTTGCCAGCGGTCCGGCCGGGAACTCAAAGGAgactgccagtgataaactggaggaaggtggggatgacgtcaagtcatcatggcccttacgaccagg
V8
gctacacacgtgctacaatggCGCATACAAAGAGAAGCGACCTCGCGAGAGCAAGCGGACCTCATAAAGTGCGTcgtagtccggattggagtctgcaactcgactccatgaagtcggaatcg
V9
ctagtaatcgtggatcagaatgccacggtgaatacgttcccgggccttgtacacaccgcccgtcacaccatgggagtgggttgcaaaagaaGTAGGTAGCTTAACCTTCGGGAGGGCGCTTA
ccactttgtgattcatgactggggtgaagtcgtaacaaggtaaccgtaggggaacctgcggttggatcacctcctta
Secuenciacin: Como
2g o mas a una
concentracin de 100 ng/l
Mezcla con cantidades
iguales de cada amplicon:
10 l de 10ng/l
Anlisis de secuencias
Anlisis de datos
PIROSECUENCIACIN
Ribosomal database Project (RDP) Pyrosequencing Pipeline: http://pyro.cme.msu.edu/
1)
2)
Anlisis de datos
plsmido
DNA BASER
Anlisis de datos
Procesos:
1) Comprobar secuencias por artefactos: heteroduplexes, quimeras
2) Bsqueda de secuencias idnticas o parecidas en los bases de datos
3) Alineamiento de secuencias
Anlisis de datos
Anlisis de datos
Grado de biodiversidad:
1) Riqueza observada: Curvas de rarefaccin DOTUR, MOTHUR, ESPRIT
2) Riqueza especifica: ndice Chao
3) ndice Shannon-Wiener
OTU=operational taxonomic unit
80% similitud = filo
97% similitud = especie
No dif.
3% dif
10% dif.
20% dif.
31 esp.
8 filo
Anlisis de datos
Ensamblaje de fragmentos
Identificacin de genes (anotacin):
Metagene software: http://metagene.cb.k.u-tokyo.ac.jp/
BLAST: http://www.ncbi.nlm.nih.gov/Blast.cgi
GenDB: http://www.cebitec.uni-bielefeld.de/groups/brf/software/gendb_info/
MicHanThi : http://www.megx.net/michanthi/
JCoast: http://www.jcoast.net
Informacin filogentica:
Genome DB: http://www.ncbi.nlm.nih.gov/sites/genome
Ejemplos
Estudios metagenmicos de secuenciacin masiva de muestras del medio
ambientales y relacionados can la salud animal
Varios zonas
marinas
Varios manantiales
geotermales
Varios suelos eg.
terragenome
Ejemplos
Estudios metagenmicos
Medio ambiente
estudiado
Lecturas/ bp secuenciado
Resultados
Referencia
Biopelcula en un
efluente de minas
Mar de Sargasso
Venter et al 2004
Science 304:66-74
Global Ocean
Sampling
(41 muestras en 8000
km desde el Norte de
Ocano Atlntico a a
Sur del Ocano Pacifico
9 medioambientes:
Subterrneo, salino,
marino, agua dulce,
coral, microbialitos,
pescado, animal,
mosquito
Dinsdale et al 2008
Nature 452: 629-632
Ejemplos
Estudios metagenmicos
Medio ambiente
estudiado
Lecturas/ bp secuenciado
Resultados
Referencia
Oceano rtico, 8
muestras en distintas
localizaciones y
profundidades
Galand et al 2009
ISME J. 3: 860869
Grice et al 2009
Science 324: 11901192
Costello et al 2009
Science 326, 16941697
Intestino humano
5 manantiales
geotermales del parque
nacional de Yellowstone
con distintas
propiedades
fisicoqumicas.