Sei sulla pagina 1di 101

Tema 2

Introducción a la Genómica
Genómica Estructural
Genómica Comparada

ASIGNATURA: GENÓMICA Y PROTEÓMICA

Grado de Biotecnología
Curso 2017/18
Bases y Conceptos

•  Genómica:

“Conjunto de ciencias y técnicas dedicadas al estudio


integral del funcionamiento, el contenido, la evolución y el
origen de los genomas”.

“Es una de las áreas más vanguardistas de la biología. La


genómica usa conocimientos derivados de distintas
ciencias como la biología molecular, la bioquímica,
la informática, la estadística, las matemáticas, la física,
etc”.
Fuente: Wikipedia
Áreas de Conocimiento

Genómica •  Secuencia, genes


Estructural •  Organización, polimorfismos

Genómica •  Función de los genes


Funcional •  Regulación

Genómica •  Semejanzas y diferencias


Comparada •  Evolución
GENÓMICA
ESTRUCTURAL
Genómica Estructural
•  Se ocupa de la organización
y la secuencia de la
información genética
contenida en un genoma.

•  Genoma: conjunto de genes contenido en los


cromosomas

•  Eucariotas: ADN del núcleo, mitocondrias y


plastos
•  Procariotas: ADN del nucleoide
El genoma contiene toda la información de cómo
funciona un organismo

La Genómica se dedica a identificar los genes presentes en


los cromosomas y determinar cuál es su función
El genoma es como una receta de cocina que
contiene las instrucciones de cómo funciona un
organismo
TGGGTATTGATCGTCAGTCAGTCGTCATGAATGAGAGATCGGA
GCCTACTTGSe corta la cebolla en tiras y se pone en la bandeja
del horno con un poco de aceiteTTTGACTAGTCA ATGGSe parte
el pollo y se pone encima de la cebolla AGCCCTGATGCTASe
cortan las patatas y se añaden GCTAGCCATG Se añada sal e
hierbas aromáticas al gustoGGCTAGTCGTAGTCACCGTAGCGT
ATCGTTGCTAGCTATAGCTGGGCTAGCTAGCTGGGTATTGATC
GTCAGTCAGTCGTACC

La Genómica descifra esas instrucciones


Organización del Genoma
El Genoma Procariota
•  Prácticamente todo el ADN existe
en forma de una única copia y
codifica productos génicos
•  Organización compacta (poco espacio entre genes)
•  Es un 99% ADN codificante
•  Casi no hay repeticiones
•  No hay intrones
•  Los genes están organizados en operones
Operones
•  Una unidad genética funcional formada por un grupo o
complejo de genes capaces de ejercer una regulación de su
propia expresión por medio de los sustratos con los que
interactúan las proteínas codificadas por sus genes.
Operón Lac- Escherichia coli
El Genoma Procariota
El Genoma Eucariota
•  Compuesto por 2 o más moléculas de ADN linear
(cromosomas)
•  Segmentos de copias únicas (genes) y diferentes
familias de ADNs repetitivos
•  90% de ADN no codificante
•  Organización menos compacta (intrones)
•  Número de cromosomas puede variar desde 2n=2,
como en la Parascaris univalens, hasta números
bastante más elevados, como en el hombre 2n=46, o
en el girasol salvaje Helianthus Pauciflorus, donde
2n=102
Estructura del ADN

`It has not escaped our notice that the


specific pairing we have postulated
immediately suggests a possible
copying mechanism for the genetic
material’

Watson & Crick


Nature (1953)

Original drawing by Francis Crick


Descubrimiento de la estructura del ADN

•  El ADN fue identificado y aislado por Friedrich


Miescher en 1869

•  El trabajo de Rosalind Franklin sobre las


imágenes de difracción de rayos X de ADN
llevó al descubrimiento de la estructura de
doble hélice del ADN

Rosalind Franklin’s DNA image


Requisitos de una molécula para ser
material genético

•  Almacenar la información genética


▫  En forma de genes y código genético
•  Genera copias de sí mismo
▫  Proceso de replicación del ADN
•  Permitir que la información cambie
▫  Mutación
•  Debe gobernar la expresión del fenotipo
▫  Determina la función de los genes
Estructura del ADN

•  ADN= Ácido Desoxy


Ribonucléico

•  Compuesto por azúcares


(deoxirribosa), fosfatos y
bases nitrogenadas

•  Purinas: Adenina (A),


Guanina (G)
•  Pirimidinas: Citosina (C),
Thymina (T)
Estructura del ADN
T
A

G
C

Wikipedia and Lewin’s Genes X


Funciones del ADN

•  Almacena la información biológica hereditaria (genotipo


y fenotipo) y la transmite a la descendencia asegurando
la perpetuación de los organismos en el tiempo.

•  Controla y coordina todas las actividades y funciones


celulares que se produzcan en la célula.
Longitud del ADN

Entonces, ¿cuántos
kilómetros de ADN
tenemos en nuestro
cuerpo?

Más de 113 billones


de metros, o lo que es
lo mismo,
113.300.000.000 km
(más de 113 mil
millones de km !!!)
Empaquetamiento del ADN
•  3 billones de pares de bases en el núcleo
•  Cada núcleo contiene alrededor de 2 mentros de ADN
Cromosomas Cromátidas
Centrómero

Telómeros
Cromosomas
•  22 pares de cromosomas más los sexuales
•  Banding pattern – differences in GC contents
Cariotipo
El Genoma Humano

•  Término que se utiliza par describir la información


genética total (contenido de ADN) en las células
humanas.
•  Genoma nuclear: complejo (3.000 millones de pares de
bases y ≈20,500 genes).
•  Genoma mitocondrial: simple - 37 genes (2 genes de
ARNr, 22 genes de ARNt y 13 genes codificantes de
polipéptidos.
Descubrimiento de la estructura del ADN
ADN de copia única
Estructural: exones
(codifica proteínas
o ARNs)
Codificante
Genes
Regulador
(controla la
expresión del gen)
ADN de copia
única
Intrones
(intercalado dentro
No codificante de los genes)
(función
desconocida)
ADN intergénico
(separa los genes)
ADN codificante: Genes

•  Exones: codificantes
Porción
estructural •  Intrones: no codificantes

GENES

•  Secuencias promotoras
Porción
reguladora •  ADN no codificante
entre promotores
Estructura de un Gen
Codón de Gen estructural Codón de
iniciación terminación

Intrón 1 Intrón 2
5’ Promotor 3’
Exón 1 Exón 2 Exón 3

Secuencias transcritas
Región de
poliadenilación
ADN repetitivo
Genes repetidos en
tándem
Agrupado
Familias multigénicas
agrupadas
Codificante

Familias multigénicas
Disperso dispersas

ADN
Agrupado
repetitivo (regiones
Repeticiones en
heterocromáticas)
tándem (ADN satélite)
y altamente
repetitivo
No Bloques
codificante dispersos de -Minisatélites
Disperso (por todo repeticiones en -Microsatélites
el genoma) y tándem
moderadamente
repetitivo
Repeticiones -SINE: secuencias Alu
dispersas -LINE: secuencias kpn
Genes repetidos en tándem
Familias génicas clásicas •  Histonas
•  ARNr
Copias conservadas repetidas en tándem
•  ARNt
•  ARNsn
Histonas
H1 H4 H2B H3 H2A H1 H4 H2B H3 H2A
5’ 3’

10-40 repeticiones
ARNr

18S 5,8S 28S región intergénica 18S 5,8S 28S región intergénica
5’ 3’

>50 repeticiones
Familias multigénicas
Agrupadas o dispersas
Cluster de la α-Globina- Cromosoma 16

LCR Región intergénica ζ2 pseudogenes α2 α1 pseudogenes


5’ 3’

Cluster de la β-Globina- Cromosoma 11

LCR ε2 ϒA ϒB pseudogen δ β
5’ 3’
Pseudogen
•  Secuencias de ADN que
muestran una gran
similitud con genes
conocidos pero que no se
expresan. Pueden ejercer
funciones reguladoras.

•  Se encuentran distribuidos
por todo el genoma y son
de dos tipos:
•  procesados
•  no procesados
ADN repetitivo no codificante
Genes repetidos en
tándem
Agrupado
Familias multigénicas
agrupadas
Codificante

Familias multigénicas
Disperso dispersas

ADN
Agrupado
repetitivo (regiones
Repeticiones en
heterocromáticas)
tándem (ADN satélite)
y altamente
repetitivo
No Bloques
codificante dispersos de -Minisatélites
Disperso (por todo repeticiones en -Microsatélites
el genoma) y tándem
moderadamente
repetitivo
Repeticiones -SINE: secuencias Alu
dispersas -LINE: secuencias kpn
ADN repetitivo no codificante
•  ADN muy repetido en disposiciones o bloques de
repeticiones en tandem de una secuencia que
puede ser simple (1-10 nucleótidos) o compleja en
grado moderado (decenas o cientos de
nucleótidos)

•  Según sea el tamaño de la configuración pueden


definirse tres subclases mayores:
•  ADN satélite
•  ADN minisatélite
•  ADN microsatélite
ADN satélite
•  Es inactivo desde el punto de vista transcripcional

•  Integra la mayor parte de regiones


heterocromáticas del genoma y se encuentra de
manera notoria en la cercanía de los centrómeros
(heterocromatina pericentromérica)

•  Tamaño: 100 kb – 1 Mb

ADN satélite en
cromosomas de ratón
ADN satélite
•  En humanos el ejemplo mejor conocido es el ADN
alfa localizado en los centrómeros de todos los
cromosomas
•  Consiste en repeticiones en tandem de una unidad
repetida de 171 pb que representa del 3-5% del
ADN de un cromosoma
ADN minisatélite
•  No se transcribe en condiciones normales

•  Conjunto de disposiciones de tamaño moderado de


secuencias de ADN de repetición en tandem que
están dispuestas en porciones considerables del
genoma nuclear

•  Tamaño: 1 kb – 20 kb
ADN minisatélite hipervariable
•  VNTR (Variable Number of Tandem Repeats):
repeticiones de secuencias de 9 a 100 pb

•  Localización dispersa en todos los


cromosomas”huellas dactilares”

•  Punto crítico para


recombinación
homóloga en células
humanas
Variaciones de la longitud del alelo VNTR (D1S80) en 6
individuos
VNTRs
ADN minisatélite

•  Otro tipo de ADN minisatélite es el telómero:


unidades de hexanucleótidos de repetición en
tandem de 3 a 20 kb

•  TTAGGG

•  Actúan como amortiguadores para proteger los


extremos de los cromosomas de su degradación y
pérdida
ADN microsatélite

•  También conocido como repeticiones de secuencias


simples (RSS o STR)

•  Unidad repetida: 1 – 6 pb

•  Diseminados en la totalidad del genoma

•  Configuración de repeticiones dinucleótidos (0.5%


del genoma)
STR: Short Tandem Repeats
ADN no codificante
Localización de las secuencias repetidas
de ADN en un cromosoma típico humano

Principles of gene manipulation. Primrose Twyman


Implicaciones de los microsatélites en patologías

•  Expansión de microsatélites de trinucleótidos:


•  Síndrome de X frágil (CCG)n
•  Distrofia miotónica 1 (CTG)n
•  Enfermedad de Huntington (CAG)n
•  Ataxia de Friedrich (GAA)n
•  Nueve formas de ataxia espinocerebral
•  Expansión de tetranucleótidos-Distrofia miotónica 2
(CCTG)n
•  Expansión de pentanucleótidos-Ataxia
espinocerebelar tipo 10 (ATTCT)n
Secuencias de ADN repetido disperso

•  Familia SINE (secuencias Alu)


•  Específica de primates y constituye un 10% del
genoma.
•  Formadas por una secuencia de 250-280
nucleótidos con unas 1.500.000 copias por
genoma y una repetición cada 4kb.
•  Actúa como un retrotransposón, ya que puede
copiarse e insertarse en otras zonas del genoma
Secuencias de ADN repetido disperso

•  Familia LINE (secuencias kpn)


•  Constituye un 20% del genoma.
•  Secuencias de varias kilobases agrupadas en
distintas familias.
•  Son retrotransposones, pueden copiarse a sí
mismos a través de un intermediario ARN y
transponerse a otras localizaciones genómicas.
•  Pueden modificar la transcripción de los genes
en cuyos intrones hay abundancia de estos
elementos.
Secuencias de ADN repetido disperso
Transposones de ADN

•  El 40% del Genoma humano consiste en


transposones de ADN
•  Son repeticiones de 10-500 pb que codifican para la
trasposasa
•  Su actividad puede ser dañina para el huésped
•  Tecnologías basadas en transposones pueden ser
eficaces para transferir genes a cultivos celulares.
Secuencias de ADN repetido disperso
Transposones de ADN

Los diferentes colores de los granos son el


resultado de la acción de trasnposones
El mito del “ADN basura”
Mapas del Genoma
Mapas Cromosómicos
Hibridación de fluorescencia in situ (FISH)

Telómeros en amarillo

Cromosomas marcados con diferentes colores


Mapas Cromosómicos

Identificación de secuencias
específicas de nucleótidos
Mapas Cromosómicos

Identificación de deleciones
Mapas Genéticos
(de ligamiento o recombinación)

•  Un tipo de mapa cromosómico que muestra las


posiciónes relativas de los genes entre sí, sin
anclaje físico

•  Distancia entre marcadores determinada por la


frecuencia de recombinación en la meiosis
(centimorgan-cM)
Mapas Genéticos
(de ligamiento o recombinación)

•  El mapa se basa en el
concepto de ligamiento,
el cual significa que
cuanto más cerca estén
dos genes en el
cromosoma, mayor
será la probabilidad de
que se hereden juntos
Mapas Genéticos
(de ligamiento o recombinación)

•  La probabilidad de
entrecruzamiento
disminuye conforme
aumenta la cercanía
de los marcadores

•  Posiciones relativas
de unos con respecto
a otros
Mapas Genéticos
(de ligamiento o recombinación)

•  Mapa genético
de alta
resolución del
Cromosoma 1
Homo sapiens
Mapas Físicos

•  Posición exacta de un gen

•  Distancia entre marcadores determinada por el


número de pares de bases (pb)

•  Posición citológica en los cromosomas, o


fragmentos de cromosomas
Mapas Físicos

•  Mapa físico del


Cromosma X humano
Mapas Genéticos y Físicos

•  Comparando con el
mapa físico, el orden
de los genes es el
mismo, pero sus
distancias relativas
pueden ser diferentes
Mapas Genéticos y Físicos
GENÓMICA
COMPARADA
Genómica Comparada
•  Estudio de la relación
entre la estructura y
función del genomas de
distintas especies
•  Localizar regiones de
similitudes y diferencias
•  Ayuda a entender mejor
la estructura y función de
los genes humanos, y a
crear nuevas estrategias
para combatir las
enfermedades humanas
Genómica Comparada
•  Explota tanto las similitudes como las diferencias de
proteínas, ARN y regiones reguladoras para inferir cómo ha
actuado la selección sobre esos elementos.
•  Aquellos elementos que sean responsables de las
similitudes deberán conservarse en el tiempo (selección
estabilizadora)
•  Los elementos responsables de las diferencias entre
especies deberán ser divergentes (selección positiva)
•  Aquellos elementos que no sean importantes para el éxito
evolutivo del organismo no estarán conservados (selección
neutral)
Genomas Víricos
•  El genoma de los virus no contiene
intrones
•  Material genético: ADN o ARN
•  La mayoría tiene una sola molécula,
aunque algunos pueden tener el genoma
segmentado (fago F6 de Pseudomonas
phaseolicola)
•  La molécula puede ser lineal o circular y El genoma del virus TMV se
mono o bicatenaria enrolla linealmente muy
ordenado rodeado de
proteínas que se van
quitando para dejar el
material genético accesible
para las polimerasas.
Genomas Víricos
Fago filamentoso M13

Partículas del virus ØX174 ADN de ØX174

-ØX174 y Fago M13àADN


circular de hélice sencilla
-SV40àADN circular de
doble hélice

Partículas del virus SV40 ADN de SV40


Genomas Bacterianos
Escherichica coli

4.2 x 106 pb

-1 Cromosoma (nucleoide)
-ADN circular de doble cadena
-Sin envoltura de membrana
Nucleoide bacteriano
Genoma de Levaduras
Saccharomyces cerevisiae
•  Conocida como la levadura del pan, del
vino y de la cerveza, se ha convertido en
un organismo de estudio común en el
laboratorio.
•  Hongo unicelular y uno de los modelos
más adecuados para el estudio de
problemas biológicos.
•  Es un sistema eucariota, con una
complejidad sólo ligeramente superior a
la de la bacteria pero que comparte con
ella muchas de sus ventajas técnicas.
Genoma de Levaduras
Saccharomyces cerevisiae

•  La secuencia completa de su genoma (cepa S288C)


como primer organismo eucariota se finalizó en 1996
y actualmente es el genoma eucariota mejor
conocido.
•  Contiene unos 6.275 genes.
•  El tamaño de su genoma es de aproximadamente 12
Mb organizado en 16 cromosomas.
•  Se estima que comparte aproximadamente el 23%
del genoma con el ser humano.
Genoma de Saccharomyces cerevisiae
Genoma de Caenorabditis elegans
•  Especie de nematodo que mide
aproximadamente 1 mm de longitud,
y vive en ambientes templados.
•  Ha sido un importante modelo de
estudio para la biología, muy
especialmente la genética del
desarrollo, desde los años 70.
•  Uno de los organismos animales
más simples que cuentan con
sistema nervioso y digestivo bien
definidos.
Genoma de Caenorabditis elegans
•  La secuencia de su genoma como
primer organismo pluricelular se publicó
en 1998 y hoy se considera completa.
•  Contiene cerca de 20.000 genes, de los
cuales el 40% coinciden con los de otros
organismos, incluyendo los humanos.
•  Genes repartidos en 6 pares de
cromosomas.
•  Es relativamente sencillo interrumpir la
función de genes específicos mediante
interferencia por ARN
interferente (RNAi), lo que permite
silenciar la función de un gen para inferir
su efecto.
Genoma Humano
Genoma Humano
Homo sapiens
•  La secuencia de ADN contenida
en 23 pares de cromosomas, 22
autosómicos y un par sexual (XX, XY).
•  Tiene una longitud aprox. de 3.200 millones de pb de ADN
(3.200 Mb) que contienen unos 20.000-25.000 genes.
•  Sólo el 1.5% de su longitud está compuesta por exones
codificantes de proteínas. Un 70 % por ADN extragénico y
un 30% por secuencias relacionadas con genes.
•  Del total de ADN extragénico, ≈70 % corresponde a
repeticiones dispersas.
Genomas y sus tamaños
Cómo se expresa la cantidad de ADN?
•  En número de cromosomas, designado por “n” en
organismos haploides y “2n” en diploides donde hay dos
copias de cada cromosoma.
•  En masa de ADN (pg=picogramos)
•  Valor C: la cantidad de ADN por genoma haploide (un
solo juego cromosómico) .
•  En longitudà pb= pares de bases en cadenas dobles.
Para moléculas largas se emplea kilobases o megabases
(Mb)
Qué es el valor C?

•  Es el concepto que cuantifica el tamaño del


genoma nuclear
•  “C-value”à se refiere al contenido de ADN
nuclear en células haploides
•  El origen del término surgió referente a
“contenido” de ADN (C=)
“Contenido de la masa de ADN” en picogramos
(1012g)≠Tamaño en bp
Paradoja del valor C
•  Falta de correlación entre la complejidad de un organismo y
el tamaño de su genoma.
•  Estudio del valor C de distintas especies à no existe relación
entre el contenido de ADN y la posición en la escala
evolutiva.
•  Paradoja del valor C à surge cuando se compara la cantidad
de ADN o tamaño del genoma con las funciones para las que
lleva la información.

Polychaos dubium tiene el


genoma más grande conocido
hasta la fecha, 670.000 millones
de pb de ADN, más de 200 veces
el genoma humano
Contenido de ADN en distintos organismos

Variación de la cantidad de ADN (pb) en diferentes grupos de especies


Los genomas varían en tamaño, número de
genes y densidad génica

•  El genoma de las bacterias y archaes varían entre 1 a 6


millones de pb (Mb). Mientras los genomas de los
eucariotas son mucho más grandes.
•  El número de genes no está correlacionado con el
tamaño de los genomas.
•  Los seres humanos y otros mamíferos tienen una
densidad más baja de genes en una longitud dada de
ADN.
Número de genes en eucariotas
Paradoja del Valor G
Paradoja del Valor G

Bacterias 1Gen/1KB Genes: 95%

Levaduras 1Gen/2KB Exones: 65%

Nematodos 1Gen/5KB Exones: 27%

Humanos 1Gen/100KB Exones: 1,5%


Densidad génica en distintos organismos

Principles of gene manipulation. Primrose Twyman


ADN repetido en distintos organismos

Principles of gene manipulation. Primrose Twyman


A mayor complejidad del organismo, mayor
proporción de regiones NO codificantes en el
genoma
% de ADN no codificante
GENÓMICA EVOLUTIVA

•  Estudio de la evolución mediante la comparación de


secuencias de ADN, bandeo cromosómico y estructura
del genoma.
•  El ADN acumula mutaciones durante el tiempo.
•  La comparación de secuencias de ADN revela que pocos
cambios se asocian con una relación estrecha
filogenéticamente y una reciente divergencia a partir de
un antecesor común. Muchos cambios implican una
divergencia más antigua.
Las diferencias entre los genomas de dos
especies revelan los cambios genéticos
fijados desde el momento de su separación
Filogenética Molecular
•  La rama de la filogenia que analiza las diferencias
moleculares hereditarias, principalmente en las
secuencias de ADN, para obtener las relaciones
evolutivas de un organismo.
•  La filogenia molecular usa estos datos para construir un
árbol de relaciones que muestra la probable evolución de
varios organismos.

Árbol filogenético para genes de ARNr


Reloj Molecular
•  Técnica que utiliza la tasa de
mutación entre dos secuencias de
ADN como un marcador del tiempo
relativo desde la divergencia a
partir de un antecesor común.
•  Asume que la tasa de mutación es constante.
•  Cuando dos poblaciones o especies se separan, el número
de diferencias genéticas existentes entre ellas será, en
principio, proporcional al tiempo de la separación.
•  Puede ser contrastado con las evidencias del registro fósil.
Árbol filogenético del ADN mitocondrial humano
La Eva mitocondrial

•  Eva mitocondrial: mujer africana que


correspondería al ancestro común más
reciente femenino que poseía las
mitocondrias de las cuales descienden
todas las mitocondrias de la población
humana actual.
Mapa de migraciones-ADN mitocondrial
Beneficios de la Genómica Comparada
•  La identificación de secuencias de ADN “conservadas” es
un paso importante para entender el genoma en sí.
•  Localiza genes que son esenciales para la vida y resalta
las señales genómicas que controlan la función génica en
muchas especies.
•  Ayuda a entender qué genes se relacionan con varios
sistemas biológicos, que se puede traducir en enfoques
innovadores para tratar enfermedades y mejorar la salud
humana.
•  Es una herramienta poderosa para el estudio de la
evolución.
Algunos resultados del campo de la
Genómica Comparada
•  La mosca de la fruta y los seres humanos tienen alrededor del
60% de sus genes conservados en común, lo cual significa que
los dos organismos aparentemente comparten un conjunto
central de genes.
•  Se han encontrado genes que aumentan el músculo en el
ganado al doble; encontraron los mismos genes en perros de
carreras, y tales resultados pueden fomentar estudios de
rendimiento humano.
•  Se ha estudiado la genómica de varios tipos de cáncer en perros,
incluidos cánceres comunes y otras enfermedades, para tratar de
obtener nuevos conocimientos sobre la forma humana de estas
afecciones.

Potrebbero piacerti anche