Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
mayora se compone de inter- repite spersed que han sido copiadas de las
transcripciones de ARN en la clula inversa
genoma nuclear
genoma mitocondrial
secuencias altamente conservadas
genes que codifican protenas
Genes de ARN, secuencias reguladoras
secuencias mal conservadas
repeticiones basado en transposn
heterocromatina
otras secuencias
Figura 9.1 Secuenciadeconservaciny
clases de secuencia en el nucleares humana
y genomas mitocondriales. Para tener una
idea de la enorme diferencia de escala entre
la nuclear (izquierda) y mitocondrial
(derecha) genomas, el pequeo punto rojo en el
centro representa el equivalente de
25 El ADN mitocondrial (ADNmt) en los genomas
la misma escala que el genoma nuclear sola
a la izquierda. Tenga en cuenta tambin la diferencia profunda
entre los dos genomas en las fracciones
de ADN altamente conservado y tambin en el
fraccin de ADN no codificante altamente repetitivo.
Pgina 3
257
transcriptasa. Hay una conciencia creciente de la importancia funcional de tales
repite.
En este captulo se considera principalmente la arquitectura del genoma humano.
Describimos las diferentes clases de secuencia de ADN, describimos brevemente
cul es su
funcin es, y debe tener en cuenta la forma en que se organizan en el genoma
humano. en adelante
captulos que describen otros aspectos del genoma humano: cmo se compara
con
otros genomas, y cmo la evolucin ha dado forma (Captulo 10), secuencia de
ADN
variacin y el polimorfismo (Captulo 13), y los aspectos de la expresin de
genes humanos
sin (Captulo 11).
9.1 ORGANIZACIN GENERAL DE LA HUMANA
GENOMA
La secuencia de ADN del genoma mitocondrial humano se public en 1981,
y una comprensin detallada de cmo el ADN mitocondrial (ADNmt) trabaja
tiene
ha construido desde entonces. El genoma nuclear ms complejo ha sido un tanto
desafo ms formidable. Secuenciacin completa de genoma nuclear
comenz en la ltima parte de la dcada de 1990, y en 2004 prcticamente la
totalidad del euchroporcin matic del genoma se ha secuenciado. Nuestro conocimiento de la nuclear
genoma restos fragmentarios, sin embargo. Como veremos ms adelante, todava
no sabemos
cuntos genes hay en el genoma nuclear, y los datos obtenidos son recientemente
cambiando radicalmente nuestra perspectiva sobre cmo se organiza y se
expresa.
El genoma mitocondrial est densamente poblada por gentica
informacin
El genoma mitocondrial humano se compone de un solo tipo de doble circular
ADN de cadena que es de 16,6 kilobases de longitud. La composicin base es en
general
44% (G + C), pero las dos cadenas de ADN mitocondrial tienen
significativamente diferentes compo- base de
siciones: la pesada (H) captulo es rico en guanines, pero la luz (L) es rica en
cadena
citosinas. Las clulas contienen generalmente miles de copias de la hebra doble
molcula de ADNmt, pero el nmero puede variar considerablemente en
diferentes tipos de clulas.
Durante la formacin del cigoto, un espermatozoide aporta su genoma nuclear,
pero
no su genoma mitocondrial, a la clula huevo. En consecuencia, el mitocondrial
genoma del cigoto se determina por lo general exclusivamente por que
originalmente se encuentra en
el vulo no fertilizado. Por consiguiente, el genoma mitocondrial es la madre
inherente
ITED: machos y hembras tanto heredan sus mitocondrias de su madre, pero
los machos no transmiten sus mitocondrias a las generaciones
posteriores. Durante
la divisin celular mittico, las mltiples molculas de ADNmt en una clula que
se divide la segregacin
de una manera puramente aleatoria de las dos clulas hijas.
La replicacin de ADN mitocondrial
La replicacin de las dos hebras H y L es unidireccional y se inicia en concreto
Leu
Thr
Lys
Pro
Glu
Tyr
Cys
Asn
Ala
gln
O
L
O
MARIDO
O
MARIDO
O
L
P
L
P
MARIDO
7S
ADN
MARIDO
hebra
L
hebra
P
MARIDO
P
L
orgenes de replicacin y
direccin de la sntesis de
de H y L hebras
promotores y
direccin de la transcripcin
de H y L hebras
rRNA genes
genes de ARNt
genes que codifican protenas
259
el cdigo gentico son propensos a producir al menos algunos pro- crticamente
misfunctional
protenas y por lo que estn fuertemente seleccionados en contra. Sin embargo, la
mitocondrias mucho menor
genomas drial hacen muy pocos polipptidos. Como resultado, la gentica
mitocondrial
cdigo ha sido capaz de desplazarse por mutacin a ser un poco diferente de lo
universal
codigo genetico.
En el cdigo gentico mitocondrial hay 60 codones que especifican amino
cidos, uno menos que en el cdigo gentico nuclear. Hay cuatro codones de
terminacin:
UAA y UAG (que tambin sirven como los codones de parada en el cdigo
gentico nuclear) y
AGA y AGG (que especifica la arginina en el cdigo gentico nuclear; vase la
figura
1,25). La parada nuclear codn UGA codifica el triptfano en la mitocondria, y
AUA especifica metionina no isoleucina.
El genoma mitocondrial especifica todas las molculas de ARNr y ARNt
necesarios
para la sntesis de protenas en los ribosomas mitocondriales, pero confa en
nucleares
genes codificados para que los otros componentes, tales como los componentes
proteicos
de los ribosomas mitocondriales y sintetasas de aminoacil tRNA. Porque hay
slo 22 diferentes tipos de tRNA mitocondrial humano, las molculas de ARNt
individuales
tenga que ser capaz de interpretar varios codones diferentes. Esto es posible
debido a
bamboleo de tercera base en la interpretacin de codones. Ocho de las 22
molculas de ARNt tienen
anticodones que cada reconocen familias de cuatro codones que slo difieren en
la tercera
base. Los otros 14 tRNAs reconocen pares de codones que son idnticos en la
primera
dos posiciones de base y comparten una purina o una pirimidina en la tercera
base.
Entre ellos, por lo tanto, las 22 molculas de ARNt mitocondriales pueden
reconocer una
total de 60 codones [(8 4) + (14 2)].
ORGANIZACIN GENERAL DEL GENOMA HUMANO
TABLA 9.1 EL autonoma limitada del genoma mitocondrial
componente mitocondrial
codificada por
mitocondrial
genoma
genoma nuclear
Los componentes de la fosforilacin oxidativa
sistema
13 subunidades
80 subunidades
yo
NADH deshidrogenasa
7
42
Reductasa II succinato de CoQ
0
4
III citocromo b - c
1
complejo
1
10
IV citocromo c oxidasa complejo
3
10
V
Complejo ATP sintasa
2
14
Los componentes del aparato de sntesis de protenas
24 ARNs
79 protenas
rRNA
2
0
ARNt
22
0
protenas ribosomales
0
79
Otras protenas mitocondriales
0
Todas
un
un
Incluye polimerasas de ADN y ARN mitocondrial, adems de otras numerosas
enzimas, estructural y
protenas de transporte, etc.
CCAAAATGAACGAAAATCTGTTCGCTTCATTCATTGCCCCCACAATCCT
AGGCCTA
ATG
Acata
Pro
Reuni
1
Lys Trp Thr Lys Ile Cys Ser Leu Su Ser Leu Pro Pro Gln Ser
53
8366
8522
68
Met Asn Glu Asn Leu Phe Ala Ser Phe Ile Ala Pro Thr Ile Leu Gly Leu
Thr
1
17
226
Detener
8577 9202 9206
MT-ATP8
MTATP6
Figura 9.4 El MTATP6 yMTATP8
los genes son transcritos en diferentes
marcos de lectura de la superposicin de
segmentos de la H mitocondrial
hebra. MT-ATP8 se transcribe a partir
nucletidos 8366 a la 8569 y MTATP6
de 8527 a 9204. Despus de la transcripcin,
el ARN que codifica la ATP sintasa 6
subunidad se escinde despus de la posicin 9206
y poliadenilado, resultando en una
Codn UAA C-terminal en el que el primero
dos nucletidos se derivan en ltima instancia
de la TA en las posiciones 9205-9206
y la tercera de nucletidos es la primera A de
el poli (A) de la cola.
Pgina 6
261
centrmero. Ciertos cromosomas, en particular 1, 9, 16 y 19, tambin tienen
importantes
cantidades de heterocromatina en la regin eucromtica cerca del centrmero
(Pericentromere), y los cromosomas acrocntricos tienen cada uno dos geneidad
considerable
erochromatic regiones. Pero la representacin ms importante est en el
cromosoma Y
algunos, donde la mayor parte del ADN est organizado como heterocromatina.
La composicin de base del componente euchromatic del genoma humano
promedia en 41% (G + C), pero existe una variacin considerable entre los
cromosomas
somes, de 38% (G + C) de los cromosomas 4 y 13 hasta 49% (para el cromosoma
19). Tambin vara considerablemente a lo largo de las longitudes de
cromosomas. Por ejemplo,
de la media (G + C) contenido en el cromosoma 17q es 50% para los distales
10.3 Mb pero
se reduce a un 38% de los 3,9 Mb adyacentes. Hay regiones de menos de 300 kb
con
oscilaciones incluso ms anchas, por ejemplo, de 33,1% a 59,3% (G + C).
La proporcin de algunas combinaciones de nucletidos puede variar
considerablemente.
Al igual que otros genomas nucleares de vertebrados, el genoma nuclear humano
tiene una conescasez conspicuo del dinucletido CpG. Sin embargo, ciertas pequeas regiones
de
transcripcionalmente activo DNA tiene la densidad de CpG esperado y,
significativamente,
son (islas CpG; Box9.1) no metilados o hypomethylated.
El genoma humano contiene al menos 26.000 genes, pero la exacta
el nmero de genes es difcil determinar
Varios aos despus de que el Proyecto del Genoma Humano entreg la primera
referencia
secuencia del genoma, todava hay muy considerable incertidumbre sobre el total
de
nmero de genes humanos. Cuando se informaron los primeros anlisis del
genoma en
2001, el catlogo de genes generadas por la Internacional secuenciacin del
Genoma Humano
ING Consorcio fue muy orientada hacia los genes codificantes de
protenas. Original
estimaciones sugieren ms de 30.000 genes codificadores de protenas humanas,
la mayora de
cuales eran las predicciones de genes sin ninguna evidencia experimental de
apoyo. Esta
nmero fue una sobreestimacin debido a los errores que se hicieron en los genes
que definen
(vase el recuadro 8.5).
Para validar las predicciones de genes evidencia de apoyo se solicit, en su
mayora por lucin
comparaciones revolu-. Comparacin con otros genomas de mamferos, tales
como
ORGANIZACIN GENERAL DEL GENOMA HUMANO
TABLA DE CONTENIDO 9.3 de ADN de cromosomas humanos
Cromosoma
El ADN total
(Megabyte)
eucromatina
(Megabyte)
heterocromatina
(Megabyte)
Cromosoma
El ADN total
(Megabyte)
eucromatina
(Megabyte)
heterocromatina
(Megabyte)
1
249
224
19.5
13
115
96.3
17.2
2
243
240
2.9
14
107
88.3
17.2
3
198
197
15
15
103
82.1
18.3
4
191
188
3.0
diecisis
90
79.0
10.0
5
181
178
0,3
17
81
78.7
7.5
6
171
168
2.3
18
78
74.6
1.4
7
159
156
4.6
19
59
60.8
0,3
8
146
143
2.2
20
63
60.6
1.8
9
141
120
18.0
21
48
34.2
11.6
10
136
133
2.5
22
51
35.1
14.3
11
135
131
4.8
incgnita
155
151
3.0
12
134
131
4.3
Y
59
26.4
31.6
Tamaos cromosmicos se toman de la Ensembl Ver Mapa Humanos
(http://www.ensembl.org/Homo_sapiens/Location/Genome). heterocromatina
cifras son estimaciones abstradas de Internacional de Secuenciacin del Genoma
Humano Consorcio (2004), Nature 431, 931-945. El tamao del total humana
genoma se estima en alrededor de 3,1 Gb, con la contabilidad de la eucromatina
por cerca de 2,9 Gb y heterocromatina que tengan 200 Mb.
pgina 8
incluyendo miles de genes que codifican los ARN no codificantes larga que se
piensa
ser importante en la regulacin de genes. Adems, hay evidencia de decenas de
mil
arenas de diferentes ARNs humanos diminutos, pero en muchos casos bastante
grandes nmeros
de diferentes ARNs pequeos se obtienen mediante el procesamiento de los
transcritos de ARN individuales.
Nos fijamos en los ARN no codificantes en detalle en la Seccin 9.3.
La combinacin de unos 20.000 genes codificadores de protenas y ARN al
menos 6000
genes, aporta un total de al menos 26.000 genes humanos. Esto sigue siendo un
provisional
el nmero total de genes; la definicin de los genes de ARN es un reto y que
pasar algn tiempo
antes de obtener un nmero exacto de genes humanos.
Metilacin del ADN en los animales multicelulares a menudo implica la
metilacin
de una proporcin de residuos de citosina, dando 5-metilcitosina (mC).
En la mayora de los animales (pero no Drosophila melanogaster), el
dinucletido
CpG es un objetivo comn para la metilacin de citosina por citosina especfica
methyltransferases, formando mCpG (Figura1A).
La metilacin del ADN tiene importantes consecuencias para el gen
expresin y permite en particular patrones de expresin gnica que sean de forma
estable
transmitida a las clulas hijas. Tambin se ha implicado en los sistemas
de la defensa del husped contra los transposones. Los vertebrados tienen la
mayor
los niveles de 5-metilcitosina en el reino animal, y la metilacin
se dispersa a lo largo de los genomas de vertebrados. Sin embargo, slo una
pequea
porcentaje de las citosinas estn metiladas (alrededor de 3% en el ADN humano,
sobre todo como mCpG pero con un pequeo porcentaje como mCpNpG, donde
N es
cualquier nucletido).
5-metilcitosina es qumicamente inestable y es propenso a
desaminacin (vase la Figura 1A). Otras bases desaminados producen
derivados que son identificadas como anormales y se eliminan mediante la
Maquinaria de reparacin del ADN (por ejemplo, citosina no metilada produce
uracilo
NUEVA HAMPSHIRE
NUEVA HAMPSHIRE
2
citosina
5-metilcitosina
timina
(forma desajuste con G;
ineficiente reconocido por
Sistema de reparacin del ADN)
(UN)
(SEGUNDO)
2
1
3
4
5
6
O
do
do
norte
do
CH
NUEVA HAMPSHIRE
NUEVA HAMPSHIRE
2
metilacin
a las 5 de carbono
desaminacin
5
3
C pG
desaminacin
CH
3
O
O
do
do
HN
do
CH
NUEVA HAMPSHIRE
CH
3
metro
3
5
gp C
metro
la duplicacin del ADN
5
3
T pG
3
5
gp C
metro
5
3
T pG
3
5
ApC
5
3
CpG
3
5
gp C
metro
+
pgina 9
263
Los genes humanos estn distribuidos de manera desigual entre y dentro de
cromosomas
Genes humanos estn distribuidos de manera desigual sobre las molculas de
ADN nuclear. La estafaregiones de heterocromatina constitutiva estn desprovistos de los genes y, aun
dentro de la
formas. Grandes genomas, tales como los genomas nucleares de los eucariotas, y
especialmente de vertebrados genomas, tienen el lujo de no estar tan
restringida. repetitivo
El ADN es una caracterstica llamativa de grandes genomas, tanto en abundancia
y
importancia.
Los diferentes tipos de secuencia de ADN se pueden repetir. Algunos son cortos
no codificante
secuencias que estn presentes en unas pocas copias a millones de copias. Estos
sern
se analiza en la Seccin 9.4. Muchos otros son moderadamente largo a ADN
grande
secuencias que a menudo contienen genes o partes de genes. Tales secuencias
duplicadas
son propensos a diversos mecanismos genticos que dan lugar a la variacin del
nmero de copias
(CNV) en la que el nmero de copias del especfico sequences- moderadamente
larga
a menudo de muchos kilobases a varias megabases largo vara entre las diferentes
haplotipos. Variacin en el nmero de copias genera un tipo de
variacin estructural que
consideramos con ms detalle en el captulo 13, pero vamos a considerar algunos
de los mecameca- a continuacin en el contexto de cmo se duplican genes. Est claro, sin
embargo,
que CNV es bastante extensa en el genoma humano. Por ejemplo, cuando James
Genoma de Watson fue secuenciado, el 1,4% de la secuencia de datos totales
obtenidos hizo
No mapa con la secuencia del genoma humano de referencia. Como genoma
personal
secuenciacin se acelera, las nuevas regiones de la CNV se estn identificando
con importantes
implicaciones para la expresin de genes y la enfermedad.
Repetida la duplicacin de una secuencia que contiene el gen da lugar a una fagen
AIA. Como veremos en las secciones 9.2 y 9.3, muchos genes humanos son
miembros de
multigene familias que pueden variar enormemente en trminos de nmero de
copias y bucin
265
9.2 GENES PROTEINCODING
Durante muchos aos, los genetistas moleculares crean que el final- importante
de funcionamiento
punto de ADN era de protenas. Los estudios de genomas procariotas apoyaron
esta creencia,
en parte porque estos genomas son ricos en ADN que codifica la protena. Lleg
como una superficie
premio al encontrar que los genomas mucho ms grandes de los eucariotas
complejos han comparativa
tivamente poco ADN codificante de la protena. Por ejemplo, la protena de
codificacin de secuencias de ADN
cuenta de cerca de 90% de la E. coli genoma, pero slo un 1,1% de la humana
genoma.
genes que codifican protenas humanas muestran una enorme variacin en
el tamao
y la organizacin interna
La diversidad de tamaos
Los genes en organismos simples como las bacterias son relativamente similares
en tamao y
son por lo general muy corto (tpicamente alrededor de 1 kb de largo). En
eucariotas complejos, genes
puede mostrar gran variacin en el tamao. Aunque en general hay una
correlacin directa
entre los genes y productos tamaos, hay algunas anomalas sorprendentes. Por
ejemplo,
el gigante gen de la distrofina 2.4 Mb es ms de 50 veces el tamao de la
apolipola protena B gen, pero la protena distrofina tiene una longitud lineal
(aminocidos totales
nmero) que es aproximadamente 80% de la de la apolipoprotena B ( Tabla
9.4 ).
Una pequea minora de los genes codificantes de protenas humanas carecen de
intrones y se generan
aliado pequea (vase la nota a la Tabla 9.4 para algunos ejemplos). Para los que
s poseen
TABLA 9.4 variacin estructural en tamao y ORGANIZACIN DE LOS
GENES HUMANOS PROTEINCODING
protena humana
Tamao de la protena (sin.
de aminocidos)
Tamao del gen
(Kb)
No. de
exones
De ADN que codifica (%)
Tamao medio de
exn (pb)
Tamao medio de
intrn (pb)
SRY
204
0,9
1
94
850
b-globina
146
diecisis
3
38
150
490
p16
156
7.4
3
17
406
3064
Albmina de suero
609
18
14
12
137
1100
Colgeno tipo VII
2928
31
118
29
77
190
p53
393
39
10
6.0
236
3076
C3 del complemento
1641
41
29
8.6
122
900
apolipoprotena B
4563
45
29
31
487
1103
La fenilalanina hidroxilasa
452
90
26
3
96
3500
Factor VIII
2351
186
26
3
375
7100
huntingtina
3144
189
67
8.0
201
2361
protena retinoblastoma RB1
928
198
27
2.4
179
6668
CFTR (fibrosis qustica
receptor transmembrana)
1480
250
27
2.4
227
9100
La titina
34350
283
363
40
315
466
utrofina
3433
567
74
2.2
168
7464
La distrofina
3685
2400
79
0,6
180
30.770
Donde isoformas son evidentes, las cifras indicadas representan las isoformas
ms grandes. Como los genes se hacen ms grandes, el tamao exn permanece
bastante constante, pero los tamaos de intrones CAN
llegar a ser muy grande. exones internos tienden a ser bastante uniforme en
tamao, pero el exn terminal o algunos exones cerca del extremo 3 pueden ser
muchos kilobases de largo;
por ejemplo, el exn 26 del APOB gen es de 7,5 kb de longitud. Tenga en cuenta
el extraordinariamente alto contenido de exn y comparativamente pequeos
tamaos de intrones en los genes
codificacin de colgeno tipo VII y titina. Adems de SRY , otros genes que
codifican protenas de un solo exn en el genoma nuclear incluyen retrogenes
(vase
Tabla 9.8) y los genes que codifican otras protenas SOX, interferones, histonas,
muchos receptores acoplados a la protena G, protenas de choque trmico,
muchos ribonucleasas,
y varios receptores de neurotransmisores y receptores de hormonas.
Genes que codifican protenas
pgina 12
267
TABLA GENOMA HUMANO Y ESTADSTICA 9.5 de genes humanos
TAMAO DE COMPONENTES GENOMA
genoma mitocondrial
16.6 kb
genoma nuclear
3.1 Gb
un
componente euchromatic
2,9 Gb (93%)
Altamente conservadas fraction150 Mb (5%)
sequences35 ADN codificante de la protena Mb (1,1%)
Otros DNA115 altamente conservada Mb (3,9%)
DNA160 segmentally duplicado Mb (5,5%)
DNA1.6 altamente repetitivo Gb (50%)
heterocromatina constitutiva 200 Mb (7%; Tabla 9.3)
repeats1.4 basado en transposn Gb (45%, Tabla 9.12)
ADN por cromosoma
48 MB-249 Mb (Tabla 9.3)
el nmero de genes
genoma nuclear
> 26.000
genoma mitocondrial
37
genes que codifican protenas 20,000-21,000
genes de ARN
> 6000 (Figura exacta no se conoce)
Pseudogenes relacionados con genes que codifican protenas
> 12.000
la densidad de genes
genoma nuclear
> 1 por 120 kb (pero considerable incertidumbre)
genoma mitocondrial
1 por 0,45 kb
LONGITUD DE LOS GENES PROTEINCODING
Longitud promedio
53.6 kb
Pequesimo
unos pocos cientos de pares de bases de largo (varios ejemplos)
ms grande
2.4 Mb (distrofina)
NMERO DE GENES exn en PROTEINCODING
Promedio del nmero de exones en un gen
segundo
9.8
el nmero ms grande de un gen
363 (en el gen de la titina)
transcripcin separada para cada gen. Tales genes se dice que formar parte de
un policistrnico (= multignica) unidad de transcripcin. Unidades de transcripcin
polycistronic son
comn en los genomas simples, tales como los de las bacterias y la mitocondrial
genoma (vase la Figura 9.3). Dentro del genoma nuclear, se conocen algunos
ejemplos
de diferentes protenas que se producen a partir de una unidad de transcripcin
comn. Tpicamente,
que se producen por escisin de una protena de precursor hbrido que se traduce
de una transcripcin comn. Las cadenas A y B de la insulina, que son
ntimamente
relacionados funcionalmente, se producen de esta manera (vase la figura 1.26),
as como el relacionado
pptido somatostatina y hormonas neuronostatin. A veces, sin embargo, funcionalmente protenas distintas son producidas a partir de un precursor de la
protena comn. los
UBA52 y UBA80 genes, por ejemplo, tanto generan ubiquitina y un no
relacionado
protena ribosomal (S27a y L40, respectivamente).
Anlisis ms recientes han demostrado que la idea desde hace mucho tiempo que
la mayora
genes humanos son unidades de transcripcin independientes que no es cierto,
por lo que la definicin
tendr que ser revisada radicalmente cin de un gen. transcripcin Multignico es
ahora
conocido por ser bastante frecuente en el genoma humano, y las protenas
especficas y
Noncoding RNAs funcionales se pueden hacer por los precursores de ARN
comunes. Esta voluntad
estudiar ms a fondo en la seccin 9.3.
genes que codifican protenas humanas a menudo pertenecen a familias de
genes
que pueden ser agrupados o dispersos en varios cromosomas
Duplicados genes duplicados y de codificacin de componentes de secuencia son
un comn
caracterstica de los genomas de animales, especialmente grandes genomas de
vertebrados. Como veremos en
Captulo 10, la duplicacin de genes ha sido un factor importante en la evolucin
de
G7a
G3a
K18L
G3 G1
G7 G8
G2
G6
G5
G4
C4A
ZB
XA
YA ZA
G11
G10
HOM
Hsp70
G11a
G7B
G5b CKIIB
G7c
BAT5
G7d
RD
bf
G9 2
1C7
B144
LTB
TNF
LTA
NB6
1kBL
BAT1
MICB
PERB6
PERB10
MICA
NOB1
NOB2
P5-6
DHFRPs
17
NOB3
alianzas de inversin pblicoprivada
(UN)
(SEGUNDO)
0
900 kb
exn 27b
exn 28
27b intrn
OGMP
EVI2B
EVI2A
2.2 kb
10 kb
4 kb
cadena con sentido
de NF1 gen
cadena antisentido
de NF1 gen
5
3
3
5
pgina 15
269
Las diferentes clases de las familias de genes humanos pueden ser reconocidos de
acuerdo con la
grado de similitud de secuencia y la similitud estructural de sus productos
proteicos.
Si dos genes diferentes hacen productos de protenas muy similares, que son ms
propensos a
se origin por una duplicacin de genes evolutivamente muy reciente, muy
probablemente
algn tipo de evento tndem duplicacin de genes, y tienden a agruparse
juntos en un lugar especfico subchromosomal. Si hacen protenas que son
ms alejadas en secuencia, que muy probablemente surgieron por una ms
antigua
la duplicacin de genes. Pueden originalmente se han agrupado juntos, pero a lo
largo
evolutivos largas escalas de tiempo de los genes podran haber sido separadas por
translocacin
ciones o inversiones, y que tienden a estar localizados en diferentes cromosomas
ubicaciones.
Algunas familias de genes estn organizados en varios clsteres. El b-, g-, d-, y
genes e-globina se encuentran en un grupo de genes en 11P y estn ms
estrechamente relacionados con
entre s de lo que son para los genes en el a-globina grupo de genes en 16p
( figura
9.8 ).Losgenesenelgrupodegenesdebglobinaen11Poriginadaspor
duplicacingnica
eventos cin que eran mucho ms reciente en la evolucin que el gen temprano
duplicacin caso que dio origen a los antepasados de los genes A y B-globina. Un
excepcional ejemplo de una familia de genes organizado como mltiples grupos
de genes es la
familia de genes de receptores olfativos. Los genes codifican un repertorio
diverso de receptores
que nos permiten discriminar miles de diferentes olores; los genes se encuentran
en grandes racimos en mltiples localizaciones cromosmicas diferentes ( Tabla
9.6 ).
Algunas familias de genes tienen copias de genes individuales en dos o ms
cromosmica
lugares sin la agrupacin de genes (vase la Tabla 9.6). Los genes en los
diferentes localizacin
ciones son por lo general bastante divergentes en secuencia a no ser que se
produjo la duplicacin de genes
hace relativamente poco tiempo o que ha habido una considerable presin de
seleccin para mantener
conservacin de la secuencia. Se espera que los miembros de la familia que se
origin
de duplicaciones de genes antiguos.
Las diferentes clases de familia de genes pueden ser reconocidos de acuerdo
con
la extensin de la secuencia y la similitud estructural de la protena
productos
A medida que se enumeran a continuacin, varias clases de familia de genes se
pueden distinguir segn
el nivel de identidad de secuencia entre los miembros de genes individuales.
En las familias de genes con miembros estrechamente relacionados, los genes
tienen un alto grado de
1
q
y
x1
y
a2
y
a1
hGH-N CS-L
CS-A
hGH-V CS-B
ALBA
AFP
ALF
GC / PAD
gen expresado
expresado, pero en estado desconocido
pseudogen
Figura 9.8 Ejemplosdehumanoagrupados
familias de genes. Los genes en un grupo son a menudo
estrechamente relacionados en secuencia y son tpicamente
transcrito a partir de la misma cadena. Gene
grupos a menudo contienen una mezcla de expresado
genes y pseudogenes no funcionales. los
el estado funcional de la q-globina y CS-L
genes es incierto. Las escalas superior
(globina y la hormona del crecimiento clusters) y
la parte inferior (cluster albmina) estn en kilobases.
Genes que codifican protenas
pgina 16
14
T-Box codifica un dominio de 170 aminocidos
los genes del dominio forkhead
50
el dominio forkhead es de 110 aminocidos de longitud
los genes del dominio POU
diecisis
el dominio POU es de 150 aminocidos de longitud
TABLA 9.6 EJEMPLOS DE agrupados y familias multignicas
ENTREMEZCLADOS
Familia
El ejemplar no.
Organizacin
localizacin cromosmica (s)
Las familias de genes en clster
Crecimiento grupo de genes de la hormona
5
agrupado a menos de 67 kb; un pseudogen (Figura 9.8)
17q24
a-globina grupo de genes
7
agrupado sobre 50 kb (Figura 9.8)
16p13
genes20 cadena pesada de HLA de clase I
agrupado ms de 2 Mb (Figura 9.10)
6p21
genes HOX
38
organizados en cuatro grupos (Figura 5.5)
2q31, 7p15, 12q13, 17q21
familia de genes de histonas
61
racimos de tamao modesto en algunos lugares; dos grandes grupos
en el cromosoma 6
muchos
familia de genes de receptores olfativos
> 900
cerca de 25 grandes grupos dispersos por todo el genoma
muchos
Las familias de genes ENTREMEZCLADOS
aldolasa
5
tres genes funcionales y dos pseudogenes en cinco
diferentes cromosomas
muchos
PAZ
9
los nueve son genes funcionales
muchos
NF1 (neurofibromatosis de tipo I)
> 12
un gen funcional en 22q11; otros estn nonprocessed
pseudogenes o fragmentos de genes (Figura 9.11)
muchos, la mayora pericentromeric
cadena pesada de ferritina
20
un gen funcional en el cromosoma 11; la mayora son
pseudogenes procesados
muchos
pgina 17
271
Dos ejemplos importantes de superfamilias de genes son la Ig (inmunoglobulina)
y GPCR (receptor acoplado a protena G) Superfamilias. Los miembros de la
super-Ig
familia todos tienen dominios globulares se asemejan a los encontrados en las
inmunoglobulinas,
y adems de inmunoglobulinas que incluyen una variedad de superficie de la
clula proprotenas solubles y protenas implicadas en el reconocimiento, unin, o ceso de
adhesin
eses de clulas (vase la Figura 4.22 para ver algunos ejemplos). La superfamilia
GPCR es muy
con al menos 799 miembros de larga duracin en grandes nicas, distribuidos en
todo el
Genoma humano. Todas las protenas GPCR tienen una estructura comn de siete
a-hlice
segmentos transmembrana, pero por lo general tienen una baja secuencia (menos
de 40%)
similitud entre s. Ellos median la sealizacin celular inducida por ligando a
travs de interaccin
cin con las protenas G intracelulares, y la mayor parte del trabajo como
receptores de rodopsina.
SBADO
MUERTO
NUEVA HAMPSHIRE
2
22-42
6-94
23-41
19-29
17-29
17-23
19-51
115-192
20-25
repeticin WD
GH
WD
n = 4-14
ncleo
Figura 9.9 Algunasfamiliasdegenescodifican
protenas funcionalmente relacionadas con corta
motivos conservados de aminocidos. (A) MUERTO
motivos cuadro de la familia. Esta familia de genes codifica
productos implicados en los procesos celulares
que implica la alteracin de ARN secundaria
estructura, tal como la iniciacin de traduccin y
empalme. Ocho amino muy altamente conservada
motivos de cido son evidentes, incluyendo el DEAD
caja (Asp-Glu-Ala-Asp). Los nmeros se refieren a
con frecuencia se encuentran rangos de tamao para intervenir
secuencias de aminocidos; X representa cualquier
aminocidos. repetir motivos familiares (B) de WD.
Esta familia de genes codifica productos que
estn involucrados en una variedad de regulador
funciones, como la regulacin de la divisin celular,
la transcripcin, la sealizacin transmembrana,
y la modificacin del ARNm. Los productos gnicos
se caracterizan por 4-16 tndem WD
repite que contienen cada uno una secuencia central de
de longitud fija a partir de una GH (Gly-His)
dipptido y de terminacin en el dipptido
WD (Trp-Asp), precedido por una secuencia de
Longitud variable.
Genes que codifican protenas
pgina 18
funcin (un retrogene ; vase la Tabla 9.7). Sin embargo, debido a que carecen
secuencias importantes que se necesitan para la expresin, el gen ms procesado
copias degenerar en pseudogenes procesados (a veces llamados
pseudogenes retrotransposed ; Figura 1B).
La prevalencia y la funcionalidad de pseudogenes
genomas eucariotas tienen tpicamente muchos pseudogenes. Un largo
de pie justificacin de su abundancia es que la duplicacin de genes es
evolutivamente ventajosa. Las nuevas variantes de genes funcionales pueden ser
creados por la duplicacin de genes y pseudogenes durante mucho tiempo han
sido vistos
como sin xito subproductos de los mecanismos de duplicacin. A pesar de que
algunos genomas procariotas parecen tener muchos pseudogenes,
pseudogenes son generalmente raros en procariotas porque sus genomas
generalmente estn diseados para ser compacto.
La gran mayora de lo que son reconocidos convencionalmente como
pseudogenes humanos son copias de genes codificadores de protenas,
simplemente
porque es relativamente fcil de identificar ellos (mediante la bsqueda de
frameshifting, las mutaciones del sitio de empalme, y as sucesivamente). Hay
mas que
8000 diferentes copias de pseudogenes procesados de codificacin de protenas
genes en el genoma humano, adems de ms de 4000 nonprocessed
pseudogenes (ver la base de datos en el pseudogen
http://www.pseudogene.org). Slo alrededor del 10% de la 21000 humana
genes que codifican protenas tienen al menos un pseudogen procesado, pero
genes altamente expresados tienden a tener mltiples pseudogenes procesados.
Por ejemplo, la protena ribosomal citoplsmica contiene 95 funcional
genes que codifican 79 protenas diferentes (16 genes se duplican) y
2090 pseudogenes procesados.
pseudogenes ARN son a menudo difciles de identificar como pseudogenes
(No hay un marco de lectura de inspeccionar, y los genes de ARN a menudo
carecen de
intrones). Sin embargo, las copias de pseudogenes de muchos ARNs pequeos
son
comn (vase la tabla siguiente), sobre todo si son transcritos por la ARN
polimerasa III (genes transcritos por la ARN polimerasa III tienen a menudo
promotores internos).
Como se describe en la Seccin 12.4, la repeticin Alu, el ms
abundantes secuencia en el genoma humano, parece haberse originado
por la copia de las transcripciones de ARN 7SL, y otros muchos altamente
repetidas intercaladas familias de ADN en los mamferos son copias de ARNt.
Por lo tanto, en cierto sentido, pseudogenes de ARN han llegado a ser los ms
comunes
elementos de la secuencia de los genomas de mamferos.
Todos los pseudogenes se encuentran en el genoma nuclear, pero
no incluir copias defectuosas de genes que residen en el mitocondrial
genoma ( pseudogenes mitocondriales ). El genoma mitocondrial
originado a partir de un genoma bacteriano mucho ms grande y durante un largo
evolutivo escala de tiempo la mayor parte del ADN de la gran precursor
genoma mitocondrial migr en una serie de integracin independiente
eventos en lo que ahora es el genoma nuclear. pseudogenes ADNmt
Ahora representar al menos el 0,016% del ADN nuclear (o aproximadamente 30
veces las
contenido del genoma mitocondrial).
La funcionalidad de pseudogenes ha sido un debate inconcluso,
y se han previsto diferentes clases de pseudogenes. Un significante
nmero de pseudogenes (pseudogenes procesados en su mayora) son
transcritas, y las transcripciones antisentido pseudogene pueden regular
los genes de los padres. Los pseudogenes tambin se han implicado directamente
en
la produccin de siRNAs endgenos que regulan transposones, como
se describe en la Seccin 9.3. Por ltimo, algunas secuencias pueden ser
pseudogene
cooptado para una funcin diferente. Han sido descritos como exapted
pseudogenes . Un ejemplo es proporcionado por el XIST gen. Se hace una
ARN no codificante que regula la inactivacin del cromosoma X, y dos de
Se conocen sus seis exones que se origin a partir de una copia de pseudogen
un gen codificante de la protena.
(UN)
(SEGUNDO)
la duplicacin de genes
UN
UN
UN
UN
UN
yA
yA
mutacional
restriccin
mutacional
flexibilidad
transcripcin
y el procesamiento
marcha atrs
transcriptasa
mutacin
cromosmico
integracin
ARNm
ADNc
promotor
inactivando
mutacin
no inactivante
mutacin
Figura 1 Orgenesdenonprocessedyprocesado
pseudogenes. (A) La copia de ADN genmico
secuencia que contiene el gen A puede producir duplicado
copias de las necesidades de presin de seleccin Fuerte gen A.
para ser aplicado a una de las copias para mantener
la funcin de genes (flecha en negrita), pero la otra copia
se puede permitir que mutar (flecha discontinua). Si se
recoge inactivacin de las mutaciones (crculos rojos), una
puede surgir pseudogen nonprocessed (YA).
(B) Un procesado pseudogene surge despus celular
transcriptasas inversas convertir una transcripcin de un gen
en un ADNc que luego es capaz de integrarse de nuevo en
el genoma (vase la figura 9.12 para ms detalles). La falta
secuencias de importantes tales como un promotor generalmente
resulta en una copia del gen inactivo.
ARN de la familia
Nmero de
genes humanos
Cantidad de trastornos
pseudogenes
U6 snRNA
49 800
U7 snRNA
1
85
Y ARN
41000
273
transcripciones tales como ARNm para hacer cDNA que luego pueden integrar en
cromosoma
ADN Somal ( Figura9.12 ). Pseudogenes procesados son comunes en
intercaladas
familias de genes (vase la Tabla 9.5).
pseudogenes procesados carecen de una secuencia promotora y por lo general no
son
expresado. A veces, sin embargo, los ADNc copia integra en un cromosoma
sitio de ADN que sucede, por casualidad, ser adyacente a un promotor que puede
conducir
expresin de la copia del gen procesado. La presin de seleccin puede garantizar
que la
de copias de genes procesado contina haciendo un producto gnico funcional,
en cuyo caso
que se describe como un retrogene . Una variedad de retrogenes intronless se
sabe que tienen
Prueba especfica de patrones de expresin y son homlogos tpicamente
autosmicos de una
-intrn que contiene el gen ligado al cromosoma X ( Tabla9.8 ).
Una razn fundamental para retrogenes puede ser un requisito fundamental para
superar la
la falta de expresin de ciertas secuencias ligadas al cromosoma X en los
testculos durante la meiosis masculina.
Durante la meiosis masculina, los cromosomas X e Y se convierten en pares
heterosexuales
la cromatina, la formacin de la altamente condensada y transcripcionalmente
inactiva cuerpo XY .
retrogenes autosmicos pueden proporcionar la sntesis continua de clulas de
testculos de cerTain productos de importancia crucial que ya no son sintetizadas por los genes en
el
muy condensada cuerpo XY.
L
TM CY
un
1
un
2
L una
1
un
2
un
3
TM CY
CY
un
2
un
3
TM CY
un
2
un
2
un
3
TM CY
un
3
un
3
3 UTR
3 UTR
3 UTR
3 UTR
3 UTR
2.2 Mb
segundo
do
mi
UN
GRAMO
F
Y
1
2
3
4
5
67
Y
Y
Y
(UN)
(SEGUNDO)
NF1
17q11.2
10b
(UN)
(SEGUNDO)
13
27b
2q12-q13
15p11.2 (2 copias)
14p11 <> q11
22p11 <> q11
18p11.2
21p11 <> q11
dispersa NF1
pseudogenes
PKD1
16p13.3
Y PKD1
gene
racimo
16p13.11
Y1
Y2
Y3
Y4
Y5
Y6
Figura 9.11 Dispersindenonprocessed
NF1 y PKD1 pseudogenes como consecuencia
de pericentromeric o subtelomrico
inestabilidad. (A) El NF1 neurofibromatosis
gen de tipo I est situado cerca de la
centrmero del cromosoma humano 17. Se
AAAA A
norte
3
AAAAAN
norte
AAAAAN
norte
AAAAAN
norte
ARNm
3
TTTT T
norte
5 ADNc
TTTTT TTTT
P
3
5
TTTTTN
norte
5
3
3
5
TTTTTN
norte
5
3
TTTT T
norte
AAAA A
3
5
TTTTTN
norte
AAAAAN
norte
TTTTTN
norte
5
3
275
Sabemos desde hace muchas dcadas que diversas clases ncRNA ubicuas son
esencial para la funcin celular. Hasta hace poco, sin embargo, hemos sido en
gran parte acosbrado a pensar en NcRNA como no mucho ms que una serie de accesorios que
son
necesaria para procesar los genes para producir protenas. ARN de transferencia
son necesarios en el muy
el final de la va, que sirve para decodificar los codones en el ARNm y
proporcionar amino
cidos en el orden en que son necesarias para su insercin en cadenas de
polipptido en crecimiento.
ARN ribosomal son componentes esenciales de los ribosomas, el complejo
ribosoma
fbricas de nucleoprotena de la sntesis de protenas.
Se conocen otros ncRNAs ubicuos para funcionar ms arriba en la va de
garantizar el trabajo de los precursores de ARNm, ARNr, ARNt y. Varios
ARN pequeos son componentes de ribonucleoprotenas complejos involucrados
en diferentes
reacciones de procesamiento, incluyendo corte y empalme, la escisin de rRNA y
tRNA precursores,
y las modificaciones de base que son necesarios para la maduracin del
ARN. Normalmente, estos
ARN funcionan como gua RNAs , por apareamiento de bases con secuencias
complementarias en el
ARN precursor.
Tambin hemos sido siempre consciente de algunas ncRNAs que tienen otras
funciones, tales
como ARN implicados en la inactivacin del cromosoma X y la impresin, y el
componente ARN de
la ribonucleoprotena telomerasa necesaria para la sntesis del ADN de los
telmeros
(Vase la Figura 2.13). Pero estos ARN parecan haber excepciones peculiares.
protenas (ver texto). Otra observacin consistente con ARN de ser el primer
cido nucleico es que
desoxirribonucletidos se sintetizan a partir ribonucletidos en vas celulares.
Adems de almacenar informacin gentica, el ARN se ha imaginado que se han
utilizado
posteriormente para sintetizar protenas a partir de aminocidos. Diferentes ARN,
incluyendo rRNA y
tRNA, son esenciales para ayudar a la sntesis de polipptidos. Muchas protenas
ribosomales se pueden eliminar
sin afectar la funcin del ribosoma, y la actividad de la peptidil transferasa
fundamental enzima
que cataliza la formacin de pptidos bonos es una ribozima. Sin embargo, el
ARN tiene una bastante rgido
columna vertebral y por tanto no se adapta muy bien como una molcula
efectora. Las protenas son mucho ms flexibles
y tambin ofrecen variedad ms funcional ya que los 20 aminocidos pueden
tener muy diferentes
estructuras y ofrecer ms posibilidades de combinacin de secuencia (un
decapptido proporciona 20
10
o alrededor
10
13
diferentes secuencias de aminocidos posibles, mientras que un decanucleotide
tiene 4
10
o alrededor de 10
6
diferentes secuencias posibles).
La sustitucin de ARN con ADN como una molcula de almacenamiento de
informacin proporcionado significativa
ventajas. ADN es mucho ms estable que el ARN, y as es ms adecuado para
esta tarea. su azcar
residuos carecen del grupo OH 2 en azcares de ribosa que hace RNA
propensos a la escisin hidroltica.
Mayor eficiencia podra lograrse mediante la separacin del almacenamiento y la
transmisin de gentica
informacin (ADN) a partir de la sntesis de protenas (RNA). Todo lo que se
necesitaba era el desarrollo de una
la transcriptasa inversa de modo que el ADN podra sintetizarse a partir de
desoxinucletidos mediante el uso de un ARN
modelo.
genes de ARN
CUADRO 9.3 EL MUNDO ARN HIPTESIS
pgina 22
hebra
transcripciones
marcha atrs
hebra
transcripciones
anotado exones
novedosas alquitranes
5
(UN)
(SEGUNDO)
3
3
5
5
3
3
5
ARNs cortos
ARNs cortos
ARNs cortos
antisentido
ncRNA
antisentido
ncRNA
ARNs cortos
ARNsno
ncRNA
miARN
que codifica la protena RNA
Figura 1 difuminacindeloslmitesdegenesaniveldetranscripcin. Enel
pasado,loscuatrogenes
en la parte superior sera de esperar que se comporten como unidades discretas
que no se solapan de transcripcin.
Como se muestra mediante anlisis recientes, la realidad es ms complicada. Una
variedad de transcripciones menudo
enlaces exones en los genes vecinos. Las transcripciones incluyen
frecuentemente secuencias de
regiones transcripcionalmente activas antes insospechados (TAR). [De Gerstein
MB, Bruce C,
Rozowsky JS et al. (2007) Genome Res. 17, 669-681. Con el permiso de Cold
Spring Harbor
Laboratory Press.]
Figura 2 Ampliatranscripcional
la complejidad de los genes humanos. (A) Human
genes se transcriben con frecuencia en tanto
hebras, como se muestra en este gen hipottico
racimo. (B) Un solo gen puede tener mltiples
sitios de inicio transcripcional (flechas en ngulo recto)
as como muchos de codificacin entrelazada y
transcripciones no codificantes. Los exones se muestran como
cajas azules. ARNs cortos conocidos como pequea
ARN nucleolar (snoRNAs) y microRNAs
(MiRNAs) pueden ser transformados a base de intrnica
secuencias y nuevas especies de ARN cortas
que se agrupan alrededor principio y al final
de genes se han descubierto recientemente (ver
el texto). [De Gingeras TR (2007) Genome
Res. 17, 682-690. Con el permiso de fro
Spring Harbor Laboratory Press.]
CAJA 9.4 REVISIN DEL CONCEPTO DE UN GEN EN LA ERA
POST GENOME
pgina 23
277
La figura 9.13 daunaperspectivamodernasobreladiversidadfuncionalde
ARN. En
esta seccin se consideran las funciones de genes y las organizaciones de los
diferentes
clases de ARN humano ( Tabla9.9 ). Numerosas bases de datos se han
desarrollado
recientemente para documentar datos sobre ncRNAs ( Tabla9.10 ).
Ms de 1000 genes humanos codifican un rRNA o tRNA, la mayora
dentro de grandes grupos de genes
los genes del RNA ribosomal
Adems de las dos molculas de ARNr mitocondrial (12S y 16S rRNA), hay
cuatro tipos de citoplsmico rRNA, tres asociados con el gran ribosoma subunidad (28S, 5.8S y 5S rRNAs) y otro con la subunidad pequea del ribosoma
(18S
rRNA). Los genes 5S rRNA se producen en pequeos grupos de genes, siendo la
ms grande de un clster
de 16 genes en el cromosoma 1q42, cerca del telmero. Slo unos pocos 5S
rRNA
RNasa
MRP
empalme
RNasa P
de pre-tRNA
scaRNA
de snRNA
ARNsno
de rRNA
RNasa MRP
U1 snRNA
U2 snRNA
basado en RNAi
silenciamiento gnico
miARN
ARNs largos como
trans -actuando
reguladores
AIRE CALIENTE
ARN largos en
cis -antisense
regulacin
TSIX
especfico
empalme
regulador
HBII-52
ARNsno
AIRE
endo-siRNA
epigentica
gene
regulacin
XIST
H19
HBII-85
ARNsno
ARN SRA1
ARN 7SK
de pre-rRNA
No. de
diferente
tipos
Funcin
organizacin de genes, la biognesis, etc.
ribosomal
RNA (rRNA),
120-5000
nucletidos
12S rRNA, 16S rRNA
1 de cada
componentes de los ribosomas mitocondriales
escindido a partir de transcritos producidos multignicas
por H hebra de ADN mitocondrial (Figura 9.3)
5S rRNA, 5.8S rRNA,
18S rRNA, 28S rRNA
1 de cada
componentes de los ribosomas citoplasmticos
5S rRNA es codificada por mltiples genes en
varios grupos de genes; 5.8S, 18S, y 28S
rRNA se escinden de transcripciones multignicas
(Figura 1.22); los multigenic 5.8S-18S-28S
unidades de transcripcin se repiten en tndem en
cada uno de 13p, 14p, 15p, 21p, 22p y (= ADNr
clusters)
Transferir
RNA (tRNA),
70-80
nucletidos
familia mitocondrial
22
decodificar ARNm mitocondrial para hacer 13
protenas en los ribosomas mitocondriales
los genes de una sola copia. tRNAs se escinden de
transcripciones de ADNmt multignica (Figura 9.3)
familia citoplasmtica
49
mRNA decodificacin producido por genes nucleares
(Figura 9.13)
700 genes y pseudogenes de ARNt dispersado
en mltiples localizaciones cromosmicas con algunos
clase H / ACA
(Figura 9.15b)
94
maduracin de rRNA por uridines modificadores
en posiciones especficas para dar pseudouridine
Pequeo Cajal
ARN cuerpo
(ScaRNA)
25
la maduracin de ciertas clases snRNA en
los rganos Cajal (cuerpos en espiral) en el ncleo
por lo general dentro de intrones de la codificacin de protenas
genes
ARN
ribonucleasas,
260-320
nucletidos
2
RNasa P escinde pre-tRNA en el ncleo +
mitocondrias; RNasa MRP escinde rRNA
en el nuclolo y est implicado en la iniciacin
la replicacin del ADNmt
los genes de una sola copia
Diverso
pequea
citoplasmtica
ARN,
80-500
nucletidos
FC200
1
RNA neural que regula dendrticas
la biosntesis de protenas; originado de Alu
repetir
1 gen, BCYRN1 , en 2p16
ARN 7SL
3
componente de la seal de reconocimiento de
partculas (SRP) que media la insercin de
protenas de secrecin en el lumen de la
retculo endoplsmico
279
Transferir genes de ARN
Las 22 ARNt mitocondriales diferentes son hechas por 22 genes de ARNt en el
ADNmt. los
listas de bases de datos genmica tRNA ms de 500 genes de ARNt humanos que
hacen que un cytoplasARNt micrfono con una especificidad definida anticodn. Los genes se pueden
clasificar en 49
familias sobre la base de la especificidad anticodn ( Recuadro9.5 ). Slo hay
una correlacin aproximada
relacin de nmero de genes tRNA humana con la frecuencia de
aminocidos. Por ejemplo,
30 genes de ARNt especifican el aminocido cistena comparativamente raros
(que
cuentas para el 2,25% de todos los aminocidos en las protenas humanas), pero
slo 21 genes de ARNt
especificar la prolina ms abundante (que tiene una frecuencia de 6,10%).
Aunque los genes de ARNt parecen estar dispersos por todo el genoma humano,
ms de la mitad de los genes de ARNt humanos (273 de 516) residen en cada
cromosoma
un 6 (con muchas agrupadas en una regin de 4 Mb en 6P2) o el cromosoma 1.
En Adems
cin, 18 de la 30 Cys tRNAs se encuentran en un tramo de 0,5 Mb del
cromosoma 7.
CUADRO 9.10 PRINCIPALES no codificante ARN BASES DE DATOS
Base de datos
Descripcin
URL
NONCODE
base de datos integrada de todos los ncRNAs excepto ARNr y ARNt
http://www.noncode.org
base de datos de ARN no codificante
secuencias y funciones de las transcripciones no codificantes
http://biobases.ibch.poznan.pl/ncRNA/
RNAdb
base de datos completa de ARN no codificante de mamferos
http://research.imb.uq.edu.au/rnadb/
Rfam
familias de ARN no codificante y la secuencia de alineaciones
http://rfam.sanger.ac.uk/
Anticode
base de datos de transcripciones antisentido naturales
http://www.anticode.org
sno / scaRNAbase
nucleolar RNAs pequeos y pequeos RNAs de cuerpo especfico Cajal
http://gene.fudan.sh.cn/snoRNAbase.nsf
ARNsno-LBME-db
snoRNAs humanos integrales
http://www-snorna.biotoul.fr/
Base de datos genmica tRNA
secuencias completas de ARNt
http://lowelab.ucsc.edu/GtRNAdb/
Recopilacin de las secuencias de ARNt
y las secuencias de genes de ARNt
tal y como su nombre indica
http://www.tRNA.uni-bayreuth.de
miRBase
y secuencias de genes miARN genes diana
http://microrna.sanger.ac.uk/
piRNAbank
secuencias conocidas empricamente y otra informacin relacionada
en piRNAs reportados en diversos organismos, incluyendo humanos,
ratn, rata, y Drosophila
http://pirnabank.ibab.ac.in/
TABLA 9.9 cont. clases principales de ARN no codificante HUMANO
clase de ARN
o subclase
evolutivo/
funcional
subfamilia
No. de
diferente
tipos
Funcin
organizacin de genes, la biognesis, etc.
MicroARN
(MiARN),
22 nucletidos
> 70 familias de
miRNAs relacionados
1000
varias funciones importantes en el gen
Reglamento, en particular en el desarrollo,
e implicado en algunos cnceres
vase la figura 9.17 para ejemplos de genoma
organizacin, y la Figura 9.16 para la forma en que son
sintetizado
Po de unin a ARN
(PiRNA), 24-31
nucletidos
89 persona
racimos
> 15.000
menudo derivado de repeticiones; expresada
slo en las clulas de la lnea germinal, donde
limitar el exceso de actividad transposn
UAA 7
UUG
CAA 7
Phe
Leu
UCU
11 AGA
UCC
GGA UCA
UGA 5
UCG
CGA 4
Ser
UAU
AUA 1
UAC
GUA 14
UAA
UUA UAG
CUA Tyr
detener
detener
UG
ACA UGC
ACG 30
UGA
UCA - (3)
UGG
CCA 9
Cys
detener
Trp
CUU
AAG 12
CUC
GAG CUA
UAG 3
CUG
CAG 10
Leu
CCU
AGG 10
CCC
GGG CCA
UGG 7
CCG
CGG 4
Pro
CAU
a AUG CAC
GUG 11
CAA
UUG 11
CAG
CUG 20
Su
gln
UGE
ACG 7
CGC
GCG CGA
UCG 6
CGG
CCG 4
Arg
AUU
AAU 14
AUC
GAU 3
AUA
UAU 5
AGOSTO
CAU 20
Ile
Reuni
ACU
AGU 10
ACC
GGU ACA
UG 6
ACG
UGE 6
Thr
AAU
AUU 2
AAC
GUU 32
AAA
UUU 16
AAG
CUU 17
Asn
Lys
AGU
ACU AGC
GCU 8
AGA
UCU 6
AGG
CCU 5
Ser
Arg
GUU
AAC 11
GUC
GAC GUA
UAC 5
GUG
CAC 16
Val
GCU
AGC 29
GCC
GGC GCA
UGC 9
GCG
CGC 5
Ala
GAU
ABC GAC
GUC 19
GAA
NVND 13
MORDAZA
13 CUC
spid
Glu
GGU
ACC GGC
15 GCC
GGA
UCC 9
GGG
CCC 7
Gly
Figura 1 Msde500diferentehumana
ARNt citoplasmticos decodificar los 61
los codones que especifican el 20 estndar
aminocidos. Las relaciones entre
los 64 codones posibles (posicionado prximo
a los aminocidos de la izquierda de los cuatro
principales columnas) y la correspondiente
anticodones (a la derecha de los cuatro
columnas) se muestran. El nmero al lado de
cada anticodn es el nmero de diferentes
ARNt humanos que se documentan en el
Genmica tRNA base de datos (ver Tabla 9.9)
como en libros que anticodn. Tenga en cuenta que 12
de los 61 anticodones capaces de reconocer
los codones que especifican el 20 estndar
281
ARNsn molculas se unen diversas protenas y funcionan como
ribonucleoprotenas
(SnRNPs).
Posteriormente, varios snARNs, entre ellos algunos de los primeros en
clasificarse,
se encontr que estar involucrados en el procesamiento post-transcripcional de
precursores rRNA
en el nuclolo; Por lo tanto, se re-clasificados como pequeos ARN nucleolar
( SnoRNAs ), por ejemplo U3 y U8 snoRNAs. Ms recientemente, miembros de
la
las clases se ha basado en la clasificacin estructural y funcional.
Un tercer grupo de pequeos RNAs han sido identificados pero que se asemejan
a snoRNAs
se limitan a los rganos Cajal (tambin llamados cuerpos en espiral ), estructura
nuclear discreta
turas en el ncleo que estn estrechamente relacionados con la maduracin de
snRNPs.
Se han llamado ARN pequeos de cuerpo Cajal ( scaRNAs ). Cientos de su
mayora
genes humanos dispersos se dedican a hacer snRNA y ARNsno, y hay
muchos cientos de pseudogenes asociados.
UUUUU
(SEGUNDO)
El sitio de LSM
3 madre
casquillo MPG
Figura 9.14 EstructurasdetipoSmysnARNsspliceosomaldetipoLSM.
De tipo Sm (A) snARNs contienen tres elementos de reconocimiento
importantes: una
5 -trimethylguanosine (TMG) gorra, un sitio de unin a protenas Sm (Sm
sitio), y
una estructura de tallo-bucle 3 . Se requieren el sitio Sm y los 3 elementos
madre
para el reconocimiento por el complejo de la supervivencia de las neuronas
motoras (SMN) para el montaje
en ribonucleoprotenas bsicas estables (RNPs). El consenso sitio Sm dirige el
montaje de un anillo de las siete protenas Sm bsicos (vase el cuadro 9.10). El
TMG tope
y se requieren las protenas del ncleo Sm reunidos para el reconocimiento por el
nucleares
maquinaria de importacin. (B) de tipo snARNs Lsm contienen un 5
-monomethylphosphate
guanosina (MPG) gorra y un vstago 3 , y terminan en un tramo de uridina
residuos (el sitio LSM) que est obligado por las siete protenas del ncleo LSM.
genes de ARN
pgina 28
OH
P
gorra
la casilla D
la casilla D
5
5
5
3
3
3
casilla C
casilla C
Nueva York
Nueva York
Anann
H cuadro
ACANNN
OH
cuadro de ACA
Figura 9.15 Estructurayfuncinde
snoRNAs. (A) / D cuadro snoRNAs gua C
- 2 O modificaciones metilacin. La caja
C y D y motivos a 5 , 3 -terminal
STEM formada por el apareamiento de bases intrastrand
(Que se muestra como una serie de roja horizontal corta
lneas) constituyen un motivo estructural al retorcimiento su vez
que est especficamente reconocido por la
15,5 kD snoRNP. El C y D cajas
representar interna, con frecuencia imperfecta
copias de las cajas C y D. C / caja de D
snoRNAs y sus ARN de substrato forman una
10 a 21 pb de doble hlice en la que el objetivo
residuo a ser metilado (que se muestra aqu por
la letra m en un crculo) se coloca exactamente
cinco nucletidos aguas arriba de la D o D
caja. R representa la purina. (B) la casilla H / ACA
snoRNAs guiar la conversin de uridines
a Pseudouridine. Estos ARN se pliegan en una
horquilla-bisagra-horquilla-cola estructura. Uno
o ambas de las horquillas contiene una interna
283
15. algunas funciones no estndar se conocen ni esperan para algunos genes
snoRNA
que no tienen secuencias complementarias a las secuencias de rRNA. Por
ejemplo, el
HBII-52 snoRNA tiene una secuencia de 18 nucletidos que es perfectamente
complementaria
a una secuencia dentro de la HTR2C gen (serotonina 2c receptor) en XP24, y
regula splicing alternativo de este gen. Los vecinos HBII-85 snoRNAs
recientemente han sido implicados en la patognesis del sndrome de PraderWilli
(OMIM 176270).
genes de ARN pequeo cuerpo Cajal
Los scaRNAs asemejan snoRNAs y realizan una funcin similar en la
maduracin del ARN,
pero sus objetivos son snARNs spliceosomal y realizan modifica- especfica del
sitio
cationes de precursores snRNA spliceosomal en los rganos de Cajal del ncleo.
Hay por lo menos 25 genes humanos, cada especificacin de un tipo de
scaRNA. Me gusta
snoRNA genes, los genes scaRNA se encuentran normalmente dentro de los
intrones de los genes
transcrito por la ARN polimerasa II.
Cerca de 1000 microARN humanos diferentes regulan conjuntos complejos
de los genes diana por emparejamiento de bases a las transcripciones de
ARN
Adems de ARNt, hemos conocido desde hace algn tiempo acerca de una
variedad de otros mo-
RNA pin que se escinde inicialmente a partir del transcrito primario por una
RNasa nuclear
III (conocido como Rnasen o Drosha) para hacer un corto de doble cadena premiARN
que es transportado fuera del ncleo ( Figura9.16 ). A citoplsmica RNasa III
llamado
Dicer corta el pre-miARN para generar un dplex miARN con voladizo
3 dinucletidos.
Un complejo de silenciamiento inducido por ARN especfico (RISC) que
contiene el endoriboArgonaute nucleasa se une el dplex miARN y acta con el fin de desenrollar el
double de cadena miARN. La protena Argonaute entonces degrada uno de los ARN
hebras (la hebra de pasajeros ) para dejar el miARN maduro de una sola cadena
(conocida
como la hebra gua ) unido a Argonaute. Los asociados miRNP maduros con
ARN
transcripciones que tienen secuencias complementarias a la hebra gua. La Unin
de miARN para orientar la transcripcin normalmente implica un nmero
significativo de errores de base
partidos. Como resultado, un miARN tpico puede silenciar la expresin de
cientos de
genes diana en la misma forma que una transcripcin de protena especfica de
tejido
factor puede afectar a la expresin de mltiples genes diana al mismo tiempo ver
la seccin de los objetivos de la base de datos miRBase aparece en la Tabla 9.9.
Para identificar ms genes miARN, nuevos programas de bioinformtica
computacionales
weredeveloped para detectar secuencias del genoma. Bymid-2009, ms de 700
humana
los genes miARN haban sido identificados y validados experimentalmente, pero
comparativa
genmica anlisis indican que el nmero de tales genes es probable que aumente.
Algunos de los genes miARN tienen sus propios promotores individuales; otros
son parte de
genes de ARN
pgina 30
inducir la metilacin del ADN. Como resultado, la expresin gnica puede ser
silenciado durante largos perodos para limitar, por ejemplo, las actividades
de transposones.
Aunque las clulas de mamferos tienen vas de interferencia de ARN,
la presencia de ARN de doble cadena activa una respuesta de interfern
que hace que no especfica de silenciamiento gnico y la muerte celular. Esto es
descrito en el captulo 12 cuando consideramos el uso de ARN de interferencia
como una herramienta experimental para producir el silenciamiento especfico de
preseleccionados genes diana. En tales casos, artificialmente sintetizado corto
ARN de doble cadena se utiliza para desencadenar gnica basada en RNAi
silenciamiento.
Figura 1 RNAdeinterferencia. Largasdedoblecadena(ds)ARNseescinde
porcitoplasmtica
dicer para dar siRNA. ARNsi dplex estn obligados por complejos Argonaute
que desenrollan la
dplex y degradar una hebra para dar un complejo activado con una sola hebra de
ARN. Por
apareamiento de bases con secuencias de ARN complementarias, el siRNA gua
complejos Argonaute
para reconocer secuencias diana. Activado RISC complejos escindir cualquier
cadena de ARN que es
complementaria a su lmite siRNA. El ARN escindido se degrada
rpidamente. Activado
RITS complejos utilizan su siRNA para unirse a cualquier ARN complementaria
recientemente sintetizada
y luego atraer protenas, tales como histonas methyltransferases (HMT) y algunas
veces DNA
metiltransferasas (Dnmt), que pueden modificar la cromatina para reprimir la
transcripcin.
CAJA 9.6 ARN de interferencia COMO MECANISMO DE DEFENSA
CELULAR
ARN largo ds
jugador
siRNA
gorra
poli (A)
gorra
poli (A)
gorra
poli (A)
ADN
ARN degradado
activada RISC
Hace + Otros
protenas RISC
RITS activados
Hace + Otros
protenas RITS
DNMT
HMT
metilacin de las histonas
la metilacin del ADN
la transcripcin reprimidos
pgina 31
285
ARN pol II
compleja RNASEN
complejo Dicer
compleja ARGONAUTE
gorra
poli (A)
pri-miARN
pre-miARN
pre-miARN
dplex miARN
miARN
ncleo
MIR
(UN)
citoplasma
un grupo miARN y se escinde de un multi-miARN transcripcin comn
unidad ( Figura9.17A ). Otra clase de genes miARN formar parte de un
compuesto
unidad de transcripcin que se dedica a hacer otros productos, adems de
miARN, o bien otro tipo de NcRNA (Figura 9.17B) o una protena (Figura
9.17C).
Muchos miles de diferentes piRNAs y siRNAs endgenos
suprimir la transposicin y regular la expresin gnica
El descubrimiento de miRNAs fue inesperado, pero ms tarde se hizo evidente
que los miRNAs
do
un
gramo
un
u
do
u
pri-miARN
u caaguaa ccaggauaggcu gu
GCA guucauu gguucuaucc ggua
gramo
California
gramo
gramo
u
do
do
do
un
u
do
u
pre-miARN
u ccaggauaggcu caaguaa
uucaaguaauccaggauaggcu
5
3
3
5
GCA guucauu gguucuaucc
u
do
u
dplex miARN
miARN
compleja RNASEN
complejo Dicer
compleja ARGONAUTE
genes de ARN
Figura 9.16 miARNhumanosntesis. (A)Esquemageneral.Eltranscrito
primario,primiARN,tieneunatapa5
(metro
7
GpppG) y una cola 3 poli (A). precursores miARN tienen un prominente
estructura de doble cadena de ARN (ARN
horquilla), y el procesamiento se produce a travs de las acciones de una serie de
complejos de ribonucleasa. En el ncleo,
Rnasen, el homlogo humano de Drosha, escinde el pri-miARN para liberar el
ARN de horquilla (pre-miARN); esta
a continuacin, se exporta al citoplasma, donde se escinde por la enzima Dicer
para producir un dplex miARN.
El ARN dplex est unido por un complejo Argonaute y la hlice se desenrolla,
con lo cual una hebra (el
de pasajeros ) es degradada por la ribonucleasa Argonaute, dejando el miARN
maduro (la hebra gua ) unido
a Argonaute. MIR, genes miARN. (B) Un ejemplo concreto: la sntesis de miR26A1 humano. repeticiones invertidas
(Muestran como secuencias resaltados overlined por flechas largas) en el primiARN se someten emparejamiento de bases para formar
una horquilla, por lo general con unos pocos desajustes. Las secuencias que van a
formar la hebra gua madura se muestran en la
rojo; las de la hebra de pasajeros aparecen en azul. La escisin por tanto la
Drosha y Dicer humana (verde
flechas) es normalmente asimtrica, dejando un dplex de ARN con
sobresaliendo por 3 dinucletidos.
pgina 32
poli (A)
miR-192-1-171819a2019b
gorra
poli (A)
miR-198 en FSTL1 ARNm 3 UTR
miR-106b9325 en MCM7 pre-ARNm intrn
(DO)
gorra
poli (A)
miR-15a16-1 en dLEU2 NcRNA intrn
gorra
poli (A)
horquilla de ARN
exonic
ARN codificante
exonic
ARN no codificante
ARN intrnica
Figura 9.17 Laestructuraprimariadelserhumano
miRNAs. (A) Ejemplos de transcripciones que se
utilizado exclusivamente para hacer miRNAs: miR-21
se produce a partir de una sola horquilla dentro de una
dedicado RNA transcrito primario;
una nica transcripcin multignica con seis
horquillas que finalmente se escinde para
dar seis miRNAs, a saber, el miR-17, miR-18,
miR-19a, y as sucesivamente. (B, C) Ejemplos de
miRNAs que son co-transcritos con un gen
codificacin o bien (B) un largo ARN no codificante
(NcRNA) o (C) un polipptido. En cada parte,
el ejemplo superior muestra miRNAs individuales
situado dentro de (B) un exn de un ncRNA
(MiR-155) y (C) en el 3 no traducida
regin (UTR) dentro de un exn terminal de una
ARNm (miR-198). Los ejemplos inferiores muestran
miRNAs mltiples ubicados dentro intrnica
secuencias de (B) un NcRNA (miR-15a y
miR-16-1) y (C) un pre-mRNA (miR-106b,
miR-93 y miR-25). Gorra, m
7
G (5 ) ppp (5 )
287
Ms de 3000 genes humanos sintetizan una amplia variedad de
medianas a grandes ARN regulador
Muchos miles de diferente largo ncRNAs, a menudo muchos kilobases de
longitud, son
Tambin cree que tienen un papel regulador en las clulas animales. Incluyen
antisentido transcripts que por lo general no se someten a corte y empalme y que pueden regular
la superposicin
transcripciones sentido, adems de una amplia variedad de largos ncRNAs
mRNA similar a que se someten
nivelacin, corte y empalme y poliadenilacin, pero no parecen codificar
cualquier considerable
polipptido, aunque algunos contienen ncRNAs internos tales como snoRNAs y
piRNAs. Las funciones de la gran mayora de la ARNm como ncRNAs son
desconocido. Algunos, sin embargo, son conocidos por ser especfica de tejido y
que participan en el gen
regulacin. Recientemente, en un esfuerzo sistemtico para identificar ncRNAs
largos, 3300 diferente
ncRNAs largos humanos fueron identificados como la asociacin con la
cromatina modificacin
complejos, lo que afecta la expresin gnica.
Algunos ncRNAs largo de ARNm-como que estn implicados en la regulacin
epigentica tienen
sido ampliamente estudiado. El XIST gen codifica una larga NcRNA que regula
inactivacin del cromosoma X, el proceso bywhich uno de los dos cromosomas
X
se selecciona al azar para ser condensado en mamferos hembras, con grandes
regiones
convertirse en transcripcionalmente inactiva. Muchos otros ncRNAs largos,
como el H19
ARN, estn implicados en la represin de la transcripcin de cualquiera de los
paterno o
alelo materno de muchas regiones autosmicos ( imprinting ). Estos ARNmcomo
ncRNAs son a menudo regulado por los genes que producen lo que puede ser
muy largo anti-
Algunos de los ARN funcionales, tales como XIST y aire, que no han sido tan
bien
conservado durante la evolucin. Las secuencias funcionales de mayor evolucin
en el
genoma humano incluye componentes de ncRNAs largos primates especficos
que son
fuertemente expresado en el cerebro. Consideramos las implicaciones evolutivas
de tales
genes en el captulo 10.
**
**
**
yA
yA
UN
yA
5
horquilla
UN
+
jugador
21-nucletido
siRNA
RISC
mRNA divisin
duplicacin
y
inversin
duplicacin
retrotransposicin
ARN
ARNm
transcrito antisentido
5
5
ncleo
citoplasma
Figura 9.19 Lospseudogenespuedenregular
la expresin de su gen de la matriz
por vas de siRNA endgenos.
1 exn
regulador antisentido de XIST
H19
2.3 kb
11p15
5 exones que abarcan 2,67 kb
involucrado en la impronta en el 11p15 clster impresa
asociado con el sndrome de Beckwith-Wiedemann
KCNQTOT1 (= LIT1)
59.5 kb
11p15
1 exn
regulador de antisentido en el clster impreso en 11p15
PEG3
1,8 kb
un
19q13
nmero variable de exones, pero
hasta 9 exones que abarcan 25 kb
maternalmente impreso y se sabe que la funcin de tumor
supresin por p53 activacin
AIRE CALIENTE
2.2 kb
12q13
6 exones que abarca 6,3 kb
trans gen regulador-actuando; aunque parte de una
regin reguladora en el HOX-C clster en 12q13, HOTAIR
RNA reprime la transcripcin de una regin 40 kb en el
HOX-D grupo en el cromosoma 2q31
un
isoformas mayores.
pgina 35
289
9.4 de ADN altamente repetitivas: HETEROCROMATINA
Y repite transposn
Los genes contienen algunas secuencias repetitivas de ADN, incluyendo el ADN
de codificacin repetitiva.
Sin embargo, la mayora de las secuencias de ADN altamente repetitivas se
producen genes externos.
Algunas de las secuencias estn presentes en ciertas regiones subchromosomal
como gran
segundo
a menudo cientos de
kilobases
asociado con la heterocromatina
un (ADN alfoide)
171 pb
heterocromatina centromrica de todos los cromosomas
b ( Sau familia 3A)
68 pb
en particular, la heterocromatina centromrica de 1, 9, 13, 14, 15,
21, 22, e Y
satlite 1
25-48 pb (rica en AT)
heterocromatina centromrica de la mayora de los cromosomas y
otras regiones heterocromatnicas
satlite 2
formas divergentes de
ATTCC / GGAAT
la mayora de, posiblemente todos, cromosomas
satlite 3
ATTCC / GGAAT
13p, 14p, 15p, 21p, 22p, y heterocromatina en 1q, 9Q,
y Yq12
DYZ19
125 kb bp400 en Yq11
DYZ2
Rica en AT
Yq12; mayor periodicidad de 2470 pb
ADN minisatlite
0,1-20 kb
en o cerca de los telmeros de todos los cromosomas
minisatlite telomrica
TTAGGG
todos los telmeros
minisatlites hipervariables
9-64 pb
todos los cromosomas, asociados a la eucromatina, sobre todo en
regiones sub-telomricas
ADN microsatlite
<100 pb
menudo 1-4 pb
repetir, pero slo una pequea minora de repeticiones de transposones son una
transposicin de forma activa.
Segn el mtodo de la transposicin, las repeticiones pueden ser organizados en
dos
grupos:
Los retrotransposones (tambin abreviado como retroposones ). Aqu la copia
nismo
meca- se asemeja a la forma en que procesan pseudogenes y retrogenes son
generado (vase la figura 9.12): transcriptasa inversa convierte un transcrito de
ARN
del retrotransposn en un ADNc copia que luego se integra en el genoma
ADN en una ubicacin diferente. Tres clases principales de mamferos utilizan
transposn
este mecanismo de copiar y pegar: elementos nucleares largos perodos de
actividad (lneas),
elementos cortos intercalados nucleares (Sines), y elementos similares a
retrovirus
que contiene repeticiones terminales largas.
transposones de ADN . Los miembros de esta cuarta clase de transposn migran
directamente
sin ninguna copia de la secuencia; la secuencia se escinde y luego reinsertado en otro lugar en el genoma (un mecanismo de cortar y pegar).
Los elementos transponibles que se incorporen las independiente se describen
como
autnoma ; aquellos que no pueden se conocen como no autnoma ( Figura
9.20 ). De
las cuatro clases de elemento de transposicin, lneas y Sines
predominan; nosotros
describirlos con ms detalle a continuacin. Las otras dos clases se describen
brevemente
aqu.
pgina 37
291
transposones LTR humanos
transposones LTR incluyen elemento autnomo y no autnomo similar a
retrovirus
mentos que estn flanqueadas por repeticiones terminales largas (LTR) que
contienen necesario
elementos reguladores de la transcripcin. secuencias retrovirales
endgenas contienen gag
60.000
retrovirus (transposones LTR)
familias HERV
MaLR240,000
285.000
autnomo
no autnoma
ORF1 ORF2 ( pol )
(UN)
norte
(UN)
norte
P
P
6-8 kb
100-400 pb
6-11 kb
1,5-3 kb
80 bp-3 kb
2-3 kb
LTR
LTR
LTR
LTR
gag pol (env)
(mordaza)
transposasa
Figura 9.20 transposnmamferos
familias. Slo una pequea proporcin de
miembros de cualquiera de transposn se ilustra
familias pueden ser capaces de transposicin;
muchos han perdido esa capacidad despus de
la adquisicin de mutaciones que inactivan, y muchos
son copias truncadas cortos. Las subclases de
las cuatro familias principales se enumeran, junto con
los tamaos en pares de bases. ORF, el marco de lectura abierto.
[Adaptado de Genoma Humano Internacional
Consorcio de Secuenciacin (2001) Naturaleza 409,
860-921. Con el permiso de Macmillan
Publishers Ltd.]
ADN altamente repetitivo: la heterocromatina como transposn REPEATS
pgina 38
TTTTTT
UN
segundo
monmero izquierda
elemento de repeticin (B) Alu
5 UTR
3 UTR
ORF1
ORF2
(A) elemento LINE-1 repeticin
monmero derecha
32 pb
p40
endonucleasa
marcha atrs
transcriptasa
Pensilvania
Figura 9.21 ElLINE1humanayAlu
repetir elementos. (A) El 6,1 kb LINE-1
elemento tiene dos marcos de lectura abiertos: ORF1,
un marco de lectura abierto de 1 kb, codifica p40,
una protena de unin al ARN que tiene una nucleico
actividad chaperona de cidos; el 4 kb ORF2
especifica una protena con tanto endonucleasa
y revertir las actividades de la transcriptasa. UN
promotor interno bidireccional se encuentra dentro de
la regin no traducida 5 (UTR). En el
otro extremo, hay una A
norte
/T
norte
secuencia, a menudo
descrito como el 3 poli (A) de la cola (pA). los
LINE-1 endonucleasa corta una hebra de un
Dplex de ADN, preferiblemente dentro de la secuencia
TTTTA, y los usos de la transcriptasa inversa
la largada 3 finales -OH en ADNc de primera
sntesis. Nuevos sitios de insercin estn flanqueadas
por una duplicacin pequeo sitio de destino de
2-20 pb (que flanquean puntas de flecha negras).
(B) Un dmero Alu. Los dos monmeros tienen
293
que contiene slo una de las dos repeticiones en tndem, y varias versiones
truncadas
de dmeros y monmeros tambin son comunes, dando un promedio de todo el
genoma
230 pb.
Mientras que SINE como el MIR (mamferos de toda la repeticin intercalados)
familias
mentiras se encuentran en una amplia gama de mamferos, la familia Alu es de
comparativamente
origen evolutivo reciente y se encuentra solamente en primates. Sin embargo,
sub-Alu
familias de diferentes edades evolutivas pueden ser identificados. En el pasado 5
millones o
por lo aos desde la divergencia de los seres humanos y los simios africanos, slo
alrededor de 5000 cobre
IES de la repeticin Alu han sido objeto de transposicin; la mayora de las
secuencias Alu mviles
son miembros de las subfamilias Y y S.
Al igual que otros mamferos Sines, repeticiones Alu se origin a partir de copias
de ADNc
pequeos ARN transcritos por la ARN polimerasa III. Genes transcritos por la
ARN
polimerasa III tienen a menudo promotores internos, y as copias de ADNc de
transcripciones
llevar con ellos sus propias secuencias promotoras. Tanto la repeticin Alu y,
indetemente, la repeticin del ratn B1 se origin a partir de copias de ADNc de ARN
7SL, la
genoma tiene algunas similitudes con los genomas de procariotas compactas, las
genoma nuclear humano es mucho ms complejo en su organizacin, con
solamente
1,1% de las protenas del genoma de codificacin y 95% que comprende
nonconserved, y
a menudo altamente repetitivo, secuencias de ADN.
La secuenciacin del genoma humano ha revelado que, contrariamente a lo
esperado,
hay relativamente pocos genes codificadores de protenas, aproximadamente
20,000-21,000 de acuerdo
ing con las estimaciones ms recientes. Estos genes varan ampliamente en
tamao e interna
organizacin, con los exones de codificacin a menudo separadas por grandes
intrones, que a menudo
contener secuencias de DNA altamente repetitivas. La distribucin de genes a
travs de la
genoma es desigual, con algunos genes relacionados funcionalmente y
estructuralmente encontrados
en grupos, lo que sugiere que surgieron por la duplicacin de genes individuales
o mayor
segmentos de ADN. Los pseudogenes se pueden formar cuando se duplica un gen
y
a continuacin, una del par acumula mutaciones deletreas, impidiendo su
expresin
sin. Surgen otras pseudogenes cuando un transcrito de ARN se transcribi de
forma inversa y
el ADNc se vuelve a insertar en el genoma.
La mayor sorpresa de la era post-genoma es el nmero y la variedad de la no
ARN codificantes de protenas transcritas del genoma humano. Al menos 85% de
la
genoma euchromatic ahora se sabe que se transcribe. El ncRNAs familiarizado
sabe que tienen un papel en la sntesis de protenas se han sumado otros que
tienen
funciones en la regulacin de genes, incluyendo varias clases prolficos de ARN
regulador diminutos
y miles de diferentes ncRNAs largos. Nuestra visin tradicional del genoma es
siendo revisada radicalmente.