Sei sulla pagina 1di 3

TEMA MONOGRFICO

GENTICA BSICA (I)

Genoma humano y estructura bsica de los genes


J. Oriolaa y R. Olivab
a

Servicio de Hormonologa. Centro de Diagnstico Biomdico. Hospital Clnic. Barcelona. bServicio de Gentica.
Centro de Diagnstico Biomdico. Hospital Clnic. Institut dInvestigacions Biomdiques August Pi i Sunyer (IDIBAPS). Barcelona.

EL GENOMA HUMANO

CONTENIDO DE INFORMACIN Y NMERO


DE GENES DEL GENOMA HUMANO

El genoma humano es el material gentico caracterstico de la especie humana (fig. 1)1. Bsicamente, el 99,9% de este material puede
hallarse representado en el ADN (cido desoxirribonucleico) contenido en una sola clula humana. As, el genoma est constituido por
23 pares de molculas de ADN. Cada molcula de ADN tiene una
longitud que oscila entre 50 y 250 millones de bases, y la suma de todos ellos es de 6.000 millones de bases en estado diploide o de 3.000
millones en estado haploide (fig. 1). Tambin la informacin gentica que presentan las mitocondrias forma parte del genoma humano.
El ADN mitocondrial humano consta de un solo filamento circular
constituido por 16.569 pares de bases (pb). En general, en cada clula hay varios cientos de mitocondrias, por lo que hay varios cientos
de copias de ADN mitocondrial en cada clula.
Para poder valorar lo que la cifra de 3 109 pb supone, es til
establecer comparaciones. Si tuvisemos que escribir esta secuencia, llenaramos 200 guas de telfono de Barcelona (1.000 pginas
cada tomo). En cuanto a sus dimensiones lineales, si estirsemos
todos los cromosomas de una sola clula y los dispusisemos uno a
continuacin del otro, la longitud sera de 2 m (el cromosoma ms
pequeo, el 21, medira 3 cm, y el ms grande, el 1, medira 16 cm).
Pero el material gentico caracterstico de la especie humana no es
slo este ADN presente en una sola clula, sino que hay que considerar, adems, la variacin gnica presente en los distintos individuos. Aproximadamente una de cada 270 bases vara entre cada 2
personas, por lo que para conocer la verdadera magnitud del genoma humano, a los 3.000 millones de bases hay que sumarle toda la
variacin gnica presente en la especie humana (fig. 1).

Humanidad
Personas: 5 x 109
El genoma difiere
en una de cada
270 bases
entre cada
2 personas

Individuo
Clulas: 1013
El genoma es
casi idntico
entre las clulas
de un individuo

Clula
Cromosomas: 23 pares
Pares de bases: 6 x 109
(en estado diploide)
+ genoma mitocondrial
(16.569 pb)
50.000-100.000 genes

La informacin gentica de la especie humana viene determinada


por la secuencia de las cuatro bases (adenina [A] guanina [G], citosina [C], y timina [T]) (fig. 1). La secuencia de estas bases de cada
uno de nosotros (el genotipo) es lo que determina junto con el ambiente (dieta, exposicin fsica, aspectos sociales, etc.) lo que somos
(el fenotipo). La molcula de ADN est formada por dos hebras
que se aparean perfectamente entre s gracias a que las bases son
complementarias dos a dos (la A con la T, y la G con la C) (fig. 1).
Cada vez que una clula humana se divide (proceso denominado
mitosis), debe copiar toda esta informacin y a continuacin repartirla, en partes iguales, a cada clula hija. Este gigantesco trabajo se
puede incluso realizar en 1-2 h y no deben generarse errores de
copia. De esta forma, se transmite exactamente la misma informacin gentica a cada una de las clulas hijas.
Pero la informacin contenida en el genoma humano no se distribuye de forma uniforme a lo largo de la secuencia, sino que se
concentra sobre todo en determinadas secuencias denominadas
genes (fig. 2). Los genes representan las unidades funcionales del
genoma y normalmente la informacin contenida en ellos sirve para dar lugar a protenas (figs. 2 y 3).
Se supone que existen alrededor de 30.000-50.000 genes repartidos
entre todos los cromosomas. Muchos de ellos ya son conocidos en detalle, as como sus posiciones en el genoma, mientras que del resto se
dispone de representaciones en las bases de datos. El primer cromosoma humano en secuenciarse fue el cromosoma 22 y en l se hallaron 545 genes y 134 seudogenes2. Estos ltimos son genes que contie-

Cromosoma
Molculas de
ADN: 2
Tamao:
entre 5 x 107 pb
y 2,5 x 108 pb

Gen
Unidad hereditaria
y funcional (con
excepciones)
Tamao: entre 400
y 2 x 106 pb

ADN
cido desoxirribonucleico
Compuesto por 4 tipos
de bases distintas: adenina (A),
guanina (G), citosina (C) y
timina (T). que se aparean
entre s (A:T y G:C)
En la secuencia de las bases
se halla la informacin
gentica

Figura 1 Composicin del genoma humano. El genoma humano es el material gentico caracterstico de la especie humana. Suele quedar representado como la secuencia de las bases del ADN de los 22 cromosomas autosmicos ms los cromosomas sexuales X e Y presentes en una sola clula (centro de la imagen). A su nivel ms elemental el genoma est compuesto por 4 bases distintas (A, G, C y T; derecha). A su nivel superior el genoma
debe considerarse como la secuencia prototipo presente en una clula ms la variacin existente entre todos los individuos presentes en la humanidad (izquierda)1.

TEMA MONOGRFICO
GENTICA BSICA (I)

Genoma humano y estructura bsica de los genes


J. Oriola y R. Oliva

dos obtenidos con la secuenciacin del genoma humano, se conoce hoy la existencia de
ADN genmico
multitud de seudogenes (por cada 4-5 genes
Exn
1
Intrn
1
Exn
2
Intrn
2
Exn
3
Regin promotora
funcionales habra uno no funcional).
5
3
No obstante, a medida que avanza el conocimiento
sobre este ADN que separa a
Transcripcin
los genes, se van descubriendo posibles
ARN trnscrito
5
3
funciones. Por ejemplo, la secuencia del exprimario
tremo 5 de los genes (la secuencia anterior
Intrones
al inicio de la transcripcin) contiene inforAUG
UGA
macin para la unin de factores de transProcesamiento
cripcin especficos de cada gen. De hecho,
ARN mensajero
Poly-A
del ARN (
5 UTR
estas regiones llamadas promotoras pue3
UTR
y poliadenilacin)
Regin
codificante
den considerarse tambin como parte de
los genes y pueden estar formadas por ms
Traduccin
de 3.000 pb. Dentro de cada gen, hay seCOOH
NH2
Protena
cuencias no codificantes (intrones), que forman alrededor del 80-90% del gen (fig. 2).
Figura 2 Estructura de un gen eucariota y principales procesos de expresin gnica. Se representa
Adicionalmente, este ADN que separa a
un gen con 3 exones y 2 intrones. Su transcripcin da lugar al ARN trnscrito primario que
es procesado para preparar su extremo 3 y eliminar los intrones (splicing). Finalmente, los
los genes, o el ADN presente en los introARN mensajeros son traducidos por el ribosoma para dar lugar a la protena correspondiennes, podra tener la funcin de incrementar
te (vase la fig. 3 para el detalle molecular de la clave de la traduccin proteica a travs del
la frecuencia de recombinacin meitica
cdigo gentico). La regulacin de estos procesos de expresin gnica se trata en el segundo
aumentando la generacin de combinaciocaptulo de este monogrfico.
nes allicas en la especie humana.
Otro tipo de secuencias no codificantes son
las repetitivas. Estas secuencias se pueden dividir entre las repetidas en
5
3
tndem y las secuencias dispersas1. Las secuencias repetidas en tnADN
dem son caractersticas de la regin central de los cromosomas (centr3
5
meros) y garantizan la correcta distribucin de los cromosomas en las
clulas hijas durante la divisin celular. En estas regiones hay muy poARNm
5
3
cos genes. Tambin hay repeticiones en tndem en las regiones finales
de cada cromosoma (telmeros), los cuales ayudan a mantener la estabilidad y la individualidad de cada cromosoma durante la replicacin.
3
5
ARNm
Cada telmero est formado por 250-1.500 secuencias TTAGGG repetidas3. No todos los tipos celulares presentan el mismo nmero de
repeticiones, pngase como ejemplo a los cromosomas de los espermaARNE
tozoides que son los que poseen los telmeros ms largos. Esta secuenArginina
a
n
Alani
cia telomrica la poseen todos los vertebrados estudiados hasta ahora.
Tirosina
Ribosoma
nina
o
i
Otras regiones repetidas en tndem corresponden a genes implicados
t
Me
Sntesis de protena
en la fabricacin de los ribosomas. stos se hallan repetidos cientos de
veces en los brazos cortos de los cromosomas 13, 14, 15, 21 y 22.
Figura 3 Transmisin de la informacin del ADN al ARNmensajero (ARNm)
Entre las secuencias dispersas ms abundantes se hallan las sey su decodificacin a travs del cdigo gentico. La transcripcuencias Alu I (regiones que contienen la secuencia AGCT que es
cin de la cadena antisentido del ADN da lugar a un ARNm (con
reconocida por la enzima de restriccin Alu I). Estas secuencias
sentido). La transmisin de la informacin del ADN al ARN se
aparecen repetidas cerca de un milln de veces en el genoma, con
produce por complementariedad de las bases correspondientes
una longitud cada una de 300-500 pb. Por s solas, estas regiones re(T-A, A-U, C-G, G-C). La clave del cdigo gentico consiste en que
presentan alrededor del 6-8% del genoma humano1. Hay teoras
a cada aminocido le corresponde uno o varios triplete de bases
que intentan explicar la presencia de estas regiones Alu I, pero nincaractersticos (vase tabla I). La sntesis proteica tiene lugar
en el ribosoma en donde se van incorporando los distintos
guna de ellas ha sido hasta ahora aceptada de forma general. Otro
ARNt-aminocido aparendose perfectamente al siguiente tritipo de secuencias dispersas son las denominadas microsatlites.
plete libre en el ARNm. En el ribosoma tiene lugar el enlace coEstas secuencias se hallan ms o menos distribuidas uniformemenvalente (enlace peptdico) entre los distintos aminocidos para
te dentro del genoma y son hipervariables o polimrficas. En estos
dar lugar a la protena correspondiente.
momentos no se les conoce funcin alguna, aunque s son de gran
ayuda en diagnstico e investigacin (p. ej., estudios de ligamiento,
nen aberraciones en su secuencia y que, por ello, no son expresados
paternidades, prdida de heterozigosidad, etc. (vase captulos
por la maquinaria celular. Si partimos de que hay unos 40.000 genes
Herramientas bsicas de anlisis gentico de este monogrfico).
funcionales en total y que la mayora de genes tienen una longitud entre 3.000 y 10.000 pb, haciendo un simple clculo obtendremos que
entre todos los genes se necesitan entre 120 y 400 millones de pb. Si
ESTRUCTURA BSICA DE LOS GENES.
sabemos que el genoma humano tiene alrededor de 3.000 millones, el
INTRONES Y EXONES
resultado es que hay mucho ADN (alrededor del 87%) entre gen y
gen que, aparentemente, no contiene informacin. Entre este ADN
La unidad bsica de informacin gentica es el gen (fig. 2). Un gen
que aparentemente no contiene informacin, y a la luz de los resultase puede definir como una regin (fsica) del ADN cuya secuencia

TEMA MONOGRFICO
GENTICA BSICA (I)

Genoma humano y estructura bsica de los genes


J. Oriola y R. Oliva

TABLA I Cdigo gentico


UUU
UUC
UUA
UUG
CUU
CUC
CUA
CUG
AUU
AUC
AUA
AUG
GUU
GUC
GUA
GUG

Fenilalanina (Phe, F)

Leucina (Leu, L)

Leucina (Leu, L)

Isoleucina (Ile, I)

Metionina (Met, M)
Valina (Val, V)

UCU
UCC
UCA
UCG
CCU
CCC
CCA
CCG
ACU
ACC
ACA
ACG
GCU
GCC
GCA
GCG

Serina (Ser, S)

Prolina (Pro, P)

Treonina (Thr, T)

Alanina (Ala, A)

UAU
UAC
UAA
UAG
CAU
CAC
CAA
CAG
AAU
AAC
AAA
AAG
GAU
GAC
GAA
GAG

Tirosina (Tyr, Y)

Stop
Stop
Histidina (His, H)

Glutamina (Gln, Q)

Asparagina (Asn, N)

Lisina (Lys, K)

Asprtico (Asp, D)

Glutmico (Glu, E)

UGU
UGC
UGA
UGG
CGU
CGC
CGA
CGG
AGU
AGC
AGA
AGG
GGU
GGC
GGA
GGG

Cistena (Cys, C)

Stop
Triptfano (Trp, W)
Arginina (Arg, R)

Serina (Ser, S)

Arginina (Arg, R)

Glicina (Gly, G)

Se indica el aminocido codificado por cada triplete. Entre parntesis se indican tambin las dos posibles abreviaciones empleadas para cada aminocido. El cdigo gentico presentado corresponde al del genoma nuclear. El cdigo gentico para el genoma mitocondrial, para bacterias y para algunos organismos inferiores difiere en determinados codones
respecto al cdigo presentado aqu.

de bases contiene informacin para dar lugar a una unidad transcripcional con sus diversas secuencias reguladoras asociadas. El tamao de los genes oscila entre los 500 pb del gen de la protamina4
(uno de los ms pequeos) y los 3 millones de pb del gen de la distrofina5 (uno de los ms grandes), aunque por trmino medio poseen alrededor de 3.000-10.000 pb6,7. Otras caractersticas importantes de los genes es que poseen polaridad 5-3, esto es, el gen se
lee en sentido 5-3 y no al revs (figs. 2 y 3). Tambin cabe sealar
que en la regin anterior al inicio del primer exn existe la regin
promotora (fig. 2). A esta regin del ADN se unen factores de
transcripcin, ya sean especficos o generales (vase captulo 2 de
este monogrfico, especfico para los aspectos de regulacin de la
expresin gnica).
Los primeros genes que se estudiaron fueron los bacterianos.
En ellos, cuando se sintetiza el ARN mensajero (ARNm) se observa el mismo orden de nucletidos que posee el ADN, teniendo en
cuenta que en el ARN la timina (T) es sustituida por el uracilo (U)
(fig. 3). Cuando se empezaron a estudiar los genes en eucariotas,
se consider que tendran estructuras parecidas. Pronto se comprob que no era as. Los genes que se hallan en organismos eucariotas poseen intrones (fig. 2). Los intrones son los segmentos de
ADN que no estn presentes en el ARNm y, por tanto, no se traducen en aminocidos. Los intrones constituyen el 85-95% de la
secuencia nucleotdica de un gen, es decir, slo una pequea parte
de la secuencia de un gen pasa a ARNm. En la mayora de casos,
se desconoce la funcin de los intrones. Tan slo sus extremos (alrededor de 4 o 5 pb) participan de una forma muy importante en
la maduracin del ARNm. En algunos genes, no obstante, se han
hallado regiones reguladoras que se hallan dentro de los intrones.
Como casos puntuales que ayudan a entender la gran diversidad
estructural de los genes, cabe mencionar al gen que codifica para
la enzima 21-hidroxilasa (CYP21), y al gen de la tenascina-XB, ambos superpuestos en sus extremos 3 terminales6. Uno se transcribe
de izquierda a derecha y el otro de derecha a izquierda. Otro
ejemplo curioso es el caso del gen NF-1, el cual posee 3 genes pequeos en su zona intrnica.
TRANSMISIN DE LA INFORMACIN GENTICA
DEL ADN A LAS PROTENAS
El primer paso en la transmisin de la informacin gentica presente en el ADN a las protenas es la copia de esta informacin a
una molcula intermediaria denominada ARNm (figs. 2 y 3)8. La
informacin contenida en la secuencia de bases del ADN se transmite fielmente al ARNm gracias al apareamiento de las bases del
ADN con las bases de ARN (la T se aparea con la A del ARN, la A

se aparea con el uracilo [U] del ARN, la G se aparea con la C, y la


C se aparea con la G) (fig. 3). La sntesis del ARNm corre a cargo
de la ARN polimerasa, utilizando como molde la secuencia de bases presente en el ADN (figs. 2 y 3). Al ARN recin sintetizado se
le denomina trnscrito primario (fig. 2). Este trnscrito primario
experimenta un proceso de maduracin consistente en la eliminacin de los intrones y el procesado del extremo 3 (fig. 2) dando lugar al ARNm maduro8.
La informacin gentica presente en el ARNm se transmite a
las protenas gracias a la existencia de un proceso de traduccin de
la informacin (fig. 3). El cdigo de traduccin de esta informacin se denomina cdigo gentico, y esencialmente consiste en
que a cada 3 bases concretas de la secuencia del ARN mensajero
le corresponde un aminocido (tabla I). Las protenas se inician
siempre con el aminocido metionina codificado por el triplete
AUG (tabla I y fig. 3). La sntesis proteica corre a cargo del ribosoma (fig. 3). Las molculas clave en la traduccin de la informacin
gentica son los ARN de transferencia, ya que poseen la propiedad
de aparearse especficamente a los distintos tripletes existentes en
el ARN. Antes de que se produzca esta unin, cada ARN de transferencia se ha acoplado al aminocido correspondiente al triplete
(fig. 3). La sntesis proteica consiste precisamente en la unin covalente entre los distintos aminocidos que se van apareando al
ARNm (fig. 3). La sntesis proteica termina siempre que el ribosoma se encuentra con uno de los codones de terminacin (TGA,
TAG, TAA; tabla I). As pues, la informacin gentica presente en
el ADN se transmite, a travs del ARNm, a las protenas en forma
de la secuencia de aminocidos. Las protenas, a su vez, desempearn la mayora de las funciones celulares (figs. 2 y 3). 

Bibliografa
1. Oliva R. Genoma humano. Barcelona: Masson S.A., 1996.
2. Dunham I, Shimizu N, Roe BA, Chissoe S, Hunt AR, Collins JE et al. The
DNA sequence of human chromosome 22. Nature 1999; 402: 489-495.
3. Moyzis RK, Buckingham JM, Scott Cram L, Dani M, Deaver LL, Jones MD et
al. Highly conserved repetitive DNA sequence (TTAGGG)n, present at telomeres of human chromosomes. Proc Natl Acad Sci USA 1988; 85: 6622-6626.
4. Oliva R, Dixon GH. Vertebrate protamine genes and the histone to protamine
replacement reaction. Prog Nucl Acids Res Mol Biol 1991; 40: 25-94.
5. Tennyson CN, Klamut HS, Worton RG. The human dystrophin gene requires
16 hours to be transcribed and is cotranscriptionally spliced. Nat Genet 1995; 9:
184-190.
6. Oriola J. Diagnstico molecular de los dficit de 21-hidroxilasa y su correlacin
con el fenotipo. Endocrinologa 46: 168-172.
7. Vidal-Taboada JM, Sanz S, Egeo A, Scartezzini P, Oliva R. Identification and
characterization of a new gene from human chromosome 21 between markers
D21S343 and D21S268 encoding a leucine rich protein. Biochem and Biophys
Res Comm 1998; 250: 547-554.
8. Watson JD, Hopkins NH, Roberts JW, Steitz JA, Weiner AM. Molecular biology of the gene. Menlo Park: Benjamin/Cummings, 1987.

Potrebbero piacerti anche