Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
El genoma humano es el genoma del Homo sapiens, es decir, la secuencia de ADN contenida
en 23 pares decromosomas en el ncleo de cada clula humana diploide. De los 23 pares, 22
son cromosomas autosmicos y un par determinante del sexo (dos cromosomas X en mujeres,
y un X y un Y en varones). El genoma haploide (es decir, una sola representacin por cada par)
tiene una longitud total aproximada de 3200 millones de pares de bases de ADN (3200 Mb) que
contienen unos 20 000-25 000genes1 (las estimaciones ms recientes apuntan a unos 20 500).
De las 3200 Mb, 2950 Mb corresponden a eucromatina y unas 250 Mb a heterocromatina.
ElProyecto Genoma Humano produjo una secuencia de referencia del genoma humano
eucromtico, usado en todo el mundo en las ciencias biomdicas.
La secuencia de ADN que conforma el genoma humano contiene la informacin codificada,
necesaria para la expresin, altamente coordinada y adaptable al ambiente,
del proteoma humano, es decir, del conjunto de las protenas del ser humano. Las protenas, y
no
el
ADN,
son
las
principales biomolculas efectoras;
poseen
funciones
estructurales, enzimticas, metablicas, reguladoras y sealizadoras, organizndose en
enormes redes funcionales de interacciones. En definitiva, el proteoma fundamenta la
particular morfologa y funcionalidad de cada clula. Asimismo, la organizacin estructural y
funcional de las distintas clulas conforma cadatejido y cada rgano, y, finalmente, el
organismo vivo en su conjunto. As, el genoma humano contiene la informacin bsica
necesaria para el desarrollo fsico de un ser humano completo.
El genoma humano presenta una densidad de genes muy inferior a la que inicialmente se haba
predicho, con slo 1.5 %2 de su longitud compuesta por exonescodificantes de protenas. Un
70 % est compuesto por ADN extragnico y un 30% por secuencias relacionadas con genes.
Del total de ADN extragnico, aproximadamente un 70 % corresponde a repeticiones dispersas,
de manera que, ms o menos, la mitad del genoma humano corresponde a secuencias
repetitivas de ADN. Por su parte, del total de ADN relacionado con genes se estima que el 95 %
corresponde a ADN no codificante: pseudogenes, fragmentos de genes, introneso
secuencias UTR, entre otros.
En el genoma humano se detectan ms de 280 000 elementos reguladores, aproximadamente
un total de 7Mb de secuencia, que se originaron por medio de inserciones de elementos
mviles. Estas regiones reguladoras se conservan en elementos no exnicos (CNEEs),fueron
nombrados como: SINE, LINE, LTR.2 Se sabe que al menos entre un 11 % y un 20 % de estas
secuencias reguladoras de genes, que estn conservadas entre especies, fue formado por
elementos mviles.
El Proyecto Genoma Humano, que se inici en el ao 1990, tuvo como propsito descifrar el
cdigo gentico contenido en los 23 pares de cromosomas, en su totalidad. En 2005 se dio por
finalizado este estudio llegando a secuenciarse aproximadamente 28 000 genes. Y, el 2 de
junio de 2016, los cientficos anunciaron formalmente el Proyecto Genoma HumanoEscrito (acrnimo en ingls HGP-Write) un plan para sintetizar el genoma humano. 3 4 5 6 7 8
Tamao
genoma (Mb)
del Nmero
de genes
0.15
182
Streptococcus pneumoniae
2.2
2300
Escherichia coli
4.6
4400
Saccharomyces cerevisiae
12
5800
Caenorhabditis elegans
97
19000
Arabidopsis thaliana
125
25500
180
13700
466
45 000-55 000
2500
29 000
2900
27 000
La funcin de la gran mayora de las bases del genoma humano es desconocida. El Proyecto
ENCODE (acrnimo de ENCyclopedia Of DNA Elements) ha trazado regiones de transcripcin,
asociacin a factores de transcripcin, estructura de la cromatina y modificacin de las
histonas. Estos datos han permitido asignar funciones bioqumicas para el 80 % del genoma,
principalmente, fuera de los exones codificantes de protenas. El proyecto ENCODE
proporciona nuevos conocimientos sobre la organizacin y la regulacin de los genes y el
genoma, y un recurso importante para el estudio de la biologa humana y las enfermedades.
Componentes
Cromosomas
El genoma humano (como el de cualquier organismo eucariota) est formado por cromosomas,
que son largas secuencias continuas de ADN altamente organizadas espacialmente (con ayuda
de protenas histnicas y no histnicas) para adoptar una forma ultracondensada en metafase.
Son observables con microscopa pticaconvencional o de fluorescencia mediante tcnicas
de citogentica y se ordenan formando un cariotipo.
El cariotipo humano normal contiene un total de 23 pares de cromosomas distintos: 22 pares
de autosomas ms 1 par de cromosomas sexuales que determinan el sexo del individuo. Los
cromosomas 1-22 fueron numerados en orden decreciente de tamao en base al cariotipo. Sin
embargo, posteriormente pudo comprobarse que el cromosoma 22 es en realidad mayor que el
21.
Las clulas somticas de un organismo poseen en su ncleo un total de 46 cromosomas (23
pares): una dotacin de 22 autosomas procedentes de cada progenitor y un par de
cromosomas sexuales, un cromosoma X de la madre y un X o unY del padre. (Ver imagen 1).
Los gametos -vulos y espermatozoides- poseen una dotacin haploide de 23 cromosomas.
Nmero
de
pares
Pares
de
bases
Cromosoma
Genes
de bases
secuenciadosnota 1
1
4220
1491
1550
446
609
2281
2135
1106
1920
10
1793
11
379
12
1430
13
924
95 559 980
14
1347
88 290 585
15
921
81 341 915
16
909
88 822 254
78 884 754
17
1672
78 654 742
77 800 220
Cromosoma
Genes
Nmero
de bases
de
pares
Pares
de
secuenciadosnota 1
18
519
76 117 153
74 656 155
19
1555
63 806 651
55 785 651
20
1008
62 435 965
59 505 254
21
578
46 944 323
34 171 998
22
1092
49 528 953
34 893 953
X (cromosoma sexual)
1846
Y (cromosoma sexual)
454
57 741 652
25 121 652
Total
32 185
ADN intragnico
Genes
Un gen es la unidad bsica de la herencia, y porta la informacin gentica necesaria para la
sntesis de una protena (genes codificantes) o de un ARN no codificante (genes de ARN). Est
formado por una secuencia promotora, que regula su expresin, y una secuencia que
se transcribe, compuesta a su vez por: secuencias UTR (regiones flanqueantes no traducidas),
necesarias para la traduccin y la estabilidad del ARNm, exones (codificantes) e intrones, que
son secuencias de ADN no traducidas situadas entre dos exones que sern eliminadas en el
procesamiento del ARNm (ayuste).
Este diagrama esquemtico muestra un gen en relacin a su estructura fsica (doble hlice de
ADN) y a un cromosoma (derecha). Los intrones son regiones frecuentemente encontradas en
los genes de eucariotas, que se transcriben, pero son eliminadas en el procesamiento del ARN
(ayuste) para producir un ARNm formado slo por exones, encargados de traducir una
protena. Este diagrama es en exceso simplificado ya que muestra un gen compuesto por unos
40 pares de bases cuando en realidad su tamao medio es de 20 000-30 000 pares de bases).
Actualmente se estima que el genoma humano contiene entre 20 000 y
25 000 genes codificantes de protenas, estimacin muy inferior a las predicciones iniciales que
hablaban de unos 100 000 genes o ms. Esto implica que el genoma humano tiene menos del
doble de genes que organismos eucariotas mucho ms simples, como la mosca de la fruta o
el nematodo Caenorhabditis elegans. Sin embargo, las clulas humanas recurren ampliamente
al splicing(ayuste) alternativo para producir varias protenas distintas a partir de un mismo gen,
como consecuencia de lo cual elproteoma humano es ms amplio que el de otros organismos
mucho ms simples. En la prctica, el genoma tan sloporta la informacin necesaria para una
expresin perfectamente coordinada y regulada del conjunto de protenas que conforman el
proteoma, siendo ste el encargado de ejecutar la mayor parte de las funciones celulares.
Con base en los resultados iniciales arrojados por el proyecto ENCODE10 (acrnimo
de ENCyclopedia Of DNAElements), algunos autores han propuesto redefinir el concepto
actual de gen. Las observaciones ms recientes hacen difcilmente sostenible la visin
tradicional de un gen, como una secuencia formada por las regiones UTRs, los exones y los
intrones. Estudios detallados han hallado un nmero de secuencias de inicio de transcripcin
por gen muy superior a las estimaciones iniciales, y algunas de estas secuencias se sitan en
regiones muy alejadas de la traducida, por lo que los UTR 5' pueden abarcar secuencias largas
dificultando la delimitacin del gen. Por otro lado, un mismo transcrito puede dar lugar a ARN
maduros totalmente diferentes (ausencia total de solapamiento), debido a una gran utilizacin
del splicing alternativo. De este modo, un mismo transcrito primario puede dar lugar a protenas
de secuencia y funcionalidad muy dispar. En consecuencia, algunos autores han propuesto una
nueva definicin de gen,:11 12 la unin de secuencias genmicas que codifican un conjunto
coherente de productos funcionales, potencialmente solapantes. De este modo, se
identifican como genes los genes ARN y los conjuntos de secuencias traducidas parcialmente
solapantes (se excluyen, as, las secuencias UTR y los intrones, que pasan a ser considerados
como "regiones asociadas a genes", junto con los promotores). De acuerdo con esta definicin,
un mismo transcrito primario que da lugar a dos transcritos secundarios (y dos protenas) no
bases
sistemas de regulacin a nivel del procesamiento, estabilidad y traduccin del ARNm, entre
otros. Por lo tanto, la expresin gnica est intensamente regulada, lo cual permite desarrollar
los
mltiples fenotipos que
caracterizan
los
distintos
tipos
celulares
de
un
organismo eucariota multicelular, al mismo tiempo que dota a la clula de la plasticidad
necesaria para adaptarse a un medio cambiante. No obstante, toda la informacin necesaria
para la regulacin de la expresin gnica, en funcin del ambiente celular, est codificada en la
secuencia de ADN al igual que lo estn los genes.
Las secuencias reguladoras son tpicamente secuencias cortas presentes en las proximidades
o en el interior (frecuentemente en intrones) de los genes. En la actualidad, el conocimiento
sistemtico de estas secuencias y de cmo actan en complejas redes de regulacin gnica,
sensibles a seales exgenas, es muy escaso y est comenzando a desarrollarse mediante
estudios de genmica comparada, bioinformtica y biologa de sistemas. La identificacin de
secuencias reguladoras se basa en parte en la bsqueda de regiones no codificantes
evolutivamente conservadas.13 Por ejemplo, la divergencia evolutiva entre el ratn y el ser
humano ocurri hace 70 a 90 millones de aos.14 Mediante estudios de genmica comparada,
alineando secuencias de ambos genomas pueden identificarse regiones con alto grado de
coincidencia, muchas correspondientes a genes y otras a secuencias no codificantes de
protenas pero de gran importancia funcional, dado que han estado sometidas a presin
selectiva.
Elementos ultraconservados
Reciben este nombre regiones que han mostrado una constancia evolutiva casi total, mayor
incluso que las secuencias codificantes de protenas, mediante estudios de genmica
comparada. Estas secuencias generalmente se solapan con intrones de genes implicados en la
regulacin de la transcripcin o en el desarrollo embrionario y con exones de genes
relacionados con el procesamiento del ARN. Su funcin es generalmente poco conocida, pero
probablemente de extrema importancia dado su nivel de conservacin evolutiva, tal y como se
ha expuesto en el punto anterior.
En la actualidad se han encontrado unos 500 segmentos de un tamao mayor a 200 pares de
bases totalmente conservados (100 % de coincidencia) entre los genomas de humano, ratn y
rata, y casi totalmente conservados en perro (99 %) y pollo (95 %).15
Pseudogenes[editar]
En el genoma humano se han encontrado asimismo unos 19 000 pseudogenes, que son
versiones completas o parciales de genes que han acumulado diversasmutaciones y que
generalmente no se transcriben. Se clasifican en pseudogenes no procesados (~30 %) y
pseudogenes procesados (~70 %)16
Frecuencia de las diversas regiones intergnicas e intragnicas del cromosoma 22. Adaptado
de: Dunham, I., et al., 1999. The DNA sequence of human chromosome 22, Nature 402(6761):
489495.
Estudios recientes enmarcados en el proyecto ENCODE han obtenido resultados
sorprendentes, que exigen la reformulacin de nuestra visin de la organizacin y la dinmica
del genoma humano. Segn estos estudios, el 15 % de la secuencia del genoma humano se
transcribe a ARN maduros, y hasta el 90 % se transcribe al menos a transcritos inmaduros en
algn tejido:12 As, una gran parte del genoma humano codifica genes de ARN funcionales. Esto
es coherente con la tendencia de la literatura cientfica reciente a asignar una importancia
creciente al ARN en la regulacin gnica. Asimismo, estudios detallados han identificado un
nmero mucho mayor de secuencias de inicio de transcripcin por gen, algunas muy alejadas
de la regin prxima a la traducida. Como consecuencia, actualmente resulta ms complicado
definir una regin del genoma como gnica o intergnica, dado que los genes y las secuencias
relacionadas con los genes se extienden en las regiones habitualmente consideradas
intergnicas.
ADN repetido en tndem
Son repeticiones que se ordenan de manera consecutiva, de modo que secuencias idnticas, o
casi, se disponen unas detrs de otras.
Satlites[editar]
El conjunto de repeticiones en tndem de tipo satlite comprende un total de 250 Mb del
genoma humano. Son secuencias de entre 5 y varios cientos de nucletidos que se repiten en
tndem miles de veces generando regiones repetidas con tamaos que oscilan entre 100 kb
(100 000 nucletidos) hasta varias megabases.
Reciben su nombre de las observaciones iniciales de centrifugaciones en gradiente de
densidad del ADN genmico fragmentado, que reportaban una banda principal correspondiente
a la mayor parte del genoma y tres bandas satlite de menor densidad. Esto se debe a que las
secuencias satlite tienen una riqueza en nucletidos A+T superior a la media del genoma y en
consecuencia son menos densas.
Hay principalmente 6 tipos de repeticiones de ADN satlite 15
1. Satlite 1: secuencia bsica de 42 nucletidos. Situado en los centrmeros de los
cromosomas 3 y 4 y el brazo corto de los cromosomas acrocntricos (en posicin
distal respecto al clster codificante de ARNr).
2. Satlite 2: la secuencia bsica es ATTCCATTCG. Presente en las proximidades de los
centrmeros de los cromosomas 2 y 10, y en la constriccin secundariade 1 y 16.
3. Satlite 3: la secuencia bsica es ATTCC. Presente en la constriccin secundaria de
los cromosomas 9 e Y, y en posicin proximal respecto al clster de ADNr del brazo
corto de los cromosomas acrocntricos.
4. Satlite alfa: secuencia bsica de 171 nucletidos. Forma parte del ADN de los
centrmeros cromosmicos.
5. Satlite beta: secuencia bsica de 68 nucletidos. Aparece en torno al centrmero en
los cromosomas acrocntricos y en la constriccin secundaria del cromosoma 1.
6. Satlite gamma: secuencia bsica de 220 nucletidos. Prximo al centrmero de los
cromosomas 8 y X.
Minisatlites
Estn compuestas por una unidad bsica de secuencia de 6-25 15 nucletidos que se repite en
tndem generando secuencias de entre 100 y 20 000 pares de bases. Se estima que el
genoma humano contiene unos 30 000 minisatlites.
Diversos estudios han relacionado los minisatlites con procesos de regulacin de la expresin
gnica, como el control del nivel de transcripcin, el ayuste (splicing) alternativo o
la impronta (imprinting). Asimismo, se han asociado con puntos de fragilidad cromosmica
dado
que
se
sitan
prximos
a
lugares
preferentes
de
rotura
cromosmica, translocacin gentica
y recombinacin meitica.
Por
ltimo,
algunos
minisatlites humanos (~10 %) son hipermutables, presentando una tasa media de mutacin
entre el 0.5 % y el 20 % en las clulas de la lnea germinal, siendo as las regiones ms
inestables del genoma humano conocidas hasta la fecha.
En el genoma humano, aproximadamente el 90 % de los minisatlites se sitan en
los telmeros de los cromosomas. La secuencia bsica de seis nucletidos TTAGGG se repite
miles de veces en tndem, generando regiones de 5-20 kb que conforman los telmeros.
Algunos minisatlites por su gran inestabilidad presentan una notable variabilidad entre
individuos distintos. Se consideran polimorfismos multiallicos, dado que pueden presentarse
en un nmero de repeticiones muy variable, y se denominan VNTR (acrnimo de Variable
number tandem repeat). Son marcadores muy utilizados en gentica forense, ya que permiten
establecer una huella gentica caracterstica de cada individuo, y son identificables
mediante Southern blot ehibridacin.
Microsatlites
Estn compuestos por secuencias bsicas de 2-4 nucletidos, cuya repeticin en tndem
origina frecuentemente secuencias de menos de 150 nucletidos. Algunos ejemplos
importantes son el dinucletido CA y el trinucletido CAG.
Los microsatlites son tambin polimorfismos multiallicos, denominados STR (acrnimo
de Short Tandem Repeats) y pueden identificarse mediante PCR, de modo rpido y sencillo. Se
estima que el genoma humano contiene unos 200 000 microsatlites, que se distribuyen ms o
menos homogneamente, al contrario que los minisatlites, lo que los hace ms informativos
como marcadores.
ADN repetido disperso
Son secuencias de ADN que se repiten de modo disperso por todo el genoma, constituyendo el
45 % del genoma humano. Los elementos cuantitativamente ms importantes son los LINEs y
SINEs, que se distinguen por el tamao de la unidad repetida.
Estas secuencias tienen la potencialidad de autopropagarse al transcribirse a una ARNm
intermediario, retrotranscribirse e insertarse en otro punto del genoma. Este fenmeno se
produce con una baja frecuencia, estimndose que 1 de cada 100-200 neonatos portan una
insercin nueva de un Alu o un L1, que pueden resultarpatognicos por mutagnesis
insercional, por desregulacin de la expresin de genes prximos (por los propios promotores
de los SINE y LINE) o por recombinacin ilegtima entre dos copias idnticas de distinta
localizacin cromosmica (recombinacin intra o intercromosmica), especialmente entre
elementos Alu.
Frecuencias y tipos de repeticiones dispersas en el genoma de varios organismos 15
Tipo repeticin
Homo
sapiens
Drosophila
melanogaster
Caenorhabditis
elegans
Arabidopsis
thaliana
LINE,SINE
33.4 %
0.7 %
0.4 %
0.5 %
LTR/HERV
8.1 %
1.5 %
0%
4.8 %
Transposones ADN
2.8 %
0.7 %
5.3 %
5.1 %
Homo
sapiens
Drosophila
melanogaster
Caenorhabditis
elegans
Arabidopsis
thaliana
Total
44.4 %
3.1 %
6.5 %
10.4 %
SINE
Acrnimo del ingls Short Interspersed Nuclear Elements (Elementos nucleares dispersos
cortos). Son secuencias cortas, generalmente de unos pocos cientos de bases, que aparecen
repetidas miles de veces en el genoma humano. Suponen el 13 % del genoma humano,15 un
10 % debido exclusivamente a la familia de elementos Alu (caracterstica de primates).
Los elementos Alu son secuencias de 250-280 nucletidos presentes en 1 500 00015 de copias
dispersas por todo el genoma. Estructuralmente son dmeros casi idnticos, excepto que la
segunda unidad contiene un inserto de 32 nucletidos, siendo mayor que la primera. En cuanto
a su secuencia, tienen una considerable riqueza en G+C (56 %),15 por lo que predominan en
las bandas R, y ambos monmeros presentan una cola poliA (secuencia de adeninas) vestigio
de su origen de ARNm. Adems poseen un promotor de la ARN polimerasa III para
transcribirse. Se consideran retrotransposones no autnomos, ya que dependen para
propagarse de la retrotranscripcin de su ARNm por una retrotranscriptasa presente en el
medio.
LINE
Esquema simplificado del mecanismo de retrotransposicin de un elemento LINE y un SINE.
Un elemento LINE es transcrito produciendo un ARNm que sale del ncleo celular. En
el citoplasma setraduce en sus dos marcos de lectura abiertos, que no se superponen, generan
ambas protenas (vase el texto), que para simplificar se han representado como ORF1p y
ORF2p. Ambas permiten retrotranscribir el ARNm del LINE y de otros retrotransposones no
autnomos, como SINEs y pseudogenes procesados. Durante la retrotranscripcin la nueva
secuencia de ADN se integra en otro punto del genoma.
Acrnimo del ingls Long Interspersed Nuclear Elements (Elementos nucleares dispersos
largos). Constituyen el 20 % del genoma humano, contiene unos 100 000-500 000 copias de
retrotransposones L1 que es la familia de mayor importancia cuantitativa, es una secuencia de
6 kb repetida unas 800 000 veces de modo disperso por todo el genoma, aunque la gran
mayora de las copias es incompleta al presentar el extremo 5' truncado por una
retrotranscripcin incompleta. As, se estima que hay unas 5000 copias completas de L1, slo
90 de las cuales son activas,15 estando el resto inhibidas por metilacin de su promotor.
Su riqueza en G+C es del 42 %,15 prxima a la media del genoma (41 %) y se localizan
preferentemente en las bandas G de los cromosomas. Poseen adems un promotor de la ARN
polimerasa II.
Los elementos LINE completos son codificantes. En concreto LINE-1 codifica dos protenas:
1. Protena de unin a ARN (RNA-binding protein): codificada por el marco de lectura
abierto 1 (ORF1, acrnimo del ingls Open reading Frame 1)
2. Enzima con actividad retrotranscriptasa y endonucleasa: codificada por el ORF2.
Ambas protenas son necesarias para la retrotransposicin.
Estos elementos mviles estn flanqueados por 2 regiones no codificantes, denominados como
5UTR y 3UTR.
Por lo tanto, se consideran retrotransopsones autnomos, ya que codifican las protenas que
necesitan para propagarse. La ARN polimerasa II presente en el medio transcribe el LINE, y
este ARNm se traduce en ambos marcos de lectura produciendo una retrotranscriptasa que
acta sobre el ARNm generando una copia de ADN del LINE, potencialmente capaz de
insertarse en el genoma. Asimismo estas protenas pueden ser utilizadas por pseudogenes
procesados o elementos SINE para su propagacin.
La transcripcin se inicia en un promotor interno del extremo 5UTR. La endonucleasa de L1
genera una mella en una nica cadena del ADN genmico, en una secuencia consenso 5
TTTTT/A3.
Diversos estudios han mostrado que las secuencias LINE pueden tener importancia en la
regulacin de la expresin gnica, habindose comprobado que los genes prximos a LINE
presentan un nivel de expresin inferior. Esto es especialmente relevante porque
aproximadamente el 80 % de los genes del genoma humano contiene algn elemento L1 en
sus intrones.15
Los SNP son marcadores tetrallicos, dado que en teora en una posicin puede haber cuatro
nucletidos distintos, cada uno de los cuales identificara un alelo; sin embargo, en la prctica
suelen presentar slo dos alelos en la poblacin. Se estima que la frecuencia de SNP en el
genoma humano es de un SNP cada 500-100 pares de bases, 15 de los que una parte relevante
son polimorfismos codificantes, que causan la sustitucin de un aminocido por otro en una
protena.
Gracias a su abundancia y a que presentan una distribucin aproximadamente uniforme en el
genoma, han tenido gran utilidad como marcadores para los mapas de ligamiento, herramienta
fundamental del Proyecto Genoma Humano. Adems son fcilmente detectables a gran escala
mediante el empleo de chips de ADN (comnmente conocidos como microarrays).
Variacin estructural
Este tipo de variaciones se refiere a duplicaciones, inversiones, inserciones o variantes en el
nmero de copias de segmentos grandes del genoma (por lo general de 1000 nuclotidos o
ms). Estas variantes implican a una gran proporcin del genoma, por lo que se piensa que
son, al menos, tan importantes como los SNPs.18
Variacin estructural es el trmino general para abarcar un grupo de alteraciones genmicas
que implican segmentos de ADN mayores de 1 Kb. La variacin estructural puede ser
cuantitativa (variante en nmero de copia, que comprende: deleciones, inserciones y
duplicaciones), posicional (translocaciones) y orientacional (inversiones).
A pesar de que este campo de estudio es relativamente nuevo (los primeros estudios a gran
escala se publicaron en los aos 2004 y 2005), ha tenido un gran auge, hasta el punto de que
se ha creado un nuevo proyecto para estudiar este tipo de variantes en los mismos individuos
en los que se bas el Proyecto HapMap.
Aunque an quedan dudas acerca de las causas de este tipo de variantes, cada vez existe ms
evidencia a favor de que es un fenmeno recurrente que todava continua moldeando y
creando nuevas variantes del genoma.
Este tipo de variaciones han potenciado la idea de que el genoma humano no es una entidad
esttica, sino que se encuentra en constante cambio y evolucin.
Enfermedades genticas
La alteracin de la secuencia de ADN que constituye el genoma humano puede causar la
expresin anormal de uno o ms genes, originando un fenotipo patolgico. Las enfermedades
genticas pueden estar causadas por mutacin de la secuencia de ADN, con afectacin de la
secuencia codificante (produciendo protenasincorrectas) o de secuencias reguladoras
(alterando el nivel de expresin de un gen), o por alteraciones cromosmicas, numricas o
estructurales. La alteracin del genoma de las clulas germinales de un individuo se transmite
frecuentemente a su descendencia. Actualmente el nmero de enfermedades genticas
conocidas es aproximadamente de 4 000, siendo la ms comn la fibrosis qustica.
El estudio de las enfermedades genticas frecuentemente se ha englobado dentro de la
gentica de poblaciones. Los resultados del Proyecto Genoma Humano son de gran
importancia para la identificacin de nuevas enfermedades genticas y para el desarrollo de
nuevos y mejores sistemas de diagnstico gentico, as como para la investigacin en nuevos
tratamientos, incluida la terapia gnica.
Mutaciones
Las mutaciones gnicas pueden ser:
lectura (frameshift), de modo que la secuencia de nucletidos del ARNm se lee de manera
incorrecta.
Las mutaciones gnica pueden afectar a:
Descripcin
Ejemplos
Autosmico
dominante
Enfermedad
de
Huntington,neurofibromatosis
1, sndrome
de
Marfan, cncer
colorrectal
hereditario no polipsico
Autosmico
recesivo
Fibrosis qustica,anemia de
clulas
falciformes,enfermedad
de
Tay-Sachs, atrofia muscular
espinal
Dominante
ligado al X
Recesivo
ligado al X
Ligado a Y
Mitocondrial
de
masculina
autismo
enfermedad cardiovascular
hipertensin
diabetes
obesidad
cncer
Alteraciones cromosmicas
Las alteraciones genticas pueden producirse tambin a escala cromosmica
(cromosomopatas), causando severos trastornos que afectan a mltiples genes y que en
muchas ocasiones son letales provocando abortos prematuros. Frecuentemente estn
provocadas por un error durante la divisin celular, que sin embargo no impide su conclusin.
Las alteraciones cromosmicas reflejan una anormalidad en el nmero o en la estructura de los
cromosomas, por lo que se clasifican en numricas y estructurales. Provocan fenotipos muy
diversos, pero frecuentemente presentan unos rasgos comunes:
Frecuencia
(/1000)
Sndrome
Trisoma 21
1.5
de Down
Trisoma 18
0.12
de Edwards
Trisoma 13
0.07
de Patau
Monosoma X
0.4
de Turner
XXY
1.5
de Klinefelter
XYY
1.5
del XYY
Es una alteracin del nmero normal de cromosomas de un individuo, que normalmente
presenta 23 pares de cromosomas (46 en total), siendo cada dotacin cromosmica de un
progenitor (diploida). Si la alteracin afecta a un slo par de cromosomas se habla
de aneuploida, de manera que puede haber un slo cromosoma (monosoma) o ms de dos
(trisoma, tetrasoma...). Un ejemplo de gran prevalencia es la trisoma 21, responsable del
Sndrome de Down. Si por el contrario la alteracin afecta a todos los cromosomas se habla
de euploidas, de manera que en teora el individuo tiene una sola dotacin cromosmica
(haploida, 23 cromosomas en total) o ms de dos dotaciones (triploida: 69
cromosomas; tetraploida: 92 cromosomas...). En la prctica las euploidas causan letalidad
embronaria (abortos) siendo muy pocos los nacidos vivos, y fallecen muy tempranamente. Las
aneuploidas son mayoritariamente letales, salvo las trisomas de los cromosomas 13, 18, 21, X
e Y (XXY, XYY), y la monosoma del cromosoma X. En la tabla se muestran las frecuencias de
nacidos vivos con estas alteraciones.
Estructurales
Se denominan as las alteraciones en la estructura de los cromosomas, tales como las grandes
deleciones o inserciones, reordenaciones del material gentico entre cromosomas...
detectables mediante tcnicas de citogentica.
Deleciones: eliminacin de una porcin del genoma. Algunos trastornos conocidos son
el sndrome de Wolf-Hirschhorn por delecin parcial del brazo corto del cromosoma 4 (4p),
y el sndrome de Jacobsen o delecin 11q terminal.
Inversiones: una parte del genoma se rompe y se reorienta en direccin opuesta antes
de reasociarse, con lo que dicha secuencia aparece invertida. Pueden ser paracntricas (si
afectan slo a una brazo) o pericntricas (si la secuencia invertida incluye el centrmero).
Cromosomas en anillos: una porcin del genoma se rompe y forma un anillo por
circularizacin. Esto puede ocurrir con prdida de material o sin prdida de material.
Isocromosomas: cromosomas simtricos, con sus dos brazo idnticos por delecin de
uno de los brazos y duplicacin del otro. El ms habitual es el isocromosoma X, en el que
se pierde el brazo corto del cromosoma X, originando fenotipos de Sndrome de Turner.
Los sndromes de inestabilidad cromosmica son un grupo de trastornos caracterizados por
una gran inestabilidad de los cromosomas, que sufren con gran frecuencia alteraciones
estructurales. Estn asociados con un aumento de la malignidad de neoplasias.
Evolucin
Los estudios de genmica comparada se basan en comparacin de secuencias genmicas a
gran escala, generalmente mediante herramientas bioinformticas. Dichos estudios permiten
ahondar en el conocimiento de aspectos evolutivos de escala temporal y espacial muy diversa,
desde el estudio de la evolucin de los primeros seres vivos hace miles de millones de aos o
las radiaciones filogenticas en mamferos, hasta el estudio de las migraciones de seres
humanos en los ltimos 100 000 aos, que explican la actual distribucin de las distintas razas
humanas.
Genmica comparada entre distintas especies[editar]
Los estudios de genmica comparada con genomas de mamferos sugieren que
aproximadamente el 5 % del genoma humano se ha conservado evolutivamente en los ltimos
200 millones de aos; lo cual incluye la gran mayora de los genes y secuencias reguladoras.
Sin embargo, los genes y las secuencias reguladoras actualmente conocidas suponen slo el
2 % del genoma, lo que sugiere que la mayor parte de la secuencia genmica con gran
importancia funcional es desconocida. Un porcentaje importante de los genes humanos
presenta un alto grado de conservacin evolutiva. La similitud entre el genoma humano y el del
chimpanc (Pan troglodytes) es del 98.77 %. En promedio, una protena humana se diferencia
de su ortloga de chimpanc en tan slo dos aminocidos, y casi un tercio de los genes tiene la
misma secuencia. Una diferencia importante entre los dos genomas es el cromosoma 2
humano, que es el producto de una fusin entre los cromosomas 12 y 13 del chimpanc 19
Otra conclusin de la comparacin del genoma de distintos primates es la notable prdida de
genes de receptores olfativos que se ha producido paralelamente al desarrollo de la visin en
color (tricrmica) durante la evolucin de primates.
Genmica comparada entre genomas humanos
Mapa de las migraciones humanas creado a partir de genmica comparada con los genomas
mitocondriales de individuos actuales. Los nmeros de la leyenda representan miles de aos
antes del presente. La lnea azul rayada delimita el rea cubierta de hielo o de tundra durante la
ltima glaciacin. Las letras englobadas por crculos indican los haplogrupos de ADN
mitocondrial; los haplogrupos se usan para definir subpoblaciones genticas, que
frecuentemente tienen una correlacin geogrfica. Los principales haplogrupos de ADNmt son:
Durante dcadas las nicas evidencias que permitan profundizar en el conocimiento del origen
y la expansin del Homo sapiens han sido los escasos hallazgos arqueolgicos. Sin embargo,
en la actualidad, los estudios de genmica comparada a partir de genomas de individuos
actuales de todo el mundo, estn aportando informacin muy relevante. Su fundamento bsico
consiste en identificar un polimorfismo, una mutacin, que se asume que se origin en un
individuo de una poblacin ancestral, y que ha heredado toda su descendencia hasta la
actualidad. Adems, dado que las mutaciones parecen producirse a un ritmo constante, puede
estimarse la antigedad de una determinada mutacin en base al tamao del haplotipo en el
que se sita, es decir, el tamao de la secuencia conservada que flanquea la mutacin. Esta
hereditario matrilineal. En general una clula humana media contiene 100-10 000 copias del
genoma mitocondrial por cada clula, a razn de unas 2-10 molculas de ADN por
mitocondria.22
Diagrama simplificado del genoma mitocondrial. Pueden apreciarse los 37 genes y la
secuencia origen de replicacin no codificante. En este esquema no se seala la cadena ligera
y la pesada.
El genoma mitocondrial posee 37 genes:15
2 genes ARNr, que codifican las dos subunidades del ARN ribosmico de la matriz
mitocondrial.
22 genes ARNt, que codifican los 22 ARN transferentes necesarios para la sntesis
proteica en la matriz mitocondrial.
Al contrario de lo que suceda con el genoma nuclear, donde slo el 1.5 % era codificante, en el
genoma mitocondrial el 97 % corresponde a secuencias codificantes. Es una nica molcula de
ADN doble hebra circular. Una de las hemihebras recibe el nombre de cadena pesada o
cadena H, y contiene 28 de los 37 genes (2 ARNr, 14 ARNt y 12 polipptidos). La hemihebra
complementaria (cadena ligera o L) codifica los 9 genes restantes. En ambas cadenas, los
genes de los ARNt aparecen distribuidos entre dos genes ARNr o codificantes de protenas, lo
cual es de gran importancia para el procesamiento del ARN mitocondrial.