Sei sulla pagina 1di 8

Mtodos de secuenciacin de cidos nucleicos'

Gonzalo Greif .
Unidad de Biologa Molecular. lnstitut Pasteur Montevideo'

1.
2.
3.

Un Poco de historia

Secuenciacin por mtodo de Maxxam y Gilbert


Secuenciacin por mtodo de Sanger

a.
b.
4.

Avances en el mtodo de Sanger (1936-1996)


ProYecto Genoma Humano

Algunos Mtodos de secuenciado masivo

a.
b.
c.
d.
1.

Pirosecuenciacin
Secuenciado por hibridizacin (lllumina)

Otro mtodos
APlicaciones

Un Poco de historia'

de doble hlice del ADN en 1953


Pasaron 15 aos desde el descubrimiento de la estructura
de forma experimental' Algunas de las
hasta la determinacin de la primera secuencia de ADN
razones que provocaron esta demora fueron:

')..

de
Las propiedades qumicas similares de las diferentes molculas

ADN dificultaban

su

aislamiento.

2.
3.

polipeptdicas de las
largo de las molculas de ADN, mucho mayores que las cadenas
protenas, hacan inabordable la secuenciacin completa'
protenas se basaba en el uso
No se conocan ADNasas especficas. La secuenciacin de
El

de proteasas que cortaban en determinados aminocidos'

en particular las
Sin embargo, algunas molculas de ARN no ofrecan estas dificultades,
individualmente'
purificar
molculas de ARN de transferencia eran peqtreas y se podan
anlogos a los
Adems se conocan ARNasas base-especficas y se desarrollaron mtodos
obtenida por Holley y
utilizados para protenas. La primer secuencia de un cido nucleico fue
de alanina de Escherichio
sus colaboradores en 1965 y corresponda al ARN de transferencia
coli.

ADN fue el
Un evento importante en el desarrollo de los mtodos de secuenciacin de
reconocen y
descubrimiento de las enzimas de restriccin de tipo ll en 1970. Ests enzimas
Estas enzimas
cortan el ADN en secuencias especficas (en general entre 4 y 6 bases de largo)'
pequeas
proporcionaron un mtodo general para fragmentar largas molculas de ADN en
de la
mediados
piezas para luego ser separadas por electroforesis en geles de agarosa' A
("plus-minus" method) que
dcada del 70, Frederick Sanger publica el mtodo "ms-menos"
polimerasa de E'
permita la secuenciacin de fragmentos de ADN utilizando la enzima ADN
alternativo de
coli. Afines de esta misma dcada, Maxxam y Gilbert publican un mtodo
que
de ADN (mtodo qumico) y el mismo Frederick Sanger publica el mtodo

secuenciacin

(mtodo enzimtico),
luego se convertira en el ms utilizado durante los siguientes 30 aos
como veremos en el Punto 3'

Mtodos de secuenciacin de cidos nucleicos'


Gonzalo Greif

2.

Secuenciacin qumica'

por Maxxam y Gilbert, fue publicado en


El mtodo de secuenciacin qumica propuesto
PNAS, 10 meses antes que Sanger
febrero de 7977 en el Volumen 74 (no 2) de la revsta
que veremos en la siguiente seccin'
publicara el mtodo de secuenciacin enzimtica

"Desarrollamos una nueva tcnica


En el artculo describen el procedimiento de esta manera:
determina la secuencia nucleotdica
para secuenciar una molcula de ADN. El procedimiento

cortndolo con agentes qumicos" en


de un ADN marcado radioactivamente en un extremo,
genera un set de fragmentos marcados
cada una de las bases. El corte parcial de cada base,
fueron clivados' Utilizando geles de
desde el extremo marcado hasta la base dnde
es posible determinar la secuencia
poliacrilamida y separando dichos fragmentos por tamao,
de esta molcula.

resolucin de los geles de


El mtodo propuesto estaba limitado por la capacidad de
posibilidad de secuenciar 100 bases de
poliacrilamida, y en este primer artculo muestran la
ADN.
El mtodo utilizaba 4 reacciones qumicas' Una reaccion

$*A *

S*T

qumica produce cortes especficamente en Citosinas


(18M hidracina, 2M NaCl. Una reaccin con 50 mM
dimetil-sulfato corta en Adeninas y Guaninas; si luego de
a
este tratamiento qumico se calienta la reaccin a 90sC
pH neutro, entonces se obtiene un patrn de bandas
intenso para las guaninas y tenues para las adeninas' Por

el contrario, el tratamiento posterior a un pH

cido

provoca un patrn inverso (bandas intensas de adeninas


y tenues de guaninas). El ltimo tratamiento (18M

hidracina) produce el clivaje tanto en citosinas como en

E"

timinas.

En la Figura 1, se muestra el patrn de bandas obtenido

"t

durante la secuenciacin de un fragmento de 64

bases

(mostrado en el artculo de7977).

' *
'',r.'

Figura

1. Se muestran los cuatro carriles del gel

de

poliacrilamida con cada una de las reacciones de clivaje'


lnterpretacin: La secuencia se lee de abajo hacia arriba'

A
,

,,;.t:t:::r,:

Una banda intensa en la primera columna

una banda

tenue en la segunda corresponden a una Adenina, mientras


que Ia situacin inversa corresponde a una Guanina en esa

posicin. Una banda que aparece en la tercera y cuarta


columna en la misma posicin indica una C' y una banda
slo presente en la ltima columna corresponde a una T'

Mtodos de secuenciacin de cidos nucleicos'


Gonzalo Greif

3.

Secuenciacinenzimtica'

y coulson que propone un nuevo


diciembre de tg77 se publica el trabajo de sanger, Nicklen
molcula de ADN' Sanger y Coulson
mtodo para determinar la secuencias de bases en una
(mtodo ms-menos) a
haban ya publicado dos aos antes, un mtodo de secuenciacin
del bacterifago QX174' La
partir del cual haban logrado obtener dos secuencias de 70 bases
de los resultados y algunos errores que podan ocurrir en la

En

dificultad en la interpretacin
secuencia hicieron que Sanger

los
sus colaboradores siguieran trabajando para mejorar

mtodos de secuenciacin de cidos nucleicos'


1977 se convirti en el mtodo ms utilizado de
La incorporacin de mejoras en los
secuenciacin de cidos nucleicos hasta la actualidad'
mtodos de deteccin' electroforesis
aspectos tecnolgicos y metodolgicos (automatizacin,
hito fundamental, la secuenciacin del genoma humano

As, el mtodo propuesto por sange

r en

capilar, etc.) permitieron, como


Sanger obtuvo su segundo
(finalizado en el ao 2003) por este mtodo. En 1980 Frederick

(ver recuadro)' Recin en 2005' con


premio Nobel en Qumica por la invencin de este mtodo
en la tecnologa de secuenciacin de
la aparicin de los secuenciadores 454 se dio un cambio

de secuenciacin masiva utilizan el


cidos nucleicos. Aun as, muchas de las nuevas tecnologas

veremos ms adelante en
principio de nucletidos terminadores, descrito por sanger, como
los secuenciadores de lllumina.
Frederick Sanger (1918-)

FrederickSangernacienRendcombe,lnglaterraenlgls.Depadremdico,se

la universldad de cambridge
esperaba que Fred siguiera sus pasos, sin embargo en

en cambridge
decidi realizar una carrera en ciencias. contnu su formacin
Luego
aminocidos
de
metabolismo
en
Neuberger,
Albert
realizando un Ph.D. con

de la insulina, en
continu trabajando con c. chibnall identificando los aminocidos
se
el transcurso de la investigacin, sanger imagin las formas en las cules
ordenan los aminocidos en la protena'

(la insulina)' Prob


obtener la secuencia de aminocidos de una protena
y ADN que codifica estas
que las protenas eran molculas ordenadas y, por analoga, los genes el
su primer premio Nobel
protenas deberan tener un orden o secuencia. Por este trabajo obtuvo
Fue la primera persona en

(1es8).

Molecular, tambin en Cambridge'


En 1962,5anger comienza a trabajar en el laboratorio de Biologa
problemas
relacionados con el ADN'
dnde Francis crick, John Kendrew y otros trabajaban con
trabajo anterior' Fue as'
su
de
Resolver como obtener la secuencia de ADN era la extensin natural
pequea) logr obtener
ms
(una
molcula
como estudiando primero la forma de secuenciar ARN
En 1980'
por
dideoxinucletidos)'
(el
de
secuenciacin
mtodo
una tcnica aplicable luego al ADN
premio Nobel tambin en Qumica compartido con walter Gilbert

obtuvo por ello

,, ,.g*do

(mtodo de secuenciacin qumica) y Paul Berg (ADN recombinante)'


el sanger lnstitute, uno de
En 7g92, el wellcome Trust y el Medical Research council establecieron
proyecto Genoma Humano'
los centros de secuenciacin dnde se llev adelante el
su jardn'
En 1985 se retir y se dedica principalmente al cuidado de
Fuentes:http://www.dnaftb.orel23lbio.html/

http://www.saneer.ac.uk/about/peoole/biographies/fsaneer.html

Lecturas recomendadas: Nobel Lecture (Frederick Sanger, 1980)'

Mtodos de secuenciacin de cidos nucleicos.


Gonzalo Greif
El mtodo enzimtico de Sanger, utiliza una ADN polimerasa

e inhibidores que finalizan

la

cadena de ADN que est siendo sintetizada en lugares especficos, particularmente utiliza
dideoxinucletidos (es decir nucletidos que en su carbono 3' no contienen el grupo hidroxilo
un molcula naciente de
-Figura 2- ). La incorporacin de una base con estas caractersticas en
ADN impide que una nueva base pueda incorporase y la sntesis de ADN es interrumpida
(Figura 3).

'1'r$ii{A.t*
l

,F"

)i
or -. ,o

.4

ln
{,

,u/,:

&,
I

"

"

,n

!,

a,t(
rir.l.ir&:.i

rrrt:lo
tf,r.;

t1{r

{'"nsrh.sd A

Figura 2. Estructura de un nucletido (ej. dATP) y un di-deoxinucletido (ddATP).

t.r, .-lt
,1

:!tj'r;ne
.":il

,!
I ''\

\'t*trut\'
:,.. lii{ r

it

Ya.

Figura 3. Esquema de mecanismo de sntesis de ADN (1), y (2) imposibilidad de continuar elongacin de cadena
naciente luego de Ia incorporacin de un didoxinucletido.

En el artculo ejemplifican, de forma clara, que sucede cundo utilizan di-deoxiTimina en la

reaccin: "Debido a que el ddT no contiene grupo 3' hidroxilo, la cadena no puede continuar

extendindose, entonces la terminacin ocurre especficamente en las posiciones dnde dT


debera haberse incorporado. Si un cebador y un molde son incubados con ADN polimerasa en
presencia de una mezcla de ddTTP y dTTP, as como los otros tres deoxiribonucleosidos

trifosfato (uno de ellos marcado radiactivamente con 32p), se obtiene un mezcla

de

Mtodos de secuenciacin de cidos nucleicos.


Gonzalo Greif
fragmentos todos con el mismo extremo 5' y con residuos ddT en el extremo 3'. Si esta mezcla
es fraccionada por electroforesis desnaturalizante en geles de acrilamida el patrn de bandas

muestra la distribucin de los residuos Timina en el ADN sintetizado. Utilizando terminadores


para cada uno de los cuatro nucletidos en reacciones independientes, y corriendo cada
mezcla en paralelo en el gel, se obtiene un patrn de bandas a partir del cual se puede leer la
secuencia de bases" (Figura 4 y 5).

D*o

ffi
p

lr**u*o* .

ltf

AtF

CT!
IfP irid1TP

tjrlrddj:,"P d;?P

"r

ATItr

6fP

GfFad{IP

T1?

AfP+ ddATP
,'f*,

nP

TF,
!

.-Airec'rTdda

*ddA

|]t-{l
-ilt
i ,t r-l
Aerylomdt O& l|fi:Plw**
Fgura 4. Esta imagen se encuentra en la Nobel Lecture de F. Sanger de 1980. En la misma se ejemplifica el
principio del mtodo de dideoxinucletidos terminadores.

Figura 5. Esta imagen corresponde a Ia segunda figura del artculo de Sanger (PNAS, 1977).

trata de un autoradiografa dnde se muestra la migracin de las cuatro diferentes


mezclas (una para cada dideoxinucletido terminador utilizado). A la derecha de la
magen se leen las secuencias de ADN (en este caso un fragmento del bacterifago SXll4.
Las lecturas se realizan de abajo (fragmentos ms pequeos) hacia arriba (ms grandes),
de acuerdo a la aparicin de las bandas. La resolucin del gel, permite separar bandas de 1
nucletido de diferencia en tamao.

Se

Las secuencias

obtenidas con este mtodo alcanzaban hasta 200 bases de largo.

Mtodos de secuenciacin de cidos nucleicos' | 6


Gonzalo Greif

a.

(dye-terminator sequencing)'
l. Secuenciacin con terminadores fluorescentes

Applied Biosystems (ABl) publican el


En 19g6 Hood y colaboradores, en colaboracin con
que establece la secuenciacin
primer reporte de automatizacin de la secuenciacin de ADN,
Est variante utiliza una
sanger'
de
mtodo
con terminadores fluorescentes como variante del
realizar la reaccin
y
permite
molcula fluorescente diferente unida a cada dideoxinucletido,
un computador'
de
travs
a
puede ser leda
en un nico tubo (Figura ). Asimismo, la secuencia
500 y 1000
entre
de
eran de un largo
Las secuencias obtenidas, con esta nueva variante
nucletidos.
b.

c.

ft
:lrl
fl
cl
al
a

*
W:

-+
illf
ffi

la
para'convertir esas seales en "electroferogramas" que representan
de
la
direccin
indica
izquierda
,ecuen.a de ADN (c). La flecha a la
lectura 5'-3'.

:'ii:::=it::':

$!!.*
' illl

&

de 4 carriles (uno
Figura 6. En esta figura se ejemplifica como en lugar
un nico carril
en
pJra cada base) (a), se corren todas las reacciones
algoritmos
y
(b)
se
desarrollan
base)
una
del gel (cada color representa

'

JI

t
#

-*

A
T
A

GCAY
ll. Secuenciacin automtica.

fue la pionera y lder en instrumentos de secuenciacin' El


y
l se logra conocer la
primer secuenciador autmtco (ABl 37OA) aparece en 1987, con
del National lnstitute of Health (NlH'
secuencia del primer gen por craig Venter y sus colegas
permiti la instalacin de facilidades de
usA). La aparicin de los secuenciadores automticos
instalaron 6 secuenciadores ABl3700'
secuenciacin. El primero de ellos fue el NlH, dnde se
(TIGR) y expande la capacidad de
En Lg92, Venter funda el lnstitute for Genomic Research
La empresa Applied Biosystems,

secuenciacin con 30 equiPos.

poder de la secuenciacin automtica con el


Con esta plataforma instalada, se demuestra el
para el descubrimiento de genes' Esta
desarrollo de la estrategia EST (expressed sequence tag)
r."l. copias de ADN a partir del ARN mensajero celular (ADNc=ADN
estrategia consste
"n
aleatoria para luego secuenciar. En 1991, con esta estrategia'
copia) y clonarlas de forma
de datos de
Venter reporta 337 genes humanos no conocidos. La base

EST

de43millonesdesecuenciascorrespondientesa1300organismosdiferentes.

contiene hoy ms

Mtodos de secuenciacin de cidos nucleicos.


Gonzalo Greif

b.

Provecto Genoma humano:

La secuenciacin del genoma humano se volvi un objetivo realizable una vez establecidas las

metodologas de secuenciacin de ADN. La discusin formal comenz en 1985 en Estados


Unidos. En 1990, se present un proyecto de 5 aos en el congreso de Estados Unidos (Human
Genome Project). Se estimaba que el proyecto durara 15 aos y el costo rondara los 3 mil
millones de dlares. El proyecto estableca el objetivo de mapear y secuenciar diferentes
organismos modelo adems de humano. Entre ellos E. coli, S. cerevisiae, C. elegons, D.
melanogoster y el ratn (Mus domesticus). El proyecto se convirti en un esfuerzo de
colaboracin internacional entre diversos centros de secuenciacin en Estados Unidos, Europa
y Japn. Cada centro se focaliz en regiones particulares del genoma, que permitieran obtener
un mapa. En 1994 se public un mapa detallado del genoma humano que inclua el mapeo de
5840 loci con una media de espaciado de 0,7 cM (1 centiMorgan = 106 bases).
En L998, el proyecto pblico, compitiendo ahora con la empresa Celera (propiedad de Craig
Venter) adopta los secuenciadores capilares de Applied Biosystems (A813700).
En 1999 el proyecto Genoma humano haba secuenciado ms de mil millones de bases y se
public la secuencia completa de un cromosoma humano (el cromosoma22).

Para

el

mismo tiempo, Celera, comenz

secuenciar el genoma humano con la estrategia


"whole genome shotgun sequencing"

de

desarrollada

adelante).

por C. Venter (explicada

La

ms

secuenciacin comenz

en

setiembre de 1999 y en junio de 2000 se realiz

un ensamblaje inicial de las secuencias

Cobertura (Coveragel:
La cobertura es el nmero promedio de
secuencias que representan a un
determinado nucletido en la secuencia
total reconstruida. Puede ser calculada a

obtenidas. Los datos de Celera permitieron el

partir del largo original del genoma (G), el

ensamblaje del genoma humano con una


cobertura de 5X (ver Cobertura). Adems se

nmero de secuencias (N)

y el largo

promedio de las secuencias (L) como:

aument la cobertura 3X con los datos pblicos.

Cobertura=NxL/G
El 25 de junio de 2000, en la Casa Blanca, el

presidente Clinton junto a Francis Collins


(responsable del proyecto pblico, NIH) y Craig
Venter, anunciaron pblicamente la versin
borrador del genoma humano realizada tanto
por el esfuerzo pblico como privado (Figura 7).
En febrero de 2001-, se publicaron los borradores
del consorcio pblico y del privado en Science y
Nature (Figura 8). Finalmente en el ao 2004
public la versin final del genoma humano.

se

Ejemplo. Un genoma hlpottico de 2000


bases, secuenciado con 24 secuencias de

350 bases de promedio de largo tiene


una cobertura de:

24x(350/2000)

4,2Y.

el genoma fue
4,2 veces. Cunto mayor
cobertura, menor posibilidades de
Este valor significa que

secuenciado

errores en la secuencia final.

Mtodos de secuenciacin de cidos nucleicos.


Gonzalo Greif

lanzamiento de borrador del genoma


humano en Washington (Clnton, Venter, Collins).

Figura 7. Foto de

Nature y Science de 2001 con


genoma
humano.
Ios borradores del

Figura 8. Tapas de revistas

Whnle genome Shotgun sequencing y Craig Venter:


genoma,
mtodo de Whole Genome Shotgun consiste en la fragmentacin al azar del ADN de todo el
vez
slonarlo en plsmidos y secuenciar ambas hebras (el paso de clonado luego fue eliminado)' Una
que
las
en
secuencias
basndose
para
contgs
formar
y
obtenidas, las secuencias se alinean ensamblan
(48,5 kb),
solapan (Figura 9). El mtodo fue utilizado por Sanger en 1982 para ensamblar el fago lambda
El

sin embargo Venter fue el primero en utilizarlo para secuenciar un genoma de mayor tamao

(H.

nfluenzoe,1,8Mb) y proponerlo como estrategia para secuenciar el genoma humano.

\\
,e-.
l

T\*

t\^

fu'
fw

con la estrategia de Shotgun, Secuenciacin de fragmentos


generados al azar y ensamblaje de la secuencia utilizando procesamiento informtico.
Figura 9. Esquema de secuenciacln

In

1g95, Venter y su grupo deciden utilzar nuevas herramientas computacionales as como los mtodos

mejorados de secuenciacin para realizar


lHaemophitus influenzae). En

la primer secuencia de un organismo de vida

libre

TIGR analizar ms de 50 genomas microbianos. Venter y alguno de sus

colaboradores, comenzaron entonces la secuenciacin de genomas de mayor tamao (mosca, rata,


ratn).
n 1006 se fund el J. Craig Venter lnstitute (JCVI) por la unin de varias organizaciones (TlGR, TCAG,
JCVS, etc.). Se trata de una organizacin lder en genmica a nivel mundial con ms de 400 cientficos

trabajando.

Potrebbero piacerti anche