Sei sulla pagina 1di 50

Corso di laurea triennale in

Scienze Biologiche e
Biotecnologie

Corso a scelta in BIOCHIMICA CLINICA

Lezione 24

Next Generation Sequencing in


Biologia Molecolare Clinica

1
Sequenziamento del DNA

Il sequenziamento del DNA è un processo che serve a mettere in fila le basi


(Adenina, Citosina, Guanina e Timina) che costituiscono il frammento di DNA in
analisi, in modo da poterlo leggere propriamente ed analizzare. La sequenza del
DNA contiene tutte le informazioni genetiche ereditarie che sono alla base per lo
sviluppo di tutti gli organismi viventi.

2
Sequenziamento del DNA
Metodo Sanger

Il metodo sviluppato da Frederick Sanger e collaboratori (il cosiddetto metodo


della terminazione della catena, chain termination method o metodo Sanger, dal
nome del suo scopritore), è un metodo cosiddetto enzimatico, poiché richiede
l'utilizzo di un enzima; il principio della tecnica sviluppata da Fred Sanger si basa
sull'utilizzo di nucleotidi modificati (dideossitrifosfato, ddNTPs) per interrompere la
reazione di sintesi in posizioni specifiche.

3
Sequenziamento del DNA
Metodo Sanger

Nella reazione di sequenziamento, l'estensione è iniziata in un sito specifico del


DNA utilizzando un oligonucleotide primer complementare alla regione del DNA
ed avviene ad opera di una DNA polimerasi che utilizza i
quattro deossinucleotidi (dATP, dCTP, dGTP, dTTP). Insieme a questi, vengono
introdotti i dideossinucleotidi i quali, una volta incorporati dalla DNA polimerasi
nella sintesi del filamento, ne provocano il blocco. Questi ddNTPs sono
solitamente anche marcati (radioattivamente o per fluorescenza) in modo da
poterli visualizzare.

4
Sequenziamento del DNA
Metodo Sanger

5
Sequenziamento del DNA
Metodo Sanger

Nonostante il sequenziamento di Sanger presenti, ad oggi, numerosi limiti, è


ancora considerato il »Gold Standard» per il sequenziamento degli acidi nucleici.

Permette di identificare alterazioni di sequenza come piccoli SNPs e piccole


INDELs.

6
Next Generation sequencing

7
Next Generation sequencing

Con il termine Next Generation Sequencing (NGS) o sequenziamento in


parallelo ad elevata sensitività si indicano una serie di tecnologie che
permettono di sequenziare fino a grandi genomi in un tempo ristretto. Sono
disponibili diverse tecnologie, tra le principali:

- Illumina
- Life Technologies
- Roche
- Oxford Nanopore

8
Next Generation sequencing
Macchinari in commercio

MiSeq - Illumina Technologies

454 - Roche

MinION – Oford Nanopore


9
Next Generation sequencing
Macchinari in commercio

10
Next Generation sequencing
Sequenziamento (SBS)

Degli oligonucleotidi sono immobilizzati sulla cosiddetta flowcell. L'amplificazione in


fase solida (con l’uso del supporto) crea fino a 1.000 copie identiche di ogni singola
molecola di modello in prossimità (diametro di un micron o meno). Con la «Cluster
Density» si ottengono densità dell'ordine di dieci milioni di cluster a singola
molecola per centimetro quadrato.

11
Next Generation sequencing
Sequenziamento (SBS)

12
Next Generation sequencing
Sequenziamento (SBS)

La tecnologia Syntesis by Syntesis (SBS) utilizza quattro nucleotidi marcati a


fluorescenza per sequenziare le decine di milioni di cluster sulla superficie della
flowcell. Durante ciascun ciclo di sequenziamento, alla catena dell'acido nucleico
viene aggiunto un singolo deossinucleoside trifosfato (dNTP). L'etichetta
nucleotidica funge da terminatore per la polimerizzazione, quindi dopo ogni
incorporazione di dNTP, il colorante fluorescente viene ripreso per identificare la
base e quindi scisso enzimaticamente per consentire l'incorporazione del
successivo nucleotide. Le chiamate di base vengono effettuate direttamente dalle
misurazioni dell'intensità del segnale durante ciascun ciclo, il che riduce
notevolmente i tassi di errore grezzi rispetto ad altre tecnologie. Il risultato finale è
un sequenziamento base per base altamente accurato.

13
Next Generation sequencing
Approcci

DNA genomico: Metagenomica


• Intero genoma (la sequenza completa - piccoli genomi)
• Esoma (solo la parte di DNA trascritto in RNA, esoni)
• Geni mirati
• Ampliconi (solo prodotti PCR)
Trascrittoma:
• RNA totale
• mRNA
• small RNA (miRNA)
Epigenoma:
• ChIP-Seq (Chromatin immunoprecipitation sequencing: DNA o RNA a cui sono
legati specifiche proteine)
• Metil-Seq (studio del pattern di metilazione del DNA, epigenetica) 14
Next Generation Sequencing
Approcci

DNA genomico:

• Ampliconi (esempio di BRCA1 e BRCA2)


• Pannelli di geni (approcci di genomica a diverse patologie)
• Esoma (solo la parte di DNA trascritto)

15
Cancro della mammella
Incidenza

Il cancro della mammella è il tumore maggiormente sviluppato nelle donne di


tutto il mondo, ad oggi si stima che 1 donna su 8 potrebbe ammalarsi durante
la sua vita. Negli uomini solo lo 0,8% presenta il tumore alla mammella.
16
Cancro della mammella
Incidenza

17
Cancro della mammella
Ereditario o Sporadico?

Nel 25% dei casi, i pazienti con la forma familiare di cancro al seno presentano
una mutazione nei geni ad alta suscettibilità BRCA1 e BRCA2. Altri geni a
bassa suscettibilità (BRCAX) non sono stati ancora identificati.
18
Cancro della mammella
Ereditario o Sporadico?

Il 90% dei casi di tumore alla mammella è sporadico, la restante parte è definita
“Hereditary Breast and Ovarian Cancers” (HBOCs). Mutazioni nei geni BRCA
aumentano il rischio di sviluppare il tumore.

19
Cancro della mammella
BRCA1 e BRCA2

BRCA1
• Si trova sul cromosoma 17
• È caratterizzato da 24
esoni
• Codifica per una proteina di
1,863 aa
• Coinvolta nel controllo del
ciclo cellulare

• BRCA1 contiene un dominio RING all’N-terminale, un sito di legame a Chk2,


un dominio Coiled-Coil e 2 domini BRCT al C-terminale.

20
Cancro della mammella
BRCA1 e BRCA2

BRCA2
• Si trova sul cromosoma 13
• È caratterizzato da 27 esoni
• Codifica per una proteina di
3,418 aa
• Coinvolta nel riparo del doppio
filamento di DNA (DSB)
attraverso la regolazione di
RAD51

BRCA2 lega PALB2 all’N-terminale, presenta 9 BRC repeats che legano RAD51, un
dominio di legame al DNA e al C-terminale vi è un sito di fosforilazione a livello della
serina 3291 che lega RAD51. 21
Cancro della mammella
Meccanismo di riparo del danno

In risposta alle rotture a


doppio filamento del DNA, i
sensori del danno (azzurro)
identificano la rottura, e la
segnalano ai mediatori (blu)
che reclutano o attivano gli
effettori (blu scuro) che
riparano il danno attivando i
checkpoint cellulari.

22
Cancro della mammella
Selezione delle pazienti

23
Next Generation Sequencing
Mutazioni BRCA

Esistono molte variazioni nei geni BRCA e non tutte le modifiche comportano gli
stessi rischi. Alcune varianti sono innocue; altre sono molto dannose. Alcuni
polimorfismi a singolo nucleotide possono comportare solo un piccolo rischio o
possono presentare rischio solo in presenza di altre mutazioni o in determinate
circostanze. In altri casi, non è noto se la variante sia o meno dannosa.

24
Next Generation Sequencing
Classificazione varianti

Le varianti sono classificate:


• Pathogenic: il cambiamento ha dimostrato di causare rischi significativi.
Spesso, si tratta di mutazioni frame-shift, o stop codon.
• Likely Pathogenic: sebbene nulla sia dimostrato, la variazione è attualmente
ritenuta dannosa.
• Variante di significato incerto (VUS): se il cambiamento abbia qualche effetto è
incerto. Man mano che vengono acquisite ulteriori prove, queste vengono ri-
classificate.
• Likely Benign: anche se nulla è dimostrato, la variazione è attualmente ritenuta
innocua.
• Benign: il cambiamento è classificato come innocuo.

25
Next Generation Sequencing
Mutazioni BRCA

BRCA1
Likely Benign
2% Benign
3%
Pathogenic
12%

VUS
83%

26
Next Generation Sequencing
Mutazioni BRCA

BRCA2
Likely Benign
4% Benign
3%

Pathogenic
14%

VUS
79%

27
Next Generation Sequencing
Preparazione dei Campioni

Estrazione Controlli
DNA qualità

PCR1 PCR2 Purificazione NGS

Validazione MLPA
Analisi Dati
Sanger

28
Next Generation Sequencing
BRCA testing

Di grande importanza è la corretta selezione delle pazienti. Possono fare il test


persone affette in giovane età da cancro della mammella e/o dell’ovaio, e
persone con familiarità quando IL PROBANDO non è più disponibile. Le donne
che risulteranno NON avere varianti patogeniche nei 2 geni BRCA NON è detto
che non svilupperanno mai un tumore; portatrici di mutazioni nei geni BRCA
hanno un elevato rischio di sviluppare tumori al seno e all’ovaio.

29
Next Generation Sequencing
Approcci

DNA genomico:

• Ampliconi (esempio di BRCA1 e BRCA2)


• Pannelli di geni (approcci di genomica a diverse patologie)
• Esoma (solo la parte di DNA trascritto)

30
Next Generation Sequencing
Pannelli di geni

31
Next Generation Sequencing
Target Sequencing

1. Digestione del gDNA


2. Ibridazione con sonde specifiche
3. Cattura delle regioni ibridate
4. Amplificazione
5. Purificazione
6. Sequenziamento

32
Next Generation Sequencing
Lista delle varianti

Tramite questo approccio è possibile, dunque, sequenziare insieme più geni


malattia. Tuttavia, è possibile identificare dalle 300 varianti in poi per ciascun
paziente.

33
Next Generation Sequencing
Approcci

DNA genomico:

• Ampliconi (esempio di BRCA1 e BRCA2)


• Pannelli di geni (approcci di genomica a diverse patologie)
• Esoma (solo la parte di DNA trascritto)

34
Next Generation Sequencing
Esoma

L'esoma è l'insieme di tutte le porzioni del genoma che “codificano” per


proteine. Pur rappresentando una quota vicina all'1% dell'intero genoma, è
all'interno dell'esoma che avviene oltre l'85% delle mutazioni oggi note come
clinicamente rilevanti.
35
Next Generation Sequencing
Esoma

1. Digestione del gDNA


2. Ibridazione con sonde specifiche
3. Cattura delle regioni ibridate
4. Amplificazione
5. Purificazione
6. Sequenziamento

L’analisi dei dati è lo step più complesso dato che si arriva oltre le 75.000
varianti per paziente. Al momento è utile usarlo in trios (famiglie caratterizzate
da malattie genetiche rare).
36
Next Generation Sequencing
Famiglia

37
Next Generation Sequencing
Esoma

38
Next Generation sequencing
Approcci

Trascrittoma:
• RNA totale
• mRNA
• small RNA (miRNA)
Epigenoma:
• ChIP-Seq (Chromatin immunoprecipitation sequencing: DNA o RNA a cui sono
legati specifiche proteine)
• Metil-Seq (studio del pattern di metilazione del DNA, epigenetica)

Metagenomica

39
Next Generation Sequencing
Trascrittomica

La trascrittomica è la disciplina che studia l'insieme degli RNA messaggeri di


una cellula chiamato anche trascrittoma. Dagli RNA messaggeri, attraverso il
processo di traduzione, derivano le proteine di cui sono costituiti gli
organismi viventi.

Lo studio del trascrittoma è importante per determinare gli eventi di trascrizione


di un organismo. Ad esempio, attraverso lo studio del trascrittoma, è possibile
identificare con precisione il percorso che porta alla alla sintesi di una proteina,
oppure è possibile valutare i cosiddetti profili di espressione. La valutazione del
profilo di espressione permette di comparare la presenza di trascritto, e quindi
la relativa espressione di un gene, a seguito di interazione dell'organismo con
sostanze chimiche oppure in particolari stati patologici.
40
Next Generation sequencing
Approcci

Epigenoma:
• ChIP-Seq (Chromatin immunoprecipitation sequencing: DNA o RNA a cui sono
legati specifiche proteine)
• Metil-Seq (studio del pattern di metilazione del DNA, epigenetica)

Metagenomica

41
Next Generation Sequencing
Epigenomica

Per epigenoma si intende sostanzialmente l'insieme dei fenomeni che modificano


il DNA senza intaccarne la sequenza, ma regolandone l'espressione.

METILAZIONE DEL DNA


La metilazione è un fenomeno molto diffuso nel DNA. Si calcola infatti che ben
l'80% di tutte le isole CpG sia metilata. Tradizionalmente si attribuisce alla
metilazione la proprietà di silenziare l'espressione. In base a ciò le zone metilate
risultano trascrizionalmente inattive mentre le zone non metilate risultano
espresse. Esistono vari modi per studiare la metilazione e le sue caratteristiche.
Uno dei più usati e il sequenziamento al bisolfito (Bisulfite Sequencing - BS)

42
Next Generation Sequencing
Epigenomica

MODIFICAZIONI CHIMICHE DEGLI ISTONI


La doppia elica del DNA non si trova normalmente sciolta e srotolata nel nucleo. Il
DNA infatti è avvolto attorno a delle proteine (le proteine istoniche). Le proteine
istoniche sono degli ottameri formati da quattro subunità: H2A, H2B, H3 e H4. Le
proteine istoniche sono soggette a modificazioni chimiche come la metilazione, la
fosforilazione e l'ubiquitinazione. Queste modificazioni possono regolare l'accesso
dei complessi trascrizionali a specifiche zone del DNA. In altre parole, in modo
diverso da un tipo cellulare all'altro, le modificazioni chimiche delle proteine
istoniche possono rendere accessibile una determinata sequenza di DNA invece di
un'altra. Uno dei metodi più usati per lo studio delle proteine istoniche e delle loro
modificazioni chimiche è la Chromatine immunoprecipitation system (ChIP).

43
Next Generation Sequencing
Epigenomica

NON-CODING RNA (ncRNA)


È ormai noto che gli ncRNA sono dei protoganisti dell'espressione genica. Dai
microRNA agli short-interfering RNA (siRNA) fino ai lncRNA, queste molecole
hanno un ruolo multiplo e fondamentale nella regolazione della trascrizione.
Basti pensare che i lncRNA sembra siano in grado persino di indurre la
metilazione di certe regioni del DNA. Fra gli altri fenomeni, gli ncRNA sono in
grado di influenzare l'inattivazione del cromosoma X, l'impriting genomico (la
metilazione, appunto) e alcuni processi patologici come il cancro.

44
Next Generation sequencing
Approcci

Metagenomica

45
Next Generation Sequencing
Metagenomica

La metagenomica è un approccio basato sull'utilizzo di tecniche genomiche


moderne per lo studio di comunità microbiche direttamente nel loro ambiente
naturale, evitando così il problema del prelevamento e coltivazione in laboratorio.

Il microbioma è l'insieme del patrimonio genetico e delle interazioni ambientali


della totalità dei microrganismi di un ambiente definito. Un ambiente definito
potrebbe essere un intero organismo (per esempio, un essere umano) o parti di
esso (per esempio, l'intestino o la cute).

46
Next Generation Sequencing
Metagenomica

47
Next Generation Sequencing
Metagenomica

Sequenziamento del gene 16S rRNA (costituente della subunità minore dei
ribosomi dei procarioti) e rappresenta un marcatore molecolare ampiamente
utilizzato nella tassonomia batterica. Da un campione biologico (materiale
fecale o biopsia intestinale) viene isolato il DNA microbico che poi è sottoposto
ad amplificazione del gene 16S rRNA. L'analisi viene poi completata dal
sequenziamento del pool di geni 16S rRNA corrispondenti ai microrganismi
presenti nel microbiota e quindi dal loro riconoscimento tramite l'impiego di
strumenti bioinformatici.

48
Next Generation Sequencing
Metagenomica

49
Next Generation Sequencing
Metagenomica

La tassonomia è la classificazione degli organismi in gruppi (taxa) sulla base di


somiglianze tra loro:

Diversità alfa: Ricchezza delle specie (conteggio OTU) "Quanti?"


Quante specie diverse potrebbero essere rilevate in un
ecosistema microbico? La ricchezza di specie è il numero di
specie diverse in un campione. In pratica, contiamo il numero di
taxa distinguibili.

Diversità Beta: Quanto è diversa la composizione microbica in un


ambiente rispetto a un altro? La diversità beta mostra la differenza
tra comunità microbiche provenienti da ambienti diversi. Il focus
principale è sulla differenza nei profili di abbondanza tassonomica
da diversi campioni. 50

Potrebbero piacerti anche