Sei sulla pagina 1di 59

Microarrays

La tecnica microarray si basa sulla ibridazione


cDNA (sonda) su supporti – chips o vetrini - sui
quali sono fissate porzioni di sequenze nucleotidiche
(cDNA o sequenze ologonucleotidiche sintetiche)
rappresentative del genoma considerato: su un
singolo microarray sono infatti presenti migliaia di
spots.
La sonda viene marcata con coloranti fluorescenti in
modo da permettere l’analisi delle intensità del
segnale con uno scanner. Si ibrida selettivamente alle
molecole complementari presenti sugli spots: solo i
campioni ibridati daranno fluorescenza, e possono
quindi essere identificati.

Sul vetrino ci sono spot di sequenza nucleotidica nota


(il gene), e conseguentemente in base a presenza ed
intensità di segnale si può vedere quale gene è
espresso e a che livello.
Chips e vetrini

diverso metodo utilizzato per l’adesione delle


sequenze nucleotidiche al supporto:
1. sintetizzate in situ nei chips (afflimetrix)
2. “spottate” (procedure robotizzate) su
vetrini trattati per favorire l’adesione degli oligo
o cDNA (es polilisina).
In oligonucleotide microarrays, the probes are
short sequences matching parts of the protein
encoding sequence, produced either by
spotting the pre-synthesized oligos on the
array surface, or by in situ synthesis by light-
directed process as those produced by
Affymetrix, Nimblegen or Combimatrix.
Microarray Technology
A

• Affymetrix microarrays
A C G
T C T C T
G G T
A C C G T A A
T A G G C
• oligonucleotide array T
A
A T
G
A C
A
G C
A
A

• photolithography
• 25 mer
• high density (100,000 features/1.26 cm2)

• Spotted Array
• cDNA or oligo array
• pin based / inkjet technology
sequential deposition of cDNA (PCR product) or
oligos (up to 80 mer)
• Moderately high density
(25,000 features/glass slide)
Analisi
comparativa
• da campioni di due categorie
viene estratto RNA
• l’mRNA di ciascuna categoria
viene marcato con un colorante
diverso (rosso e verde)
• quantità uguali dei due RNA
marcati vengono ibridate su uno
stesso vetrino.
Diversi tessuti sono formati da cellule che si
comportano in modo diverso

Cellula Ogni cellula contiene una esatta copia del


genoma (l’intera sequenza del DNA
animale dell’organismo)

All’interno del nucleo della cellula il DNA è


organizzato in cromosomi:
autosomi in numero variabile a seconda della
specie
due cromosomi sessuali XY

Nei cromosomi si possono individuare porzioni


di DNA codificante chiamati geni
Che cosa le rende differenti ?
• Ogni cellula contiene una copia dell’intero genoma
• Le cellule sono di diversi tipi (cellule muscolari, cellule
epiteliali, cellule del sangue, gameti…)

Espressione Differenziale

• Espressione genica differenziale, i.e., quando, dove,


e in che quantità ogni gene è espresso.
• circa il 10% dei geni sono tessuto specifici. Non tutti i
geni sono espressi contemporaneamente
Espressione Differenziale

• Ogni cellula contiene una copia dell’intero genoma


• Le cellule sono di diversi tipi (cellule muscolari, cellule
cardiache, cellule della pelle, cellule del sangue …)
• Che cosa le rende differenti ?
Espressione genica differenziale, i.e., quando, dove, e
in che quantità ogni gene è espresso.
• Ad un determinato istante circa il 40% dei geni sono
espressi e circa il 10% dei geni sono tessuto specifici.
Dogma Centrale

L’ espressione dell’informazione genetica raccolta nelle


molecole di DNA, avviene in due stadi:

–(i) trascrizione, durante la quale il DNA è trascritto in


mRNA
–(ii) traduzione, durante la quale l’ mRNA è tradotto per
produrre la proteina associata

DNA mRNA protein


(RT)
Multiple Levels of
Protein Strucure

( Protein folding)
RNA

• Ribonucleic acid o RNA è una molecola simile al DNA


ma:

– è singola, non ha la doppia elica;


– l’ uracile (U) sostituisce la timina (T).

• RNA gioca un ruolo importante sia nella sintesi proteica


che in altre attività biochimiche della cellula.
Using Amplified RNA for Microarray Analysis
-A comparison of microarray using total RNA and aRNA

Direct labeling(Cy-dye incorpeartion) 15-20ug of total RNA

Indirect labeling(after transcript labeling) >10ug

Genesphere labeling >1-5ug

aRNA labeling <1ug


AAAAAA Total RNA
TTTTTTT—T7 T7Oligo(dT) primer
First strand cDNA synthesis

T7
2nd strand
dscDNA

cDNA purification

In vitro transcription(amplification)
TTTTTT
TTTTTT
TTTTTTAntisense RNA(aRNA)
TTTTTT

aRNA purification

Labeling with Cy3 or Cy5 by reverse transcription


Come è fatto l’array

I singoli nucleotidi sul microarray


(spots) sono organizzati in gruppi
(array), e ogni vetrino porta qualche
decina di arrays.
Il numero di spots dipende dalla
metodica impiegata per la
preparazione:
• Afflimetrix permette una
concentrazione di spots più elevata,
• Vetrini: concentrazione spots /
unità di superficie più ridotta.
cDNA library
General strategy
for
Amplification of
hybridisation and
cDNA fragments microarray gene
expression
Spotting of cDNA microarrays
analysis

Hybridisation and detection


Sequencing of differentially expressed cDNAs
Esempio analisi comparativa
Sul vetrino ibridato:
- spot solo rossi (espressi in una categoria)
- solo verdi (espressi nell’altra)
- gialli (espressi in entrambe)
- non fluorescenti (non espressi nelle due
categorie).
Le sonde si ibridizzano ai singoli spots in base alle
identità di sequenza formando degli eteroduplex, in
modo più o meno efficiente in relazione all’identità
della sequenza, e dando quindi un segnale. L’intensità
del segnale dipende dalla quantità di trascritto
presente
Analisi differenze
espressione genica

L’informazione per codificare le proteine, presente nel


DNA, trascritta in mRNA, viene tradotta in proteine.

I microarrays analizzano i cambiamenti negli acidi


nucleici che si possono ripercuotere nella sintesi
proteica.
Espressione genica-2

Si ibridizzano campioni provenienti da animali con


diverse caratteristiche (a differente attitudine, sani
o malati, esposti o meno a uno specifico trattamento)
per identificare geni espressi in maniera
differenziale in una specifica condizione.
Espressione genica-3

I geni differenzialmente espressi sono


potenzialmente coinvolti in processi metabolici
correlati con la condizione in esame.

L’espressione genica è variabile nei vari tessuti e nei


vari organi, nonché dipendente dalle condizioni
dell’animale (età, ormoni, metabolismo etc): il cDNA
va retrotrascritto partendo da RNA estratto da
tessuti dello stesso tipo e condizioni.
Microarray Overview
Campione di Campione da
riferimento analizzare

Isolate RNA

120
110
50
100
45
90
40
80
35
70
60 30

50 25
Fluorescence

Fluorescence
40 20
30 15
20 10
10
5
0
18S

28S

18S

28S
19 24 29 34 39 44 49 54 59 64 69
Time (seconds) 19 24 29 34 39 44 49 54 59 64 69
Time (seconds)

labeling
Cy5 (probe) Cy3
Microarray Overview
Biology

Data Analysis

Mix

Hybridize

Scan “Chip”
Sul vetrino ibridato:

Le sonde si ibridano ai singoli spots in base


alle identità di sequenza formando degli
eteroduplex, in modo più o meno efficiente
in relazione all’identità della sequenza.

L’intensità del segnale dopo eccitazione con


laser dipende dalla quantità di trascritto
presente
Spot sul vetrino ibridato:

•rossi (espressi in una


categoria)

•verdi (espressi nell’altra)

•gialli (espressi in
entrambe)

•non fluorescenti (non


espressi nelle categorie).
Programmazione esperimenti

Vanno programmati accuratamente: costi piuttosto


elevati.

Fare un numero di campioni e di vetrini sufficiente per


una analisi statistica e limitando le ripetizioni.
Ripetizioni
Servono più campioni individuali per escludere
polimorfismi non associati al fenomeno in esame:
loop design, reference design

dye swap: differenze nell’efficienza dei singoli


fluorofori.
ripetizioni
errori sperimentali
•preparazione vetrino (errori spottaggio, ad esempio scivolamento o
cattiva aderenza in alcune zone del vetrino)
•estrazione dell’RNA: prodotti non ottimali o degradazione prima
della retrotrascrizione.
•retrotrascrizione: problemi dovuti per esempio ai reagenti (diversa
efficienza).
•Fluorofori: differente efficienza per problemi di conservazione dei
fluorofori stessi o del vetrino; si possono legare selettivamente a
particolari nucleotidi.
•Durante l’ibridazione, per condizioni di ibridazione poco stringenti ,
incorporazione differenziale di uno dei due fluorofori, precipitazioni
o bolle d’aria nel buffer di ibridazione
estrazione di RNA
RNA totale
Spettrofotometro: rapporto OD 260/280 tra 1.9 e 2.1.

gel di agarosio denaturante: due bande nette (subumità


ribosomali), la banda 28S è circa doppia di quella 18S.

Non devono esserci contaminazioni da DNA genomico, che


se presenti richiedono un trattamento con DNasi ed una
completa inattivazione di queste ultime prima
dell’ibridazione (ad esempio con fenolo cloroformio o
passaggio in colonnine qiagen).
Il vetrino
prelavaggio in gradienti di SSC (2X SSC, 2,2X SSC e
acqua distillata) prima dell’ibridazione per rimuovere sali
e detriti che possono essersi depositati sulla superficie
degli array, in modo da ridurre il background.
L’invecchiamento del vetrino può portare a difetti di
ibridazione, riducendo il segnale specifico ed alzando il
background, soprattutto nel canale verde (Cy3).
Anche le soluzioni utilizzate per i lavaggi possono
contribuire alla formazione di background, per cui è
consigliabile controllare periodicamente le soluzioni
utilizzate e preparare volta per volta delle diluizioni
nuove.
Esperimento
Pool RNA sani Pool RNA malati

cDNA cDNA
SNP microarray
utilizza polimorfismi nei singoli
nucleotidi (SNPs). Approccio
utilizzato originariamente
in studi medici (predisposizioni
allo sviluppo di tumori o
differenti suscettibilità a farmaci) ed ora utilizzato per
l’analisi di SNPs in taxa il cui genoma è conosciuto in
dettaglio.

usa microarrays nei quali sono presenti sonde allele-


specifiche che si differenziano per un singolo nucleotide
in base all’ibridazione dei campioni sui vari spots è
possibile ricostruirne il genotipo
Analisi di genotipi

utilizza polimorfismi nei singoli nucleotidi (SNPs).


approccio utilizzato inizialmente in studi medici
(predisposizioni allo sviluppo di tumori o differenti
suscettibilità a farmaci); ora di largo uso in studi di
popolazione, anche in animali.
usa microarrays nei quali sono presenti copie di
determinate sequenze che si differenziano per un
singolo nucleotide, ed in base all’ibridazione dei
campioni sui vari spots è possibile ricostruirne il
genotipo
nimblegen
CombiMatrix’s core technology is a Combimatrix
modified semiconductor adapted for
Lab-on-a-Chip
biological applications, containing Arrays of individually
arrays of microelectrodes addressable microelectrodes
permit synthesis of hundreds or
individually addressable using thousands of different molecules
in parallel.
embedded logic circuitry on the
chip. Porous Reaction Layer (PRL)
Biocompatible layer that
Placed in a specially designed supports the attachment of
synthesized molecules.
fluidic chamber, the chip digitally
directs the molecular assembly of
Virtual Flask
biopolymers in response to a digital A process that confines
command. chemical reagents within a
virtual flask over each
Each microelectrode is addressed microelectrode.
to selectively generate, by an
DNA Microarrays
electrochemical reaction, chemical Arrays of oligonucleotides
reagents that facilitate the in situ capture molecules synthesized
on the chip for use in genomic
synthesis of DNA oligonucleotides. and proteomic applications.
SNP-Genotyping Arrays
Affymetrix Illumina
(10K, 100K, 500K, 5.0, 1M) (100K,320K, 230S, 550K,650K, 1M)

affymetrix.com illumina.com
Affymetrix Genotyping
Affymetrix Microarray Overview

Procedures for Target Preparation


Cells Biotin-labeled transcripts
AAAA IVT

(Biotin-UTP
Biotin-CTP) B B B B
RNA
cDNA
T7-dT
Fragment
(heat, Mg2+)

Hybridize
B
Scan Wash & Stain (16 hours) B

Fragmented cRNA
Illumina Genotyping

Infinium (7,600-1 Million SNPs)

GoldenGate (96-1,536 SNPs)


Agriculture
bovino
Dye Bias
• Cy3 e Cy5 possono falsare i risultati legandosi a
particolari spots.
• Inserire un dye-swap di ciascun array può far
individuare ed eliminare il problema.
• Raddoppia il numero di microarrays richiesti.
Cy3 Cy5
Pools

Utilizzando pools di RNA (più individui appartenenti a


ciascuna categoria analizzata) si può raggiungere la
quantità di RNA necessario per una buona ibridazione e il
cDNA viene retrotrascritto in un’unica reazione, livellando
la variabilità sperimentale. Questo può permettere inoltre
di preparare cDNA sufficiente all’ibridazione di più
vetrini, limitando quindi anche le differenze tra le
ripetizioni necessarie per la validazione stesso
esperimento.
Ibridazione
Lettura dati
La lettura ottica viene effettuata con uno scanner alle due lunghezze
d’onda corrispondenti ai due fluorocromi utilizzati.
Le intensità del segnale per ciascuno spot alle due lunghezze d’onda
vengono registrate.

I dati vengono analizzati


statisticamente per
identificare pattern di
espressione simili
(cluster analisis) e poi
valutati con test di
significatività per
valutare la differenza di
espressione tra i
campioni.
Analisi dell’immagine
• Identificazione della
posizione degli spot

• Costruzione di un’area
locale intorno ad ogni
spot

• Calcolo dell’intensità di
ogni singolo spot

• Calcolo del background


locale
Risultati attesi
differenza di
espressione nel
tessuto di
animali (ex.sani e
malati)

identificazione
dei geni
coinvolti nel
carattere
analizzato
plants 20%
viruses and bacteria 16%
invertebrates 8%
vertebrates 3%
human 35%
rodents 17%
livestock 3%
Ma se non si lavora coi topi?

1. Microarray di specie affini


2. Analisi High throughput di mRNA senza
microarrays (SAGE; MPSS)
3. Deep cDNA sequencing (GS-FLX
Pyrosequencing)
Oppure….

4. GENERARE CUSTOM
MICROARRAY USANDO LE
SEQUENZE DISPONIBILI NEI
DATABASE PUBBLICI

Expressed sequence tags (EST)


Sequenze pubbliche(generalemnte lunghe 200 -500 nucleotidi)
generate da sequenziamento random di librerie di cDNA.
Rappresentano i geni espressi in cellule, tessuti, organi di diversi
organismi. Disponibili in NCBI dbEST.
A pipeline to rapidly
generate custom
microarrays from sequence
databases
dbEST

Redundancy
filter

annotation
Hybridization

In situ
oligo generation
design
un microarray per Ovis aries

The microarray efficiency was assessed by performing


pilot experiments using RNA of two sheep breeds and
achieving very good technical outcomes, such as in
slide replicates coefficient of variation <0.25 for
differentially expressed genes with P<0.01.
Aristaeus chip 1.0

 Oligonucleotides 40 mer designed using the


GoArrays software
 in situ generated using the Combimatrix
equipment.
 21,737 non-redundant features in quadruplicate
 73.4% fully annotated (10,190 genes)
We conclude that the method is very efficient
and can be easily extended to other species of
which genetic sequences are present in public
databases. With this procedure, even a
microarray in single copy can be generated with
a moderate cost. Therefore, we believe that this
method allows the study of species so far
neglected with advanced devices like
microarrays. As a perspective, the approach can
be applied also to species of which no
sequences are available to date, by using high-
throughput deep sequencing methods.
Chip bovino
 43768 sonde lunghe 40 nucleotidi
 Ciascuna rappresenta un singolo trascritto bovino
 Sintetizzate in duplicato su 90K chip Combimatrix

Identificazione di geni responsabili


della tenerezza della carne