Sei sulla pagina 1di 3

PROCEDURA

A. RACCOLTA: Legit, Luogo, Habitat

B. DETERMINAZIONE: descrizione morfologica (macroscopica e microscopica, eventuali


reazioni macrochimiche)

C. CONSULTAZIONE della bibliogra a relativa

D. ESSICCATA: deposito in Erbario (“Fungario”), rilascia un codice alfanumerico per ogni


campione (VOUCHER)

E. SEQUENZIAMENTO: in laborarorio, chiedere:

• quale gene: RNA ribosomale o codi cante proteine (Polimerasi, …)

• quale marcatore sequenziare (ITS,LSU,SSU,rpb,…; dipende da cosa si vuole fare!);

• primers

• lamento forward 5’-3’

F. eventuale DEPOSITO della SEQUENZA in GenBank (oppure UNITE o BOLD SYSTEM) che
restituisce un Numero di Accesso univoco per ogni sequenza

G. COSTRUZIONE DATASET: è la fase più delicata e importante; deve contenere un numero di


sequenze di specie rappresentative per quello che vogliamo dimostrare.

- INGROUP: l’insieme della nostra sequenza da analizzare e di quelle dei taxa


strettamente correlati a quello in studio.

a. BLAST (Basic Local Alignment Search Tool) è un software on-line


(non necessita di installazione sul pc ma di connessione internet) che
permette la comparazione tra la mia sequenza e quelle
depositate in GenBank. Non ha implicazioni sistematiche. Non
‘ragiona’ in termini evolutivi ma di similitudine della sequenza
nucleotidica. La scelta delle sequenze suggerite dall’algoritmo, si
dovrà basare sulla percentual identity (che descrive appunto la
similitudine tra le sequenze) e la query cover (che indica la
copertura delle sequenze).

b. Ragionamento sistematico (Index Fungorum o MicoBank): per


includere tutte le sequenze utili alla nostra analisi. Ri erca e
entuale anche in altre banche dati (come UNITE e BOLD
SYSTEM)

- OUTGROUP: dall’esame della documentazione bibliogra ca si individua


“l’insieme delle sequenze di taxa su cientemente distanti (ma non troppo!) dai
taxa considerati nell’ingroup, insieme che non rientra direttamente nello studio
ma che serve a ‘collocare’ la radice dell'albero”

- Formato dei le del dataset: è buona prassi salvare ogni singolo le ottenuto in
una cartella

- come le.txt con editor di testo semplice come Blocco Note


fi
fi
fi
fi
ffi
fi
fi
fi
- le.FASTA: I software per l’analisi logenetica non gradiscono i ‘caretteri
speciali’ (come ad esempio gli spazi) ad eccezione del carattere _ (underscore o
‘linee a bassa’). Ad es. “ >Tubariomyces sp Pierotti AGMT 10800 ribosomal
RNA gene, partial sequence; internal transcribed spacer 1 and 5.8S
ribosomal RNA gene, complete sequence; and internal transcribed spacer
2, partial” viene trasformato in “>Tubariomyces_sp_AGMT10800”, a seguire
la sequenza di nucleotidi. In caso di analisi combinata dobbiamo produrre
un dataset per ogni marcatore considerato: sarà poi un software ad
assemblare i vari dataset. Per far questo il software si baserà sul codice da
noi assegnato alla singola sequenze (es. Genere_specie_voucher)! Quindi
se un campione (voucher) è presente in più dataset (ad es. ITS&LSU), in
ognuno dovrà avere lo stesso codice. Il nostro campione di esempio,
Tubariomyces sp AGMT 10800, avrà codice Tubariomyces_sp_AGMT10800
sia nel dataset ITS che in quello LSU.

1. VERIFICA Dataset completo veri cato con MESQUITE: software che controlla se la
sintassi è corretta e permette di esportare i le nel formato corretto per altri programmi
( le in formato .Nexus e come le per MrBayes in formato .Phylip)

2. ALLINEAMENTO sequenze (come le FASTA): software MEGA con MUSCLE o


CLUSTAL (più lento e meno preciso)

3. EDITING ALLINEAMENTO: Jalview (software utilizzato per l’editing dell’allineamento),


per valutare dove tagliare testa e coda. Taglio prima la coda e poi la testa, in modo
conservativo.

4. ALBERO di test con metodo Nejghbor-Joining (= elabora l’ipotesi logenetica


basandosi su una matrice di distanza che confronta le distanze relative tra coppie di
sequenze presenti nel dataset. È veloce ma non è molto preciso). Serve unicamente
per valutare la consistenza dell’albero, cioè si valuta se l’outgroup è separato
dall’ingroup.

H. Metodi correnti per la COSTRUZIONE DELL’ALBERO FILOGENETICO:

I) Metodi di Verosimiglianza: quello attualmente più valido è MAXIMUM LIKELIHOOD


(ML). Consente di creare un Albero parsimonioso (cioè con il minor numero di
sostituzioni nucleotidiche possibili). Ogni ramo dell’albero ha un suo valore % di
Bootstrapp, che indica, nei 1000 (o più alberi generati dall’algoritmo), in quanti quello
stesso ramo è presente. L’esplorazione avviene secondo una distribuzione gaussiana,
quindi un po’ a destra e un po’ a sinistra del valore normale. Il valore di bootstrapp
considerato statisticamente attendibile deve essere > o = a 70%.

Software: RaxML

II) Metodi di inferenza: il metodo attualmente più utilizzato è l’INFERENZA BAYESIANA A


POSTERIORI (MrBayes). Consente di creare un Albero di Consenso, cioè l’albero
che, in senso probabilistico, meglio rappresenta quello reale. L’esplorazione avviene su
un numero di alberi generati superiore al milione, tramite una ricerca per successive
approssimazioni (Catene di Markov: i “segugi”). Ogni singolo ramo ha un valore di
robustezza statistica da 0 a 1 (BPP=Bayesian Probability Posterior), che per essere
fi
fi
tt
fi
fi
fi
fi
fi
fi
attendibilie deve essere > o = a 0,95 ( cioè se si ripete lo stesso procedimento per 100
volte, in almeno 95 casi ho la probabilità di ottenere lo stesso ramo)

Software: MrBayes

Questi metodi si basano su Modelli Evolutivi creati da concrete sperimentazioni e da


alcune assunzioni di partenza: il più valido attualmente è il GTR (=General Time
Reversible)

I. Lettura e Interpretazione dell’albero ottenuto:

Fare un albero generale ed eventualmente un focus speci co sulla parte che contiene la
sequenza in esame

Nell’eventuale pubblicazione è buona norma inserire:

- sezione Materiali e Metodi: indicare in maniera precisa e dettagliata tutta la procedura


utilizzata per ottenere l’albero (raccolta, essiccata, software impiegati, …). In modo che
qualsiasi persona abbia la possibilità di ripercorrere esattamente la stessa procedura
per veri care o per eventualmente aggiungere e proseguire l’analisi

- Tabella Dataset completa: taxon, voucher, marcatore e relativo nr di accesso, paese


provenienza sequenza, eventuale typus, bibliogra a di riferimento

- Filogramma (rappresentazione gra ca dell’albero ottenuto): indicare taxon, numero di


accesso della sequenza, paese di provenienza, eventuale typus; segmento con numero
sostituzioni

- Didascalia Albero: indicare Metodo utilizzato, Marcatori impiegati, Valori di Bootstrapp


e di BPP signi cativi per ogni ramo

fi
fi
fi
fi
fi

Potrebbero piacerti anche