Sei sulla pagina 1di 20

COME RECUPERARE SEQUENZE (08-04-16)

1. Aprire l’indirizzo web NCBI


2. Dal menu a tendina ALL DATA BASE, vengono visualizzate due voci importanti:
NUCLEOTIDE, trova tutte le sequenze nucleotidiche quando si lavora con il
DNA; PROTEIN, mostra le sequenze amminoacidiche quando si lavora con
proteine.
3. Esempio: cerco hemoglobin, selezionando dal menu la voce nucleotide, trovo i
geni che codificano l’emoglobina. La ricerca mostra vari tipi di emoglobina di
diverse specie, per una ricerca più accurata uso parole chiave come specie,
genere ecc.
- Seleziono in questo caso la prima voce che mi compare.

4. Cliccando su CDS ottengo la sequenza codificata evidenziata.


5. In basso a dx trovo la voce FASTA, formato usato per analizzare le
sequenze

6. Cliccare sopra, rimanda in un’altra pagina con la sequenza in FASTA,


copiarla in un foglio Word nuovo.
7. A questo punto è importante che sul file word sia attivato ¶ per vedere
tutti i caratteri ed spazi.
8. Il nome della sequenza deve rimanere separato dalla sequenza stessa
nella forma:
>nome_specie_accesionnumber
-è importante che ci sia il segno > davanti ad ogni nominativo di
sequenza, il nome di specie se contiene più parole vanno separate da un
underscore _.
-per semplicità si può omettere anche il codice identificativo.
>Pseudoterranova_decipiens_M85050.

FRAME DI LETTURA

Il DNA viene letto da una finestra ogni 3 triplette, usa 3 basi all’uscita
che parte dal 1° nucleotide dal 2° o dal 3°, al 4° ritorna al primo.
Vengono dunque chiamati frame1 , 2 , 3.
-può codificare da inizio ->fine oppure da fine->inizio.
- avrò quindi 6 frame di lettura, 3 front word e 3 revers.

1. Aprire il collegamento EBI TRANSEQ (programma per tradurre la


sequenza DNA)
2. Copio e incollo la sequenza da word
3. Scelgo il frame di lettura, se non so nulla uso tutti i 6: all six frame
4. Nella voce CONDON TABLE lascio l’opzione standard code (è quello
universale per eucarioti) – hanno un secondo genoma dentro al
mitocondrio, quindi la stessa tripletta può codificare varie cose. Un terzo
genoma in eucarioti che fanno fotosintesi.
5. Premere SUBMIT
6. I frame vengono indicati con numeri.
7. Osservo che su alcuno trovo degli * che sono la versione grafica di un
codone di stop e quindi complet.
8. Su altri osservo delle X finali che indicano codoni di stop incompleti
9. Prendendo in considerazione il frame 1, che presenta un * il quale voglio
togliere perché non vengono codificati, torno sul file word ed elimino la
tripletta TGA che è il codone di stop.
10. Torno nel TRANSEQ ed elimino anche lì TGA
11. Traduco di nuovo questa volto però solo in frame 1.

>Pseudoterranova_decipiens
ATGCACTCTTCAATAGTTTTGGCCACCGTGCTCTTTGTAGCGATTGCTTCAGCATCAAAAACGCGAGAGC
TATGCATGAAATCGCTCGAGCATGCCAAGGTTGGCACCAGCAAGGAGGCGAAGCAGGACGGCATCGACCT
CTACAAACATATGTTCGAGCACTATCCAGCAATGAAGAAATACTTCAAGCATCGTGAAAATTATACACCG
GCCGATGTCCAAAAGGATCCCTTCTTTATTAAACAAGGTCAAAATATCTTGCTCGCCTGTCACGTTTTGT
GCGCCACATACGACGATCGTGAGACATTCGACGCGTACGTTGGTGAGCTGATGGCACGACACGAGCGGGA
CCATGTTAAAGTACCGAATGATGTTTGGAATCACTTCTGGGAACATTTCATCGAGTTTCTGGGAAGTAAG
ACCACGTTGGACGAGCCAACCAAGCACGCATGGCAAGAGATCGGTAAAGAATTCTCACATGAAATCAGCC
ACCACGGTCGACATTCGGTTCGCGACCATTGCATGAACTCGTTGGAGTATATCGCGATCGGCGATAAGGA
ACATCAAAAGCAGAATGGCATTGACCTTTACAAGCATATGTTCGAGCATTATCCACATATGAGAAAGGCA
TTCAAGGGACGCGAAAACTTCACGAAAGAAGACGTTCAAAAGGACGCATTCTTCGTTAACAAGGACACAA
GATTCTGTTGGCCCTTCGTATGCTGTGACTCCTCATACGATGACGAGCCAACATTCGACTATTTTGTTGA
TGCCCTAATGGATCGTCATATCAAAGATGATATTCATCTACCTCAGGAACAATGGCATGAGTTCTGGAAA
TTGTTTGCCGAATATTTGAACGAAAAGAGTCACCAACATTTGACAGAAGCCGAGAAACATGCATGGAGTA
CAATAGGTGAGGACTTCGCGCATGAGGCCGATAAGCATGCAAAGGCCGAAAAAGACCATCATGAAGGAGA
GCACAAAGAGGAACACCACTGA

Dopo: su transeq e frame 1


>Pseudoterranova_decipiens_1
MHSSIVLATVLFVAIASASKTRELCMKSLEHAKVGTSKEAKQDGIDLYKHMFEHYPAMKK
YFKHRENYTPADVQKDPFFIKQGQNILLACHVLCATYDDRETFDAYVGELMARHERDHVK
VPNDVWNHFWEHFIEFLGSKTTLDEPTKHAWQEIGKEFSHEISHHGRHSVRDHCMNSLEY
IAIGDKEHQKQNGIDLYKHMFEHYPHMRKAFKGRENFTKEDVQKDAFFVNKDTRFCWPFV
CCDSSYDDEPTFDYFVDALMDRHIKDDIHLPQEQWHEFWKLFAEYLNEKSHQHLTEAEKH
AWSTIGEDFAHEADKHAKAEKDHHEGEHKEEHH

ESERCIZI IN CLASSE
Predere un gene uguale per tutte le specie MITOCHONDRION COMPLETE
GENOME.
• bovino-bos taurus
• capra-capra hircus
• pecora- ovis aries
• cammello –camelus bactrianus
1. sul sito NCBI scrivere il nome della specie e cercare il genoma
mitocondriale come scritto sopra, fare attenzione a scrivere
correttamente le parole in quanto il data base non accetta errori di
ortografia.
2. Trovo l’intero genoma, sul compito chiede un gene specifico, in questo
caso per esempio il gene ND4 scorrendo la pagina oppure facendo una
ricerca sulla pagina web trovo il gene interessato.
3. Nei genomi mitocondriali la voce “gene” e “CDS” sono uguali.
4. Cliccare cu CDS
5. Clic su FASTA
6. Copio la sequenza su un file word nuovo, pulisco il nome facendo
attenzione all’indicazioni date sopra
>Bos_taurus
ATGCTAAAATACATTATTCCAACAATTATACTTATACCCCTAACCTGGTTATCAAAAAATAATATAATTT
GGGTTAACTCCACAGCACACAGCCTTCTAATTAGCTTTACAAGCCTCCTCCTCATAAACCAGTTTGGCGA
CAACAGCCTTAATTTTTCACTACTATTTTTCTCCGACTCCCTATCCACTCCACTACTAATTTTAACCATA
TGGCTCCTCCCTCTAATACTAATAGCTAGCCAACATCATCTATCAAAAGAAAACCTAACCCGAAAAAAAC
TATTTATTACTATGCTGATCTCACTACAACTATTCCTAATTATAACCTTTACCGCCATGGAACTAATCTT
ATTTTATATTCTATTTGAAGCAACACTAGTCCCAACACTCATTATTATTACCCGATGAGGAAACCAAACA
GAACGCCTAAACGCCGGACTCTATTTCCTATTCTATACACTAGCTGGCTCCCTACCCCTATTAGTCGCAC
TAATTTATATCCAAAACACAGTAGGATCCCTAAATTTCCTAATATTACAGTACTGAGTACAACCTGTTCA
TAACTCTTGATCTAATGTCTTCATATGACTAGCATGTATAATAGCTTTCATAGTAAAAATACCACTATAT
GGCCTCCACCTTTGACTACCTAAAGCTCACGTAGAAGCCCCCATCGCAGGCTCCATAGTCCTTGCAGCAG
TTCTACTAAAACTAGGGGGGTACGGTATGCTACGAATCACACTAATTCTAAACCCTATGACCGACTTTAT
AGCATACCCATTCATTATACTCTCCCTATGAGGCATAATTATAACCAGCTCAATCTGCCTCCGTCAAACG
GACCTAAAATCACTCATCGCATACTCCTCTGTAAGCCACATAGCACTCGTTATCGTAGCCATCCTTATCC
AGACACCTTGAAGCTACATAGGAGCAACCGCCCTTATGATTGCCCACGGCCTCACATCCTCCATACTTTT
CTGTCTAGCAAACTCAAACTACGAACGAATCCACAGCCGAACCATAATTCTAGCTCGAGGCCTACAAACG
CTCCTTCCACTAATAGCCACCTGATGACTACTAGCAAGTCTAACCAACTTAGCTCTACCCCCAACAATCA
ACTTAATTGGAGAACTATTTGTAGTAATGTCAACCTTTTCATGATCTAACATTACAATTATTCTAATAGG
AGTAAATATAGTAATCACCGCCCTATATTCTCTATACATGCTAATTATAACCCAACGAGGAAAATATACC
TACCACATTAATAATATCTCGCCTTCCTTTACACGGGAAAATGCACTCATATCATTACACATCCTACCCC
TACTACTCCTAACCCTAAACCCAAAAATTATTCTAGGACCTCTATACT
>Capra_hircus
ATGCTAAAATACATTATTCCTACAATAATACTTATACCCCTAACCTGACTATCAAAAAATAACATAATCT
GAATTAACTCCACACTTCATAGCCTACTAATTAGCTTCACAAGCCTACTCCTTATAAACCAATTTGGCGA
TAACAGCCTCAACTTCTCATTAACCTTCTTCTCCGACTCCCTATCTACACCACTACTAATCCTAACTATA
TGACTCCTTCCCCTGATACTTATAGCTAGTCAACATCACCTATTAAAAGAAAGTCCAACCCGGAAAAAAC
TTTTCATCTCAATACTAGTCCTATTGCAACTGTTCCTAATTATAACATTCACCGCTACAGAACTAATTTT
CTTTTACATTATATTTGAAGCAACACTGGTCCCTACACTCATCATTATCACTCGATGAGGAAACCAAACA
GAGCGTCTAAACGCCGGCCTCTACTTCTTGTTTTATACCCTAACAGGATCCCTACCCCTACTAGTCGCAC
TAATTCACATTCAAAACACAGTAGGATCCCTAAACTTCCTAATCCTTCAATACTGAGCACAACCAGTACC
CAACTCCTGATCCAATGTTTTCTTATGATTAGCATGCATAATAGCCTTCATAGTAAAAATACCATTATAT
GGACTCCACCTTTGACTACCTAAAGCCCACGTAGAAGCCCCAATCGCAGGCTCTATAGTCCTTGCAGCAA
TCCTACTAAAACTAGGAGGATATGGCATGATACGAATCACACTACTCCTTAATCCAATCACCGACTATAT
AGCATATCCATTCATTATACTATCATTATGAGGCATAATTATAACCAGCTCAATTTGTCTCCGTCAAACG
GACCTGAAATCACTCATCGCATATTCTTCCGTCAGTCATATAGCGCTCGTTATCGTCGCCATCCTCATCC
AGACACCCTGAAGCTACATAGGAGCCACTGCCCTAATAATTGCCCATGGCCTTACATCATCTATACTTTT
CTGCCTAGCAAATTCTAACTATGAGCGAATCCACAGCCGTACAATAATTTTAGCCCGCGGCCTCCAAACA
CTCCTTCCACTAATGGCTGCCTGATGACTCCTAGCAAGTCTAACTAATCTGGCCCTACCCCCAACAATCA
ACCTAATTGGAGAACTATTCGTAGTAATATCAACTTTTTCATGATCTAACATCACAATTATTCTAATAGG
ACTTAACATAGTGATCACCGCCCTATACTCCCTCTACATACTAATCACAACGCAACGGGGTAAACATACC
CATCACATCAACAACATCTTACCTTCTTTCACACGAGAAAATGCACTCATATCACTTCATATATTACCAC
TACTACTTCTATCCCTAAACCCAAAAATTATCCTAGGCCCCCTATACT
>Ovis_aries
ATGCTAAAATACATTATCCCCACAATAATACTTATACCCCTAACCTGACTATCAAAAAATAGCATAATCT
GAATCAACACCACACTTCACAGCTTGCTAATCAGCCTCACAAGCCTTCTCCTCCTAAATCAATTCGGTGA
TAATAGCCTCAACTTCTCATTAACTTTTTTCTCCGACTCCTTATCTACACCATTACTAATTCTAACCATA
TGACTTCTACCCCTAATACTCATAGCTAGCCAGCATCATCTATCAAAAGAAAATCTAGCCCGAAAAAAAC
TCTTCATCTCAATGCTAATTCTACTACAACTATTTCTGATTATAACATTCACTGCCACAGAACTAATCTT
TTTCTATATCATGTTTGAAGCAACACTAGTCCCCACACTTATCATTATTACTCGATGAGGAAATCAAACA
GAACGCCTAAATGCCGGTCTCTATTTCTTGTTTTACACACTAGCAGGATCCCTGCCCCTATTAGTCGCAC
TGATTTATATTCAAAACACAATAGGATCACTAAATTTCCTTATTCTCCAGTACTGAGTTCAACCAATACC
TAACTCATGATCCAACACTTTCATATGACTAGCATGCATAATAGCTTTCATAGTAAAGATACCACTATAT
GGACTCCACCTCTGACTTCCCAAAGCCCATGTAGAAGCTCCAATTGCGGGCTCCATGGTCCTTGCAGCAA
TCCTACTTAAACTAGGAGGATATGGCATGATACGGATTACATTACTTCTGAATCCAATCACCGACTTTAT
AGCATACCCATTCATTATATTATCATTATGAGGCATAATCATAACCAGCTCAATTTGCCTTCGCCAAACG
GACCTAAAGTCACTCATTGCATATTCTTCCGTTAGCCACATAGCACTTGTCATTGTTGCCATTCTCATTC
AAACACCCTGAAGCTACATAGGAGCCACCGCCCTAATAATTGCTCATGGTCTCACATCTTCCATACTTTT
CTGCCTAGCAAACTCCAACTATGAACGAGTTCACAGCCGAACAATAATCCTAGCCCGCGGCCTACAAACA
CTCCTTCCACTAATGGCTGCCTGATGACTCCTAGCAAGTCTAACTAATCTAGCTCTACCCCCATCAATCA
ACCTAATCGGAGAACTATTTGTAGTAATATCAACCTTTTCATGATCTAACATCACAATCATTCTAATAGG
ACTTAATATGGTAATTACTGCTCTATATTCCCTCTACATACTAATCACAACACAACGAGGTAAACATACT
CACCACATCAATAATATTTTACCCTCCTTCACACGAGAAAATGCACTTATATCACTGCATATACTACCAC
TCCTACTTCTATCCCTAAACCCGAAAATTATCCTAGGCCCCCTATACT
>Camelus_bactrianus
ATGTTAAAAATTATCTTTCCTTCAATTATACTAATGCCCTTAACCTGGCTGTCAAAAAATAACATAATCT
GAATTAACCCTACAGTATACAGCCTGCTGATCAGCCTAATTAGCCTCTCCACGCTTAATCAGTATAGCGA
CAACAGCACCAACTTTTCTCTCCTATTTTTCTCAGATTCTCTATCGGCACCCTTGCTAGTCCTAACGACA
TGACTACTGCCCCTGATACTCATCGCCAGCCAATCTCACCTCTCCAAAGAGCCCCTCACACGAAAAAAAG
TATATATCACAATACTAATCCTATTACAAGTTCTCCTAATTATGACATTTACCGCATCAGAACTTATTAT
ATTCTACGTATTATTTGAAGCGACCCTGGTTCCTACTTTAATTATCATTACCCGATGAGGCAGCCAGGCA
GAGCGACTCAACGCGGGCTCCTACTTCCTATTTTATACACTATCAGGGTCTCTACCCCTCTTAGTCGCAC
TTGTATATATCCAAAACACAACAGGCTCCCTAAACTTCTTGATTATGCAGTACTGAAACCAACCCTTAAT
AGACTCTTGATCCAACGCACTCCTATGACTAGCGTGCATAATGGCCTTCATGGTAAAAATACCCCTATAC
GGCCTACACCTCTGACTACCCAAGGCCCACGTGGAAGCCCCAATTGCGGGCTCTATAGTCCTAGCTGCAG
TACTGCTTAAACTAGGGGGCTATGGAATACTCCGACTCACAACTATACTAAATCCCCTAACAGAATATAT
AGCGTACCCATTTCTAATACTATCCCTCTGGGGCATAATTATAACTAGCTCCATTTGCTTACGCCAGACT
GATCTAAAGGCACTTATTGCATATTCCTCAGTTAGTCACATAGCCCTGGTTATTGTAGCCATTTTAATTC
AAACTCCCTGAAGTTACATAGGAGCTACGACCCTTATAGTTGCCCATGGACTTACATCCTCTATACTCTT
CTGTTTAGCTAACACAAACTATGAGCGCACCCACAGCCGGACAATGATCCTGGCACGAGGCCTGCAAACA
CTCCTCCCCCTAATAGCGATATGATGGCTACTAGCAAGCCTTGCTAACCTAGCCCTGCCCCCGACGATTA
ATCTACTTGGAGAATTATTTGTAGTTATATCAGCATTCTCCTGATCCAACATTACAATCATCCTAATAGG
AGCCAATATGATAATTACGGCCCTTTACTCACTGTATATGCTTATCATGACACAACGAGGCAAACACACT
CACCATATCAACAACATTAAGCCTACTTATACACGAGAAAATTCCCTCATAGCCCTACACATGTTACCCC
TACTAATATTATCACTCAACCCTAAAATCATTATAGGACTTACCTACT

7. Una volta fatto lo stesso procedimento per tutte le specie, copio ed


incollo tutte le sequenze sul EBI TRANSEQ
8. Lavoro questa volta con un solo frame e nella voce Condon Table scelgo
questa volta MITOCHONDRIAL VERTEBRATE perché conosco le specie.

9. Una volta tradotte le sequenze mi accorgo che ci sono delle X alla fine di
ogni sequenza il che indica che non è identificato l’amminoacido, ho un
codone di stop non completo.
10. Per correggere, elimino le T e TA sulle sequenze che ho sul file word.
>Bos_taurus
ATGCTAAAATACATTATTCCAACAATTATACTTATACCCCTAACCTGGTTATCAAAAAATAATATAATTT
GGGTTAACTCCACAGCACACAGCCTTCTAATTAGCTTTACAAGCCTCCTCCTCATAAACCAGTTTGGCGA
CAACAGCCTTAATTTTTCACTACTATTTTTCTCCGACTCCCTATCCACTCCACTACTAATTTTAACCATA
TGGCTCCTCCCTCTAATACTAATAGCTAGCCAACATCATCTATCAAAAGAAAACCTAACCCGAAAAAAAC
TATTTATTACTATGCTGATCTCACTACAACTATTCCTAATTATAACCTTTACCGCCATGGAACTAATCTT
ATTTTATATTCTATTTGAAGCAACACTAGTCCCAACACTCATTATTATTACCCGATGAGGAAACCAAACA
GAACGCCTAAACGCCGGACTCTATTTCCTATTCTATACACTAGCTGGCTCCCTACCCCTATTAGTCGCAC
TAATTTATATCCAAAACACAGTAGGATCCCTAAATTTCCTAATATTACAGTACTGAGTACAACCTGTTCA
TAACTCTTGATCTAATGTCTTCATATGACTAGCATGTATAATAGCTTTCATAGTAAAAATACCACTATAT
GGCCTCCACCTTTGACTACCTAAAGCTCACGTAGAAGCCCCCATCGCAGGCTCCATAGTCCTTGCAGCAG
TTCTACTAAAACTAGGGGGGTACGGTATGCTACGAATCACACTAATTCTAAACCCTATGACCGACTTTAT
AGCATACCCATTCATTATACTCTCCCTATGAGGCATAATTATAACCAGCTCAATCTGCCTCCGTCAAACG
GACCTAAAATCACTCATCGCATACTCCTCTGTAAGCCACATAGCACTCGTTATCGTAGCCATCCTTATCC
AGACACCTTGAAGCTACATAGGAGCAACCGCCCTTATGATTGCCCACGGCCTCACATCCTCCATACTTTT
CTGTCTAGCAAACTCAAACTACGAACGAATCCACAGCCGAACCATAATTCTAGCTCGAGGCCTACAAACG
CTCCTTCCACTAATAGCCACCTGATGACTACTAGCAAGTCTAACCAACTTAGCTCTACCCCCAACAATCA
ACTTAATTGGAGAACTATTTGTAGTAATGTCAACCTTTTCATGATCTAACATTACAATTATTCTAATAGG
AGTAAATATAGTAATCACCGCCCTATATTCTCTATACATGCTAATTATAACCCAACGAGGAAAATATACC
TACCACATTAATAATATCTCGCCTTCCTTTACACGGGAAAATGCACTCATATCATTACACATCCTACCCC
TACTACTCCTAACCCTAAACCCAAAAATTATTCTAGGACCTCTATACT
>Capra_hircus
ATGCTAAAATACATTATTCCTACAATAATACTTATACCCCTAACCTGACTATCAAAAAATAACATAATCT
GAATTAACTCCACACTTCATAGCCTACTAATTAGCTTCACAAGCCTACTCCTTATAAACCAATTTGGCGA
TAACAGCCTCAACTTCTCATTAACCTTCTTCTCCGACTCCCTATCTACACCACTACTAATCCTAACTATA
TGACTCCTTCCCCTGATACTTATAGCTAGTCAACATCACCTATTAAAAGAAAGTCCAACCCGGAAAAAAC
TTTTCATCTCAATACTAGTCCTATTGCAACTGTTCCTAATTATAACATTCACCGCTACAGAACTAATTTT
CTTTTACATTATATTTGAAGCAACACTGGTCCCTACACTCATCATTATCACTCGATGAGGAAACCAAACA
GAGCGTCTAAACGCCGGCCTCTACTTCTTGTTTTATACCCTAACAGGATCCCTACCCCTACTAGTCGCAC
TAATTCACATTCAAAACACAGTAGGATCCCTAAACTTCCTAATCCTTCAATACTGAGCACAACCAGTACC
CAACTCCTGATCCAATGTTTTCTTATGATTAGCATGCATAATAGCCTTCATAGTAAAAATACCATTATAT
GGACTCCACCTTTGACTACCTAAAGCCCACGTAGAAGCCCCAATCGCAGGCTCTATAGTCCTTGCAGCAA
TCCTACTAAAACTAGGAGGATATGGCATGATACGAATCACACTACTCCTTAATCCAATCACCGACTATAT
AGCATATCCATTCATTATACTATCATTATGAGGCATAATTATAACCAGCTCAATTTGTCTCCGTCAAACG
GACCTGAAATCACTCATCGCATATTCTTCCGTCAGTCATATAGCGCTCGTTATCGTCGCCATCCTCATCC
AGACACCCTGAAGCTACATAGGAGCCACTGCCCTAATAATTGCCCATGGCCTTACATCATCTATACTTTT
CTGCCTAGCAAATTCTAACTATGAGCGAATCCACAGCCGTACAATAATTTTAGCCCGCGGCCTCCAAACA
CTCCTTCCACTAATGGCTGCCTGATGACTCCTAGCAAGTCTAACTAATCTGGCCCTACCCCCAACAATCA
ACCTAATTGGAGAACTATTCGTAGTAATATCAACTTTTTCATGATCTAACATCACAATTATTCTAATAGG
ACTTAACATAGTGATCACCGCCCTATACTCCCTCTACATACTAATCACAACGCAACGGGGTAAACATACC
CATCACATCAACAACATCTTACCTTCTTTCACACGAGAAAATGCACTCATATCACTTCATATATTACCAC
TACTACTTCTATCCCTAAACCCAAAAATTATCCTAGGCCCCCTATACT
>Ovis_aries
ATGCTAAAATACATTATCCCCACAATAATACTTATACCCCTAACCTGACTATCAAAAAATAGCATAATCT
GAATCAACACCACACTTCACAGCTTGCTAATCAGCCTCACAAGCCTTCTCCTCCTAAATCAATTCGGTGA
TAATAGCCTCAACTTCTCATTAACTTTTTTCTCCGACTCCTTATCTACACCATTACTAATTCTAACCATA
TGACTTCTACCCCTAATACTCATAGCTAGCCAGCATCATCTATCAAAAGAAAATCTAGCCCGAAAAAAAC
TCTTCATCTCAATGCTAATTCTACTACAACTATTTCTGATTATAACATTCACTGCCACAGAACTAATCTT
TTTCTATATCATGTTTGAAGCAACACTAGTCCCCACACTTATCATTATTACTCGATGAGGAAATCAAACA
GAACGCCTAAATGCCGGTCTCTATTTCTTGTTTTACACACTAGCAGGATCCCTGCCCCTATTAGTCGCAC
TGATTTATATTCAAAACACAATAGGATCACTAAATTTCCTTATTCTCCAGTACTGAGTTCAACCAATACC
TAACTCATGATCCAACACTTTCATATGACTAGCATGCATAATAGCTTTCATAGTAAAGATACCACTATAT
GGACTCCACCTCTGACTTCCCAAAGCCCATGTAGAAGCTCCAATTGCGGGCTCCATGGTCCTTGCAGCAA
TCCTACTTAAACTAGGAGGATATGGCATGATACGGATTACATTACTTCTGAATCCAATCACCGACTTTAT
AGCATACCCATTCATTATATTATCATTATGAGGCATAATCATAACCAGCTCAATTTGCCTTCGCCAAACG
GACCTAAAGTCACTCATTGCATATTCTTCCGTTAGCCACATAGCACTTGTCATTGTTGCCATTCTCATTC
AAACACCCTGAAGCTACATAGGAGCCACCGCCCTAATAATTGCTCATGGTCTCACATCTTCCATACTTTT
CTGCCTAGCAAACTCCAACTATGAACGAGTTCACAGCCGAACAATAATCCTAGCCCGCGGCCTACAAACA
CTCCTTCCACTAATGGCTGCCTGATGACTCCTAGCAAGTCTAACTAATCTAGCTCTACCCCCATCAATCA
ACCTAATCGGAGAACTATTTGTAGTAATATCAACCTTTTCATGATCTAACATCACAATCATTCTAATAGG
ACTTAATATGGTAATTACTGCTCTATATTCCCTCTACATACTAATCACAACACAACGAGGTAAACATACT
CACCACATCAATAATATTTTACCCTCCTTCACACGAGAAAATGCACTTATATCACTGCATATACTACCAC
TCCTACTTCTATCCCTAAACCCGAAAATTATCCTAGGCCCCCTATACT
>Camelus_bactrianus
ATGTTAAAAATTATCTTTCCTTCAATTATACTAATGCCCTTAACCTGGCTGTCAAAAAATAACATAATCT
GAATTAACCCTACAGTATACAGCCTGCTGATCAGCCTAATTAGCCTCTCCACGCTTAATCAGTATAGCGA
CAACAGCACCAACTTTTCTCTCCTATTTTTCTCAGATTCTCTATCGGCACCCTTGCTAGTCCTAACGACA
TGACTACTGCCCCTGATACTCATCGCCAGCCAATCTCACCTCTCCAAAGAGCCCCTCACACGAAAAAAAG
TATATATCACAATACTAATCCTATTACAAGTTCTCCTAATTATGACATTTACCGCATCAGAACTTATTAT
ATTCTACGTATTATTTGAAGCGACCCTGGTTCCTACTTTAATTATCATTACCCGATGAGGCAGCCAGGCA
GAGCGACTCAACGCGGGCTCCTACTTCCTATTTTATACACTATCAGGGTCTCTACCCCTCTTAGTCGCAC
TTGTATATATCCAAAACACAACAGGCTCCCTAAACTTCTTGATTATGCAGTACTGAAACCAACCCTTAAT
AGACTCTTGATCCAACGCACTCCTATGACTAGCGTGCATAATGGCCTTCATGGTAAAAATACCCCTATAC
GGCCTACACCTCTGACTACCCAAGGCCCACGTGGAAGCCCCAATTGCGGGCTCTATAGTCCTAGCTGCAG
TACTGCTTAAACTAGGGGGCTATGGAATACTCCGACTCACAACTATACTAAATCCCCTAACAGAATATAT
AGCGTACCCATTTCTAATACTATCCCTCTGGGGCATAATTATAACTAGCTCCATTTGCTTACGCCAGACT
GATCTAAAGGCACTTATTGCATATTCCTCAGTTAGTCACATAGCCCTGGTTATTGTAGCCATTTTAATTC
AAACTCCCTGAAGTTACATAGGAGCTACGACCCTTATAGTTGCCCATGGACTTACATCCTCTATACTCTT
CTGTTTAGCTAACACAAACTATGAGCGCACCCACAGCCGGACAATGATCCTGGCACGAGGCCTGCAAACA
CTCCTCCCCCTAATAGCGATATGATGGCTACTAGCAAGCCTTGCTAACCTAGCCCTGCCCCCGACGATTA
ATCTACTTGGAGAATTATTTGTAGTTATATCAGCATTCTCCTGATCCAACATTACAATCATCCTAATAGG
AGCCAATATGATAATTACGGCCCTTTACTCACTGTATATGCTTATCATGACACAACGAGGCAAACACACT
CACCATATCAACAACATTAAGCCTACTTATACACGAGAAAATTCCCTCATAGCCCTACACATGTTACCCC
TACTAATATTATCACTCAACCCTAAAATCATTATAGGACTTACCTACT

Per verificare, ricopio le sequenze sul transeq corrette, e dovrei avere al


posto delle X delle Y.
11. Vado sul sito web NPSA
12. Sulla voce MULTIPLE ALIGNMENT
13. Clic su CLUSTAL W PROTEIN Copio e incollo le sequenze trovate con
transeq e corrette (fine con Y)
14. SUBMIT

si ottiene un allineamento multiplo:


-in rosso AA identici
-in verde AA simili
-in azzurro AA mediamente simili
- in blu/nero AA diversi

ALLINEAMENTO MULTIPLO (lezione 2 15-04-16)

Sul file Brachyura nad2 trovo un file con geni NAD2 presi dal genoma mitocondriale di
alcune specie di granchi
-Per creare un allineamento multiplo si possono usare due vie:
1. Allineando direttamente i geni con la modalità inizio-fine del gene
2. Allineamento in due step: traduzione delle frequenze, allineamento AA, stampo
tra codoni

ESERCITAZIONE
1. Aprire il sito web EBI TRANSEQ
2. Verificare che sia nello stesso frame di lettura
3. Copio le frequenze del file brachyura sul sito
4. Uso 1 frame
5. Se ho l’inverso complementare -> “sequence manipulation ly suite” cioè se la
sequenza genica è il codificante “reverse complement”
NB: ricordare il genoma da cui ho preso le frequenze
6. Quindi sulla voce condon table seleziono INVERTEBRATE MITHOCONDRIAL,
perché sto lavorando con un genoma mitocondriali di granchi che sono
invertebrati. Do submit
Ottengo le mie sequenze tradotte con rispettivi * (codoni di stop completi) e X (codoni
di stop incompleti) i quali devono essere tolti tornando sul file word di partenza ed
eliminando le T e TA dalle sequenze (non di più) , per gli * devo eliminare l’ultima
tripletta e rifare la traduzione sul transeq.

>Paralithodes_brevipes_AB735677_nad2
ATTTTTTTATCTTTATCAAATATAATATTTATATCTACTTTATCTCTAGGAATGATAATAGCTATTTCGGCGCCCTCTTGATTTATAGCATGAGTTGGTT
TAGAACTAAATTTAATATCATTTATTCCTATTATTTTAACAATAAATAATCGCTACTCATCTGAAGCTGCCCTTAAGTATTTTTTAATCCAAGCACTGGG
TTCTTCATTTATTATTTTCAGAAGGTCTCTAATATTATTATCTTCAGAGGTGTCTTTTTTTATAATTATTTCGGCTTTATTATTAAAACTAGGAGCAGCT
CCTTTTCACTTCTGATTTCCTCAAATCATAGAAGGATTATCATGACCACGACTAATTATTTTAATAACAATTCAAAAAATTGCACCACTTTCTCTTATTT
TACTATTAATACCATATCAACAAACTTATACCGTAGTTATTATATCGGCAGTATTATCTGCTATTATTGGATCAATTATAGGAATCAATCAAACATCTTT
GCGCAAAATTATAGCCTTTTCCTCAATTAATCACATAGCATGAATACTTGCTGCAGCAATTTTAAGAGAAAATATAATGTTTATATATTTTTTATTTTAT
TGTTGTATTTCTAGGTCGGTCGCTCTAATTTTTCACAATCACCAAGCTTTTTATATTAGTAATCTTGTTGATAAAAAAGAATCTTCATCGGTTTCAAATT
TTCCAATATTTATGGCATTATTTTCTTTAGGGGGATTACCACCCTTTACAGGGTTTATCCCCAAATGGTTTATTATCCAAGAATTAAATAATTTTAATAT
ATTTATATTATTTATTGTACTTCTATCTTGTACCCTAATTACATTATATTTCTACCTACGAGTTGCAATCCCATTTTTAACCTTTTCAGCACCAAGATTT
AAATCTTCTTTAGCCTATAATTTAAATAATAATAATAATTTATTATCTAGCCCATTTATTATCTTTATAAACATATTTGGACTGATAATTCCCTCTTTAT
TTATAATTATATAA
>Neopetrolisthes_maculatus_KC107816_nad2
ATTTATTATTCTTATTTTAATATAATTTTTATTTTAACGTTAGTTTTTGGATCATTTTTATCTATTTCATCGTCTTTTTGGTTCTCAGCGTGAGCTGGTC
TCGAACTTAATTTAATTTCATTTATTCCTTTAATTATTTCATCAAAAAGAAAATATTCTTCTGAAGCCGCTTTAAAATATTTTCTAATCCAAGCTCTGGG
TTCTTCTATAATTATCTTTTCTAGATCCCTTTTACTTTTCTCAAACTTTATTTTTTCTATTCTATTAAGATTATCTCTTCTCTTAAAGCTTGGAGCTGCA
CCTTTTCATTTCTGGTTTCCCCAAGTAATAGAAGGGATAATATGACCCCAAGCAATTATACTTATAACAATTCAAAAAATAGCCCCTTTGTTTCTTCTTT
CTTATATAGCCCTTTTAATTAATAACTCTATTGTTATTTACTTAAGAAGAATATTTTCAGCAATTATCGGAGCTATTGGCGGCTTGAATCAGATTTCTTT
ACGTAAAATCTTATCATTTTCTTCAATTAATCATTTAGCCTGAATACTTAGAACTTTAATAATCAGGGAAAATATCTTTTTTACCTATTTCATTTTATAT
TGTTTTATTTCATCATCAATTGCATTAGTTTTCTTCTCAGGCCAGTTCTTTTTCTTTAATCAATTAACAAATTCTAAGTTACCTAACTTGCTAAAAATTT
TATCCATTATATCAATCTTATCACTAGGAGGATTACCTCCTTTCACCGGATTTATCCCAAAATGATTAATTATTCAAGAATTAGCAGCAATGAACTCATT
TGTTCTTTTAGCTGTATTAATTTCTTCTGCCCTTCTCACGCTTTACTATTACTTACGACTAAGATTTTCTATTTTTGTTATTTCTTCATCCAAAATTAAA
CCCTTATTGCTCAAAAAGACAGTTTTTAAATATGAATCTTTTCTATACATAAATTTTTTAGGATTACTTATTCCTTCATGTTTAGTTTTAATTT
>Homologenus_malayensis_KJ612407_nad2
ATGTTTTTATTCCATCTAATATTTTTTTTATCTTCTTTACTGATTGGCTCTATTATTTCTATCTCCTCTACATCTTGATTCACAGCTTGAATCGGATTAG
AACTAAATTTAATATCATTTATTCCCTTAATTTCAATTAAACCCCAAAAACAACTTTCTGAAGCGGCTATTAAATATTTCCTAATTCAAGCTCTTGGTTC
AGCAATCATCATCATATCTAGATGTCTCTTTTTAAATTTTCAAATCACAGCTCTATTTTTTACTCTCTTAGCCCTAATTCTAAAATTAGGAGCAGCCCCT
TTCCACTTATGATTTCCCCAAATCATAGAAGGTATCATATGGCCCCAAGCTATCATCTTAATAACTATTCAAAAACTCGCTCCAATATTTCTACTTTCTT
ATTTACTTGAAACCTCTTCAACCTTCTTGTTTATTCTTTTCTCAAGTATAATATCAGCAATTCTTGGTTCCTTAGGAGGAATTAATCAAGTTTTGTTACG
AAAAATTATAGCTTATTCATCAATTAATCACATAGCTTGAATATTGTCAGCCATAACAATTAGAGAAAAAGCCTGAATCACATATTTTATCTTTTACTCA
ATAATTTCTATATCAGTAGTCTTGATTTTTCATTTTAATAAAATAAATCACTTATCTCAAATTATTAATTATATTCCATCATCCAATTTTATTTTTTTTT
CTATTCCCTTAAGATTATTTTCTCTTGGAGGTTTACCTCCTTTTTCAGGATTTATCCCTAAATGAATTTTAATTCAAACCTTTAGATCCAATAATATATA
TATTCCTTTATTTATTCTTCTAATTTCAACTTTAATTACTCTTTATTTTTATACACGAATCTTTATTACAATAATTATTTTAACTCCTAATATAAAATGA
TTAATAAAAAAAAATACAATTGAAAACTTTAATATATCACTCACTTTATATTTCAATATATTCATATTAATCATCCCCTCAATATATATAATTTTTTA

Ottengo poi le mie sequenze tradotte e corrette senza * e X

7. Aprire il programma MEGA


8. Dal menu ALING selezione la voce EDIT/BUILD ALINGMENT
9. Si aprono una serie di finestre con domande:

Si apre una nuova finestra:

10.Copio le sequenze del file word


11.Vado su Mega e dal menu EDIT selezione la voce PASTE e ottengo:
12.Dal menu DATA seleziono SELECT GENETIC CODE TABLE
13.Seleziono il codice che mi interessa in questo caso sto lavorando con
invertebrati:

14. Dal menu ALIGNMENT seleziono ALIGN BY CLUSTALW, questo mi crea un


allineamento che esporto
15. dal menu DATA , EXPORT ALIGNMENT -> MEGA FORMAT
16.NB salvare nella cartella di esame, dando il nome

17. Cercare il file salvato e aprirlo con MEGA


18. cliccare su TA
19.dal menu DISPLAY seleziono cosa voglio vedere
20.cliccando su C, PI( parsimonia), V(variabili)
21. chiudo.

CALCOLO DISTANZE

1. dal menu DISTANCE seleziono la voce COMPUTER PARWISE DISTANCE


2. si apre una finestra chiedendo se si vuole usa il file che ho selezionato, clicco su
YES

3. viene aperta una seconda finestra con una serie di menu:


- nella voce MODEL/METHOD seleziono in questo caso P-DISTANCE
- nella voce GAPS/MISSING DATA TREATMENT seleziono PAIRWISE DELETION
esistono altre voci:
complete deletion, che insieme alla prima vengono usate se ho un allineamento
multiplo
4. clicco su compute e ottengo una finestra con la matrice di distanze
- ricordare che non si calcola mai la distanza tra una base e un trattino.

5. salvo la matrice , FILE ->EXPORT/PRINT DISTANCE -> FORMATO EXCEL > clic
su print/save matrix
6. do il nome al file e lo salvo. Il formato mi permette di aprirlo in excel.
7. Torno alla finestra di prima e cambio modello selezionando questa volta
MAXIMUM COMPOSITE LIKELIHOOD, con questo modello le distanze aumentano
perché tiene conto di ?

COSTRUZIONE DI ALBERI FILOGENICI SENZA RADICE

1. menu PHYLOGENY
2. seleziono la seconda voce costruc/test neighbor-joining tree
3. clic su compute

4. Ottengo un albero senza radice, in esame vengono forniti gli outgroups, a sx


trovo un logo verde che mi inserisce la radice, lo seleziono e metto nei due outg.
Dati noti all’esame.
5. Dal menu FILE, selezionare EXPORT CURRENT TREE.

LEZIONE.3 (22-04-16)
-Come individuare i migliori modelli
-Alberi parsimoniosi

1. Aprire file Brachyura su MEGA


2. Menu MODELS, selezionare la prima voce FIND BEST DNA/PROTEIN
3. Dopo aver dato l’ok si apre nuovamente la finestra con le tendine gialle,
verificare che sia selezionata la voce NUCLEOTIDE, si lavora con sequenze
nucleotidiche di DNA e dare COMPUTE.
4. Una volta caricato, viene aperta una finestra nella quale vengono ordinati dal
megliore al peggiore.

-devo salvare l’informazione in formato excel, dal menu File > export excel (XL).
Con il nome best dna model, nella cartella creata per l’esame.
-HKY (acronimo)
-G indica che il processo di cambiamento è modulato con una curva gamma.
5. Chiudo
6. Ripeto il punto 2 selezionando però questa volta la voce AMINO ACID
7. Salvare il file in formato XL con il nome di best pro model
8. Ottenuto il file torno su MEGA
9. Menu PHYLOGENY
10.Selezionare la prima voce Costruct/test Maximum likelihood tree
11.Nella voce subtituion type, selezionare Nucleotide
12.Cerco l’acronimo nel MODEL/METHOD:

13.Nella voce RETES AMONG SITE selezionare GAMMA DISTRIBUTED(G)


14.Nella voce TEST OF PHYLOGENY lasciare NONE, sta a indicare il numero di
repiche del bootstrap più alto è più tempo il computer ci mette a fornire l’albero.
15.una volta ottenuto l’albero senza radice, inserisco la radice negli
outgroups(sono dati dal prof).
domanda: con chi è imparentato Homologenus Malayensi?
Risposta: è sister taxon con tutti i granchi.
16. Salvare l’albero dal menu file EXPORT CURRENT TREE
17.Fare la stessa cosa sempre con il file BRACHYURA.meg questa volta però
inserendo AA, guardando anche il modello migliore nel file excel creato in
precedenza
18.Inserire la radice e rispondere ad eventuale domande
19.Salvare l’albero

ANALISI MASSIMA PARSIMONIA

1. Menu PHYLOGENY (sempre dal file brachyura.meg)


2. Selezionare la voce CONSTRUCT/TEST MAXIMUM PARSIMONY TREE
3. Test of phylogeny -> scelgo bootstrap method
4. Inserisco un numero di repliche pari a 100
5. Substitution type -> seleziono Nucleotide
6. GAPS/MISSING DATA TREATMENT -> seleziono USE ALL SITE
7. Ottengo un albero con spazi uguali, in quanto la parsimonia mi indica soltanto
la relazione
8. Inserisco la radice
9. Rispondere alle domande
10.Salvare l’albero parsimonydna

Risulta che portunus pelagicus è imparentato con callinectes sapidus e riceve un


supporto bootstrap del 100%
Posso fare anche per minimum evolution..
Per gli AA posso usare 1000 bootstrap in quanto sono molto più veloci.
L’albero non corrisponde all’esercitazione svolta in aula, da rivedere.

COME IDENTIFICARE LA SPECIE NON NOTA DI UN TAXA(SEQUENZA) DATA.(lez.4 06-


05-16)

- uso della funzione BLAST sul sito web NCBI


- uso sito web BOLD SYSTEMS
avendo sequenze di cui non si sa nulla devo capire di quale specie si tratta, che tipo di
sequenza è, sapere anche se le CDA di riconoscimento molecolare di specie ci sono
altre sequenze

1. aprire NCBI, a sx su POPULAR RESOURCES selezionare la voce BLAST (basic


local aligne sequences total)
*Come funziona BLAST?
-Avendo una sequenza di acidi nucleici lunga per esempio 500 nucleotidi, può
essere divisa in parti uguali più piccole in genere da 7 a 10 nucleotidi in
direzione 5’->1’ che sarebbe l’inverso complementare formato worm reverse. --
-Blast introduce delle sequenze variabili.

-posso usare le sequenze nucleotidiche oppure quelle proteiche, importante


dunque ricordare quale sequenza sto usando.
2. In questo esempio useremo nucleotide blast selezionandolo dal menu a SX,
blast confronterà la mia sequenza nucleotidica
3. Una volta cliccato, il sito rimanda a una nuova finestra, copiare e incollare le
sequenze date
4. Controllare che sia selezionata la voce NUCLEOTIDE COLLECTION
5. In OPTIMIZE FOR selezionare SOMEWHAT SIMILAR SEQUENCES(BLASTN)
6. Fare clic su BLAST
sequenza

selezionando MEGABLAST otteniamo una ricerca molto più ristretta e accurata


rischiando di non trovare alcuna corrispondenza con le sequenze sconosciute date nel
file “bold identification no name”.

>Taxon1
ATAAATAAAATGATAAAAATACTAAAAAAAGAAGAAATAGGAGGATACGGGGAAGTTGAGTCGTGGTGACGTCGATGGTTGTGGTCAACAAATCATAAAG
ATATTGGTACTCTTTATCTATATAGGGGGGTCTGAGGAGGTTTGTTCGGGGCAAGGTTAAGCCTGATAATCCGGATACAGTTAGGGCATCCTGGAGCAGT
ATTTTTAAAAAGAGACTGGTTTTATAATGTGGTTGTTACAACACATGCCTTAATAATAATTTTCTTTGCTGTAATACCTATCCTAATCGGAGCTTTTGGT
AATTGGCTGATTCCCCTATTAGTAGGTGGTAAAGATATAATTTATCCGCGGATAAATAATTTGAGTTATTGGTTATCTCCTAATGCGCTATATTTACTTA
TATTATCTTTTAGAACGGATAAAGGGGTAGGTGCTGGATGGACTATTTACCCGCCATTGTCTGTATACCCTTATCATAGCGGGCCGAGGATAGATGTTCT
TATTGTGTCCTTGCATTTAGCTGGGTTAAGTTCTTTGGTGGGTGCTATTAATTTTGCTAGTACCAACAAAAACATACCAGTTTTAGAGATAAAAGGAGAA
CGAGCTGAGCTTTATGTCCTAAGGATTAGAGTTACTGCCGTATTGCTAATTATTTCTATTCCGGTTTTAGGAGGGGGTATCACAATAATTCTGTTTGATC
GGAATTTTAACACAACATTCTTTGACCCAGCAGGAGGGGGTGACCCTGTCTTGTTTCAACATTTGTTCTGATTTTTTGGGCACCCTGAGGTGTACATCCT
TATTCTACCTGCTTTTGGTGTAATATCAAAAGTAATTATGCATTGTTCCGGAAAGGAGGCAGTTTTCGGGTTAATTGGGATGGTGTATGCAATAATTGGA
ATTGGAGGGCTAGGTTGTATGGTGTGGGCTCACCATATATTTACAGTAGGGCTTAATGTTGATACTCGAGGTTATTTCTCTACTGCAACTATAGTAATCG
CAGTCCCTACAGGGGTAAAAGTATTCAGGTGGTTAGCAACTATAGCAGGAAGGAAATTTAAGATAAAGCCTGCTGCTTACTGAAGTACGGGGTTCTTGTT
TCTATTCACCGTAGGAGGCTTAACAGGGGTGTTATTATCAAGGGCTTCTATGGACGTATCGCTTCATGATACTTATTATGTGGTGGCTCATTTCCACTAT
GTGCTAAGTATAGGAGCGGTGTTCGGAGTATTTTGTGGCCTGAATCATTGATTGCCTAACTTTGTTGGAGTATGCTTTAATAAGAAATGGAGAAAAGCCC
ACTTTATAGCAATGTTTTTTGGTGTAAATACCACTTTCTTTCCTCAACACTTTCTAGGGCTGAGGGGTATGCCTCGACGGTACATAGATTATGCTGACAT
TTATGCTCATTGGCATTGGGTGTCTTCTTATGGGTCTGCAGTGTCTTTTGGCTCTTTGATATATTTCAAGTTCCTACTCTGAGAAGCTTTAGTGAGTCAA
CGAGGGGTTGTATTTAGTGGGGGGTTATGCGGTGAGATGGACTGAGCAGGAACTCGAGACCTTTATCCCGGGAGAAAGCATGTTTACAGTCAACTTCCAT
TTGTTTGAACAAATCCCTATAACACGTGTATTACTTATATTTATAAGAAATCGCGTAATCAATAA

>Taxon2
ATTCGAATGGAGTTAGCTATGCCTGGAAAAATGTTAGATGATGGGCAGCTTTATAATTTAATCGTTACTGCTCACGGGCTGGTAATAATTTTCTTTCTAG
TAATACCTATAATAATTGGGGGATTTGGGAACTGGTTAGTTCCTTTAATACTAACGATACCAGACATAGCATTCCCTCGTATAAATAATCTTAGGTTCTG
ATTGTTGCCGGTGTCTATATTATTACTATTAGGTTCTGCTTATGTAGATGGTGGTGCTGGAACAGGGTGAACCATTTATCCTCCCTTATCTAGGGCTCTG
TCTCATTCGGGATGTGCAATGGATTACGTCATTTTTTCACTTCATATCGGAGGAATGTCGTCTATTTTAGCTTCTTTGAATTTTGTAACTACTAGATTTT
GTATACGCCCTGGAGTAATAACTTTGCTCCGTACTACTATGTTTGTATGGTGTGTAGCTGTAACTGGGTTTTTGTTAATTGTTGCTATGCCTGTATTGGC
TGCTGCTTTGACAATATTATTAACAGACCGAAATTTTAATACATCTTTCTTTGACCCTGTTGGGTTA

>Taxon3
ATTCGAATAGAATTATCTATGCCTGGTACTATTTTAGATGATTCTAATTTGTATAATGTAATTGTTACTTCCCATGGGTTGGTAATAATTTTTTTTTTAG
TTATGCCAATAATAATGGGGGGTTTTGGTAATTGGTTGATTCCTTTAATATTAACTGCTCCGGATATGGCTTTTCCCCGTGTAAATAATTTGAGGTTTTG
ATTATTGCCGGTTTCTTTAATATTACTTTTAGGTTCAGCTTATGTAGATTCTGGACCTGGAACAGGTTGAACTATTTATCCTCCTTTATCTGGTGGGACT
TATCATTCTGGTGTTTCTGTGGATTATGCTATTTTGTCTTTACACGTAGGGGGTGCATCTTCTATTATATCTGGAATTAATTTTACTACAACAGCTATTT
GTATACGTCCGGAATTTTTGAGATTGTTGCGAACTACAATGTTTGTTTGATGTATGGCGGTTACGGCTTTTTTATTGGTTTGTGCCATACCTGTATTAGC
AGCTGGTTTAACCATGTTGTTAACCGATCGTAATTTTAATACCAGGTTTTTTGATCCTATTGGTTTAGG
…continua.
7. Una volta dato il via, viene aperta una nuova finestra dove vengono mostrate la
mia sequenza indicata come QUERY ID, quelle simili indicate con SUBJECT.
8. Un grafico dove mostra tutte le sequenze
9. Scorrendo la pagina trovo in maniera analitica la descrizione delle sequenze che
hanno un match con la mia sequenza (DESCRIPTIONS).
-query cover: indica quanto viene coperta la sequenza.
-evalue: fornisce la probabilità che la somiglianza sia di tipo casuale, più basso
è meglio; =0 ottimo
10.In ALIGNMENTS viene fornita graficamente il risultato dell’allineamento
11.guardo 9068, che è il punto da cui partono
12.cliccare su SEQUENCE ID gb-AY49...
13.viene aperta una finestra dove cerco il numero del gene 9068.
Ho trovato che è il gene che produce la citocromo ossidassi

Sequence Manipulation Suite: http://www.bioinformatics.org/sms2/index.html

14. aprire il sito web SEQUENCE MANIPULATION SUITE


15. a dx nel menu cerco REVERSE COMPLEMENT
questo se ho l’inverso complementare.
16.Cliccare su CDS
17.Scegliere il formato BLASTA
18.Copiare la sequenza
19.Aprire il sito web BOLD SYSTEMS
20.Chiede di identificarsi, fare clic su IDENTIFICATION nei menu sopra
21.Incollare la sequenza del gene in formato fasta
22.Clic submit
23.Si carica la pagina con la specie corrispondente
24.Cliccare su TREE BASED IDENTIFICATION
25.Clic su VIEW TREE
26.Viene caricato in una finestra a parte l’albero, il mio esemplare è indicato come
UNKNOWN SPECIMENT
27.Se la specie non viene trovata come nel caso del taxon4 nell’esempio, torno
indietro e scelgo il primo data base “all barcode record on ….” Che è meno
restrittivo. Facendo submit mi mostra i best match.
28.In altri casi come quello del taxa 7 non riesce a dare una assegnazione, ci sono
due specie corrispondenti. Devono differire almeno per il 3%.