Sei sulla pagina 1di 27

Antropologia Forense

Lantropologia biologica (un tempo definita come antropologia fisica) studia le caratteristiche morfologiche fisiche, la variabilit e levoluzione. Lantropologia comprende diversi discipline di studio, quali: _ la paleoantropologia (studio di reperti fossili e molto antichi), _ la primatologia (studio dei primati, nostri parenti non umani), _ losteologia, _ la bioarcheologia, _ lantropologia genetica (studio della trasmissione dei tratti). _ lantropologia forense (studio di reperti scheletrici recenti). Queste discipline spaziano dallanalisi di meccanismi biologici, alla base dellevoluzione biologica, ai meccanismi di trasmissione genetica, permettendo unanalisi della variabilit e delladattabilit dell a specie umana. Dunque, lantropologia una disciplina di sintesi che si serve di metodi e teorie proprie di discipline diverse (principalmente la genetica) applicandole a questioni evolutive, a tematiche antropologiche. Lantropologia genetica cos in grado di fornire risposte a: o i processi evolutivi delluomo (perch siamo cos oggi?), o la diaspora umana dallAfrica (OOA) (Come avvenuta la popolazione al di fuori dellAfrica ? Quando avvenuta?), o la distribuzione geografica di varianti genetiche che dimostrano la quantit di variabilit (perch alcune popolazioni variano tanto e altre poco?), o il coinvolgimento bio-culturale nelle malattie complesse. Lo studio della medicina evolutiva un nuova disciplina che vede malattie di oggi (sindrome metabolica, obesit) in chiave evolutiva, cio non pi come disadattamento evolutivo ma disadattamento ambientale: i geni avrebbero dunque uninterazione con lambiente che portano alla manifestazione di patologie disadattive. Differenze tra genetica umana e antropologia genetica Antropologia genetica Genetica umana Pi ampia prospettiva bioculturale su interazioni Meccanismi e processi, specialmente in malattie. genetiche e ambientali (interazione del genoma mano con lambiente). Lo studio non si concentra solo sui malati. Studio della popolazione, dove i pedigree sono Analisi di famiglie, gemelli e famiglie di gemelli; utilizzati per misurare la somiglianza familiare. sempre collegati alla malattia. Quindi lo studio rimane rilegato a paesi industrializzati, in quanto aventi strutture ospedaliere in grado di diagnosticare e raccogliere informazioni circa la malattia. Studio di popolazioni piccole e isolate, spesso non Studio di una grande quantit di casi clinici presenti occidentali. Ricerca di popolazioni mescolate il in aree urbane (ospedalizzate). meno possibili (ricerca di pool genici). Es. uomini di popolazioni indigene del Per non hanno problemi di prostata (pu essere interessante dal punto di vista medico). Popolazioni culturalmente omogenee. Popolazioni eterogenee per motivi socio-economici, occupazione e stile di vita (i paesi industrializzati sono un insieme di genomi provenienti da aree diverse, es. emigrati). Campionamento rappresentativo della normale Campionamento per diagnosi clinica (es. tutti i variabilit nella popolazione. pazienti obesi). Attenzione nella caratterizzazione e nella Le variazioni ambientali sono raramente misurazione dellambiente considerate. 1

Studio della normale variabilit in tratti complessi.

Dicotomia tra malattia e sanit (solitamente si fanno confronti e studi su malati e sani, trovandone le differenze). 5-7 milioni di anni fa si ha la separazione della linea evolutiva umana dallantenato comune tra noi e le scimmie antropomorfe (scimpanz), detto LUCA (last universal common ancestor). Ogni disciplina antropologica in grado di studiare caratteristiche pi indietro nel tempo, rispetto alle altre.

La nuova sintesi Lantropologia una disciplina di sintesi in quanto richiede diverse modelli disciplinari per interpretare il dato puramente genetico o antropologico. Dunque, bisogna tenere conti di modelli della linguistica, dei processi culturali avvenuti nel tempo, di variabilit genetica e avvalersi di conoscenze di linguistica storica, preistoria. Sono necessarie altre discipline per interpretare i dati ottenuti. Infatti, nessuna di queste singole discipline pi importante di unaltra ma tutte concorrono a dare unidea dei processi evolutivi passati. Ci si avvaller di una disciplina rispetto ad unaltra in base al tipo di domanda biologica presa in considerazione (che cosa sto cercando). Confronti tra individui strettamente correlati, ad esempio della stessa specie, dovrebbero fornire la prova di processi evolutivi pi recente. Lo studio de llantropologia forense si basa su studi genetici effettuati su: _ genomi di individui, tramandati dagli antenati. _ DNA antico proveniente da resti fossili ben mantenuti, che pu o meno essere stato tramandato ai discendenti. 2

Microevoluzione e macroevoluzione Con il termine microevoluzione si indica levoluzione che avviene allinterno delle specie viventi (genesi di variet e di sottospecie) ed i processi di speciazione (nascita di nuove specie da specie ancestrali). Avviene in tempi pi ristretti allinterno della stessa specie e ci si avvale della genetica di popolazione, per studiare il cambiamento delle frequenze genetiche. lo studio della diversit genetica e della variabilit delle popolazioni odierne (nella specie) e lo studio delle forze microevolutive che causano le fluttuazioni delle frequenza, come deriva genetica, mutazioni, etc.

Con il termine macroevoluzione, si intende invece levoluzione su grande scala che, nel corso di circa quattro miliardi di anni, ha portato, dalle cellule primordiali, fino alla biodiversit attuale. Parliamo di macroevoluzione quando compariamo specie diverse (uomo, scimpanz, gorilla), ricostruendo i rapporti evolutivi tra specie diverse attraverso la filogenetica molecolare. La filogenetica molecolare studia le relazioni evolutive tra i diversi organismi e tra geni e proteine e spiega modelli biogeografici.

Polimorfismi Le persone sono differenti tra loro, dunque anche i loro genomi sono diversi. Dal febbraio 2001 stata disponibile la sequenza del genoma umano, anche se ottenuta da 4 genomi diversi ( a puzzle); nel 2007 stata sequenziato completamente il primo genoma umano diploide; il genoma di Venter.

Nel genoma di Venter vennero riscontrate delle variabili (30%) mai state riscontrate prima, quindi dal 2007 si ha il 30% di variabilit in pi del genoma umano. Le varianti includono SNPs, delezioni, inversioni, inserzioni, duplicazioni segmentali e forme di variabilit pi complesse del DNA. Prima che si studiassero i marcatori molecolari (dunque studio su marcatori classici, come gruppo sanguigno), la stima dei geni codificanti proteine era di 100.000; oggi sappiamo che sono 20.000- 25.000 dopo aver scoperto il ruolo fondamentale dello splicing alternativo e la presenza di DNA junk (spazzatura) Solo il 2% del DNA codifica per proteine. Nellambito del DNA genico, il 23,5% non codificante (extragenico). Il DNA non genico (extragenico) comprende zone altamente ripetitive (anche il DNA genico ha ripetizioni ma molto meno rispetto a quello extragenico). Oltre al DNA nucleare, nella cellula presente il DNA mitocondriale . Il DNA mitocondriale molto importante nella biologia forense perch essendo presente in molte copie per cellula (in quanto presenti molti mitocondri in una cellula), pu essere ricercato in reperti molto antichi dove il genoma frammentato e degradato; dunque molto usato in ambito forense e antropologico. Il DNA mitocondriale di 1,65 Kb ed formato da 16569 paia di basi. Dunque un genoma molto piccolo ma informativo in ambito forense. Il junk DNA (non codificante) ha una funzione indiretta ed importante evolutivamente perch ha un gran ruolo nelle dinamiche cromosomiche e nella loro struttura. In ambito forense- antropologico, si analizza la variabilit del genoma codificante o meno e il loro tasso di accumulo e mutazione. Quindi nel genoma si ricercano regioni variabili che conservano la variabilit nellevoluzione, regioni che variano nel tempo e nello spazio, sia per ricostruire ci che successo in passato ma anche per effettuare una differenziazione spaziale nel mondo. Esistono due tipi di mutazioni: 1. Mutazione a singola base (SNPs = polimorfismo da singolo nucleotide). Ad esempio, una persona nella posizione X avr la base G, mentre unaltra pu avere C. Altro esempio, nel cromosoma Y c uninserzione filogeneticamente molto antica, sulla cui base si pu distinguere maschi positivi e maschi negativi. Questo tipo di pol imorfismo detto anche biallelico perch i tri e i tetrallelici sono pi rari. 2. Inserzioni o delezioni di uno o pi nucleotidi: a. Inserzioni/ delezioni Dal punto di vista statistico, sono sempre polimorfismi binari, cio caratterizzati tramite un dato binario: ad esempio, nel gruppo 0 sono presenti gli individui che in una determinata posizione hanno CG; nel gruppo 1 tutti gli individui che non hanno CG. b. Ripetizioni in tandem Sembra che la ripetitivit del genoma sia ci che predispone il DNA a questi riarrangiamenti localizzati tra repeat omologhi e che possa generare quindi questi polimorfismi da indel, cio sembra che cos tanto DNA ripetuto sia la causa di inserzione e delezione di nucleotidi. Tutte queste ripetizioni in tandem sono definite anche VNTR ( variable number tandem repeat). In base alla lunghezza del motivo ripetuto si distinguono: Minisatelliti: da 1 a 6 ripetizioni. Sono stati i primi marcatori molecolari in ambito forense. Microsatelliti o STR (short tandem repeat): da 14 a 100 ripetizioni. Se il cromosoma su un cromosoma autosomico potrei ricavarne un fenotipo. Se il microsatellite presente su cromosoma autosomico si potrebbe leggere come un fenotipo. Considero due cromosomi: uno di origine paterna e uno materna; ad esempio nel cromosoma 1 c un locus che presenta repeat: sullallele materno ci sono 4 repeat e nel paterno 2. Quindi il mio genotipo per quel locus 4-2. Si possono descrivere genotipi anche per i cromosoma Y (in questo caso avr solo un locus). Il genotipo e il numero di repeat importante nella diagnosi di alcune malattia (sindrome X fragile, ecc.) perch n base alla quantit di repeat, un individuo sar predisposto o no a quella malattia. Le ripetizioni sono importanti dal punto di vista medico, in quanto se il numero aumenta possono insorgere malattie. I microsatelliti vengono identificati con sequenziatori automatici, ma anche con kit (specialmente in biologia forense) sia per cromosomi autosomici e cromosomi Y: in base alla lunghezza del micro satellite si avranno picchi diversi.

I polimorfismi sono forme multiple e quindi non conservate; si trovano soprattutto nelle zone non codificate (introni). Si parla di polimorfismo quando esistono almeno 2 varianti e la variante alternativa ha almeno la frequenza dell1%. Quin di si parla di polimorfismo quando due varianti coesistono. Ma le varianti non sono eterne: quando un allele si fissa, cio diventa unico nella popolazione, si arriva al monomorfismo. Potrebbe diventare unico perch vantaggioso ma anche per effetto del caso. Inizialmente con i marcatori classici si potevano analizzare solo proteine polimorfiche che avevano subito mutazioni non sinonime (cambia aa). Le mutazioni sinonime non venivano studiate perch non rilevabili; oggi possibile rilevarle (e quindi considerarle parte dello studio della variabilit) grazie ad analisi dirette della sequenza del DNA (PCR o sequenziamento, NO con elettroforesi). possibile evitare il sequenziamento attraverso lutilizzo di enzimi di restrizione, nel caso in cui il polimorfi smo sia di restrizione, cio rilevato e rilevabile con un enzima di restrizione. Generalmente i polimorfismi di restrizione sono degli SNPs e sono distinguibili in dati binari: gruppo 0 quando lenzima taglia (quando non c mutazione), gruppo 1 quando non taglia (se il sito di restrizione ha una mutazione, lenzima non riconosce e non taglia). In biologia forense, il concetto di variabilit strettamente legato al concetto di informativit: pi un marcatore variabile (in questo caso si parla di numero di ripetizioni) pi informativo. Il potere informativo e discriminante di una certo marcatore si possono calcolare. Variabilit tra specie Lomologia di genoma tra uomo e scimpanz (specie pi affine e vicina a quella umana) del 96%; mentre tra uomo e uomo (variabilit intraspecie) del 99,9%. Gli SNPs rappresentano il 90% della variabilit genetica umana. Tuttavia la maggior parte non da origine a cambiamenti fenotipici. I CNVs (copy number variations) sono variazioni nel numero di copie di un gene. Ad esempio, il gene per lamilasi 1 ha avuto una notevole importanza nel corso dellevoluzione umana in funzione degli shift nutrizionali (transizione neolitica). Modalit di eredit dei marcatori Autosomici: ad ogni generazione si ha crossing over. Quindi difficile stabilire se il cromosoma sia di origine materno o paterna. Cromosoma Y: non subisce ricombinazione, quindi viene trasmesso in modo invariato da una generazione allaltra. Mitocondriali: trasmesso dalla madre a tutti i figli (sia maschi che femmine), MA solo le femmine figlie lo trasmettono alle altre generazioni. Quindi se una donna ha solo figli maschi, la variabile mitocondriale si perde (perdita di variabilit). Dunque i marcatori mitocondriali e del cromosoma Y sono uniparentali, non ricombinanti o detti marcatori di linea e mi permettono di riscostruire la storia di un cromosoma. I marcatori sono scelti in modo che siano sparsi su tutto il genoma. Esistono loci che permettono di individuare il sesso di una persona da una traccia biologica. Marcatori del DNA Si distinguono in: Ad evoluzione lenta: SNPs e indel. importante conoscere lo stato ancestrale degli SNPs, definito attraverso il confronto con un outgroup, cio uno fuori dal gruppo, di unaltra specie (nel nostro caso, lo scimpanz). Questi polimorfismi sono detti anche polimorfismi da evento unico perch hanno tasso di mutazione bassissimo (10-9) e perch levento di mutazione avvenuto una volta sola nel corso dellevoluzione di quel cromosoma. Per le indel il tasso di mutazione inferiore (10 11 ). Anche le sequenza Alu sono eventi unici e quindi si conosce lo stato ancestrale facendo inferenze di tipo evolutivo. Ad evoluzione rapida: microsatelliti e minisatelliti. Una stessa variante si pu presentare pi volte, per cui ci possono essere eventi di omoplasia, cio eventi in cui si presenta la stessa variante. Il tasso di mutazione non costante lungo il genoma e varia proprio in funzione della caratteristi ca dei marcatori. 5

In ambito forense, sono pi importanti gli SNPs e gli STR perch hanno diversi pattern di mutazione. Gli indel hanno tasso di mutazione bassissimo quindi si pu escludere la presenza di alleli ricorrenti e retromutazioni: ogni volta che si verifica una mutazione si genera un allele nuovo. Quindi il modello di mutazione proposto quello a siti infiniti che esclude lomoplasia, cio la presenza di alleli ricorrenti perch sono avvenute retromutazioni. Per quanto riguarda i microsatelliti e i minisatelliti si parla di modello di mutazione stepwise . Facendo un esempio: si hanno 4 TCA ripetuti e la mutazione pu causare la presenza di 5 TCA (aggiunta di una) o 3 TCA (perdita). Dunque la mutazione avviene o per perdita o per aggiunta di una ripe tizione. In altre parole, lallele 14 potrebbe mutare in 15, ma questo potrebbe retromutare in 14 causando un evento di omoplasia. In questo modello non si pu escludere levento di omoplasia perch i ministaelliti e i microsatelliti sono molto variabili e variano molto velocemente. Questo modello prende in considerazione mutazioni a singolo step e le chiama +1; -1, quindi riguarda un incremento e un decremento ugualmente probabili, indipendentemente dalla lunghezza e dal numero di ripetizioni. Dunque non pi probabile che lallele 14 evolva in 15 o 13 rispetto allallele 5 in 6 o 4. Su ogni cromosoma, si avr una combinazione di ripetizioni di diversi di microsatelliti e queste verranno ereditate tutte assieme, al completo. Ci possono essere mutazioni ma sostanzialmente la combinazione rimane la stessa. Con gli SNPs si avr meno probabilit di trovare variabilit. Studiare i marcatori con un elevato tasso di mutazione molto informativo dal punto di vista forense. I marcatori pi stabili danno informaz ione sullarea geografica di appartenenza di un individuo. Filogenesi Effettuare una filogenesi significa vedere i rapporti evolutivi tra specie diverse, in ambito di macroevoluzione, o allinterno della stessa specie, in microevoluzione. Sfruttando le sequenze geniche e le linee genetiche, si in grado di studiare la filogenesi microevolutiva delluomo: ad esempio attraverso marcatori non ricombinanti. La coalescenza quel fenomeno per il quale due linee genetiche tracciate indietro nel tempo riportano ad una antenato comune. Per antenato non si intende necessariamente un individuo ma una linea genetica; ad esempio, dai cromosomi Y di due maschi riesco a risalire al cromosoma Y ancestrale comune. possibile dunque risalire alla linea comune pi recente, cio campionabile tuttora perch ancora facente parte della variabilit attuale. La teoria della coalescenza una teoria matematica che sottende la distribuzione attesa di quanto tempo necessario andare indietro nel tempo per trovare un antenato comune nella popolazione di studio. In genetica umana, gli alberi genealogici sono costituiti da individui ma anche da linee genetiche, in quanto possibile applicare il principio della coalescenza a linee genetiche. Quindi possibile ricostruire, partendo da una distribuzione attuale, come nel corso del tempo le linee genetiche si sono intrecciate tra loto e sono arrivate a coalescenza (si sono unite) fino ad arrivare ad una linea antenata genitrice. Quindi la genetica umana studia dal passato al presente e la trasmissione dei caratteri; mentre lo studio di popolazioni si basa sulla raccolta dei dati presenti (attuali) e indaga nel passato, andando indietro nel tempo (questo studio alla base degli studi macroevolutivi di specie diverse). Per gli studi microevolutivi (umani) necessario anche fornire un outgroup (di altra specie) conoscendo per il tempo della separazione. Radicare un albero significa inserire un outgroup e quindi che ci sia una radice, unorigine ben precisa in fatti di tempi. Per la specie umana, loutgroup lo scimpanz e il suo genoma. Il tempo di separazione si stima conoscendo il tasso di mutazione di una sequenza analizzata (diverso per introni e esoni, e calcolato in base allanalisi del pedigree) e sapendo che il tempo di una generazione viene fissato a 25- 30 anni. La teoria della coalescenza un modello di evoluzione attraverso il quale possibile fare genealogie di famiglie e individui, ma anche di linee genetiche. Dai dati reali ottenuti in laboratorio, si stimano i parametri e si confrontano i dati ottenuti con quelli previsti dal modello. Come tutti i modelli, esistono assunzioni: la trasmissione ereditaria viene trattata indipendentemente dal processo di mutazione. Ad esempio nello studio della genealogia materna di un gruppo di individui, si considera il DNA mitocondriale; quindi due 6

individui possono avere 2 madri diverse o la stessa, in questultimo caso la loro linea coalesce (lante nato comune la mamma). Se dei loci non sono neutrali, vuol dire che sono sotto selezione. Neutrali invece vuol dire che non sono stati posti a pressioni selettive. Negli studi degli alberi genealogici si assumono le stesse condizioni di Hardy Weinberg: accoppiamento casuale, dimensione della popolazione costante, generazioni non sovrapposte (vedi pi avanti). Il tempo di studio quel lasso di tempo tra il presente e lantenato comune pi recente. In una popolazione diploide di dimensione costante, con 2N copie per ciascun locus (N = numero degli individui) ci sono 2N potenziali genitori nella generazione precedente. Cos la probabilit che due alleli coalescano, cio condividano lo stesso antenato, 1/2 N; la probabilit che lantenato comune non ci s ia 1 N. Ogni genealogia, andando indietro nel tempo, viene necessariamente ricondotta ad uno solo, cio allantenato comune pi recente. Se si prende una popolazione con N costante, N donne hanno una madre tra le N donne della generazione precedente. Quindi la probabilit di coalescenza 1N perch consideriamo il DNA mitocondriale; prima era N perch si considerava una popolazione diploide. Quindi la probabilit, indicata come P(N), che N alleli abbiano N antenati distinti nella generazione precedente, diminuisce con li diminuire del campione popolazione. Ovviamente pi numerose sar una popolazione, maggiore la probabilit di coalescenza. Quindi la probabilit varia in funzione di N. La teoria del coalescente fornisce un modello di evoluzione basato sullindipendenza tra processo genealogico e processo mutazionale. Nelle popolazioni umane si possono individuare le regioni variabili del genoma e studiare le differenze a livello delle frequenze di determinate varianti del nostro genoma (marcatori microsatelliti, snps, ecc.). Queste variazioni sono date da fattori microevolutivi, cio da fattori che producono variabilit allinterno di una specie, e sono: mutazione flusso genico deriva genetica selezione Sono dunque fattori microevolutivi cio concorrono a produrre microevoluzione, cio variabilit di frequenze geniche. I fattori interagiscono fra loro ed agiscono simultaneamente nel determinare la struttura della popolazione e vedere da quali componenti genetiche essa formata. Proprio perch nel nostro passato tutta la nostra storia stata data da migrazioni, mescolamenti, ricombinazione, nel nostro genoma sono presenti diversi componenti diverse che possono strutturare ciascun individuo e tutta la popolazione in un certo modo: pi omogenea o pi eterogenea, pi vicina in frequenza geniche a popolazioni europee o di qualche altro continente. La struttura genetica nella popolazione il risultato della storia evolutiva: partendo dallindividuo attuale si esegue un percorso inverso per ricostruire la storia evolutiva (microevolutiva). La variabilit attuale diversa da quella presente 100 anni fa e da quella futura. Quindi si analizzano combinazioni di frequenza in determinati geni; la struttura genetica il risultato di quello che avvenuto nel passato e viene analizzata utilizzando marcatori genetici , che per essere tali devono essere polimorfici (variabili), presentandosi almeno in 2 o pi forme alleliche note. Un marcatore genetico un qualsiasi sito, che per il fatto di esistere in almeno due forme alleliche note, si presta ad essere studiato con unanalisi genetica, cio attraverso la trasmissione dei suoi alleli da parte degli eterozigoti. Un marcatore genetico che possa essere utile in campo forense deve essere molto informativo e cio molto polimorfico (tante variabili per es. microsatelliti perch hanno il tasso di mutazione elevato e ci vuol dire che con il passare del tempo hanno accumulato molte varianti). I marcatori polimorfici sono molto importanti per il CODIS INDENTIFY dellFBI che si basa su calcoli statistici. 7

Il grado di eterozigosit (H) un parametro che indica la percentuale di eterozigoti per un marcatore, cio la sua variabilit allinterno della popolazione. Inciso: l85% di tutta la variabilit risiede allinterno della popolazione, mentre bassa fra pop olazioni diverse (circa 5%). Dunque, lefficienza direttamente proporzionale al grado di eterogeneit tra popolazioni (cio a quanto queste popolazioni si differenziano per quel marcatore). inversamente proporzionale al grado di eterogeneit allinterno della popolazione cio al suo grado di eterozigosit. Bisogna sapere la variabilit interna alla popolazione ma anche i tassi di mutazione per capire se un marcatore pi o meno variabile, dunque pi o meno efficiente. I polimorfismi genetici o marcatori possono essere utili: _ a fini medico- legali, per identificare un sospetto o la paternit. _ a livello popolazionistico antropogenetico. _ a scopi clinici, per consulenze genetiche o diagnosi prenatali. Il medico legale e lantropologo utilizzano marcatori naturali, in quanto pi indicativi per ricostruire la storia rispetto ai marcatori sottoposti a pressione selettiva: si cercano marcatori non sottoposti a pressione quindi se hanno accumulato variabilit lhanno fatto perch passato pi tempo. Popolazione umana La demografia interessata al numero, alla struttura e a come si distribuiscono gli individui. In biologia, la definizione di popolazione definita dal punto di vista genetico e viene a costituire lunit dellevoluzione biologica, e attraverso gli individui di una popolazione si ottiene lunit. Dunque, la popolazione vista in unottica mendeliana e in genetica definita deme. Il deme un gruppo riproduttivo di individui interfecondi che condivide un pool genetico comune. Quindi la popolazione un raggruppamento spazio- temporale: insieme di individui di et diversa circoscritti in unarea geografica (distribuzione nel tempo) e nel tempo che condividono lo stesso pool genico anche se non appartengono allo stesso gruppo riproduttivo non ostante siano presenti nella medesima localit. Gli individui allinterno della popolazione condividono: _ cultura e abitudini. _ storia. _ vicinanza geografica (area). _ regole sociali e valori che dettano gli accoppiamenti e che implicano un certo tipo di costituzione di una popolazione (ad es. accoppiamento fra cugini). Nello studio di una popolazione bisogna inoltre ricostruire la struttura della popolazione analizzando le componenti e le variazioni sincroniche e diacroniche delle frequenze. Le componenti sincroniche sono quelle che variano nello stesso tempo, momento ( come una fotografia di una situazione attuale). Le componenti diacroniche variano invece nel corso del tempo (in molti anni); ad es. combinazioni di frequenze di certe linee avvenute in 100, 1000 o pi anni. Questa distinzione spaziale della variabilit non casuale: una distribuzione che riflette una storia. Dunque uno strumento per capire cosa avvenuto attraverso anche lutilizzo di altre discipline. Diversamente dallo studio della genetica di piante e animali, lo studio della genetica umana non pu utilizzare incroci sperimentali perch gli accoppiamenti sono basati su una scelta consapevole e spontanea del coniuge. Per studiare la genetica umana, si utilizzano dati relativi al le famiglie, ai coniugi, ai figli e attraverso lereditabilit sfruttando le leggi di Mendel (sempre considerando che laccoppiamento sia casuale e non forzato; cos si in grado di studiare le frequenze e il comportamento genico) . In questo modo si in grado di elaborare modelli e capire quanta variabilit e come si evolve (variazione della diversit) nel corso del tempo. Dunque tutta la popolazione mondiale strutturata in popolazioni mendeliane studiate attraverso astrazioni (popolazione mendeliane = modello astratto). 8

Le popolazioni mendeliane, cio i demi, sono sottopopolazioni, cio gruppi di individui di una stessa specie che vivono in unarea geografica sufficientemente ristretta da permettere lincrocio. infatti tramite le leggi di Mendel si riesce a spiegare la distribuzione delle frequenza genotipiche e alleliche nella progenie. Nella genetica di popolazione si applica la genetica mendeliana (leggi di ereditabilit) ai demi, utilizzando il modello del pool genico: un locus genico con una coppia di alleli, dove con 2N indichiamo il numero di copie di un gene in una popolazione di N individui. Il pool genico pu essere inteso anche come pool gametico (gameti maschili e femminili) dal quale sono campionati gli zigoti della generazione successiva. P e q sono le frequenze dei 2 alleli A e a Le frequenze si calcolano dal numero dei genotipi parentali e poi si presuppone che non ci sia alcuna differenza tra maschi e femmine. Equilibrio di Hardy- Weiberg Normalmente si presume che le popolazioni siano in equilibrio di Hardy- Weinberg. Nel modello di HardyWeinberg si presume che se determinate condizioni sono rispettate, le frequenze genotipiche e alleliche non cambiano nel corso delle generazioni. Ci significa che le frequenze ricavate nelle generazion i parentali siano uguali nella progenie (NO evoluzione). Le condizioni (assunzioni) sono: o Organismo diploide a riproduzione sessuata. o Generazioni non sovrapposte (no accoppiamenti di un individuo con uno della generazione precedente). o Unione casuale. o Popolazione grande. o Mutazione, ricombinazione e migrazione trascurabili. o Mortalit e fertilit indipendenti dal genotipo. Se tutte queste condizioni sono rispettate, la popolazione in equilibrio di Hardy- Weinberg, cio non evolve e quindi le frequenze genotipiche e alleliche sono costanti nel corso delle generazioni. Se queste condizioni non sono rispettate si avr: Inbreeding, unione non casuale, cio accoppiamento fra consanguinei o preferenziale. Popolazione piccola, con effetto di deriva genetica (quando si esegue il campionamento, non potendo disporre di infiniti individui, si cerca di scegliere un campione rappresentativo cercando di evitare la deriva). Migrazione (quindi flusso genico). Mutazione. Mortalit e fertilit dipendenti dal genotipo, cio alcune genotipi comportano dei vantaggi e quindi sottoposti a selezione. Se tutti i genotipi hanno la stessa probabilit di riprodursi e di lasciare discendenti, allora vuol dire che non c selezione naturale. Assunzioni Unione casuale Popolazione grande Popolazione isolata (migrazione trascurabile) Mutazione trascurabile Mortalit e fertilit indipendenti dal genotipo Forze microevolutive Inbreeding Deriva genetica Migrazione Mutazione Selezione

1. 2. 3. 4. 5.

La deriva genetica un fattore microevolutivo di tipo stocastico, casuale che interviene sia in popolazione grandi che piccole. un processo stocastico di campionamento di gameti da una generazione a quella successiva. Ad esempio, partendo da una situazione di parit numerica di allele A e a (50%), in modo casuale in 5 generazioni si riesce a perdere il polimorfismo ave ndo cos gameti di un solo tipo (monomorfismo).

La deriva importante perch la maggior parte dei marcatori utilizzati nel campo forense sono neutrali, mentre la deriva la maggior responsabile di cambiamenti in piccole popolazioni non adattative, dunque il fattore microevolutivo responsabile dei cambiamenti di tipo non adattativo. La deriva ha molta importanza per la conservazione, in quanto riduce la diversit. Leffetto della deriva che a lungo andare tender in modo casuale a fissare un allele e a perderne un altro. Ci avviene in funzione del numero di individui della popolazione: ci spiega perch nelle piccole popolazioni pi marcatala perdita di variabilit e nello stesso tempo anche causa della comparsa di patologie. Infatti, gli alleli patologici sono rari ma in caso di deriva possono diventare comuni. Dunque la deriva riduce la variabilit genetica dentro la popolazione. Il collo di bottiglia un fenomeno associato alla deriva genetica ed una riduzione drastica della popolazione che permette il passaggio di pochi alleli alle generazioni successive. I pochi alleli rimasti e quindi le poche persone rimaste aumenteranno la loro numerosit col tempo, aumentando la frequenza di quei pochi alleli, rispetto alla popolazione di partenza (si ha perdita di variabilit dalla generazione iniziale). Leffetto fondatore un fenomeno caratterizzato dalla perdita di varianti alleliche, con distribuzione molto elevata solo di un tipo di variante. Leffetto del flusso genico (e quindi della migrazione) laumento della variabilit allinterno della popolazione ( il contrario della deriva) e riduce la differenza tra popolazioni (mentre la deriva aumenta). Esistono diversi modelli teorici dellazione del flusso genico: Ad isole. Si ignorano le differenze e quindi tutte le popolazioni possono scambiarsi individui (migranti) indipendentemente dalla distanza (anche se nelle popolazioni umane, la distanza un fattore importante). Quindi le relazioni geografiche tra demi vengono ignorate. Ad isolamento per distanza che tiene conto delle relazioni geografiche e il numero di migranti (m) proporzionale alla distanza. un modello pi realistico, in cui le popolazioni vicine si scambiano maggiormente migranti e quindi sono pi affini, simili, perci a pochi chilometri ci saranno somiglianze genetiche maggiori mentre a pi chilometri pi differenze. La distanza si misura attraverso un indice che varia da 1 a 0: pi vicino a 0 pi le popolazioni sono simili geneticamente, pi vicino a 1 maggiore sono le differenze; quindi la differenza proporzionale alla distanza e lindice aumenta in funzione della distanza. 10

Mutazione, ricombinazione e flusso genico fanno aumentare la diversit genica, mentre la deriva genetica la fa diminuire. La selezione pu sia aumentare che diminuire in funzione del locus analizzato; quindi la selezione locus o contesto specifica. Studi su marcatori classici nella genetica forense Il primo polimorfismo scoperto il sistema AB0 agli inizi del 900 e nel 1919 usc la prima mappa di distribuzione di frequenze dei tipi AB0 nel mondo, mostrando zono con distribuzione diversa. Nel Sud America lo 0 comune e non un polimorfismo perch quasi tutti gli individui sono di tipo 0 (90-100%). NB: il tipo 0 un carattere recessivo; quindi nel locus sono presenti due alleli dominanti (A e B) e uno recessivo, per cui esistono 6 possibili genotipi, in cui sono presenti 95 varianti e 42 popolazioni con una grande mole di dati. Per semplificare la mole di dati, senza perdere informazioni Cavalli- Sforza utilizzarono componenti principali. Dunque la componente principale riassume e sostituisce un enorme dato di frequenze e varianti di una o pi popolazioni. Le CP sono state utilizzate da Cavalli- Sforza per lo studio dello sviluppo dellagricoltura in Europa. Con lanalisi delle componenti principali sono state descritte diverse mappe: _ la prima mappa ha alta corrispondenza con le datazioni archeologiche eseguite con il radio- carbonio che mostrano lantichit dei siti dello sviluppo dellagricoltura in Europa. Analizzando i geni si ritrova lo stesso gradiente dove presente un nucleo accentuato nel punto di origine dellagricoltura: questo pattern di variabilit spiega la diffusione unidirezionale dellagricoltura con gradiente sudest -nordovest. _ la seconda mappa analizza la variabilit spiegata dalla seconda CP (spiegazione della variabilit residua): il centro non pi in Africa ma la Lapponia. Questo potrebbe essere interpretato come un gradiente nordsud e spiegato con ladattamento al freddo o la distribuzione delle famiglie di lingua uralica. _ la terza mappa ottenuta con la terza CP (variabilit non spiegata dalla prima e dalla seconda) mostra un picco nella Germania orientale; quindi c una corrispondenza elevata con datazioni archeologiche che dimostrano la diffusione di pastori nomadi di lingua indoeuropea a partire dalle steppe euroasiatiche (circa 6000- 4500 anni fa). NB: i dati relativi alla Sardegna sono stati esclusi dallanalisi perch ha peculiarit genetiche non rappresentative della varianza totale europea (ad esempio mutazione H26 sullY, tipica sarda). A questi studi si nota una coevoluzione tra gene e cultura. Ad esempio si nota che le popolazioni africani sono tolleranti al lattosio e hanno una mutazione diversa rispetto agli europei; la pressione selettiva (mancanza di acqua) pu aver portato allo stesso genotipo in modi diversi: convergenza evolutiva o evoluzione gene- cultura. Marcatori genetici molecolari Polimorfismi del cromosoma Y e del DNA mitocondriale A partire dal1986, con la scoperta della pcr, non si studiarono pi i polimorfismi da proteine o enzimi ma direttamente il DNA. Gli studi si possono effettuare su: _ genoma nucleare (cromosomi autosomici e somatici). _ genoma mitocondriale. Con i cromosomi autosomici, si possono studiare loci ricombinanti (diploidi), mentre con marcatori di linea (DNA mitocondriale per la linea materna e cromosoma Y per la linea paterna) si studiano loci non ricombinanti (aploidi) per trasmessi sempre uguali da generazione a generazione perch non ricombinano. Sfuggendo alla ricombinazione sono utilizzati per costruire alberi genealogici. La distribuzione geografica dei geni importante perch rispecchia la storia delle popolazioni e la storia di una mutazione; dunque la filogenesi delle linee storiche si ottiene studiando mutazioni di popolazioni: si fa una storia di linee genetiche (chi h avuto quella mutazione, chi lha trasmessa). Dal fondatore, ogni mutazione causa la formazione di linee genetiche ; perci da una popolazione fondatrice dopo 5 generazioni si avranno popolazioni diverse. Ogni linea ha una distribuzione geografica precisa, ad esempio una linea pu essere pi diffusa in un posto piuttosto che unaltra, quindi presumibilmente avr avuto origine da quella popolazione. Nellambito forense e nei reperti antichi, il DNA mitocondriale di elezione perch presente in molteplici copie, anche se un genoma piccolo (tanti mitocondri per cellula e tanti DNA per mitocondrio). 11

Attraverso lanalisi del DNA mitocondriale e del cromosoma Y possibili costruire mappe di frequenze mondiali di mutazioni, che identificano a loro volta aplogruppi (vedi dopo). Gli aplogruppi del cromosoma Y sono identificati di determinate aree geografiche: _R1B tipico dellEuropa occidentale; _J in medio oriente con andamento da est a ovest: ci pu essere interpretato come una diffusione di questa linea secondo un cline (gradiente decrescente o crescente) di frequenza decrescente da sud-est a nord- ovest. possibile ipotizzare che J sia insorta pi recentemente in periodo neolitico e portata con flusso genico dagli agricoltori neolitici in Europa (c in dubbio se il nostro pool genico paleolitico s ia stato completamente sostituito dallondata di agricoltori neolitici). Genoma mitocondriale Il DNA mitocondriale circolare, piccolo con alta densit di geni e ha alta differenza nucleotidica allinterno della specie umana. Il DNA mitocondriale patern o in quantit inferiori, inoltre esiste un sistema di degradazione nellovulo del DNA mitocondriale paterno (100.000 copie negli oociti e 50-75 nello sperma). Dunque un marcatore di linea materna. Il mtDNA ha un tasso di mutazione maggiore di 10- 20 volte rispetto a quello nucleare; quindi si riesce ad andare pi indietro nel tempo perch nella stessa unit di tempo ci sono pi mutazioni: pi variabilit e pi alto potere di risoluzione. Inoltre il mtDNA ha diversi tassi di mutazione nelle sue 2 diverse regioni: _ 10 volte maggiore del genoma nucleare nella regione codificante. _ 100 volte maggiore del genoma nucleare nella regione non codificante ad alta variabilit HVR1 (HVR = hypervariable regione). La regione codificante codifica per 37 geni e quindi enzimi importanti per la respirazione cellulare, come ATPsintasi, citocromo ossidasi, coenzima Q e NADH deidrogenasi. Dunque, avvengono meno mutazioni perch ci sono geni importanti alla funzione della cellula. La regione non codificante detta regione di controllo, regione d-loop o HVR. lunga 1122 bp, molto variabile ed suddivisa in altre regioni: HVR1 (che va dalla posizione 16024 a 574), HVR2 e HVR3, dove la 1 ha tasso di mutazione maggiore della 2, e la 2 pi della 3. Nel 1981 si ha il primo sequenziamento completo del mtDNA e successivamente nel 1999 fu corretta, e a tuttoggi si questultima come riferimento negli studi di popolazione: per questo viene chiamata Cambridge Reference Sequence (CRS). Le due regioni del mtDNA sono utilizzate negli studi di popolazione: Regione d-loop. Sequenziata direttamente, quindi si fa unanalisi diretta e in particolare della regione HVR1. Linsieme delle mutazioni nella regione d-loop rispetto alla CRS va a formare lAPLOTIPO, che una combinazione di loci er editati in blocco. Ad esempio, se una persona ha una C nella posizione 16224, al posto della G (come nella CRS) e una C in 16311 (G in CRS) avr un determinato aplotipo. Questo aplotipo far parte di un aplogruppo in base alle mutazioni presenti nella regione codificante. Regione codificante. Pi stabile: avvengono meno mutazioni. Si ricercano solo gli RFLPs (SNPs riconosciuti da un enzima di restrizione, quindi detti polimorfismi di restrizione). Lo studio degli RFLPs identifica linee monofiletiche dette anche APLOGRUPPI. Laplogruppo un insieme di aplotipi con mutazioni caratterizzanti nella regione codificante. Parliamo di mutazioni caratterizzanti, perch alcune possono comuni a pi linee e quindi inutilizzabili nello studio. possibile avere divers i individui che differiscono per mutazioni nellaplotipo ma che nella regione codificante hanno tutti la stessa mutazione appartenente allo stesso aplogruppo. Laplogruppo viene definito dalle mutazioni nella regione codificante ma possibile predire l aplogruppo grazie al sequenziamento della regione d-loop se vengono trovate mutazioni caratterizzanti negli aplotipi perch esclusive. Eteroplasmia: aplotipi multipli nello stesso individuo. Omoplasmia: un solo di mtDNA nello stesso individuo. Omoplasia: pattern uguali da mutazioni ricorrenti e ricombinazione, che possono avere effetti simili nel generare variabilit. Si pu avere una stessa distribuzione su certe linee per fenomeni di omoplasia anzich essere filogeneticamente legate. 12

Il FILOTREE un albero genetico, il cui database viene aggiornato ogni 6 mesi che attualmente contiene 9439 sequenze complete di DNA mitocondriale. inoltre presente un albero complessivo che rappresenta la filogenesi mitocondriale umana; nella radice del ramo pi lungo presente la linea mitocondriale pi recente che ha lasciato variabilit ed arrivata fino a noi. possibile andare a vedere lorigine di certe linee e i tempi di origine. Ad esempio, la linea L3 ci fornisce lipotesi pi accertata di uscita delluomo de llAfrica dopo esserci rimasto per 140-110 anni: in questo periodo si sviluppata una variabilit interna al continente africano.

Cromosoma Y Ha un DNA lineare di 50- 60 Kb con bassa densit di geni rispetto al mtDNA. Scarsa diversit nucleotidica all interno della specie umana. nel nucleo, perci difficile andare ad analizzarlo nei reperti , inoltre lunico cromosoma aploide perch quasi il 95% dellY non ricombina, ad eccezione delle regioni pseudoautosomiche PAR1 e Par2 che permettono la ricombinazione con il cromosoma X: lunica fonte di cambiamento lungo le linee sono mutazioni casuali che si sono accumulate nel tempo. I marcatori utilizzati sono: o SNPs e indel: marcatori ad evoluzione lenta (tasso di mutazione 10-6- 10-8), quindi la loro mutazione si trasmette per pi generazioni rimanendo costanti. Definiscono gli aplogruppi, che vanno a formare gli alberi filigenetici. o Microsatelliti (STR) e minisatelliti: marcatori ad evoluzione rapida (tasso di mutazione 10 -2-10-3) e cambiano da individuo a individuo. Definiscono gli aplotipi, che vanno a formare i network. Riassumendo, per il cromosoma Y: Laplotipo dato dallo studio degli STRs ed la combinazione degli stati allelici (numero di ripetizioni) per un set di marcatori polimorfici (loci STRs) associati alla stessa molecola di DNA (per esempio un cromosoma o una regione cromosomica). Laplogruppo dato dallo studio degli SNPs ed linsieme delle linee monofiletiche identificate sulla base della condivisione di specifiche mutazioni per marcatori biallelici (SNPs) a lenta evoluzione. Nella genetica forense (identikit) si valutano 17 marcatori STR, dove il numero di ripetizioni ci definisce laplotipo. Per quantificare le ripetizioni si utilizza lYfiler Allelic Ladder: per ogni locus esiste un range di possibili ripetizioni (ad esempio un STR pu essere presenti da 15 a 19 copie) e ad ognuna corrisponde un picco. Ad esempio, il locus DY9456 pu avere STR composti da 13, 14, 15, 16, 17 o 18 copie, dove ogni 13

numero di ripetizione indentificato con un picco nella ladder. Dallanalisi del cromosoma Y del sospettato trover un solo picco: dal numero corrispondente al picco definiscono laplotipo per quel locus. Si pu consultare il sito YHRD, un database di aplotipi dove si inserisce il numero di ripetizioni degli STRs (17 loci) e il database trova il match specifico se esiste, altrimenti laplotipo pi simile a quello cercato. Per lidentificazione dellaplogruppo (pi stabile) si utilizzano 10 SNPs del cromosoma, analizzati con una multiplex pcr, con una tecnica chiamata minisequenziamento che visualizza gli SNPs separati e in colori diversi in funzione dellallele. Oltre allanalisi diretta: _ si pu cercare laplotipo geograficamente nel mondo inserendolo in un database (si possono cercare anche gli aplotipi simili). _ si pu fare unanalisi gerarchica (ricerca a tappe). Laplogruppo pu essere predetto con studi statistici e algoritmi di calcolo in base agli aplotipi dati da Y STRs. Esiste un sito, haplogroup predictor che usa questo modello matematico. La combinazione dellaplotipo pu appartenere a un aplogruppo con una certa percentuale di probabilit, che deve essere alta per poter considerare laplotipo appartenente a quellaplogruppo. Se la percentuale bassa (sotto l80%) si fanno altre Multiplex pcr per vedere le altre mutazioni in radice (ancestrali) per vedere se realmente appartiene a quellaplogruppo; dunque la ricerca avr bisogno di un livello di risoluzione maggiore per poter affermare lapparte nenza.

Colore degli occhi Il colore degli occhi determinato dalla quantit di melanina presente nel tessuto epiteliale e nello stroma delliride e anche dalla densit cellulare dello stroma. Non esistono colori definiti bens sfumature; infatti tr a lazzurro e il marrone ci sono una gamma infinita di sfumature che vanno dal nocciola al grigio passando per lambra e li verde: in questi casi, il contenuto di melanina una via di mezzo. Esiste un sistema ( IrisPlex) che basandosi su 6 snps in grado di predire con accuratezza elevata il colore degli occhi di una persona. Questo modello stato messo a punto da scienziati dellErasmus University Medical Centre of Rotterdam, basandosi su uno studio di 6000 individui olandesi che confronta il colore degli occhi e il DNA. I 6 snps associati considerati sono: 14

o o o o o o

rs12913832 (Herc2) rs1800407 (OCA2) rs12896399 (SLC24A4) rs16891982 (SLC45A2) rs1393350 (TYR) rs12203592 (IRF4)

Herc2 il gene in grado di dirci subito se una persona avr gli occhi marroni o no. I nfatti, ci fornisce subito la direzione dellanalisi del colore dellocchio, grazie proprio al pattern (genotipo). Gli altri 5 snps servono solo a modificare leggermente la colorazione dellocchio, schiarendola o scurendola, a seconda dei casi. Nellocchio chiaro (azzurro) sono presenti delle cripte nelliride che distinguono un individuo dagli altri (anche nei gemelli, le iridi sono diverse). Nelliride sono presenti cripte, anelli pigmentati e nevi,in modo unico in ognuno di noi e tutti sono predetti attraverso modelli di snps. Essendo un modello predittivo, si otterranno percentuali, probabilit sul reale colore dellocchio, sulla base di un modello matematico di regressione logistica. Il progetto HGDP-CEPH si basato sullo studio dei linfociti di volontari (circa 40) provenienti da diverse etnie sui quali stato predetto il colore degli occhi. Da questo studio successivamente stato predetto il colore degli occhi di altre 1000 persone. Grazie allutilizzo di questi marcatori (snps) stato possibile ricostruire la distribuzione della variabilit in Europa e nel resto del mondo. Nel disegno rappresentata la variabilit del colore degli occhi, dove la grandezza del grafico a torta proporzionale alla numerosit della popolazione.

15

Si nota una grande predominanza del colore marrone (brown). Anche se, bene sapere che lazzurro ha unorigine pi recente, datata 6 milioni di anni fa (periodo del neolitico) e si affermato perch la personna risultava pi attraente. Colore dei capelli possibile predire il colore dei capelli attraverso un modello dato da 45 snps localizzati in 12 geni. Per campione sono stati presi 385 uomini e donne di origine polacca che sono stati divisi in base al colore dei capelli in 7 categorie: _ biondo _ biondo scuro _ castano _ castano ramato _ biondo- rosso _ rosso _ nero Le quali sono state poi raggruppate per colori simili in 4 macrocategorie: _ biondo _ rosso _ castano _ nero Il colore dei capelli, della pelle e degli occhi sono quelli pi conosciuti dal punto di vista genetico perch studiati precedentemente in modelli animali. Il primo gene umano associato alla normale variazione del pigmento sia della pelle sia del capello il gene codificante per la melanocortina (MC1R). numerosi snps associati a questo gene sono co llegati al colore rosso dei capelli e la pelle chiara. Nei Neanderthaliani sono stati ritrovati questi polimorfismi e quindi pensabile che fossero di carnagione chiara e avessero i capelli rossi. Con solo 3 snps si in grado di riassumere il 90% dei fenotipi a pelle chiara e a capello rosso (quindi dal DNA molto facile risalire allidentikit di un assassino se rosso). Dal modello iniziale con 45 snps stato creato un modello lineare in cui ogni snp viene pesato in base allefficacia della predizione. Eliminando le varianti meno utili si ottenuto un modello formato da soli 13 snps localizzati in questi geni: MC1R, Herc2, IRF4, TYR, EXOC2, SLC45A2, TYRP1, OCA2, SLC45A4, KITLG, ASIP. Si tratta di un modello molto efficace dal momento che riesce ad individuare i soggetti con i capelli rossi o neri con unaccuratezza del 90%, e quelli con i capelli biondi o castani dell80%. Come si vede da questi grafici, laccuratezza cresce man mano che si aggiungo no snp raggiungendo il massimo con 13. Possiamo notare che si ritrovano altri geni come Herc2, OCA2 che sono sempre responsabili della pigmentazione. Ricerca del DNA di Luigi XVI Indagine svolta congiuntamente ad un gruppo di Barcellona e pubblicato su Forensic Science International. Si ricercato in una zucca (oggetto di antiquariato stupendo) la possibile presenza di tracce di sangue di Luigi XVI ghigliottinato in Francia nel 1793 durante la rivoluzione francese. Un anonimo port questa zucca istoriata su cui viene raccontata una storia e su cui sono presenti i profili di DAntoine, Marais, De Mulain. Sulla zucca c scritto che Maximilian Bourdaleue nel 21 gennaio ha intinto il suo fazzoletto nel sangue del re dopo Ia decapitazione e che avrebbe vendut o la zucca per 500 franchi alIaquila, ovvero al giovane Napoleone. Dal fondo della zucca stata prelevata una polverina marrone, ottenuta con un raschiamento: non cerano tracce del fazzoletto. 16

Procedimento per valutare la presenza di sangue in questa polvere marrone: 1. Estrazione del DNA a partire da 5 campioni, inviati sia a Barcellona che a Bologna. Lestrazione e stata fatta in due modi diversi, lavorando in sterilit e con Ie massime precauzioni possibili. 2. Metodo cromatografico per vedere se la polvere era data da un residuo di sangue e se questo fosse effettivamente umano. E stato confermato che era sangue umano. 3. Sequenziamento del mitocondriale: a Barcellona amplificazione solo HRV1, a Bologna HRV1 e HRV2. Il genoma ha una mutazione in 16093 con una C, in 16945 con una A e 176 e 123 una C. LapIotipo ottenuto e compatibile con Iaplogruppo N1b. E un aplotipo veramente molto raro e si e trovato solo in due altri individui europei su 20960 pplotipi, un turco ed uno del Caucaso 4. Ricerca del cromosoma Y con Yfiler. Laplotipo corrisponde allaplogruppo G2A. Lo si confermato testando 8-9 mutazioni presenti sul G. Il confronto sul database non ha trovato alcun match tra oltre 21800 aplotipi includendo anche i 6382 aplotipi dallEurasia. 5. Ricerca degli autosomici. Nel kit c anche il locus della melogenina, che discrimina il sesso, oltre ad analizzare questi loci tetranucleotidici altamente variabili. 6. Indagine di HERC2, per il colore degli occhi. Sono state eseguiti 14 cloni dove 6 hanno confermato il col ore marrone (dato dalla base A) mentre 8 per lazzurro (mutazione in G). Potrebbe essere stato un eterozigote GA e non si sicuri del colore dell occhio. Per esiste un 15,8% di individui eterozigoti che hanno gli occhi azzurri; quindi non escluso che abbia gli occhi azzurri seppur controverso. La genealogia stata ricostruita cercando i discendenti per linea materna di Luigi XVI basandosi sullanalisi del mtDNA. lnfatti, nonostante fosse analizzato anche il genoma dellY, bisogan considerare che Luigi ha avuto un unico figlio maschio morto giovanissimo (Luigi XVII). Il figlio morto piccolo nella cattedrale di Saint Deni a Parigi e ne fu conservato il cuore. Dopo 200 anni, in Belgio, un gruppo ha estratto il DNA da Luigi XVII e hanno studiato il mitocondriale, ma questo non rilevante, perch Ia mamma di Luigi XVII non la stessa di Luigi XVI. Quindi lunica alternativa possibile e ricostruire gli alberi per rintracciare un qualche discendente attuale per linea materna. E un lavoro molto lungo e complesso per essere preciso ma una rapida ricostruzione ha condotto alla famiglia di principi di Torlonia a Roma, ma non un risultato sicuro. Lalternativa e sperare che, con l aumento di mitocondri e cromosomi Y sequenziati, si arrivi ad una risposta. Mummia del Similaun Anni fa ne fu sequenziato il DNA datato 5000 anni fa (330-3200 a.C.). Caratterizzando solo 1000 bp si ipotizz una linea nuova chiamata aplogruppo K: un K1 che non rientrava in nessuno di quelli sino allora conosciuti. un paio di anni fa, con una pyrosequencing, il mtDNA stato completamente sequenziato confermando lipotesi iniziale. Quindi pu essere una linea che non ha dato discendenti arrivati fino a noi oppure che sia una linea non ancora individuata. Al Congresso delle Mummie, a Bolzano, sono stati portati i risultati dello studio sul cromosoma Y di Oetzi. E stato annunciato che Oetzi appartiene allaplogruppo G2A4 (stesso di Luigi XVI). Studio e rappresentazione dei dati genetici Considerando gli aplotipi deIl Y possibile costruire delle reti per individuare le connessioni tra questi. Ci si focalizza su: Statistiche descrittive. Ad esempio: quanto variabile una popolazione? Quale tra due popolazioni la pi variabile? Pi tempo una popolazione ha avuto per evolvere, pi variabilit ha accumulato (ad esempio al mtDNA africano appartengono molte pi varianti che non ai sud americani). La variabilit in funzione del tempo. Posso confrontare loci differenti e scoprire che andando su loci sottoposti a pressio ne selettiva, o collegati a funzionalit importanti nellorganismo, questi varieranno meno. Distanza genetica = affinit genetica, cio quanto una popolazione dista da unaltra. 17

Analisi multivariate. Ad esempio le componenti principali in Cavalli - Sforza. Una misura di diversit pu essere il numero di alleli presenti nella popolazione. Una popolazione pi alleli ha e pi variabile. Mismatch distribution= distribuzione delle differenze di sequenze tra gli individui di una popolazione presi a coppia. Se abbiamo 5 sequenze, si fanno confronti tra tutte (prima con la seconda, con la terza ...) e si calcola la quantit di differenze tra una e l'altra. Questa una matrice di distanza: calcolo del numero di nt di differenza tra un individuo e un altro. Ad esemp io si valuta quante volte c una differenza sola, quante volte non ci sono differenze e quante volte pi di una. Alla fine si ottiene una frequenza di differenze rappresentabile con un istogramma. Questa distribuzione un indicatore della variabilit genetica di una popolazione: maggiore il numero di differenze, maggiore la variabilit. La distribuzione ha una forma indicativa di eventi di espansione demografica o se la popolazione rimasta a dimensione costante. Ad esempio le popolazioni che sono rimaste a dimensione costante nel tempo, hanno una distribuzione spezzata, mentre la distribuzione a campana quella propria di una popolazione in fase di incremento demografico. Pi ci si allontana dallo 0 (si va verso destra) pi lespansione antica. Oss ervando i rami, si nota che i rami meno sono profondi pi recente lespansione della popolazione, pi sono profondi e pi lespansione antica. Facciamo un esempio considerando un campo da calcio e in particolare la distanza sul campo corrisponda al tempo. caso della popolazione a dimensione costante. Immaginiamo di avere tanti gruppi (popolazioni) compatti di persone separati tra loro e a distanze diverse. Possiamo dire che allinterno della popolazione la differenza di sequenze praticamente nulla ma la distanza nel tempo grande; quindi avr a livello grafico una spezzata.

Casi delle popolazioni ad evoluzione rapida. Possiamo spiegarle come un gruppo di persone che partono tutte al centro del campo e devono spostarsi. o In caso di evoluzione recente sono tutte al centro; quindi la differenza tra sequenze praticamente zero, perch solo pochi si saranno allontanati dal centro, cio accumulato differenza. o Poi il tempo scorre (distanza aumenta) e o Nel caso di evoluzione antica, tutte le persone si saranno allontanate dal centro e quindi saranno distribuite uniformemente nel campo (perch hanno avuto tempo di muoversi). La distribuzione una gaussiana perch le differenze di sequenza si saranno distribuite attorno ad un valore medio di differenza.

18

Indice FST= proporzione di varianza totale delle frequenze alleliche che si stabilisce tra sottopopolazioni. E la misura di distanza genetica pi usata per la varianza tra sottopopolazioni. P la frequenza di quella variante nella popolazione e pu assumere valori compresi tra 0 e 1: pi vicino a 0 e pi le popolazioni sono simili; pi vicino a 1 pi saranno differenziate.

Quindi prima si parte da statistiche descrittive che informano su quanta variabilit c nelle popolazioni. Poi si calcola il numero delle differenze per avere informazioni sulla storia demografica di una popolazione. Per calcolare la distanza tra popolazioni, si calcola principalmente lindice F ST. Altri indici che partono da dati molecolari devono tener conto dei modelli mutazionali: sono indici che non si possono applicare a tutti i tipi di dato. Quindi per lo studio del mtDNA si usa un tipo di indice di distanza che tiene conto di come questo muta e del fatto che le transizioni sono pi frequenti della trasversioni; per lo stu dio dei microsatelliti si usa un altro indice che tiene conto del loro modello mutazionale. Ci sono dei software che calcolano in base ai dati gli indici di distanza, in modo automatico. Ad esempio stepwise si usa per i microsatelliti. Alla fine indipendentemente dallindice usato, si ottengono matrici di distanza dove in diagonale ci saranno degli 0 (la distanza quella della popolazione con se stessa). Man mano che le popolazioni si allontanano, i valori di questa matrice simmetrica crescono. Questo si fa per confrontare le popolazioni a due a due perch non si ha una visione globale.

19

Dunque esistono modi per rappresentare visivamente le distanze tra pi popolazioni: usando analisi multivariate si riesce a ridurre lo spazio multidimensionale a poche di mensioni che possono essere interpretate riducendo al minimo la perdita di informazioni. Ad esempio con il multidimensional scaling, in un piano bidimensionale separato in 4 quadranti, posso leggerlo secondo le due dimensioni; individuando lo 0 posso fingere di separare africani da non africani. Lungo la seconda dimensione separo tre popolazioni da tutte le altre. Quindi visivamente riesco ad interpretare i numeri ottenuti con la matrice di distanza.

Laltro metodo per ridurre i dati quello delle compo nenti principali che riduce il numero delle variabili ed individua una struttura nella relazione tra le variabili. Le variabili vengono classificate riducendo la variabilit presente nel database e rianalizzando ogni volta la variabilit residua non spiegata dalle prime componenti. Una volta spiegata la prima componente, quella che rende conto della maggior variabilit, lanalisi procede cercando di spiegare la residua. Faccio un riassunto della grande massa di informazioni originaria in poche componenti. Nella rappresentazione cromatica, alle componenti principali si associano mappe cromatiche per ottenere una mappa con uno scatter pIot (popolazioni rappresentate come punti).

20

Se invece ricostruiamo degli alberi, si fa una filogenesi molecolare perch si ricostruiscono le relazioni genealogiche tra le linee genetiche (mitocondriali o dellY). Laltezza del ramo rappresenta il numero di cambiamenti. Quando costruiamo gli alberi possiamo: Partire dalle matrici di distanza, come abbiamo visto nello scaling. Partire dallo stato del carattere. Ad esempio partire dagli aplotipi dellY. Si costruiscono cos dei network, delle reti in cui si vedono i rapporti tra i diversi aplotipi ma non individuabile il punto di divergenza (visibile invece nellalbero) perch non c una netta separazione, ma solo una distribuzione spaziale con un percorso tra i due oggetti pi distanti. Poi si trovano gli altri a seconda dellaffinit con i pi vicini. Non un albero: parto dagli aplotipi e partendo dai pi distanti tra loro calcolo via via i pi vicini sino ad arrivare, senza divergenze, a collocare tutti gli aplotipi in funzione della loro somiglianza con quello pi vicino. E una distribuzione degli aplotipi nello spazio: pi i rami sono corti pi la mutazione recente. Es: linea L1C in cui tutti i pallini sono aplogruppi della linea L1C. Serve solo per vedere una distribuzione nello spazio degli aplotipi. Se ho un reticolo, non si sa da dove laplotipo effettivamente deriva. Tutti i cerchi sono aplotipi diversi dellY. Pi e lungo il ramo pi mutazioni ci sono state; pi sono vicini pi recentemente sono derivati. Ogni colore di pallino rappresenta una popolazione diversa. Laplotipo condiviso da pi popolazioni potrebbe essere anche un fondatore. Pi i rami sono lunghi, pi la linea ha avuto tempo per evolvere.

21

Applicazione pratica delle tecniche precedentemente illustrate Progetto Genographic Lantropologia molecolare una disciplina nata recentemente nellambito delle discipline storico - classiche anche in seguito al grande sviluppo tecnologico. Studia la variabilit esistente nelle popolazioni attuali sotto punti di vista che vanno dalla dimensione di popolazione a quella di individuo. Ci avviene mediante lutilizzo di marcatori molecolari. ln unottica evolutiva, questo ci consente di ottenere importanti informazioni e di ricostruire i diversi eventi che hanno dato origine alla popolazione attuale ed ai suoi differenziamenti nel corso della storia. Studiare la variabilit genetica attuale quindi ci consente di: o Ricostruire lorigine della nostra specie o Studiare le popolazioni pi antiche (out of africa) e le sue migrazioni o Studiare gli eventi di migrazione e flusso genico pi recenti o Studiare la variabilit e la diversit esistenti sia nella popolazione che tra le popolazioni. La maggior parte e nelle popolazioni. Il progetto di ricerca rientra nello studio del movimento e delle modificazion i delle popolazioni per determinare la nostra provenienza e i processi popolazionistici demografici avvenuti che nel corso delle generazioni ci hanno portati ad essere come oggi siamo. A tal fine, stato lanciato nel 2005 un progetto che si chiama Genographic, di origine internazionale, che ha lo scopo di esplorare i principali eventi migratori utilizzando dei marcatori molecolari di dna provenienti da popolazioni pi o meno di tutto il mondo. Il progetto Genographic si occupa anche dellambito italiano. Per ricostruire la storia genetica si utilizzano marcatori presenti nel DNA che consentono di tornare indietro nel tempo cercando quelli che sono i "segni" molecolari lasciati dalluomo nel corso delle migrazioni. I marcatori sono uniparentali, ovvero cromosoma Y e mtDNA che non essendo soggetti a ricombinazione vengono trasmessi in modo inalterato a meno di eventi mutazionali. Questi marcatori costituiscono unimpronta che rimane nel nostro genoma nel corso della storia evolutiva e che ci permettono di torn are indietro nel tempo sino ad identificare un antenato comune. Quindi lobiettivo e ricostruire la storia dei singoli marcatori tornando indietro nel tempo in modo tale da poter poi identificare quelli che sono stati i movimenti ed i processi avvenuti ne l corso della storia per ogni popolazione. 22

Allinterno del Genographic Project sono stati scelti una serie di laboratori di riferimento sia europei che locali; in Italia il BES la struttura referente. E importante studiare la storia genetica di Italia poich ha avuto un ruolo fondamentale dal punto di vista storico e in funzione della sua posizione geografica ha rappresentato un punto di arrivo e di partenza per molti processi migratori nel corso della storia, con connessioni sia con larea mediterrane a sia con quella continentale. ln particolare il suo progetto consiste in un analisi della storia genetica dellItalia attraverso lanalisi delle linee maschili e poi del mtDNA. Inizialmente, il progetto consiste in una campagna di campionamento durata circa 2 anni che alla fine ha portato alla raccolta di 1000 campioni uniformemente distribuiti nella penisola italiana. Quando si effettua un disegno sperimentale e necessario cercare di effettuare bene il procedimento; quindi gi la scelta dei campioni uno step fondamentale, in quanto il presupposto studiare attraverso la variabilit del cromosoma Y la storia genetica della nostra popolazione. Bisogna campionare individui rappresentativi della popolazione italiana (quindi radicati nel territorio), altrimenti i risultati non saranno effettivamente rappresentativi della reale storia della nostra popolazione. Perci necessario: o Per essere sicuri della validit del campionamento, unanalisi dei cognomi che, al pari del cromosoma Y, vengono trasmessi di generazione in generazione dal padre ai figli. l figli maschi lo trasmettono ai loro figli e cosi via. ln questo modo fu possibile individuare i cognomi fondatori, ovvero quei cognomi radicati allinterno di un determinato territorio. Si visto infatti che in ogni regione ci sono cognomi caratteristici. Quindi stato fatto prima uno studio su 80.000 cognomi provenienti da circa 17.000.000 di individui distribuiti su tutto il territorio e poi basandosi sui cognomi sono stati identificati quelli fondatori (es: Rossi non va bene perch ubiquitario). Usando questi ultimi sono state effettuate delle cluster analisi, cio analisi che co nsentono di vedere cognomi vicini. Lanalisi preliminare ha diviso lItalia in macroaree sulla base dei raggruppamenti dei cognomi ottenendo cos le aree: orientale, settentrionale, nord occidentale, centro orientale, etc. successivamente, allinterno del le aree sono state scelte province campionarie per motivi storici o geografici (es vicino alla costa). Allinterno di ciascuna provincia, grazie ad un contatto con la Usl, sono stati campionati individui ai quali stato fatto un prelievo di sangue e compi lare una scheda biodemografica con la raccolta delle informazioni relative ad almeno 3 generazioni dellindividuo (nome, cognome e luogo di nascita dei genitori e dei nonni). Sui campioni raccolti stata fatta unulteriore analisi ottenendo infine solo c ampioni di maschi sani non imparentati tra loro e con parenti di almeno 3 generazioni originari della stessa provincia dellindividuo, in modo da garantire lancestralit locale di ciascun individuo. Alla fine sono stati selezionati 1000 campioni da pi di 2000 raccolti. o E stato analizzato il cromosoma Y studiando i marcatori SNPs e STRs. Gli STRs permetto no lindagine dei fenomeni evolut ivi e la variabilit pi recente. Finora si sono tipizzati una serie di SNPs che individuano una serie di linee filogen etiche. Quindi stata fatta unanalisi di frequenze degli aplogruppi. E possibile di vedere la distribuzione delle linee pi frequenti in Italia creando mappe di distribuzione in cui ogni puntino una provincia, cui viene assegnata una frequenza per una determinata linea. Poi si crea una mappa di gradiente decrescente, dalla frequenza maggiore a quella minore. Da questa mappa si pu vedere che esistono alcune linee con elevato gradiente da nord a sud, altre pi frequenti ad ovest che ad est, oppure si possono vedere linee esclusive, ad esempio in Sardegna. ln effetti, la Sardegna un outlier, distaccata dal resto dellEuropa e ha frequenze elevate di determinate linee a causa delleffetto del fondatore. Oppure altre linee isolate, come L1 presente solo a Vicenza e a Campobasso ritrovabile con frequenze elevate in Scandinavia e diminuisce spostandosi verso sud: questi picchi di frequenza in Italia si spiegano con le invasioni dei barbari e dei longobardi (Vicenza e Campobasso sono due fondazioni longobarde ). Ci spiega la distribuzione delle mutazioni e degli aplogruppi non casuali ma riflettenti processi avvenuti nel passato. Quindi dallanalisi del cromosoma Y possibile chiarire la storia genetica dellItalia ed in particolare il suo ruolo sia nel conte sto genetico mediterraneo sia in quello europeo. Possiamo anche analizzare la variabilit di specifici contesti locali e gli aplogruppi particolari per vedere una connessione ad eventi di ripopolamento dellItalia. 23

Analisi di geni sottoposti a selezione: il gene che codifica per la lattasi. Il lattosio il principale zucchero del latte: disaccaride composto da una molecola di glucosio e una di galattosio unite da un legame 1,4 glicosidico. La composizione del latte nei mammiferi molto particolare ed simile solo al latte dasina. La quantit di lattosio presente nel latte umano molto elevata (7,2 g) rispetto a quello della mucca (4,9 g). Lenzima che taglia il legame del lattosio la lattasi - florizin- idrolasi e si trova nel tenue, sugli enterociti a livello dei microvilli. La lattasi ancorata alla membrana dei microvilli scinde il lattosio in glucosio e galattosio che raggiungono la circolazione sanguigna passando attraverso pompe Na-K. Se non c la lattasi, il lattosio viene permutato per azio ne batterica ad acido lattico, idrogeno ed anidride carbonica. Essendo una molecola grossa, quando si trova nellintestino, crea un effetto osmotico e richiama acqua causando effetti collaterali tipici dellindividuo intollerante: meteorismo, dolori addomi nali, diarrea. Il gene che codifica per la lattasi si trova nel cromosoma autosomico 2, sul braccio lungo ed LCT, di 50 kb, preceduto dal gene MCM6. La lattasi fondamentale durante i primi anni di vita quando la dieta di un mammifero e composta solo di latte. Nella maggior parte dei mammiferi dopo lo svezzamento la lattasi diminuisce. Alcune popolazioni riescono a digerirlo anche in et adulta. Ci sono 3 ipotesi: 1. ipotesi storico culturale: la pi importante. Afferma che la distribuzione geografica del fenotipo tollerante al lattosio ha somiglianze con la distribuzione geografica della diffusione della pastorizia. Quando sono stati addomesticati gli animali, il latte divent sempre disponibile e si inzi a berlo. Gli individui codificanti la lattasi furono avvantaggiati e durante la carestia poterono sostituire le calorie che mancavano assumendo latte. 2. ipotesi inversa: il contrario della prima e meno accreditata. La pastorizia si diffusa laddove cerano individui tolleranti al lattosio, ma non c una vera spiegazione a questa teoria. 3. Ipotesi dellassorbimento di calcio: il lattosio stimola lassorbimento di calcio ed il latte ne ricco. Gli individui che possono bere latte sono favoriti in quelle zone dove lincidenza della luce solare minore (ai poli) poich a livello epiteliale con lesposizione ai raggi uvb viene stimolata la vitamina D e quindi il calcio. Le popolazioni che vivono ai poli molto spesso vanno incontro ad osteomalacia e rachitismo. Gli individui che riuscivano a bere latte a queste latitudini erano avvantaggiati. Queste malattie possono impedire la gravidanza e quindi chi beveva latte si riproduceva. A livello geografico ci sono gradienti di tolleranza al lattosio, dove gli individui sono molto tolleranti. Ci sono oltre al nord Europa delle sacche di diffusione della tolleranza al lattosio anche in Africa ed Arabia perci si pu fare unaltra ipotesi: 4. Queste frequenze cosi elevate si trovano in zone dove ci sono delle popolazioni di pastori nomadi: sono zone desertiche quindi non aven do a disposizione lacqua, chi riusciva a bere il latte era favorito. Test fisiologici: Biopsia intestinale per vedere la quantit di enzima legato alla membrana (pi accurato ma invasivo). Test di riassorbimento del lattosio: viene somministrato latte agli individui e poi si preleva il sangue analizzando la quantit di glucosio presente (se il valore alto, vuol dire che il lattosio stato scisso). pH delle feci. Nellindividuo senza lattasi, il lattosio viene fermentato dai batteri con produzione di H, CO2 e acido lattico. Lidrogeno rende le feci pi acide e modifica il pH. Breath test: nellespirato troveremo una concentrazione pi alta di CO 2. La cosa migliore sarebbe fare tutti o 3 questi ultimi test o solo una biopsia. Spesso si chiede solo allindividuo se beve latte e se quando Io beve ha dei problemi gastrointestinali. Quindi in realt i risultati delle analisi che oggi si hanno non sono poi cos specifici. Nonostante ci sia una grande variabilit tra chi digerisce e chi non il latte, a livello molecolare le conoscenze ad oggi sono ancora molto scarse. Solo nel 2002 stato identificato un polimorfismo che si trova 13910 basi a monte del gene LCT, completamente associato alla tolleranza al lattosio nella popolazione finlandese. 24

Il polimorfismo costituito da una mutazione di una C in un T; si trova a livello del promotore del gene LCT in un sito di legame per il fattore di trascrizione OCT1. Nella popolazione finlandese gli individui tolleranti sono omozigoti o eterozigoti per la T; quelli intolleranti sono omozigoti per la C. Studi in vitro hanno inoltre confermato che il fattore di trascrizione OCT1 lega pi frequentemente le sequenze che presentano la T. Prima dello svezzamento, tutti digeriamo il latte e quindi la lattasi viene prodotta; poi in alcuni individui la lattasi continua ad essere prodotta (i finlandesi in questo caso presentano la T). Anche in et adulta la lattasi continua a essere prodotta ma non in quantit sufficienti a digerire il latte perch OCT1 si lega meno fortemente quando c C. Un altro polimorfismo che mostra unassociazione meno forte stato trovato sempre nella popolazione finlandese (polimorfismo 22018 bp a monte di LCT).

Tabelle con frequenze di genotipi CT e TT nella popolazione finlandese e svedese tolleranti.

Nei cinesi la T ha una frequenza pari a 0 come anche nei giapponesi e nei messicani. Quindi devono esserci altri polimorfismi che spiegano perch in Africa e Arabia esistono popolazioni che possono bere latte pur non presentando questa variante.

La 13910 si trova allinterno di un esteso blocco aplotipico, di circa 1 megabase. Nel 2004 un ricercatore ha tipizzato 101 SNPs in popolazioni statunitensi che derivavano sia da africani che da europei. Sono SNPs che 25

si trovano intorno alla 13910, sia a livello del promotore che a monte della lattasi e vengono ereditati senza ricombinazione da una generazione allaltra. E una conferma dellipotesi culturale, in quanto gli individui che riescono a bere latte sono avvantaggiati nella selezione in quelle popolazioni in cui bere latte costituisce un vantaggio. Inoltre aver trovato un blocco cosi lungo (tanti SNPs ereditati in blocco) ci permette di dire che la mutazione recente, circa 9000 anni fa, periodo che corrisponde alla diff usione della pastorizia (ulteriore conferma dellipotesi culturale). Allinterno del blocco aplotipico ci saranno altre varianti in gradi di spiegarci perch in Africa e in Arabia esistono individui in grado di digerire il latte; alcuni ricercatori infatti hanno trovato varianti come la 14010, la 13915 e la 13907, sempre a livello del promotore OCT1 che quindi legher pi fortemente alcune varianti rispetto ad altre. A. 14010: particolarmente frequente nelle popolazioni di pastori della regione Nilo- Sahariana, come ad esempio i masai. E stata datata circa 6000-7000 anni. un caso di convergenza evolutiva ovvero abbiamo Io stesso fenotipo dato da mutazioni diverse in tempi diversi, quindi significa che queste popolazioni africane non derivano dalle nordeuropee ma hanno sviluppato la tolleranza indipendentemente. Sono popolazioni di pastori e la possibilit di bere latte al posto dellacqua in periodi di carestie potrebbe aver avuto leffetto di pressione selettiva. B. 13915: tipica della penisola arabica. Insorge 4000 anni fa e poi si diffonde in medio oriente. Sembra associata alla addomesticazione del cammello e costituisce quindi unulteriore differenza dalle altre 2. C. 13907: ha distribuzione geografica pi ristretta: in popolazioni del Sudan, del Kenya e dell Etiopia.

In Cameroon ad esempio c la 13910, cosi come in Marocco; quindi lanalisi dei geni sottoposti a selezione e delle migrazioni. In Italia, lintolleranza al lattosio non ancora stata studiata bene, fatta eccezione per la 13910. LItalia presenta una percentuale elevata di tolleranza al lattosio al Nord con gradiente discendente spostandoci vero sud, sino a raggiungere il suo minimo in Sicilia. Probabilmente in Italia ci sono altre varianti oltre alla 13910. Dai campioni del Genographic, sono stati selezionati 1213 individui distribuiti nelle macroaree e selezionati secondo gli stessi criteri visti prima. Successivamente sono stati genotipizzati circa 50 SNPs, scegliendo quelli che erano molto frequenti nella popolazione Nordeuropea e in Italia. La genotipizzazione stata effettuata con una particolare macchina che segue un protocollo di multiplex pcr, tipizzando pi SNPs contemporaneamente in ununica pcr. Nelle multiplex importante utilizzare primer che non si appaiono tra loro formano forcine o coppie di primer. Perci esistono software, in grado di predire il possibile appaiamento di primer, in modo da non sprecare risorse (costi) e avere prodotti e risultati sbagliati. Solitamente, per motivi economici, si scartano primer (e quindi analisi di SNPs) che devono essere analizzati da soli (o con pochi altri). Ci possibile unendo insieme diversi primer che amplificano diverse regioni. 4 passaggi per lo studio degli SNPs: 26

1. Pcr con amplificazione delle regioni che contengono lo SNP di interesse (fino a 20 SNPs a reazione, quindi 40 primer, forward e reverse) 2. Purificazione dei prodotti di pcr ed eliminazione delleccesso (primer e deossinucleotidi che non hanno reagito). 3. Seconda reazione di pcr che usa un primer che termina una base prima del sito polimorfico di interesse. Poi viene aggiunto un dideossinucleotide terminatore di catena con una massa particolare. 4. Con uno spettrometro di massa si ricerca il genotipo presente. Lo spettrometro legge il peso degli amplificati definendone il genotipo. I dideossinucleotidi sono marcati con un fluoroforo.

27