Sei sulla pagina 1di 29

Statistica Inferenziale CAMPIONAMENTO

immagine tratta da girapagina.blogspot.it

eBook assemblato da Monica Terenghi esercitazione svolta nellambito del DOL MOOC Editoria elettronica: eBook per la scuola italiana dicembre 2013

Archive All Download Newest

Statistica inferenziale: campionamento


Campionamento statistico - Wikipedia it.wikipedia.org statistica inferenziale: scopi del campionamento galenotech.org statistica inferenziale: metodi di campionamento galenotech.org statistica inferenziale: errori di campionamento galenotech.org Campionamento quadernodiepidemiologia.it Caratteri del campione quadernodiepidemiologia.it Errore di campionamento quadernodiepidemiologia.it Metodi di campionamento quadernodiepidemiologia.it

Archive All Download Newest Campionamento statistico - Wikipedia it.wikipedia.org In statistica il campionamento statistico (che si appoggia alla teoria dei campioni o teoria del campionamento), sta alla base dell'inferenza statistica, la quale si divide in due grandi capitoli: la teoria della stima e la verifica d'ipotesi. In particolare una rilevazione si dice campionaria quando utile per fare inferenza ossia per desumere dal campione stesso un'informazione relativa all'intera popolazione. Le indagini censuarie, al contrario, riguardano l'intera popolazione e pur essendo pi affidabili riguardo al parametro oggetto d'indagine soffrono di: Maggiori costi Tempi pi lunghi Minore accuratezza e minori risorse concentrate sul controllo della qualit della rilevazione (quello che si guadagna in estensione si perde in profondit) Quindi mentre l'indagine censuaria fornisce il valore vero dei parametri di interesse (proporzioni, percentuali, medie, totali,...) quella campionaria restituisce una sua stima al quale associato un certo grado di fiducia (ovvero un'incertezza) quantificabile quando la formazione del campione risponde a determinati criteri di tipo probabilistico. Il campionamento si usa quando si vuole conoscere uno o pi parametri di una popolazione, senza doverne analizzare ogni elemento: questo per motivi di costi intesi in termini monetari, di tempo, di qualit o di disagio o perch analizzare un elemento lo distrugge rendendo inutilizzabile l'informazione ottenuta. Modalit di selezione del campione sono: Nella pratica quotidiana dei sondaggi di opinione e delle ricerche di mercato vengono usati tutti e quattro gli approcci. La scelta di un tipo di campionamento avviene in base alle propriet degli stimatori di alcuni parametri oppure per tener conto di problemi di costo, mobilit o altro. Concetti chiave sono: Bench gi nel Settecento si sia notato il vantaggio nell'esaminare un sottinsieme della popolazione per generalizzare i risultati alla popolazione complessiva, solo dalla fine dell'Ottocento che la discussione sulla "scientificit" del campionamento viene posta in modo

esplicito alla comunit statistica. Gi agli inizi del Novecento si vanno delineando le caratteristiche che un campione deve avere, ovvero che deve essere scelto in maniera casuale, e nell'arco di pochi anni compaiono i primi studi che mettono in evidenza che il campione non deve essere necessariamente un campione semplice ma pu essere pi complesso, per esempio stratificando. Importanti autori che hanno fatto la storia della teoria dei campioni sono stati tra gli altri: Pierre-Simon de Laplace (che fece uso dei moltiplicatori per stimare il totale di una popolazione); Adolphe Qutelet (che accetta di generalizzare alla popolazione complessiva il tasso di analfabetismo osservato tra i delinquenti, ma rifiuta di generalizzare la percentuale di maschi tra i neonati); Anders Nicolai Kiaer che nel 1895 avvia la discussione di merito in seno all'Istituto Internazionale di Statistica; Ladislaus Bortkiewicz che con un suo intervento introduce seriamente la teoria della probabilit nella discussione sul campionamento; Arthur Bowley che sviluppa il campionamento casuale, la stratificazione, e formula la varianza della stima del totale nel caso del campionamento semplice e nel caso del campionamento stratificato; Aleksandr A. uprov, suo padre Aleksandr I. uprov, A. G. Kovalevskij e Jerzy Neyman che descrivono il campionamento stratificato, e, per quanto riguarda A. A. uprov e J. Neyman, anche scoprendo in modo indipendente l'allocazione ottima. Nel 1925, durante il congresso di Roma, l'Istituto Internazionale di Statistica accetta definitivamente come scientifico il metodo campionario, distinguendo il campionamento casuale dal campionamento ragionato. Altri autori importanti nella ricerca teorica ed applicata sul campionamento furono George Gallup e William G. Cochran. S. Brasini, M. Freo, F. Tassinari, G. Tassinari, Statistica aziendale e analisi di mercato, 2002, Manuali, Il Mulino, Bologna M. Barisone, R. Mannheimer, I sondaggi, 1999, Il Mulino, Bologna M. Chiaro, I sondaggi telefonici, 1996, CISU, Roma it.wikipedia.org

statistica inferenziale: scopi del campionamento galenotech.org L'esame di un campione piuttosto che dell'intera popolazione, consente di superare questi problemi. Scegliere un campione da una popolazione significa effettuare un "campionamento". Esaminare ogni singolo individuo della popolazione significa effettuare un censimento; esaminare gli individui di un campione significa effettuare una indagine (o inchiesta o sondaggio, in inglese survey). Il principale obiettivo di un campionamento quello di raccogliere dati che consentiranno di generalizzare all'intera popolazione i risultati ottenuti dal campione. Questo processo di generalizzazione detto inferenza.

campionamento In qualsiasi studio basato su un campione, si deve tener presente che non si otterranno mai risultati completamente certi. Per valutare la validit di uno studio campionario indispensabile tener conto di vari fattori, principalmente: i criteri di scelta della popolazione in studio, il metodo con cui si selezionato il campione, il periodo di osservazione, i metodi adottati per identificare i casi di malattia, le tecniche di analisi, la precisione delle misure effettuate. Supponiamo di aver eseguito un'indagine campionaria; esaminando i dati forniti dal campione al fine di trarne delle conclusioni, occorre formulare due domande fondamentali: validit interna: misura quanto i risultati di uno studio sono corretti per il campione di individui che sono stati studiati. Viene appunto detta "interna" in quanto si applica alle condizioni del particolare gruppo di individui studiati, e non necessariamente agli altri. Per esempio, negli studi clinici, la validit interna dipende dalla correttezza di impostazione dello studio stesso, dalla scelta di buone tecniche diagnostiche e da un loro corretto utilizzo, da una buona elaborazione dei dati, ecc. La validit interna viene difettata sia dalla variazione casuale che da ogni elemento di disturbo (bias).

La validit interna rappresenta una condizione necessaria ma non sufficiente perch uno studio sia utile. validit esterna: il grado di generalizzabilit delle conclusioni tratte da uno studio. Per esempio, nel caso di uno studio epidemiologico clinico, essa risponde alla domanda "Supponendo che i risultati di un determinato studio siano veri, essi si applicano anche ai miei pazienti?". In altre parole, la validit esterna misura il grado di verit dell'assunto secondo cui gli individui studiati con il campione sono "uguali" ad altri pazienti affetti dalla stessa condizione. flow chart campionamento Per semplicit, supponiamo che un certo studio sia provvisto di eccellente validit interna: conosciamo con accuratezza le caratteristiche del campione che abbiamo esaminato. Questo significa che le conclusioni che ne abbiamo derivate sono certamente valide per gli individui del campione, ma non possiamo dire se e quanto tali conclusioni siano generalizzabili alla popolazione da cui il campione stato estratto (la soluzione a questo problema verr discussa avanti). esempio 1: si vuole conoscere l'et media di un gruppo di 600 persone che frequentano un villaggio vacanze. Poich non abbiamo la possibilit di accedere ai documenti di tutti gli ospiti, estraiamo un campione di 6 soggetti e offrendogli un omaggio per la disponibilit gli poniamo la domanda e calcoliamo la loro media. evidente che, con questo metodo, avremo un valore che si potr scostare anche di parecchi anni dalla media della popolazione da cui essi provengono (cio il gruppo di 600). Ma se intervistiamo altre persone e le aggiungiamo alle prime, la nuova media ottenuta sar pi vicina a quella vera; cio, l'accuratezza della nostra stima aumenter con il numero di persone intervistate, per non otterremo una misura perfetta finch non avremo intervistato tutti gli ospiti. esempio 2: si vuole effettuare un'indagine sui rapporti fra allergia e polline. Nel territorio d'indagine

presente un paese che conta 20.000 abitanti e 180 ville abitate da 500 persone. La popolazione di interesse costituita da tutte le persone presenti nel territorio; l'unit di analisi il singolo individuo. Se il campione fosse selezionate tra i soli abitanti del paese, non sarebbe rappresentativo; lo stesso si avrebbe se considerassimo tutti gli abitanti esterni al paese. Un campione pi rappresentativo, composto da 100 persone, sar invece rappresentato dalle singole frazioni di popolazione: frazione abitanti di paese = 100 20.000/(20.000 + 500) = 97 persone frazione esterna al paese = 100 500/(20.000 + 500)= 3 persone E' evidente che un campione di 100 persone piuttosto ridotto; tuttavia, anche se esaminassimo il pi ampio campione possibile, per esempio costituito dal 90% degli individui, questo non sarebbe perfettamente rappresentativo della popolazione, in quanto tra le circa 19.900 persone non esaminate potrebbero riscontrarsi le pi evidenti manifestazioni allergiche. In sostanza, con qualunque metodo si effettui il campionamento, si otterranno dal campione dei risultati che quasi certamente si discostano (poco o tanto) dalla "vera" misura della popolazione. Questo perch non possiamo mai essere sicuri che il campione rappresenti perfettamente la popolazione da cui stato estratto. L'errore di campionamento rappresentato dalla differenza tra i risultati ottenuti dal campione e la vera caratteristica della popolazione che vogliamo stimare. L'errore di campionamento non pu mai essere determinato con esattezza, in quanto la "vera" caratteristica della popolazione (per definizione) ignota. Esso tuttavia pu essere contenuto entro limiti pi o meno ristretti adottando appropriati metodi di campionamento; inoltre, esso pu essere stimato: ci significa che, con adatti metodi statistici, si possono determinare i limiti probabili della sua entit. Marcello Guidotti, copyright 2003 questa pagina pu essere riprodotta su qualsiasi supporto o rivista purch sia citata la fonte e l'indirizzo di questo sito (ai sensi degli artt. 2575 e 2576 cc. Legislazione sul diritto d'autore). Le fotografie sono tratte da siti web e sono, o possono ritenersi, di pubblico dominio purch utilizzate senza fini di lucro. Le immagini di prodotti presenti nel sito hanno unicamente valenza esemplificativa oltre che, eventualmente, illustrare messaggi fuorvianti e non vi alcun richiamo diretto o indiretto alla loro qualit e/o efficacia il cui controllo affidato alle autorit regolamentatorie. galenotech.org

statistica inferenziale: metodi di campionamento galenotech.org Ogni anno, per conoscere i gusti e le abitudini delle persone, si investono in Europa 8 miliardi di euro. Negli Stati uniti, la cifra ancra pi elevata. Il numero di aziende (ma anche partiti politici, opinionionisti, programmatori televisivi, ecc.) che per prendere decisioni si affidano all'opinione delle persone - o a quella che sembra essere l'opinione delle persone - cresce continuamente. Cos, quasi tutto pu essere oggetto di un sondaggio e, secondo una stima per difetto, nel mondo viene condotto un sondaggio ogni due minuti: le statistiche, sono quasi costantemente presenti nei quotidiani, nei periodici, nella televisione, nella radio e, ovviamente, in Internet. I sondaggi sono nati - negli Stati Uniti prima e sbito dopo in Europa - con lo sviluppo del mercato di massa tanto dal punto di vista politico che da quello economico. Da quando, cio, i consumatori divennero un soggetto fondamentale nel mercato ed era quindi importante conoscere i loro gusti, i loro interessi ed il loro comportamento. Il primo a manifestare interesse nei sondaggi - negli Usa - stato il mondo politico. Con il diffondersi del suffragio universale era aumentata l'esigenza di scoprire come influenzare l'opinione pubblica e i sondaggi fornirono la risposta e lo strumento necessario. Il primo sondaggio realizzato con criteri scientifici venne condotto negli Stati Uniti da Gorge Horace Gallup (1901-1984), che fond nel 1935 l'American Institute of Public Opinion. Gallup pens di "misurare" l'opinione pubblica a partire da un questionario indirizzato ad un campione rappresentativo di qualche migliaio di americani. In occasione delle elezioni presidenziali del 1936, la maggior parte dei giornali americani, condotti dal Literary Digest, che aveva intervistato telefonicamente pi di due milioni di persone, preannunciava la netta vittoria del candidato repubblicano Alf Landon, contro Franklin D. Roosevelt. Per contro, l'Istituto Gallup, sulla base di poche migliaia di questionari, previde la vittoria di Roosevelt (54% secondo gli ultimi pronostici di Gallup). Roosevelt vinse con il 61% dei suffragi. Era nata la mistica dei sondaggi, la cui diffusione continu ad aumentare anche quando - in occasione dell'elezione presidenziale del 1948 - Gallup preannunci, sbagliando, la vittoria del repubblicano Dewey contro Truman. Un paragone spesso citato che i risultati di un sondaggio sono una fotografia della realt. Questo vero, per con i limiti e i difetti di una fotografia. fotografia La fotografia (v. riassunto nel riquadro) un'approssimazione della realt e, per parte loro, i sondaggi sono basati sull'assunto che un numero ridotto di persone possa riprodurre il pensiero dell'intera popolazione (detta universo) Questo assunto si dimostrato spesso vero ma in altri casi (come il secondo sondaggio Dewey vs. Truman) no. Per riprendere l'analogia con la fotografia, il risultato sbagliato pu dipendere da cattiva scelta del campione (messa a fuoco sul soggetto sbagliato), inadeguadezza numerica del campione rispetto all'universo (eccessiva

grana della pellicola o scarsa definizione del sensore). Nella composizione a destra: in alto a sinistra un primo piano della foto originale, che per stata modificata aggiungendo un riflesso sul casco e un prodotto nella mano dell'astronauta. La procedura standard parte da dati Istat, facendo in modo che all'interno del campione siano rappresentate nei corretti rapporti tutte le fasce sociali e demografiche: sesso, et, grado di istruzione, residenza, lavoro, reddito. Se il sondaggio lo richiede, si possono considerare altri elementi (statura, peso, sport praticato, alimentazione). Il campione pu essere rappresentativo non solo di chi vive in una Regione o uno Stato, ma anche di una categoria: lavoratori dipendenti, avvocati, gelatai, ecc.

formazione di un sondaggio esempio: posto che in Italia, il 5% della popolazione laureato, allora un campione di 100 persone dovr comprendere 5 laureati; le altre classi costitutive saranno presenti seguendo lo stesso criterio. La dimensione del campione pu variare, ma l'esperienza suggerisce che un sondaggio condotto su meno di 500 persone poco affidabile (1000 senz'altro un campione migliore), e sorprendentemente - se il campione scelto con criterio - la sua consistenza numerica indipendente dall'universo di riferimento. Il criterio guida di un buon campionamento, in linea teorica e a prescindere dai costi, prevede che ciascun membro della popolazione abbia la stessa probabilit di essere scelto. In tal caso il campione viene detto "randomizzato" o "casuale". Un campionamento randomizzato offre il vantaggio di essere privo di errori sistematici (bias = distorsione) e consente di accertare rigorosamente l'attendibilit dei risultati o, per meglio dire, i rapporti fra i risultati forniti dal campione e la vera caratteristica della popolazione.

In realt, nella pratica dei sondaggi di opinione e delle ricerche di mercato l'attuale normativa prevede che vengano usati anche gli approcci non probabilistici. E la preferenza ai vari tipi di campionamento avviene in base alle propriet degli stimatori di alcuni parametri oppure per tener conto di problemi di costo, mobilit o altro. Due fattori sono determinanti: la formulazione delle domande e delle risposte (che possono indirizzare le opinioni di chi risponde al questionario) e la modalit con cui vengono svolte le interviste. Esistono delle tecniche relative all'uso del linguaggio che studiano la composizione delle frasi in modo da renderle il pi possibile neutre, oppure accentuare pi o meno un elemento. Per esempio, una domanda del tipo: " d'accordo per un aumento delle piscine comunali?" potrebbe riscuotere un certo consenso in mancanza di alternative, ma il consenso sarebbe probabilmente minore se la domanda fosse formulata cos: " d'accordo ad un aumento della tassa sui rifiuti urbani se aumenta il numero delle piscine comunali?" Il campionamento non probabilistico non fornisce a ciascuna unit della popolazione la stessa occasione di essere scelta a far parte del campione, ma alcuni gruppi o individui hanno maggiore probabilit di essere scelti, pertanto il campionamento non probabilistico da considerare un metodo abbastanza critico a meno di giustificazioni ragionevoli. Questo metodo, infatti, prevede la selezione del campione in base a criteri di comodo o di praticit: per esempio perch gli elementi da campionare sono pi facilmente accessibili, o per ragioni di costo, o perch in una certa zona sono disponibili volontari ecc. Un campione selezionato con questi criteri di comodo, sebbene abbia il vantaggio della rapidit, essendo soggetto ad un forte bias, pu fornire dati poco affidabili e pu essere facilmente viziato da errori sistematici. esempio 1: in un sondaggio di opinioni all'interno di una piccola azienda con 200 impiegati si vuole studiare la valutazione attribuita alla qualit della mensa. A questo scopo si decide di esaminare un campione composto da 20 persone. Per motivi di convenienza, si intervistano le prime 20 persone che si presentano in sala mensa. Questo criterio molto pratico, in quanto non bisogna attendere l'arrivo di tutti i dipendenti; tuttavia, si esamineranno impiegati di livello pi basso: i dipendenti pi impegnati o comunque meno "affamati" non entreranno a far parte del campione. Questo campione, dunque viziato da un errore sistematico. D'altra parte, l'errore si sarebbe evitato scegliendo una persona ogni 8 - 10 fra quelle che varcano la porta d'uscita. esempio 2: un classico esempio di cattivo uso del campionamento si present durante le elezioni presidenziali Usa del 1936. La rivista Literary Digest studi un sondaggio elettorale nel 1932, con un risultato molto accurato; cos, ripropose il sondaggio per le elezioni del 1936 utilizzando la stessa metodologia. I loro risultati davano Alf Landon vincente contro Franklin Roosevelt con un margine elettorale di 370 voti contro 161. I risultati reali furono un p differenti... 523 contro 8! Cos'era accaduto? Il sondaggio era stato fatto utilizzando un campione di utenti telefonici. Un

campionamento che non avrebbe dovuto dare problemi. Tuttavia, nel 1929 il mercato azionario era crollato dando inizio alla depressione. Dal 1932, le cose iniziarono ad andare male, ma non troppo male. Dal 1936, le cose andarono realmente male. La popolazione aveva rinunciato alla cose non necessarie come gli abbonamenti alle riviste e l'uso del telefono. Solo i ricchi potevano permettersi simili lussi. Per, negli anni '30 i ricchi votavano tendenzialmente per i Repubblicani e quindi era naturale che un sondaggio vedesse vincente un candidato repubblicano. esempio 3: nel 1948 l'Istituto Gallup sbagli la previsione pronosticando la sconfitta di Harry Truman. In questo caso Gallup attribu l'errore al fatto di aver concluso le interviste 3 settimane prima del voto supponendo che dato il consistente margine di vantaggio di Dewey non potessero esserci cambiamenti significativi. Nelle poche settimane precedenti al voto, per, una parte degli indecisi si schier a sostegno di Truman, mentre una parte dei sostenitori di Dewey decise di non recarsi al voto dando per certa la vittoria del proprio candidato in base al risultato dei sondaggi: per questo che la previsione di Gallup fu smentita dai fatti. Il campionamento per randomizzazione semplice si effettua estraendo una certa quota di unit dalla popolazione attraverso un metodo che garantisce la casualit delle estrazioni. Questa viene ottenuta, ad esempio, con il classico sistema dell'estrazione di un numero, come avviene nel gioco del bingo, oppure - pi comunemente - si utilizza un computer con un generatore di numeri casuali. Occorre prestare attenzione al fatto che anche un campione casuale, particolarmente nella sperimentazioni clinica, non pu essere considerato esente da errori: le persone non sono oggetti e la loro variabilit biologica rende il campione intrinsecamente affetto da bias (basti pensare a come definita la DE50 e alla necessit di farmacovigilanza) La randomizzazione semplice (come, d'altra parte, altri metodi di campionamento) un metodo valido per il campionamento in medicina; essa offre due vantaggi:

Ovviamente vi sono situazioni in cui il campionamento per randomizzazione semplice risulta poco pratico se non addirittura inapplicabile. Infatti, il principale svantaggio quello di richiedere la preventiva numerazione di tutti i soggetti; successivamente necessario individuare nella popolazione quelli corrispondenti ai numeri estratti. La scarsa applicabilit di questo metodo pu essere ben evidenziata con un esempio.

esempio: supponiamo di voler controllare il tempo di disaggregazione di un campione di 100 compresse da estrarre con randomizzazione semplice da un lotto di 4000 compresse. La procedura richieder la numerazione da 1 a 4000 di tutte le compresse (per esempio con una matita), l'estrazione dei 100 numeri casuali e la selezione delle 100 compresse corrispondenti. Queste operazioni necessitano di risorse preziose e costose quali tempo e mano d'opera e nella pratica non sono applicabili. Il campionamento per randomizzazione semplice di facile applicazione quando si dispone di una popolazione gi numerata e composta di un numero non elevato di unit. Nel campionamento per randomizzazione sistematica le n unit che costituiranno il campione sono scelte dalla popolazione ad intervalli regolari: per esempio, in un reparto ospedaliero si potr scegliere un soggetto ogni 4 degenti. Questo metodo pi pratico rispetto alla randomizzazione semplice, ed assicura anche che le singole unit del campione siano distribuite uniformemente all'interno della popolazione. Occorre tuttavia porre attenzione che l'intervallo di campionamento prescelto non sia influenzato da qualche variabile esterna che agisce con la stessa ciclicit del campionamento. esempio: si vuole stimare il livello di contaminazione batterica di un reparto di inflaconamento, ed in particolare osservare se esso subisce variazioni nel tempo. Procediamo quindi al prelievo di materiali diversi (tamponi da filtri dell'aria, dai pavimenti, dalle macchine, ecc.) attraverso randomizzazione sistematica effettuata per due settimane in base al giorno della settimana: i prelievi vengono fatti i giorni dispari: luned, mercoled e venerd. Tuttavia, nel reparto ogni sabato viene effettuata un'operazione di pulizia e disinfezione particolarmente energica. Pertanto, il campione costituito dai tamponi del luned non rappresentativo. campionamento per randomizzazione stratificata Il campionamento per randomizzazione stratificata trova applicazione quando si studia un carattere che, presumibilmente o notoriamente, influenzato da un certo fattore presente nella popolazione. In pratica, prima di effettuare l'estrazione del campione la popolazione viene suddivisa in strati basati sul fattore che influenza il livello del carattere da studiare. Quindi, all'interno di ciascuno strato si sceglie un campione con il metodo della randomizzazione semplice o sistematica.

Il campionamento con randomizzazione stratificata pi flessibile di quello eseguito con

randomizzazione semplice in quanto nei diversi strati pu essere scelta una percentuale differente (es. 10% in uno strato, 5% in un altro ecc.). Lo svantaggio del campionamento stratificato che lo stato di tutte le unit di campionamento, rispetto ai fattori su cui basata la stratificazione, deve essere noto prima di scegliere il campione. esempio: supponiamo di voler studiare, dopo un anno dal suo inserimento nel mercato farmaceutico, la penetrazione presso la classe medica di un farmaco A concorrente di un noto farmaco B. Lo studio, effettuato in una grande citt, mostra che la diffusione di B (da pi tempo sul mercato e di buona efficacia) superiore rispetto ad A. Supponiamo inoltre di conoscere che il rapporto numerico fra le farmacie "di quartiere" (dove la clientela quasi sempre la stessa) e "di passaggio" (situate in zone centrali o vie discretamente trafficate, dove il fruitore anche occasionale) sia 9/1 ; allora, dovremo scegliere un campione di farmacie in due "strati" che rispettino la proporzione esistente nel mercato: un campione di 50 farmacie composto da 45 farmacie di quartiere e 5 farmacie di passaggio. Il campionamento dovrebbe essere effettuato direttamente presso i grossisti, in quanto possono fornire il rendiconto della consistenza degli ordini effettuati dalle 50 farmacie scelte. Il dato ricavato dovrebbe permettere una prima risposta al problema: cosa hanno di particolare le farmacie dove si concentra la maggior parte delle prescrizioni di A? Sono "farmacie di quartiere", oppure "farmacie di passaggio"? primo caso: la maggior parte delle prescrizioni si concentra in farmacie di quartiere. Questo significa che l'informazione presso la classe medica per il nuovo farmaco, A, non capillare (l'informazione stata recepita da pochi medici) ed occorre aumentare il numero di informatori o la frequenza delle interviste. secondo caso: le prescrizioni sono equamente distribuite fra le due tipologie di farmacie. Questo significa che gli informatori intervistano medici omogeneamente distribuiti nelle varie parti della citt. D'altra parte, poich le prescrizioni di A sono minori di quelle di B, il "problema" dovr essere affrontato con una diversa impostazione: per esempio, associare la prescrizione di A ad una specifica indicazione terapeutica meno ricordata dal farmaco B; verificare il numero di informatori e la ciclicit delle interviste al medico rispetto alla concorrenza. Marcello Guidotti, copyright 2003-2005-2007 questa pagina pu essere riprodotta su qualsiasi supporto o rivista purch sia citata la fonte e l'indirizzo di questo sito (ai sensi degli artt. 2575 e 2576 cc. Legislazione sul diritto d'autore). Le fotografie sono tratte da siti web e sono, o possono ritenersi, di pubblico dominio purch utilizzate senza fini di lucro. Le immagini di prodotti presenti nel sito hanno unicamente valenza esemplificativa oltre che, eventualmente, illustrare messaggi fuorvianti e non vi alcun richiamo diretto o indiretto alla loro qualit e/o efficacia il cui controllo affidato alle autorit regolamentatorie. galenotech.org

statistica inferenziale: errori di campionamento galenotech.org In sintesi, i fattori responsabili della generazione di un errore di campionamento sono riconducibili a La variazione casuale dovuta al caso, cio ad un insieme di cause, piccole o grandi, che agiscono imprevedibilmente su un fenomeno senza che noi possiamo contrastarne l'azione. La variazione casuale ha sottoposto alla nostra osservazione gli individui che costituiscono il campione, per il quale la misura che vogliamo studiare assume un valore pi alto o pi basso, senza una regola precisa. Tutti noi ricorriamo al "caso" per giustificare, ad esempio, il motivo per cui su 100 lanci di una stessa moneta non sempre esce per 50 volte "testa" e per le restanti 50 "croce". Questo stesso motivo (la variazione casuale) vale a giustificare il seguente esempio. Supponiamo di avere a disposizione due farmaci, A e B, ugualmente efficaci per una determinata sintomatologia, nel senso che guariscono il 50% dei pazienti trattati. Ci proponiamo di fare una nuova sperimentazione per confermare l'efficacia dei due farmaci. Ammettiamo che, in questo esperimento, non sia presente alcun bias (distorsione: differenza, causata da un errore sistematico, tra la stima ottenuta da un campione e la vera caratteristica della popolazione, e quindi che i dati ottenuti siano assolutamente affidabili). Tuttavia, se l'esperimento prevede di esaminare un numero limitato di soggetti per ciascuno dei due trattamenti, pu facilmente capitare di osservare che il farmaco A induce guarigione con maggior frequenza rispetto al farmaco B (o viceversa). Questo effetto dovuto, appunto, alla variazione casuale. osservazione Ovviamente, l'errore di campionamento condizionato dall'esistenza di variabilit tra gli individui che compongono la popolazione di partenza; se tutti - per assurdo - avessero lo stesso carattere in egual misura, l'esame di qualsiasi numero di individui fornirebbe lo stesso valore, e quindi l'errore di campionamento sarebbe nullo. La selezione viziata quella che viene effettuata su un segmento non rappresentativo della popolazione. Questo avviene quando la scelta delle unit che costituiranno il campione viene effettuata con regole non rigorosamente causali. Talvolta, lo stesso sperimentatore che, definendo delle regole estemporanee volte a neutralizzare - nelle intenzioni - gli effetti del caso e di ottenere un campione pi aderente alla popolazione, commette un errore che rende i dati inutilizzabili. Infatti, un campione che non stato ottenuto correttamente fornisce misurazioni e risultati per i quali impossibile calcolare il cosiddetto "errore di campionamento".

esempio 1: vogliamo accertare la proporzione di persone che si curano con preparati omeopatici in una determinata citt. Non potendo esaminare tutti gli individui della citt considerata, decidiamo di esaminare un campione di persone. Per comodit, scegliamo le persone che si servono presso le farmacie provviste anche di prodotti omeopatici. Il campione cos ottenuto sar sicuramente composto proprio da molte di quelle persone che assumono preparati omeopatici. Il nostro campione sar biassato perch (1) ha selezionato persone che preferiscono la medicina omeopatica, e (2) ha selezionato persone che si servono in Farmacie omeopatiche. Presumibilmente, una maggior quantit di individui del nostro campione risulter privilegiare il trattamento omeopatico e dunque potremmo erroneamente concludere che "moltissime persone non ricorrono alle terapie tradizionali". esempio 2: il campione prelevato con una biopsia epatica rappresenta circa 1/50.000 dell'organo. Essendo il campione cos piccolo rispetto all'intero organo, esiste la possibilit di ampie variazioni da un campione all'altro. Inoltre, poich il campione viene esaminato, in genere, allo scopo di diagnosticare una malattia dell'intero fegato, possibile che il processo di inferenza sia viziato. Ad esempio, si preleva un campione di tessuto sano in un organo ammalato. osservazione In conclusione, si pu affermare che soltanto quando la scelta degli individui che compongono il campione stata dettata dal puro e semplice caso, possibile prevedere e calcolare l'entit della differenza tra campione e popolazione. In caso contrario, il campione si dice "distorto" o "biassato". Con un campione distorto, non possibile calcolare l'errore di campionamento ed i dati ottenuti saranno difficilmente utilizzabili. Pi precisamente, per "bias" si intende un processo, effettuato in qualsiasi stadio della inferenza, che tende a fornire risultati che si discostano sistematicamente dai valori veri. A differenza del bias (che influenza i dati sistematicamente in una direzione o nell'altra), la variazione casuale fornisce dati che possono essere parimenti al di sopra o al di sotto del valore vero. Di conseguenza, la media di molte osservazioni non-biassate si avvicina al valore vero della popolazione, anche se i singoli dati utilizzati per ottenere la media possono discostarsi di molto dal valore vero. esampio: nel disegno in basso, sono raffigurati due bersagli:

colpi sparati da due revolver differenti bersaglio a sinistra: mostra la rosata dei fori prodotti da 10 proiettili sparati da un esperto tiratore che ha usato un revolver con il mirino ben regolato. L'insieme dei fori si pu considerare come un campione delle infinite possibili combinazioni di 10 colpi che

quel tiratore pu ottenere sparando con il suo revolver. Come si vede, i fori hanno una disposizione casuale (dovuta alle piccole differenze esistenti tra i proiettili ed a piccole oscillazioni del braccio) ma tendono a disporsi attorno al centro del bersaglio. bersaglio a destra: mostra la rosata dei fori prodotti da 10 proiettili sparati dallo stesso tiratore che per ha usato un revolver con il mirino non ben regolato. Anche in questo caso, i fori hanno una disposizione casuale, ma tendono ugualmente a disporsi attorno ad un punto che non corrisponde al centro del bersaglio. Supponiamo (figura sotto) di non conoscere la posizione del centro bersaglio (che, fuor di metafora, corrisponde alla VERA caratteristica della popolazione in studio, la quale in effetti non mai nota).

colpi sparati da due fucili differenti Con un buon campionamento (che equivale ad un revolver ben regolato) otterremo il campione raffigurato a sinistra; se, invece, il campione sar affetto da bias, otterremo un campione come quello a destra. Ora, in base ai dati ottenuti dalla figura sopra, proviamo a fare una inferenza sulla vera caratteristica della popolazione (figura in basso).

colpi sparati da due fucili differenti E' facile convincersi che, se utilizzeremo il campione di sinistra (cio quello del revolver ben regolato) l'inferenza sar ragionevolmente accurata, mentre con il campione affetto da bias (a destra), saremo indotti a ritenere che il centro del bersaglio sia spostato rispetto al reale. In quest'ultimo caso, fuor di metafora, non riusciremo a stimare correttamente la vera caratteristica della popolazione: commetteremo un errore. Marcello Guidotti, copyright 2003 questa pagina pu essere riprodotta su qualsiasi supporto o rivista purch sia citata la fonte e l'indirizzo di questo sito (ai sensi degli artt. 2575 e 2576 cc. Legislazione sul diritto d'autore). Le fotografie sono tratte da siti web e sono, o possono ritenersi, di pubblico dominio purch utilizzate senza fini di lucro. Le immagini di prodotti presenti nel sito hanno unicamente valenza esemplificativa oltre che, eventualmente, illustrare messaggi fuorvianti e non vi alcun richiamo diretto o indiretto alla loro qualit e/o efficacia il cui controllo affidato alle

Campionamento quadernodiepidemiologia.it

specificare i motivi che inducono - od obbligano - ad esaminare un campione piuttosto che la popolazione in toto individuare i principali obiettivi di un campionamento Raramente in uno studio epidemiologico possibile esaminare ogni singolo animale della popolazione. Infatti spesso si limitati dalle risorse disponibili (economiche, di personale, di laboratori, di tempo ecc.); in altre occasioni, anche supponendo di disporre di risorse illimitate, l'intera popolazione da studiare non fisicamente raggiungibile oppure non del tutto nota . Pensa, ad esempio, ad una indagine epidemiologica da effettuare su animali selvatici di una certa specie (es. camosci) in un parco: probabilmente non sar conosciuto con esattezza il numero degli animali presenti, n il rapporto maschi/femmine n la distribuzione per et ecc.. In altri casi, il numero di individui che compongono la popolazione da studiare talmente elevato che lo studio di ognuno di essi fattibile solo teoricamente. Pensa, ad esempio, alle api di un alveare o ai pesci presenti un laghetto di allevamento. Infine, possibile trovarsi di fronte ad una combinazione delle suddette difficolt, come ad esempio nel caso si volessero studiare gli insetti vettori di una determinata malattia in una determinata zona. Talvolta, soprattutto nel lavoro di ricerca medica, la popolazione addirittura infinita o, meglio, indeterminata in quanto non conoscibile in modo esaustivo, neppure virtualmente. ESEMPIO. Una popolazione indeterminata rappresentata da tutti gli animali che, oggi e in futuro, necessiteranno di una particolare terapia, oppure dall'insieme delle concentrazioni di mercurio misurabili in tempi diversi in un lago). L'esame di un campione, ossia di un numero ridotto di osservazioni, invece dell'intera popolazione consente di superare i problemi ora accennati. Un campione non altro che un insieme di elementi tratti da una popolazione (o "universo"). Un universo consiste della totalit degli elementi che hanno certe caratteristiche. Il campione soltanto una parte del tutto.

Epidemiologia veterinaria: campionamento

Scegliere un campione da una popolazione significa effettuare un campionamento. Esaminare ogni singolo individuo della popolazione significa effettuare un censimento; esaminare gli animali di un campione significa effettuare una indagine (o inchiesta o sondaggio, in inglese survey).

Epidemiologia veterinaria: campionamento Per una serie di motivi, raramente possono essere studiate tutte le unit che compongono una popolazione. Pertanto, si studia soltanto una parte pi o meno grande della popolazione, per poi generalizzare all'intera popolazione i risultati ottenuti. Questo processo di generalizzazione dei risultati ottenuti studiando un campione detto inferenza:

Epidemiologia veterinaria: campionamento ESEMPIO. Un farmacologo somministra un farmaco a 30 cani con una certa malattia, mentre somministra semplice soluzione fisiologica ad altri 30 cani (i controlli). Dopo una settimana guarito il 25% degli animali trattati con il farmaco ed il 19% dei controlli. Questo risultato stato ottenuto su un campione di animali, e non implica necessariamente che il farmaco sia efficace; infatti, lo stesso esperimento condotto su altri animali potrebbe portare a risultati diversi. Non c' dubbio che sugli animali del campione il farmaco ha funzionato meglio del placebo. Per non puoi essere sicuro che il farmaco funzioner anche sulla popolazione di tutti i cani affetti da quella malattia. Le ipotesi sono due: il farmaco funziona oppure il farmaco non funziona. Quale ipotesi scegliere? Qui viene in aiuto la statistica: attraverso un processo di inferenza basato su metodi statistici (statistica inferenziale) si pu stimare con obiettivit l'efficacia del farmaco sulla popolazione in generale, a partire dai risultati ottenuti studiando un campione. Alcuni principi di base della statistica inferenziale sono stati trattati nel Capitolo 5; altri verranno trattati pi avanti in questo stesso capitolo.

NELLA PROSSIMA UNIT: si spiega perch non possibile ottenere un campione perfetto e si introduce il concetto di errore di campionamento. quadernodiepidemiologia.it

Caratteri del campione quadernodiepidemiologia.it analizzare i caratteri del campione e spiegare perch non esiste il campione perfetto intuitivo che da una popolazione possono essere estratti moltissimi campioni, che probabilmente saranno tutti diversi fra loro:

Epidemiologia veterinaria: caratteri del campione altrettanto intuitivo che le caratteristiche di un campione non saranno mai perfettamente identiche a quelle della popolazione. Il campione non sar mai la fotocopia precisa della popolazione di origine. Quindi, se studi un campione allo scopo di effettuare una inferenza sulla popolazione, giungerai inevitabilmente a conclusioni non del tutto veritiere. In questa unit, e nelle successive, imparerai come ovviare a questo inconveniente. Immagina di aver effettuato una indagine su un campione; in pratica, hai misurato un certo carattere in ciascuna delle unit del campione. Ora vuoi utilizzarev i tuoi dati per trarre delle conclusioni. Ti devi porre due domande fondamentali:

Epidemiologia veterinaria: caratteri del campione La risposta a queste due domande genera i concetti di validit interna e di validit esterna di uno studio epidemiologico eseguito su un campione (studio campionario).

La validit interna misura quanto i risultati di uno studio sono corretti per il campione di individui che sono stati studiati. Essa viene detta interna perch si applica al campione, e non necessariamente agli altri individui della popolazione. Forse questo concetto ti potr sembrare una sottigliezza inutile. Per devi pensare che non sempre si tratta di fare misurazioni facili, semplici ed affidabili (come ad esempio pesare ratti da laboratorio). In molti casi, le cose sono pi complicate: negli studi clinici, la validit interna dipende dalla correttezza di impostazione dello studio stesso, dalla scelta di buone tecniche diagnostiche e da un loro corretto utilizzo, da una buona elaborazione dei dati ecc. Nel caso dei dati ottenuti attraverso questionari, un fattore che contribuisce ad abbassare la validit interna rappresentato dalla propensione degli intervistati a mentire sistematicamente su determinate domande, come illustrato nell'esempio che segue. ESEMPIO. Effettui un sondaggio per conoscere la percentuale di cani che vengono sottoposti a vaccinazione periodica nei confronti della leptospirosi; a questo scopo, sottoponi ai proprietari dei cani la seguente domanda: Lei fa vaccinare annualmente il suo cane per la leptospirosi?. Prevedibilmente i proprietari che hanno cura del loro cane (e che lo vaccinano regolarmente) saranno ben felici di rivelare il loro comportamento virtuoso e quindi risponderanno correttamente con un "s". Al contrario, molti di coloro che omettono di vaccinare il cane non saranno disposti ad ammetterlo, per non apparire egoisti o avari, e quindi tenderanno a mentire, rispondendo anch'essi con un "s". Ci evidentemente far diminuire la validit interna del campione. La validit esterna il grado di generalizzabilit delle conclusioni tratte da uno studio. Ad esempio, nel caso di uno studio epidemiologico clinico, essa risponde alla domanda "Supponendo che i risultati dello studio siano veri, essi si applicano anche ai miei pazienti?". In altre parole, la validit esterna misura il grado di verit dell'assunto secondo cui gli animali studiati sono "uguali" ad altri animali affetti dalla stessa condizione. Per semplicit, assumiamo ora che lo studio sia provvisto di ottima validit interna; ci significa che conosciamo con esattezza le caratteristiche del campione che abbiamo esaminato. Le conclusioni che ne abbiamo tratto sono certamente valide per gli individui del campione, ma non possiamo dire se e quanto tali conclusioni siano generalizzabili alla popolazione da cui il campione stato estratto. La soluzione a questo problema verr accennata nelle unit successive (metodi di campionamento, limiti fiduciali, ecc.). Ovviamente, le conclusioni ottenute attraverso uno studio campionario sono valide soltanto se esiste una buona validit interna ed esterna. Nella figura seguente viene schematizzato il flusso del ragionamento riguardo alla validit interna ed esterna di un campione, al fine di giungere a conclusioni affidabili.

Epidemiologia veterinaria: validit di un campione ESEMPIO 1. Vogliamo conoscere il peso di un gruppo di 600 suini pronti per la macellazione. Non abbiamo la possibilit di pesare tutti i 600 animali; quindi, estraiamo un campione di 6 soggetti, li pesiamo e calcoliamo la media. evidente che, con questo metodo, avremo un valore che si potr scostare anche di parecchi chili dalla media della 'popolazione' da cui essi provengono (cio il gruppo di 600). Ma se misuriamo altri individui e li aggiungiamo ai primi, la nuova media ottenuta sar pi vicina a quella vera; cio, la precisione della nostra misura aumenter parallelamente all'aumento del numero di animali pesati. Tuttavia, non otterremo una misura perfetta finch non avremo pesato tutti i suini. ESEMPIO 2. Abbiamo il compito di effettuare un'indagine sui rapporti fra mastite della bovina e produzione di latte. Nel territorio sono presenti, in pianura, 14 grandi allevamenti, per un totale di 2900 bovine adulte da latte; nella zona montagnosa, vi sono invece 36 piccoli allevamenti (300 animali in totale). La popolazione di interesse : tutte le bovine da latte. L' unit di analisi la singola bovina da latte. Le nostre risorse ci consentono di esaminare un campione di 300 animali. Se tutti gli animali verranno selezionati dagli allevamenti della pianura, avremo un campione non rappresentativo. Un campione pi rappresentativo sar invece rappresentato dal 90% circa di bovine degli allevamenti di pianura e dal 10% di vacche di montagna.

In sostanza, con qualunque metodo si effettui il campionamento, si otterranno dal campione dei risultati che quasi certamente si discostano (poco o tanto) dalla vera misura della popolazione. ben vero che il campione dovrebbe rappresentare una immagine della popolazione ridotta dal punto di vista numerico ma fedele dal punto di vista qualitativo. Tuttavia, non possiamo mai essere sicuri che il campione rappresenti una copia perfetta della popolazione da cui esso stato estratto, a meno di non esaminare... l'intera popolazione! L'errore di campionamento rappresentato dalla differenza tra i risultati ottenuti dal campione e la vera caratteristica della popolazione che vogliamo stimare. L'errore di campionamento non pu mai essere determinato con esattezza, in quanto la vera caratteristica della popolazione (e rester!) ignota. Esso tuttavia pu essere contenuto entro limiti pi o meno ristretti adottando appropriati metodi di campionamento. Inoltre, esso pu essere stimato; ci significa che, con adatti metodi statistici, si possono determinare i limiti probabili della sua entit. NELLA PROSSIMA UNIT: si prendono in considerazione i fattori che contribuiscono all'errore di campionamento; si parla anche della selezione viziata e dell'effetto del caso. quadernodiepidemiologia.it

Errore di campionamento quadernodiepidemiologia.it

Quaderno di Epidemiologia

Abbiamo gi visto che un campione non mai perfettamente rappresentativo della popolazione da cui stato estratto. Ci implica che, ogni qual volta studiamo un campione, otteniamo dati che non rispecchiano la realt: dobbiamo tener conto di un errore di campionamento. I fattori responsabili dell'errore di campionamento sono sostanzialmente due: la variazione casuale e la selezione viziata.

Errore di campionamento La variazione casuale dovuta al caso, cio a quell'insieme di fattori o cause, piccole o grandi, che agiscono su un fenomeno senza che noi possiamo o vogliamo controllarli esattamente e prevederne quindi l'azione (Cavalli-Sforza). La variazione casuale ha portato alla nostra osservazione proprio quegli individui che costituiscono quel campione, nei quali la misura che vogliamo studiare assume un valore pi alto o pi basso, senza una regola precisa. La variazione casuale fa s che una misura effettuata su un campione non fornisca un valore identico a quello ottenibile misurando l'intera popolazione: c' sempre - un certo errore, che viene detto errore campionario. Questo errore deriva semplicemente dal fatto che stiamo osservando soltanto una parte della popolazione. Ovviamente, l'errore di campionamento condizionato dall'esistenza di variabilit tra gli individui che compongono la popolazione di partenza; se tutti - per assurdo - avessero lo stesso carattere in egual misura, l'esame di qualsiasi numero di individui fornirebbe lo stesso

valore, e quindi l'errore di campionamento sarebbe nullo. La selezione viziata quella che viene effettuata su un segmento non rappresentativo della popolazione. Questo avviene quando la scelta delle unit che costituiranno il campione viene effettuata con regole non rigorosamente causali. Talvolta, lo stesso sperimentatore che, definendo delle regole estemporanee volte a neutralizzare - nelle intenzioni - gli effetti del caso e di ottenere un campione pi aderente alla popolazione, commette un errore che rende i dati inutilizzabili. Infatti, un campione che non stato ottenuto correttamente fornisce misurazioni e risultati per i quali impossibile calcolare il cosiddetto errore di campionamento. La selezione viziata fa s che all'errore campionario si sommi un altro tipo di errore, detto errore non campionario o bias.

Errore di campionamento ESEMPIO 1. Vogliamo accertare la proporzione di cani vaccinati contro il cimurro in una provincia. Non potendo esaminare tutti i cani dell'area considerata, decidi di esaminare un campione di animali. Per comodit, scegli i cani che vengono presentati presso alcuni ambulatori del capoluogo. Il campione cos ottenuto sar sicuramente distorto (affetto da "bias"), in quanto composto quasi esclusivamente da cani "cittadini" che, notoriamente, sono oggetto di maggiori cure da parte del proprietario rispetto a quelli che risiedono in campagna. Inoltre, anche il fatto stesso che il cane venga portato in ambulatorio testimonia l'attenzione da parte del proprietario verso la salute del suo animale, ed probabile che questa attenzione si sia tradotta in una corretta profilassi vaccinale. Infatti, ovvio che i cani trascurati non vengono vaccinati n vengono portati dal veterinario! Quindi, il tuo campione sar distorto perch (1) hai selezionato cani cittadini e (2) hai selezionato cani portati in ambulatorio. Presumibilmente, tutti i cani del tuo campione (distorto!) risulteranno vaccinati per il cimurro e quindi sarai portato a concludere erroneamente che "tutti i cani della provincia sono vaccinati per il cimurro". ESEMPIO 2. Il frammento prelevato con una biopsia epatica rappresenta circa 1/50000 dell'organo. Essendo il campione cos piccolo rispetto all'intero organo, esiste la possibilit di ampie variazioni da un campione all'altro. Inoltre, poich il frammento viene esaminato, in genere, allo scopo di diagnosticare una malattia dell'intero fegato, esiste la possibilit che il processo di inferenza sia viziato. Ad esempio, si preleva un campione di tessuto sano in un organo ammalato. In conclusione, si pu affermare che soltanto quando la scelta degli individui che compongono il campione stata dettata dal puro e semplice caso, possibile prevedere e calcolare l'entit della differenza tra campione e popolazione. In caso contrario, il campione si dice distorto. Con un campione distorto, non possibile

calcolare l'errore di campionamento ed i dati ottenuti saranno difficilmente utilizzabili.

Errore di campionamento Pi precisamente, per bias si intende "un processo, effettuato in qualsiasi stadio della inferenza, che tende a fornire risultati che si discostano sistematicamente (ossia sempre nella stessa direzione) dai valori veri". Epidemiologia veterinaria: errore di campionamento ESEMPIO. Nello schema A (a lato) sono raffigurati due bersagli. Quello a sinistra (A1) il risultato di 17 tiri effettuati da un buon tiratore che ha sparato con un buon fucile. L'insieme dei fori si pu considerare come un campione delle infinite possibili combinazioni di 17 tiri che quel tiratore pu ottenere sparando con quel fucile. Come vedi, i fori hanno una disposizione casuale, ma tendono a disporsi attorno al centro del bersaglio. Il bersaglio di destra (A2) stato utilizzato dallo stesso tiratore, ma con un fucile con il mirino disallineato. Anche in questo caso, i fori hanno una disposizione casuale, ma tendono a disporsi attorno ad un punto che NON corrisponde al centro del bersaglio. Epidemiologia veterinaria: errore di campionamento Ora supponi (schema B) di non conoscere la vera posizione del centro bersaglio (la quale, fuor di metafora, equivale alla VERA caratteristica della popolazione in studio, la quale in effetti non mai nota). Supponi anche di estrarre a caso un campione di 17 colpi dagli infiniti campioni possibili. Con un buon campionamento (che equivale ad un buon fucile) otterrai il campione raffigurato a sinistra (B1); se, invece, il campione sar affetto da bias, otterrai un campione come quello a destra (B2). Ora, sempre in base ai dati dello schema B, prova ad "inferire" (ossia ad indovinare) la posizione del centro del bersaglio. Epidemiologia veterinaria: errore di campionamento Ragionevolmente collocherai i bersagli come indicato nello schema C: con il campione di colpi di sinistra (C1) (cio quello del fucile preciso) l'inferenza sar attendibile, come dimostra la corretta collocazione del centro del bersaglio rispetto alla realt (cos come raffigurato in A1). Al contrario, utilizzando il campione distorto (C2), sarai indotto a ritenere che il centro del bersaglio sia spostato rispetto al reale e non riuscirai a posizionarlo correttamente. In quest'ultimo caso, fuor di metafora,

non sarai in grado di stimare correttamente la vera caratteristica della popolazione. NELLA PROSSIMA UNIT: si elencano cinque fra i metodi di campionamento pi comunemente impiegati nelle indagini epidemiologiche; si fornisce anche una definizione generale di buon campione. quadernodiepidemiologia.it

Metodi di campionamento quadernodiepidemiologia.it

descrivere la logica di un buon campionamento ed elencare alcuni dei pi comuni metodi di campionamento Il principio informatore generale di un buon campionamento prevede di utilizzare lo stesso principio dell'estrazione a sorte, ossia quello della casualit assoluta, in modo tale che ciascuna unit della popolazione abbia la stessa probabilit di entrare a far parte del campione. In tal caso il campione viene detto randomizzato o casuale. Affidandosi al caso si ottiene, in una qualche misura, la garanzia che il campione sar rappresentativo della popolazione stessa, ossia ne rifletter le caratteristiche con una certa approssimazione.

Epidemiologia veterinaria: metodi di campionamento Immagina di avere una lista di 100000 animali, e che una met di questi siano maschi e l'altra met siano femmine. La teoria statistica delle probabilit dice in anticipo che, se estrarrai in modo casuale mille soggetti dalla lista, otterrai un campione composto per met da maschi e per met da femmine, con un livello di approssimazione prevedibile a priori. Analogamente, supponi di ripetere molte volte il lancio di una moneta. L'evento "testa" o "croce" condizionato soltanto dal caso: le prime volte potr uscire sempre "testa" (oppure sempre "croce"), ma alla lunga la proporzione di teste e croci nella "popolazione" di lanci tender ad equilibrarsi. Un campionamento randomizzato offre il vantaggio di fornire un campione privo di errori sistematici (bias) e consente di accertare l'attendibilit dei risultati o, per meglio dire, i rapporti fra i risultati forniti dal campione e la vera caratteristica della popolazione. Nelle unit successive verranno illustrati brevemente cinque fra i pi comuni metodi di campionamento. Di essi, uno un metodo non probabilistico, mentre i restanti 4 sono basati sulla randomizzazione:

Epidemiologia veterinaria: metodi di campionamento NELLA PROSSIMA UNIT: si prende in considerazione il metodo di campionamento non probabilistico e se ne esaminano pregi e difetti. quadernodiepidemiologia.it Archive All Download Newest