Sei sulla pagina 1di 13

Il Campionamento

Al fine di studiare le caratteristiche di una popolazione target quasi impensabile


pretendere di indagare ciascun elemento e, per non rinunciare allobiettivo iniziale, la
soluzione pi logica quella di procedere al campionamento.
Si parla di campionamento per indicare il procedimento di individuazione del
campione, cio di un insieme di osservazioni rappresentativo della popolazione.

Popolazione target

Totalit di elementi che godono di determinate caratteristiche e ai quali si


desidera estendere i risultati delle analisi .

Campione

una parte limitata della popolazione target, selezionata per condurre delle
analisi. Generalmente si distingue tra campioni probabilistici e nonprobabilistici a seconda che nelle selezione si tanga conto o meno della
probabilit che ciascun elemento appartenga al campione. importante che
risulti rappresentativo. Un campione rappresentativo quello in cui la
distribuzione degli individui rispetto al criterio scelto molto simile alla
distribuzione della intera popolazione rispetto allo stesso criterio.

Come dimostra la vita di ogni giorno, il ricorso al campionamento molto pi


frequente di quanto non si possa pensare, soprattutto quando si ha a che fare con
insiemi di grandi dimensioni; in tal caso, indagare per campioni appare una necessit.
Cosa pensate che siano gli esami, se non forme di campionamento? I professori
testano il grado di preparazione degli allievi attraverso domande relative ad alcuni
argomenti del programma: sarebbe impossibile verificare che tutto sia stato studiato
correttamente!
Cos anche, lidea che abbiamo di molti conoscenti, spesso, si basa su osservazioni
occasionali che abbiamo modo di registrare nei vari incontri e, raramente, sulla
frequenza assidua del soggetto.
Si possono riportare mille altri esempi del genere e, quindi, desumere che luso di
campioni diffuso oltre che necessario.
necessario se si pensa al ricorso a tecniche distruttive per il controllo della qualit
nelle produzioni industriali: vero che la soddisfazione del cliente da anteporre a
tutto, ma come potremo soddisfarlo se distruggiamo ogni prodotto?
Alla necessit si accompagna la convenienza: lindagine a campione molto pi
rapida ed economica di un eventuale possibile censimento della popolazione, o
rilevazione esaustiva, in quanto riguarda solo una piccola frazione della totalit degli
elementi.

Perch ricorrere al
campionamento?

I campioni, spesso, sono di numerosit inferiore all1% della popolazione target,


quasi sempre inferiori al 5%; in ogni caso, anche qualora si dovessero raggiungere
dimensioni del campione notevolmente superiori a quelle usuali, non verrebbe meno il
vantaggio derivante dal ridimensionamento del numero di elementi da gestire.
Dimensioni minori comportano meno richiesta di manodopera, minori costi di
processamento e, ovviamente, minore tempo; e, anche se il risparmio di tempo non
risulta proporzionale alla diminuzione di unit, dati i tempi fissi di setup, si sa che il
tempo denaro!

Censimento

Il censimento lesempio pi classico di rilevazione totale, che prende cio


in considerazione tutte le unit dellinsieme di riferimento, tanto che
lespressione "censimento incompleto" usato da taluni per indicare
linsuccesso nella rilevazione di tutte le unit della popolazione.

Oltretutto, opportuno notare che per i censimenti sono necessari tempi lunghi sia
nella fase di raccolta che in quella di elaborazione dei dati; pu, quindi, accadere che i
risultati ottenuti in un grande arco di tempo non siano pi attendibili data la grande
rapidit con cui mutano le caratteristiche della societ contemporanea.

Le indagini campionarie sono preferibili a quelle complete nei casi


indicati di seguito:
a)
b)
c)

d)

e)

quando le rilevazioni di tutte le unit della popolazione da


analizzare comportano costi elevati;
quando i risultati della ricerca devono essere forniti in tempi
brevi;
quando la rilevazione, misurazione e controllo delle informazioni
comporta la distruzione delle unit esaminate, come nel
controllo statistico di qualit della produzione (valutazione della
vita media di una lampadina elettrica o dellaffidabilit di un
dato componente, giudizio su di un prodotto alimentare);
nelle prove di mercato di un prodotto, quando esse non si
possono svolgere sullintero mercato, per motivi di
riservatezza verso la concorrenza o per incompleta definizione
di alcune variabili di marketing;
quando la popolazione di dimensione infinita o unentit
astratta (ad esempio la popolazione dei prezzi di un certo
prodotto nel tempo).

Nei casi c), d), e), lindagine campionaria diventa lunica via praticabile
per la rilevazione delle informazioni che interessano.

ri sistematici

Inoltre, auspicabile scostarsi dalla diffusa convinzione che i dati raccolti mediante
rilevazioni complete siano assolutamente pi rappresentativi dei dati ottenuti con
metodologie campionarie.

Lerrore di osservazione nelle rilevazioni complete altrettanto


importante o forse pi importante che nelle rilevazioni parziali; e mi riferisco
allidea erronea ma ancora molto diffusa tra gli utilizzatori,che i risultati di un
censimento siano assolutamente esatti,o comunque pi esatti di quelli forniti
da indagini per campione. La circostanza che i risultati di un campionamento
siano affetti da un errore probabilistico dovuto alla natura parziale della
rilevazione non pu e non deve far concludere che i risultati censuari siano
di qualit superiore; questi ultimi, in realt, sono ottenuti sotto il dominio
delle stesse cause di errore e possono contenere deformazioni
sistematiche almeno dello stesso ordine di grandezza. Anzi, nelle indagini
per campione molte fonti di errore possono essere tenute sotto
controllo Pu accadere, quindi, che un ampliamento della numerosit del
campione accresca lentit delle deformazioni sistematiche; ci induce a
sospettare che il massimo errore si registri proprio nei censimenti e che
quindi unindagine campionaria sia atta a fornire risultati anche pi precisi
dei censimenti stessi, specialmente allorch lerrore probabilistico possa
ritenersi di scarsa rilevanza. (Giusti)

Qualsiasi rilevazione , infatti, soggetta ad errori e ci non deve allarmare!


Se, infatti, si portati ad associare alla parola errore, uno sbaglio o una gaffe, nel
gergo statistico non necessariamente si intende ci.
L'errore statistico da interpretarsi come una discrepanza attesa tra valore osservato
e valore vero. Rappresenta un'informazione sulla qualit dell'indagine, dove con il
termine qualit si intende l'attendibilit, cio laccuratezza delle stime, e, quindi, il
raggiungimento degli obiettivi.
In particolare, nel campionamento, di distingue tra errori casuali ed errori
sistematici.
Gli errori casuali sono legati alla variabilit intrinseca della popolazione osservata,
ovvero dalle fluttuazioni casuali del campione. sono legati al fatto che la variet di
chance di scelta comporter, quasi sicuramente, che un campione differir da un altro
anche qualora entrambi fossero estratti dalla stessa popolazione target, nello stesso
modo casuale: un risultato della selezione casuale! Tali errori possono essere stimati
e opportunamente controllati e ridotti, per esempio, aumentando la numerosit del
campione.
Gli errori sistematici, invece, si ripetono nello stesso modo in ogni osservazione;
possono essere legati a gaffe o sbagli grossolani e sono di pi difficile rilevazione.
Tali errori possono verificarsi, in indagini totali o campionarie, e dipendono da fattori
relativi al piano di campionamento e, quindi, al metodo di rilevamento utilizzato,
oltre che alle tecniche impiegate.

Lerrore statistico

Errori casuali

Per esempio, si possono registrare distorsioni sistematiche in indagini condotte


mediante questionari concepiti in modo da orientare, anche involontariamente, gli
intervistati verso determinate risposte, o in indagini porta a porta, in presenza di un
rilevatore non imparziale o che senza scrupoli, interpreta, deformandole, le
informazioni ricevute dal campione, o, infine, in indagini relative a tematiche sulle
quali si osserva una generale ritrosia ad esprimersi liberamente.

Errore statistico

Discrepanza tra il valore disponibile nellindagine e il suo valore vero. La


definizione di errore statistico assume un carattere generale che, poi,
tende a specializzarsi in relazione alla sua natura. Conoscendo i possibili
errori e il loro probabile impatto, il ricercatore cercher di adottare le
metodiche opportune per prevenirli o limitarne leffetto.
essenziale non dimenticare che lunico errore fatale ignorare la
possibilit derrore!

Errore casuale

Lerrore casuale dovuto al caso, cio a quell'insieme di fattori o cause,


piccole o grandi, che agiscono su un fenomeno senza che noi possiamo o
vogliamo controllarli esattamente e prevederne quindi l'azione (CavalliSforza). Ci fa s che sia presumibile osservare, in un campione, valori
diversi da quelli misurati su di un altro campione e, ovviamente, sullintera
popolazione. Poich ci legato al fatto che stiamo osservando solo parte
della totalit degli elementi si parla anche di errore campionario.

Errore sistematico

Scarto tra un valore rilevato e il suo valore atteso che, in prove ripetute, si
manifesta sempre nella stessa direzione e misura. Questo scarto anche
detto distorsione. Si distingue dallerrore casuale che varia tra prove
campionarie e pu, quindi, in media, bilanciarsi.

Piano di campionamento

E' la descrizione tecnica, dettagliata, di tutto quanto deve succedere da


quando si incomincia la ricerca a quando saranno disponibili i campioni per le
analisi. Comprende, tra laltro, la struttura del campione, le regole seguite
per la selezione delle unit e la numerosit del campione.

Abbiamo accennato a come gli errori sistematici siano connessi anche al piano di
campionamento.

Esempio

Se per studiare limmunit nei confronti del virus della rabbia in una
popolazione di cani, ci si limita ad osservare un campione di animali che
frequenta un ambulatorio veterinario, evidentemente si commetter un
errore sistematico in quanto non tutti i cani godono della possibilit di
essere curati. Come conseguenza, dallindagine, molto probabilmente,
emergerebbe una bassa propensione allinfezione!

Si comprende, quindi, facilmente limportanza di elaborare degli schemi di


campionamento, con attenta scrupolosit, in relazione alle caratteristiche della
popolazione oggetto dello studio.
Prima di effettuare qualsiasi tipo di indagine, sia essa una raccolta di dati o un
esperimento, necessario, o, comunque, fortemente consigliabile per lo studioso,
fermarsi a riflettere sulle caratteristiche del dominio danalisi, su cosa si andr a fare e
su quali sono gli obiettivi della ricerca.
La chiara comprensione dello scopo dello studio costituisce un punto di partenza
fondamentale: su di esso che si svilupper la strategia di analisi!
Definito lobiettivo si passa al piano tattico: si cercher di capire in che modo
possibile operare al fine di raggiungere quanto ci si prefisso di ottenere.
Supponiamo che il nostro problema riguardi lefficacia della pubblicit televisiva. Per
capirne qualcosa in pi opportuno trarre degli obiettivi operativi, ossia, elaborare dei
problemi di natura pi pratica, a cui sar pi semplice dare una risposta.
Nel nostro caso obiettivi operativi potrebbero essere:
1.
2.
3.
4.
5.

Come organizzare
unindagine statistica

Quante tv sono sintonizzate sul programma che pubblicizza il prodotto?


Quante persone ascoltano il programma?
Tali persone sono dei potenziali acquirenti?
Qual la loro opinione del programma?
Sono in grado di identificare chi pubblicizza il prodotto?

Si pu facilmente osservare che ciascuno di tali obiettivi focalizza lattenzione su


aspetti parziali del problema e non pretende di risolverlo nel suo complesso, proprio
per questo pi semplice e pi immediato da raggiungere.
Individuati gli obiettivi operativi pi rilevanti, per ciascuno di essi si stabilisce in che
modo procedere. importante, a questo punto, stabilire qual lunit di osservazione;
per esempio, se siamo interessati a conoscere il numero di tv sintonizzate sul
programma, la nostra unit di osservazione sar un televisore e la totalit di televisori
raggiunti dal segnale del programma trasmesso costituir il nostro universo di
indagine. Potrebbe, per, apparire pi conveniente conoscere il numero di persone che
seguono il programma: in tal caso, la singola persona sar lunit di osservazione e la
popolazione della regione coperta dal segnale del programma sar luniverso.
Si definisce, quindi, in che modo procedere con le indagini: alla luce dei vantaggi che
potrebbero derivarne, ha senso effettuare delle rilevazioni esaustive? Limpresa che
pubblicizza il prodotto, stimati i possibili ricavi derivanti dallo spot, sar disposta a
sovvenzionare unindagine completa sulla popolaizone? Abbiamo visto come spesso
sia preferibile o, eventualmente, necessario ricorrere ad indagini campionarie;

pagheremo questa scelta con la riduzione dellaccuratezza dei risultati: daltronde,


sappiamo che anche i censimenti non sono scevri da errori e che, nelle rilevazioni
campionarie, agendo sulla dimensione del campione e sulla qualit del piano di
campionamento si ha la possibilit di contenerli.
Sono due i fattori da considerare nella redazione di qualsiasi piano di campionamento:
1. la presenza o lassenza di meccanismi casuali;
2. loggettivit o la partecipazione soggettiva di chi conduce le indagini.
Proprio su questultimo aspetto, si fonda la distinzione tra campionamento casuale o
probabilistico (Random Sampling) e campionamento accidentale o non-probabilistico
(Judgment Sampling).

Accuratezza

Nellaccezione pi generale, accuratezza esprime la vicinanza di un valore


rilevato al corrispondente valore vero.

Il Campionamento Non Probabilistico


Le tecniche di campionamento non-probabilistico, quasi certamente,
rappresentano il metodo pi comune e pi rapido di selezione arbitraria del campione.
Non previsto, infatti, il ricorso a procedure casuali di selezione degli elementi della
popolazione da includere nel campione e ci si affida totalmente al buon senso, ovvero,
al giudizio soggettivo, del ricercatore: non garantita a ciascun elemento la stessa
probabilit di essere scelto come unit campionaria, in pratica alcuni gruppi hanno
maggiore possibilit di essere scelti rispetto ad altri.
Ne deriva che non necessario definire formalmente i piani di campionamento e ci
consente di evitare tutte le problematiche connesse con lindividuazione degli elementi
della base campionaria, con un conseguente risparmio di costi e di tempo.
Tuttavia, non si possono trascurare i limiti insiti in tali tecniche. Innanzitutto, non si
pu pretendere di affermare che il campione sia rappresentativo della popolazione dato
che la selezione non basata su criteri che garantiscono statisticamente la presenza di
elementi eterogenei: siffatto campione soggetto ad una forte distorsione; n si
possono stimare le probabilit di inclusione nel campione di ciascun elemento della
popolazione.
Possiamo, quindi, ragionevolmente desumere che i risultati ottenuti non sono
supportati da basi statistiche tali da poter essere generalizzati, ossia riferiti, allintera
popolazione.

Base campionaria

Lista delle unit campionarie da cui estrarre il campione.


La base campionaria non necessariamente coincide con lintera popolazione.

Tutto ci rende il campionamento non-probabilistico particolarmente conveniente solo


quando si ha a che fare con una popolazione omogenea, quindi, caratterizzata da una
bassa variabilit delle caratteristiche da analizzare; quando la ricerca di carattere
esplorativo, ovvero, non si ha una piena o alcuna conoscenza del dominio e, pertanto,
non si dispone di dati a sufficienza per elaborare un piano di campionamento. ,
infine, indicato quando non interessa trarre delle conclusioni statistiche dallo studio
condotto e si vuole disporre di un metodo operativamente facile da implementare.
Le pi comuni tecniche di campionamento non probabilistico sono:
1. il campionamento di convenienza (Convenience Sampling);
2. il campionamento ragionato (Judgmental Sampling);
3. il campionamento per quote (Quota Sampling).
Vediamo, brevemente, le principali caratteristiche di ciascuna.
Il campionamento di convenienza prevede la selezione del campione in base a
criteri di comodo o di praticit e, quindi, considera le unit che sono pi facilmente
disponibili.

Campionamento di
convenienza

Esempio

Supponiamo di voler ricavare dei giudizi sullorganizzazione di una maratona


cittadina; a tale scopo, decidiamo di esaminare un campione di 100
soggetti. Scegliere di intervistare i primi 100 arrivati risponde certamente
ad un criterio di convenienza: non saremo costretti ad attendere al
traguardo il fanalino di coda della gara; per, facile comprendere come,
cos facendo, il campione sar probabilmente costituito da soggetti giovani
e particolarmente soddisfatti del risultato ottenuto. Peraltro, si
escluderebbero a priori tutti coloro che decidono di ritirarsi dalla
competizione e che probabilmente avrebbero espresso un giudizio poco
positivo!

Il rischio che si corre con questo tipo di tecnica quello di reclutare preferenzialmente
elementi "particolari" rispetto alla popolazione, ad esempio elementi dotati di
caratteristiche tali da influenzare il carattere che vogliamo studiare.
Un particolare esempio di campionamento di convenienza rappresentato dal
televoto: i telespettatori che decidono di parteciparvi non rappresentano di certo la
totalit degli spettatori e, tanto meno, lintera popolazione; sono il risultato di un

Campionamento
ragionato

Campionamento
per quote

Limiti del
campionamento
non-probabilistico

processo di autoselezione spontanea libero da qualsiasi criterio di scelta di natura


ragionata o probabilistica.
Il campionamento di convenienza una tecnica spesso utilizzata nella ricerca
esplorativa per ottenere informazioni in tempi rapidi e costi contenuti; tuttavia, la
rapidit con cui si cerca di portare a termine lindagine fa anteporre alla qualit dei
rispondenti, la rapidit delle risposte.
Nel campionamento ragionato la selezione del campione completamente affidata
al ricercatore, sulla base della propria personale conoscenza del processo da studiare e
degli elementi che ne fanno parte. Appare, quindi, fondamentale e imprescindibile per
il corretto svolgimento delle indagini, la disponibilit di ricercatori sufficientemente
esperti, che nel tempo hanno saputo maturare dei giudizi analitici sulle caratteristiche
delle unit, cos da poter valutare lopportunit di introdurle nel campione. In questo
caso, almeno da parte del ricercatore vi la pretesa che il campione sia rappresentativo
della popolazione. La selezione del campione snella e, di conseguenza, sono bassi
sia i tempi che i costi di rilevazione.
una tecnica spesso utilizzata nelle indagini di mercato, al fine di testare il potenziale
dacquisto di nuovi prodotti in determinati mercati selezionati.
Il campionamento per quote rappresenta una via di mezzo tra le due tecniche
precedentemente analizzate. Si pu, infatti, ritenere una forma particolare di
campionamento ragionato realizzato con modalit organizzative molto simili a quelle
del campionamento di convenienza.
Lobiettivo quello di garantire la selezione di un campione che condivida la
medesima composizione della popolazione rispetto a variabili strutturali scelte dal
ricercatore. Si cerca, cos, di garantire la presenza di tutti i sottogruppi di cui si
costituisce la popolazione, lasciando, comunque, il ricercatore libero di selezionare
qualsiasi elemento da ciascun gruppo, dato che non prevista la stesura di una lista
degli elementi della popolazione target, n lindicazione di criteri di selezione
campionaria che vadano oltre il semplice rispetto delle quote. Ci fa s che sia
possibile, ancora una volta, seguire criteri di comodo nella scelta delle unit e, di
conseguenza, introdurre delle deviazioni sistematiche che porteranno a sottostimare la
variabilit propria delle caratteristiche analizzate. Ovviamente, lefficacia del metodo
risulta strettamente legata alla capacit e allattendibilit delle fonti statistiche tramite
cui si aggiornano le quote, anche se, opportuno osservare che la rappresentativit del
campione, che si pu ritenere legittimata dalla stessa composizione strutturale della
popolazione, rimane solo presunta.
Le variabili strutturali considerate sono spesso di natura demografica: sesso, et,
livello di istruzione, condizione professionale, zona di residenza, ecc
In definitiva, ciascuna delle tecniche viste, sebbene caratterizzata da unestrema
rapidit di rilevazione, presenta il forte handicap di non consentire la valutazione
dellaccuratezza dei risultati; ci non significa che essi siano necessariamente
scarsamente accurati, ma che anche se lo fossero, la loro accuratezza sarebbe
generalmente indeterminabile e, comunque, strettamente legata allesperienza del
ricercatore. Fortunatamente, nel campionamento probabilistico non si incontrano
questi problemi: i campioni possono essere facilmente selezionati e la loro accuratezza
immediatamente determinata anche da studiosi che non necessariamente hanno
maturato una profonda conoscenza degli elementi della popolazione e delle
caratteristiche oggetto dellanalisi.

Il Campionamento Probabilistico
Il campionamento probabilistico rappresenta la soluzione pi logica per chi ha
necessit di condurre delle indagini su una popolazione target con lobiettivo di trarre
delle conclusioni statistiche. Si tratta di tecniche di campionamento sviluppate per
ogni possibile situazione e la loro scelta opportuna, in funzione delle caratteristiche da
analizzare, consente di contenere al meglio leffetto di errori sistematici.
Si basano sulla definizione di procedure casuali per la selezione degli elementi del
campione e il ricercatore dovr premurarsi di rispettarle.
fondamentale procedere alla preparazione del piano di campionamento e, quindi,
alla lista degli elementi che fanno parte della popolazione target, dato che per ciascuno
di essi va, poi, valutata la probabilit di entrare a far parte del campione. Non detto
che tale probabilit debba risultare uguale per tutti, limportante che tale circostanza
sia prevedibile!
Le tecniche di campionamento probabilistico pi diffuse sono:
1. il campionamento casuale semplice (Simple Random Sampling);
2. il campionamento sistematico (Systematic Sampling);
3. il campionamento stratificato (Stratified Sampling);
4. il campionamento per gruppi (Cluster Sampling);
5. il campionamento areale (Area Sampling);
6. il campionamento doppio o a due fasi (Two Phases Sampling);
7. il campionamento con ripetizioni (Replicated o Interpenetrating Sampling);
8. il campionamento a pi stadi (Multistage Sampling);
9. il campionamento per panel (Panel Sampling).
Cerchiamo di capire in cosa consistono.
Il campionamento casuale semplice la pi semplice tra le tecniche di
campionamento probabilistico. Consiste in una procedura di selezione di un campione
di dimensione n concepita in modo tale che ciascun insieme di n elementi goda della
stessa probabilit di essere estratto dalla popolazione. una tecnica spesso usata a
livello teorico in virt della semplicit della funzioni di stima, ma trova scarsa
applicazione pratica per le difficolt operative che presenta. Innanzitutto, si devono
numerare gli elementi della popolazione; successivamente si estraggono n numeri
casuali e, infine, si ricercano gli elementi corrispondenti ai numeri estratti. in
questultima fase che risiedono le principali difficolt operative del metodo,
soprattutto se si ha a che fare con una popolazione di grandissime dimensioni, non
precedentemente numerata e caratterizzata da elementi mobili e, quindi, di difficile
reperibilit.
Nella fase di estrazione dei numeri possibile far ricorso a qualsiasi programma di
generazione di numeri casuali, per esempio anche al foglio di calcolo Microsoft
Excel utilizzando la funzione =CASUALE(), o, nel caso in cui non si disponesse di un
computer, a qualsiasi tavola di numeri casuali. Una tavola di numeri casuali consiste
in un insieme di numeri interi generati in modo che, nelle righe e nelle colonne, tutti le
dieci cifre (0, 1, , 9) compaiano in ugual misura e non sia possibile rilevare alcun
trend nel meccanismo che li ha prodotti.

Campionamento
casuale semplice

Funzioni di stima

Funzioni dei dati raccolti sui campioni tali da fornire le stime relative alla
popolazione e il loro grado di precisione. Le funzioni di calcolo delle stime e
della loro precisione sono basate sul calcolo delle probabilit e trattate
nellambito della teoria dei campioni. (ISTAT)

Esempio

Supponiamo di avere il permesso di condurre uno studio sul valore in euro


del contenuto di cassette di sicurezza di una grande banca. Ciascuna delle
500 cassette risulta numerata ed nostra intenzione analizzare un
campione di circa il 5%. Non avendo a disposizione un calcolatore,
utilizziamo una tavola di numeri randomizzati.

Numeriamo ciascuna cassetta con numeri di tre cifre: 001, 002, 003,, 500.
Quindi, scegliamo una riga qualsiasi della tavola (es. riga 103) e componiamo le
cifre in gruppi da tre: 454, 677, 170, 977, Si potrebbe procedere anche
eliminando da ciascun numero le ultime due cifre: 454, 717, 775, ecc
In ogni caso, selezioneremo i primi 25 numeri che rappresentano una cassetta,
ossia valori minori o uguali di 500, premurandoci di scartare i valori gi estratti.
In tal caso si parla di campionamento casuale semplice senza ripetizione; qualora
fosse possibile considerare pi volte lo stesso elemento, parleremmo di
campionamento casuale con ripetizione, che, per, prevede alcune complicazioni
nelle funzioni di stima.

Il campionamento sistematico rappresenta probabilmente il metodo pi pratico di


selezione casuale di un campione. Tale tecnica prevede la scelta casuale di un
elemento dalla base campionaria a cui segue la selezione di una unit ogni k unit che
scorriamo nella lista.
Spesso si assume

k=

N
n

dove N ed n sono rispettivamente la dimensione della popolazione e del campione (in


ogni caso opportuno che k risulti minore del rapporto indicato), e si seleziona la
prima unit fra le prime k della lista. Se non lo si facesse, si dovrebbe fare attenzione,
una volta terminato lelenco, a continuare il conteggio a partire dallinizio della lista.
Il procedimento si chiude quando tutte le n unit previste per il campione sono state
selezionate.

10

Campionam
sistematico

una tecnica particolarmente vantaggiosa quando non si conosce esattamente la


dimensione della popolazione e quando risulta impossibile numerare gli elementi.
Supponiamo di avere il compito di intervistare 100 persone che abbiano visitato un
museo darte contemporanea. impossibile sapere a priori quanta gente visiter il
museo in quel giorno! Potremo, per, seguire una procedura casuale di selezione se,
scelto a caso il primo individuo alluscita dal museo, intervisteremo un visitatore ogni
10 soggetti che lasciano ledificio.
Generalmente, il campionamento sistematico meno soggetto agli errori
dellintervistatore anche perch pi semplice da implementare rispetto alla
randomizzazione casuale; inoltre, il campione si distribuisce meglio su tutta la
popolazione e, cos, in grado di fornire pi informazioni rispetto ad unequivalente
quantit di dati contenuti in un campione casuale semplice. Tuttavia, possibile
osservare delle distorsioni se lordine con cui le unit sono elencate tende ad avere una
ricorrenza associata alla caratteristica di interesse o, pi difficilmente, se vi sono delle
variabile esterne che influenzano il campione, agendo con la stessa ciclicit del
campionamento. Per esempio, se vogliamo testare il livello di igiene di un canile
municipale e monitorarlo nel tempo, procediamo a controlli sistematici ogni mese.
Potrebbe, per, essere previsto, a nostra insaputa, un contratto con un impresa di
pulizia che preveda un intervento al mese, il giorno prima della visita ispettiva.
Evidentemente il campione non sar rappresentativo!
doveroso osservare che il campionamento sistematico non pu essere considerato
una forma di selezione casuale a pieno titolo, in quanto, rispetto alla randomizzazione
casuale semplice, il numero potenziale di campioni risulta fortemente ridotto.
comunemente usato nelle indagini telefoniche.
Ha senso ricorrere al campionamento stratificato quando si intende studiare una
caratteristica fortemente influenzata da un fattore presente nella popolazione. Lidea di
fondo, in questa procedura, quella di suddividere la popolazione target in due o pi
gruppi, detti strati, in funzione di prestabiliti fattori di classificazione, per poi
procedere con lestrazione di unit da ciascuno strato secondo tecniche di
campionamento casuale, quali la randomizzazione semplice o sistematica. Se la
spartizione degli elementi nei vari strati avviene correttamente, e, soprattutto, i fattori
di classificazione sono legati alla caratteristica da analizzare, ci si dovr attendere, in
ogni gruppo, unelevata omogeneit degli elementi, rispetto alle variabili oggetto di
studio, e, quindi, una variabilit allinterno di ciascuno strato notevolmente inferiore
rispetto a quella complessiva (relativa allintera popolazione), vantaggio
assolutamente non trascurabile ai fini della precisione della stima della variabile da
studiare. Si potrebbe, inoltre, pensare di stimare i parametri che ci interessa ottenere
per la popolazione, anche per ogni singolo strato, cos da rendere pi completa
lanalisi.

Campionamento
stratificato

Esempio

Un medico curante, particolarmente attento alla salute dei suoi pazienti,


commissiona ad un centro di ricerche statistiche, unindagine sul livello di
copertura anticorpale nei confronti del virus dellinfluenza. A tal fine, mette
a disposizione dei ricercatori lelenco dei pazienti che si sono sottoposti a
vaccinazione allinizio della stagione. immediato comprendere che,
essendo la vaccinazione un fattore che influenza fortemente la propensione
allinfezione, opportuno condurre unindagine stratificata, dividendo i
pazienti in vaccinati e non vaccinati. presumibile che tra i vaccinati si
riscontri un maggiore livello anticorpale e che non vi siano sostanziali
differenze nel tasso di immunit dal virus allinterno dello stesso strato.

11

Campionamento
per gruppi

La suddivisione in strati presenta lulteriore vantaggio di rendere sufficientemente


flessibile la procedura di selezione, dato che una volta definiti gli strati possibile
procedere indipendentemente per ciascuno di essi, e, quindi, estrarre da ognuno un
numero diverso di elementi. Nella scelta del numero di unit da estrarre da ogni strato,
conveniente cercare di mantenere la medesima composizione strutturale tra il
campione e la popolazione, o, comunque, avendo scelto i numeri secondo altri criteri,
cercare di pesare opportunamente i risultati per garantirne una maggiore accuratezza.
Tornando allesempio precedente, se il medico avesse in cura 2500 pazienti, e di
questi 1000 fossero vaccinati, sarebbe consigliabile fare in modo che il campione
fosse costituito per il 60% da soggetti non vaccinati.
Lunico problema rilevante con questo tipo di campionamento appare essere la
necessit di disporre di informazioni attendibili e aggiornate sulle caratteristiche della
popolazione per procedere alla creazione degli strati.
Il campionamento per gruppi consiste in un campionamento casuale semplice, in
cui ciascuna unit campionaria rappresentata da un insieme di elementi della
popolazione, al quale ci si riferisce con il nome di gruppo, grappolo, o cluster.
Affinch sia conveniente ricorrere a tale tecnica necessario che la popolazione sia
suddivisa o suddivisibile in sottoinsiemi o segmenti di elementi legati da vincoli di
contiguit spaziale o di altro tipo. Al contrario di quanto accade per il campionamento
stratificato, importante che ciascun gruppo, al suo interno, sia caratterizzato da
elevata eterogeneit rispetto al carattere analizzato, che i grappoli siano di dimensioni
simili e non eccessivamente grandi.
Una volta individuati i gruppi, si procede alla rilevazione esaustiva limitatamente ai
grappoli selezionati; in alternativa, possibile sottoporre i clusters estratti ad un
ulteriore selezione campionaria che porter a focalizzare lattenzione solo su alcuni
elementi del gruppo. In tal caso si parla di campionamento a due stati, essendo i
grappoli le unit del primo stadio e gli elementi estratti dai grappoli quelle del
secondo.
In generale, tale tecnica risulta fortemente conveniente da un punto di vista operativo
ed economico dato che si presta a facilitare notevolmente il reclutamento dei soggetti;
tuttavia, rispetto ai metodo precedenti, possono aumentare notevolmente gli errori di
campionamento.

Esempio

Supponiamo di voler analizzare la difettosit delle lampadine prodotte da


una certa fabbrica. Scegliere di effettuare dei controlli sulle singole unit
potrebbe risultare eccessivamente costoso. Essendo previsto un
confezionamento in pacchi da sei, potremmo sfruttare la suddivisione
naturale della popolazione e ricorrere ad un campionamento per gruppi.

12

Il campionamento areale una forma particolare di campionamento a pi stadi


(generalizzazione del campionamento a due stadi). Si ricorre a tale tecnica quando non
si dispone di una lista completa degli elementi della popolazione da analizzare,
dislocata su di un certo territorio. In tal caso, si prevede innanzitutto la suddivisione
del territorio in aree contigue, si procede alla selezione casuale di alcune delle aree
individuate e si conduce unesplorazione completa di tali aree al fine di produrre le
liste delle unit presenti al loro interno. Ottenute le liste, si completa la procedura
estraendo da esse, casualmente, delle unit campionarie.
Al termine di questa breve panoramica sulle principali tecniche di campionamento
doveroso notare che di grande importanza testare e monitorare la strategia di
campionamento adottata per garantirne la rispondenza agli obiettivi iniziali e
ladeguatezza rispetto a successive occasioni di indagine. Se possibile, opportuno
confrontare tra loro lefficacia di diversi schemi di campionamento, sulla base di dati
in possesso, per rilevazioni precedenti o per studi pilota, cos da poter raffinare la
scelta delle variabili di stratificazione o la dimensione del campione, e rientrare nei
limiti di errore consentiti.
Si deve, inoltre, considerare che non detto che la strategia, in teoria pi efficiente sia
necessariamente quella da scegliere: vanno sempre integrate, nelle valutazioni
preliminari, considerazioni sulla compatibilit dei disegni di campionamento con la
situazione operativa e gli effetti che errori sistematici (es. impossibilit di contattare
qualche unit, il rifiuto a partecipare allindagine, ecc) possono avere sulla
valutazione delle stime.
Infine, necessario ricordare che le funzioni di stima sono strettamente correlate con
le strategie scelte e che, pertanto, si rischia di commettere gravi errori se la loro
selezione non risulta corretta.

Campionamento
areale

Suggerimenti

Nel seguito, ove si parler di campioni, questi si riterranno frutto di un corretto


campionamento che, in quanto tale godr delle seguenti caratteristiche:
deve essere preceduto da uno studio del Sistema, Processo, Fenomeno da cui
vengono estratti, misurati, raccolti i dati;

si deve definire chiaramente la natura della variabile/variabili da studiare;

il campione deve essere rappresentativo dei fattori che influenzano il Sistema,


Processo, Fenomeno.

il campionamento deve essere adeguatamente numeroso.

13

Potrebbero piacerti anche