Sei sulla pagina 1di 21

IL CAMPIONAMENTO

per poter passare dalla sfera della realt


alla sfera degli strumenti cognitivi,
necessario attivare delle procedure
specifiche. Si ricorre a queste procedure,
che prendono il nome di campionamento
, ogni qualvolta la popolazione di
riferimento non raggiungibile nella sua
totalit.
Popolazione o universo
La popolazione (o universo) di una ricerca
quell: Insieme dei casi che teoricamente
costituiscono loggetto di indagine e che
hanno in comune almeno una caratteristica
osservabile.

La ricerca studia le caratteristiche della


popolazione
di
riferimento
che
costituiscono loggetto da conoscere; ci
significa che ogni popolazione contiene
delle informazioni che il ricercatore deve
raccogliere per svolgere la sua ricerca.
Per questo, comunemente si dice che la
popolazione un contenitore di informazioni.
Definizione della popolazione
Quando si mette a punto una ricerca, una delle
fasi consiste nel definire la popolazione di
riferimento. Definire una popolazione significa:
Individuare le caratteristiche interessanti per la
ricerca, delimitando il campo di azione della
ricerca stessa, eliminando quelle caratteristiche
non utili. La definizione della popolazione
dipende dagli obiettivi di ricerca.
Esempi:
indagine sui redditi in Italia -> popolazione:
individui che percepiscono un reddito in Italia;
indagine sui fitti in Italia -> popolazione: tutte le

famiglie in fitto in Italia;


indagine sugli istituti superiori campani ->
popolazione: tutti gli edifici scolastici in
Campania.
indagine sulle prossime elezioni politiche ->
popolazione: tutti gli italiani con diritto di voto e
con et uguale o superiore a 18 anni;
indagine sullimpatto della riforma scolastica
sugli studenti delle scuole superiori ->
popolazione studenti italiani delle scuole
superiori.

La popolazione pu essere teorica e


accessibile.
La popolazione teorica: linsieme di tutti i casi
che costituiscono la popolazione oggetto di
indagine.
Es. indagine sulle prossime elezioni politiche ->
popolazione teorica: tutti gli italiani con diritto di
voto e con et uguale o superiore a 18 anni;
La popolazione accessibile: linsieme di tutti i
casi appartenenti alla popolazione teorica che
sono effettivamente raggiungibili.

Es. indagine sulle prossime elezioni politiche ->


popolazione accessibile: parte degli italiani con
diritto di voto e con et uguale o superiore a 18
anni effettivamente intervistabili.
La rilevazione campionaria
Indipendentemente dagli obiettivi proposti,
limpossibilit di accedere alla popolazione
teorica ovvero di esaminare ogni singola unit
dellintera popolazione causata da:
limitate risorse economiche, di personale di
tempo disponibili;
lintera popolazione da studiare non fisicamente
raggiungibile;
lintera popolazione da studiare non del tutto
nota.
Per superare questi problemi si ricorre ad una
rilevazione campionaria ossia una rilevazione che
permette di:
Studiare le caratteristiche di una popolazione
attraverso lo studio di una porzione della
popolazione stessa (campione) invece dellintera
popolazione.

Campione e campionamento: definizioni


Campione: parte della popolazione selezionata in
modo da diminuire, in termini di tempo e costi,
lacquisizione tutte le informazioni utili per la
ricerca. Il campione la rappresentazione in
piccolo di tutta la popolazione, sintetizza, cio
tutte le caratteristiche della popolazione
originaria.
Scegliere un campione da una popolazione
significa effettuare un campionamento.
Campionamento: Procedimento attraverso il
quale si estrae, da uninsieme di unit
(popolazione), un numero finito di casi
(campione) che siano rappresentativi di tutta la
popolazione e scelti con criteri tali da consentire
la
generalizzazione
(inferenza)
allintera
popolazione a partire dai risultati ottenuti
studiando il campione.
Motivi per utilizzare un campione
Lestrazione di un campione richiede meno tempo
rispetto allesame dellintera popolazione;
un campione meno costoso;
un campione pi pratico da gestire;
un campione garantisce un elevato grado
approfondimento e accuratezza;

spesso una necessit perch lesame dellintera


popolazione non accessibile.
Le valutazioni sulle caratteristiche della
popolazione si devono perci basare sulle
informazioni contenute in un campione estratto
dalla popolazione.

Validit/Bont di un campione
Perch il risultati di una indagine campionaria
siano generalizzabili necessario valutare la
validit (bont) del campione. Tale valutazione
pu essere condotta ponendosi due quesiti:
Le conclusioni sono corrette per gli individui che
compongono il campione?
Il campione rappresenta bene la popolazione da
cui stato estratto?
Un campione valido (bont di un campione)
se :
Eterogeneo: se include tutte le caratteristiche e
qualit diverse. Il campione deve essere
diversificato al suo interno in modo da presentare
una variabilit di caratteristiche collegate alle
informazioni da rilevare (tutti studenti)
Rappresentativo: ovvero se presenta, senza
distorsioni, tutte le caratteristiche della

popolazione di riferimento. La rappresentativit


garantita se la procedura di campionamento
casuale ossia se regolata dalla legge
caso/probabilit.
Accurato: ovvero se il grado di minimizzazione
degli errori di copertura (lista della popolazione)
elevato ed il numero di non risposte (tutti i casi
del campione sono raggiungibili) basso.
Ampio: ovvero se include un numero elevato di
casi. Lampiezza inversamente proporzionale
agli errori di rilevazione.

Come si determina lampiezza del campione?


Per determinare la dimensione ottimale del
campione (il campione pi piccolo col minimio
errore di campionamento) che consenta di stimare
una percentuale ad una precisione voluta
(intervallo di confidenza stabilito) si utilizzano
le tavole di campionamento.
Per usarle necessario conoscere:
N delle unit che compongono la popolazione
dal quale il campione deve essere tratto.
Lintervallo di fiducia/confidenza al quale si
intende operare.
La percentuale di soggetti della popolazione che
possiedono le caratteristiche richieste.
Lerrore campionario massimo che vuole
accettare nei risultati.
Determinazione dellampiezza del campione:
esempio
Si intende stimare i votanti per il partito politico
X in una citt dove gli elettori sono 200.000; alle
precedenti elezioni il partito X aveva preso il
23% dei voti
Popolazione (N) = 200.000
Intervallo di fiducia = 95%
Stima (P) dei voti che il partito X dovrebbe
prendere =23% dei votanti

Errore campionario = 1%
Campione = 6580
Tipi di campionamento
I tipi di campioni si possono raggruppare in :
Campionamento probabilistico: la procedura
di campionamento in cui i casi vengono scelti
in modo che la probabilit che di ciascun caso
ha di essere incluso nel campione nota.
Campionamento non probabilistico: la
procedura di campionamento in cui i casi
vengono scelti in modo che la probabilit che
di ciascun caso ha di essere incluso nel
campione non nota..
NB: Dal momento che nei campioni non
probabilistici i casi sono scelti senza conoscere la
loro probabilit di selezione, la teoria sviluppata
per il campionamento probabilistico non pu
essere applicata.

In un CP fondamentale la conoscenza
delluniverso: per poter estrarre in modo
probabilistico i casi dalla popolazione
necessario avere dati sulluniverso teorico,
necessario, cio, disporre di informazioni circa le
caratteristiche della popolazione.
N = corrisponde ai numero dei soggetti nella
popolazione oggetto di indagine.
n = corrisponde al numero dei soggetti nel
campione.
K = n/N = rapporto di campionamento.
Come si scelgono casualmente i casi da includere
nella rilevazione? Le tavole dei numeri casuali
Stabilita lampiezza del campione, devono essere
individuati i casi che concretamente devono
essere inclusi nel campione. Perch la scelta sia
effettivamente casuale si ricorre alle tavole dei
numeri casuali.
Una tavola di numeri casuali si compone di una
serie di cifre generate casualmente ed elencate
nellordine secondo cui sono state generate.
Poich il sistema decimale ha 10 cifre (le cifre
0,1,2,3,,9), queste hanno tutte la stessa
probabilit 1/10 di essere generate casualmente.
Le cifre sono riunite in gruppi di cinque per
facilitare la lettura; poich tutte le cifre o

successioni di cifre nella tavola sono casuali, si


pu leggere sia in senso orizzontale che verticale,
dallalto o
dal basso, specificando per prima di iniziare a
usare la tavola il criterio scelto; bisogna inoltre
scegliere un punto di partenza nella tavola dei
numeri casuali (ad esempio puntando a caso con
una
matita a occhi chiusi). Per usare la tavola si
assegna ad ogni elemento della popolazione un
codice numerico, ad esempio si fa una lista
numerata; si pu ottenere un campione leggendo
la tavola dei numeri casuali e selezionando gli
individui della lista il cui codice coincide con il
numero casuale.
Tavola dei numeri casuali
I tipi di campionamento probabilistico
Campionamento casuale semplice
Campionamento sistematico
Campionamento stratificato random
Campionamento a stadi
Campionamento per aree
Campionamento a grappoli (cluster)

1. campionamento casuale semplice


E la pi semplice tecnica di selezione di un
campione; il procedimento sostanzialmente
simile allo schema di estrazione da unurna.
Un campione casuale semplice un campione
in cui ogni individuo della popolazione ha la
stessa probabilit di essere scelto.
Se si indica con n la dimensione del campione
(numero di elementi del campione) e con N la
dimensione della popolazione, (numero di
elementi della popolazione), nel campionamento
casuale semplice la probabilit che ogni individuo
della popolazione ha di essere scelto alla prima
estrazione (rapporto di probabilit) 1/N.
In questo tipo di campionamento necessaria la
presenza di una lista della popolazione.
Campionamento
casuale
semplice
con
reimmissione e senza reimmissione.
La selezione del campione pu essere fatta in due
modi:
con reimmissione: ciascun elemento della
popolazione disponibile ad ogni estrazione,
quindi ad ogni estrazione ogni elemento ha
sempre probabilit 1/N di essere estratto. In
questo modo un elemento pu essere nuovamente
estratto in una successiva estrazione;

senza reimmissione. Ciascun elemento, una volta


selezionato, non viene rimesso nella popolazione
e non pu pi essere scelto di nuovo. In questo
modo per gli i casi non hanno tutti la stessa
probabilit di essere estratti, perch si altera la
composizione del campione dopo ogni estrazione.
Tutti i tipi di campionamento probabilistico si
basano sul Campionamento Casuale Semplice.
Campionamento casuale semplice: procedura
Con sorteggio
Ad ogni numero associato ad un soggetto
estrazione di un numero da unurna;
ricorso ai numeri casuali generati dai computer;
utilizzo della tavola dei numeri casuali.
Senza sorteggio
Si predispongono in unurna tanti bigliettini
quanti sono gli elementi della popolazione e se ne
estraggono un n prestabilito;
si inseriscono nomi dellintera popolazione in un
foglio elettronico e si numerano in ordine
alfabetico da 1 a N. Si estraggono i casi da
includere nel campione in modo casuale (dati o 1
caso ogni tot.);

tavola numeri casuali: se N ha 3 cifre si seleziona


la prima tabella con 3 cifre e si procede o in
verticale, diagonale orizzontale.
Campionamento sistematico
E tipo particolare di campionamento casuale
semplice dove le unit campionarie sono
individuate sistematicamente una ogni dato
intervallo. Nel campionamento sistematico le n
unit che costituiranno il campione sono scelte
dalla popolazione ad intervalli regolari ossia in
base ad una regola prefissata.
Questo metodo assicura anche che le singole
unit
del
campione
siano
distribuite
uniformemente allinterno della popolazione.
Occorre tuttavia porre attenzione che lintervallo
di campionamento prescelto non sia influenzato
da qualche variabile esterna che agisce con la
stessa ciclicit del campionamento.
Il campionamento sistematico pi facile da
eseguire, ma il suo uso acritico pu portare con
facilit a campioni affetti da errori sistematici;
rischio che non c con il campionamento casuale
semplice.
Campionamento sistematico: procedura

Si costruisce un elenco di nominativi e si associa


un numero
Si definiscono le unit totali della popolazione e
si classificano da 1 a N N noto
Si decide la dimensione del campione da estrarre,
corrisponde al valore di n.
Si calcola lintervallo di campionamento rapporto
k (N/n)
Si estrae a caso un valore compreso tra 1 e k
Esempio (exit poll):
N = 1000 ; n = 100 ; k = 1000/100 = 10
Si sceglie per iniziare un n compreso tra 1 e 10 e
poi se ne prende uno ogni 10
2 = n estratto a caso tra 1 e 10
Campionamento stratificato
E tipo particolare di campionamento casuale
semplice, nel quale si utilizzano una o pi
caratteristiche precedentemente acquisite sulla
popolazione per suddividerla in sotto popolazioni
o strati ciascuno dei quali si suppone omogeneo.
Si utilizza quando, essendo in possesso di una

lista completa della popolazione, si intende


studiare un carattere specifico e determinantedella popolazione I campioni estratti da un
sottogruppo sono pi omogenei tra di loro e
presentano una variabilit minore rispetto
allintera popolazione.
Con questa strategia di campionamento
possibile assicurare la rappresentativit dei
sottogruppi della popolazione. Prima di effettuare
lestrazione del campione la popolazione viene
suddivisa in strati basati sul fattore che influenza
il livello del carattere da studiare. Quindi,
allinterno di ciascuno strato si sceglie un
campione con il metodo della randomizzazione
semplice o sistematica
Lo svantaggio del campionamento stratificato
che lo stato di tutte le unit di campionamento,
rispetto ai fattori su cui basata la stratificazione,
deve essere noto prima di scegliere il campione.
Campionamento stratificato random: procedura
Si divide la popolazione in sottocampioni/strati
omogenei in base ad una caratteristica della
popolazione (caratteristica = regione di residenza,
strati = Nord centro sud)

Si effettua un campionamento casuale semplice in


ogni strato
I sotto campioni definiscono, nel loro insieme, il
campione basato sulle variabili stratificanti
Esempio: Ricerca sul reddito degli italiani
Si divide la popolazione per professione in 4
strati: operai impiegati autonomi e professionisti.
Estraiamo in modo casuale un campione da
ciascuno strato e si unifica il campione.
Campionamento stratificato proporzionale e non
proporzionale
Stratificato proporzionale = riproduzione della
stessa
composizione
degli
strati
nella
popolazione. Utilizzando gli stessi rapporti di
campionamento per i diversi strati.
Stratificato non proporzionale = sovra /
sottorappresentazione di uno strato utilizzando
rapporti di campionamento diversi per gli strati.
Si usa quando si vogliono sovra rappresentare gli
starti meno numerosi della popolazione.
Esempio st. proporzionale

Se gli operai sono il 40% della Popolazione,


impiegati 40%, autonomi 15% e professionisti
5% e il campione n= 1000 allora si prenderanno
operai 400 impiegati 400, autonomi 150 e
professionisti 50.
Esempio st. non proporzionale
Se operai 40%, impiegati 40%, autonomi 15% e
professionisti 5% e n= 1000 sovra rappresentiamo
i professionisti operai 400 impiegati 400,
autonomi.
4. Campionamento a stadi
Si utilizza quando non disponibile una lista
complessiva delle unit della popolazione. A
questo tipo di campionamento si ricorre per
necessit in quanto le stime con esso ottenibili
sono di solito meno efficienti (maggior variabilit
campionaria) di quelle calcolate applicando un
campione casuale semplice. E definito sulla base
di scelte e procedure successive che passano per
pi stadi.
Procedura
La

popolazione

viene

divisa

in

gruppi

gerarchicamente ordinati
I casi vengono estratti con un procedimento ad
imbuto..
Esempio di tale situazione dato dallanagrafe
che non esiste come unico archivio nazionale ma
suddivisa negli 8.103 comuni italiani.
In questo caso si procede:
1. estrazione casuale di un campione di comuni
(unit di primo stadio);
2. estrazione di un campione casuale di famiglie
(unit di secondo stadio) da ciascuna lista
anagrafica per ogni comune selezionato.
5. Campionamento per aree
E un tipo di campionamento a stadi dove lo
stadio unarea geografica.
Si utilizza quando non si dispone di una lista per
la selezione delle unit e queste sono dislocate sul
territorio.
In questo caso si procede ad una suddivisione in
parti (aree) dellintero territorio e allestrazione di
un campione di aree. Quindi si esplorano le aree
campionate,
allo
scopo
di
enumerare
esaustivamente le unit presenti al loro interno e

produrre delle liste complete. Infine, dalle liste


prodotte, si estraggono le unit campione da
contattare per la rilevazione vera e propria.
Dal punto di vista teorico il campionamento per
aree deve essere considerato una forma
particolare di campionamento a pi stadi.
Esempio: Ricerca sugli Italiani
MULTISTADI
Macroarea/Regioni/Province/Comuni/Zona
rurale-urbana/individui
6. Campionamento a grappoli (cluster)
E un tipo di campionamento a stadi.
E utilizzato quando la popolazione risulta
naturalmente divisa in gruppi / grappoli
(Esempio: classi scolastiche, reparti aziendali
ecc.).
Questa tecnica di campionamento stata proposta
nelle indagini di mercato per evitare di avere una
distribuzione dei campioni in un territorio molto
vasto. Le procedure da adottare prevedono di

dividere la popolazione in cluster (solitamente


delle zone geografiche). Si estraggono a caso dei
cluster e si procede per lestrazione del campione
dai cluster selezionati.