Sei sulla pagina 1di 39

1

Il Campionamento
1. Lindagine campionaria.............................................................................................................. 2
2. Popolazione e campione.............................................................................................................. 3
3. Campionamento probabilistico e non probabilistico.................................................................... 5
4. Campionamento probabilistico: strategia di campionamento e disegno di campionamento.......... 7
5. La stima delle caratteristiche della popolazione........................................................................... 8
6. Campionamento casuale semplice............................................................................................. 11
6.1 Campionamento casuale semplice senza ripetizione............................................................ 12
6.1.1 Piano di campionamento casuale semplice senza ripetizione......................................... 13
6.1.2 Stimatori dei parametri della popolazione..................................................................... 14
6.2 Campionamento casuale semplice con ripetizione............................................................... 18
6.2.1 Piano di campionamento del disegno casuale semplice con ripetizione......................... 18
6.2.2 Stimatori dei parametri della popolazione..................................................................... 20
7. Campionamento sistematico...................................................................................................... 23
7.1 Campionamento sistematico lineare.................................................................................... 24
7.2 Campionamento sistematico circolare................................................................................. 25
7.3 Piano di campionamento..................................................................................................... 27
8. Campionamento stratificato...................................................................................................... 28
8.1 L'allocazione del campione negli strati ................................................................................ 29
8.2 Piano di campionamento stratificato.................................................................................... 30
8.3 Stimatori dei parametri della popolazione............................................................................ 32
9 Campionamento a grappoli ........................................................................................................ 34
9.1 Piano di campionamento..................................................................................................... 35
10. Campionamento a due stadi..................................................................................................... 36
10. Errore di campionamento........................................................................................................ 37
Riferimenti Bibliografici:.............................................................................................................. 39

PDF created with pdfFactory trial version www.pdffactory.com
2
Le tecniche di campionamento

1. Lindagine campionaria
Nell'indagine statistica l'informazione pu essere acquisita osservando tutte le unit componenti la
popolazione o soltanto parte di esse. Nel primo caso l'indagine detta completa o totale, nel
secondo parziale o campionaria.
INDAGINE TOTALE: indagine effettuata rilevando le caratteristiche su tutte le unit della
popolazione.
INDAGINE CAMPIONARI A: indagine effettuata rilevando le caratteristiche sulle unit di
un sottoinsieme della popolazione. Lobiettivo quello di estendere i risultati campionari
alla popolazione attraverso la stima di una o pi caratteristiche (parametri) della
popolazione.
L'indagine totale teoricamente semplice ma all'atto pratico presenta molti lati negativi. Se la
popolazione che si desidera studiare molto numerosa, le risorse economiche e personali necessarie
al suo corretto svolgimento possono essere superiori a quelle disponibili. Anche i tempi di
esecuzione possono spesso superare limiti accettabili o comunque limitarne notevolmente la
frequenza. Inoltre, le indagini complete non possono essere svolte:
su popolazioni non finite, come negli esperimenti casuali;
su popolazioni per le quali l'osservazione del fenomeno di studio comporti la distruzione
dell'unit che si osserva, come nel controllo statistico di qualit.
Nell'indagine campionaria la possibilit di limitare la rilevazione ad un insieme di unit di
dimensione ben inferiore a quella della popolazione consente di:
contenere i costi dell'indagine entro limiti accettabili;
svolgere l'indagine in tempi relativamente brevi;
raccogliere per ogni unit inclusa nell'indagine un maggior numero di informazioni;
raccogliere le informazioni con maggior accuratezza.
Sul piano teorico tuttavia l'indagine campionaria presenta due notevoli problemi: il primo, legato al
modo in cui deve essere scelto il campione; il secondo relativo ai procedimenti da adottare per
estendere l'evidenza campionaria alla popolazione.
Infatti lobiettivo dellindagine campionaria quello di descrivere la realt della popolazione alla
luce delle osservazioni condotte su un insieme limitato di unit estratte dalla popolazione stessa. La
realt della popolazione espressa dalle costanti caratteristiche quali la media, il totale, etc. Quando
PDF created with pdfFactory trial version www.pdffactory.com
3
tali costanti sono viste come oggetto dellinferenza dal campione alla popolazione sono definite
parametri.
In altri termini il principale obiettivo di unindagine campionaria quello di raccogliere dati che
consentiranno di generalizzare all'intera popolazione i risultati ottenuti dal campione. Questo
processo di generalizzazione detto inferenza.












2. Popolazione e campione
Nella fase in cui si definiscono gli obiettivi della ricerca (astrazione) viene anche definita la
popolazione oggetto di studio o popolazione obiettivo. Definire la popolazione obiettivo significa
individuare con esattezza la natura dei suoi elementi componenti, cio delle unit oggetto di studio,
e la sua estensione spaziale e temporale.
La popolazione l'insieme di tutte le unit statistiche, o elementi, di interesse. Si parla di
popolazione finita quando le unit statistiche sono in numero finito e sono etichettabili. In seguito
si far riferimento esclusivamente a popolazioni di dimensione finita ed si indicher con N il
numero complessivo di unit componenti la popolazione.
Un campione un sottoinsieme delle unit della popolazione, che la rappresenti con riferimento al
problema oggetto di studio. La dimensione del campione, e quindi il numero complessivo di unit
componenti il campione, si indicher con nN.

Definita la popolazione obiettivo, necessario verificare la disponibilit di una base di
campionamento che le corrisponda perfettamente. Le unit della base di campionamento sono
dette unit di campionamento (UC).
popolazione
campionamento
campione
studio del
campione
inferenza
popolazione
campionamento
campione
studio del
campione
inferenza

PDF created with pdfFactory trial version www.pdffactory.com
4
Occorre, quindi, disporre di una lista completa delle unit della popolazione. La lista (archivio)
linsieme ordinato di etichette delle unit della popolazione, registrate su un supporto che ne
consenta la consultazione. La lista include informazioni ausiliarie (indirizzo) utilizzate dal metodo
di campionamento e di stima. Una lista ottimale deve avere le seguenti propriet:

copertura: tutti gli elementi della popolazione (UP) devono essere rappresentati nella lista;
non devono essere presenti duplicazioni;
non devono essere presenti elementi estranei.

Purtroppo sono frequenti i casi in cui non esiste perfetta coincidenza tra popolazione di selezione,
contenuta nella base di campionamento, e popolazione obiettivo. Infatti, soprattutto in campo
sociale ed economico, gran parte delle liste disponibili presentano difetti tra i quali il pi grave
quello dellincompletezza.
Oltre alle popolazioni obiettivo e di selezione, necessario parlare anche di popolazione di
indagine. Selezionato il campione, accadr normalmente di non poterne osservare tutte le unit per
impossibilit di contattarle o per un loro rifiuto di partecipazione all'indagine. Il fenomeno della
mancata osservazione di un'unit che fa parte della popolazione di selezione prende il nome di
mancata risposta totale. In presenza di questo fenomeno il campione fornisce evidenze soltanto
sull'insieme di coloro che sarebbe stato possibile osservare se l'indagine fosse stata completa.
Questo insieme costituisce la popolazione di indagine.
Quindi:
la popolazione obiettivo, cui direttamente interessato chi svolge l'indagine, differisce da
quella di selezione a causa dell'incompletezza della lista;
la popolazione di selezione differisce a sua volta da quella di indagine a causa della non
risposta.

PDF created with pdfFactory trial version www.pdffactory.com
5
La popolazione di selezione (UC) sar costituita da N unit. Ad ogni unit viene associata
unetichetta identificativa U
i
. La variabile oggetto di indagine sar indicata con Y e il valore,
incognito, della stessa su ogni unit di campionamento sar denotata con Y
i.

Unit
(etichette)
U
1
U
2
U
i
U
N

Valori di Y
(incogniti)
Y
1
Y
2
Y
i
Y
N


N: numerosit della popolazione
U
i
: etichetta dellunit di campionamento i-
esima
Y: carattere di interesse
Y
i
: valore incognito della variabile di interesse
sullunit di campionamento U
i


3. Campionamento probabilistico e non probabilistico
Vi sono numerosi metodi per selezionare un campione e diverse possibilit di classificarli. Una
distinzione di importanza fondamentale quella tra campioni probabilistici e non probabilistici.
Si parla di campionamento probabilistico quando le unit sono selezionate con meccanismo
casuale e hanno tutte una probabilit nota e non nulla di essere selezionate. In particolare devono
ricorrere le seguenti condizioni:
(a) possibile definire l'insieme C dei campioni distinti che possono essere estratti dalla
popolazione;
(b) a ciascuno dei campioni c possibile associare una probabilit di selezione p(c);
(c) tutte le unit della popolazione hanno una probabilit non nulla di essere estratte;
(d) esiste un meccanismo di selezione casuale che garantisce la selezione di ciascun
campione secondo la probabilit teorica.
Tutti i campioni probabilistici vengono formati ricorrendo ad un meccanismo di selezione
casualizzata o casuale. Tale meccanismo, che sintetizzabile in un insieme di regole e/o algoritmi,
viene denominato schema di campionamento.
Nellambito del campionamento probabilistico si considereranno le seguenti tecniche: casuale
semplice; sistematico; stratificato; a grappoli; a stadi.
PDF created with pdfFactory trial version www.pdffactory.com
6
Si parla di campionamento non probabilistico quando non ricorrono le condizioni viste per quello
probabilistico. Tale tipo di campionamento:
rappresenta la modalit prevalente nelle ricerche di mercato, nelle cd. Internet surveys e nei
sondaggi di opinione, per i quali la tempestivit la dimensione pi ricercata;
non consente inferenze sulle propriet statistiche dei metodi di stima utilizzati;
il rischio di distorcere la rappresentativit della popolazione elevato (bias);
non richiede la lista.
Di seguito si descrivono brevemente le forme pi comuni di campione non probabilistico che
possono essere raggruppate in due categorie: campioni ragionati e campioni fortuiti o a caso.
Campioni a scelta ragionata: sono formati senza alcun ricorso a meccanismi di casualizzazione.
La scelta delle unit da includere nel campione affidata al ricercatore (o al rilevatore) ed
operata il pi delle volte con obiettivi di rappresentativit di certi aspetti strutturali della
popolazione.
In tale ambito rientrano i campioni per quote, formati previa classificazione delle unit
della popolazione in gruppi. Il rilevatore deve selezionare unit appartenenti a ciascun
gruppo fino al raggiungimento di prestabilite quote, cio dimensioni, in modo da riprodurre
nel campione (relativamente ai gruppi formati) la struttura della popolazione.
Un altro tipo diffuso di campione ragionato quello formato da unit tipo, unit cio che a
giudizio di un esperto, cui demandata la loro selezione, possiedono caratteristiche ritenute
pi frequenti nella popolazione.
Molto simile al campione di unit tipo quello formato da aree barometro, circoscrizioni
territoriali nelle quali si riscontrano comportamenti analoghi a quelli medi dell'intera
popolazione.
Campioni selezionati fortuitamente o a caso. il termine a caso non deve essere confuso con
casualmente; questi campioni infatti non sono formati n con l'ausilio di tecniche di tipo
casuale, n seguendo procedimenti che implicano la preferenza da parte del rilevatore per
certe unit anzich per altre. Appartengono a questa categoria i campioni formati da:
volontari (i pazienti di un centro medico, i rispondenti ad un questionario inserito in
un giornale, ecc.);
unit che transitano da passaggi obbligati come frontiere, ingressi di edifici, le casse
di un supermercato, ecc.;
le parti pi accessibili di popolazioni generalmente formate da oggetti.

PDF created with pdfFactory trial version www.pdffactory.com
7
4. Campionamento probabilistico: strategia di campionamento e
disegno di campionamento
La selezione del campione e la stima dei parametri della popolazione rappresentano senz'altro i due
momenti di maggiore interesse teorico dell'indagine campionaria.
Le fasi relative alla selezione del campione e alla stima dei parametri della popolazione
costituiscono, in unaccezione ampia, la cosiddetta strategia di campionamento che comprende le
operazioni relative a:
l'identificazione delle unit campionarie;
l'individuazione di aggregati di unit per una eventuale selezione a pi stadi e
l'identificazione di elementi per la costruzione di strati e per la classificazione al loro interno
delle unit;
la scelta della metodologia per l'estrazione delle unit e per la stima dei parametri di
interesse.
Con il termine piano o disegno di campionamento si intende la distribuzione di probabilit p(c)
associata ai possibili campioni che sono selezionabili, sulla base di un prestabilito schema di
campionamento, da una data popolazione. Quindi nel disegno di campionamento si devono
precisare i seguenti elementi:
schema di campionamento e tecnica di estrazione;
universo dei campioni: insieme dei campioni di numerosit n che possono essere estratti
dalla popolazione di numerosit N secondo lo schema prefissato; il numero dei campioni
ottenibili C
N,n
noto come cardinalit delluniverso dei campioni;
probabilit di selezione di ciascuno dei campioni p(c) : probabilit che il campione c
sia estratto;
probabilit di inclusione del primo ordine
i
=P(U
i
c) : probabilit che il campione
estratto contenga lunit U
i
; o anche probabilit che lunit U
i
sia contenuta nel
campione estratto;
probabilit di inclusione del secondo ordine
ij
=P[(U
i
,U
j
) c] : probabilit che il
campione estratto contenga le unit U
i
e U
j
; o anche probabilit che le unit U
i
e U
j
siano
contenute nel campione estratto.

PDF created with pdfFactory trial version www.pdffactory.com
8
5. La stima delle caratteristiche della popolazione
La stima il procedimento statistico mediante il quale un valore ricavato come funzione delle
osservazioni campionarie viene assunto a rappresentare il valore incognito di un parametro di
interesse nella popolazione.
Il parametro oggetto dellindagine una funzione delle modalit osservabili sullinsieme delle unit
della popolazione ( )
N i
Y Y Y F , , , ,
1
K K .
I parametri di maggiore interesse sono:
il totale

N
i
i
Y T
1

la media
N
Y
Y
N
i
i

1

Nel caso di variabili quantitative tali parametri rappresentano lammontare totale del carattere nel
collettivo e lammontare medio. Nel caso di variabili qualitative i parametri rappresentano
rispettivamente la frequenza assoluta e la frequenza relativa, come si chiarir di seguito.
Volendo effettuare unindagine di tipo campionario, ai fini della stima di parametri necessario
definire la strategia di campionamento e, quindi, costruire un disegno di campionamento e scegliere
il relativo stimatore.
Nel campionamento dalle N unit della popolazione di selezione si devono estrarre n unit
campionarie u
(i)
. A partire dai valori del carattere Y osservati sulle unit campionate y
(i)
si procede
alla stima dei parametri della popolazione.
Campione
Unit campionarie
(etichette)
u
(1)
u
(2)
u
(j)
u
(n)

Valori di Y
(rilevati)
y
(1)
y
(2)
y
(j)
y
(n)


n: numerosit della popolazione
u
(i)
: etichetta dellunit estratta alli-esima estrazione
y
(i)
: valore della variabile di interesse rilevato sullunit
campionata u
(i)


Per effettuare la stima si utilizzano delle funzioni delle osservazioni campionarie o stimatori ed in
genere gli stimatori dei parametri considerati sono delle funzioni lineari, o in altri termini i valori
stimati si ottengono come combinazione lineare delle osservazioni campionarie. Si supponga di
voler stimare il totale di un carattere Y in una popolazione di N unit, uno stimatore di tipo lineare
PDF created with pdfFactory trial version www.pdffactory.com
9
avr la seguente espressione:
( ) ( )

c i
i i
w y T

. Dallo stimatore del totale possibile ricavare lo


stimatore della media della popolazione in quanto
N
T
Y da cui
( ) ( )


c i
i i
w y
N N
T
Y
1

.
Uno stimatore lineare molto utilizzato nel caso di campionamento senza ripetizione lo stimatore di
Horvitz-Thompson (HT) in cui i pesi w
(i)
sono dati dallinverso della probabilit di inclusione del
primo ordine
( )
( )

c i i
i
HT
y
T

. La formulazione dello stimatore si modifica in relazione al piano di


campionamento in quanto varia lespressione della probabilit di inclusione.
Lo stimatore HT corretto nel senso che il suo valore atteso nelluniverso dei campioni uguale al
parametro. Nonostante la correttezza, la maggior parte, se non la totalit, delle stime campionarie
differir in pi o in meno dal parametro della popolazione. In altre parole le stime campionarie
avranno una variabilit pi o meno elevata intorno al valore centrale rappresentato, come si detto,
dal parametro della popolazione. E' intuitivo che se questa variabilit elevata del pari elevata la
probabilit che la stima di un campione casuale risulti anche molto diversa dal parametro della
popolazione. Al contrario, se la variabilit piccola la distribuzione campionaria non solo centrata
ma anche addensata sul parametro della popolazione e, di conseguenza, alta la probabilit di
selezionare casualmente campioni con stime prossime al parametro della popolazione. Il grado di
addensamento della distribuzione campionaria intorno alla propria media una propriet che si
esprime con il termine precisione e si misura con un indice denominato errore standard. L'errore
standard la radice quadrata della varianza della distribuzione campionaria delle stime. La stima
della varianza dello stimatore HT data da:
( )
( ) ( )
( )( )
( )
( )
( )
( )

>

,
_

,
_


c i i j c j j
j
i
i
j i
j i
HT
y y
T v
,
2
1




dove
( )( )
0 >
j i
.
Nel campionamento con ripetizione si pu utilizzare lo stimatore di Hansen-Hurwitz (HH)
( )
( )

c i i
i
HH
np
y
T

in cui p
(i)
la probabilit di estrazione dellunit i-esima. La stima della varianza
dello stimatore data da
( )
( )
( )
2

) 1 (
1

,
_

c i
HH
i
i
HH
T
p
y
n n
T v

PDF created with pdfFactory trial version www.pdffactory.com
10
Quando il carattere di interesse di tipo qualitativo oggetto di stima la frequenza assoluta o
relativa delle unit della popolazione che possiedono un determinato attributo.
Se consideriamo un carattere dicotomico in cui lunit o possiede lattributo o non lo possiede, si
pu pensare ad una popolazione suddivisa in due classi e tale che se lunit appartiene a
variabile in esame assumer modalit 1 (Y
i
=1) altrimenti assumer modalit 0 (Y
i
=0).
Ad esempio se la variabile Y il sesso, si pu considerare Y
i
=0 se lunit i-esima maschio, Y
i
=1
se lunit i-esima femmina; se la variabile Y il titolo di studio, si pu considerare Y
i
=0 se
lunit i-esima diplomato, Y
i
=1 se lunit i-esima non diplomato.
In tal caso la frequenza assoluta delle unit della popolazione che appartengono alla classe si pu
derivare dalla formula del totale A Y T
N
i
i


1
, cos come la frequenza relativa sar ricavabile dalla
formula della media P
N
A
Y
N
Y
N
i
i


1
1
. Si tratta quindi di stimare il valore totale A o il valore
medio P di una variabile che assume valori 0 e 1.
PDF created with pdfFactory trial version www.pdffactory.com
11
6. Campionamento casuale semplice
Il campionamento casuale semplice (CCS) costituisce il metodo di campionamento pi elementare;
pu avere valenza autonoma, ma viene pi frequentemente utilizzato in congiunzione ad altre
tecniche.
Sebbene non sia molto diffuso nella pratica delle indagini, il campionamento casuale semplice
rappresenta il naturale punto di partenza per lo studio di tutti gli altri disegni campionari.
Il campionamento casuale semplice la tecnica che attribuisce la stessa probabilit di selezione ad
ogni insieme di n unit distinte della popolazione: con tale tecnica si seleziona un campione di
numerosit n da una popolazione di N elementi, senza o con ripetizione, in modo tale che ogni
possibile campione abbia uguale probabilit di essere estratto.
Consegue che anche ogni singola unit della popolazione ha la stessa probabilit di entrare a far
parte del campione. I disegni di campionamento che possiedono questa ultima propriet vengono
detti equiprobabilistici. Un disegno equiprobabilistico d luogo ad un campione cos detto
autoponderante.
Nella selezione di un campione casuale possibile scegliere se ogni unit possa entrare pi di una
volta nel campione. Se questa possibilit non ammessa il campionamento detto senza
ripetizione, altrimenti con ripetizione. Nella pratica, l'estrazione con ripetizione viene adottata
raramente.
Il CCS si caratterizza quindi per i seguenti elementi:
1. le unit di campionamento coincidono con le unit di rilevazione;
2. ciascuna unit possiede la stessa probabilit di inclusione nel campione (metodo
autoponderante);
3. qualsiasi sotto insieme di n elementi (campione) ha la stessa probabilit di estrazione.









C.C.S

Campione
Popo
lazio
ne
n
N

PDF created with pdfFactory trial version www.pdffactory.com
12












6.1 Campionamento casuale semplice senza ripetizione
Lassenza di ripetizione significa che ununit non pu entrare a far parte dello stesso campione pi
di una volta.
Lestrazione avviene attraverso un criterio sequenziale:
1. si seleziona un elemento dalla lista di N elementi con probabilit
N
1
.
2. dai rimanenti N-1 elementi si seleziona ununit con probabilit
1
1
N


n. dai rimanenti N-n+1 elementi si seleziona ununit con probabilit
1
1
+ n N

La via pi immediata per attuare questo schema di campionamento quella di ricorrere ad unurna:
alle unit della popolazione, numerate da 1 a N, si fanno corrispondere altrettante palline recanti tali
numeri; inserite le palline nellurna, si tratta di estrarre, una dopo laltra e senza reinserimento, n
palline; faranno parte del campione le n unit individuate dai numeri delle palline estratte.
Nella realt il procedimento di estrazione dallurna viene simulato tramite la generazione di n
numeri casuali compresi fra 1 e N. Tale funzionalit di generazione di numeri casuali presente in
molti software statistici e anche nel software Excel.


PDF created with pdfFactory trial version www.pdffactory.com
13
6.1.1 Piano di campionamento casuale semplice senza ripetizione
Il numero dei campioni distinti che possono essere estratti risulta pari a
! )! (
!
,
n n N
N
n
N
C
n N

,
_


La notazione k!, per k intero, denota il fattoriale di k: k! =k(k - 1)(k - 2)... 2 1.

Ciascun campione ha una probabilit costante, pari a
n N
C
,
1
, di essere estratto. Quindi la probabilit
di estrazione di un campione
!
! )! (
! )! (
!
1 1
) (
N
n n N
n n N
N
n
N
c P

,
_



Probabilit di inclusione del primo ordine: ogni unit U
i
della popolazione ha una probabilit di
inclusione nel campione costante e pari alla cosiddetta frazione di campionamento:
( )
N
n
n
N
n
N
c U P
i i

,
_

,
_


1
1


Probabilit di inclusione del secondo ordine: ogni coppia di unit (U
i
;U
j
) della popolazione ha una
probabilit di inclusione congiunta costante e pari a:
( ) [ ]
( )
( ) 1
1 2
2
,
,

,
_

,
_


N N
n n
n
N
n
N
c U U P
j i j i

PDF created with pdfFactory trial version www.pdffactory.com
14
Esempio del campionamento casuale semplice senza ripetizione

Popolazione: Antonio, Bruno, Carla, Daniela
N =4.
Campioni di dimensione n =2
Universo dei campioni e probabilit di estrazione del campione

Campioni distinti
Antonio, Bruno
Antonio, Carla Bruno, Carla
Antonio, Daniela Bruno, Daniela Carla, Daniela

6
2
12
1 2 1 2
1 2 3 4
! 2 ! 2
! 4
! 2 )! 2 4 (
! 4
2 , 4



C cardinalit delluniverso
167 , 0
6
1 1
) (
2 , 4

C
c P probabilit di estrazione del campione

Probabilit di inclusione del primo e del secondo ordine
( ) ( ) ( ) ( ) 5 , 0
4
2
c Daniela P c Carla P c Bruno P c Antonio P
i

( ) [ ] ( ) [ ] ( ) [ ]
( ) [ ] ( ) [ ] ( ) [ ]
6
1
12
2
3
1
4
2
, , ,
, , ,
,


c Daniela Carla P c Daniela Bruno P c Carla Bruno
c Daniela Antonio P c Carla Antonio P c Bruno Antonio P
j i




6.1.2 Stimatori dei parametri della popolazione
Nel caso di campionamento casuale a probabilit costanti il riferimento alle etichette non
necessario per cui si far riferimento a y
1
, y
2
, , y
n
come al campione ordinato.
Per il campionamento casuale semplice senza ripetizione lo stimatore del totale dato da:



n
i
i
n
i
i
n
i i
i
y
n
N
N n
y y
T
1 1 1
/


Il fattore N/n prende il nome di fattore di espansione: la stima dellammontare totale di un carattere
quantitativo data dallammontare totale campionario moltiplicato per il fattore di espansione alla
popolazione.
PDF created with pdfFactory trial version www.pdffactory.com
15
La stima della varianza dello stimatore data da
2 2
1
)

( s
n
f
N T v


dove ( )

n
i
i
y y
n
s
1
2 2
1
1
la stima della varianza della popolazione e
N
n
f la frazione di
campionamento.
Lo stimatore della media della popolazione dato dalla media campionaria


n
i
i
y
n
y Y
1
1


Si ha infatti: y y
n
y
n
N
N N
T
Y
n
i
i
n
i
i


1 1
1 1


La stima della varianza dello stimatore data da
2
1
)

( s
n
f
Y v

.
Lerrore standard dello stimatore la radice quadrata della varianza. Quindi dopo aver stimato
l'errore standard del totale o della media possibile, sotto certe condizioni, costruire un intervallo di
confidenza centrato su di essa, cio individuare due valori, gli estremi dell'intervallo, che hanno una
prestabilita probabilit di contenere al loro interno il parametro della popolazione. Sotto ipotesi di
distribuzione normale del carattere o nel caso in cui il campione sia di numerosit elevata si pu
assumere che lintervallo di confidenza al 95% per il totale e per la media della popolazione siano
dati rispettivamente da )

( 96 . 1

T v T t e )

( 96 . 1

Y v Y t .
Quando il carattere di interesse di tipo qualitativo oggetto di stima la frequenza assoluta A o
relativa P delle unit della popolazione che possiedono un determinato attributo.

Mentre gli stimatori del totale e della media rimangono invariati, le formule relative alle varianze si
semplificano in quanto si ha
)

1 (

1
1
)

( )

(
2
P P
n
f
N A v T v

1 (

1
1
)

( )

( P P
n
f
P v Y v


PDF created with pdfFactory trial version www.pdffactory.com
16
Esempio di stimatori nel campionamento casuale semplice senza ripetizione

Popolazione: Antonio, Bruno, Carla, Daniela
N =4.
Campioni di dimensione n =2
Distribuzione delle variabili Sesso e Reddito nella popolazione
i U(i) Sesso
Sesso:
dicotomico
Reddito
1
Antonio M
0 50
2
Bruno M
0 70
3
Carla F
1 90
4
Daniela F
1 110

I parametri relativi alla popolazione sono i seguenti
Reddito totale 320
Reddito medio 80
Femmine totale 2
Proporzione di femmine 0.50
Per ognuno dei campioni delluniverso possibile stimare il totale del reddito, il reddito medio e le
relative varianze:
y y T
n
i
i
4
2
4


2 2
2
1
4 )

( s
f
T v


y Y


2
2
1
)

( s
f
Y v


Stime dei parametri per i campioni delluniverso campionario:

Stime
Varianza
stimatore
Standard error
U
1
U
2
y
1
y
2
Totale Media Totale Media Totale Media
Antonio Bruno 50 70 240 60 800 50 28 7
Antonio Carla 50 90 280 70 3.200 200 57 14
Antonio Daniela 50 110 320 80 7.200 450 85 21
Bruno Carla 70 90 320 80 800 50 28 7
Bruno Daniela 70 110 360 90 3.200 200 57 14
Carla Daniela 90 110 400 100 800 50 28 7

PDF created with pdfFactory trial version www.pdffactory.com
17
Gli stimatori sono corretti in quanto il loro valore atteso uguale al parametro della popolazione:
Distribuzione campionaria degli stimatori
Totale Media Probabilit
240 60 0.17
280 70 0.17
320 80 0.33
360 90 0.17
400 100 0.17
( ) 320 17 . 0 400 17 . 0 360 33 . 0 320 17 . 0 280 17 . 0 240

+ + + + T E
( ) 80 17 . 0 100 17 . 0 90 33 . 0 80 17 . 0 70 17 . 0 60

+ + + + Y E

Analogamente per la stima del numero e della proporzione delle donne si ha:
Stime Varianza stimatore Standard error
U
1
U
2
y
1
y
2
Totale Percentuale Totale Percentuale Totale Percentuale
Antonio Bruno 0 0 0 0 0.0 0.0 0 0
Antonio Carla 0 1 2 0.5 2.0 0.1 1.41 0.35
Antonio Daniela 0 1 2 0.5 2.0 0.1 1.41 0.35
Bruno Carla 0 1 2 0.5 2.0 0.1 1.41 0.35
Bruno Daniela 0 1 2 0.5 2.0 0.1 1.41 0.35
Carla Daniela 1 1 4 1 0.0 0.0 0 0

Distribuzione campionaria degli stimatori
Totale PercentualeProbabilit
0 0 0.17
2 0.5 0.67
4 1 0.17
( ) 2 17 . 0 4 67 . 0 2 17 . 0 0

+ + A E
( ) 5 . 0 17 . 0 100 67 . 0 5 . 0 17 . 0 0

+ + P E


PDF created with pdfFactory trial version www.pdffactory.com
18
6.2 Campionamento casuale semplice con ripetizione
Si ha un campionamento casuale semplice con ripetizione quando vengono effettuate n estrazioni
indipendenti, tali che ogni unit della popolazione ha la stessa probabilit di essere estratta, pari a
N
1
. Una volta estratto, un elemento viene reinserito nella popolazione. Si tratta di una schema di
campionamento scarsamente usato nelle applicazioni.


6.2.1 Piano di campionamento del disegno casuale semplice con ripetizione
Il numero dei campioni ordinati con ripetizione che possono essere estratti risulta pari a
n
n N
N C
,

Ciascun campione ha una probabilit di essere estratto costante e pari a
n
N
c P
1
) (

Probabilit di inclusione del primo ordine: ogni unit della popolazione ha una probabilit di
inclusione nel campione costante e pari a:
( )
n
i i
N
N
c U P

,
_



1
1

Probabilit di inclusione del secondo ordine: ogni coppia di unit (U
i
;U
j
) della popolazione ha una
probabilit di inclusione congiunta costante e pari a:
( ) [ ]
n n
j i j i
N
N
N
N
c U U P

,
_

,
_



2 1
2 1 ,
,


PDF created with pdfFactory trial version www.pdffactory.com
19
Esempio del campionamento casuale semplice con ripetizione

Popolazione: Antonio, Bruno, Carla, Daniela
N =4.
Campioni di dimensione n =2

Universo dei campioni e probabilit di estrazione del campione
Campioni ordinati
Antonio, Antonio Bruno, Antonio Carla, Antonio Daniela, Antonio
Antonio, Bruno Bruno, Bruno Carla, Bruno Daniela, Bruno
Antonio, Carla Bruno, Carla Carla, Carla Daniela, Carla
Antonio, Daniela Bruno, Daniela Carla, Daniela Daniela, Daniela

16 4
2
2 , 4
C
0625 , 0
16
1 1
) (
2 , 4

C
c P

Probabilit di inclusione del primo e del secondo ordine

( ) ( ) ( ) ( )
16
7
16
9
1
4
3
1
4
1 4
1
2 2

,
_

,
_



c Daniela P c Carla P c Bruno P c Antonio P
i



( ) [ ] ( ) [ ] ( ) [ ]
( ) [ ] ( ) [ ] ( ) [ ]
8
1
16
4
16
4
16
9
2 1
4
2
4
3
2 1
4
2 4
4
1 4
2 1
, , ,
, , ,
2 2 2 2
,
+

,
_

,
_

,
_

,
_





c Daniela Carla P c Daniela Bruno P c Carla Bruno
c Daniela Antonio P c Carla Antonio P c Bruno Antonio P
j i



PDF created with pdfFactory trial version www.pdffactory.com
20
6.2.2 Stimatori dei parametri della popolazione

Per il campionamento casuale semplice con ripetizione gli stimatori della media e del totale sono
uguali al caso del campionamento senza ripetizione:



n
i
i
n
i
i
n
i i
i
y
n
N
N
y
n p
y
n
T
1 1 1
/ 1
1 1


n
i
i
y
n
y Y
1
1


Cambia per la varianza degli stimatori:
n
s
N T v
2
2
)

(
n
s
Y v
2
)

(
Anche in questo caso dopo aver stimato l'errore standard del totale o della media possibile, sotto
certe condizioni, costruire un intervallo di confidenza centrato su di essa.
Nel caso di caratteri qualitativi le varianze sono date da:
)

1 (

1
)

( )

(
2
P P
n
N
A v T v

1 (

1
1
)

( )

( P P
n
P v Y v


PDF created with pdfFactory trial version www.pdffactory.com
21
Esempio di stimatori nel campionamento casuale semplice con ripetizione

Popolazione: Antonio, Bruno, Carla
N =3.
Campioni di dimensione n =2
Distribuzione delle variabili Sesso e Reddito nella popolazione
i U(i) Sesso
Sesso:
dicotomico
Reddito
1
Antonio M
0 50
2
Bruno M
0 70
3
Carla F
1 90

I parametri relativi alla popolazione sono i seguenti
Reddito totale 210
Reddito medio 70
Femmine totale 1
Proporzione di femmine 0.33
Per ognuno dei campioni delluniverso possibile stimare il totale del reddito, il reddito medio e le
relative varianze:
y y T
n
i
i
3
2
3


2
3 )

(
2
2
s
T v
y Y


2
)

(
2
s
Y v
Stime dei parametri per i campioni delluniverso campionario:
Stime Varianza stimatore Standard error
U
1
U
2
y
1
y
2
Totale Media Totale Media Totale Media
Antonio Antonio 50 50 150 50 0 0 0 0
Antonio Bruno 50 70 180 60 900 100 30 10
Antonio Carla 50 90 210 70 3600 400 60 20
Bruno Antonio 70 50 180 60 900 100 30 10
Bruno Bruno 70 70 210 70 0 0 0 0
Bruno Carla 70 90 240 80 900 100 30 10
Carla Antonio 90 50 210 70 3600 400 60 20
Carla Bruno 90 70 240 80 900 100 30 10
Carla Carla 90 90 270 90 0 0 0 0
PDF created with pdfFactory trial version www.pdffactory.com
22

Gli stimatori sono corretti in quanto il loro valore atteso uguale al parametro della popolazione:
Distribuzione campionaria degli stimatori
Totale Media Probabilit
150 50 0.11
180 60 0.22
210 70 0.33
240 80 0.22
270 90 0.11

( ) 210 11 . 0 270 22 . 0 240 33 . 0 210 22 . 0 180 11 . 0 150

+ + + + T E
( ) 70 11 . 0 90 22 . 0 80 33 . 0 70 22 . 0 60 11 . 0 50

+ + + + Y E

Analogamente per la stima del numero e della proporzione delle donne si ha:
Stime Varianza stimatore Standard error
U
1
U
2
y
1
y
2
Totale Percentuale Totale Percentuale Totale Percentuale
Antonio Antonio 0 0 0 0 0.00 0.00 0.00 0.00
Antonio Bruno 0 0 0 0 0.00 0.00 0.00 0.00
Antonio Carla 0 1 1.5 0.5 2.25 0.25 1.50 0.50
Bruno Antonio 0 0 0 0 0.00 0.00 0.00 0.00
Bruno Bruno 0 0 0 0 0.00 0.00 0.00 0.00
Bruno Carla 0 1 1.5 0.5 2.25 0.25 1.50 0.50
Carla Antonio 1 0 1.5 0.5 2.25 0.25 1.50 0.50
Carla Bruno 1 0 1.5 0.5 2.25 0.25 1.50 0.50
Carla Carla 1 1 3 1 0.00 0.00 0.00 0.00
Distribuzione campionaria degli stimatori
Totale PercentualeProbabilit
0 0 0.44
1.5 0.5 0.44
3 1 0.11
( ) 1 11 . 0 3 44 . 0 5 . 1 44 . 0 0

+ + A E
( ) 33 . 0 11 . 0 1 44 . 0 5 . 0 44 . 0 0

+ + P E
PDF created with pdfFactory trial version www.pdffactory.com
23
7. Campionamento sistematico
Le tecniche di selezione del campionamento casuale semplice hanno la propriet che tutte le unit
del campione vengono estratte individualmente. Nel campionamento sistematico, invece, solo la
prima unit scelta casualmente, mentre le altre sono determinate in modo automatico secondo un
criterio prefissato.
Nel campionamento sistematico:
le unit della popolazione sono messe in sequenza
si associa ad esse un numero da 1 a N
si estrae un numero r casualmente
si seleziona la prima unit considerando lunit di campionamento associata al numero r
si selezionano le unit successive nel seguente modo
- partendo da r+1 e contando k posizioni si prende lunit che occupa il posto
r+k,
- partendo da r+k+1 e contando k posizioni si prende lunit che occupa il posto
r+k 2
- etc.
Il numero k detto passo di campionamento ed uguale allinverso della frazione di
campionamento.

Propriet del campionamento sistematico:
Se l'ordinamento delle unit della popolazione casuale, tale tecnica fornisce gli stessi risultati del
campionamento casuale semplice senza ripetizione. Se invece le unit sono elencate in modo da
rispettare lordine crescente o decrescente della variabile di interesse il campionamento sistematico
da preferire a quello casuale semplice perch pi rappresentativo. Di solito lordinamento viene
esplicitato ricorrendo ad una variabile ausiliaria correlata con la variabile di interesse. Ad esempio
in unindagine sui redditi dei lavoratori di una data categoria, si possono ordinare i lavoratori in
ordine di anzianit.
PDF created with pdfFactory trial version www.pdffactory.com
24

















A seconda che la numerosit N della popolazione sia o non sia multipla della numerosit n del
campione si ha, rispettivamente, il campionamento sistematico lineare o circolare

7.1 Campionamento sistematico lineare
Assumiamo che la numerosit della popolazione N sia multipla della numerosit del campione n.
Al fine di selezionare un campione di n unit
si seleziona casualmente la prima unit estraendo un numero r compreso tra 1 e
n
N
k
a partire dal numero r si seleziona ununit ogni k
in simboli le unit selezionate saranno quelle corrispondenti ai numeri
r, r+k, r+k 2, r+k 3,, r+k(n-1)


Passo di campionamento (k)



PDF created with pdfFactory trial version www.pdffactory.com
25
Esempio del campionamento sistematico lineare
N =20,
n =4
1. Le unit U
i
della popolazione sono messe in sequenza e si associa ad esse un numero da 1 a 20.
2. Si calcola il passo di campionamento 5
4
20

n
N
k
3. Si seleziona un numero compreso tra 1 e 5. Si supponga di aver selezionato il numero r=3. La
prima unit estratta quella corrispondente al numero 3 (es. U
3
).
4. Si selezionano successivamente le unit corrispondenti ai numeri 3+5=8, 8+5=13, 13+5=18.
Il campione sar costituito da U
3
, U
8
, U
13
, U
18
.

A seconda di quale sia il primo numero estratto fra 1 e 5, si possono avere i campioni costituiti dalle
unit di campionamento corrispondenti ai seguenti numeri
r=1 r=2 r=3 r=4 r=5
1 2 3 4 5
6 7 8 9 10
11 12 13 14 15
16 17 18 19 20


7.2 Campionamento sistematico circolare
Assumiamo che la numerosit della popolazione N non sia multipla della numerosit del campione
n.
In questo caso il passo di campionamento dato da
1
]
1

n
N
k dove con [ ] si intende
larrotondamento del rapporto
n
N
al numero intero inferiore o superiore.
Ad esempio se la numerosit della popolazione N =22, e quella del campione n =4, il passo di
campionamento dato da [ ] 5 5 , 5
4
22

1
]
1

1
]
1

n
N
k

PDF created with pdfFactory trial version www.pdffactory.com
26
In tal caso se si utilizza la procedura del campionamento sistematico lineare si ottengono dei
campioni di numerosit diversa a seconda di qual il primo numero estratto fra 1 e 5.

r=1 r=2 r=3 r=4 r=5
1 2 3 4 5
6 7 8 9 10
11 12 13 14 15
16 17 18 19 20
21 22
n= 5 5 4 4 4


Per ovviare a tale inconveniente si considera la lista circolare e, al fine di selezionare un campione
di n unit,
si seleziona casualmente la prima unit estraendo un numero r compreso tra 1 e N
a partire dal numero r si seleziona una unit ogni
1
]
1

n
N
k
lista circolare: se si arriva alla fine della lista si riparte dallinizio.

Esempio del campionamento sistematico circolare
N =22
n =4

1. Le unit U
i
della popolazione sono messe in sequenza e si associa ad esse un numero da 1 a 20.
2. Si calcola il passo di campionamento [ ] 5 5 , 5
4
22

1
]
1

1
]
1

n
N
k
3. Si seleziona un numero compreso tra 1 e 20. Si supponga di aver selezionato il numero r=9. La
prima unit estratta quella corrispondente al numero 9 (U
9
).
4. Si selezionano successivamente le unit corrispondenti ai numeri 9+5=14, 14+5=19, 19+5=24
24-22=2. Il campione sar costituito da U
9
, U
14
, U
19
, U
2


PDF created with pdfFactory trial version www.pdffactory.com
27
7.3 Piano di campionamento
Nel campionamento sistematico, come in quello casuale semplice, ogni unit della popolazione ha
la stessa probabilit di entrare a far parte del campione. Diversamente da quanto avviene nel
campionamento casuale semplice, tuttavia, in quello sistematico non tutte le n-ple hanno la stessa
probabilit di entrare a far parte del campione. Al contrario, fissato l'ordinamento della lista e
stabilito di selezionare la prima unit tra le prime k, sono soltanto k le n-ple selezionabili, ciascuna,
ovviamente, con probabilit 1/k.
Il piano di campionamento tale che ciascun campione ha una probabilit di essere estratto costante
e pari a
k
c P
1
) ( in quanto linsieme dei possibili campioni contiene soltanto N/n=k elementi.
Le probabilit di inclusione del primo ordine e del secondo ordine: sono uguali fra di loro e pari a
1/k.
( )
k
i
1

( )( )

'

altrimenti 0
estratto campione al no appartengo U e U se
1
(j) (i)
k
j i


PDF created with pdfFactory trial version www.pdffactory.com
28
8. Campionamento stratificato
Nel campionamento stratificato la popolazione suddivisa in sottogruppi, mutuamente esclusivi, in
base ad una o pi variabili ausiliarie o di classificazione. I sottogruppi cosi determinati sono detti
strati. Lo strato h, con h =1, 2, , H, contiene N
h
elementi.
Da ciascun sottogruppo viene estratto in maniera indipendente un campione di numerosit n
h
.
La stratificazione ha i seguenti obiettivi:
aumentare la precisione delle stime rispetto al campionamento casuale semplice, qualora i
sottogruppi siano omogenei al loro interno e disomogenei tra di loro;
facilitare e razionalizzare il campionamento, che pu presentare problematiche diverse nei
vari sottogruppi, come nel caso del campionamento della popolazione residente in zone
urbane o rurali;
conseguire stime per suddivisioni di interesse della popolazione.




















Campione
P
o
p
o
l
a
z
i
o
n
e
Maschi Femmine
Campione
P
o
p
o
l
a
z
i
o
n
e
Maschi Femmine

n=5
N=25
n=5
N=25

PDF created with pdfFactory trial version www.pdffactory.com
29
8.1 L'allocazione del campione negli strati
Una volta fissata la numerosit campionaria n, occorre decidere come allocare le n unit all'interno
degli strati. Si deve quindi definire la numerosit n
h
per ognuno degli strati in cui suddivisa la
popolazione.
Lallocazione pu essere:
con numerosit fissa: si estrae lo stesso numero di unit da ogni strato: n
1
=n
2
=n
h
=...=n
H


con numerosit proporzionale alla dimensione dello strato: si fissa la frazione di
campionamento data dal rapporto fra la numerosit del campione e la numerosit della
popolazione
N
n
f e si mantiene costante tale frazione in ogni strato: f
1
=f
2
=f
h
=...=f
H
.
Per la determinazione della numerosit dello strato h si applicher la frazione di
campionamento alla numerosit dello strato stesso
h h
N f n ;

ottimale o di Neyman: tiene conto della varianza negli strati e del costo. Il costo della
rilevazione pu essere considerato come somma di un costo fisso e di un costo funzione degli
strati. La funzione lineare di costo esprimibile come
h
H
h
h
n C C C

+
1
0
dove C
0
rappresenta i
costi fissi e C
h
il costo marginale di rilevazione nello strato h. La componente fissa, C
0
,
legata all'impiego di infrastrutture, mezzi tecnici (elaboratori elettronici), personale
(formazione degli intervistatori), ecc.. La componente variabile dipende dal numero delle
unit (spese di trasporto, telefoniche, di intervista, etc.), mediante un coefficiente C
h
(costo
marginale). Il campionamento viene effettuato utilizzando delle risorse date, rispettando cio
un budget assegnato. Pertanto ha senso chiedersi quale sia il modo ottimale di ripartire il
campione di n unit all'interno degli H strati. Pare logico, per n fissato, scegliere n
h
in modo
da minimizzare la varianza dello stimatore a parit di costo. La numerosit sar quindi data da

H
h
h h h
h h h
h
C S W
C S W C C
n n
1
0
/
/ ) (

dove
N
N
W
h
h
il peso dello strato sulla popolazione.
S
h
lo scarto quadratico dello strato.
PDF created with pdfFactory trial version www.pdffactory.com
30
L'allocazione ottimale dipende
- dalla dimensione W
h
dello strato,
- dalla variabilit, S
h
, del carattere all'interno dello strato (a parit di altre condizioni,
quanto minore l'omogeneit interna dello strato tanto maggiore sar il numero di unit
da selezionare per ottenere un campione rappresentativo),
- dal costo marginale, C
h.

Nel caso particolare in cui il costo marginale sia invariante rispetto allo strato (il costo
marginale uguale in ogni strato) si ottiene l'allocazione di Neyman, in cui la numerosit
data da

H
h
h h
h h
h
S W
S W
n n
1

Poich l'allocazione ottimale e di Neyman richiedono informazioni spesso non disponibili a
priori circa la dispersione del fenomeno all'interno degli strati, in genere si ricorre al
campionamento proporzionale


8.2 Piano di campionamento stratificato
Se come tecnica di estrazione del campione allinterno di ogni strato si considera il procedimento di
estrazione casuale senza reinserimento possiamo definire i seguenti elementi del piano di
campionamento.
Il numero dei campioni distinti che possono essere estratti risulta pari
( ) ( ) ( ) ! !
!
! !
!
! !
!
2 2 2
2
1 1 1
1
2
2
1
1
,
H H H
H
H
H
n N
n n N
N
n n N
N
n n N
N
n
N
n
N
n
N
C

,
_

,
_

,
_

L L
dove

,
_

h
h
n
N
il numero di campioni casuali semplici che si possono estrarre dallo strato h.

Ciascun campione ha una probabilit di essere estratto costante e pari a:

,
_

,
_

,
_


H
H n N
n
N
n
N
n
N C
c P
L
2
2
1
1 ,
1 1
) (

PDF created with pdfFactory trial version www.pdffactory.com
31
Probabilit di inclusione del primo ordine: ogni unit della popolazione ha una probabilit di
inclusione nel campione pari alla frazione di campionamento dello strato di appartenenza:

( )
h
h
i h i h
N
n
c U P
, ,
h=1,2,,H; i=1,2,,N
h


Probabilit di inclusione del secondo ordine:
se le unit (U
i
;U
j
) appartengono allo stesso strato h della popolazione la probabilit di
inclusione congiunta :
( ) [ ]
1
1
,
,


h
h
h
h
j i ij h
N
n
N
n
c U U P h=1,2,,H; i,j=1,2,,N
h


se le unit (U
i
;U
j
) appartengono a due strati diversi della popolazione la probabilit di
inclusione congiunta :
( ) [ ]
m
m
h
h
j i ij hm
N
n
N
n
c U U P ,
,
h,m=1,2,,H; i=1,2,,N
h
, j=1,2,, N
h



Esempio del campionamento stratificato

Popolazione: N =32 distinta in N
1
=24 maschi e N
2
=8 femmine
Campione n =8
Frazione di campionamento 25 . 0
32
8

N
n

Allocazione proporzionale: n
1
=6 maschi e n
2
=2 femmine

Probabilit di estrazione del campione
3768688
! 2 )! 2 8 (
! 8
! 6 )! 6 24 (
! 24
2
8
6
24
8 , 32

,
_

,
_

C cardinalit delluniverso
8 , 32
1
) (
C
c P probabilit di estrazione del campione

PDF created with pdfFactory trial version www.pdffactory.com
32
Probabilit di inclusione del primo e del secondo ordine
25 , 0
8
2
25 , 0
24
6
, 2
, 1


i
i


8
2
24
6
7
1
8
2
23
5
24
6
, 12
, 2
, 1

ij
ij
ij




8.3 Stimatori dei parametri della popolazione

Popolazione stratificata
Strato Elementi Numerosit Media
1 Y
11
... Y
1i
... Y
1N1
N
1
1
Y
2 Y
21
... Y
2i
... Y
2N2
N
2
2
Y
M M M M M M M
h Y
h1
... Y
hi
... Y
hNh
N
h
h
Y
M M M M M M M
H Y
H1
... Y
Hi
... Y
HNH
N
H
H
Y

Totale dello strato h:

h
N
i
hi h
Y T
1

Totale della popolazione:



H
h
N
i
hi
H
h
h
h
Y T T
1 1 1


Media dello strato h:

h
N
i
hi
h
h
Y
N
Y
1
1

Media della popolazione:



H
h
N
i
hi
h
H
h
h h
h
Y
N N
N Y
N
Y
1 1 1
1 1 1

PDF created with pdfFactory trial version www.pdffactory.com
33
Campione stratificato.
Strato Elementi Numerosit Media
1 y
11
... y
1i
... y
1n1
n
1
1
y
2 y
21
... y
2i
... y
2n2
n
2
2
y
M M M M M M M
h y
h1
... y
hi
... y
hnh
n
h h
y
M M M M M M M
H y
H1
... y
Hi
... y
HnH
n
H
H
y

Stimatore del totale dello strato h:
h h
n
i
hi
h
h
h
y N y
n
N
T
h


1


Stimatore della totale della popolazione:

H
h
h h
y N T
1


Varianza del totale:
( )

H
h
h
h
h
h
s
n
f
N T v
1
2 2
1



Stimatore della media dello strato h:
h
n
i
hi
h
h
y y
n
Y
h


1
1


Stimatore della media della popolazione:

H
h
h h
y N
N
Y
1
1


Varianza della media:
( )

H
h
h
h
h
s
n
f
Y v
1
2
1




PDF created with pdfFactory trial version www.pdffactory.com
34
9 Campionamento a grappoli
Presupposto di questo tipo di campionamento che la popolazione sia suddivisa, in modo naturale o
artificiale, in segmenti di sottoinsiemi di unit elementari legate da vincoli di contiguit spaziale o di
altra natura. Es. famiglie nelle indagini sugli individui, classi in unindagine sugli alunni di una certa
scuola.
I gruppi di unit prendono il nome di grappoli.
In termini generali nel campionamento a grappoli le unit campionarie non vengono scelte in modo
diretto, attingendo alla lista delle unit elementari che compongono la popolazione oggetto di studio,
ma viene estratto un certo numero di grappoli e tutte le unit ad essi appartenenti entrano a far parte del
campione.
Quindi lunit di campionamento un gruppo o grappolo di unit della popolazione e nel
campionamento a grappolo si seleziona un campione casuale di grappoli e tutte le unit ad esso
appartenenti sono oggetto di rilevazione.

Motivazioni:
Non disponibile una lista degli elementi della popolazione. La popolazione viene suddivisa in
unit areali (quartieri, sezioni di censimento, etc.) che sono oggetto di selezione.
Convenienza amministrativa e organizzativa. La sua valenza si esplica nei casi in cui i costi di
rilevazione aumentano al crescere della distanza tra gli elementi. Esso mira prevalentemente a
ridurre il costo marginale della rilevazione.
Analisi multilivello: i raggruppamenti costituiscono unit di interesse (corsi, scuole, etc.)

PDF created with pdfFactory trial version www.pdffactory.com
35
9.1 Piano di campionamento
Si assuma che il campionamento avvenga con estrazione senza ripetizione e si consideri la seguente
simbologia:
- N numero di grappoli nella popolazione
- n numero di grappoli nel campione
- M
i
numero di unit elementari del grappolo i
- M numero di unit elementari della popolazione
Il numero dei campioni distinti che possono essere estratti risulta pari
( ) ! !
!
,
n n N
N
n
N
C
n N

,
_


Ciascun campione ha una probabilit di essere estratto costante e pari a:

,
_


n
N C
c P
n N
1 1
) (
,

Probabilit di inclusione del primo ordine: ogni unit della popolazione ha una probabilit di
inclusione nel campione pari alla probabilit di inclusione del grappolo a cui appartiene

( )
N
n
c U P
i h i h

, ,


Probabilit di inclusione del secondo ordine:
se le unit (U
i
;U
j
) appartengono allo stesso grappolo la probabilit di inclusione congiunta :
( ) [ ]
N
n
c U U P
j i ij h
,
,


se le (U
i
;U
j
) appartengono a due grappoli diversi della popolazione la probabilit di inclusione
congiunta :
( ) [ ]
1
1
,
,


N
n
N
n
c U U P
j i ij hm



PDF created with pdfFactory trial version www.pdffactory.com
36
10. Campionamento a due stadi
Il presupposto di questo tipo di campionamento lo stesso di quello visto per il campionamento a
grappoli. In particolare necessario che la popolazione sia suddivisa, in modo naturale o artificiale, in
segmenti di sottoinsiemi (grappoli) di unit elementari legate da vincoli di contiguit spaziale o di altra
natura.
In termini generali nel campionamento a due stadi viene estratto un certo numero di grappoli e per ogni
grappolo selezionato si procede allulteriore campionamento delle unit ad esso appartenenti.
Quindi vi sono due livelli o stadi di campionamento
nel primo si estraggono i grappoli
nel secondo si estraggono le unit elementari.
Le unit di campionamento di primo stadio (o unit primarie) sono i grappoli; quelle di secondo stadio
(o unit secondarie) sono le unit elementari della popolazione.

A titolo di esempio si consideri di dover effettuare unindagine sulle famiglie italiane. Per tale indagine
occorrerebbe predisporre una lista completa di tutte le famiglie del paese. molto pi conveniente
selezionare prima un insieme di comuni che rappresentano grappoli di unit elementari- e quindi
allinterno di ogni comune estratto andare a selezionare un dato numero di famiglie. Le unit di primo
stadio sono quindi i comuni, mentre quelle di secondo stadio sono le famiglie.
La definizione di campionamento a due stadi pu essere generalizzata a quella di campionamento a pi
stadi.
Il piano di campionamento dipender dalle tecniche di estrazione delle unit di primo stadio e di
secondo stadio.

PDF created with pdfFactory trial version www.pdffactory.com
37
10. Errore di campionamento
Immaginiamo di aver effettuato unindagine esaminando ciascuna unit che compone il campione. A
questo punto, analizzando i dati forniti dal campione, si pongono due domande fondamentali:
(1) le conclusioni sono corrette per gli individui che compongono il campione?
(2) se s, il campione rappresenta bene la popolazione da cui stato estratto?
La risposta a queste due domande deriva dai concetti di validit interna e di validit esterna di uno
studio campionario.
La validit interna misura quanto i risultati di uno studio sono corretti per il campione di individui
studiati. Essa viene detta interna perch si applica alle condizioni del particolare gruppo di individui
studiati, e non necessariamente agli altri. Nel caso di dati ottenuti attraverso questionari, un fattore che
contribuisce ad abbassare la validit interna rappresentato dalla propensione degli intervistati a
mentire sistematicamente su determinate domande. La validit interna condizione necessaria ma non
sufficiente perch uno studio sia utile.
La validit esterna il grado di generalizzabilit delle conclusioni tratte da uno studio. In altre
parole, la validit esterna misura il grado di verit dell'assunto secondo cui gli individui studiati sono
"uguali" ad altri individui affetti dalla stessa condizione.
Se lo studio provvisto di ottima validit interna significa che conosciamo con esattezza le
caratteristiche del campione che abbiamo esaminato. Le conclusioni che ne abbiamo tratto sono
certamente valide per gli individui del campione, ma non possiamo dire se e quanto tali conclusioni
siano generalizzabili alla popolazione da cui il campione stato estratto. Per ora bastano due
considerazioni intuitive:
1. attraverso lo studio di un campione, si pu soltanto stimare (cio determinare con un certo margine
di errore) il carattere della popolazione da cui il campione deriva; tuttavia, tale carattere non potr
mai essere determinato con esattezza;
2. laccuratezza della stima direttamente correlata al numero di osservazioni che si compiono del
fenomeno in studio.
In sostanza, con qualunque metodo si effettui il campionamento, si otterranno dal campione dei
risultati che quasi certamente si discostano (poco o tanto) dalla vera misura della popolazione.
PDF created with pdfFactory trial version www.pdffactory.com
38
ben vero che il campione dovrebbe rappresentare unimmagine della popolazione ridotta dal punto di
vista numerico ma fedele dal punto di vista qualitativo. Tuttavia, non possiamo mai essere sicuri che il
campione rappresenti una copia perfetta della popolazione da cui esso stato estratto, a meno di non
esaminare... l'intera popolazione!
Infatti, posto N il numero di individui che compongono una popolazione, supponiamo di analizzare il
pi ampio campione possibile costituito da [N-1] individui. Ebbene, intuitivo che, anche in questo
caso, il campione non sar perfettamente rappresentativo della popolazione, in quanto l'unico
individuo non esaminato potrebbe possedere caratteri molto diversi da quelli di tutti gli altri [N-1]
individui.
L'errore di campionamento rappresentato dalla differenza tra i risultati ottenuti dal campione e la
vera caratteristica della popolazione che vogliamo stimare.
L'errore di campionamento non pu mai essere determinato con esattezza, in quanto la vera
caratteristica della popolazione ignota. Esso tuttavia pu essere contenuto entro limiti pi o meno
ristretti adottando appropriati metodi di campionamento. Inoltre, esso pu essere stimato; ci significa
che, con metodi statistici adatti, si possono determinare i limiti probabili della sua entit.










PDF created with pdfFactory trial version www.pdffactory.com
39
Riferimenti Bibliografici:
ISTAT (1989); Manuali di tecniche di indagine, voll. 1-6, Istat, collana metodi e norme, Roma
Frosini B. Montanaro M. Nicolini G. (1999) Il campionamento da popolazioni finite Metodi e applicazioni,
Utet

PDF created with pdfFactory trial version www.pdffactory.com