Sei sulla pagina 1di 27

Fonti

Formazione dei dati statistici:


1. Uso delle fonti – fonti statistiche ufficiali
2. Uso di strumenti di tipo stimolo-risposta

Fonti e dati nella ricerca sociale


Nelle scienze umane e sociali la ricerca si deve confrontare con diverse fonti di
informazioni e con diversi metodi di rilevazione e analisi dei dati:
- matrici di dati e serie storiche tratte da fonti ufficiali, rapporti, indagini,
censimenti...
- matrici di dati ottenute dalla compilazione di questionari, test
psicometrici...
- trascrizioni di osservazioni etnografiche della realtà
- trascrizioni di narrazioni orali frutto di interviste
- narrazioni raccolte in lettere, diari, storie di vita…
- articoli di giornale, abstract, saggi, interventi, discorsi pubblici…
- documenti scritti di interesse storico, politico, istituzionale,
amministrativo...

Fonti → Servono prima di tutto a evitare la molestia statistica


= meglio rinunciare all’indagine se può essere sostituita dal ricorso ad
apparati informativi esistenti

Il Paese è dotato di un ampio patrimonio di fonti statistiche


Vantaggi → continuità, comparabilità nazionale e internazionale, dettaglio
territoriale e copertura

Sistan
Il Sistema statistico nazionale (Sistan) è la rete di soggetti pubblici e privati che
fornisce al Paese e agli organismi internazionali l'informazione statistica ufficiale.
Istituito dal decreto legislativo n. 322 del 1989, il Sistan comprende: l'Istituto
nazionale di statistica (Istat); gli enti e organismi pubblici d'informazione
statistica (Inea, Isfol); gli uffici di statistica delle amministrazioni dello Stato e di
altri enti pubblici, degli Uffici territoriali del Governo, delle Regioni e Province
autonome, delle Province, delle Camere di commercio (Cciaa), dei Comuni, singoli
o associati, e gli uffici di statistica di altre istituzioni pubbliche e private che
svolgono funzioni di interesse pubblico.
Finalità:
- collegamento (e interconnessione) tra tutte le fonti pubbliche
- istituzione di un Ufficio statistico presso ogni amministrazione dello Stato
- attribuzione di compiti d’indirizzo e coordinamento all’ISTAT
- garanzia del principio di imparzialità e completezza nella produzione di dati
- garanzia diritto di accesso (dal Parlamento, a enti pubblici, fino ai singoli
cittadini)
- garanzia autonomia ISTAT (strutture, organizzazione, risorse)

Sin dall'origine, ma in maniera progressivamente crescente, in particolare dopo la


realizzazione della moneta unica e l'emanazione del regolamento europeo n.
223/2009, il Sistan opera in coerenza e come parte attiva del Sistema statistico
europeo (ESS – European Statistical System), ponendo al centro della
programmazione dell'offerta statistica le esigenze informative europee e
internazionali oltre che nazionali.

ISTAT (coordinatore)
L'Istituto nazionale di statistica svolge un ruolo di indirizzo, di coordinamento, di
promozione e di assistenza tecnica alle attività statistiche degli enti e degli uffici
facenti parte del Sistema statistico nazionale. Per l'esercizio di tali funzioni l'Istat
si avvale del supporto del Comstat e agisce tramite la Direzione centrale per il
coordinamento del Sistan e della rete territoriale dell'Istat.

www.sistan.it
https://ec.europa.eu/eurostat/web/european-statistical-system

www.istat.it
https://ec.europa.eu/eurostat

Tipi di indagini
Articolazione per referente statistico:
- famiglie e individui
- imprese
- indagini da fonte amministrativa

Articolazione per intensità di approfondimento e cadenza:


1. Indagini strutturali
un tempo tre censimenti decennali, oggi permanenti:
- popolazione
- industria e commercio
- agricoltura
2. Indagini correnti congiunturali
colgono le variazioni dei fenomeni anche tra ristretti spazi temporali (es.
trimestrali)
3. Indagini correnti non congiunturali
misurano i livelli dei fenomeni di solito con cadenza annuale
I principali settori tematici delle rilevazioni:
● Economico → produzione industriale, bilanci delle imprese, commercio,
turismo, forze di lavoro, prezzi ecc…
● Demografico → natalità, mortalità, movimenti migratori, ecc…
● Sociale → giustizia, istruzione, consumi culturali, consumi delle famiglie,
uso del tempo ecc…
● Sanitario → malattie, cause di morte, interruzioni volontarie di gravidanza
ecc…
● Ambientale → meteorologia, incendi, depuratori ecc…
● Amministrativo → conti pubblici, bilanci degli Enti Pubblici ecc…
● Assistenziale e previdenziale

Il nuovo censimento permanente


https://www.istat.it/it/censimenti-permanenti/popolazione-e-abitazioni
La rilevazione ha cadenza annuale e non più decennale ed è stata condotta per la
prima volta nel 2018. Il Censimento permanente non coinvolge più tutte le
famiglie nello stesso momento.
Coinvolge solo un campione che include circa 1 milione 400 mila famiglie, in
oltre 2.800 comuni.
I principali vantaggi introdotti dal nuovo disegno censuario sono un forte
contenimento dei costi della rilevazione e una
riduzione del fastidio a carico delle famiglie.
Il 22 dicembre si è conclusa l’ultima edizione del Censimento permanente della
popolazione e delle abitazioni, che coinvolge, come ogni anno, solo un campione
rappresentativo di famiglie.
Nel 2022 le famiglie che partecipano al Censimento sono 1 milione 326.995 in
2.531 Comuni sull’intero territorio nazionale.
La data di riferimento del Censimento è il 2 ottobre 2022, ossia le risposte ai
quesiti inseriti nel questionario devono essere riferite a questa data. I primi
risultati saranno invece diffusi a dicembre 2023

Cosa cambia per le famiglie?


La famiglia che fa parte del campione riceve una lettera che la invita a compilare
il questionario online.
La famiglia che fa parte del campione della rilevazione areale viene informata
dell’arrivo di un rilevatore, attraverso una lettera non nominativa e una locandina
affissa negli androni, nei cortili dei palazzi, ecc.
La famiglia che non fa parte del campione non riceve alcuna lettera.
Regole d'uso
Controlli da effettuare prima di utilizzare i dati di una fonte ufficiale:
- durata della serie temporale della rilevazione d’interesse, al fine di poter
costruire indicazioni di dinamica dei fenomeni rilevati;
- stabilità temporale degli aspetti metodologici con cui si è costruita la fonte;
- data di riferimento dell’ultima rilevazione, al fine di valutare
l’appropriatezza temporale delle analisi che si intende fare (se si tratta,
come spesso accade, di materiali non tempestivi);
- natura censuaria o campionaria della rilevazione, in entrambi i casi per
verificare l’eventuale presenza di fattori di distorsione;
- caratteristiche del percorso di raccolta dei moduli di rilevazione, in
particolare per disporre di elementi di giudizio sull’accuratezza della
procedura e su eventuali effetti distorcenti delle modalità di contatto con i
fornitori delle informazioni
- natura delle definizioni concettuali sottostanti ai fenomeni rilevati, al fine di
verificarne la congruenza con gli obiettivi conoscitivi ed interpretativi del
personale progetto di studio;
- natura delle classificazioni (delle modalità) delle variabili con cui vengono
rilevati i fenomeni d’interesse, al fine di considerarne la conciliabilità con il
dettaglio conoscitivo dell’autonomo studio;
- natura delle tabulazioni presentate nella pubblicazione, al fine di verificare
la presenza delle combinazioni di variabili che consentano l’analisi delle
ipotesi relazionali poste a base dello studio

Attività
Test: 10 cose che sai sulla popolazione
http://censimentigiornodopogiorno.it/giochi-istat/10-cose-che-sai/

Sei nella media?


http://censimentigiornodopogiorno.it/giochi-istat/6-nella-media/

Gioca con Istat


http://censimentigiornodopogiorno.it/giochi-istat/

Guarda il video sul censimento permanente


https://youtu.be/ebtteIeoqyg
Sondaggi
Indagine o sondaggio?
Il sondaggio è un caso limite di indagine sociale.
Per alcuni aspetti assomiglia a un'indagine sociale ma per molti altri aspetti non
ne ha le caratteristiche.

Un problema di scopi e di impianto:


- costi ridotti
- tempi rapidi
- argomento circoscritto
e, soprattutto, in un sondaggio
- non si indagano mai le «motivazioni profonde»

Sondaggi
Conoscere le opinioni di molti attraverso le risposte di pochi (Barisione e
Mannheimer 1999)

Un’indagine puramente esplorativa, volta ad accertare l’esistenza e la consistenza


di un fenomeno. (Corbetta 1999)

Strumenti di rilevazione:
Si utilizzano solo questionari. L'uso dell'intervista aperta è molto raro.
● PAPI → paper and pencil interview
● CATI → intervista telefonica (è il più usato perché economico)
● CAPI → intervista personale a sistema computer
● CAWI → problemi: basso tasso di risposta (a meno che non si utilizzi un
panel, persone che decidono di rispondere a dei sondaggi spesso in cambio
di benefit, utili per studiare le transizioni di voto o l’opinione riguardo le
famiglie arcobaleno); pro: economico, facilità di raggiungere le persone
● Face-to-face
Sondaggi politico-elettorali
Legge 22 Febbraio 2000, n. 28
"Disposizioni per la parità di accesso ai mezzi di informazione durante le
campagne elettorali e referendarie e per la comunicazione politica"
Art. 8.
(Sondaggi politici ed elettorali)
1. Nei quindici giorni precedenti la data delle votazioni è vietato rendere
pubblici o, comunque, diffondere i risultati di sondaggi demoscopici
sull'esito delle elezioni e sugli orientamenti politici e di voto degli elettori,
anche se tali sondaggi sono stati effettuati in un periodo precedente a
quello del divieto.
2. L'Autorità determina i criteri obbligatori in conformità dei quali devono
essere realizzati i sondaggi di cui al comma 1.
3. I risultati dei sondaggi realizzati al di fuori del periodo di cui al comma 1
possono essere diffusi soltanto se accompagnati dalle seguenti indicazioni,
delle quali è responsabile il soggetto che ha realizzato il sondaggio, e se
contestualmente resi disponibili, nella loro integralità e con le medesime
indicazioni, su apposito sito informatico, istituito e tenuto a cura del
Dipartimento per l'informazione e l'editoria presso la Presidenza del
Consiglio dei ministri:
a. soggetto che ha realizzato il sondaggio;
b. committente e acquirente;
c. criteri seguiti per la formazione del campione;
d. metodo di raccolta delle informazioni e di elaborazione dei dati;
e. numero delle persone interpellate e universo di riferimento;
f. domande rivolte;
g. percentuale delle persone che hanno risposto a ciascuna domanda;
h)data in cui è stato realizzato il sondaggio.

Effetti riconosciuti
Effetti dei sondaggi sul comportamento politico riconosciuti dalla letteratura
scientifica:
1. l'effetto bandwagon: salto sul «carrozzone» del vincitore → gli elettori
tendono a spostarsi verso il partito che i sondaggi danno per vincente;
2. l'effetto underdog: «soccorso» del perdente → del partito dato per
sfavorito/sconfitto nel confronto, nella duplice forma della mobilitazione
elettorale (andare a votare anche se si era già deciso di astenersi per evitare
la sconfitta del partito più vicino) e del voto utile (passare dal partito
preferito al partito più vicino per non favorire un terzo partito più lontano e
temuto).
Assirm
L'Associazione tra istituti di ricerche di mercato, sondaggi di opinione e ricerca
sociale (Assirm) è l'organizzazione che raggruppa le aziende italiane del settore
(http://www.assirm.it)
L'Assirm ha predisposto un codice di autodisciplina e un insieme di standard di
qualità. Gli associati Assirm sono tenuti (con i loro clienti e committenti) a
rispettare le norme dell'ESOMAR (www.esomar.org) per (l'eventuale) diffusione dei
risultati.
Nel 1995 l'Assirm ha sottoscritto con il Consiglio Nazionale dell'Ordine dei
Giornalisti un protocollo di intesa che impegna i firmatari a fare in modo che la
pubblicazione di risultati di sondaggi sia sempre corredata dalle informazioni
previste dal codice ESOMAR.
Nel 2006 l'Assirm ha formulato un «decalogo» per un corretto uso e una
responsabile diffusione dei sondaggi elettorali.
Esomar

Agcom
La legge n. 249 del 1997 istituisce l'Autorità per le garanzie nelle comunicazioni
(www.agcom.it).
Fra le competenze attribuite all'Agcom c'è la «verifica che la pubblicazione e la
diffusione dei sondaggi sui mezzi di comunicazione di massa siano effettuate
rispettando i criteri contenuti» in un apposito regolamento in materia di
pubblicazione e diffusione dei sondaggi sui mezzi di comunicazione di massa
(luglio 2002 delibera Agcom n. 153/02/Csp, e successive modifiche es. delibera
Agcom n. 237/03/Csp).
Il regolamento specifica le modalità di pubblicazione e diffusione dei sondaggi,
descrive le attività di verifica svolte dall'Agcom e le sanzioni da applicare ai
soggetti che violano il regolamento.
Regolamento Agcom
Per i sondaggi politico-elettorali sono richiesti:
1. «nota informativa»
La nota informativa deve essere evidenziata in un apposito riquadro nel
caso di diffusione a mezzo stampa, letta al pubblico in caso di
radiodiffusione o trasmessa per tutta la durata di illustrazione dei risultati
in caso di diffusione televisiva;
2. «documento»
Chi realizza il sondaggio è tenuto a spedire all'Autorità un documento con
l'indicazione delle metodologie adottate per la realizzazione, e della
significatività e limiti dei risultati ottenuti, oltre ad ogni elemento utile al
fine della verifica, da parte dell'Agcom della corrispondenza effettiva di tali
metodologie a quelle dichiarate dal soggetto realizzatore del sondaggio. Il
soggetto che ha realizzato il sondaggio deve inoltre fornire le eventuali
informazioni aggiuntive richieste dall'Autorità al fine di effettuare ulteriori
verifiche.
Nota informativa
Riprende le normative del codice ESOMAR. Ogni diffusione di risultati di sondaggi
deve essere accompagnata da una «nota informativa» con:
- il soggetto realizzatore del sondaggio;
- il nome del committente e dell'acquirente del sondaggio;
- il tipo di rilevazione, l'universo o collettivo di riferimento, la tipologia degli
intervistati e il tipo di campione, specificando che si tratta di un sondaggio
rappresentativo;
- l'estensione territoriale del sondaggio (nazionale, regionale, provinciale...);
- la consistenza numerica del campione di intervistati, il numero o la
percentuale dei non rispondenti e delle sostituzioni effettuate;
- la data o periodo in cui è stato condotto il sondaggio;
- il testo integrale delle domande rivolte ai rispondenti oggetto della
pubblicazione o diffusione dei risultati del sondaggio;
- indirizzo (sito) dove è disponibile il documento completo riguardante il
sondaggio.

Documento
Il documento deve riportare i seguenti elementi:
- soggetto che ha realizzato il sondaggio;
- committente e acquirente;
- tipo e oggetto del sondaggio (opinioni etc.), universo o collettivo di
riferimento, unità intervistate, tipo di campionamento, sui criteri per la
formazione del campione;
- estensione territoriale del sondaggio, luoghi dove é stata effettuata la
rilevazione (regioni, province, comuni, circoscrizioni comunali);
- data o periodo in cui è stato realizzato il sondaggio;
- metodo di raccolta delle informazioni;
- testo integrale di tutte le domande rivolte ai rispondenti;
- consistenza numerica del campione, numero dei non rispondenti e delle
sostituzioni effettuate, percentuale delle persone che hanno risposto a
ciascuna domanda;
- verifica della coerenza delle risposte alle diverse domande;
- rappresentatività dei risultati, in termini di «margine di errore», al livello
fiduciario del 95%, delle stime ottenute (valori assoluti, medie, percentuali,
etc.) per le variabili più importanti rispetto agli obiettivi del sondaggio;
eventuali limiti interpretativi dei risultati contenuti nelle tabelle diffuse.
Ulteriori problemi
Non c'è una regolamentazione per quello che riguarda i sondaggi on line (che
riguardano i visitatori dei siti web e non campioni con caratteristiche
controllabili).
La conduzione dei sondaggi non è vietata nel periodo immediatamente precedente
le elezioni lo è soltanto la diffusione pubblica dei risultati.
Se è relativamente agevole distinguere i sondaggi «sull'esito delle elezioni» e «sugli
orientamenti di voto degli elettori» dagli altri, è più arduo identificare i sondaggi
«sugli orientamenti politici» o «sulle opinioni politiche».

www.sondaggipoliticoelettorali.it

La credibilità dei sondaggi


Problemi:
- la grande diffusione dei pseudo-sondaggi (effetti anche culturali)
- la concreta disponibilità di finanziamenti

La credibilità dei sondaggi:


● L'argomento
● Gli obiettivi
● Le risorse finanziarie
● Le risorse umane e tecniche
● Destinatari
● Strumenti
● Popolazione
● Timeline
● Raccolta dei dati
● Test&train
● Risultati
● Rapporto finale
● Prosecuzione

Una (vecchia) ricerca


Elezioni politiche 13-14 aprile 2008
Osservazione nel mese antecedente le lezioni (marzo 2008)
7 quotidiani:
● 5 quotidiani nazionali
○ La Repubblica
○ Il Corriere della Sera
○ Il Manifesto
○ Il Giornale
○ L'Unità
● 2 locali
○ La Tribuna di Treviso
○ Il Gazzettino

53 articoli con risultati di sondaggi pre-elettorali.


Variabili prese in considerazione:
- realizzatore del sondaggio
- committente del sondaggio
- periodo di realizzazione
- criteri di formazione del campione numerosità del campione
- metodo di raccolta dati
- testo delle domande
- percentuali di rispondenti per ogni domanda sito internet di riferimento.

Tesi di laurea in Comunicazione


Pseudo sondaggi
Si parla di sondaggio demoscopico...
... ma poi nelle trasmissioni si propongono pseudo-sondaggi
Chi rappresentano?
La popolazione...
... o gli spettatori?
Gli spettatori...
... o solo la parte più attiva?
Gli spettatori che partecipano sono indipendenti dall'argomento?
Gli spettatori che partecipano sono indipendenti dall'opinione?

Pseudo sondaggi televisivi


- Via telefono (CATI)
- Via social media
- ...
Meccanismo di auto-selezione (le persone si offrono volontarie)→ non sono
rappresentativi della popolazione, al massimo degli ascoltatori (forse → non è
necessariamente vero, può essere la motivazione per l’argomento a spingere al
voto)
Infatti, chi telefona/invia messaggi/clicca sul web... rappresenta la parte più
attiva degli spettatori.
L’argomento incide in questo senso (impatto diverso sull’insieme degli spettatori)
Spesso avviene una sovra-rappresentazione delle posizioni più forti, succede
questo perché gli indecisi partecipano di meno. Questo fa sottostimare la
percentuale di indecisi → problema.
→ hanno valenza minima perche l’idea di distribuzione che danno non è
realistica.

Inchiesta? Intervista giornalistica?


E l'intervista giornalistica?
L'intervista nella ricerca sociale e nell'inchiesta giornalistica:
- carattere privato (anonimo) vs. fruibile dal pubblico
- ottica comparativa vs. interesse per il singolo caso
- sistema metodologico (costruzione, sintesi, analisi dei dati, comunicazione
dei risultati) vs. sistema delle regole giornalistiche (es. suscitare clamore)

Campionamento
Una definizione di orientamento:
“Costruire un campione vuol dire selezionare una parte (campione) di un tutto
(popolazione), con procedimenti e regole che garantiscano la capacità della prima
a rappresentare significativamente gli aspetti essenziali del secondo.”
Lorenzo Bernardi

Parole chiave nella definizione:


- costruire → capire quali sono le scelte che possiamo adottare
- selezionare → equiprobabilità di essere estratti
- procedimenti e regole → corretti procedimenti operativi
- significativamente → possibilità di poter generalizzare (inferenza statistica
→ errore accettabile e controllabile perchè non sto interrogando tutti ma
solo una parte quindi è normale ci siano errori)
intervallo fiduciario → devo capire il livello di fiducia delle mie stime
- rappresentare → rappresentare popolazione oggetto della ma indagine
- essenzialità → sottoinsieme analizzato di alcune …, popolazione analizzata
riguardo aspetti essenziali

Concetti basilari:
- popolazione
- unità statistica → elemento che costituiscono l’oggetto di
- disegno di campionamento → insieme di decisioni assunte per determinare
il campione
- strategia di campionamento → vari tipi di campionamento
- modalità di estrazione delle unità campionarie → necessità conoscenza a
priori delle probabilità di inclusione (ho bisogno di numeri casuali e/o
estrazione sistematica che prevede la presenza di una lista ordinata)
- stime → porta con se errori
- errore di campionamento → posso stabilirlo a priori e determinare
l’affidabilità delle stime
- errore non campionario → es liste non corrette (mancano o ci sono persone
in più, questionario fatto male, distorsioni da parte dell’intervistatore, errori
nell'emissione dati (nel cawi è minima)

Specificazione del concetto di Disegno. I fattori costitutivi sono rappresentati da:


- scelta della strategia
- criteri di identificazione/selezione delle unità
- definizione numerosità campionaria
- attenzioni da prestare per limitare errori non campionari
- scelte in funzione del budget

Principali strategie di campionamento

Strategie non probabilistiche:


- campionamento per quote
- campionamento a scelta ragionata
- campionamento a cascata

Strategie probabilistiche:
- casuale semplice
- stratificato proporzionale
- stratificato ottimale
- a stadi

Campionamento casuale semplice


→ è una strategia basilare di tipo probabilistico
Principio: equiprobabilità a priori di estrazione per tutte le unità della popolazione
Condizioni (implicazioni operative):
- disponibilità di una lista corretta (non persone in più e non devono
mancare persone)
3 rischi (possono essere superati con un buon lavoro di bonifica delle liste):
1. la sottocopertura: la lista non è completa;
2. la sovracopertura: la lista contiene unità statistiche non afferenti
all’aggregato;
3. la duplicazione: la molteplice presenza di una stessa unità dentro la
lista.
- modalità di estrazione delle unità che assicurino il principio
dell’equiprobabilità (individualizzazione di un criterio di estrazione delle
unità campionarie che salvaguardi il principio dell’equiprobabilità):
a) estrazione casuale dall’ipotetica urna
b) estrazione sistematica (da tavole di estrazione casuale o generatori di
numeri)

Questo significa che ad ogni unità statistica è associato un numero da 1 a N e che


vengono estratti n numeri casuali con valore compreso tra 1 e N.
Ciò determina una uguale probabilità di estrazione per tutte le unità statistiche
n
pari a 23 .
N

n = numerosità prevista del campione (compreso tra 1 e N)


Ni = è parte persone appartenenti a questo strato (rispetto alla popolazione
totale)
N = è tutta la popolazione

❖ popolazione di numerosità N
❖ campione di numerosità n
n
❖ probabilità di inclusione =
N

Selezione sistematica delle unità statistiche campionarie


→ alternativa utilizzata per superare problemi logistici e organizzativi.
N
● stabilire passo si campionamento o modulo, tramite il rapporto k =
n
● estrarre un numero casuale “r” tra 1 e k (con generatore) 1 ≤r ≤ k
● estrarre i successivi: r,r+k, r+2k, r+3k …, r+(n-1)k

K = passo di campionamento
vedi libro pag 107 precedenti e successive

La grande facilitazione operativa di questa prassi è ridimensionata da due fattori


di disturbo:
- la presenza di ciclicità nella lista: se estraggo giorni dell’anno per misurare
la frequenza della clientela di un grande magazzino e il passo di
campionamento è 7 ricado sempre nello stesso giorno
- il rapporto N/n non è un numero intero

Campionamento stratificato proporzionale


→ è la strategia che si adotta quando si è in possesso di due condizioni aggiuntive
rispetto al campionamento semplice.
Principi:
1) si dispone di informazioni aggiuntive (oltre alla lista) sulle unità della
popolazione (come genere ed età);
2) tali informazioni sono correlate alla variabile da stimare

Conseguenza: è possibile definire strati della popolazione presumibilmente


omogenei rispetto alla variabile oggetto di studio (con medie di strato diverse)

Il primo compito, come si nota, comporta un leggero appesantimento degli oneri


operativi, ulteriormente aggravato dal terzo impegno: occorre, infatti, formare
tante subliste di unità statistiche quanti sono gli strati formati dalla
combinazione delle modalità delle variabili di stratificazione e adottare poi
all'interno di ciascuno strato il procedimento di selezione casuale di unità
statistiche secondo l'itinerario descritto al paragrafo precedente.
La seconda operazione è, invece, una scelta tecnica direttamente conseguente alla
disponibilità o meno di ipotesi sulla specifica variabilità interna agli strati della
variabile di studio.
Nel caso di assenza di tale ipotesi, la scelta naturale è quella del campionamento
stratificato proporzionale con il quale, per ciascuno strato, si preleveranno unità
campionarie secondo la seguente regola di ripartizione:
Ni
ni = ⋅n
N
oppure:
ni =wi ⋅n
dove:
N
w i=
Ni❑
ni = numerosità campionaria per lo strato i (maschi o femmine);
n = numerosità campionaria totale;
N i = numerosità della popolazione nello strato i;
N = numerosità totale della popolazione.

Condizione: per ogni strato della popolazione si estrae una numerosità


campionaria pari a ni= Ni/N*n, con tecnica di estrazione per ogni strato come nel
campionamento casuale semplice.
ni (=totale persone da campionare in questo strato) sarà un numero minore di 1
→ anche definito Wi (ovvero il peso (Weight) della parte della popolazione, dello
strato di popolazione) → quello che è rilevante è come calcolo ni
¿
ni = N ⋅ n

¿ 90
N ⋅ 160 = 0,56 = ni (totale delle persone che devo campionare in quello strato)

Campionamento stratificato ottimale


Principio: oltre ai principi dello stratificato proporzionale, si presume ( o si
conosce) che anche le varianze dei singoli strati siano diverse
Condizione: per ogni strato si estrae secondo la seguente formula:
wi ⋅ σ i
ni = ⋅n
∑ i wi ⋅ σ i

w i = peso Ni ⋅N (complesso popolazione)


σ i = misura variabilità nello strato i della variabile oggetto di studio, varianza
riferito a maschi o femmine
∑ = vado a sommare tante volte quante sono le mie i i componenti
20 = campione
strato = parte di popolazione (maschi o femmine in questo caso)
[0,56 femmine e 0,44 maschi]
ni = maschi / femmine
σ1 = varianza femmina
σ2 = varianza maschi

Wi⋅ σ 1 0 ,56 ⋅2 1 ,12


n1 = ∑ wiσi
⋅ n=
o , 56 ⋅2+o , 44 ⋅9
⋅20 = n1 = ⋅
6 ,16 +3 , 96 20 = 2,213

varianza = misura della variabilità


variabile con numeri casuali

Campionamento a stadi
Condizione: non si dispone con facilità della lista delle unità finali d’indagine (per
numerosità, per estensione territoriale): es. maturandi
Soluzione: si procede per campionamenti successivi di popolazioni che
contengono le unità finali (es. Province poi Istituti scolastici poi classi infine
maturandi)
Limiti: si commette un errore campionario in ogni stadio
Vantaggi: puramente operativi

Numerosità campionaria
Dipende dalla variabilità insita nella variabile di studio
Dipende dall’errore che si accetta di commettere
Dipende dal grado di fiducia che si vuole attribuire alla stima
Non è importante la frazione di campionamento ma la numerosità del campione

2 a
K ⋅
2
a
= probabilità di trovarsi agli estremi della distribuzione
2
2 a
K ⋅ = 1,96 (1.96 ^2) → alla fine ottengo un numero che è circa 4
2
2
E = errore che posso commettere al massimo (posso fissarlo a mio piacimento e
influenza il campione)
n= numerosità campionaria progressiva ( poi posso dividerla all’interno degli
strati)
N = popolazione intera da intervistare

Regole per estrarre un campio


Nella pratica ci sono alcuni siti che lo fanno

Confidence level 95% sempre (standard in statistica)


Errori non campionari

Nelle indagini sociali possono essere più grandi dell’errore di campionamento:


- errata definizione della popolazione
- errori nella lista (sottocopertura, sovracopertura, duplicazioni)
- errori nello strumento di rilevazione (errori nel questionario)
- effetto intervistato (es: desiderabilità sociale, può mentire)
- eventuale effetto intervistatore (può influenzare le risposte)
- mancata risposte (non trovati, rifiuti, ecc)
- errori nelle fasi di codifica, imputazione, elaborazione dei dati
Ci possono essere diversi tipi di errori non campionari che non posso controllare
e poi c’è l’errore campionario che posso controllare.
Il rettangolo rosso scuro/marrone è il
campione che estraggo, dove calcolo "n". Ma
non tutti mi hanno risposto, i rispondenti
sono 3, nel quadrato rosso. Posso calcolare
il tasso di risposta. N2= campione, abbiamo
un tasso del 75% di risposta.
Parto da N cioe popolazione complessina,
estraggo il campione Ni, e poi ho quelle che
mi rispondono N3, e divido N2 con N3 —>
ottengo 75%

Ho estratto 4 numeri casuali da 1 a 12


e li intervisto
Estraggo casualmente una
persona nello strato uno due
persone nello strato due e una
persona nello strato tre
Quando dentro le classi prendo
tutti
Da 6 grappoli diversi ne
prendo 2
Può essre utile pr l’ISTAT che
interroga tutti i componenti
della famiglia

Invio a 3 persone il questionario e


invito a condividerlo

Problema non sto controllando la


numerosità campionaria
Devo capire quando fermarmi

Rischio di arrivare ad un gruppo


chiuso
Non lo mandano a componenti esterni

Potrebbero piacerti anche