INDICE

QUALITA’ DELLE INFORMAZIONI STATISTICHE RACCOLTE TRAMITE LE INDAGINI CAMPIONARIE ........ 4
QUALITA’ DELL’INFORMAZIONE STATISTICA ...................................................................................... 4
L’INFORMAZIONE STATISTICA può essere di 3 tipologie: ................................................................... 4
DEFINIZIONI DI QUALITA’ DELL’INFORMAZIONE STATISTICA: ............................................................ 5
ERRORE STATISTICO O TOTALE ........................................................................................................... 5
ERRORE STATISTICO CAMPIONARIO ................................................................................................... 6
ERRORE STATISTICO NON CAMPIONARIO .......................................................................................... 6
ERRORE STATISTICO VARIABILE .......................................................................................................... 6
ERRORE STATISTICO SISTEMATICO o DISTORSIONE ........................................................................... 7
LEZIONE DEL 03/03/08 ............................................................................................................................ 8
FASI DELL’INDAGINE(ISTAT): ............................................................................................................... 9
ERRORI DI LISTA ................................................................................................................................ 10
ERRORI DI NON RISPOSTA ................................................................................................................. 12
ERRRORI DI MISURA .......................................................................................................................... 12
CAUSE DEGLI ERRORI NON CAMPIONARI nelle varie fasi ..................................................................... 13
FASE 1: DEFINIZIONE OGGETTO ........................................................................................................ 13
FASE 2 ................................................................................................................................................ 13
FASE 3 ................................................................................................................................................ 14
FASE 4 ................................................................................................................................................ 16
LEZIONE 10/03/08 ................................................................................................................................. 16
LE CLASSICHE  TECNICHE DI RILEVAZIONE O DI SOMMINISTRAZIONE SONO 3: ............................... 17
NON RISPOSTE : ................................................................................................................................ 17
MANCATE RISPOSTE PARZIALI: ......................................................................................................... 18
ERRORI DI MISURA O ERRORI DI RISPOSTA ...................................................................................... 19
ERRORI DOVUTI AL RISPONDENTE: .................................................................................................. 19
ERRORI CHE DIPENDONO IN MODO + EVIDENTE DALL’INTERVISTATORE ........................................ 20
FASE 5 ................................................................................................................................................ 20
PREVENZIONE E CONTROLLO ERRORE .............................................................................................. 21
ERRORE DI COPERTURA: .................................................................................................................. 21
SECONDO TIPO DI ERRORE DI LISTA: ................................................................................................ 23
Panel ..................................................................................................................................................... 24
CAMPIONI INDIPENDENTI ................................................................................................................. 24

CORREZIONE DEGLI ERRORI NON CAMPIONARI ............................................................................... 25
MANCATE RISPOSTE TOTALI ............................................................................................................. 26
LEZIONE DEL 14/04/08 .......................................................................................................................... 27
METODO DELLA PONDERAZIONE: .................................................................................................... 27
MANCATE RISPOSTE PARZIALI .......................................................................................................... 28
SECONDA PARTE I MEDIA E LA PUBBLICITA’ ......................................................................................... 30
Cenni sulla pubblicità. ....................................................................................................................... 30
RUOLO ECONOMICO DELLA PUBBLICITÀ .......................................................................................... 30
TEORIA DELL’INFORMAZIONE ........................................................................................................... 31

QUALITA’  DELLE  INFORMAZIONI  STATISTICHE  RACCOLTE  TRAMITE
LE INDAGINI CAMPIONARIE

L’utilizzo del campione è ormai diffuso in tutti le tipologie di raccolta di informazioni statisti‐
che. E’ importante controllare la qualità di tali informazioni e dei metodi utilizzati per racco‐
glierle in quanto spesso le info stesse sono alla base di scelte strategiche ed economiche ri‐
levanti.

QUALITA’ DELL’INFORMAZIONE STATISTICA
Si tratta delle informazioni raccolte mediante indagini statistiche, ovvero tutte le operazioni
che  permettono  di  avere  informazioni  quantitative  rispetto  ad  un  determinato  fenomeno
che voglio conoscere.

E’ un processo produttivo perché produce un’informazione( come tv, giornale ecc produce
la notizia partendo da un avvenimento)Æ anche l’informazione statistica o il dato statistico
è considerata come prodotto e per questo è venduta a pagamento (Nielsen) come gli altri
beni, è un bene immateriale.

L’indagine è quella sollecitazione dell’individuo che permette di oggettivare un fenomeno e
considerarlo un’informazione (risposta alla domanda).

Un  fenomeno  diventa  informazione  statistica  nel  momento  in  cui  è  possibile  misurarlo  og‐
gettivamente, cioè quando assume una dimensione quantitativa, tramite un processo di ela‐
borazione  che  porta  alla  PRODUZIONE  dell’informazione  stessa.  (assimilabile  al  processo
produttivo industriale).

Esempio: il REDDITO PERCEPITO da alcuni individui è un fenomeno che si verifica alla fine del
mese per tutto l’anno. La rilevazione di tutti gli stipendi ed il calcolo della  media aritmetica
permette di ottenere il REDDITO MEDIO ANNUO oppure MENSILE che non sono direttamente
rilevabili, ma  frutto dell’elaborazione statistica e prendono il nome di informazione o dato
statistico.

L’INFORMAZIONE STATISTICA può essere di 3 tipologie:
1. MICRO DATO  o  DATO ELEMENTARE
Dato rilevato sulla singola unità statisticaÆindividuo che compone la popolazione
2. MACRO DATO  o  STATISTICA
Risultato di una qualsiasi funzione di sintesi dei dati elementari (es. Media, Frequen‐
za Relativa, Mediana….)
3. META DATO

Informazione  qualitativa  e  quantitativa  riguardante  le  diverse  operazioni
dell’indagine, necessari per capire se i risultati ottenuti sono attendibili o no.

La misurazione della qualità dell’informazione statistica considera non solo la qualità
dei micro dati e dei macro dati ma anche il grado di trasparenza nei processi di inda‐
gine.

DEFINIZIONI DI QUALITA’ DELL’INFORMAZIONE STATISTICA:

¾ Un dato statistico è qualitativamente buono se è vero, cioè se corrisponde alla realtà
del fenomeno. Æ semplice ma poco operativa
¾ ( concetto di qualità utilizzato nei processi di produzione manifatturiera)
Il produttore offre due tipologie di garanzie qualitative:
9 GARANZIE DI PROGETTAZIONE
Il produttore garantisce la conformità ai requisiti del bene prodotto
9 GARANZIE DI TOLLERANZA
Il produttore fornisce dei limiti entro i quali alcuni requisiti possono variare e
garantisce la conformità del prodotto all’interno di quel margine di tolleranza
che è variabile a seconda della tipologia di prodotto.

¾ (definizione istat) Proprietà di progettazioneÆ requisiti del bene prodotto
L’informazione  statistica  deve  avere  una  qualità  tale  da  soddisfare  le  aspettative
dell’utente, in particolare:
9 TEMPESTIVITA’ : un’informazione non tempestiva è di bassa qualità
9 RILEVANZA TEORICA: le informazioni prodotte sono di buona qualità se risul‐
9 RILEVANZA EFFETTIVA: la qualità è proporzionale alla parte di informazione
che viene effettivamente utilizzata
9 TRASPARENZA: la qualità aumenta all’aumentare della possibilità dell’utente
di accedere a tutte le informazioni relative agli strumenti utilizzati
9 TOLLERANZA: indica la precisione dei dati, la differenza tra il valore vero ed il
valore osservato, che può essere causata dalla tecnica campionaria sceltaÆ
PRECISONE  CAMPIONARIA  oppure  da  problemi  verificatisi  durante
l’indagineÆPRECISIONE NON CAMPIONARIA

ERRORE STATISTICO O TOTALE
Æ   si verifica nel momento in cui un dato non è preciso.
E’ il risultato della differenza tra il dato ottenuto con la rilevazione (DATO MISURATO = MI‐
SURA) e il valore vero del fenomeno, cioè il valore effettivo, reale, privo di errori.

Tipologie di errore statistico :

9 Rispetto al MICRO DATO
L’errore è relativo al valore rilevato sulla singola unità statistica

9 Rispetto alla STATISTICA – MACRO DATO
Gli errori di rilevazione si ripercuotono anche sulla loro sintesi (statistiche)
L’errore  è causato  dal  fatto  che  la risposta  allo  stimolo  è  arrivata  solo  da  parte
della popolazione e non dalla totalità, quindi alcuni aspetti vengono sicuramente
valutati in modo errato.
La statistica risulta distorta in quanto non si verifica la compensazione degli errori
a livello di micro dato (errori + ed errori ‐).

Sulla base delle precedenti tipologie di errore è possibile definire le seguenti categorie:

ERRORE STATISTICO CAMPIONARIO
L’errore campionario dipende dal fatto che il valore vero viene stimato con un cam‐
pione  probabilisticoÆ  lo  stimatore  (valore  atteso  medio)  che  è  diverso  dal  valore
medio reale
E’ per questo motivo che la stima è intervallare non puntuale, e si considera un in‐
tervallo di confidenza proprio ad evidenza dell’errore commesso.
L’errore campionario può dipendere anche dal tipo di stimatore utilizzato che può ri‐
sultare non corretto per stimare il fenomeno in considerazione.
Es. la Mediana a volte corrisponde alla Media altre no, in questi casi non è adatta a
stimare la media.

ERRORE STATISTICO NON CAMPIONARIO
L’errore è imputabile al processo di indagine statistica, è causato dai problemi, dalle
situazioni di difficoltà che provocano imprecisioni nell’indagine statistica
Esempi: errori di trascrizione numeri – lista non completa – domande non compren‐
sibili – domande troppo private…..
N.B.  E’  presente  anche  nelle  indagini  statistiche  totali  (es.  censimento)  non  solo  in
quelle campionarie.

ERRORE STATISTICO VARIABILE
L’errore  si  dice  variabile  se  le  differenze  fra  valore  vero  e  valore  osservato  (errori)
nelle unità oggetto dell’indagine sono distribuiti CASUALMENTE e con MEDIA NULLA
all’interno della popolazione.
Ad esempio nelle distribuzioni Normali cambia la variabilità ma non la precisione.

ERRORE STATISTICO SISTEMATICO o DISTORSIONE
L’errore ha uno specifico segno. (sistematicamente + o sistematicamente ‐)
Il  valore  atteso  di  questa  stima  non  è  uguale  al  valore  vero,  è  sempre  maggiore  o
sempre minore.
Es. se tutti i soggetti dichiarano un valore di reddito inferiore rispetto a quello effet‐
tivo  anche la media risulterà distorta inferiormente perché deriva da dati sistemati‐
camente inferiori ai reali.

I precedenti possono essere combinati nei seguenti modi:

ERRORE CAMPIONARIO + ERRORE SISTEMATICO

DISTORSIONE CAMPIONARIA O DELLO STIMATORE
La distorsione dipende dal fatto di utilizzare un campione per cui può verificarsi un
errore nella scelta della strategia di campionamento oppure dello stimatore.

ERRORE CAMPIONARIO + ERRORE VARIABILE

ERRORE VARIABILE CAMPIONARIO
Lo stimatore differisce dal valore vero per il caso, cioè per l’utilizzo di un campione
(discorso dell’intervallo di confidenza)

ERRORE NON CAMPIONARIO + ERRORE SISTEMATICO

ERRORE  SISTEMATICO  NON  CAMPIONARIO  o  DISTORSIONE  SISTEMA‐
TICA
Dipende  dal  comportamento  dell’intervistato,  ad  esempio  nel  caso  in  cui  risponde
solo  una  parte  della  popolazione(errore  non  campionario)  se  la  parte  che  non  ri‐
sponde presenta caratteristiche differenti rispetto alla parte che risponde (errore si‐
stematico) alcuni fattori vengono sottostimati e provocano la distorsione.

ERRORE NON CAMPIONARIO + ERRORE VARIABILE

ERRORE VARIABILE NON CAMPIONARIO

Se  risponde  il  75  %  degli  intervistati  (errore  non  campionario)  la  conseguenza  è
l’aumento della variabilità dello stimatore (errore variabile), infatti, al diminuire della
popolazione considerata la variabilità dell’errore aumenta.

LEZIONE DEL 03/03/08

Da ora in poi ci interesseremo solamente dell’errore non campionario.

L’errore non campionario, a lungo trascurato, si è visto che è un errore importante, e molto
significativo per la qualità dei dati statistici. (in alcuni casi molto difficile da correggere). In
linea di massima l’errore campionario dipende dalla grandezza del campione( più il campio‐
ne è grande più l’errore campionario è piccolo perché diminuisce la variabilità campionaria e
le stime sono più precise).

Quando  si  fa  un’indagine  statistica  bisogna  arrivare  ad  un  equilibrio  tra  la  precisione
dell’informazione( delle stime) e i costi. Più aumenta la numerosità campionaria più aumen‐
tano  i  costi (ma  più  è  precisa  l’informazione).  Questa  preoccupazione  è  sempre  stata  pre‐
sente in chi organizzava le indagini statistiche. Di fatto, in questi anni si è introdotta una ri‐
flessone  che  dice  che  è  molto  più  interessante  controllare  l’errore  non  campionario  che
quello campionario. Cioè se pensiamo che l’errore statistico è formato da tali errori, in que‐
sti ultimi anni si è visto che è prevalente la componente dell’errore non campionario e quin‐
di ci si è interessati molto di più a . tentare di correggere i non campionari.

Errore non campionario:  sono gli errori che influenzano la qualità dei dati statistici e la cui
origine  è  molteplice.  Ogni  passaggio  dell’indagine  statistica  cela  la  possibilità  che  vengano
compiuti degli errori non campionari( cioè tutti i fattori che producono delle conseguenze di
errore sulla rilevazione dei dati. Esso fa sì che il dato raccolto ha un’errore. C’è differenza tra
dato raccolto e dato vero ).

## Tale  errore  può  nascere  dalla  progettazione,  dall’atteggiamento  dell’intervistatore  o

dell’intervistato, nel momento della codifica ecc..  cioè sono tutti gli errori che si annidano in
ogni passaggio dell’indagine.

## A  differenza  dell’errore  campionario  che  diminuisce  all’aumentare  del  campione,  l’errore

non campionario può aumentare all’aumento della numerosità del campione, poiché le pro‐
cedure si fanno più complesse possono aumentare gli errori non campionari. Una delle ca‐
ratteristiche  dell’errore  statistico  non  campionario  è  che  aumenta  all’aumentare  della  nu‐
merosità.

Abbiamo già visto che l’errore non campionario può provocare degli errori di distorsione e
degli errori di variabilità.

Se prendiamo un campione ed in esso il 25% delle persone non rispondono, ciò aumenta la
variabilità delle stime. Se poi questo 25% ha anche delle caratteristiche particolari, introdu‐
ciamo delle distorsioni oltre alla variabilità(es.: tale 25% è tutto analfabeta ed è impossibili‐
tato a rispondere a indagini postali sul reddito).

FASI DELL’INDAGINE(ISTAT):

1. Definizione dell’oggetto dell’indagine
a. Quando prepariamo un’indagine, il ricercatore o istituto di ricerca vuole co‐
noscere le intenzioni di voto( esempio). Bisogna definire la popolazione degli
interessati(  es  maggiorenni  per  votare),  il  campo  di  rilevazione  ecc..  fase  in
cui si prepara quello che si vuole conoscere
2. Studio delle condizioni in cui si svolge l’indagine
a. dopo la fase 1 devo capire in che condizioni si svolge l’indagine. Ci sono 2 fat‐
tori importante. Il primo è la qualità organizzativa di chi svolge l’indagine( ov‐
vero vedere quali sono gli strumenti, qualità del personale ecc.. che devo uti‐
lizzare  per  fare  l’indagine).  Il  secondo  fattore  sono  le  liste  da  cui  estrarre  il
campione( strumento essenziale).
3. Scelta, progettazione e preparazione di un sistema per la rilevazione delle informa‐
zioni statistiche
a. Intendiamo il lavoro di preparazione del questionario e decidere il tipo di in‐
tervista da utilizzare( diretta, telefonica, postale mmh….ecc..).  questi sono i
due momenti più importanti( questionario e modalità di rilevazione) e sono
collegati.
4. Rilevazione delle informazioni statistiche
a. L’intervistatore somministra il questionario secondo le scelte fatte della mo‐
dalità di intervista.
5. Codifica e registrazione
a. Codifica:  le  informazioni  prese  dall’intevistarore  devono  essere  codificate
perpoter essere “lette” dall’elaboratore. Registrazione: i dati vengono impu‐
tati in un foglio elettronico( es. in excel). Fase delicata. Se utilizziamo il que‐
stionario elettronico la codifica e registrazione sono già inserita nel questio‐
nario stesso.
6. Revisione
a. Fase importante per la qualità dati. Dopo aver raccolto le informazioni biso‐
gna fare controlli per vedere se le procedure sono state seguite bene, la codi‐
fica  è  stata  eseguita  correttamente  ecc..    Nel  caso  di  errore  si  procede  alla
correzione. Verifico dunque la qualità delle informazioni e procedo alla corre‐
zione delle stesse.
7. Elaborazione dei dati
a. Es. su tabelle
8. Fase dell’amarezza

In ognuna di queste fasi si possono trovare degli errori.  Tali fasi servono per capire in quali

Domanda: gli errori non campionari, oltre poter portare distorsioni o aumento di variabilità
delle stime, possono essere classificati? Esistono degli errori tipici? Si esistono. Le classifica‐
zioni proposte sono molteplici. Il maffenini propone la più interessante che individua 3 tipi
di errore non campionario e cioè:

1) ERRORI DI LISTA

2) ERRORI DI NON RISPOSTA

3) ERRORI DI MISURA

ERRORI DI LISTA

Grande parentesi cos’è una lista?

La  lista  è  l’elenco  ordinato(  successione  significativa  delle  informazioni)  delle  etichet‐
te(intesa come modo di identificare l’unità, non quella sulla fronte del maffe) che contrasse‐
gnano tutte le unità di una popolazione. Esempio: lista telefonica, iscritta alla unimib ecc..
dipende dalla popolazione. Es. lista degli aventi diritto al voto.

La  lista  nasce  per  scopi  amministrativi(  in  genere),  cioè  avendo  una  popolazione(  in  senso
generico) c’è il bisogno che la popolazione, formata da unità , sia identificata( per esempio
quindi per motivi amministrativi).

Le etichette che devono identificare tutte le unità della popolazione contengono le informa‐
zioni necessarie alla identificazione ed alla individuazione(oltre che al reperimento) delle u‐
nità  stesse.  Se  vogliamo  individuare  solo  una  persone  è  sufficiente  dare  ad  ogni  unità  un
numero. Es: se è una lista anagrafica le etichette conterranno nome, cognome, data di na‐
scita ed indirizzo.

Le informazioni contenuta nell’etichetta dipendono dalla lista.

Quando possiamo dire che una lista sia buona( dal punto di vista della qualità, cioè che la
qualità risponde alle esigenze per le quali la lista è fatta. NB: La qualità dipende dagli usi che
si fanno della lista)?

 La lista deve essere completa: cioè contiene tutti i nominativi delle unità della popo‐
lazione a cui sono interessato;

 Deve essere aggiornata: cioè deve avere le informazioni che siano il più vicino possi‐
bile alla data in cui utilizzo la lista per determinati scopi amministrativi o anche stati‐
stici;
 Deve  essere  informativa:  ciascun  individuo  deve  essere  distinguibile  da  un  altro  ed
individuabile.

Dal punto di vista statistico ho bisogno delle liste per fare censimenti ed indagini statistiche.

Nel secondo caso ho bisogno di una lista da cui estrarre il campione. Se posso ricostruisco la
lista partendo dalla popolazione obiettivo( cioè quella interessata ad un’indagine) contenen‐
te tutte le unità presenti in tale popolazione. Spesso è un’operazione impraticabile però, es‐
sendo troppo costosa ed inutile (esistendo già surrogati delle liste di cui necessito). Ci pos‐
sono essere casi particolare in cui faccio liste ma non sono interessanti dal nostro punto di
vista(o pdv come dice silvia).

Quindi devo vedere se esistono già liste che corrispondano alle mie esigenze. Esistono. Le
liste più comuni di questo tipo sono:

 Liste anagrafiche
 Problema:  i  privati  non  possono  utilizzarle.  Ancor  prima  del  concetto  di
privacy, il privato non poteva usarle. Solo l’ISTAT o altri enti dello stato pos‐
sono utilizzarli.
 Bollettini telefonici
 Utilizzate soprattutto negli anni novanta(tutti avevano il telefono. Da un po’
di anni anche queste liste sono in crisi, essendo complesse da usare a causa
dei cellulari e per la possibilità di non far comparire il proprio nome nel bol‐
lettino telefonico).
 Liste elettorali
 I privati possono usarle. Perché queste si e le prime no? Dal pdv legislativo la
lista anagrafica è del comune, utilizzate per propri scopi amministrativi. Men‐
tre le liste elettorali per definizione sono affisse all’albo affinché tutti possano
verificare  di  essere  nelle  liste  elettorali  e  se  ci  sono  persone  senza  diritto  i‐
scritte.  Sono  per  definizioni  PUBBLICHE(come  le  liste  dei redditi  delle azien‐
de). I comuni, dietro corrispettivo, possono fornire tali liste. Il problema lega‐
to a tale fattispecie è che include solo i maggiorenni( oltre le minoranze di co‐
loro che non possono usufruire della propria capacità giuridica per motivi pe‐
nali). Le liste elettorali vengono usate per estrarre delle famiglie.

Nb: stiamo parlando della popolazione italiana in generale. Ovviamente se dovrò fare inda‐
gini sui medici avrò altre liste.

Quando una lista è usata per estrarre un campione viene chiamata base di campionamento(
o campionaria). Quali caratteristiche deve avere la lista nel momento in cui diventa una base
campionaria?E’ adatta alla mia popolazione obiettivo? (popolazione obiettivo: popolazione
rispetto alla quale voglio svolgere un’indagine).

 La  lista  è  completa  rispetto  alla  popolazione  obiettivo?  Æ  La  lista  deve  contenere
tutte le unità della popolazione obiettivo. Questo dipende da che tipo di lista sto uti‐
lizzando. La lista deve essere completa rispetto alla data nella quale faccio l’indagine(
deve  essere  aggiornata).  Evidentemente  la  lista  deve  contenere  anche  tutte  le  in‐
formazioni che servono per fare l’indagine.

Più informazioni ci sono e meglio è perché se ho molte informazioni su altre caratteristiche,
queste sono utili nel caso in cui debba sostituire la persona( non rispondente) o comunque
possono essere utili per fare lavori di correzione dei dati. Più informazioni ho e più esse mi
aiutano ad avere una buona qualità dei dati e poi servono anche per la correzione.

Evidentemente poiché una lista deve essere completa ed aggiornata, in realtà prendo la lista
che trovo.( differenza tra il pratico ed il teorico) . es: le liste anagrafiche sono aggiornate o‐
gni 10 anni( dog) ed i movimenti migratori non sono aggiornate. Le liste elettorali sono ag‐
giornate ogni 6 mesi, ma non rappresentano tutta la popolazione. Le liste telefoniche non
sono liste della popolazione ma di individui( non si conosce l’età ecc..). poiché non posso fa‐
re liste ad hoc per un’indagine, devo utilizzare delle liste succedanee( anagrafe, istat, liste
elettorali,  telefoniche  ecc..).  esse  però,  essendo  state  pensate  per  funzioni  amministrati‐
vo/burocratiche non hanno le caratteristiche da me volute. Da qui nascono gli errori di lista.

Fine grande parentesi.

Errore di lista: tutti gli errori che dipendono dall’imperfezione della lista inclusi gli errori col‐
legati all’individuazione e reperibilità dell’unità statistica che voglio utilizzare.

ERRORI DI NON RISPOSTA

Î Tutti gli errori che scaturiscono dal fatto che un’unità statistica non risponde per nul‐
la ad un’indagine oppure dalle non risposte parziali.  Errori causati sulla qualità del
dato prodotte dalla non risposta totale o parziale.

ERRRORI DI MISURA

Î In questo contesto intendiamo tutti gli altri errori, ciop tutti gli altri tipi di errori che
avvengono durante un’indagine campionari che non siano errori di lista e/o di non ri‐
sposta.
Î È una categoria strettamente residuale? No perché hanno una caratteristica partico‐
lare: danno un’informazione non corretta rispetto al valore vero. Mentre gli altri er‐

rori influiscono sulla qualità di un dato in modo indiretto, l’errore di misura lof a in
modo diretto.
Î Quindi è una tipologia residuale con caratteristica particolare.

CAUSE DEGLI ERRORI NON CAMPIONARI nelle varie fasi

FASE 1: DEFINIZIONE OGGETTO

CAUSE ERRORI relativi alla qualità dell’indagine:

  Non chiara definizione della popolazione di riferimento
 Fraintendimento dell’obiettivo dell’indagine

Î Se durante tale fase non si hanno le idee chiare, possono venire a crearsi errori sulla
qualità delle informazioni. Se non si definisce la popolazione oggetto dell’indagine in
modo chiaro, le informazioni che raccoglieremo non saranno adeguate rispetto a ciò
che vogliamo ottenere. In alcuni casi il ricercatore può anche fraintendere l’obiettivo
dell’indagine. Ad esempio le elezioni politiche, l’intenzione di voto in questo momen‐
to. Aver chiaro l’oggetto e la popolazione di un’indagine è il primo requisito fonda‐
mentale affinché la qualità dell’indagine sia conforma a quanto ci si aspetta. ( silvia
ha sonno!!).
Î In questa situazione si possono anche fare errori che si possono ripercuotere anche
su altre analisi future. Quando definisco la popolazione obiettivo devo avere già chia‐
ro quali strumenti utilizzare.
Î Quindi la fase 1 è importante perché è determinante per quanto riguarda la qualità
dell’indagine
Î

FASE 2

Problema della lista: quali sono i possibili errori che sono causati da una lista?

1)La situazione perfetta è quella in cui esiste corrispondenza perfetta tra i nominativi della
lista e le unità della popolazione obiettivo. In questo caso la lista è perfetta, non presenta
alcun tipo di errore e non è sorgente di errori.

2) LISTA INCOMPLETAÆ Mancano alcune unità della popolazione obiettivo. Si parla di unità
includibili‐ mancanti. L’incompletezza può dipendere da imperfezioni della lista( es. nel caso
di lista anagrafica spesso succede che le famiglie che si trasferiscano tra 2 comuni non ven‐
gano cancellati; es. lista elettorale è incompleta se usata come lista per estrarre la popola‐

zione obiettivo generale perché mancano i minorenni e quindi è incompleta x l’uso che ne
faccio).  Quindi  non  necessariamente  l’incompletezza  riguarda  le  funzioni  della  lista,  ma
l’utilizzo che se ne fa. In questo caso si parla di errore di copertura, dove la lista non copre la
popolazione obiettivo.

3) Sovra copertura di lista, che è più grande della popolazione obiettivo in quanto nella lista
sono presenti nominativi inesistenti o estranei rispetto alla popolazione obiettivo.

‐ NOMINATIVI INESISTENTI: nella lista ci sono della unità che non appartengono
più alla popolazione obiettivo.

‐ NOMINATIVI ESTRANEI: sono presenti nella lista dei nominativi che non inte‐
ressano( quindi non c’è stato errore di aggiornamento ecc..)

Ci sono altri 2 tipi di problemi particolari.

4) più nominativi della lista corrispondono ad una sola unità della popolazione obiettivo. (
questo è un caso particolare di sovra copertura della lista).

5) lista con grappoli di unitàÆ nel caso di elenchi telefonici una volta ad un numero telefo‐
nico corrispondevano più nominativi. Ad un nome della lista corrispondono più unitùà della
popolazione obiettivo. Esiste poi una lista particolare con grappoli di unità che sono le liste
dei comuni.

Questi sono gli errori classici della lista per quanto riguarda la sua completezza, cioè il rap‐
porto tra unità della popolazione obiettivo e unità della lista stessa.

Esistono però anche errori collegati sia alla individuazione che reperibilità delle unità da in‐
dagare. In questo caso la lista può causare altri tipi di errori. Ad esempio: le informazioni che
la lista da non sono sufficienti per reperire un individuo sul territorio. Oppure sono informa‐
zioni sbagliate. Comunque informazioni che non permettono di individuare o reperire unità
sul territorio.

FASE 3

In questo contesto sono due i momenti importanti: costruzione del questionario e la scelta
del tipo di intervista.

Questionario: è una delle fonti più importanti di errore non campionario. I problemi posso‐
no essere relativi:

 Alle  domande  che  vengono  fatte  per  la  raccolta  delle  informazioni  che  voglio  ave‐
re(informazioni vere e proprie del soggetto che sto indagando);

 Ai codici identificativi;
 Alle domande per il controllo della qualità dell’intervista.

Il  primo  problema  che  si  può  avere  è  quello  della  capacità  di  comunicare  all’intervistato
quello che voglio sapere. Se non lo so fare raccolgo informazioni inutili.

Altri errori sono dovuti alla memoria: cioè di ricordare male o non ricordare. Dal pdv delle
soluzioni  si  può  intervenire  con  alcuni  metodi(  vedremo  infra).  Gli  errori  possono  derivare
dal fatto di dimenticare o da collocare errata nel tempo.

Errori dovuti alle domande proxy: domande che pongo a un familiare della persona da inter‐
vistare ma non presente in quel momento. Soprattutto nelle indagini familiari, quando una
persona non è presente per 2 o 3 volte allora o si esclude la famiglia( maggior parte dei casi)
oppure si interrogano padre o madre. Queste risposte possono ovviamente causare grossi
errori. Ci sono domande delicate o imbarazzanti( a seconda della cultura del paese) in gene‐
re riguardo a situazioni personali, ai redditi, salute, convinzioni politico/religiose Æ c.d. dati
sensibili . tali dati possono causare errori di non risposta o risposta falsa.

Ci sono altre situazioni che possono generare errori: come le domande aperte.

Abbiamo dunque visto errori relativi a domande fatte sulle persone che voglio indagare.

Nel caso dei codici identificativiÆ in tali codici è indicato l’intervistatore, intervistato ecc.. in
alcuni casi errori su tali codici possono causare gravi problemi.

Variabili controllo dell’intervista Æ  le informazioni sull’intervista riguardano l’ora di inizio e
di fine dell’intervista, se l’intervistato è stato intervistato al primo contatto o meno, quando
sono stati gli altri contatti in caso negativo, se l’intervistato è un sostituto di un ‘intervistato
che non aveva risposto. Cioè bisogna inserire le informazioni di controllo.che possono esse‐
re utili e che indicano come è andata l’intervista e per controllare la qualità dei dati.

Quando si fa un’indagine si decide ad un certo punto se farla diretta, telefonica o postale.
Anche in questi casi sappiamo che i vari tipi di tecniche hanno determinate conseguenze( es.
postale Æ numero di non rispondenti è elevatissimo. Es. intervista diretta sui temi delicati
ha come conseguenza un altissimo numero di non risposte. Nb anche le domande delicate
non sono tutte uguali ma dipende). La scelta del metodo ha conseguenze sulla qualità.

Molti errori sono inevitabili. Se uso l’indagine postale perché ho pochi soldi so che avrò mol‐
ti non ritorni e devo cercare dei modi per correggere tali errori.

FASE 4

In  questa  fase  emergono  i  problemi  legati  alla  scelta  dei  metodi.  All’interno  di  tale  fase  il
problema più grave è quello delle mancate risposte.

Si è visto che le indagini statistiche in modo diffuso sono cominciate negli anni cinquanta. La
prima indagine campionaria è del 1939. Perciò è molto recente l’utilizzo e l’esplosione è par‐
tita dagli Usa negli anni ’50. Il primo istituto italiano è degli anni ‘50Æ la DOXA,che è l’unico
rimasta italiana. Le indagini, partite da questo periodo, si diffusero a macchia d’olio.

Il problema che accompagnò tale diffusione sono state le mancate risposte. “problema che
angustia abbastanza i ricercatori”.

Cause delle non risposte:

 urbanizzazione  ovvero  il  passaggio  della  popolazione  dalla  campagna  alla  città.  Chi
abita in città è più asociale e scettico rispetto ai campagnoli( vd Rogeno). come con‐
seguenza si ha avuto la non risposta o una minore risposta. Dal 5% di non risposte al
25‐30% di non risposte negli Usa dagli anni ‘50
 poiché le indagini sono talmente invadenti le persone tendono a non rispondere per
difendersi anche se poi i dati sono anonimi.

In Italia la situazione è particolare per 2 motivi:

1‐ quando si fa un’indagine ISTAT siamo obbligati a rispondere per legge. Que‐
sto  ha  portato  ad  un’atteggiamento  di  dire  “vabbè  bisogna  rispondere  alle
indagini e allora rispondiamo anche alla doxa e all’istat”. Quindi si risponde
ma si dicono cose non vere.

LEZIONE 10/03/08

Il  problema  delle  mancate  risposte  è  uno  dei  problemi  +  gravi  che  si  possono  trovare
nell’indagine statistica sia campionaria che non campionaria.

Soprattutto le mancate risposte totali dipendono da vari motivi alcuni chiari altri no comun‐
que le non risposte sono in forte aumento negli ultimi anni. Questo fenomeno tocca in mo‐
do meno evidente l’Italia perché le indagini istat sono obbligatorie anche se poi si risponde il
falso  provocando  problemi  +  gravi  Æ  meglio  una  non  risposta  che  una  risposta  sbagliata
perché è molto difficile correggerle.

La non risposta dipende anche dal tipo di tecnica utilizzata per fare l’indagine.

LE CLASSICHE  TECNICHE  DI  RILEVAZIONE O DI SOMMINISTRAZIONE SONO
3:

  intervista direttaÆ è quella che causa meno non risposte
  Intervista telefonicaÆ si risponde di meno
  Intervista postaleÆ + alti tassi di non risposta per vari motivi (anche solo 10% risp)
esistono tecniche di richiamo ma nei casi migliori si arriva al 50 % delle risposte dopo
lettere e richiami ecc però è spesso utilizzata perché è poco costosa e non servono
strumenti specifici.
 Via internet

Indagini delicateÆ strettamente personali, politica, reddito ecc per le quali è meglio
non fare la diretta ma la postale

NON RISPOSTE :

  TotaliÆ il questionario non è stato compilato in alcuna parte
 ParzialiÆ all’interno del questionario ci sono parti a cui non è stata data risposta

NON RISPOSTE TOTALI: Unità di rilevazione per le quali è stato impossibile raccogliere le in‐
formazioni.

Situazioni che le provocano:

1.  Non  includibilità  dell’unità:  alcune  unità  non  sono  includibili  nel  campione  perché
non fanno parte della popolazione obiettivo e quindi non possono essere intervistate
se estratte (sovra copertura di listaÆ coincidenza imperfetta, ho + unità che non mi
interessano). E’ un po’ particolare perché è decisa dall’intervistatore comunque vie‐
ne considerata come non risposta.‐‐> normalmente si riesce a risolvere prima il pro‐
blema e ripulire la lista.
Es. Se ho la lista dei residenti in provincia di Milano e voglio solo i maggiorenni, eli‐
mino tutti i minorenni.
2. Non  contatto  delle  unità  della  popolazione  obiettivo:  non  contatto  in  senso  molto
generaleÆ si applica a tutte le situazioni in cui è impossibile l’individuazione e la re‐
peribilità sul campo delle unità da intervistare. Ho estratto l’unità ma le info che ho
non mi permettono di individuarla oppure a reperirla.
Questo dipende da:
‐   informazioni non accurate o errate (errore di lista)
‐  unità includibili mancantiÆ fanno parte della pop obiettivo ma non sono nella lista
e quindi non ho nessuna info su di loro e non potrò intervistarle.

Si  parla  di  non  contatto  anche  quando  sono  state  individuate  e  reperite  ma  non  è
stato possibile incontrarle. Es. tizio non è a casaÆ vacanza, orario sbagliato…

3.  Rifiuto  di  partecipare  all’intervista (non  risposta  classica) : persona  individuata,  re‐
perita, contattata ma decide di non partecipare all’intervista.
Il rifiuto può dipendere da:
  INCAPACITÀ DELL’INTERVISTATOREÆ è interessante distinguere i casi in cui con un intervi‐
statore + persuasivo il rifiuto sarebbe rientrato.
  TIPO DI INDAGINEÆ l’effetto non cambia però serve per decidere strategie per risolvere
problema. Ad esempio si cambiano le domande, si cambia la tecnica…

Dal punto di vista teorico dell’analisi delle dinamiche si può distinguere tra:
 RIFIUTI PERMANENTI: non si riesce a convincere la persona in nessun modo.
 RIFIUTI  TEMPORANEI:  es.  se  uno  viene  contattato  3  volte  e  risponde  solo  l’ultima
volta

4.  Incapacità  di  partecipare  all  l’intervista:  es.  malattia,  analfabeti  se  faccio  indagine
postale non possono risp. Non conoscenza lingua scritta (immigrati). Alcune incapaci‐
tà si possono risolvere (es. lingua) altre non sempre, dipende ad esempio dai tempi
di somministrazione questionario ecc.

MANCATE RISPOSTE PARZIALI:

1. In senso stretto: la persona partecipa all’indagine ma quando si analizza il questiona‐
rio ci sono delle domande a cui non ha risposto per vari motivi.
2. Valori non ammissibili: c’è un evidente errore nella risposta per cui non è possibile
accettare la rispostaÆ es. data di nascita 1830, altezza 3 mt.
Incongruenze  logiche:  contraddizione  tra  le  risposte.  Es  nella  risposta  ad  una  do‐
manda dice che fuma e ad un’altra no. Valori non ammissibili possono essere dovuti
 Incongruenze  logiche  formaliÆ  a  volte  si  inseriscono  nel  questionario  do‐
mande filtro cioè ad un certo punto si entra o no in una parte del questiona‐
rio,  può  succedere  che  uno  che  non  doveva  rispondere  perché  ad  esempio
ha risposto no alla domanda filtro è entrato lo stesso in quella parte del que‐
stionario.  Bisogna  vedere  se  l’errore  era  nella  risposta  alla  domanda  filtro
oppure se effettivamente non doveva rispondere e non devo considerarle.

La differenza tra mancata risposta totale e parziale può non essere cosi evidente. Es. se clas‐
sifico  un  questionario  come  mancata  risposta  parziale  ma  le  mancate  risposte  sono  molte

oppure mancano proprio quelle + importanti x l’intervista allora si può decidere di eliminarle
tutte e considerarlo come una non risposta totale.

ERRORI DI MISURA O ERRORI DI RISPOSTA

Sia  gli  errori  di  misura,di  non  risposta  che  quelli  di  lista  si  verificano  nel  momento
dell’intervista ( siamo sempre nella 4 fase).

Ogni  momento  dell’indagine  ha  la  possibilità  di  creare  errori  di  misura  però  a  lato  pratico
emergono in modo particolare in determinati momenti.

DefÆ L’errore di misura o di risposta è connesso ad imperfezione degli strumenti di rileva‐
zione o all’imprecisione delle informazioni possedute dagli intervistati o ad errori di rispo‐
sta in senso stretto.

Dipendono da:

1. Questionario utilizzato (strumento di rilevazione)
2.  Tipo di indagine scelta ( se diretta, telefonica, postale o via internet – ognuna può
provocare un certo errore)
3. RispondenteÆ imprecisione dell’informazione posseduta + errore di risposta (rsp er‐
rata)
4. Intervistatori e Supervisori rientrano nella categoria dello strumento di rilevazione e
del suo utilizzo

La conseguenza di queste fonti di errore è che l’informazione che ottengo differisce dal valo‐
re vero, anche se le cause sono diverse tra loro.

Gli errori in realtà si catalizzano nel momento dell’intervista.

ERRORI DOVUTI AL RISPONDENTE:

## 1. Non  comprensione  della  domanda  Æperché  il  soggetto  è  incapace  a  compren‐

derla oppure perché la domanda è posta male
2. Scarsa motivazione a rispondere (fretta) Æ poca motivazione o trascuratezza nel‐
la risposta scritta (sottocategoria)
3. Insufficiente capacità ad elaborare e comunicare la risposta Æ(cambia a seconda
del tipo di indagine, è consigliabile fare risposte chiuseÆ multiple choice rispetto
a domande aperte in cui bisogna scrivere liberamente)

materiale gratuito disponibile sul sito http://www.appuntibicocca.com   19 of 31

www.AppuntiBicocca.com ‐ Metodi quantitativi per il marketing

4. Mancanza  di  informazioni  del  rispondente  Æ(può  essere  mancanza  di  informa‐
zioni generali, ho sbagliato l’unità oppure manca una domanda filtro, es. faccio
una domanda su Sanremo e ad un certo punto capisco che il soggetto non l’ha vi‐
sto ).
5. Comunicazione  della  risposta  è  condizionata  dall’immagine  che  si  vuole  dare  di
séÆil questionario non sempre viene visto bene
6. Presenza di persone terzeÆ es. intervista a diciottenne deve essere fatta senza
genitori
7. Difficoltà di ricordare

Molte di queste situazioni potrebbero portare ad errori di non risposta tout cours che è la
situazione migliore perché è possibile correggerlo. Soprattutto non conoscenza e non ricor‐
do dovrebbero portare a non risposta. Molte volte invece si risponde comunque e questo è
problematico  per  l’indagine.  L’intervistatore  deve  chiarire  che  si  preferisce  la  non  risposta
alla risposta falsa.

Un  altro  caso  di  non  risposta  detto  anche  NON  ACCURATEZZA  INVOLONTARIA  è  proprio  il
fatto che il soggetto non conosce la risposta. Es. acquisto di un prodotto in una famiglia, in‐
tervisto il figlio e lui non sa qual è il motivo per cui è stato acquistato Æ bisogna capire se il
soggetto conosce o meno l’argomento, in alcuni casi il margine è basso, bisogna fare in mo‐
do che diventi una non risposta e non un errore.

ERRORI CHE DIPENDONO IN MODO + EVIDENTE DALL’INTERVISTATORE
1.  Domande  lette  in  modo  diverso  da  come  sono  state  scritteÆ  può  avere
grosse conseguenze sul tipo di risposta.
2. Cambiamento ordine delle domande
3. Errori di trascrizione delle risposte
4. Incapacità a reagire a situazioni impreviste

FASE 5

Durante la fase di codifica e registrazione possono esserci diversi tipi di errori come errori di
trascrizione errori derivanti dalla difficoltà della codifica errori di registrazione veri e propri

PREVENZIONE E CONTROLLO ERRORE

Errori di lista:

a.  UNITÀ INCLUDIBILI MANCANTI producono l’errore di copertura cioè si han‐
no delle liste incomplete rispetto alla pop. obiettivo, che non è coper‐
ta  totalmente  dalla  lista.  Non  è  facile  individuare  le  unità  includibili
mancanti,  quindi  possiamo  sapere  che  una  lista  è  incompleta  però
non so cosa manca, quindi ho delle difficoltà a prevenire l’errore, pro‐
prio perché non ho la lista completa.d’accordo???? Es. lista telefonica
quando non tutti avevano il telefono io sapevo che il 20 % non aveva il
telefono ma non sapevo chi erano questi soggetti.

La difficoltà di correggere e prevenire questi errori è molto elevata, a volte è IMPOS‐
SIBILE.

ERRORE DI COPERTURA:

Popolazione obiettivo di numerosità N vogliamo stimare per il carattere Y il valore medio di
questa popolazione. Per farlo bisogna estrapolare un campione e da questo calcolare il valo‐
re medio. Ho bisogno quindi di utilizzare una lista che però non è aggiornata e quindi causa
errori di copertura.

Ora vediamo un modello matematico che serve per descrivere questo errore di copertura.
La pop N si divide in 2 sottopopolazioni o strati, uno lo chiamo Np e rappresenta la pop o‐
biettivo presente nella lista che ho e le chiamo unità presenti nella lista. Lo strato Nm indica
le unità mancanti, cioè unità della pop obiettivo che mancano dalla lista.

Lo strato Np ha un valore medio Yp medio che rappresenta la media delle risposte alle do‐
mande, indipendentemente da cosa viene chiesto.
Ym medio è il valore medio delle unità mancanti.
Indico Wp il rapporto tra Np e N cioè la percentuale della popolazione presente nella lista.
Indico Wm la percentuale della popolazione mancante dalla lista.
Wp+Wm=100 sono complementari tra loro, perché Np+Nm=N
Wm = tasso di mancata copertura della lista.
A questo punto posso scrivere y medio come la media ponderata delle 2 medie.

Ymedio= (Wp x Ypmedio) + ( Wm x Ym medio)

materiale gratuito disponibile sul sito http://www.appuntibicocca.com   21 of 31

www.AppuntiBicocca.com ‐ Metodi quantitativi per il marketing

A questo punto posso definire l’errore di copertura ovvero la differenza tra Ypmedio e Yme‐
dio, per ora ammettiamo che esista. La differenza tra i due valori è causata dalla copertura.

L’errore di copertura è misurato da :
Ypmedio – Ymedio= Wm( Yp medio – Ym medio)

Che cosa vuol dire tutto questo????
Se abbiamo 2 popolazioni (presente e mancante) che sono differenti tra di loro succederà
che Ymedio sarà diverso da Yp Æ la differenza esiste se le 2 pop sono diverse
Esempio: liste telefoniche con 20 % di non coperturaÆ la pop obiettivo è 80% presente nel‐
la lista, 20% mancante. Le 2 popolazioni differiscono per 2 elementi: età e reddito.
Quindi il reddito medio di tutta la pop obiettivo è differente dal reddito medio della popola‐
zione presente nella listaÆ esiste un errore di copertura.
Esiste errore di copertura se W è diverso da zero (cioè se la lista non copre) oppure se man‐
canti e presenti sono uguali .

Quando c’è una mancata copertura bisogna capire se i mancanti hanno le stesse caratteri‐
stiche dei presenti o no. Si può sapere da informazioni che avevamo in precedenza o da ca‐
ratteristiche della lista stessa (ad. Esempio se ho indicazioni sull’età ecc).

Popolazione selezionata o non casualeÆ Yp diverso da Ymedio la pop mancante non è pre‐
sente nella lista per un motivo preciso, quindi ha delle caratteristiche diverse da quella pre‐
sente proprio a causa di questo motivo. Es. livello di reddito x i telefoni (chi non ha il telefo‐
no è + povero).

Popolazione non selezionata o casualeÆ Yp = Ymedio il fatto di non essere presente nella
lista non dipende da un fattore specifico cioè è casuale. Tipo se estraggo a caso l’80% della
pop.  Anche il  restante  20%  sarà  casuale,  hanno  le  stesse  caratteristiche  e  hanno  lo  stesso
valore atteso cioè lo stesso Ymedio.

Il punto è capire se la popolazione mancante è casuale o no. Normalmente no. Es. telefono.

Per essere utilizzata per la stima la popolazione deve essere non selezionata anche con rife‐
rimento allo specifico carattere che voglio osservare Æ es. l’intenzione di voto.

Hp:  decisioni  di  voto  non  dipende  dal  reddito  :  posso  estrarre  un  campione  dalla  lista  per
stimare le intenzioni di voto anche se manca il 20 % della popolazione.  Se invece quel 20% è
influenzato dal livello di reddito non va bene.

Se la lista è selezionata il parametro che calcolo è sicuramente DISTORTO. Lo tengo,poi ve‐
dremo se è correggibile. La distorsione dipende dal tasso di non risposta e dalla differenza
tra Ym mancante e presente.

SECONDO TIPO DI ERRORE DI LISTA:

5.  UNITÀ  NON  INCLUDIBILI  INCLUSE  che  provocano  errore  di  non  risposta  totale  se
non riesco a prevenirlo e correggerlo.
Succede con nominativi estranei o non esistenti ÆSe la lista è informativa è possibile
pulire la lista togliendo le unità che non corrispondono alla popolazione obiettivo. Es.
se  ho  l’età  posso  prendere  solo  quelli  che  mi  interessano  ed  escludere  gli  altri.  Se
non ho questa caratteristica me ne accorgo quando contatto la persona e quindi è
possibile  ridimensionare  il  campione  successivamente,  anche  se  questo  provoca
qualche problema. Succede che il campione diminuisce, quindi la stima del campione
avrà  una  varianza  più  elevata,  aumentando  il  campione  si  risolve  il  problema  (tipo
1200 invece di 1000).
a. UNITA’ DUPLICATE: presenti + volte nella lista. Es. ditta che ha + di un
telefono. Normalmente è possibile chiarificare la situazione e pulire la
lista.
b. Caso  particolareÆ  LISTA  ELETTORALE  UTILIZZATA  PER  ESTRAZIONE  DI  FAMIGLIE
per l’indagine ma qui mancano tutti i minorenni quindi si prende tutta
la famiglia dell’unità che estraggo però se ci sono + maggiorenni nella
stessa  famiglia  l’unità  famiglia  è  duplicata.  Pulirla  è  difficile  allora  la
famiglia viene estratta solo se si estrae il + giovane o il + vecchio (che
è sempre1 quindi probabilità uguale).

Altro elemento molto importante per la prevenzione degli errori è il

CONTROLLO DI QUALITA’ DEL QUESTIONARIO Æ non solo il questionario deve essere fatto
seguendo procedure che tengono conto degli errori che possono intervenire, sono necessari
anche dei controlli di qualità sul questionario, che possono essere di 4 tipi:

1. Giudizio degli esperti: quando viene fatto il questionario c’è una commissione di e‐
sperti che lo verificano.
2. Pre‐test: prima di utilizzare il questionario lo si sottopone a un campione molto pic‐
colo
3. Test di alternative: può far parte del pre‐test Æ a metà persone si pone la domanda
in un modo a metà nell’altro e con i risultati vedi quale causa meno errori
4. Indagine pilota:  es. istat prima di lanciare censimento che è molto costoso e compli‐
cato l’anno prima fa un censimento campionario per testare come va.

Panel
Campioni probabilistici che vengono utilizzati per un periodo ripetuto perché hanno det. ca‐
ratteristiche.

T2 A B C Tot
T1Æ
A 25
B 30
C 45
Tot 30 20 50 100

Panel

T=1 e t=2

Vogliamo ad esempio in 2 periodi stimare se c’è stato l’aumento o la diminuzione del valore
della vendita del prodotto.

Stimatore di Y1‐ Æ y1‐

Stimatore di Y2 ‐ Æ y2‐

Stimatore di (Y2 ‐ Y1‐)  Æ y2‐ y1‐

Varianza di  (Y2 ‐ Y1‐) = Var(

CAMPIONI INDIPENDENTI

Vengono utilizzati quando di fatto non si ha la possibilità di mettere in piedi un panel oppure
se non siamo interessati all’utilizzo del panel. E’ il tipico strumento utilizzato ad esempio per
conoscere il consumo di un prodotto nell’anno. Utilizzato anche per monitoraggio audience
di alcuni mass media, es. stampa o radio.

## L’informazione  raccolta  tramite  campioni  indipendenti  ha  caratteristiche  particolari  nella

misura in cui devo calcolare il valore medio.

Restiamo nell’esempio dei 2 periodi t1 e t2 in cui vogliamo conoscere il valore di y1medio e
y2medio per poter conoscere uno stimatore MEDIA . Io so che y1medio ed y2medio sono
stimatori corretti, quindi la media di questi 2 è uno stimatore corretto del valore medio rea‐
le.

La varianza di (ym1+ym2)/2  = ¼ * (Var( Ym1) + Var (ym2))

Se noi calcoliamo la stessa stima utilizzando i dati di un panel la stia sarebbe la stessa ma la
varianza sarebbe:

¼ * var (ym1)+var(ym2) + 2r(ym1‐ym2)*…………… (vedi ale)

Quindi lo stimatore fatto con il panel è meno efficiente perché ha una variabilità + elevata.

Abbiamo chiuso la parentesi sui panel.

Una  fase  molto  importante  per  la  prevenzione  e  lo  studio  degli  errori  non  campionari  è  il
momento della REGISTRAZIONE.

Si tratta di un momento molto delicato dal punto di vista della qualità dei dati, anche se lo è
sempre  di  meno  in  un  contesto  di  tecnologie  che  utilizzano  software  attraverso  i  quali  la
compilazione del questionario, la codifica e la registrazione sono CONTEMPORANEE. Mentre
nel cartaceo sono successive.

Esistono comunque alcune indagini che vengono ancora svolte per iscrittoÆ censimenti.

Come vengono fatti i controlli durante la fase di registrazione?? Si fanno dei campioni e per i
campioni estratti si fanno dei controlli con i valori veri e se l’errore è superiore ad un certo
livello il lavoro di registrazione viene fatto rifare.

Controlli  sequenziali  Æman  mano  che  la  registrazione  avviene  c’è  la  possibilità  di  fare  un
controllo

CORREZIONE DEGLI ERRORI NON CAMPIONARI

Nonostante tutti i controlli e i sistemi di prevenzione, succede che gli errori avvengano ed è
quindi necessario trovare dei metodi per correggerli.

Iniziamo dalla correzione degli errori di lista.

Metodi x Lista incompleta (accenno):

‐ Metodo dell’intervallo semi‐aperto
Ha una caratteristica particolare. E’ utilizzato per indagini campionarie areali cioè la
lista non è di persone ma di aree territoriali  all’interno delle quali si identificano gli
alloggi (case, villette, appartamenti …). E’ utilizzato negli usa perché non hanno liste
anagrafiche.

materiale gratuito disponibile sul sito http://www.appuntibicocca.com   25 of 31

nella lista ed aggiungerli nella lista quando è contiguo ad uno campionato in prece‐
denza.
‐ Metodo della doppia base di campionamento
E’ stato inventato quando le liste telefoniche erano ancora incomplete.
La tecnica consiste nell’utilizzare sia lista telefonica sia lista anagrafica in modo com‐
plementare tra  di  loro  cosi  da  poter  raggiungere  le  unità  che  sono  presenti  solo  in
una delle due.
‐ Metodo della post‐stratificazione
A volte succede che un’unità estratta è un grappolo, cioè ne contiene altre. Proble‐
ma  di  sovra  rappresentazione.  Allora  posso  intervistare  tutte  le  unità  del  grappolo
estratte, oppure seleziono a caso un elemento del grappolo e successivamente do un
peso proporzionale alle dimensioni del grappolo. Nel secondo caso il campione non è
più auto ponderante, perché ogni unità avrà un peso diverso, quindi quando vado a
calcolare la media devo considerare anche i pesi.

Lista con nominativi inesistenti o estranei.

Se riesco a pulire la lista prima di estrarre il campione è meglio, però non sempre posso far‐
lo. Ci sono varie modalità per ovviare al problema:

‐  Estraggo  un  campione  sovradimensionatoÆ  ne  estraggo  1200  invece  di  1000  per‐
ché so che 200 non vanno bene
‐ Estraggo in un secondo tempo le unità mancanti

Lista con nominativi ripetutiÆlista elettorale x famiglie

‐  Ponderare le osservazioni per il reciproco della probabilità di inclusione. ESEMPIO:  se Bi  è il
numero del nominativo della famiglia p è la probabilità di estrazione 1/p x Bi    è il reciproco
della probabilità di inclusione, cioè si ponderano le osservazioni con il reciproco della proba‐
bilità i inclusione
‐  Correggere  la  probabilità  di  selezione  Æ  se  famiglia  è  presente  4  volte  ad  ognuno  do  ¼
mentre all’intera famiglia do 1. Di fatto, si raggiunge lo stesso risultato di quando si prende
solo il membro + giovane.

MANCATE RISPOSTE TOTALI
Provocano 2 problemi:

‐  La diminuzione della numerosità del campione aumenta la variabilità delle stime.
‐  Le mancate risposte introducono distorsioni nelle stime.

Metodi di correzione utilizzati durante l’indagine campionaria

‐  Sostituire le unità mancanti direttamente mentre si sta facendo l’indagine. Normalmente lo
si fa tramite una lista di riserva. Di fatto, è il metodo utilizzato per formare un panel.

‐ Posso decidere che una parte o tutte le unità dei non rispondenti vengono intervistate utiliz‐
zando un diverso metodo di indagine, ad esempio l’indagine telefonica  postale invece che
diretta.  Si ricorre a questa doppia intervista quando si ritiene che le non risposte derivano
dal metodo utilizzato.
‐ Metodo della domanda crucialeÆ quando l’intervistatore si accorge che l’intervistato sta ri‐
fiutando di partecipare all’intervista cerca di porgli almeno una domanda. Questa domanda
può  servire  ad  avere  un’informazione  diretta  sull’argomento  che  voglio  conoscere,  oppure
può servirmi per sapere che caratteristica ha rispetto al fenomeno che sto studiando. Dipen‐
de dalle informazioni che conosco sul soggetto e dall’obiettivo dell’indagine.
ÆÆÆÆDOMANDA CRUCIALE: HAI MAI COMPERATO LA MOZZARELLA BINGO BONGO?
Metodi di correzione impiegati dopo l’indagine campionaria Cerchiamo di raddrizzare la sti‐
ma, cioè di farla diventare non distorta. Noi sappiamo che il comportamento è collegato a
certe caratteristiche socio demografiche. Ad esempio a parità di fattori le donne guadagna‐
no meno degli uomini, i giovani fanno scelte diverse dagli anziani.
Se  divido  la  popolazione  target  in  4  classi  secondo  età  e  sessoÆ  giova‐
ni/vecchi/maschi/femmine
Se la variabilità è determinata totalmente dal sesso e dall’età io posso dire che rispondenti e
non rispondenti hanno lo stesso comportamento.  In altre parole andrò a suddividere in clas‐
si  omogenee  al  loro  interno  ed  eterogenee  tra  di  loro  in  modo  da  ipotizzare  che
l’omogeneità fa si che il comportamento sia lo stesso proprio perché c’è un solo fattore che
lo determina.
A questo punto prendo il campione dei rispondenti e divido il campione secondo delle classi
(le stesse) e calcolo gli stimatori per classe.

‐  Tecnica della ponderazione
‐ Tecnica della post‐stratificazione

LEZIONE DEL 14/04/08

METODO DELLA PONDERAZIONE:

partendo dal caso di non rispondenti selezionati, si constata che lo stimatore è distorto. Esistono al‐
cune variabili che determinano dei gruppi omogenei al loro interno ed eterogenei all’esterno. es:se
pigliamo una popolazione in cui le caratteristiche sono sesso e età noi consideriamo che tutti i GIO‐
VANI MASCHI si comportano allo stesso modo.

Adesso formalizziamo e CAPIAMO SE CI SIAMO CAPITI!

PONDERAZIONE

Si divide il campione in C classi di numerosità n1, n2, … nc classiÆprendo il campione e lo divido in c
classi, e queste classi le identifico attraverso le variabili controllo.

materiale gratuito disponibile sul sito http://www.appuntibicocca.com   27 of 31

prima dell’indagine e la suddivisione dopo l’indagine. Il  metodo  della ponderazione parte  dal fatto
che le variabili controllo ce le ho prima della intervista.  LA  numerosità delle classi del campione e‐
stratto e dopo ho la numerosità delle classi dei rispondenti.

Dato  che  il  comportamento  dei  rispondenti  e  dei  non  rispondenti  è  il  medesimo.  (riascolta  questo
pezzo)

Per compensare le non risposte ad ogni valore campionario( unità) che chiamo yi si associa il peso
ni/nir ovvero la numerosità totale rapportata alla numerosità dei rispondenti(IL PROF è IN CRISI!!!),
OVVERO IL RECIPROCO DEL TASSO DI RISPOSTA di ciascuna classe. Associare il peso ad ogni valore
equivale ad imputare a ciascun non rispondente il valore medio della classe attribuzione .

FORMULE: copia da pagine fatte a mano!!!NO sono riuscito a fare la foto!!!!!!!!!!!

Lo stimatore y verrà trasformato.

LA POST STRATIFICAZIONE(ha ribadito che ci darà la dispensa!!!)

Quando lo si applica??  Quando ho fatto l’indagine avrò informazioni, e queste si utilizzano per stra‐
tificare a posteriori. Identifico i gruppi dopo. Il resto è analogo a prima. La post si usa quando non
conosco  le  variabili  controllo  ma  le  posso  dedurre  dalle  informazioni  raccolte  durante
l’interrogazione.

Esistono anche altri metodi per risolvere i problemi legati alle non risposte ma citiamo solo i nomi:
Regressione e Quoziente. Con questo abbiamo terminato l’argomento delle mancate risposte totali.

MANCATE RISPOSTE PARZIALI

Per mancate risposte si intende la mancata risposta solo ad alcune risposte del questionario. Se le
parziali sono le risposte fondamentali equiparo la parziale alla totale e butto il questionario

Ci sono 3 strategie:

1) IMPUTAZIONE

Tutti  questi  metodi  sono  tutti  metodi  che  utilizzano  programmi  (informatici)  ad  hoc  ed  è  questo  il
motivo per il quale i comuni mortali non li usano.

IMPUTAZIONE  ANALITICA:  di  fatto  va  a  ricostruire  partendo  da  info  che  ho  rispetto  all’unità  (colui
che ha risposto) ricostruire il valore vero (se in un punto non c’è la risposta ma se c’è un'altra rispo‐
sta simile imputo questa risposta anche a quella mancante).

IMPUTAZIONE  DETERMUNISTICA:  se  esistono  dei  legami  tra  2  variabili,  vado  a  verificare  se  esiste
una risposta con altre variabili legate e le associo. (ha 74 anni allora alla domanda ha avuto figli negli
ultimi mesi la risposta è sicuramente NO)

IMPUTAZIONE DA MODELLO: se tra A e B esiste una relazione di tipo statistico derivante da un algo‐
ritmo qualsiasi anche matematico il programma sostituirà in b il valore che deriva dalla risposta di A(
se dall’algoritmo deriva che se a=6 b=7 allora se B è mancante vado a vedere quanto è A e attribui‐
sco il valore a B)

2) CRITERIO DEL DONATORE.

ANCHE QUI ABBIAMO 3 METODI

1. SOSTITUIRE AL DATO mancate il valore medio aritmetico uscito dall’indagine( se uno non mi
ha detto quale è il suo reddito calcolo il reddito medio degli altri rispondenti e attribuisco al
mancante quel valore)
2.  Dividiamo  le  unità  dei  corrispondenti  in  classi  utilizzando  determinate  caratteristiche  (età,
reddito ecc.posso prendere tutte le caratteristiche che voglio), poi vado a  prendere quello
che non ha risposto vedo in che gruppo appartiene e vado ad attribuire il valore medio del
gruppo.
3. È un derivato del secondo metodo, sostituire il valore dell’unità più vicina all’unità mancan‐
te. Identifico tutte le variabili e trovo il rispondente più simile al rispondente mancante e poi
associo la stessa risposta del più vicino alla risposta mancante.(posso anche prendere i 2 più
vicini e faccio la media)

3) CRITERI DI CASUALITA’

1. Consiste nell’estrarre a caso un unità tra quelli che hanno risposto alla domanda per la
quale non ho risposta e associo l’unità estratta a caso!!!
2. Esiste poi un metodo più raffinato che estrae dei gruppi e poi estraggo a caso dal grup‐
po.

materiale gratuito disponibile sul sito http://www.appuntibicocca.com   29 of 31

Cenni sulla pubblicità.

La pubblicità in un approccio micro economico rappresenta un’importante funzione per il mktg. Ser‐
ve all’impresa per vendere quello che produce. Serve a vendere il prodotto facendolo conoscere e
creano una propensione la consumo. In questa prospettiva vengono individuati i seguenti punti

1. Il ruolo da attribuire alla pubblicità rispetto agli altri elementi di mktg
2. Le interdipendenze con le iniziative pubblicitarie della concorrenza
3. La dimensione e la temporalità del budget
4. La misurazione degli effetti delle spese pubblicitari sulle vendite
5. I rapporti tra pubblicità e altri metodi di incentivazione vendite

Il prof ha scelto il 4!ci concentriamo soprattutto su questo.

Nel contesto del 4 faremo una veloce rassegna sull’incidenza e ruolo economico della pubblicità

RUOLO ECONOMICO DELLA PUBBLICITÀ

Si cominciò a studiare il titolo solo alla fine dell’800 e il primo a studiarlo fu Marshall. Le teorie si di‐
vidono i 2 filoni in conflitto:

teoria potere di mercato vs teoria dell’informazione

Queste due teorie che si contrappongono in M. sono due dimensioni che si separano successivamen‐
te. M. fa esplicito riferimento alle attività promozionali dato che ormai queste attività esistono dob‐
biamo riconoscere che sono una parte nel costo totale della produzione di un bene. In questo conte‐
sto dice: pur costituendo un costo aggiuntivo per l’impresa rispetto alla produzione fisica stretta,
questo costo è nell’interesse stesso dell’impresa perché un modo che l’impresa usa per far cono‐
scere il bene per far aumentare la domanda di quel bene. Questa è la prima teoria.  Trenta’anni do‐
po M. in poche pagine fornisce un quadro del ruolo della pubblicità. Dice: la pubblicità è utile per la
capacità di illustrare l’esistenza e l’utilizzo di un prodotto. Permette al consumatore di individuare
un prodotto che soddisfi i propri bisogni senza sprecare troppo tempo. Quando e nel momento in
cui le imprese utilizzano la pubblicità  con lo scopo di combattere la concorrenza e attraverso in‐
cessante ripetizione di messaggi guadagnare quote di mercato e per fare questo investe forte capi‐
tale  si  finisce  per  generare  un  inutile  spreco  di  risorse  che  con  una  conseguenza  diretta  eleva  i
prezzi del prodotto e col rendere il mercato meno libero.

Negli anni 30 si riprende interesse per la pubblicità con: Robinson e Chamberlin

Essi studiano una teoria economica che spieghi la ragione per la quale nella maggior parte dei mer‐
cati avevano delle caratteristiche intermedie tra la concorrenza perfetta e monopolio. Dato che loro
erano  convinti  che  in  assenza  di  forze  esterne  dovevano  andare  verso  una  concorrenza  perfetta  o
verso il monopolio vuol dire che se non vanno è perché sci sono delle perturbazione e una perturba‐
zione è la pubblicità. La pubblicità è un elemento di disturbo perché è in grado di associare al pro‐
dotto caratteristiche di unicità poco importa se vere o fittizie. In questo modo la tendenza è che cia‐

scun produttore diventi monopolista. Pubblicità vista come strumento per avere potere sul  merca‐
to. Rende i consumatori disposti a pagare di più pur di disporre del bene promosso.  Altri due dico‐
no(Ekelund e Saurman) che se la pubblicità aumenta la domanda si può o produrre di più o aumen‐
tare i prezzi ma generalmente i produttori aumentano il prezzo.        La pubblicità ostacola la concor‐
renza  creando  delle  barriere  all’entrata.(Kaldor).  La  pubblicità  serve  a  eliminare  la  concorrenza  se
fatta in modo massiccio, e inoltre impedisci o rendi molto difficile entrare perché avresti bisogno di
investimenti  pubblicitari  talmente  alti.  Altri  autori(Comanor  e  Wilson)  dicono  che  aumentando
l’investimento pubblicitario si ottiene un incremento delle vendite più che proporzionale delle vendi‐
te, perché l’effetto di messaggi cumulativi ripetuti da vantaggio a chi utilizza la pubblicità, inoltre chi
fa tanta pubblicità a capacità di contrattare pubblicità più di chi la fa poco. Questo fa si che chi vuole
entrare è ancora più in difficoltà.

GALBRAITH: accusa la pubblicità di essere un oscura forza persuasiva che vuole e può modificare i
desideri e i bisogno degli individui e può crearne di nuovi. Perché quello che punta l’impresa è ven‐
dere e si creano quindi esigenze false e futili. I PERSUASORI OCCULTI 1958 PACKARD: il pubblicitario
è un essere abile a modificare le coscienze e che ricorre ad attività persuasive.

1. La pubblicità favorisce l’instaurasi di comportamenti monopolistici attraverso la differenzia‐
zione  del  prodotto  creata  dalla  pubblicità,  garantendo  all’impresa  un  potere  sul  prezzo.  I
prezzi salgono
2. La pubblicità è persuasiva e manipolatrice ed induce i consumatori all’acquisto manipolando
il consumatore
3. La  pubblicità  è  uno  spreco  di  risorse,  perché  ci  sono  ingneti  investimenti  in  pubblicità  che
possono  portare a situazioni di conflitti feroci.

TEORIA DELL’INFORMAZIONE

Gli effetti benefici della comunicazione pubblicitaria:

La pubblicità è utile e benefica perché: non solo è compatibile con la concorrenza ma anche è van‐
taggiosa per il consumatore. Proprio per questo l’attività di diffusione delle informazioni è vitale per
lo sviluppo economici e per lo sviluppo della società. HAYEK E KIRZNER partono criticando gli altri: è
scorretto dire che la pubblicità crea i bisogni inesistenti, i bisogni necessari sono poco tutti gli altri
sono indotti quindi non è colpa della pubblicità, quindi è la società che crea i bisogni e la pubblicità è
uno strumento usato per aumentare la diffusione dei bisogni .

materiale gratuito disponibile sul sito http://www.appuntibicocca.com   31 of 31