Sei sulla pagina 1di 59

Piergiorgio Corbetta

METODOLOGIA E TECNICHE DELLA


RICERCA SOCIALE

1) I PARADIGMI DI RIFERIMENTO

I PARADIGMI DELLA RICERCA SOCIALE


Kuhn e i paradigmi delle scienze

La parola paradigma ha unantica origine nella storia del pensiero filosofico, stata utilizzata da Platone
(nellaccezione si modello) e da Aristotele (esempio). In sociologia il suo uso molto inflazionato e resto
confuso da molteplici significati (sinonimo di teoria, articolazione interna di una teoria, scuola o corrente
di pensiero).
Il concetto di paradigma stato espresso nel 1962 da Thomas Kuhn nellopera La struttura della rivoluzioni
scientifiche. La riflessione di Kuhn ha per oggetto lo sviluppo storico delle scienze ed egli rifiuta la
concezione tradizionale della scienza come accumulazione progressiva e lineare di nuove acquisizioni,
affermando invece che in certi momenti (detti rivoluzionari) si interrompe il rapporto di continuit con il
passato e si inizia un nuovo corso,in modo non completamente razionale. Si tratta di un elemento arbitrario
composto di accidentalit storiche e personali sempre presente come elemento costitutivo nelle convinzioni
manifestate da una data comunit scientifica in un dato momento.
Secondo la tradizionale concezione cumulativa le singole invenzioni e scoperte si aggiungevano al corpo
conosciuto precedente, alla stregua dei mattoni che si sovrappongono nella costruzione di un edificio a pi
piani. Nei momenti rivoluzionari il processo di continuit con il passato si interrompe e si inizia una nuova
costruzione, viene fatto saltare in aria un vecchio palazzo di mattoni per fare spazio ad un edificio
strutturalmente diverso,
Il passaggio da una teoria a unaltra cos globale e ha tali conseguenze che Kuhn lo chiama rivoluzione
scientifica.
A seguito di queste rivoluzioni in una determinata disciplina si produce un cambiamento dei problemi da
proporre allindagine scientifica e dei criteri con cui si stabilisce cosa si considera come un problema
ammissibile e di seguito cambia anche la struttura concettuale Il paradigma - attraverso cui gli
scienziati guardano il mondo.

Il paradigma una prospettiva teorica che condivisa e riconosciuta dagli scienziati in una determinata
disciplina, fondata su acquisizioni precedenti della disciplina stessa ed opera indirizzando la ricerca
individuando e scegliendo i fatti rilevanti da studiare - formulando ipotesi entro le quali collocare la
spiegazione del fenomeno osservato individuando le tecniche di ricerca empiriche necessarie.

Senza un paradigma una scienza non ha orientamenti n criteri di scelta, perch tutti i criteri, i problemi e le
tecniche diventano ugualmente legittime. Il paradigma una guida e fornisce agli scienziati sia un modello
ma anche le indicazioni per costruirlo. Con il paradigma lo scienziato acquisisce contemporaneamente in una
mescolanza inestricabile, teorie, metodi e criteri. Il paradigma qualcosa di pi ampio e generale di una
teoria, una visione del mondo, una finestra mentale, una griglia di lettura che precede lelaborazione
teorica.

1
La scienza normale definita da Kuhn come quei periodi in cui esiste allinterno di una disciplina un
paradigma condiviso dalla comunit degli scienziati.
Ogni scienza matura possiede in ogni momento della sua storia un suo paradigma, esso rappresenta una
sorta di visione che orienta la comunit di scienziati indirizzando la loro ricerca.
Le scienze sociali non essendo scienze mature non hanno dei paradigmi.
Nella storia della sociologia ed in generale delle scienze sociali difficile individuare un paradigma
predominante, condiviso da tutti i sociologi.
Solo tra gli anni 40 e 50 ha prevalso il concetto di sistema e la teoria funzionalista di T. Parsons. Egli
rielabora il pensiero degli europei e crea una teoria basata sul sistema e sul consenso. A questo paradigma
viene contrapposto quello di Marx, basato sul conflitto sociale. In questo modo possiamo parlare di disciplina
multi paradigmatica ovvero una disciplina che contiene al suo interno pi paradigmi.

Positivismo e interpretativismo

Effettuando unanalisi storica possiamo individuare due paradigmi fondativi che hanno indirizzato la
ricerca sociale: il positivismo ( 2 versioni 800 Positivismo 900 Neopositivismo e Postpositivismo) e
linterpretativismo.

(nb: tra le funzioni di un paradigma c quella di definire i metodi e le tecniche di ricerca accettabili in una
disciplina)
La profonda differenza tra i due paradigmi emerge dalle risposte che essi danno alle domande principali a cui
si trova di fronte la scienza sociale: la realt (sociale) esiste ( ontologia)? conoscibile (epistemologia)?
Come pu essere conosciuta (metodologia)?

La Questione Ontologica (Ontologia: Quella parte della filosofia che studia lessere in quanto tale, dal greco
Ontos (essere, ente) e logos ( discorso, riflessione) la questione del che cosa, ci si chiede se il mondo dei
fatti sociali sia reale e oggettivo dotato d autonoma esistenza al di fuori della mente umana e
dellinterpretazione del soggetto. Ci si interroga se i fenomeni sociali siano cose in se stesse o
rappresentazioni di cose.

La questione Epistemologica (Epistemologia: riflessione sulla conoscenza scientifica , dal greco episteme
(conoscenza certa)) il rapporto tra il chi ed il che cosa, essa pone laccento tra lo studioso e la realt
studiata.

La questione Metodologica (Metodologia: dal greco metodo ( strada con cui, metodo). Questione
metodologica in quanto ha a che fare con i metodi della ricerca sociale, intesi come corpo organico di
teorie.) riguarda la strumentazione tecnica del processo conoscitivo

Positivismo

Il paradigma positivista (il primo ad essere utilizzato nelle scienze sociali) studia la realt sociale utilizzando
(quello che era allora il paradigma applicato alle scienze naturali )gli apparati concettuali, le tecniche di
osservazione e misurazione, gli strumenti di analisi matematica e i procedimenti di inferenza delle scienze
naturali. Esso infatti sosteneva che la realt sociale dovesse essere studiata con la stessa logica investigativa
le lo stesso metodo utilizzato dalle scienze sociali, da qui il nome di Fisica Sociale attribuito allo studio della
societ.
Il primo a tradurre la prospettiva teorica globale in termini di ricerca empirica fu Durkheim, per questo
diciamo che fu il primo scienziato sociale, il primo vero sociologo positivista.
La sua prassi empirica fondata sulla teoria del Fatto Sociale, essa impone di trattare i fatti sociali come
cose effettivamente esistenti al di fuori delle coscienze individuali e studiabili oggettivamente.
Essi hanno le medesime propriet delle cose del mondo naturale e come tali non sono soggette alla volont
delluomo e funzionano secondo proprie regole che possono essere studiate.

Lontologia del positivismo si basa sul Realismo Ingenuo: la realt sociale reale ed ha dunque un esistenza
effettiva ed conoscibile, come se si trattasse di una cosa.

2
Dal punto vista epistemologico, esso si basa sul dualismo tra lo studioso e loggetto di studio (che non si
influenzano a vicenda in nessun modo mantenendo una loro oggettivit),lo studioso analizza il fatto sociale
intenso come dato esterno ed immodificabile e presume di ottenere risultati veri e certi, il suo obiettivo
quello di spiegare e di formulare leggi naturali e generali immutabili poich si basano sulosservazione di
quelle che sono le categorie di causa effetto.

La metodologia positivista prevede quindi esperimenti e manipolazioni della realt, con osservazioni e
distacco tra losservatore e losservato; il suo modo di procedere prevalentemente induttivo (dal particolare
al generale-universale). Le tecniche utilizzate sono quantitative (esperimenti, statistica) e si utilizzano le
variabili.
Analisi per variabili.

Neopositivismo

Il neopositivismo nasce per rispondere alle critiche ed ai limiti che erano stati avanzati al positivismo.
Si ha un rifiuto delle questioni metafisiche definite prive di senso in quanto indimostrabili e ci si concentra sui
problemi metodici di ogni scienza, allanalisi del loro linguaggio e delle loro elaborazioni teoriche.
Si sviluppo un modo di parlare della realt sociale del tutto nuovo, mutato dalla matematica e dalla statistica
che Paul Lazarsfeld chiam linguaggio delle variabili.
Ogni oggetto sociale anche lindividuo veniva analiticamente definito sulla base di una serie di attributi e
propriet, le variabili, e a questa ridotto. La variabile con i suoi caratteri di neutralit, oggettivit diventava la
protagonista dellanalisi sociale.
Le teorie sociali non vengono espresse sotto forma di leggi deterministiche ma in termini probabilistici.
Ogni affermazione teorica assume una connotazione di provvisoriet e rimane sempre esposta alla possibilit
di una smentita.

Dal punto di vista ontologico, adotta il realismo critico, per cui afferma che esiste una realt sociale esterna
alluomo, ma che essa conoscibile solo imperfettamente data linevitabile imprecisione di una conoscenza
umana ed in modo probabilistico data la natura stessa delle sue leggi che hanno carattere probabilistico.
Realismo si assume che relazioni causa /effetto sono presenti al di fuori della mente umana. Critico
atteggiamento di continua messa in discussione da parte dello scienziato delle nozioni

Lepistemologia del neopositivismo prevede il riconoscimento del rapporto di interferenza tra studioso e
studiato, che deve essere il pi possibile evitato per poter formulare leggi non pi assolute, ma limitate nel
tempo e soggette alla continua falsificazione per poter arrivare sempre pi vicini alla conoscenza assoluta.

La metodologia resta sostanzialmente quella del positivismo, anche se c unapertura ai metodi qualitativi.
Analisi per variabili.

Interpretativismo

Linterpretativismo, che vede in Weber il suo esponente principale, fonda le sue basi sulla fondamentale
differenza epistemologica fra le scienze sociali e quelle naturali per il motivo che la realt sociale non pu
essere semplicemente osservata ma necessita di essere interpretata. Nelle scienze naturali loggetto di studio
consiste in una realt esterna al ricercatore e che tale rimane durante tutto il percorso di ricerca per cui la
conoscenza assume la forma di spiegazione mentre nelle scienze sociali non essendoci distacco tra
osservatore e ci che osservato la conoscenza pu essere raggiunta solo attraverso il processo di
comprensione; in questo modo si pone allopposto del positivismo per quanto riguarda i punti principali del
paradigma.
Il campo di indagine ora nuovo per la Sociologia il mondo della vita quotidiana, e se la vita umana
diversa dal mondo naturale essa andr studiata con metodi diversi da quelli positivistici, lattuale
impostazione soggettiva non pu adottare il linguaggio delle variabili.

Infatti, la sua ontologia prevede il costruttivismo e il relativismo (realt multiple), vale a dire che
non esiste una realt oggettiva (ogni individuo produce una sua realt, e solo questa realt conoscibile);
inoltre anche le singole realt individuali o anche condivise tra i gruppi sociali, variano comunque tra le
diverse culture e quindi non esiste una realt sociale universale valida per tutti ma bens realt multiple.

3
Lepistemologia prevede un non-dualismo, non-separazione, non oggettivit tra studioso e oggetto dello
studio ma interdipendenza, la ricerca sociale vista come una scienza interpretativa alla ricerca di significato
piuttosto che una scienza sperimentale in cerca di leggi. Nel perseguire il suo obiettivo,
che quello della comprensione del comportamento individuale, la ricerca sociale pu servirsi di astrazioni e
generalizzazioni: i tipi ideali e gli enunciati di possibilit.

La metodologia prevede linterazione empatica tra studioso e studiato, perch solo in questo modo
possibile comprendere il significato attribuito dal soggetto alla propria azione. Le tecniche sono quindi
qualitative e soggettive e il metodo usato quello dellinduzione (dal particolare al generale).
Analisi per casi.

Radicalizzazioni e critiche

La radicalizzazione dei precedenti approcci pu avere gravi conseguenze.


Una radicalizzazione del positivismo consiste nel riduzionismo, cio nel ridurre la ricerca sociale ad una mera
raccolta di dati senza unelaborazione teorica che li supporti. In questo modo la ricerca sociale diventa una
massa sterminata di dati minuziosamente rilevati, misurati e classificati, ma non coordinati tra loro, privi di
connessioni significative, incapaci di rendere una conoscenza adeguata delloggetto cui nominalmente si
riferiscono.
In ogni caso, la critica maggiore mossa al positivismo quella di separare troppo nettamente le categorie
osservative da quelle teoriche; in altre parole non possibile sostenere che le forme di conoscenza non
siano storicamente e socialmente determinate e quindi dipendenti dalle teorie utilizzate.
Per quanto riguarda linterpretativismo, le critiche maggiori sono rivolte ai filoni sviluppatisi dalla teoria
originale di Weber (che pur affermando la centralit dellintenzione soggettiva, non escludeva la possibilit di
arrivare a delle forme di generalizzazione conoscitiva, i tipi ideali) che si spingevano verso un soggettivismo
estremo. In questo modo si esclude la possibilit dellesistenza della scienza sociale, perch se tutto
soggettivo e unico non possono esistere leggi sociali comuni a pi individui che hanno assunto autonomia
rispetto ai singoli, come le istituzioni. La seconda critica afferma che se la realt una pura costruzione
soggettiva, non possibile andare oltre alla persona, si nega la possibilit di generalizzazioni sovraindividuali
e quindi si nega loggettivit della scienza. Se il ricercatore non pu trascendere loggetto dellindagine non
pu esistere la conoscenza oggettiva.

RICERCA QUANTITATIVA E RICERCA QUALITATIVA


Per evidenziare le differenze tra i due approcci descriviamo due ricerche condotte sulla stessa tematica la
delinquenza giovanile una condotta sotto l ispirazione del paradigma neopositivista una allinsegna del
paradigma interpretativo.
Si far riferimento a due tipi ideali e puri di ricerca per focalizzarci sulle differenze dei due approcci.

Paradigma Neopositivista: Crime in the making di Sampson e Laub

Essi effettuano unindagine secondaria sui dati gi esistenti di uninchiesta campionaria sulla delinquenza
giovanile ed un esempio di ricerca quantitativa che si ispira al paradigma neopositivista.
Essa mette in luce un modo di procedere sistematico, nel quale ogni capitolo segue in una geometria
circolare uno schema a 4 fasi: inquadratura teorica, rilevazione empirica, analisi dei risultati, ritorno alla
teoria. Lanalisi dei dati viene condotta sulle variabili ( variabili di base: classiche variabili , povert,
disgregazione familiare, criminalit dei genitori / variabili di processo: fanno riferimento ai legami informali,
famiglia, scuola, lavoro) utilizzando tecniche statistiche al fine di produrre modelli causali nei quali le variabili
sono connesse da relazioni di causa-effetto.

4
Paradigma interpretativo: Islands in the street di Sanchez jankowski

Questo studio un esempio di osservazione partecipante, una delle tecniche classiche della ricerca
qualitativa basata sul paradigma interpretativo. Gli interrogativi sono simili alla ricerca precedente ma il
metodo di lavoro molto differente. Lautore ha partecipato personalmente alla vita delle gang oggetto della
sua indagine 37gang in 10 anni- , prendendo parte alle loro attivit e registrando le sue osservazioni su
taccuini nel corso dellosservazione stessa. Lo scopo non individuare le relazioni di causa-effetto tra le
variabili ma quello di capire le motivazioni che stanno dietro il comportamento dei membri delle gang e
costruire delle classificazioni e delle tipologie.

Ricerca quantitativa e ricerca qualitativa: un confronto

Le differenze fra ricerca quantitativa e ricerca qualitativa - intese non pi come riferimento alle loro
premesse filosofiche ed epistemologiche , ma guardando alle concrete applicazioni empiriche posso essere
comprese meglio se analizziamo le 4 fasi della ricerca empirica:
Disegno della ricerca Rilevazione delle informazioni Analisi dei dati Produzione dei risultati

Impostazione della ricerca

Nei due approcci fondamentalmente diverso il rapporto instaurato tra teoria e ricerca.
Nel caso della ricerca quantitativa neopositivista, il rapporto strutturato in fasi logicamente sequenziali ,
secondo unimpostazione sostanzialmente deduttiva (la teoria precede losservazione), che si muove nel
contesto della giustificazione, cio di sostegno, tramite i dati empirici, della teoria precedentemente
formulata sulla base della letteratura.

Nel caso della ricerca qualitativa interpretativista elaborazione teorica e ricerca empirica procedono
intrecciate, in quanto il ricercatore vede nella formulazione iniziale di una teoria una possibile
condizionamento che potrebbe inibirgli la capacit di comprendere il soggetto studiato. In questo modo la
letteratura ha una minore importanza.

Anche i concetti sono usati in modo diverso dai due approcci. I concetti sono gli elementi costitutivi della
teoria, e tramite la loro operativizzazione (trasformazione in variabili empiricamente osservabili) permettono
alla teoria di essere sottoposta a controllo empirico.

Nellapproccio neopositivista la chiarificazione dei concetti e la loro operativizzazione in variabili avvengono


prima ancora di iniziare la ricerca. ( es: lavoro di Sampson e Kaub concetto di disgregazione familiare gli
autori lo operativizzano nel seguente modo: valore 1 disgregazione quando in famiglia uno o entrambi i
genitori sono assenti per divorzio, separazione, decesso; valore 0 per gli altri casi)
Questo metodo, se da un lato offre il vantaggio di poter rilevare empiricamente il concetto, dallaltro
comporta anche lo svantaggio di una forte riduzione e impoverimento del concetto stesso, con il rischio
ulteriore che la variabile sostituisca il concetto (reificazione).

Un ricercatore qualitativo avrebbe invece utilizzato il concetto come orientativo ( sensitizing concept), che
predispone alla percezione, ancora da definire non solo in termini operativi, ma anche teorici, nel corso della
ricerca stessa. I concetti diventano quindi una guida di avvicinamento alla realt empirica, non riduzioni della
realt stessa in variabili astratte.

Per quanto riguarda il rapporto generale con lambiente studiato, lapproccio neopositivista non ritiene che
la reattivit del soggetto possa rappresentare un ostacolo di base, e crede che un certo grado di
manipolazione controllata sia ammissibile. Viceversa la ricerca qualitativa si basa sull approccio
naturalistico, vale a dire che il ricercatore non manipola in alcun modo la realt in esame. I due modi di fare
ricerca trovano illustrazioni tipiche e opposte nelle tecniche dellesperimento e dellosservazione partecipante.
Se passiamo alla specifica interazione psicologica con i singoli soggetti studiati, il ricercatore quantitativo
assume un punto di vista esterno al soggetto studiato, in modo neutro e distaccato; inoltre studia solo ci
che egli ritiene importante. Il ricercatore qualitativo invece si immerge il pi completamente possibile nella
5
realt del soggetto e quindi tende a sviluppare con i soggetti una relazione di immedesimazione empatica.
Ma in questo modo sorge prepotentemente il problema delloggettivit della ricerca.
Anche linterazione fisica con i singoli soggetti studiati differente per i due approcci. La ricerca
quantitativa spesso non prevede alcun contatto fisico tra studioso e studiato il ricercatore ha un
atteggiamento nei confronti dei soggetti studiati neutrale e distaccato -, mentre nella ricerca qualitativa il
contatto fisico una precondizione essenziale per la comprensione empatia ed identificazione - .
Il soggetto studiato quindi risulta passivo nella ricerca quantitativa, mentre ha un ruolo attivo nella ricerca
qualitativa.

Rilevazione (disegno della ricerca)

Nella ricerca quantitativa il disegno della ricerca (decisioni operative che sovrintendono allorganizzazione
pratica della ricerca) costruito a tavolino prima dellinizio della rilevazione ed rigidamente strutturato e
chiuso. Nella ricerca qualitativa invece destrutturato, aperto, idoneo a captare limprevisto, modellato nel
corso della rilevazione. Da queste diverse impostazioni deriva la diversa concezione della rappresentativit
dei soggetti studiati. Nella ricerca quantitativa il ricercatore pi preoccupato della rappresentativit del
campione di societ che sta studiando piuttosto che della sua capacit di comprendere, mentre lopposto
vale per la ricerca qualitativa, alla quale non interessa la rilevanza statistica bens limportanza che il singolo
caso sembra esprimere.

Anche lo strumento di rilevazione differente per i due tipi di ricerche. Nella ricerca quantitativa esso
uniforme o uniformante per tutti i soggetti per garantire la validit statistica (obiettivo: matrice dei dati) ,
mentre nella ricerca qualitativa le informazioni sono approfondite a livelli diversi a seconda della convenienza
del momento e dellinteresse del soggetto (non si tende alla standardizzazione).
Allo stesso modo, anche la natura dei dati diversa. Nella ricerca quantitativa essi sono oggettivi e
standardizzati (hard), mentre la ricerca qualitativa si preoccupa della loro ricchezza e profondit soggettive
(soft).

Analisi dei dati

Lanalisi dei dati completamente differente per le due impostazioni della ricerca, a partire dalloggetto
dellanalisi. La ricerca quantitativa raccoglie le propriet individuali di ogni soggetto che sembrano rilevanti
per lo scopo della ricerca ( variabili) ((Nb: variabili: caratteristiche dei casi che vengono studiati)) e si limita
ad analizzare statisticamente queste variabili. Il soggetto non viene quindi pi ricomposto nella sua unitariet
di persona, ma i dati sono del tutto impersonali. (es. Sampson e laub: per ogni soggetto analizzato si
individuano le sue variabili atti di violenza commessi, composizione della famiglia, professione dei genitori)
Lobiettivo dellanalisi sar spiegare la varianza delle variabili dipendenti, trovare cio le cause che
provocano la variazione delle variabili dipendenti fra i soggetti, i fattori che spiegano perch alcuni ragazzi
per es sono diventati delinquenti ed altri no.

La ricerca qualitativa invece non frammenta i soggetti in variabili, ma li considera nella loro interezza, sulla
base del ragionamento che lindividuo qualcosa in pi della somma delle sue parti. Lobiettivo quindi
quello di comprendere i soggetti, interpretando il punto di vista dellattore sociale.
Le tecniche matematiche e statistiche sono fondamentali per la ricerca quantitativa, mentre sono considerate
inutili e dannose nella ricerca qualitativa.
- Variable-based Cased-based

Risultati

I risultati dei due tipi di ricerca sono naturalmente diversi. Gi nella presentazione dei dati notiamo che la
ricerca quantitativa si serve di tabelle, mentre quella qualitativa di narrazioni ( brani di interviste, testi). Le
tabelle hanno il pregio della chiarezza e della sinteticit, ma presentano il difetto di presentare uno schema
mentale proprio dei ricercatori che pu non corrispondere alle reali categorie mentali dei soggetti; inoltre
impoveriscono inevitabilmente la ricchezza delle affermazioni dei soggetti.
Le narrazioni riescono ad ovviare a questi difetti, perch riportano le parole degli intervistati e quindi si
pongono come una fotografia dei loro pensieri.

6
Per quanto riguarda la generalizzazioni dei dati, la ricerca quantitativa si pone lobiettivo di enunciare le
correlazioni ovvero i rapporti causali tra le variabili che possano spiegare i risultati ottenuti. La ricerca
qualitativa, invece, cerca di individuare tipi ideali (nel senso weberiano), cio opera delle classificazioni e
tipologie, categorie concettuali che non esistono nella realt, ma che liberano i casi reali dai dettagli e dagli
accidenti della realt per estrarne le caratteristiche essenziali ad un livello superiore di astrazione; lo scopo
dei tipi ideali quello di essere utilizzati come modelli con i quali illuminare e interpretare la realt stessa.
La ricerca qualitativa non si preoccupa di spiegare i meccanismi causali che stanno alla base dei fenomeni
sociali, cerca invece di descriverne le differenze interpretandole alla luce dei tipi ideali. Allopposto, il fine
ultimo della ricerca quantitativa proprio quello di individuare il meccanismo causale.
Unultima questione quella della portata dei risultati. A questo proposito notiamo che la profondit
dellanalisi e lampiezza della ricerca sono inversamente correlate, vale a dire che ad un maggior numero di
casi esaminati corrisponde un minore approfondimento dei singoli casi. Data la maggiore quantit di casi
necessariamente esaminati dalla ricerca quantitativa, risulta indubbiamente una maggiore generalizzabilit
dei risultati rispetto a quelli della ricerca qualitativa che punta sulla specificit.

Pi la ricerca sar ampia, pi ampio sar il numero dei soggetti investito ed il suo campione sar
rappresentativo della situazione reale, quindi legittimamente i suoi risultati saranno estensibili allintera
popolazione.

Due diversi modi di conoscere la realt sociale

A questo punto ci si potrebbe chiedere se uno dei due approcci scientificamente migliore dellaltro. A
questo proposito si possono individuare tre posizioni. La prima afferma che i due approcci sono incompatibili
tra di loro, e quindi i rispettivi sostenitori dei due paradigmi dicono che il proprio corretto mentre laltro
sbagliato. La seconda si ritrova nei neopositivisti, che affermano lutilit dellapproccio qualitativo ma solo in
una prospettiva preliminare di stimolazione intellettuale brain storming che resta tuttavia esterno alla
fase scientifica vera e propria(ruolo ancillare). La terza posizione infine sostiene la
pari dignit e legittimit dei due metodi, e auspica lo sviluppo di una scienza sociale che, a seconda delle
circostanze e delle opportunit, scelga per luno o per laltro approccio. Infatti contributi importanti alle
scienze sociali sono arrivati da entrambi i tipi di ricerca, che possono essere rispettivamente adatti per
differenti situazioni.
Entrambi gli approcci si possono considerare come due diversi modi di fare ricerca che possono contribuire
insieme alla conoscenza dei fenomeni sociali, integrandosi vicendevolmente per una migliore comprensione
della realt da punti di vista differenti.

I due approcci vanno interpretati come un arricchimento, non un limite. Un approccio multiplo e differenziato
necessario per poter conoscere davvero la realt sociale.

2 )LA RILEVAZIONE DEI DATI: TECNICHE QUANTITATIVE

LA TRADUZIONE EMPIRICA DELLA TEORIA

Struttura tipo della ricerca quantitativa

La ricerca scientifica un processo creativo (nel senso di evocare le capacit personali del ricercatore, la sua
intelligenza intuitiva) di scoperta che si sviluppa secondo un itinerario prefissato e
secondo procedure prestabilite che si sono consolidate allinterno della comunit scientifica.

Questo significa che esiste un atto della scoperta che sfugge alle analisi logiche, ma allo stesso tempo la
ricerca empirica deve essere pubblica/collettiva (essa deve svilupparsi allinterno di un quadro
collettivamente condiviso), controllabile ( i concetti ed i procedimenti adoperati devono essere standardizzati
e i risultati della loro intuizioni devono essere verificate anche da altri) e ripetibile per poter essere definita
7
scientifica. Per questo esiste un percorso tipico una sequenza - della ricerca sociale che parte dalla
teoria, attraversa le fasi si raccolta e analisi dei dati e ritorna alla teoria.

Esso un percorso ciclico, che inizia dalla teoria ed alla teoria ritorna. Pi precisamente, si possono
individuare cinque fasi e cinque processi che le legano.

La prima fase quella della elaborazione teorica (teoria),


la seconda quella delle ipotesi, legate tra di loro attraverso il processo della deduzione. La teoria generale
mentre lipotesi ne rappresenta unarticolazione specifica.
La terza fase quella della raccolta dei dati, a cui si arriva attraverso il processo di operativizzazione, cio
la trasformazione delle ipotesi in affermazioni empiricamente osservabili. Loperativizzazione porta alla
definizione del disegno della ricerca, cio di un piano di lavoro che stabilisce le varie fasi dellosservazione
empirica.
La quarta fase quella dellanalisi dei dati, preceduta dallorganizzazione dei dati rilevati. Di solito
questa fase nella ricerca quantitativa consiste nella creazione di una matrice di dati.
La quinta fase quella della rappresentazione dei risultati, a cui si arriva tramite un processo di
interpretazione delle analisi statistiche condotte nella fase precedente. Infine il ricercatore ritorna alla teoria
iniziale tramite un processo di induzione, che confronta i risultati ottenuti con la teoria precedente.

Teoria
Deduzione
Ipotesi -
Operativizzazione ( disegno della ricerca)
Rilevazione dei dati
Organizzazione dei dati (matrice-dati)
Analisi dei dati
Interpretazione
Risultati -
Induzione

Teoria

Teoria, cio un insieme di proposizioni tra loro organicamente connesse che si pongono a un elevato livello
di astrazione e generalizzazione rispetto alla realt empirica, le quali sono derivate da regolarit empiriche e
dalle quali possono essere derivate della previsioni empiriche.
Si tratta di un tentativo di spiegare un fenomeno sociale e deve essere verificata.
Insieme di proposizioni: sistema coerente non un semplice aggregato ma connesso attraverso regole
logiche di affermazioni.
Astrazione e generalizzazione: la teoria trascende le specifiche espressioni empiriche sia dal puto di vista
concettuale astrazione - sia da quello del campo di applicazione generalizzazione.
Derivata da regolarit empiriche: la teoria nasce dalla constatazione di ricorrenze nella realt osservata
Produttivit di previsioni empiriche:da una teoria ricavata dallosservazione di determinate regolarit
empiriche si possono inserire accadimenti in altri e diversi contesti.

Ipotesi

Una teoria deve essere articolata in ipotesi specifiche. Lipotesi una proposizione che implica una relazione
tra due o pi concetti, si colloca a un livello inferiore di astrazione e generalit rispetto alla teoria, e ne
permette una traduzione in termini empiricamente controllabili.
Il carattere di provvisoriet delle ipotesi dato dal fatto che lipotesi unaffermazione provvisoria ancora da
provare, che deriva dalla teoria ma che verr confermata solo attraverso un controllo empirico.
La validit di una teoria dipende dalla sua traduzione in ipotesi empiricamente verificabili, perch se una
teoria troppo vaga per dar luogo ad ipotesi, non pu essere verificata nella realt. Il criterio della
controllabilit empirica il criterio stesso della scientificit.

8
Dalla teoria alle ipotesi

importante la differenza tra generalizzazioni empiriche e teorie: le prima sono proposizioni isolate che
riassumono uniformit relazionali osservate tra due o pi variabili, mentre le seconde nascono quando
queste proposizioni sono raccolte e sussunte in un sistema concettuale che si colloca ad un livello superiore
di astrazione (ad esempio, permette di avanzare ipotesi in campi diversi e remoti da quelli originari).

Talvolta la pratica delle ricerca si sviluppa con ordini diversi rispetto a quello canonico: possibile che le
ipotesi vengano sviluppate dopo aver raccolto i dati, e con questi confrontati a posteriori. Oppure si ricorre
alla teoria dopo aver analizzato i dati, per spiegare un fatto anomalo o un risultato inaspettato. Infine, una
nuova teoria pu essere scoperta nel corso della fase empirica. Talora la rilevazione viene prima delle
ipotesi per ragioni di forza maggiore, nel caso dellanalisi secondaria, quando cio si applica una seconda
analisi a dati raccolti da altri ricercatori in tempi precedenti.

- Dal momento che una teoria uninterconnessione fra entit astratte e

Dai concetti alle variabili

Nel suo significato pi ampio, il termine concetto si riferisce al contenuto semantico (significato) dei segni
linguistici e delle immagini mentali. Sarebbe latto di staccare dallimmediatezza delle impressioni sensibili e
dalle rappresentanze particolari unastrazione dal significato universale .
Il termine ha quindi unaccezione di generalit e da essa il concetto pu includere ogni specie di segno o di
procedura semantica quale sia loggetto a cui si riferisce, astratto, concreto, universale, individuale, ecc.
I concetti possono anche fare riferimento a costruzioni mentali astratte che impossibile osservare
direttamente, il potere, la felicit, la classe sociale.

Essendo lipotesi una interconnessione tra concetti, emerge il fatto che i concetti sono i mattoni della
teoria, e attraverso la loro operativizzazione si realizza la traduzione empirica di una teoria. Il concetto il
legame tra la teoria e il mondo empirico osservabile.
(es. lipotesi che il tasso di suicidio sia pi elevato fra le persone istruite costituito dalla relazione tra il
concetto di religione e di istruzione)

I concetti possono riferirsi ad astrazioni impossibili da verificare empiricamente (potere, felicit, ecc), oppure
a entit concrete (oggetti, persone, ecc). Ma se i concetti formano una teoria, come si pu verificarla
empiricamente - operativizzazione? I concetti possono essere trasformati in entit empiricamente osservabili
applicandoli ad oggetti concreti ovvero facendoli diventare attributi o propriet di specifici oggetti di studio
(chiamati unit di analisi). Es. il concetto di potere pu essere una propriet di ununit di analisi costituite
da ruoli aziendali o ruoli politici, consigliere comunale, deputato.

Il secondo passaggio per rendere operativo un il concetto consiste nel darne una definizione operativa, nello
stabilire cio regole per la sua traduzione in operazioni empiriche.
Es. si pu dare una definizione operativa del potere di un ruolo aziendale attraverso il numero di subordinati
che ad esso dipendono.
Il terzo passaggio consiste nellapplicare le regole esposte ai concreti casi studiati, questa la fase di
operativizzazione in senso stretto.

Gli stati operativizzati delle propriet sono chiamati modalit e ad ognuna di esse viene assegnato un
differente valore simbolico normalmente costituito da un numero.
Una propriet misurabile di una unit di analisi si chiama variabile.
Es. il concetto di livello culturale pu essere rilevato attraverso la propriet titolo di studio riferita agli
individui che assume stati diversi nei vari oggetti studiati, ottenendo varie modalit senza titolo, licenza
elementare, media etc, ad essi vengono rispettivamente assegnati i valori 0-1-2..
Per esempio, il peso un concetto, ma il peso di un oggetto la sua propriet. Il peso delloggetto misurato
con la bilancia una variabile. Oppure, il livello culturale un concetto astratto, ma se applicato a un
individuo diventa una propriet, e se misurabile una variabile.

9
In definitiva, una variabile una propriet di una unit di analisi a cui sono assegnati valori diversi.

Concetto propriet (operativizzazione: procedure di essa raggruppabili in 4 classi: classificazione( x es.


classifichiamo la nazionalit in base alla nazione),ordinamento (es. ordiniamo le professioni in base al loro
prestigio sociale),misurazione (es. misuriamo let con lunit di misura anno solare), conteggio(contiamo il
numero di figli di una persona)) - Variabile

Unit di analisi

Lunit di analisi rappresenta loggetto sociale al quale afferiscono, nella ricerca empirica, le propriet
studiate. Esse devono essere determinate con precisione nel momento in cui si vuole sottoporre a controllo
empirico una teoria mediante una specifica ricerca di tipo quantitativo, in quanto sono un elemento
importante del disegno della ricerca (il programma di lavoro empirico).

Nella ricerca sociale le pi comuni unit di analisi sono rappresentate da: l individuo (la pi comune),
laggregato di individui (di solito basate sugli aggregati territoriali di individui, comuni, province), dal
gruppo-organizzazione-istituzione (quando lunit di rilevamento rappresentata dal collettivo stesso e le
variabili sono di tipo globale es. studio sugli istituti scolastici dove le variabili sono relative al tipo di gestione
privata/pubblica al tipo di bacino sociale servito . Gruppi: famiglie,associazioni Organizzazioni Istituzioni:
sindacati, partititi, ospedali, fabbriche), dagli eventi sociali (quando gli eventi stessi sono le unit di analisi)
e dalle rappresentazioni simboliche prodotto culturale (quanto lunit di analisi consiste da messaggi di
comunicazione di massa di ogni genere).

Lunit di analisi singolare ed astratta, mentre chiamiamo casi gli esemplari specifici di quella data unit di
analisi che vengono studiati, sui quali si rilevano i dati. Essi sono gli oggetti specifici della ricerca empirica

Variabili

Una variabile un concetto operativizzato, o meglio la propriet operativizzata di un oggetto, in quanto il


concetto, per poter essere operativizzato, ha dovuto essere applicato ad un oggetto diventandone propriet.
Un concetto pu essere operativizzato in modi diversi.
La differenza tra concetto, propriet e variabile la stessa che esiste tra peso (concetto), il peso di un
oggetto (propriet) ed il peso di un oggetto misurato mediante una bilancia (variabile)
Cos come i concetti sono i mattoni della teoria, le variabili sono lelemento centrale della ricerca empirica.
Le variabili possono variare tra diverse modalit corrispondenti a diversi stadi della propriet.
Es. il genere variabile perch pu assumere gli stadi di maschio/femmina.

Notiamo che una propriet anche se variabile in linea di principio pu risultare invariante nello specifico
sottoinsieme degli oggetti studiati,es. la nazionalit una propriet che pu variare tra gli individui ma se lo
studio viene condotto sulla popolazione italiana essa sar invariante, nel qual caso non pi chiamata
variabile ma prende il nome di costante.

La variazione di una variabile pu realizzarsi in due modi: nel tempo, su uno stesso caso (studio
longitudinale o diacronico) oppure fra i casi, nello stesso tempo (studio trasversale o sincronico).
(Es tratti dal campo della medicina. 1 caso : vogliamo studiare la reazione di un paziente ad un farmaco per
vedere la variazione della percentuale di globuli bianchi alla somministrazione. Per fare ci variamo la
somministrazione del farmaco osservando la variazione di percentuale sui globuli bianchi le due variabili
variano nel tempo sullo stesso caso 2 caso: per sottoporre al controllo empirico lipotesi che il cancro al
polmone sia correlato al consumo di sigarette si metteranno a confronto un gruppo di pazienti sani con uno
malato e si valuteranno se a diversi stadi corrispondono livelli diversi di malattia le variabili considerate
malattia e fumo variano tra i soggetti )
Nelle scienze sociali il secondo metodo il pi utilizzato mentre il primo lo nelle scienze naturali.

Le variabili possono esser classificate secondo la loro manipolabilit, la posizione nella relazione
causa/effetto, losservabilit, il carattere individuale o collettivo e il trattamento dei loro valori.

10
La prima distinzione quella tra variabili manipolabili e non manipolabili. Le variabili manipolabili
sono quelle che possono essere modificate dal ricercatore, viceversa quelle non manipolabili non possono
essere
controllate. La maggior parte delle variabili sociali non sono manipolabili, anche se esistono dei casi in cui il
ricercatore pu controllarle.

La seconda distinzione quella tra variabili dipendenti e variabili indipendenti. In una relazione
asimmetrica tra due variabili, quando cio una variabile influenza unaltra, la variabile indipendente ci che
influenza (la causa), mentre la variabile dipendente ci che influenzato (leffetto). Nel caso in cui le
variabili indipendenti siano pi di una abbiamo una relazione multivariata.

La terza distinzione quella tra variabili latenti e variabili osservate. La distinzione si basa sulla
osservabilit, ossia sulla possibilit di rilevazione empirica. Le prime sono variabili non direttamente
osservabili in quanto rappresentano concetti molto generali o complessi, mentre le seconde sono facilmente
rilevabili. In ogni caso, entrambe possono essere operativizzate, per cui anche nel caso delle variabili latenti
c una sostanziale differenza con i concetti.

Lultima distinzione quella tra variabili individuali e variabili collettive. Le variabili individuali sono
specifiche di ogni individuo, mentre quelle collettive sono proprie di un gruppo sociale. Le variabili collettive
si suddividono a loro volta in variabili aggregate, dove la propriet del collettivo deriva dalle propriet dei
singoli componenti del gruppo, e variabili globali, quando le caratteristiche esclusive del gruppo non
derivano da propriet dei membri che lo compongono.

Le variabili sono assolutamente fondamentali nella ricerca empirica, anche se a ogni definizione operativa
lasciata allarbitrio del ricercatore, che deve solo esplicitare e giustificare le sue scelte. Per questo una
definizione operativa non mai perfettamente adeguata ed esiste sempre uno scarto tra variabile e
concetto. Un altro pericolo che porta loperativizzazione quello della reificazione, cio di identificare la
definizione operativa di un concetto (necessariamente arbitraria e impoverita) con il concetto stesso.
Tuttavia, con tutti i suoi limiti, la definizione operativa necessaria per fondare scientificamente e
oggettivamente la ricerca sociale.

Variabili nominali, ordinali e cardinali

Unaltra classificazione molto importante quella che riguarda le operazioni logico (operazioni di uguale e
diverso) -matematiche ( le quattro operazioni aritmetiche) che possono essere effettuate sulle variabili.
Questa classificazione fondamentale poich stabilisce in maniera determinante le procedure di elaborazione
statistica che ad esse possono essere applicate.
Il ricercatore fa ricorso alla variabile per trattare una propriet con gli strumenti della matematica e della
statistica.
A questo proposito abbiamo variabili nominali, ordinali e cardinali.

Le variabili nominali sono tali quando la propriet da registrare assume stati discreti non ordinabili, cio
finiti e delimitati che non hanno alcun ordine o gerarchia tra di essi. es. la religione pu essere cattolica o
mussulmana, non una via di mezzo possiamo definire la nazionalit di una persona italiana, svedese,
tedesca ma non possiamo stabilire una gerarchia tra di essi).
Le uniche relazioni che possiamo stabilire fra le modalit di una variabile sono le relazioni di eguale e diverso
(es. un cattolico uguale in ambito religioso ad un altro cattolico ma diverso da un protestante)
Gli stati di una propriet cos descritta si chiamano categorie, le categorie operativizzate (cio gli stati della
variabile) modalit e i simboli assegnati alle modalit valori.
Loperazione che permette di passare dalla propriet alla variabile la classificazione.
Le categorie nelle quali gli stati della propriet vengono classificati devono avere il requisito della -
esaustivit ( ogni caso che stiamo esaminando deve poter essere collocato in una delle categorie previste)
mutua esclusivit ( ogni caso pu essere classificato solo in una categoria)
Il valore non ha altro significato se non quello di identificare la categoria, in genere si tratta di un numero ch
e non ha alcun significato numerico, indifferente per es associare per la variabile religione il valore 1 per la
modalit cattolico, 2per protestante etc.

11
Loperazione di suddivisione di una propriet in categorie non ordinate consiste nella semplice associazione
ad ogni categoria di un nome, quale esso sia per questo, questo tipo di variabile si chiama nominale.
Nel caso in cui ci siano solo due modalit es, maschio / femmina - si parla di variabili dicotomiche.
Operazioni effettuabili sui valori- uguale/diverso

Le variabili ordinali sono tali quando la propriet da registrare assume stati discreti ordinabili.
Es. titoli di studio / oppure in caso di un questionario alla possibilit da parte dellintervistato di scegliere tra
le categorie poco-molto-abbastanza
In questo caso possibile stabilire non solo relazioni di eguaglianza e disuguaglianza, ma anche relazioni
dordine.
In questo caso la procedura di operativizzazione l ordinamento, che tiene conto dellordinabilit degli stati
della propriet. Lesistenza di un ordine ci permette di stabilire fra le modalit non solo le operazioni di
eguaglianza-diseguaglianza ma anche le relazioni dellordine (maggiore, minore di. )
Quindi lattribuzione dei valori alle singole modalit non potr essere casuale ma dovr utilizzare un criterio
che presevi lordine fra gli stati. Tipicamente si utilizzano i numeri naturali, che comunque non godono delle
loro propriet cardinali (cio la distanza che corre tra le varie modalit non pu essere confrontata con le
altre).
Se attribuiamo il valore 1 allassenza di titolo di studio, 2 alla licenza elementare, 3 licenza media etc tali
numeri vanno letti per la sequenza che esprimono ma non per il valore del numero.
Le variabili possono essere ordinali perch derivano da propriet originariamente costituite da stati discreti 8
vedi les del titolo di studio) oppure perch derivano da propriet continue che sono state registrate su una
sequenza sono ordinale perch non si dispone di strumenti di misurazione (es. domande di un questionario
che prevedono risposte graduate molto-abbastanza etc)

Le variabili cardinali sono tali perch i numeri che ne identificano le modalit ( i valori della variabile) non
sono delle semplici etichette, ma hanno un pieno significato numerico (hanno cio propriet sia ordinali che
cardinali).es. et, reddito, numero dei figli.
Tra le modalit delle variabili di questo tipo, oltre a stabilire relazioni di eguaglianza e diversit e dordine, si
possono effettuare le quattro operazioni aritmetiche (operazioni di somma e sottrazione tra i valori e tutte le
altre operazioni statistiche.)
Si possono ottenere variabili cardinali attraverso due processi di operativizzazione: la misurazione (quando
la propriet da misurare continua cio pu assumere infiniti stadi intermedi in un dato intervallo tra due
stadi qualsiasi e si possiede una unit di misura prestabilita che permetta di confrontare la grandezza da
misurare con una grandezza di riferimento) e il conteggio (quando la propriet da registrare discreta
assume stati infiniti non frazionabili - ed esiste una unit di conto, cio una unit elementare che
contenuta un certo numero finito di volte nelle propriet delloggetto).
Es. contiamo il numero di figli di una persona, il numero di stanze di una casa.

Nelle scienze sociali molte variabili cardinali derivano operazioni condotte su altre variabili cardinali.
Le variabili quasi-cardinali sono un sottoinsieme delle variabili cardinali. Le propriet pi caratteristiche delle
scienze sociali possono essere tutte immaginate come propriet continue, che per non riescono a passare
dalla condizione di propriet continua a quella di variabile cardinale per la difficolt di applicare una unit di
misura agli atteggiamenti umani. Un tentativo di superare questo limite dato dalla tecnica delle scale, che
cerca di avvicinarsi a misurazioni in senso proprio, cio a variabili in cui la distanza tra due valori sia nota. Le
variabili prodotte da questa tecnica sono dette quasi-cardinali.

Concetti, indicatori e indici

Nelle scienze sociali esistono concetti che hanno un elevato grado di generalit es. alienazione,
socializzazione,potere, conflitto, e sono rappresentazioni lontane dallesperienza.
Per poterli definire in modo empiricamente controllabile necessario darne una definizione operativa
(tradurli in termini osservativi) tramite gli indicatori. Gli indicatori sono concetti pi semplici e specifici,
traducibili in termini osservativi, che sono legati ai concetti generali da unaffinit di significato da un
rapporto di indicazione, o rappresentanza semantica. Gli indicatori sono quindi dei ancora dei concetti, ma
pi facilmente operativizzabili.

12
In quanto specifici, gli indicatori rappresentano solo un aspetto della complessit del concetto generale,per
cui pu essere necessario identificare diversi indicatori per lo stesso concetto, uno per ogni sua dimensione.

Il rapporto tra concetto e indicatore parziale: da una parte un concetto generale non pu essere esaurito
da un solo indicatore specifico, dallaltra un indicatore pu sovrapporsi solo parzialmente al concetto per il
quale stato scelto, e dipendere per il resto da un altro concetto, anche profondamente diverso. Inoltre la
scelta di un indicatore lasciata unicamente allarbitrio del ricercatore, il cui unico obbligo quello di
argomentare la sua scelta, non di dimostrarne la correttezza.

Loperativizzazione di tali indicatori genera delle variabili che vengono combinate in indici al fine di ricorrere
al concetto originale.
Questa pratica avviene solo nel caso di concetti complessi, quando un concetto viene scomposto in
dimensioni e rilevato attraverso una molteplicit di indicatori si pone lesigenza di sintetizzare in un unico
indice la pluralit delle variabili che abbiamo prodotto.
Es. dopo aver rilevato la religiosit mediante variabili che operativizzano la religiosit ritualistica, ideologica,
esperienziale, possiamo desiderare di ricomporre lunit originaria in quello che potremmo chiamare indice
globale di religiosit.

La rilevazione empirica di un concetto non direttamente osservabile passa attraverso quattro fasi:
larticolazione del concetto in dimensioni (i diversi aspetti e significati del concetto), la scelta degli indicatori,
la loro operativizzazione, la formazione degli indici. Lindice la sintesi globale della pluralit delle variabili
che sono state prodotte dai diversi indicatori.

Errore di rilevazione

Lerrore di rilevazione rappresenta lo scarto tra il concetto teorico e la variabile empirica.


Lerrore di rilevazione viene di solito suddiviso in errore sistematico ed errore accidentale.
Possiamo dire che il valore osservato ( il valore della variabile empirica cos come viene rilevato) la somma
di 3 parti:

Il valore vero ( concetto) + Errore sistematico + Errore accidentale.

Ovvero : Errore = valore osservato-Valore vero = Errore sistematico + Errore accidentale.

Lerrore sistematico (distorsione) un errore costante nel senso che si presenta in tutti i singoli casi di
rilevazione, il suo valore medio sul totale dei casi osservati non pari a zero ma assume un valore positivo o
negativo nel senso che in ogni caso il valore osservato tende sistematicamente a sovrastimare o sottostimare
il valore vero.
Es. rileviamo la partecipazione elettorale di un campione di cittadini alle ultime elezioni, sappiamo che c
una diffusa tendenza da parte degli intervistati a sovrastimare la loro partecipazione per cui otterremo un
tasso medio di valore elettorale osservato superiore a quello vero.

Lerrore accidentale invece un errore variabile, che varia da rilevazione a rilevazione, per cui si tratta di
unoscillazione che, ripetuta su tutti i soggetti, tende a zero.
Lerrore sistematico la parte di errore comune a tutte le applicazioni di una determinata rilevazione; lerrore
accidentale la parte di errore specifica di ogni singola rilevazione.
Gli errori possono verificarsi sia nella fase teorica, o di indicazione (in cui si scelgono gli indicatori), che in
quella empirica, o di operativizzazione (in cui si rilevano gli indicatori stessi).
Lerrore nella fase di indicazione sempre sistematico, perch lindicatore non del tutto adatto al concetto
e quindi si ha un difetto nel rapporto di indicazione.
Lerrore nella fase di operativizzazione pu esser sia sistematico sia accidentale, in quanto esistono tre fasi
nelloperativizzazione (selezione delle unit studiate, rilevazione dei dati o osservazione e trattamento dei
dati) in ognuna delle quali si possono compiere degli errori.

Gli errori di selezione sono quelli dovuti al fatto che in una certa ricerca non si operi solo su un campione
di soggetti e non sullintera popolazione.
Essi sono: lerrore di copertura (dovuta al fatto che la lista della popolazione da cui si estrae il
13
campione non completa), lerrore di campionamento (il fatto di condurre la ricerca su una frazione della
popolazione) e lerrore di non risposta (quando i soggetti del campione non possono o non vogliono
rispondere).

Gli errori di osservazione possono essere addebitati a quattro fonti: errori dovuti all intervistatore
(condizionamenti dellintervistato da parte dellintervistatore, registrazione errata delle risposte) , errori
dovuti allintervistato (errata comprensione della domanda), errori dovuti allo strumento (domande mal
formulate, tendenziose), ed errori dovuti al modo di somministrazione. (lintervista telefonica ha un ritmo di
lavoro affrettato),

Gli errori di trattamento dei dati si verificano dopo che i dati sono stati raccolti e sono errori di codifica,
trascrizione, memorizzazione, elaborazione, ecc.

Approccio allerrore globale, esso non stimabile, lunico errore quantificabile una componente di questo
errore globale, quello di campionamento, per questo spesso viene riportato come errore
globale della rilevazione.

Attendibilit e validit

Con riferimento alla fase dellerrore relativa allosservazione gli psicometrici hanno elaborato due nozioni:
Attendibilit e Validit.

Lattendibilit ha a che fare con la riproducibilit del risultato, e segnala il grado con il quale una certa
procedura di trasformazione di un concetto in variabile produce gli stessi risultati in test ripetuti con lo stesso
strumento di rilevazione (stabilit) oppure con strumenti equivalenti (equivalenza).
Es. una bilancia tanto pi attendibile quanto pi, replicando la pesata di uno stesso oggetto, si ottiene un
peso prossimo al primo, sia che la replica sia effettuata con quella o con unaltra bilancia.

La validit fa invece riferimento al grado con il quale una certa procedura di traduzione di un concetto in
variabile effettivamente rileva (operativizzi) il concetto che si intende rilevare (operativizzare).
Es. se misuriamo il grado di intelligenza delle persone attraverso il loro numero di scarpe, otteniamo un dato
attendibile ma privo di validit.

In genere si associa lattendibilit allerrore accidentale e la validit allerrore sistematico.


Per determinare lattendibilit si utilizza il concetto di equivalenza, dove lattendibilit misurata attraverso
la correlazione tra due procedure diverse ma molto simili tra loro.
Questa tecnica per utile solo nel caso in cui la procedura di operativizzazione consiste in una batteria di
domande.
La prima tecnica proposta in questa prospettiva quella della suddivisione a met dove lattendibilit data
dalla correlazione fra due met dello stesso test domande di un test costituito da una batteria di domande
vengono suddivise in due gruppi, domande pari e dispari, i punteggi vengono computati separatamente e tra
loro correlati.

La validit invece meno facilmente controllabile, in quanto lerrore di validit in genere nasce dallerrore di
indicazione.
Per determinare la validit di un indicatore si utilizzano sue procedure di convalida: la validit di
contenuto e la validit per criterio.
La validit di contenuto indica il fatto che lindicatore prescelto per un concetto copre effettivamente lintero
dominio di significato del concetto; una convalida di questo tipo pu avvenire soltanto su un piano
puramente logico.
La validit per criterio consiste nella corrispondenza tra lindicatore e un criterio esterno che per qualche
motivo si ritiene correlato con il concetto.
Questo criterio pu essere rappresentato da un altro indicatore gi accettato come valido oppure da un
fatto oggettivo.
La validit per criterio stata distinta in validit predittiva (quando si correla il dato dellindicatore con un
evento successivo ad esso connesso), in validit concomitante (quando lindicatore correlato con un altro
indicatore rilevato nello stesso momento) e in validit per gruppi noti (quando lindicatore viene applicato a
14
soggetti dei quali sia nota la posizione sulla propriet da rilevare.

Esiste infine anche la validit di costrutto, che consiste nella rispondenza di un indicatore alle attese
teoriche in termini di relazioni con altre variabili.

CAUSALITA ED ESPERIMENTO

Il concetto di causa

Malgrado la nozione di causa-effetto rappresenti il cuore del ragionamento scientifico, essa una delle pi
difficili da tradurre in termini operativi. Tuttavia, anche se lesistenza di una legge causale non pu mai
essere empiricamente provata, il fatto di ipotizzare sul piano teoretico una relazione causale implica dei fatti
osservativi.
Queste osservazioni empiriche non costituiscono una prova definitiva dellesistenza nel nesso causale, ma
tuttavia forniscono una collaborazione empirica della loro ipotetica esistenza.

Es. non possiamo mai dire, sul piano empirico (lo possiamo ipotizzare sul piano teorico), che la variazione di
X produce la variazione di Y . Ma se osserviamo empiricamente che una variazione di X regolarmente
seguita da una variazione di Y tenendo costanti tutte le altre possibili cause di Y, abbiamo un forte elemento
empirico di corroborazione che X sia causa di Y.

Corroborazione empirica della relazione causale

Per poter corroborare empiricamente lesistenza di una relazione causale fra due variabili, sono necessari tre
elementi empirici:

Covariazione fra variabile indipendente e dipendente

- Distinzione tra variabile indipendente e dipendente. In una relazione asimmetrica tra due variabili,
quando cio una variabile influenza laltra, chiamiamo variabile indipendente la variabile che influenza, e
variabile dipendente la variabile che influenzata.
Nella relazione tra classe sociale ed orientamento politico, la classe la indipendente, lorientamento la
dipendente.
Essa si ha quando osserviamo in primo luogo una variazione della variabile indipendente.
Contemporaneamente al suo variare dobbiamo poter osservare una variazione della variabile dipendente.
Nel linguaggio statistico si usa il termine covariazione fra le due variabili: al variare di una varia laltra.
Es. vogliamo avere elementi empirici a conferma dellaffermazione teorica per cui lindividualismo sociale
produce un alto tasso di suicidi.
Possiamo fare ci solo se la variabile indipendente la situazione sociale osservata non costante societ
gruppi a diversi gradi di individualismo, societ cattoliche, protestanti, persone in contesti sociali diversi.

Direzione causale

Dobbiamo osservare che al variare della variabile indipendente consegue una variazione della variabile
dipendente ma che non vero il contrario.
La causa la variabile indipendente e leffetto la variabile dipendente.
Possiamo stabilire empiricamente questo fatto in due modi:
- Manipolazione della variabile indipendente il ricercatore in grado di fare variare con la sua azione la
variabile ( strada percorribile solo nel caso dellesperimento)
- Criterio della successione temporale esso nasce dallosservazione che variazione della variabile
indipendente X precede la variazione della dipendente Y.

Alcune direzioni causali sono da escludersi per impossibilit logica.

15
Se diciamo che esiste un nesso causale fra la classe sociale e orientamento politico, esso pu esistere solo
nella direzione che va dalla prima alla seconda, impensabile linverso.

Controllo delle variabili estranee

Dobbiamo poter escludere la variazione, simultanea al variare della variabile indipendente, di atre variabili ad
essa correlate che potrebbero esse loro stesse, invece della variabile indipendente studiata, le cause del
variare della dipendente.
Se vera laffermazione teorica che X causa di Y, allora dovremmo poter osservare, sul piano empirico,
che una variazione di X tenendo costanti tutte le altre possibili cause di Y accompagnata da una
variazione di Y. Ma come possiamo realizzare empiricamente la formula tenendo costanti tutte le altre
possibili cause di Y? la risposta diversa a seconda se ci muoviamo attraverso la logica dellanalisi della
covariazione o secondo quella dellesperimento.

Una covariazione non pu mai essere adottata come unica prova empirica a sostegno dellesistenza di una
relazione causale.
Pu esistere covariazione senza che esista causazione.

Analisi della covariazione ed esperimento

Gli scienziati dispongono di due tecniche base per sottoporre a test empirico le affermazioni causali.

Analisi di covariazione: il ricercatore osserva ed analizza come le variazioni di X siano connesse alle
variazioni di Y in un ambiente naturale , escludendo linfluenza delle variabili estranee attraverso il confronto
fra gruppi oppure il controllo statistico (depurazione).

Esperimento: il ricercatore produce artificialmente una variazione manipola e controlla - di X in una


situazione controllata (lassegnazione casuale dei soggetti ai gruppi permette di controllare le altre variabili)
e misura la conseguente variazione di Y.

Lesperimento nasce e trova una sua sistemazione epistemologica nelle scienze naturali, la sua applicazione
alle scienze sociali comporta degli adattamenti.
Se vogliamo definire leffetto della variabile X sulla variabile Y e cio rilevare le modalit di Y quando X =T
Trattamento e X=C Controllo, non possiamo farlo nella stessa unit e nello stesso tempo.
E questo il problema fondamentale dellinferenza causale
Es. immaginiamo sia possibile rilevare il voto di uno stesso individuo si nel caso in cui egli sia stato
sottoposto alla propaganda televisiva X = t sia nel caso egli non sia stato sottoposto X=C, non possiamo
verificare i due fattori perch o vi stata esposizione o non vi stata.

Nelle scienze sociali gli esperimenti vengono suddivisi in esperimenti di laboratorio o sul campo.
Nel primo caso lesperimento viene condotto in una situazione artificiale, mentre nel secondo caso si realizza
nel contesto della vita reale.

Un esperimento deve presentare due caratteristiche: manipolazione della variabile indipendente ed


assegnazione casuale dei soggetti ai gruppi randomizzazione.
Se la prima assente, non abbiamo pi un esperimento,ma uno studio fondato sullanalisi della covariazione,
se la seconda condizione manca, abbiamo i cosiddetti quasi esperimenti.
Possiamo quindi distinguere gli esperimenti in due gruppi. Veri esperimenti Quasi esperimenti.

Il metodo sperimentale presenta due vantaggi.


Permette di affrontare empiricamente il problema della relazione di causa-effetto, in secondo luogo permette
di isolare il fenomeno sociale oggetto dello studio e di focalizzare su di esso losservazione , al riparo da
interferenze esterne.
Nel contempo presenta anche degli svantaggi, riassumibili nellartificialit della situazione ( riferimento
allambiente ed alle reazioni dei soggetti coinvolti) e nella debole rappresentativit dei campioni studiati.

16
INCHIESTA CAMPIONARIA

Linchiesta campionaria nella ricerca sociale

Nella vita di tutti i giorni, quando vogliamo conoscere un determinato fenomeno sociale, sia esso individuale
o collettivo disponiamo fondamentalmente di due modi per raccogliere informazioni: osservare e domandare.
Per inchiesta campionaria intendiamo un modo di rilevare informazioni interrogando gli stessi individui
oggetto della ricerca, appartenenti ad un campione rappresentativo, mediante una procedura standardizzata
( a tutti i soggetti vengono poste le stesse domane nella stessa formulazione) di interrogazione, allo scopo di
studiare le relazioni esistenti tra le variabili.

Lo strumento di rilevazione costituito da due parti fondamentali domande e risposte che possono
essere formulate in modo standardizzato oppure possono essere lasciate libere.
Quando sono entrambe standardizzate abbiamo il questionario, che rappresenta il pi diffuso strumento di
raccolta dei dati nella ricerca sociale.
Quando la domanda standardizzata e la risposta libera abbiamo lintervista strutturata.
Quando domanda e risposta non sono standardizzate abbiamo lintervista libera.

Domande Risposte

Standardizzate Libere
Standardizzazione Questionario Intervista strutturata

Libere - Intervista libera

Ricerca quantitativa Ricerca qualitativa

Per poter analizzare i dati con tecniche statistiche necessario che oltre alle domane anche le risposte siano
standardizzate ovvero organizzate secondo uno schema di classificazione comune a tutti i soggetti.
Ci produrr a conclusione della rilevazione la matrice dati.
Dato che per tutti i casi studiati sono state rilevate le stesse informazioni possibile organizzare tali
informazioni nella forma di una matrice rettangolare di numeri, la matrice casi per variabili CxV. In quessta
matrice abbiamo in riga i casi, in colonna le variabili ed in ogni cella ( derivante dallincrocio tra una riga ed
una colonna) un dato, cio il valore assunto da una particolare variabile su un particolare caso.

Linchiesta campionaria non si limita ad esplorare e descrivere ma intende controllare empiricamente delle
ipotesi. Nello studio condotto sul comportamento elettorale, non si accontenter di conoscere gli
orientamenti di voto della popolazione studiata ma vorr conoscere le ragioni delle scelte .
Essa quindi non un sondaggio e si distingue da esso per lesistenza di unampia problematica teorica che
sta alle sue spalle e che struttura limpostazione stessa della rilevazione dei dati e per lampiezza dei temi
toccati.

Lespressione inchiesta campionaria con il quale chiamiamo la ricerca condotta attraverso il questionario
deriva dal termine survey che intraducibile, forse sondaggio ma come abbiamo visto molto riduttivo.

La standardizzazione ovvero linvarianza dello stimolo

Approccio oggettivista versus approccio costruttivista


Approccio uniformista versus approccio individualista
Lobiettivo come minimo comun denominatore

17
Due sono i dilemmi di fronte ai quali si trova il ricercatore che intende esplorare la realt sociale
interrogando gli stessi attori sociali e sono riconducibili ai due paradigmi fondamentali della ricerca sociale.
In particolare, si contrappongono coloro che ritengono che la realt sociale sia esterna allindividuo e
pienamente conoscibile quindi in modo oggetto (posizione oggettivista) e coloro che sostengono
che il dato sociale viene generato dallinterazione tra i soggetti studiante e studiato (posizione
costruttivista).
In secondo luogo, esiste una diatriba tra chi ritiene che nel mondo sociale esistano uniformit empiriche ai
quali pu essere ricondotto lagire individuale (posizione uniformista) e chi sottolinea la fondamentale
irriducibilit del soggetto umano a qualsiasi forma di generalizzazione e standardizzazione per cui ogni azione
sociale un evento unico (posizione individualista).
Queste due diversit di vedute implicano due specifiche questioni: la prima riguarda il rapporto tra
intervistato e intervistatore, la seconda concerne la standardizzazione dello strumento di informazione e
dellinformazione rilevata.
Per quanto riguarda il rapporto tra intervistato e intervistatore, lapproccio oggettivista ritiene che esso
debba essere il pi possibile spersonalizzato per non alterare lo stato delloggetto studiato. Tuttavia non
possibile instaurare un rapporto neutro tra intervistato e intervistatore, esiste sempre un certo grado di
interazione.
Per quanto riguarda invece la standardizzazione della rilevazione, lapproccio uniformista prevede luniformit
dello strumento della rilevazione-interrogazione (questionario con domande e risposte prefissate). I limiti del
questionario sono due: non tiene conto della disuguaglianza sociale e uniforma lindividuo al livello delluomo
medio.
Lobiettivo della posizione oggettivista-uniformista quindi quello di ottenere la neutralit dello strumento di
rilevazione, cio ottenere linvarianza dello stimolo finalizzato alla comparabilit delle risposte.
Ma non sicuro che allinvarianza dello stimolo corrisponda luniformit dei significati, infatti una stessa
domanda o parola possono avere diversi significati per lo stesso individuo, sia per motivi culturali che per le
circostanze stesse in cui si svolge lintervista.

A questo punto il ricercatore deve scegliere se appoggiarsi ad una tecnica che massimizza la ricerca di
uniformit (questionario) e una che predilige lindividualit del soggetto studiato (intervista strutturata). Se si
sceglie il questionario, bisogna essere consapevoli che studiando solo le uniformit del comportamento delle
persone (ci che esse hanno in comune) si limita inevitabilmente la piena comprensione dei fatti sociali.
La limitazione ad un minimo comun denominatore riduttiva e limitativa di confronti dellobiettivo da
raggiungere, una piena comprensione del comportamento umano. Questo il limite della ricerca quantitativa
che sceglie consapevolmente di lavorare sui grandi numeri piuttosto che in profondit.

Laffidabilit del comportamento verbale

Partiamo da una domanda: Il comportamento verbale pu essere unaffidabile fonte di esplorazione della
realt sociale?
Molti scienziati sociali hanno espresso dubbi sulla possibilit che la realt sociale possa essere compresa
attraverso i resoconti verbali delle risposte ottenute interrogando gli uomini.
Le risposte alle domande (standardizzate) degli intervistatori possono non essere attendibili per due motivi:
la desiderabilit sociale delle risposte e la mancanza di opinioni.
La desiderabilit sociale la valutazione, socialmente condivisa, che in una certa cultura viene data ad un
certo atteggiamento o comportamento individuale. Se uno di questi valutato positivamente o
negativamente, una domanda che abbia questo come oggetto pu dare risposte distorte, perch
lintervistato pu essere riluttante a rivelare opinioni o comportamenti che ritiene indesiderabili e pu essere
tentato di dare di s la migliore immagine possibile, anche se non veritiera, in modo volontario o anche
involontario.

La mancanza di opinioni concerne domande su tematiche complesse, sulle quali plausibile che un certo
numero di intervistati non abbia mai riflettuto, e quindi molti rispondono a caso oppure formulano sul
momento unopinione che pu essere solo passeggera. Questo fenomeno accentuato anche dal fatto che
spesso la risposta non so viene percepita come unammissione di incapacit mentale.

Un altro problema delle domande standardizzate che esse misurano lopinione, ma non la sua intensit n
il suo radicamento.

18
Le risposte ad un questionario produce da parte degli intervistati una affermazione chiedendo se sono
daccordo o contrari ma il ricercatore non in grado di distinguere al loro interno le opinioni profondamente
radicate ed emotivamente coinvolgenti.
La tecnica del questionario non in grado di distinguere le opinioni intense e stabili da quelle deboli e
volubili.

Sostanza e forma delle domande


Il questionario pu apparire come una sequenza banale ma la sua formulazione unimpresa complicata e
difficile. Per la stesura di un buon questionario sono necessari esperienza del ricercatore conoscenza
della popolazione a cui viene somministrato chiarezza delle ipotesi di ricerca.

Dati sociografici, atteggiamenti e comportamenti

Le domande di un questionario possono essere classificate in base al loro contenuto, in tre classi, a seconda
che riguardino: propriet sociografiche di base, atteggiamenti e comportamenti.

Domande relative alle propriet sociografiche di base: si riferiscono alla pura descrizione delle
caratteristiche sociali di base di un individuo . Intendiamo quindi le sue caratteristiche permanenti come
quelle demografiche (genere, et, luogo di nascita), quelle ereditate dalla famiglia (classe sociale di origine,
titolo di studio), quelle temporanee (professione, stato civile, comune di residenza). Queste domande
seguono delle formulazioni standard.

Domande relative agli atteggiamenti. Si tratta delle propriet degli individui pi tipicamente rilevabili
(opinioni, motivazioni, sentimenti, giudizi, valor): interrogare direttamente gli individui lunica via per
ottenere queste informazioni, ma questo anche il campo pi difficile da esplorare, e le risposte sono
influenzate dal modo in cui sono poste le domande/collocazione nel questionario/modo di porsi
dellintervistatore.

Domande relative ai comportamenti. Nei casi precedenti si rileva quello che lintervistato dice di pensare,
ora si rileva quello che il soggetto dice di fare o di aver fatto. Questo un aspetto pi facile da indagare
rispetto agli altri. I comportamenti sono inequivoci, unazione o c stata o non c stata. I comportamenti si
caratterizzano dal fatto di essere empiricamente osservabili, unazione pu essere osservata da una terza
persona e pu lasciare una traccia oggettiva. E pi facile rispondere a questo tipo di domande ed pi
difficile mentire.

Domande aperte e domande chiuse

Con riferimento alla loro forma distinguiamo tra domande a risposta aperte e domande a risposta chiusa.

Le domande aperte sono quelle in cui si lascia piena libert allintervistato nella formulazione della risposta;
si rivolgono di solito ad un campione ridotto. Il vantaggio della domanda aperta quello di concedere una
maggiore libert di espressione e spontaneit, ma la risposta deve essere trascritta per intero. Lo svantaggio
consiste nel fatto che la risposta difficile da classificare successivamente in categorie predeterminate.
Questo crea dei problemi di codifica a posteriori, perch le risposte possono essere generiche o imprecise.
Solo un buon intervistatore pu sollecitare a precisare meglio il significato delle risposte, ma questo
comporta un maggiore impegno dellintervistato e quindi un maggior rischio di rifiuti, senza contare
laggravio dei costi.

Le domande chiuse offrono la possibilit di scegliere tra risposte prefissate, quindi la risposta sar standard.
Sono il solo tipo di domande che si possono utilizzare con un campione di grandi dimensioni. I vantaggi delle
domande chiuse consistono nella maggiore facilit di codifica, nello stimolo dellanalisi e della riflessione da
parte dellintervistato e nella maggiore economicit (in un campione ampio). La domande sono poste a tutti
con lo stesso schema di risposte e chiariscono allintervistato qual il piano di riferimento della ricerca,
evitando cos risposte vaghe.
I limiti sono il rischio di non considerare tutte le altre possibili alternative di risposta non previste e di

19
influenzare la risposta con le alternative proposte. A volte lintervistato sceglie una delle alternative anche se
non convinto. Le risposte, inoltre, non hanno significato uguale per tutti, e tutte le alternative possono
essere troppe per essere ricordate.

Formulazione delle domande

La formulazione delle domande importantissima perch pu influenzare pesantemente la risposta; bisogna


quindi porre molta attenzione al linguaggio, alla sintassi e al contenuto stesso delle domande.

Semplicit di linguaggio: il linguaggio del questionario deve essere adatto alle caratteristiche del campione
studiato, il questionario autocompilato deve essere pi semplice rispetto a quello con intervistatore in quanto
non pu prevedere spiegazioni da parte di questultimo e in ogni caso non bisogna far conto sulle sue
spiegazioni, perch di solito gli intervistati provano imbarazzo ad ammettere di non capire le domande.

Lunghezza delle domande: di solito le domande devono essere concise perch la lunghezza distrarrebbe
lintervistato dal focus dellinterrogativo, ma nel caso di tematiche complesse sono preferibili le domande
lunghe perch facilitano il ricordo, danno pi tempo per pensare e agevolano una risposta pi articolata.

Numero delle alternative di risposta: non devono essere troppo numerose; se presentate a voce non
devono superare il numero di cinque, limite al di sopra del quale il ricordo delle prime risulta affievolito.

Espressioni in gergo: preferibile non utilizzare espressioni gergali perch potrebbero irritare lintervistato
pensando di essere considerato ridicolo.

Definizioni ambigue: occorre fare molta attenzione a non utilizzare termini dal significato non ben definito.

Parole dal forte connotato negativo: bene evitare anche i termini carichi di significato emotivo,
soprattutto se questo negativo.
Es: lei picchia suo figlio?

Domande sintatticamente complesse: la domanda deve avere una sintassi chiara e semplice, evitando ad
esempio la doppia negazione.

Domande con risposta non univoca: bisogna evitare le domande esplicitamente multiple (domande in cui
ne sia inclusa unaltra) e quelle dalla problematica non sufficientemente articolata.
Es. i suoi genitori erano religiosi? Risulta impossibile rispondere in caso di orientamento differente tra i due.

Domande non discriminanti: le domande devono esser costruite in modo tale da operare delle
discriminazioni significative nel campione degli intervistati.

Domande tendenziose (viziate o a risposta pilotata): necessario presentare le domande in modo


equilibrato, senza orientare lintervistato verso una possibile risposta.

Comportamenti presunti: indispensabile evitare di dare per scontati comportamenti che non lo sono.
Es. non chiedere allintervistato per chi ha votato nelle ultime elezioni senza chiedergli se andato a votare

Focalizzazione nel tempo: occorre sempre definire con precisione larco temporale al quale si riferisce la
domanda.

Concretezza astrazione: la domanda astratta pu dare facilmente luogo a risposte generiche o normative,
mentre la domanda concreta facilita la riflessione e rende pi difficile il fraintendimento.

Comportamenti e atteggiamenti: data la difficolt di determinare gli atteggiamenti, buona regola, quando
possibile, limitarsi ai comportamenti piuttosto che restare nellambito dellopinione.

Desiderabilit sociale delle risposte: per evitare risposte normative bisogna formulare domande il pi
possibile concrete. Altre indicazioni sono quelle di giustificare anche la risposta meno accettabile; considerare
20
normale e diffuso anche il comportamento negativo; equilibrare la desiderabilit delle risposte (Alcuni
dicono che altri pensano che); attribuire allintervistato il comportamento condannato, lasciandogli il
compito delleventuale smentita; formulare le domande in terza persona; e cos via. In ogni caso
impossibile eliminare del tutto gli effetti della desiderabilit sociale.
Es. riportato in tutti i manuali, Quante volte ha picchiato sua moglie questa settimana? Invece di dire Lei
picchia sua moglie?

Domande imbarazzanti: Ci sono questioni delicate comportamento sessuale, reffito, comportamenti


devianti ( droga, alcolismo) - che andrebbero studiate attraverso domande aperte e con interviste non-
strutturate, con le quali si pu conquistare la fiducia degli intervistati.

Mancanza di opinione e non so: bisogna far presente allintervistato che non so una risposta legittima
come le altre, per esempio includendola espressamente tra le alternative possibili. Bisogna inoltre evitare di
indirizzarlo, anche in maniera indiretta o inconsapevole.

Intensit degli atteggiamenti: importante cogliere anche lintensit degli atteggiamenti, perch
questultima che determina i comportamenti. La rilevazione dellintensit degli atteggiamenti necessita di
solito di domante ulteriori.

Acquiescenza: si riferisce alla tendenza di scegliere risposte che esprimono accordo piuttosto che negative.
Tipica delle persone meno istruite.
Un problema simile quello delluniformit delle risposte response set, quando si tende a scegliere la
stessa risposta per una serie di domande che contemplano lo stesso tipo di alternativa.
Avviene per pigrizia o per mancanza di opinioni.
Il problema si risolve alternando la polarit delle risposte, formulandone in maniera che un individuo con
idee coerenti debba rispondere in maniera positiva a certe domande e ad altre in maniera negativa.

Effetto memoria: per ovviare alla inevitabile distorsione causata dalla memoria si possono stabilire limiti
temporali al ricordo; utilizzare punti di riferimento temporali relativi ad eventi pi salienti rispetto a quello
studiato; presentare allintervistato liste di possibili risposte; utilizzare diari o strumenti analoghi; ecc.

Sequenza delle domande: meglio mettere allinizio domande facili, che abbiano lo scopo di rassicurare
lintervistato e di metterlo a proprio agio. Le domande imbarazzanti si posizioneranno quindi a met
questionario, in modo che lintervistatore abbia avuto un po di tempo per conquistare la fiducia
dellintervistato. Anche le domande impegnative dovranno essere collocate a met dellintervista, in modo
tale da assecondare la curva di interesse dellintervistato e la possibile stanchezza. Alla fine si potranno porre
le domande pi noiose ma che non richiedono riflessione come quelle sociometriche.
bene seguire anche il passaggio da domande generali a domande particolari, stringendo progressivamente
sugli aspetti pi specifici.

Bisogna tenere conto infine delleffetto contaminazione, cio del fatto che in certi casi la risposta ad una
domanda pu essere influenzata dalle domande che lhanno preceduta.

Batterie di domande

Le batterie di domande sono domande che essendo, tutte formulate nello stesso modo (stessa domanda
introduttiva e stesse alternative di risposta, varia solo loggetto al quale si riferiscono), vengono presentate
allintervistato in un unico blocco. Le batterie di domande hanno gli obiettivi di risparmiare spazio sul
questionario e tempo dellintervista, facilitare la comprensione del meccanismo di risposta, migliorare la
validit della risposta e permettere al ricercatore di costruire indici sintetici che riassumono in un unico
punteggio le diverse domande della batteria. Gli svantaggi delle batterie di domande consistono nel pericolo
che le riposte siano date a caso e che le risposte siano meccanicamente tutte uguali tra di loro.

21
Quando una stessa domanda come nel caso delle batterie si applica a diversi oggetti, importante
distinguere il caso in cui in essa formulata in termini assoluti da quello in cui essa formulata in termini
relativi.
Assoluti: nel senso che ogni elemento della batteria unentit autosufficiente , alla quale lintervistato pu
rispondere indipendentemente dalle altre domande
Relativi: la domanda in cui la risposta nasce da un confronto con le altre possibili risposte
Es. pensiamo ad una batteria di domande aventi lo scopo di rilevare la popolarit dei personaggi pubblici. Si
pu presentare allintervistato un elenco di uomini pubblici domande in termini assoluti: si chiede di
esprimere una valutazione per es attraverso un punteggio da 1 a 10 - domande in termini relativi: si chiede
di mettere gli uomini politici dellelenco in graduatoria di preferenza oppure di scegliere i tre che preferisce.

Modalit di rilevazione
Tre sono i modi fondamentali di somministrazione di un questionario:

Interviste faccia a faccia


Nel caso che stiamo trattando, vale a dire quello dellintervista con questionario standardizzato, poich
lintervistatore gioca un ruolo essenziale, lobiettivo quello di limitare leffetto dellintervistatore,
standardizzandone il comportamento e limitandone i margini di discrezionalit attraverso una fase di
addestramento.
In altre parole, lintervistatore deve inibirsi qualsiasi comportamento che pu influenzare lintervistato; per
questo motivo gli intervistatori devono presentare alcuni tratti particolari per raggiungere questo scopo.

Le loro caratteristiche: lintervistatore ideale donna, sposata, di mezza et, diplomata, casalinga, di ceto
medio, con un abbigliamento neutrale. ricordandoci che in effetti le caratteristiche dellintervistatore ideale
dipendono molto da quelle del campione intervistato.

Le loro aspettative: le aspettative degli intervistatori possono essere trasmesse inconsciamente agli
intervistati, passando attraverso il tono di voce, la mimica facciale (sguardi di incredulit, assensi con il
capo), sottolineature ed enfasi nel leggere domande o le alternative di risposta - influenzandone le risposte
soprattutto per quanto riguarda intervistati insicuri.

La loro preparazione: lintervistatore deve essere consapevole dellinfluenza che ha nella formulazione delle
risposte e non deve essere un automa inerte ma deve poter intervenire in caso siano necessari dei
chiarimenti, e per questo deve essere istruito - saranno distribuite delle istruzioni scritte, saranno previsti
incontri preliminari ed in corso di rilevazione nonch dei supervisori ai quali gli intervistatori potranno
rivolgersi - per limitare al massimo questi effetti.

La loro motivazione: lintervistatore deve essere convinto dellimportanza del proprio lavoro, perch un
atteggiamento contrario potrebbe riverberarsi in modo negativo sullintervistato. E fondamentale negli
incontri preliminari che siano date istruzioni anche sugli obiettivi della ricerca.

Interviste telefoniche
Lintervista telefonica diffusa enormemente negli ultimi anni presenta numerosi vantaggi: permette una
grande velocit di rilevazione; ha costi ridotti il 50-70% di risparmio rispetto a quella faccia a faccia - ;
presenta minori resistenze alla concessione dellintervista e maggiore garanzia di anonimato;
permettere di raggiungere a parit di costo anche gli intervistati della periferia del paese; facilita
enormemente il lavoro di preparazione degli intervistatori e la loro supervisione; consente di utilizzare
direttamente il computer in fase di rilevazione.

I suoi svantaggi sono: il minore coinvolgimento dellintervistato che porta a una maggiore incidenza di
risposte superficiali; il pi rapido logoramento del rapporto con lintervistato; limpossibilit di utilizzare
materiale visivo; limpossibilit di raccogliere dati non verbali; limpossibilit di raggiungere tutti gli strati
sociali escludendo coloro che non hanno un telefono; il fatto che anziani e persone poco istruite risultano
sottorappresentate; il fatto che le domande sono spesso elementari a causa della ristrettezza del tempo a
disposizione. I limiti pi gravi sono comunque lassenza di contatto e la mancanza di tempo, che non
rendono adatta lintervista telefonica quando si
vogliono analizzare tematiche complesse.
22
Questionati autocompilati

I questionari autocompilati sono quelli che il soggetto compila da solo, senza lintervento dellintervistatore.
Il vantaggio principale di questa tecnica lenorme risparmio dei tempi di rilevazione.
I limiti invece consistono nel fatto che deve essere breve, conciso e il pi semplice possibile per venire
incontro al maggior numero possibile di persone;non essendo istruito lintervistato produrr errori grossolani
molti compileranno un questionario per la prima volta e non sapranno come fare, molti saranno
scarsamente motivati - inoltre di solito coloro che restituiscono il questionario sono un segmento particolare
della popolazione in esame (autoselezione), cosa che limita lestensibilit dei risultati.

Esistono due casi principali di autocompilazione: la rilevazione di gruppo e la rilevazione individuale.

La rilevazione di gruppo avviene in presenza di un operatore che distribuisce i questionari, assiste alla
compilazione e ritira i questionari; in questo caso i rischi di questa ricerca vengono molto ridotti.

La rilevazione individuale si pu dividere a sua volta in rilevazione con restituzione vincolata e con
restituzione non vincolata. Nel primo caso, loperatore deposita il questionario presso il soggetto in
questione e passa a ritirarlo in seguito (un tipico caso il censimento); anche questa tecnica limita i rischi
prima ricordati. Questa tecnica implicando lintervento personale di ogni rilevatore per lintervista non offre
costi inferiori rispetto alla procedura di intervista faccia a faccia ma molto adottata dallIstat.
Nel secondo caso, tipicamente quello del questionario postale, il questionario viene inviato per
posta con una lettera di presentazione e con una busta di ritorno gi affrancata.

I vantaggi di questa tecnica sono i risparmi altissimi dei costi, la possibilit di essere compilati in qualsiasi
momento anche a pi riprese, la maggiore garanzia di anonimato, lassenza di distorsioni dovute
allintervistatore, laccessibilit a soggetti residenti in zone poco raggiungibili.

Gli svantaggi sono la bassa percentuale di risposte, lautoselezione del campione, la necessit che il livello di
istruzione della popolazione studiata sia medio-alto, la mancanza di controllo sulla compilazione,
limpossibilit di questionari complessi e la sua lunghezza non eccessiva. Il problema principale di questa
tecnica dato dalla percentuale di ritorno dei questionari. E considerato adeguato almeno un 50% di
ritorno. Questo tasso di riuscita determinato da vari fattori, i principali: la misura in cui conosciuta
listituzione che patrocina la ricerca, la lunghezza del questionario e la sua forma grafica, le caratteristiche
degli intervistati ( si ha miglior riuscita quando la popolazione studiata rappresentata da un segmento
particolare accomunato da qualche caratteristica, soci di unassociazione,laureati di ununiversita),tipo di
sollecito, meglio se si sollecita almeno un paio di volte.
Sia nel caso dei questionari telefonici che di quelli autocompilati sono da escludere le domande aperte.

Interviste computerizzate (elettroniche)

Il computer pu essere utilizzato sia nelle interviste telefoniche (CATI, Computer Assisted Telephone
Interviewing) che nelle interviste faccia a faccia (CAPI, Computer Assisted Personal Interviewing), che si
differenzia da una normale intervista faccia a faccia per il fatto che le risposte vengono riportate
direttamente su un PC portatile con risparmio notevole di tempo facendo scomparire la fase di codifica -
immissione.
Una altro impiego del computer quello della teleintervista, in cui lintervistato risponde direttamente con il
suo PC al questionario trasmesso per via elettronica. I vantaggi di questa tecnica consistono nelleliminazione
dellintervistatore ma soprattutto nel fatto che si possono condurre inchieste longitudinali, cio rilevazioni
ripetute nel tempo sugli stessi soggetti anche effettuando variazioni sul questionario finalizzando la ricerca a
monitorare i cambiamenti dellopinione pubblica, dei consumi.. I suoi limiti consistono nel fatto che non
possibile accertarsi di chi effettivamente compili il questionario e inoltre la consapevolezza di esser studiati
pu alterare il comportamento.

Organizzazione della rilevazione

23
La raccolta delle informazioni finora analizzate normalmente preceduta dalle seguenti operazioni in
sequenza:
Interviste esplorative preliminari pre test di collaudo del questionario preparazione e supervisione dopo
che il lavoro su campo iniziato degli intervistatori contatto con le persone da intervistare forma grafica
del questionario.

Lo studio esplorativo: il ricercatore per poter formulare delle domande adeguate deve conoscere
perfettamente i problema oggetto del suo studio prima di iniziare a redigere le domande.
In particolar modo questo necessario per il questionario standardizzato che essendo composto da
domande chiuse esige che il ricercatore conosca non solo le questioni e gli interrogativi ma anche tutte e
possibili risposte.
Questa fase esplorativa preliminare verr condotta attraverso interviste preliminari, che partono da una
massima destrutturazione e da strumenti qualitativi fino a strumenti sempre pi strutturati, che hanno lo
scopo di analizzare perfettamente il problema di oggetto e di formulare con la massima precisione possibile
le risposte alternative per le domande chiuse.
Si effettueranno interviste libere ad osservatori privilegiati,interviste a risposta aperta, prove di domande al
fine di mettere a confronto differenti formulazioni.
Il pre-test: la fase di collaudo consiste in una sorta di prova generale del questionario, sottoposto a
poche decine di soggetti, che ha lo scopo di evidenziare eventuali problemi o cattive formulazioni del
questionario stesso. E necessario per testare lefficacia del test, una volta che sar stampato non potr pi
essere modificato.
Tra gli scopi oltre alla rilevazione degli errori c quella di determinare la durata dellintervista, esso contiene
un numero di domande maggiori rispetto a quelle che saranno poi somministrate.
La preparazione e la supervisione degli intervistatori: gli intervistatori devono essere preparati ( briefing)
informati su tutto ci che riguarda la ricerca, collaudati sul campo con il pre-test e controllati durante la
ricerca vera e propria da appositi supervisori.
Il contatto iniziale con i soggetti intervistati: il problema dei rifiuti. Il momento pi delicato dellintervista
quello iniziale, in cui i soggetti devono decidere se collaborare o meno. Per rendere massima la
collaborazione importante insistere sullanonimit delle risposte, sul prestigio dellistituzione committente e
sulla figura dellintervistatore. anche opportuno inviare una lettera di presentazione che spieghi
chiaramente chi il committente della ricerca, quali ne sono gli obiettivi, perch ci si rivolge proprio a lui,
sottolineare limportanza delle sue risposte e rassicurarlo sullanonimato.
La forma grafica del questionario: opportuno distinguere chiaramente il testo che riguarda lintervistato e
quello che di pertinenza dellintervistatore, i passaggi tra le domande devono essere indicati chiaramente, il
questionario deve essere graficamente compatto e non estendersi su troppe pagine. I questionari
autocompilati devono inoltre essere autoesplicativi, le domande devono essere semplici e brevi (meglio se
dello stesso formato), limpostazione grafica deve esser compatta e chiara.

Analisi secondaria e inchieste ripetute nel tempo


Litinerario di inchiesta campionaria finora presentato quello di un ricercatore che conduce le analisi su dati
da lui raccolti ma non lunico possibile.
Sono frequenti le ricerche condotte su basi-dai preesistenti, cos come le indagini ripetute nel tempo.
Lanalisi secondaria una ricerca che viene condotta su dati di inchiesta campionaria gi precedentemente
raccolti e disponibili nella forma di matrice-dati originale essa quindi una forma di ri-analisi di files gi
esistenti.
Al giorno doggi molto facilitata dallo viluppo dellinformatica che rende agevole lo scambio di files di dati e
la loro archiviazione.
Lanalisi secondaria nasce nellambito di un maggiore approfondimento dei dati gi raccolti sulla base di
successive scoperte o di nuove teorie avanzate nelle scienze sociali; a questo punto i dati gi raccolti
possono essere suscettibili di nuove elaborazioni e approfondimenti.
Inoltre, a causa dellestrema onerosit della fase di raccolta dei dati, sono nate apposite agenzie che
riescono risorse comuni mettendo poi i dati archivi-dati - a disposizione di tutti i ricercatori; ovviamente
queste agenzie non raccolgono i dati per un unico tema, ma trattano di rilevazioni multi scopo che toccano
un ampio spettro di problematiche sociali.

I vantaggi di questi sviluppi si possono riassumere in un generale risparmio economico, nella garanzia del
24
rigore della rilevazione stessa quando viene effettuata con il controllo della comunit scientifica e nella
possibilit anche per i ricercatori con poche risorse di effettuare ricerche di ampio respiro.

Gli svantaggi sono legati alla qualit dei dati, in quanto i dati raccolti nel passato possono non essere stati
trattati in modo corretto ( la divisione del lavoro che viene introdotta fra chi si pone gli interrogativi ed
analizza i dati e chi li raccoglie pu condurre ad una limitazione degli interrogativi, domande importante
possono restare senza una risposta); altro svantaggio il fatto che possano nascere ricerche a partire dai
dati disponibili piuttosto che dalle ipotesi teoriche ( alcuni ricercatori ottengono un data set, vi applicano le
elaborazioni statistiche e poi decidono qual il problema da studiare; i risultati saranno banali e scontati.

Distinzione tra analisi secondaria e meta-analisi:La meta-analisi un metodo di selezione, integrazione e


sinesi di studi aventi uno stesso oggetto danalisi, a partire e qui si differenzia dallanalisi secondaria dai
risultati degli studi e non dai dati. Si tratta di un integrazione dei risultati piuttosto che ricanalizzare i
soggetti. La meta-analisi unanalisi di analisi : lanalisi statistica di unampia collezione dei risultati derivanti
dagli studi sugli individui, allo scopo di arrivare ad unintegrazione dei risultati.

Estato gi accennato in merito agli esperimenti che una variabile pu variare sia fra i casi nello stesso
tempo sia nel tempo sugli stessi casi.
Le inchieste replicate nel tempo (diacroniche) si possono dividere in longitudinali e trasversali replicate.
Le inchieste longitudinali consistono nellintervistare ripetutamente gli stessi soggetti in un ampio arco di
tempo (panel studies).
I problemi di questa tecnica consistono nella mortalit del campione (molti soggetti saranno irraggiungibili
per diversi motivi a ogni nuova rilevazione), nelleffetto memoria e nel fatto che il soggetto sapendosi
osservato pu modificare il suo comportamento normale.
Le inchieste trasversali consistono nel replicare linchiesta ma su un campione (equivalente) di differenti
soggetti.
Linchiesta trasversale retrospettiva invece una normale inchiesta trasversale nella quale si pongono agli
intervistati domande sul loro passato, con gli evidenti limiti che laffidamento alla memoria pu comportare.
Le inchieste trasversali replicate consistono nel rilevare le stesse informazioni in differenti momenti
temporali , ma non sugli stessi soggetti bens su differenti campioni di individui.
Il maggiore difetto degli studi che comportano il fattore tempo naturalmente il costo molto elevato
poich non si ci pu accontentare di sole due rilevazioni ma sembra indispensabile ripetere linchiesta in un
lungo periodo di tempo, anche decenni.
Da qui la necessit di affidare queste indagini ad istituzioni permanenti in grado di garantire la continit che
non pu essere assicurata da singoli ricercatori o isolati gruppi di ricerca.

Data set ed archivi in Italia


Anche nel nostro paese si sono consolidati in questi ultimi anni istituti di archiviazione dei dati per la loro
messa a disposizione della comunit scientifica, nonch programmi di ricerca impostati su un ampio arco
temporale, finalizzato allo studio del cambiamento sociale, in aree come le trasformazioni demografiche, la
salute, i livelli di istruzione, la partecipazione politica, la mobilit sociale, i consumi, le opinioni pubbliche.

Analisi secondaria. Archivi- dati per le scienze sociali.


Non esiste in italia un archivio centralizzato di rilevanza nazionale, lunico tentativo in questo senso
rappresentato dallarchivio dati e programmi per le scienze sociali Adpss.
Lo strumento pi importante a disposizione oggi del ricercatore sono le Indagini multiscopo sulle famiglie
effettuate dallIstat.

Inchieste replicate nel tempo su campioni diversi.


Lesempio principe per lo studio dei valori e degli atteggiamenti costituito dall Eurbarometro iniziativa
europea, condotta dal 1973 due volte lanno nei paesi appartenenti alla CE su un campione di 1000 inividu in
ogni paese, et superiore ai 15 anni, intervistati faccia a faccia a domicilio.

Inchieste longitudinali.
Distinte in base al settore tematico di applicazione.
Campo della transizione scuola-lavoro es. indagine longitudinale sugli sbocchi professionali dei laureati
condotta dallIstat.
25
Campo economico sociale es. Indagine sul bilancio delle famiglie italiane condotta dallIstat

Nuove tendenze e nuovi rischi


Dalle tecniche finora elencate si sta iniziando a creare una distinzione tra parti nobili della ricerca
elaborazione teorica, analisi statistica, interpretazione dei risultati e parti volgari raccolta delle
informazioni.
Il ricercatore sta iniziando a delegare ad altri il secondo tipo di attivit e rinuncia anche al suo controllo.
Si rischia di avere elaborazioni sofisticate s dati inconsistenti con la conseguente produzione di ricerche
spazzatura (acronimo Gigo garbage in , garbage out)

---- si passa ora ad affrontare uno dei problemi pi difficili della ricerca sociale,il problema della misurazione,
si spiega come si possano trasferire dal piano teorico a quello empirico i concetti complessi delle scienze
sociali , stai emotivi, tratti psicologici, atteggiamenti politici, orientamenti di valore ----

LA TECNICA DELLE SCALE


Loperativizzazione dei concetti complessi
La tecnica delle scale (scaling) consiste in un insieme di procedure messe a punto dai ricercatori sociali per
misurare concetti complessi e non direttamente osservabili ottimismo,depressione, religiosit etc sono
concetti tipici delle scienze sociali caratterizzanti lessere umano che sono difficilmente traducibili nel
linguaggio della ricerca empirica.
Lunico modo per poterli registrare quello di usare un insieme coerente ed organico di indicatori, mettendo
anche a punto criteri intersoggettivi per controllare leffettiva sovrapposizione fra indicatori e concetto e la
completezza della procedura.
Possiamo quindi dire che una scala un insieme coerente di elementi items - che sono considerati come
indicatori di un concetto pi generale.
Lelemento item il singolo elemento ( affermazione, domanda, comportamento, risposta ad un test,
attributo); la scala linsieme degli elementi.

Es. un test di abilit matematica una scala: si ipotizza lesistenza di un concetto generale quale l abilit
matematica che viene rilevato attraverso una serie di prove specifiche ( soluzioni di equazioni, problemi,
prove logiche) i risultati delle quali alla fine vengono sintetizzati in un unico punteggi

In psicologia e sociologia la tecnica delle scale trova la sua applicazione pi comune soprattutto nella misura
degli atteggiamenti, dove lunit danalisi lindividuo, il concetto generale un atteggiamento (insieme di
tendenze e sentimenti, pregiudizi e nozioni preconcette, idee, convinzioni di una persona nei confronti di un
particolare argomento ; esso quindi un credenza di fondo non rilevabile direttamente) e i concetti specifici
sono le opinioni (espressione empiricamente rilevabile di un atteggiamento).

Latteggiamento il concetto generale, le opinioni ne sono gli indicatori.

La procedura che rileva gli atteggiamenti consiste nel sottoporre ai soggetti studiati una serie di affermazioni
in qualche modo legate allatteggiamento studiato, chiedendo di esprimere la loro opinione in proposito.
Combinando opportunatamente le risposte si perviene ad un punteggio individuale che stima la posizione di
un soggetto sullatteggiamento in questione.

Tuttavia la misura degli atteggiamenti se costituisce il pi importante campo di applicazione della tecnica
delle scale non ne rappresenta lunico. La tecnica pu essere utilizzata non solo per rilevare la propriet degli
individui attraverso le loro risposte ad una serie di stimoli gli elementi della scala ma anche per attribuire
un punteggio agli stimoli sulla base delle risposte degli individui. Es. possiamo attribuire alle professioni un
punteggio di prestigio sociale, oppure stabilire una graduatoria di popolarit fra gli uomini politici.4
La tecnica delle scale pu essere adoperata per rilevare le propriet non di individui ma di altre unit, per es
per giudicare lefficienza delle istituzioni.
26
Le variabili prodotte dalla tecnica delle scale non possono essere considerate pienamente cardinali, perch
scaturiscono da dimensioni sottostanti immaginate come propriet continue il grado di pregiudizio razziale
di una persona , cos come la religiosit, variano in maniera graduale tra gli individui e non sono misurabili
poich vi lincapacit di definire ununita di misura anche se la teoria delle scale tenta di dare una risposta
a questo problema. Per questo le variabili della teoria delle scale vengono chiamate quasi-cardinali.
Il quasi sta ad indicare l irraggiungibilit dellobiettivo di attribuire pieno significato numerico ai punteggi
delle scale.

Domanda e risposta graduata: lautonomia semantica delle risposte


Gli elementi di una scala sono tipicamente domande, possiamo quindi affermare che una scale costituita da
una batteria di domande (raramente da una domanda singola).
Le domande (sempre chiuse) possono essere proposte si parla di formato - in tre modi diversi.
Il primo consiste nel presentare risposte semanticamente autonome, cio ciascuna ha un suo intrinseco
significato compiuto che non necessita, per essere compreso, di essere messo in relazione con il significato
delle altre alternative presenti nella scala.
Per es. Indichi il suo titolo di studio? Nessuno licenza elementare media etc. Lintervistato per rispondere
che il suo titolo laure no ha bisogno di conoscere le altre possibilit si risposta
Il secondo caso quello in cui le categorie di risposta sono a parziale autonomia semantica, quando il
significato di ogni categoria parzialmente autonomo dalle altre (molto, abbastanza, poco,
per nulla). Es. non chiaro di per s che cosa voglia dire interessarsi abbastanza di politica ma in un
contesto che va da molto a niente, al termine abbastanza inserito tra i valori facile attribuire un significato.

Infine ci sono le scale auto-ancoranti, dove solo le due categorie estreme sono dotate di
significato, mentre tra di esse si colloca un continuum rappresentato da caselle, cifre, segmento - entro il
quale il soggetto colloca la sua posizione.

Le variabili prodotte dalla prima situazione sono senza dubbio ordinali, mentre nella seconda probabile che
scatti un processo di comparazione quantitativa. Per quanto riguarda il caso delle risposte auto-ancoranti
ancora pi probabile che si metta in moto una procedura mentale di suddivisione graduata dello spazio tra i
due estremi, suddivisione che per soggettiva e non valida per tutti. Per questo si parla di variabili
quasi-cardinali.
Nel caso delle variabili a parziale autonomia semantica preferibile offrire la possibilit di un punto neutro e
dellopzione non saprei. Il numero delle opzioni disponibili di solito 5 o 7, tranne nellintervista telefonica,
dove si usano domande con risposte binarie- si/no- per motivi di semplicit.

Nel caso delle graduatorie auto-ancoranti si possono usare diverse soluzioni come quella delle caselle vuote,
della sequenza di cifre oppure della linea continua.

Le preferenze possono essere espresse in termini assoluti (quando ogni domanda riguarda isolatamente una
singola questione) oppure in termini relativi (nella forma di confronti e scelte tra diversi oggetti).

preferibile scegliere scale con pi domande rispetto a scale con una domanda sola per tre motivi: la
complessit dei concetti rende improbabile la loro copertura con un singolo indicatore; una rilevazione
singola manca di precisazione, in quanto non riesce a discriminare in maniera fine tra le diverse posizioni dei
soggetti sulla propriet considerata; infine le singole domande sono pi esposte agli errori accidentali.
Le domande ad un solo elementi sono quindi meno valide, meno precise e meno attendibili.

Scale a pi elementi:

Scala di Likert

La procedura che sta alla base delle scale di Likert proposte da Likert negli anni 30, parliamo di unampia
variet di scale , scale additive, la tecnica pi adoperata nella rilevazione degli atteggiamenti - consiste
nella somma dei punti attribuiti ad ogni singola domanda.

27
Es. La procedura che sta alla base semplice ed intuitiva la medesima di questo es. test scolastico composto
da 30 domande, attribuiamo 1 punto esatto ad ogni domanda e sommando i vari punti lo studente che non
ha fatto errori prender 30

Il formato delle singole domande della scala di Likert rappresentato da una serie di affermazioni per
ognuna delle quali lintervistato deve dire se e in che misura daccordo. Di solito le alternative di risposta
sono cinque, da molto daccordo a fortemente contrario, originariamente erano 7.
E importante che siano previste risposte non so e che le affermazioni non siano tutte nello stesso senso.

La costruzione della scala avviene in quattro fasi.


Nella prima, la formulazione delle domande, si individuano le dimensioni dellatteggiamento studiato e si
formulano delle affermazioni che coprano i vari aspetti del concetto generale che si vuole rilevare.
Es. Nella Personalit autoritaria di Adorno e colleghi gli autori individuarono da precedenti ricerche nove
dimensioni della personalit autoritaria attorno alle quali costituirono le singole domande-affermazioni della
scala.

Nella seconda fase, la somministrazione delle domande, la scala viene sottoposta ad un campione limitato
di intervistati con un certo livello di istruzione.

In seguito, nella terza fase (analisi degli elementi), si selezionano le domande e si valuta il grado di
coerenza interna ( item analysis) della scala, cio se la scala misura effettivamente il concetto in esame e
leffettiva capacit della scala di conseguire lobiettivo per il quale stata costruita.
infatti possibile che alcuni elementi non risultino in linea con gli altri e vadano quindi eliminati.
Gli strumenti utilizzati nella terza fase sono la correlazione elemento-scala e il coefficiente alfa.
Per la correlazione elemento-scala, si calcola per ogni soggetto il punteggio su tutta la scala e si calcola il
coefficiente di correlazione tra questo punteggio e il punteggio di ogni singolo elemento.

Il coefficiente di correlazione una misura che quantifica il grado di relazione tra due variabili cardinali e
indica se il punteggio di ogni singolo elemento si muove nella stessa direzione del punteggio globale che
tiene conto di tutti gli altri elementi.
Se ci non avviene la domanda non congruente con la scala e va eliminata.
Es. stiamo rilevando lautoritarismo, se ad una persona viene attribuito un punteggio globale elevato
sommando le risposte tutte le domande e quindi risulta autoritaria - essa dovr avere un punteggio
abbastanza elevato - risposte di tipo autoritario anche su tutti i singoli elementi della scala.

Il coefficiente alfa serve invece a valutare la coerenza interna complessiva della scala.
Esso si basa sulla matrice di correlazione tra tutti gli elementi della scala e il loro numero; pi alti sono i
valori (da 0 a 1) maggiore la coerenza interna alla scala.
I pi noto tra tali indici lalfa di Cronbach. (Vedi pag 227)

Nelleliminare gli elementi pi insoddisfacenti della scala il ricercatore terr conto di entrambe le correlazioni,
eliminer gli elementi con correlazione elemento-scala troppo bassa finch questa operazione produrr un
aumento di alfa, fermandosi non appena questo intervento produrr invece una sua diminuzione.

Infine si apre la quarta fase, quella dei controlli sulla validit e lunidimensionalit della scala. Tralasciando i
controlli di validit ( analizziamo un modo di procedere dominane nellaattuale ricerca psicologia dove le
scale sono pi semplici costituite da una decina di elementi e la scala diventa uno degli aspetti della
ricerca, per cui le scale cos semplici comprendono un numero ridotto di elementi e non si necessita di
soffermarsi sui controlli di validit), la tecnica pi efficace per il controllo di unidimensionalit quella
dellanalisi fattoriale.
Il suo scopo quello di ridurre una serie di variabili tra loro collegate ad un numero inferiore di variabili
ipotetiche tra loro indipendenti, in modo da controllare se dietro agli elementi di una scala che si presume
unifattoriale, vi sia un solo fattore o pi fattori.
Es. la correlazione fra il voto in algebra ed in geometria di un gruppo di studenti se si va bene in una delle
materie si andr bene anche nellaltra o viceversa potrebbe essere ricondotta al fatto che entrambi i vosti
sono influenzati da un fattore sottostante, la capacit di astrazione matematica.

I vantaggi della scala Likert consistono nella sua semplicit e applicabilit, mentre i suoi svantaggi sono il
28
fatto che i suoi elementi vengono trattati come scale cardinali pur essendo ordinali ((Ogni elemento una
variabile ordinale , di solito del tipo a parziale autonomia semantica, nel caso pi frequente a cinque
modalit, da completamente daccordo a compl. contrario,alle quali vengono assegnati in maniera arbitraria i
punteggi in scala semplice 1.25, che vengono poi trattati come scale cardinali per es. nella correlazione
elemento-scala)) e la mancata riproducibilit (dal punteggio della scala non possibile risalire alle risposte
delle singole domande lo stesso punteggio pu essere ottenuto da diverse combinazioni di risposte) e il
fatto che il punteggio finale non rappresenta una variabile cardinale(non abbiamo elementi per dire che la
distanza fra un punteggio di 14 ed uno di 18 sia la stessa che intercorre tra 8 e 12).

Scalogramma di Guttman
La scala di Guttman una scala cumulativa o scalogramma. Nasce con lobiettivo di fornire una soluzione al
problema dellunidimensionalit della scala di Likert ed cumulativa nel senso che costituita da elementi di
difficolt crescente - una sequenza di gradini e si presume che il soggetto che ha risposto
affermativamente ad una certa domanda deve aver risposto affermativamente anche a quelle che la
precedono nella scala di graduatoria di difficolt.
In questo modo, se gli elementi della scala sono perfettamente scalati, solo alcune sequenze di risposte sono
possibili; inoltre dal risultato finale possibile risalire alle risposte date dal soggetto ai singoli elementi della
scala (riproducibilit).

Questa tecnica prevede solo elementi dicotomici, cio ogni domanda pu avere solo due risposte opposte e
distinte. si/no favorevole-sfavorevole /
Le due risposte possibili vengono di solito contrassegnate con i numeri 0 e 1.
Es. scala di distanza sociale proposta negli anni 20.
In questa scala per determinare il grado di pregiudizio degli intervistati nei confronti di determinate
minoranze etniche veniva posta una sequenza di domande del tipo:
Lei sarebbe disposto ad accettare un nero(coreano, giapponese) come visitatore del suo paese?
come vicino di casa?
avere come amico personale?
sposare n nero?
E evidente che chi disposto a sposare un nero risponder n modo affermativo alle altre domane.
Indichiamo con 1 il positivo e lo 0 il negativo, in linea di principio dovremmo avere possibili solo le sequenze:
1111 1110 1100 -1000 -0000 , mentre ad esempio la sequenza 1011 non dovrebbe verificarsi.

1 positivo, 0 negativo, sommando i punteggi di ogni individuo su tutti gli elementi otterremo per ogni
soggetto il punteggio complessivo della scala.

Anche la scala di Guttman segue tre-quattro fasi nella sua costruzione.


La prima quella della formulazione delle domande, con considerazioni analoghe a quelle relative alla scala
di Likert tranne che le domande devono essere dicotomiche e disposte secondo un ordine crescente di forza.
Anche la seconda fase (somministrazione) simile a quella della scala di Likert, con il vantaggio che la
forma binaria agevola le risposte e rende pi veloce la compilazione (anche se talvolta la forte
semplificazione indotta dal carattere binario delle scelte pu creare problemi allintervistato).

La specificit della scala di Guttman sta nellanalisi dei risultati, quando si valuta la scalabilit degli elementi,
si scartano quelli meno coerenti col modello, si stabilisce un indice di scalabilit della scale e se accettarla o
meno.
In primo luogo si devono individuare gli errori della scala, cio le risposte che non si inseriscono nelle
sequenze previste nel modello.
Per questo si utilizza un indice (coefficiente di riproducibilit) che misura il grado di scostamento della scala
osservata dalla scala perfetta.
Vedi pag. 235-236
Questo indice pu variare da 0 a 1; per poter essere accettabile, il valore dellindice deve essere maggiore o
uguale a 0,90 (cio errori pari o inferiori al 10% delle risposte).
Esiste anche un altro indice, detto di minima riproducibilit marginale, che segnala il valore minimo al di
sotto del quale il coefficiente di riproducibilit non pu scendere, quali che siano le sequenze delle risposte.
Esso deve essere confrontato con il coefficiente di riproducibilit: solo se il secondo, oltre ad essere

29
maggiore di 0,90, anche nettamente superiore al primo, si pu affermare che la buona riproducibilit della
scala dovuta ad uneffettiva scalabilit dei suoi elementi e non alla distribuzione marginale delle risposte.

Lultima fase quella di attribuire i punteggi ai soggetti; per far questo si sommano i punteggi 0/1 ottenuti
nelle varie risposte.
I problemi della scala di Guttman consistono nel fatto che il punteggio finale ancora una variabile ordinale;
si tratta di una tecnica applicabile solo ad atteggiamenti ben definiti e scalabili; il modello risulta rigidamente
deterministico di fronte ad una realt sociale interpretabile solo attraverso modelli probabilistici che
contemplino la possibilit di errore ed il passaggio graduale tra le posizioni.

Differenziale semantico
La tecnica del differenziale semantico di Osgood si propone di rilevare con il massimo della standardizzazione
il significato che i concetti assumono per gli individui, che cosa ci significa per te.
Il modo pi semplice per scoprire cosa significa una certa cosa per una certa persona quello di
chiederglielo direttamente, ma solo persone intelligenti, istruite e con eccellenti capacit verbali possono
fornire dati utilizzabili.
La tecnica del differenziale semantico supera questi limiti in quanto si basa sulle associazioni che
lintervistato instaura tra il concetto in esame ed altri concetti proposti in maniera standardizzata a tutti gli
intervistati. In concreto si utilizzano una serie di scale auto-ancoranti nelle quali solo le categorie estreme
hanno significato autonomo, mentre il significato graduato delle categorie intermedie viene stabilito a
giudizio dellintervistato.

Es. invece di chiedere che cosa significa per lei il termine sofisticato?
Si porranno una serie di domande del tipo: sofisticato duro o soffice? Gradevole o sgradevole? Etc

Per aumentare la sensibilit dello strumento si chiede di classificare lintensit di ogni giudizio su una scala di
7 punti.

La lista di questi attributi bipolari non deve avere necessariamente relazione con loggetto valutato, e quindi
deve essere sempre la stessa: anche coppie di aggettivi apparentemente estranei con il caso in esame es.
maschile/femminile , giovane/vecchio risultano utili per rilevare significati pi profondi ed anche inconsci
che loggetto ha per lintervistato.
Il test risulta di facile somministrazione e di solito viene accettato di buon grado da parte degli intervistati, in
genere nella presentazione delle batterie di domande si raccomanda allintervistato di rispondere distinto ,
sena riflettere troppo su ogni coppia.

Il numero delle domande di solito va dalle 12 alle 50, in base al disegno della ricerca.

Il modo pi importante di utilizzare il differenziale semantico rappresentato dallesplorazione delle


dimensioni dei significati, se chiediamo ad un intervistato di collocare un determinato oggetto cognitivo su
30 coppie di aggettivi, i singoli giudizi risulteranno naturalmente guidati dalla visione di insieme significato
che lintervistato ha del soggetto proposto.

Il presupposto che questa dimensione non sia unidimensionale, non si articoli cio in una sola direzione
,ma presenti diversi aspetti che contribuiscono al significato complessivo di quelloggetto.
Si ritiene cio che attraverso lanalisi fattoriale sia possibile determinare quali sono le dimensioni
fondamentali che stanno dietro ai giudizio di un certo campione di soggetti intervistati.

In linea generale, si possono trovare tre dimensioni fondamentali che sottostanno ai vari giudizi: la
valutazione, la potenza e lattivit, in ordine di importanza.
La valutazione sembra rappresentare latteggiamento( favorevole-sfavorevole) verso un certo oggetto.
Es. buono cattivo / positivo-negativo / giusto- ingiusto)
Potenza es. duro-soffice / pesante leggero
Attivit: attivo-passivo/caldo-freddo/veloce-lento

Le risposte ottenute si prestano a diverse elaborazioni tra cui ricordiamo,per una descrizione sintetica
dellimmagine del soggetto sottoposto a valutazione, si pu utilizzare il profilo , cio una rappresentazione
30
grafica consistente nel congiungere con una linea il punteggio medio ottenuto da quelloggetto su ogni copia
di attributi.

Il contributo pi importante della tecnica del differenziale semantico proprio quello di aver introdotto la
multidimensionalit dei significati nella struttura degli atteggiamenti.

Test sociometrico
Il test sociometrico proposto da Jacob Moreno si pone lobiettivo di individuare le relazioni interpersonali
esistenti tra gli individui di un gruppo; infatti il suo campo di applicazione ideale rappresentato da una
classe scolastica.
Nella sua forma pi semplice il test sociometrico consiste in un questionario con poche domande, che
ruotano intorno al tema della preferenza e rifiuto nei confronti degli altri appartenenti al gruppo.

In questo modo si pu conoscere lo status sociometrico personale, cio il grado di prestigio di cui gode un
elemento rispetto agli altri componenti del gruppo, e la struttura sociometrico del gruppo, cio
lorganizzazione interna del gruppo (con sottogruppi, persone isolate, relazioni tra i sottogruppi, ecc.). La
tecnica quindi utile sia come strumento di diagnosi individuale che per cogliere la struttura relazionale del
gruppo.
Tuttavia esso adatto solo per gruppi strutturati perch necessario che sia delimitato nettamente il raggio
di scelta del soggetto.
Es. tra i tuoi compagni di classe, quali sono quelli che desidereresti ritrovare lanno prossimo? Indicane
quanti vuoi mettendoli in ordine di preferenza. Etc.
Lelaborazione dei dati semplice come la somministrazione del questionario-
Si costruisce una matrice quadrata avente sul lato sx e superiore lelenco dei componenti del gruppo, e si
registrano nelle celle corrispondenti ad ogni coppia le preferenze/rifuiti.
Una prima elaborazione rappresentata dallanalisi dello status sociometrico individuale, ce si compone
analizzando per ogni individuo il numero di scelte effettuate e di rifiuti ricevuti.

In questi ultimi tempi questa tecnica ha ripreso piede allinterno della network analysis (analisi di rete).

Scale unidimensionali e multidimensionali


Negli esempi visionati abbiamo trattato di scale unidimensionali, in questa sequenza il punto di partenza
rappresentato dal concetto generale che si vuole rilevare , per operativizzare il quale vengono individuati
degli indicatori. Ma c un modo anche diverso di affrontare i problema di concetti complessi sottostanti un
insieme di osservazioni, ed quello di partire direttamente dalle osservazioni, chiedendosi quante e quali
dimensioni latenti stanno dietro di esse.
E questa la tecnica delle scale multidimensionali.

A partire dalle distanze fra determinati oggetti ci si pone lobiettivo di ricostruire lo spazio concettuale nel
quale questi oggetti sono collocati , nella mente degli intervistati se si tratta di dati dellintervista.
Il problema quello di capire se esiste uno spazio comune a tutti i rispondenti, poi si tratta di individuare
quante dimensioni ha questo spazio ed infine occorre dare un nome a queste dimensioni.

Esse sono tecniche matematicamente e concettualmente complesse che rientrano nella branca dellanalisi dei
dati.

LE FONTI STATISTICHE UFFICIALI


Le societ moderne producono una vastit di dati su se stesse , derivanti da iniziative espressamente
intraprese dai governi per conoscere la popolazione governata - es. i censimenti oppure prodotti dalle
normali procedure amministrative della burocrazia pubblica statistiche demografiche derivanti da atti di
nascite, morte etc-. Questi dati sono una fonte ineguagliabile di conoscenza sociale e possono costituire il
materiale empirico della ricerca sociale.

31
Una ricerca basata sulle statistiche ufficiali
Il primo importante studio basato sulle statistiche ufficiali fu quello di Emile Durkheim le Suicide condotto
alla fine del diciannovesimo secolo 1897. Sulla base dei tassi di suicidio nella varie nazioni europee, D. riusc
a corroborare empiricamente la sua complessa teoria dellintegrazione sociale, teoria che risulta tuttora
valida e stimolante.

Le statistiche ufficiali
Le statistiche ufficiali differiscono dagli altri dati normalmente utilizzati nella ricerca sociale in specie da
quelli raccolti mediante indagini campionarie surveys per quattro aspetti:

- La produzione ( in generale le statistiche ufficiali sono raccolte dalla pubblica amministrazione e


prodotte da normali procedure amministrative)

- Le unit di analisi (che non sono rappresentate da individui ma da aggregati territoriali di individui es.
sezioni elettorali, comuni, province, per questo sono chiamati dati aggregati in opposizione ai dati
individuali. Il dato aggregato deriva da unoperazione di conteggio effettuata sugli individui di un
collettivo, in questo caso il collettivo il territorio.)

- Il contenuto ( le informazioni raccolte dalla pubblica amministrazione consistono in registrazione di


eventi o fatti siamo nellambino di ci che stato definito prima comportamento - , per cui le opinioni,
gli atteggiamenti, le motivazioni, sono di norma escluse da questi dati)

- Lampiezza della rilevazione ( le fonti statistiche tradizionali es. censimenti fanno riferimento
allintera popolazione, non ad un suo campione)

Enti produttori e unit territoriali


Le fonti statistiche ufficiali hanno due caratteristiche principali:

- Sono prodotte da organismi pubblici ( e da qui prendono lattributo di ufficiali). In Italia si istitu nel
1861 un Ufficio centrale di statistica, nel 1921 lIstat istituto centrale di statistica nel 1989 si istitu il
Sistema statistico Nazionale sistan con lo scopo di coordinare tutte le competenze e le attivit
statistiche disperse nei vari organi centrali e periferici della pubblica amministrazione

- Si riferiscono non ad individui ma ad aggregati territoriali di individui. In Italia abbiamo sostanzialmente


tre unit amministrative territoriali: comuni province regioni. Esse rappresentano lunit di analisi
della quasi totalit delle statistiche ufficiali, a queste per esigenze date dalla complessit dei confini
amministrativi si aggiungono a livello sub comunale le sezioni di censimento e le sezioni elettorali e a
livello sovra comunale le aree metropolitane.

Contenuto informativo delle statistiche ufficiali italiane


Le statistiche ufficiali italiane sono prodotte per la maggior parte dallIstat. Esse vengono brevemente
descritte dopo averle classificate, a seconda del loro contenuto , in nove classi:
Informazioni generali / Popolazione : nascite /decessi , spostamenti territoriali migrazioni, matrimoni,
separazioni e divorzi / Sanit / Assistenza e previdenza / Giustizia / Istituzione e culture / Lavoro / Consumi
/ Reddito e benessere / Elenzioni / Indagini multiscopo sulle famiglie

Lo studio delle strutture sociali


Le fonti statistiche ufficiali sono una straordinaria opportunit per la ricerca sociale.
Forniscono una massa imponente di dati che abbracciano ogni settore della vita e accompagnano lindividuo
per tutto il ciclo di vita.

32
In almeno quattro settori di ricerca il ricorso alle statistiche ufficiali appare irrinunciabile per lo scienziato
sociale:
- Analizzare e descrivere la struttura della societ
- Ripartizioni territoriali di un paese
- Studi comparati tra le nazioni
- Studi nel tempo.

Il ricorso alle statistiche ufficiali non privo di limiti. I tre pi rilevanti sono:
- la natura dei dati non soddisfa le esigenze del ricercatore
- limitate a variabili fattuali cio dati oggettivi e comportamentali e quindi lesclusione di tutta la sfera
soggettiva delle opinioni, motivazioni, atteggiamenti
- non sono adatti per lanalisi dei comportamenti individuali.

3) LE TECNICHE QUALITATIVE

LOSSERVAZIONE PARTECIPANTE
E la pi classica delle tecniche qualitative, che unisce lassunzione dellosservare come strumento di
rilevazione del dato sociale alla completa immersione nel segmento di societ studiato

Osservazione e osservazione partecipante


Losservazione partecipante una tecnica di ricerca mediante la quale il ricercatore entra direttamente e per
un periodo di tempo relativamente lungo in un determinato gruppo sociale preso nel suo ambiente naturale
e stabilisce relazioni di interpretazione personale con i suoi membri, vive come e con le persone oggetto di
studio, al fine di osservare le loro azioni e capire le loro motivazioni attraverso un processo di
immedesimazione.

Nellosservazione partecipante coinvolgimento e immedesimazione non vanno evitati ma perseguiti (


simmetricamente oggettivit e distanza che erano alla base dellapproccio neopositivista non sono pi
considerate un obiettivo desiderabile).
Siamo nel pieno del paradigma interpretativo.

Osservazione: implica il guardare e lascoltare Partecipante: implica il coinvolgimento del ricercatore.


In senso weberiano , vedere il mondo con gli occhi dei soggetti studiati

Questa tecnica dallantropologo Bronislaw Malinowski dallesigenza di studiare le societ primitive nellambino
di ricerche di tipo antropologico - etnografico, successivamente con la scomparsa delle societ primitive i
campi di studio sono diventate le societ moderne.

Campi di applicazione e sviluppi dellosservazione partecipante

Losservazione partecipante pu essere applicata allo studio di tutte le attivit umane e di tutti i
raggruppamenti di esseri umani quando si vuole scoprire dallinterno qual la visione del loro mondo.

Ci sono dei settori nei quali questa tecnica particolarmente utile: quando si sa poco di un fenomeno
(nuovo movimento politico un evento sociale imprevisto come la ribellione), quando esistono delle forti
differenze tra il punto di vista dellinterno e quello dellesterno ( gruppi etnici organizzazioni sindacali
gruppi professionali medici etc), quando il fenomeno si svolge al riparo da occhi indiscreti (rituali religiosi
vita familiare), quando il fenomeno deliberatamente occultato agli sguardi degli estranei ( comportamenti
illegali)

33
Sociologia autobiografica: si ha quando losservatore partecipante si propone come strumento naturale di
indagine, il ricercatore intende studiare una realt nella quale ha fatto o fa lui stesso parte.

Losservazione partecipante viene abitualmente utilizzata nella ricerca sociologica per studiare due tipo di
gruppi:
- studi di comunit : (risentono maggiormente del modello etnografico) piccole societ autonome, collocate
in ambiti territorialmente definiti e dotate di un universo culturale chiuso che investe tutti gli aspetti della vita

- studi di subculture: subculture sviluppatesi allinterno di segmenti sociali delle societ complesse, che
possono rappresentare aspetti della cultura dominante, oppure essere con essa in particolare conflitto .

Esiste un filone di studi della cosiddetta etnografia organizzativa che consiste in unanalisi delle
organizzazioni come culture: dove oggetto di studio sono la cultura dellorganizzazione (le conoscenze
implicite condivise fra gli appartenenti alla stessa istituzione, i modelli di riferimento utilizzati per interpretare
la realt, le regole non scritte che orientano lazione individuale) e le modalit con le quali questa cultura si
esplicita nellazione e nellinterazione sociale (lorganizzazione formale ed informale, la costruzione di processi
decisionali, i rapporti interpersonali, i simboli, i riti)

Lo.p. stata utilizzata anche per studiare istituzioni sanitarie, politiche etc.

Osservazione palese e dissimulata: laccesso e gli informatori


Nellosservazione partecipante il ricercatore pu

- osservazione palese : chiarire apertamente da subito i suoi veri obiettivi, e cio che vuole entrare nel
gruppo non perch ne condivida gli obiettivi ma solo per studiarlo

- osservazione dissimulata : oppure si pu infiltrare nel gruppo fingendo di unirsi ad esso e di essere un
membro come gli altri ( paradosso dellosservatore: volere osservare come la gente si comporta
quando non osservata). La principale giustificazione a sostegno di questa pratica che lessere umano
se sa di essere osservato si comporter presumibilmente in maniera diversa da quella abituale ( si
visto che ci accade nelle prime fasi, successivamente con la consuetudine il soggetto si comporta
secondo le proprie attitudini)
La controindicazione di carattere morale , spia, e nel caso in cui si fosse scoperti si potrebbe correre in
conseguenze non prevedibili.
Semi-dissimulato: alcuni membri della comunit sono a conoscenza della presenza dellosservatore

Per entrare nella comunit oggetto dello studio il ricercatore spesso si serve di un mediatore culturale cio
di una persona che gode della fiducia della comunit e che pu fare accettare losservatore da parte del
gruppo, egli, per le sue caratteristiche culturali, anche capace di capire le motivazioni e le necessit del
ricercatore.

Unaltra figura dellosservazione partecipante rappresentata dall informatore, persona che appartiene alla
comunit studiata che losservatore utilizza per acquisire informazioni ed interpretazioni dallinterno della
cultura studiata. testimoni privilegiati: persone in posizione strategica interlocutori privilegiati: persone
normali.

Che cosa osservare


Losservatore non pu osservare tutto ma la pratica deve essere selettiva.

Brumer parla di concetti sensibilizzanti la ricerca guidata non su una tabula rasa ma da una particolare
sensibilit verso certi concetti piuttosto che altri.
Losservatore decide che cosa chiedere e forgia i suoi interessi nel corso della ricerca stessa.

34
Spradley dice che ogni situazione sociale definita da tre elementi: posto , attori e le attivit.

I potenziali oggetti di osservazione possono essere classificati nelle seguenti categorie:

- contesto fisico: Il ricercatore dovr limitarsi alla descrizione dei luoghi, pi che parlare di un quartiere
deprimente dovr descrivere lo stato delle strade, i negozi,i mezzi di trasporto etc

- contesto sociale: si descriver lambiente umano, le persone che frequentano le strade, le finalit dei
loro spostamenti spesa, lavoro, bighellonare -. In unazienda si descriver lorganigramma del
personale e degli uffici.

- interazioni formali: sono quelle che avvengono fra individui allinterno di istituzioni ed organizzazioni,
nella quali i ruoli sono prestabiliti e le relazioni si svolgono in un quadro di vincoli prefissati. le
comunicazioni che avvengono in unazienda tra i vari livello gerarchici.

- interazioni informali: le pi difficili da definire, losservatore p. deve diventare consapevole di tutti i


frammenti della vita quotidiana e imparare ad isolarli per analizzarli.

- interpretazioni degli attori sociali: lindividuo il soggetto, attivo e protagonista,il ricercatore osserva e
domanda e linterrogazione nella duplice forma di colloquio informale e intervista formale si affianca
allosservazione come strumento di rilevazione.

Registrazione dellosservazione
Il processo di registrazione dei dati di fondamentale importanza.
Nel caso dellosservazione partecipante essa assume essenzialmente la forma di stesura di appunti fatta
giorno per giorno: una sorta di giornale di bordo nel quale viene attentamente riportato, con ricchezza di
particolari e riflessioni personali, tutto quello che il ricercatore ha osservato nel corso della giornata.

Le note del ricercatore nascono dallinterazione fra osservatore e realt osservata, per ci constatano
essenzialmente di due componenti:
- la descrizione: dei fatti, accadimenti, luoghi, persona
- linterpretazione: data dal ricercatore a questi avvenimenti con le sue impressioni, riflessioni e reazioni.
Latto della registrazione pu essere scomposto in tre aspetti:

- Quando.. effettuare il prima possibile rispetto allaccadimento. Si suggerisce di portare sempre un


taccuino in cui appuntare degli spunti da elaborare

- Che cosa.. registrare abbiamo gi detto che le note devono riguardare la descrizione dei fatti,
linterpretazione del ricercatore ed ora aggiungiamo linterpretazione dei soggetti studiati.
La descrizione degli avvenimenti deve essere dettagliata ma il ricercatore non pu scrivere tutto e su
tutto, si consiglia di partire da descrizioni estensive per poi definire in maniera pi restrittiva il fuoco
delle analisi.
Linterpretazione del ricercatore di solito composta da due parti: riflessioni teoriche (rappresenta il
primo sforzo riflessivo finalizzato ad accumulare materiale e spunti) e reazioni emotive (il coinvolgimento
del ricercatore non va trascurato, essa rappresenta una forma di autoanalisi utile per il controllo di se ed
una utile documentazione a posteriori della dinamica creata da osservato-osservati per individuare
possibili distorsioni generate dalle proprie emozioni.

- Come.. registrare applicando il criterio della distinzione (fra descrizioni e interpretazioni del ricercatore
e dei soggetti, bisogna attribuire con meticolosit le valutazioni da chi le ha espresse) e della fedelt
(nel riportare commenti dei soggetti, loro punti di vista etc es. riportare fedelmente le espressioni
verbali)

35
Analisi del materiale empirico
Lanalisi del materiale empirico che un processo continuo che in parte si sviluppa nel corso della stessa
osservazione passa normalmente attraverso le seguenti fasi con la costante che si parte dal particolare per
arrivare al generale:

- Descrizione : E il resoconto sensoriale dellosservatore p. arricchita dei significati e delle interpretazioni,


un descrizione densa thick description, viene iscritta nel contesto culturale e storico e nella rete dei
rapporti sociali. Essa il risultato dellassemblaggio di materiale diverso,cronache giornalistiche, testi di
materiale documentario etc.

- Classificazione : nellosservare il mondo sociale , la configurazione fisica degli ambienti e dei gruppi, i
comportamenti degli individui, le azioni, il ricercatore coglier delle ricorrenze nel tempo cos come delle
similitudini tra diversi oggetti sociali che gli permetteranno di costruire delle classificazioni. ( il caso pi
semplice consiste nellindividuare le sequenze temporali con cui si svolge un avvenimento)

- Identificazione delle dimensioni delle tipologie stesse o tipi ideali si colgono le caratteristiche che
rendono i tipi uguali/differenti tra loro

Il modo pi generale di leggere il materiale raccolto attraverso losservazione partecipante consiste nella
identificazione dei temi culturali definizione di Spradley - che attraversano la societ studiata.
La ricerca dellosservatore p. deve muoversi partendo esaminando i dettagli muniti che sta studiando per poi
tracciare le linee generali del panorama studiato.

In merito allo stile di scrittura esso narrativo (prossimo allo stile letterario del racconto o della cronaca
giornalistica)e riflessivo ( la scrittura legata alla personalit ed alla cultura del ricercatore).

Osservazione in Microsociolgia
Losservazione partecipante nata come strumento per studiare le altre culture.

Dallo studio delle trib primitive essa stata trasferita allo studio delle trib urbane continuando ad avere
tuttavia come obiettivo coloro che venivano considerati diversi.
Successivamente si compreso che ogni campo dellattivit umana ha una sua specifica cultura che pu
essere analizzata attraverso lapproccio etnografico e lo strumento dellosservazione partecipante.

Anche gli aspetti organizzativi della nostra vita sociale hanno una loro cultura, anche i momenti pi banali
della quotidianit, gli atti meccanici della vita di tutti i giorni sono carichi di significati impliciti.

La Microsociologia lo studio delle piccole azioni quotidiane. Le azioni di tutti i giorni sono regolate da ben
definite norme (implicite) che governano le interazioni fra la gente. Ogni significato non individuale ma
sociale e viene appreso dallindividuo nel processo di interazione sociale con i suoi simili.

lEtnometodologia lo studio dei metodi e delle pratiche utilizzate dalla gente comune per decodificare il
mondo, dargli significato e compiere qualsiasi azione.
Letnometodologia si pone come obiettivo quello di svelare e studiare tali norme di cui il soggetto agente
lindividuo umano non ha consapevolezza pur nel suo continuo adeguarsi ad esse.

Limiti e risorse
I limiti della tecnica dellosservatore partecipante sono principalmente tre:

- Soggettivit del ricercatore


- Non generalizzabilit dei casi studiati
- Non standardizzazione delle procedure utilizzate

36
Essi sono un limite ma nel contempo una risorsa.

La tecnica ha anche delle difficolt di realizzazione ( grande investimento di tempo e di risorse psicologiche)

LINTERVISTA QUALITATIVA
Rilevazione mediante interrogazione
Lintervista qualitativa pu essere definita come una conversazione provocata dallintervistatore, rivolta ai
soggetti scelti sulla base di un piano di rilevazione ed in un numero consistente, avente finalit di tipo
conoscitivo , essa guidata dallintervistatore, sulla base di uno schema flessibile e non standardizzato di
interrogazione.
La prospettiva quella non di vedere con i suoi occhi ma di accedere alla prospettiva del soggetto studiato,
cogliere le sue categorie mentali, le sue interpretazioni, i motivi delle sue azioni.

Intervista qualitativa e quantitativa


Interrogare gli esseri umani per ricavarne conoscenza sulla societ pu essere fatto sia tramite un approccio
qualitativo interviste libere sia tramite un approccio quantitativo questionari standardizzati.
Approccio qualitativo si distingue dallaltro per: assenza di standardizzazione, comprensione piuttosto che
documentazione / contesto piuttosto che giustificazione, assenza di campione rappresentativo , approccio
incentrato sul soggetto invece che sulle variabili.

Tipi di intervista
Le interviste qualitative si differenziano per il loro grado di standardizzazione cio per il diverso grado di
libert-costrizione che viene concesso ai due attori.
Abbiamo gi distinto strutture standardizzate questionario e non standardizzate -intervista
dellinterrogazione
Le interviste si caratterizzano per essere uno strumento flessibile , aperto, adattabile ma la flessibilit pu
presentarsi a diversi gradi per cui esse possono essere ricondotte a tre tipi: vedi pag 80-83

Interviste strutturate: sono poste le stesse domande nella stessa formulazione e nella stessa sequenza a
tutti gli intervistati (le domande sono predefinite sia nel contenuto che nella forma come in un questionario a
risposta aperta)

Interviste semi-strutturate: lintervistatore non pone delle domande preformulate ma utilizza una traccia
che riporta gli argomenti che deve toccare nel corso dellintervista (le domande sono predeterminate nel
contenuto ma non nella forma)

Interviste non strutturate: lintervistatore deve solo accertarsi che determinati argomenti siano toccati
nel corso della conversazione, secondo le formule ed i modi che ritiene pi adeguati in quella specifica
situazione (n forma n contenuto delle domande sono prestabilite)

Casi particolari si interviste qualitative sono:


- le interviste non direttive e interviste cliniche: nellintervista non diretta neppure largomento
della discussione prestabilito, lintervistatore si lascia condurre dallintervistato che libero di portare
la conversazione dove meglio crede ed il fatto che la porti su un terreno piuttosto che su un altro viene
assunto come elemento diagnostico. Lo scopo quello di aiutare il paziente a portare alla luce
sentimenti profondi ed inconsci / Intervista clinica: fortemente guidata dallintervistatore , lo scopo
quello di rileggere la storia personale dellintervistato ricostruendo litinerario che ha portato verso un
certo esito, per es. verso un comportamento deviante.
La finalit per entrambe che sono terapeutiche.

- interviste con testimoni (osservatori) privilegiati persone intervistate non perch fanno parte del
fenomeno studiato ma in quanto conoscitori ed esperti di questo fenomeno del quale hanno una visione
diretta e profonda.
37
Essi sono adoperati soprattutto allinizio di una ricerca quando si ancora nel momento esplorativo

- Interviste di gruppo - focus groups: le persone intervistate devono essere innanzi tutto coinvolte tutte
in una situazione particolare ( vedere un film, hanno partecipato ad un evento sociale), gli individui
vengono poi intervistati in gruppo da un intervistatore che ha studiato preventivamente lelenco in
esame e che stimola e dirige la discussione in modo da far emergere le diverse interpretazioni, reazioni
emotive etc. Si tratta di un dibattito focalizzato su un evento ben preciso.

Conduzione dellintervista

Condurre unintervista qualitativa non essendo solo un momento di raccolta di informazioni ma un


processo di interazione fra due individui unarte difficile.
La dinamica dellintervista pu essere descritta con riferimento ai seguenti aspetti:

- le spiegazioni preliminari: il problema di affrontare il contatto iniziale non tanto quello di superare la
diffidenza dellintervistato quanto quello di fargli capire che cosa vogliamo da lui. Si descriver lo scopo
della ricerca, spiegando perch abbiamo scelto lui e perch faremo certe domande

- le domande primarie e secondarie: primarie: quelle che introducono un nuovo tema o aprono un
nuovo interrogativo, secondarie: finalizzate ad articolare ed approfondire largomento della domanda
primaria

- le domande sonda: non sono delle vere e proprie domande ma degli stimoli che intendono essere
neutrali ed hanno la funzione di incoraggiare lintervistato ad andare avanti ed aprirsi.(es. ripetizione
delle domande, incoraggiamento attraverso espressioni di interesse, pause, richiesta di
approfondimento.

- il linguaggio: lo stile cambia da soggetto a soggetto adattandosi alle caratteristiche dellintervistato

- il ruolo dellintervistatore: Lintervistatore ha un ruolo determinante ed il suo approccio costruttivista.


P Per cui non si richiede come nellambito quantitativo solo di essere diligente ma una sensibilit,
unintuizione, capacit di immedesimarsi. Pi lo strumento di rilevazione destrutturato maggiori
devono essere le capacit dellintervistatore.

Analisi del materiale empirico

Una volta che le interviste sono state concluse ( effettuate e trascritte) , esse devono essere analizzate,
interpretate e viene steso il rapporto di ricerca.

Lanalisi dei dati centrata sui soggetti (differisce dallapproccio quantitativo nel quale centrata sulle
variabili) secondo una visione olistica nel senso che lindividuo osservato e studiato nella sua interezza.

I risultati sono presenti in una prospettiva di tipo narrativo, si sviluppa attraverso racconti di si episodi,
descrizione di casi spesso utilizzando le stesse parole degli intervistati per non alterare il materiale raccolto.
Il modo standard di procedere alla presentazione dei risultati il seguente: si sviluppa unargomentazione e
al suo sostegno ed illustrazione viene riportato un brano dellintervista.

le sintesi e le generalizzazioni assumono la forma di classificazioni e tipologie.

Nel caso delle interviste strutturate i dati si possono analizzare secondo un approccio:

- misto:contemporaneamente qualitativo e quantitativo: lelemento che distingue la ricerca quantitativa


dalla qualitativa, il vero punto di discontinuit, costituito dalla presenza o meno della matrice dati.
la matrice dati consiste nella organizzazione delle risposte sulla base di uno schema di classificazione
comune a tutti i soggetti, che d luogo ad una matrice rettangolare di numeri, in riga abbiamo le i casi,
38
in colonna le variabili, in ogni cella, costituita dallintreccio tra le due, un dato (ovvero un valore assunto
da una particolare variabile su un particolare caso)la matrice dati come organizzazione standardizzata
delle risposte incompatibile con lapproccio individualistico.

Nellintervista strutturata per i due approcci convivono poich le domande sono prestabilite.
Si ottiene cos una matrice dati dove i soggetti studiati sono classificati sulle stesse variabili.
I dati standardizzati , comuni a tutti gli intervistati, vengono analizzati con gli strumenti classici della
statistica, i testi integrali delle trascrizioni secondo le modalit della ricerca qualitativa.

Si consiglia di stabilire lo schema della matrice dati prima dellintervista, in modo che ogni intervistatore
sia a conoscenza di quali sono le informazioni che deve chiedere.

Assenza di standardizzazione e interazione

Lassenza di standardizzazione rappresenta il punto di forza e di debolezza delle interviste qualitative.

E uno strumento adatto alla scoperta ed alla comprensione liber dellintervistato che pu fare risaltare il
proprio punto di vista, pochi vincoli allintervistatore i cui studi possono andare oltre la formulazione
originaria del problema.

La manca di standardizzazione comporta per una difficolt di comparazione , difficolt di sintesi.


Lintervista un atto di interazione in cui il ricercatore accede al mondo dellintervistato.

LUSO DEI DOCUMENTI


Ogni societ produce un grande quantit di documenti, vediamo come tali documenti possano essere
utilizzati in quanto basi della ricerca sociale.

Definizione delloggetto
Tre azioni elementari stanno alla base delle tecniche di ricerca quantitativa:
osservare interrogare leggere.
Trattiamo la parte relativa alla lettura dei documenti prodotti dagli individui e dalle istituzioni.

Documento: qualsiasi materiale che fornisce informazioni su un dato fenomeno sociale che esiste
indipendentemente dallintervento del ricercatore.
Esso viene prodotto dai singoli individui o dalle istituzioni per finalit diverse da quelle della ricerca sociale
ma essa pu impossessarsene e utilizzarlo ai propri fini.
Essendo riprodotti senza lintervento dei ricercatore essi contengono informazioni non reattive , cio che non
risentono dellinterazione tra studiante e studiato e attraverso di essi si pu studiare il passato.

Documenti personali
I documenti personali hanno natura privata, essendo prodotti dallindividuo gente comune - per uso
personale.

Vengono chiamati documenti espressivi in quanto esprimono i sentimenti, gli affari ed in generale la
personalit di chi li produce.

Sono stati classificati in:


- autobiografie : resoconti scritti dellintera vita della persona, da lei stessa compilati, scritti in un periodo
circoscritto e di tempo e quindi secondo una visione retrospettiva

- diari: scritti per uno strettamente personale e contemporaneamente allaccadimento degli eventi
39
ai diari che scrivono spontaneamente i soggetti possiamo accostare quelli commissionati, sono resoconti
giornalieri compilati su richiesta del ricercatore (inchiesta campionaria uso dei bilanci del tempo
consistenti in schede consegnate ai soggetti studiati, nelle quali la giornata viene suddivisa in frazioni di
tempo e per ciascuna di esse si chiede ad ognuno di annotare che cosa ha fatto per un certo periodo)

- lettere , testimonianze orali: resoconti della propria esperienza di vita sollecitate dal ricercatore. Le
testimonianze orali possono essere distinte in storie di vita narrazione allintervistatore della propria
vita e storia orale resoconto di specifici eventi dei quali il soggetto stato testimone

Documenti istituzionali
I documenti istituzionali sono prodotti da istituzioni oppure da singoli individui nel contesto dei loro ruoli
istituzionali.

Diversamente dai documenti personali hanno natura pubblica

Sono stati classificati in base alla loro fonte in:


- mezzi di comunicazione di massa:
- narrativa
- testi pedagogici
- racconti della cultura popolare
- materiale giudiziario
- documenti della politica
- documenti aziendali e amministrativi
- tracce fisiche : documenti materiali dai quali possibile risalire alle attivit che li hanno prodotti.
(iscrizioni sui muri, spazzatura etc)

Leggere i documenti umani

Leggere i documenti personali


Due modi principali degli scienziati sociali per atteggiarsi alla lettura dei documenti personali.
Il primo approccio riduttivo non si nega il fascino letterario ed il potere evocativo ma trattandosi di
racconti di destini unici ai documenti personali viene riconosciuta una funzione integrativa.
Il secondo approccio contempla che dato che lo scopo non quello di spiegare i fatti ma comprenderli, allora
anche lo studio dei singolo casi pu conoscendo i singoli casi, aiutare la nostra comprensione.

Leggere i documenti istituzionali


Pro: non reattivit possibilit di analisi diacronica costi ridotti
Contro: incompletezza dellinformazione ufficialit della rappresentazione.

4) ANALISI DEI DATI

IL CAMPIONAMENTO
Nella grande maggioranza dei casi la ricerca sociale non pu essere condotta sulla totalit della realt sociale
oggetto dello studio ma costretta a ritagliare un sottoinsieme di tale realt sul quale condurre lo studio.
La procedura di campionamento rappresenta la prima operazione empirica che il ricercatore sociale si trova a
svolgere.
Popolazione e campione
Anche se pu sembrare strano, la scelta casuale (tipica del campionamento) deve seguire regole ben
precise.

40
Un campionamento infatti pu essere definito come un procedimento attraverso il quale si estrae, da un
insieme di unit costituenti loggetto di studio (popolazione), un numero ridotto di casi (campione) scelti
con criteri tali da consentire la generalizzazione allintera popolazione dei risultati ottenuti studiando il
campione. La rilevazione campionaria presenta numerosi vantaggi alla ricerca sociale per quanto riguarda il
costo di rilevazione, i vantaggi nei tempi di raccolta dati ed elaborazione, vantaggi organizzativi (nel senso
che non necessario reclutare , addestrare e gestire le legioni di rilevatori che sono necessari nella
rilevazione totale) lapprofondimento e laccuratezza (la minore complessit organizzativa permette di
concentrare risorse sulla qualit dei dati)

Errore di campionamento
La tecnica del campionamento presenta tuttavia anche degli svantaggi. Infatti, se lindagine totale fornisce il
valore esatto del parametro che si vuole conoscere, lindagine campionaria ne fornisce solo una stima, cio
un valore approssimato. Ci significa che il valore in questione non certo, ma solo probabile, e inoltre
questa probabilit pu variare entro un certo intervallo (detto intervallo di fiducia).
La stima del campione sar quindi sempre affetta da un errore, che si chiama errore di campionamento.
Se per il campione probabilistico (cio scelto secondo una procedura rigorosamente casuale), la statistica
ci permette di calcolare lentit di tale errore.

Campioni probabilistici: il campione casuale semplice


Un campione detto probabilistico quando ogni unit che lo compone viene estratta con una probabilit
nota e diversa da zero.

necessario conoscere la popolazione.

I principiali tipi sono:

Campionamento casuale semplice: Il caso pi semplice del campione probabilistico, in cui ogni individuo
della popolazione ha uguali possibilit di essere scelto per il campione.
Si devono estrarre gli individui senza riferimento a caratteristiche individuali; il ricercatore parte dalla lista
completa dei membri della popolazione, in questo modo potr assegnare ad ognuna unit un numero ed
estrarre poi casualmente i numeri corrispondenti ai soggetti destinati a formare il campione.

Raramente applicato sia perch la selezione completamente casuale sia perch molto costosa e non
sempre i dati sui membri dellintera popolazione sono disponibili.

Campionamento sistematico: simile al casuale semplice, ma con diversa tecnica di estrazione. I soggetti
si scelgono secondo un intervallo stabilito (uno su k)
K=N/n : N la popolazione di riferimento n le unit che vogliamo k lintervallo di campionamento.
Su 8235 abitanti N - , vogliamo estrarre 500 unit n avremo k=8235/500 ovvero 16.7, ununit ogni
16.

Si usa quando non c periodicit e quando la lista non completa (ad esempio nei controlli di qualit sui
prodotti effettuato nelle ricerche di mercato delle persone che escono dal supermercato oppure negli exit
polls). In ogni caso deve essere rispettato il requisito che tutte le unit abbiano la stessa probabilit di
essere incluse nel campione e inoltre
deve essere evitata ogni forma di scelta diversa da quella predeterminata dallintervallo di campionamento.

Campionamento stratificato: si applica quando il fenomeno oggetto di studio presenta maggiore


omogeneit.
Si articola in tra fasi: a)si suddivide la popolazione di riferimento in sottopopolazioni (dette strati) il pi
possibili omogenee rispetto al fenomeno studiato, utilizzando come criterio di stratificazione una variabile
correlata a tale fenomeno b) si estrae tramite un procedimento casuale semplice un campione da ogni strato
c) si uniscono i campioni corrispondenti ai singoli strati per ottenere il campione complessivo.
Questa procedura richiede che per tutte le unit della popolazione sia nota la variabile posta alla base della
stratificazione.
Es. se il fenomeno oggetto di studio il reddito i soggetti di studio possono essere suddivisi in strati in base
alla variabile occupazione avremo quindi operai, impiegati etc
41
Il campione ottenuto pu essere stratificato proporzionale o ponderato (se si decide di riprodurre la stessa
composizione degli strati nella popolazione es. la popolazione composta da 40% impiegati, 15% operai etc
costruiremo un campione complessivo di 1000 casi in cui il 15% saranno operai ed il 40% impiegati ) oppure
stratificato non proporzionale (se si decide di sovrarappresentare alcuni strati e sottorappresentare altri. Il
campione di questo esempio pi efficiente il campione stratificato ottimale: lampiezza del campione
estratto da ciascuno strato risulta proporzionale alla variabilit del fenomeno studiato allinterno di quello
strato).

Campionamento a stadi: la popolazione viene suddivisa su pi livelli gerarchicamente ordinati, i quali


vengono estratti in successione con un procedimento ad imbuto.
Se presumiamo di avere due stadi, il campionamento si effettua in due momenti: prima si estraggono le
unit primarie (gruppi di soggetti che costituiscono le unit di analisi vere e proprie) e successivamente si
estrae casualmente un campione di unit secondarie (le unit di analisi) in ognuna delle unit primarie
selezionate dalla prima estrazione.

I vantaggi di questa tecnica consistono nel fatto che non necessario avere la lista di tutta la popolazione,
ma solo delle unit primarie; inoltre la rilevazione viene concentrata sulle unit estratte, con notevole
riduzione dei costi e una semplificazione della procedura.

Gli svantaggi sono una perdita di efficacia dovuta al fatto che i casi appartenenti ad una stessa unit dordine
superiore tendono in parte ad assomigliarsi e la teoria statistica legata molto complessa.
Es. devo costruire un campione nazionale di maestri elementari , le unit primarie sono i circoli didattici di
appartenenza (purch ogni maestro appartenga ad una sola unit primaria)e le unit secondarie sono gli
stessi maestri. Il campionamento si effettua in due stadi ovvero in due estrazioni successive, al primo stadio
si estrae un campione di unit primarie per es. 50 circoli didattici, al secondo si estrae casualmente un
campione di unit secondarie, maestri, da ognuna delle unit primarie selezionate nella prima estrazione.
La lista dei maestri serve solo per le unit primarie.

Gli stadi del campionamento possono essere anche pi di due.

Campionamento a grappoli: si usa quando la popolazione risulta naturalmente suddivisa in gruppi di unit
spazialmente contigue (grappoli). Al posto delle unit elementari vengono estratti i grappoli, e poi tutte le
unit elementari appartenenti ai grappoli vengono incluse nel campione. Questa tecnica semplifica di molto
la rilevazione ed molto utile quando manca la lista delle unit elementari mentre esiste la possibilit di
estrarre con procedura probabilistica i grappoli.
Es. ricerca sul tifo calcistico si pu assumere come popolazione di riferimento linsieme dei tifosi che seguono
in treno la trasferta della squadra. Scegliere con campionamento sistematico due scompartimenti per ogni
vagone ferroviario ed intervistare tutti gli individui presenti negli scompartimenti selezionati.

Campionamento per aree: molto simile al campionamento a stadi e si utilizza quando mancano del tutto i
dati sulla popolazione oppure quando le liste sono incomplete. Esso offre maggiori probabilit di rilevare i
clandestini, residenti temporanei etc.

Campioni complessi: sono quelli in cui si utilizzano congiuntamente le tecniche ora presentate.

Campioni non probabilistici


Quando il disegno probabilistico non pu essere impostato si ricorre sin dallinizio ai campioni non
probabilistici.
Campionamento per quote: E il campionamento pi diffuso soprattutto nelle ricerche di mercato e nei
sondaggi di opinione.
Si divide la popolazione in strati definiti da alcune variabili delle quali si conosce la distribuzione (es. genere ,
classe di et, titolo di studio) , quindi si calcola il peso percentuale di ciascuno strato ovvero la quota di
popolazione complessiva che appartiene ad ogni strato (la somma di questi pesi deve esser uguale ad 1),

42
infine moltiplicando ciascuno di questi pesi per lampiezza n del campione si stabiliscono le Quote ovvero il
numero di interviste da effettuare in ciascuno strato.
Restando il vincolo dellammontare complessivo di ogni quota il ricercatore libero di scegliere a sua
discrezione i soggetti da intervistare.

i soggetti allinterno degli strati rispettando la proporzione (non c casualit). I limiti di questa procedura
consistono nel fatto che il ricercatore segua criteri utilitaristici di selezione e cerchi i soggetti pi facilmente
raggiungibili, enfatizzando in questo modo lerrore di non-risposta.

Campionamento a valanga: particolarmente utile in caso di popolazioni clandestine e per quei gruppi
poco numerosi dispersi per il territorio.
Esso consiste nellindividuare i soggetti da inserire nel campione partendo dagli stessi soggetti intervistati.
Si parte da un piccolo numero di individui dai requisiti richiesti, i quali sono utilizzati come informatori per
identificare altri individui dalle medesime caratteristiche, con il procedere delle rilevazioni il numero dei
nominati dovrebbe crescere esponenzialmente da qui lanalogia con la valanga.

Svantaggio: si selezionano le persone pi attive socialmente e pi visibili e potrebbero imboccarsi delle


strade troppo specifiche per cui si necessita di porre dei vincoli basati sulla propria conoscenza del
fenomeno.

Campionamento a scelta ragionata: in questo caso le unit campionarie non sono scelte in maniera
probabilistica, ma sulla base di alcune loro caratteristiche.
Viene adoperato quando lampiezza del campione assai limitata.
Es. nella scelta dei quartieri di una citt si pu decidere di includere nel campione un egual numero di
quartieri centrali e periferici, operai e borghesi.

Campionamento bilanciato: una forma di campionamento ragionato, nel quale si selezionano la unit di
modo che la media del campione, per determinate variabili, sia prossima alla media della popolazione (deve
trattarsi quindi di variabili delle quali sia nota la distribuzione nella popolazione). Esso viene usato
soprattutto in caso di campioni molto piccoli e quando le unit di analisi non sono individui ma istituzioni,
comuni etc.

Problemi di campionamento nella ricerca sociale


Nellinchiesta campionaria survey lapplicazione della teoria del campione resa difficile dallesistenza dei
cosiddetti errori di selezione, che includono oltre allerrore di campionamento anche lerrore di copertura e
lerrore di non risposta.

Errore di copertura. Lista della popolazione


Nasce dal fatto che spesso nella ricerca sociale non si possiede una lista completa della popolazione.

Nel caso in cui si conosce la lista della popolazione, possibile procedere con campionamenti probabilistici.
Questo accade di solito quando loggetto di studio lintera popolazione (anche nazionale), perch esistono
anagrafi e liste elettorali che forniscono lelenco completo della popolazione.

Il problema si pone per i sottoinsiemi della popolazione, perch di solito non si in possesso di una lista
completa della popolazione, pensiamo per esempio agli studi su operai, immigrati, cattolici etc.

Quando invece lunit di analisi non un individuo , come appena accennato, ma un collettivo, la situazione
migliore perch in genere un aggregato di individui esiste in forma istituzionalizzata e registrata.

Se non c la possibilit di conoscere la lista della popolazione bisogna rinunciare a tecniche di


campionamento probabilistico, perch in questi casi non possibile assegnare a tutte le unit della
popolazione una certa probabilit di estrazione.

Ma non sufficiente che le liste esistano, bisogna anche che siano aggiornate, complete ed esenti da

43
duplicazioni. Il problema dell incompletezza il pi grave; in questo caso il ricercatore ha tre vie:pu
ridefinire la popolazione, trascurare gli esclusi oppure procedere ad unintegrazione del campione.

Errore di campionamento. Ampiezza del campione


Se consideriamo il caso di una ricerca monovariata (quando si stimano le variabili ad una ad una) la
dimensione del campione pu essere adeguata, ma se nella stessa ricerca studiamo le relazioni tra le
variabili (analisi bivariata o multivariata) lerrore cresce subito fino a livelli inaccettabili.

La dimensione ideale del campione dipende dalla distribuzione delle variabili studiate e dal tipo di analisi che
si intende fare. In generale lampiezza del campione dovr essere tanto maggiore quanto pi il fenomeno da
studiare minoritario.

Errore di non-risposta. Mancati contatti e rifiuti


Lerrore di non-risposta pu avere due cause ben diverse:
a) Il mancato contatto con i soggetti estratti
b) Il rifiuto di farsi intervistare da una parte di essi

Il problema del mancato contatto con i soggetti estratti soprattutto un problema di costi, esso pu
presentarsi in due forme:
- pu essere causato dalla difficolt di raggiungere i soggetti (non si pu superare un certo limite stabilito
dalleconomia generale della rilevazione, es non si pu immaginare che nellambito di una ricerca sulla
popolazione nazionale, una volta effettuato il sorteggio si possano intervistare i soggetti dispersi su tutto
il territorio)
- oppure dalla loro irreperibilit; (sempre per motivi di costi dopo 2-3 volte di mancato contatto con la
persona che si ricerca essa venga sostituita da un nominativo di riserva)
in ogni caso si tratta di problemi fastidiosi ma risolvibili.

Molto pi grave il problema dei rifiuti a rispondere, in quanto spesso coloro che non vogliono rispondere
sono diversi dagli altri e quindi non rappresentano una selezione casuale del campione originario.
Spesso si tratta di persone anziane, con baso titolo di studio, donne, individui che vivono soli, oppure per es
persone con certe caratteristiche, in uninchiesta sugli operai di uno stabilimento possono rifiutarsi di
rispondere quelli pi politizzati.
In questo modo si compromette la validit del campione stesso, che sovrarappresenter alcune categorie di
persone a scapito di altre.

La percentuale di mancate risposte in Italia varia dal 20% al 50%, a seconda della diversa
forma di contatto utilizzata (ad esempio di solito le interviste faccia a faccia hanno un tasso di risposta
superiore a quelle telefoniche).

Una soluzione per rimediare alle mancate risposte pu essere quella di sostituire i soggetti con altri scelti a
caso, ma questa tecnica spesso non efficace perch i sostituti assomigliano pi ai rispondenti che non ai
non rispondenti e potrebbero non rappresentare segmenti di popolazione dalle caratteristiche particolari
marginali ma un gruppo medio essendo stati estratti casualmente.

Per contrastare efficacemente il problema delle mancate risposte ci sono due metodi: il primo quello di
tornare il pi possibile dalla persone che non rispondono per incontrarle o convincerle; il secondo consiste
nella ponderazione, cio nellattribuire alle persone non raggiunte dallintervista le risposte medie date dal
gruppo sociale al quale esse appartengono.

Ponderazione
La ponderazione quella procedura con la quale modifichiamo artificialmente la composizione del campione
(attraverso operazioni matematiche nella fase di elaborazione) onde renderla pi prossima alla distribuzione
della popolazione. Essa si realizza attribuendo un peso ai casi campionati che varia a seconda delle loro
caratteristiche.

Le procedure di ponderazione sono molto complesse e ci limitiamo ad illustrare quelle le cui forme e le
situazioni pi elementari a seconda che si basino sulle
44
a) probabilit di inclusione delle unit nel campione,

La ponderazione si effettua a partire dalle probabilit di inclusione dei soggetti nel campione.
Spesso i campioni utilizzati nella ricerca sociale non corrispondono alla situazione ideale in cui tutte le unit
hanno eguale probabilit di selezione e che viene richiamata nellimmagine delle palline estratte dallurna.
Essa consiste nel campionare negli strati in modo deliberatamente non proporzionale alla loro presenza nella
popolazione per avere un numero di soggetti sufficiente per lanalisi statistica.
In questo caso la probabilit di inclusione non uguale per tutti i soggetti, ma nota; ed a partire da
questa conoscenza si calcolano i pesi per la ponderazione. Siamo nellalveo del campione probabilistico.

Nei casi in cui il campione non probabilistico oppure p affetto da errori di copertura o di non risposta gli
intervento di ponderazione consistono in puri e semplici interventi di aggiustamento finalizzati a contenere gli
errori e le distorsioni.

b) conoscenze che si hanno sulla popolazione

Il caso pi comune di ponderazione effettuata sulla base di conoscenze che si hanno sulla popolazione
quello della cosiddetta post-stratificazione e consiste nel correggere la distribuzione nella popolazione del
campione di alcune variabili in modo da farla corrispondere alla distribuzione della popolazione totale.

Loperazione si effettua moltiplicando ogni caso del campione per un coefficiente di ponderazione ( peso) pari
al rapporto quota teorica /quota rilevata della categoria di appartenenza.

Es. se i maschi invece di essere il 49% - quota teorica nota attraverso il censimento risultano essere nel
campione a rilevazione avvenuta il 58% - quota rilevata si moltiplicher ogni soggetto maschio per il peso
49/58=0.84 ed ogni femmina per il peso 51/42=1.21. Di fatto come se riducessimo un po il numero dei
maschi imponendo che ogni maschio conti non per ununit ma per 0.84 unit ed aumentassimo il numero
delle femmine imponendo che ognuna di esse conti per 1.21 unit.

Esso copre lerrore di copertura. In questo caso non siamo pi in presenza di campioni
probabilistici.

c) conoscenze che si hanno sulle non-risposte.

Il caso che si basa sulle conoscenze che si hanno sulle non-risposte copre invece lerrore di non-risposta e
consiste nel classificare le persone che si rifiutano di rispondere sulla base di un certo numero di variabili e
quindi le risposte raccolte vengono ponderate attribuendo loro un peso che tiene conto dei rifiuti.

Lo scopo di questa procedura quello di attribuire ai non rispondenti il comportamento medio delle persone
appartenenti al loro stesso gruppo sociale.
Es. nellintervista alluscita dai seggi elettorali exit polls lintervistatore classifica le persone che rifiutano
di rispondere sulla base di due variabili, genere e classe di et. Le interviste raccolte vengono ponderate
attribuendo loro un peso che tiene conto dei rifiuti a rispondere. Se sul totale delle persone interpellate per
lintervista le donne anziane erano il 9% ma di queste solo una parte 5% de totale ha risposto -, a quelle
che hanno accettato di farsi intervistare verr attribuito un peso pari a 9/5=1.8.
In questo caso il coefficiente di ponderazione peso corrisponde al reciproco del tasso di risposta per
ciascuna classe.

Anche in questo caso non si tratta di una tecnica probabilistica.


Un ulteriore intervento, che si usa per attenuare la distorsione prodotta dalla mancata risposta solo a
qualche domanda del questionario, consiste nel procedere ad una stima delle mancate risposte a partire
dalle informazioni che si hanno sugli intervistati parzialmente reticenti.
Bont di un campione
la validit scientifica ( bont) di un campione definita da due fattori: la sua rappresentanza e la sua
ampiezza.

45
Un campione rappresentativo quando fornisce unimmagine in piccolo ma senza distorsioni della
popolazione; la rappresentativit dipende dalla casualit della procedura con la quale stato costruito.
Questa rappresentativit valida per tutte le variabili della popolazione.

Possiamo infine dire che se le stime del campione sono sufficientemente piccole, il campione
rappresentativo.
Ma praticamente impossibile realizzare una procedura completamente casuale, per cui la rappresentativit
del campione un obiettivo limite al quale ci si pu solo avvicinare minimizzando gli errori di copertura e di
non-risposta (accuratezza).

In parte lampiezza del campione condizione della rappresentativit: se il campione troppo piccolo, allora
lerrore di campionamento troppo elevato e il campione non pu essere definito rappresentativo. In parte
invece lampiezza del campione un requisito autonomo dalla rappresentativit, e dipende dal tipo di analisi
che vogliamo fare sui dati (monovariata, bivariata o multivariata).

Tra i due requisiti dovrebbe essere privilegiata lampiezza per la sua maggiore importanza.

importante anche la finalit della ricerca: se si tratta di uno studio descrittivo, il campione deve essere il
pi possibile rappresentativo, se invece lobiettivo di tipo relazionale, il campione pu anche non essere
perfettamente rappresentativo. In ogni caso il ricercatore pu trascurare laccuratezza della rilevazione,
applicando il pi possibile il campionamento casuale nonostante la sua difficolt.

LANALISI MONOVARIATA
Lanalisi monovariata consiste nellanalizzare le variabili singolarmente, ad una ad una senza metterle in
relazioni tra loro.

Tipi di variabili e analisi statistica


Le variabili si distinguono in nominali, ordinali e cardinali.

Tale distinzione deriva dalle caratteristiche della propriet che la variabile operativizza ed ha delle
conseguenze sulla scelta delle tecniche statistiche da utilizzare per analizzare le variabili stesse e le loro
relazioni.

Sono le caratteristiche logico-matematiche delle variabili a definire le procedure da seguire nella fase di
analisi dei dati. Le diverse variabili sono quindi analizzate in modo diverso sin dai
livelli pi elementari.

- Nominali: deriva da unoperazione di classificazione degli stati della propriet. I numeri assegnati alle
modalit (ammesso che siano numeri, potrebbero essere lettere o qualsiasi altro segno)non hanno alcun
significato numerico ma sono dei puri nomi. Es. religione assegniamo 1 cattolica 2 mussulmana dove i
numeri sono puramente arbitrari privi di significato numerico.
Le sole relazioni possibili sono quelle di eguaglianza (due persone cattoliche sono uguali per quanto
riguarda la religione) e di diseguaglianza (un cattolico ed un protestante sono diversi per religione)

- Ordinali: nasce da unoperazione di ordinamento degli stati della propriet. I valori numerici attribuiti
alle modalit mantengono le propriet ordinali dei numeri, nel senso che attribuiamo 1 per molto
insoddisfatto, 2 per poco soddisfatto etc.
Oltre alle relazioni di eguaglianza e diseguaglianza possono essere instaurate anche le relazioni dordine
e cio di maggiore e minore.
Non si pu affermare la distanza tra valori e quindi quanto un valore sia maggiore dellaltro

- Cardinali: si ottengono dalle propriet mediante unoperazione di misurazione e conteggio.


I valori hanno un pieno significato numerico.
Nel caso della misurazione, lesistenza di ununit di misura fa si che si conoscano le distanze fra i valori.
46
Fra 20 e 22 gradi c la stessa distanza che intercorre tra 16 e 18 gradi e tale distanza la met di
quella esistente fra 40 e 44 gradi.
Si possono effettuare le quattro operazioni matematiche aprendo la strada allutilizzazione si tutte le
principali procedure della statistica.

Il fatto che sulle variabili non siano consentite le stesse operazioni fa si che esse vadano analizzate con
procedure diverse sin dai livelli pi elementari.

La maggior parte delle tecniche sono state elaborate per le variabili nominali o cardinali, mentre le variabili
ordinali dovrebbero essere trattate come nominali perch non corretto assegnare loro le propriet delle
variabili cardinali. Ricordiamo che le propriet dei tre tipi di variabili sono cumulative,- la variabile successiva
ha insite le caratteristiche di quella che lha preceduta- e i tipi possono essere visti come tre livelli ordinabili
per cui le tecniche di analisi delle variabili a livello inferiore sono applicabili anche a quelle poste su un livello
superiore. Un caso particolare delle variabili nominali quello delle cosiddette variabili dicotomiche, che
hanno la propriet di poter essere trattate statisticamente come variabili cardinali non ponendosi il problema
delle distanze tra i due valori; per questo talvolta il ricercatore dicotomizza variabili a pi categorie
(politomiche) aggregando modalit dal significato prossimo. (es aggregando il partito votato in partito di
destra o di sinistra)

Matrice dei dati

Abbiamo il materiale empirico grezzo si tratta ora di organizzarlo in una forma che possa essere analizzato
con gli strumenti dellanalisi statistica.
Nella ricerca quantitativa lo strumento adoperato la matrice dei dati che consiste in un insieme
rettangolare di numeri, dove in riga abbiamo i casi e in colonna le variabili; in ogni cella derivante
dallincrocio tra una riga e una colonna abbiamo un dato, cio il valore assunto da una particolare variabile
su un particolare caso. Per potere essere organizzate in una matrice, le informazioni devono avere due
caratteristiche: lunit danalisi deve essere sempre la stessa (ovvero per es. trattare di informazioni raccolte
tutti su individui oppure tutti su comuni , famiglie etc) e su tutti i casi studiati devono essere rilevate le
stesse informazioni.

Loperazione di traduzione del materiale empirico grezzo (il pacco di questionari, la pila di documenti) in
matrice viene chiamata codifica ed avviene con due strumenti, il tracciato record (la posizione di ogni
variabile nella riga della matrice es. la variabile genere si trova nella colonna 4 della matrice) e il codice (che
assegna ad ogni modalit della variabile un valore numerico es. nella variabile genere si assegna il valore 1
ad un maschio 2 ad una femmina).

Nella pratica di ricerca spesso tracciato record e codice sono inseriti allinterno del questionario.
Ogni riga della matrice corrisponde ad un caso un individuo/ un questionario - (leggendo ogni riga
possiamo ottenere il profilo di un caso), mentre ogni colonna corrisponde ad una variabile (leggendo una
colonna conosciamo le risposte date a quella domanda da tutti gli intervistati).

Ogni singola riga della matrice , ovvero ogni singolo caso trasformato in dati, si chiama record.

La matrice dati memorizzata su supporto informatico si chiama files, limmissione dei dati si chiama data
entry.

Stampa pag 63-64-65 esempi e dettagli questionario

Distribuzione di frequenza

Distribuzioni assolute e relative

47
Una volta costruita la matricedati si deve analizzare, lanalisi verr condotta per variabili.

Per dare una rappresentazione sintetica di una colonna della matrice si usa la distribuzione di frequenza, di
una variabile una rappresentazione nella quale ad ogni valore della variabile viene associata la frequenza
con la quale esso si presenta nei dati analizzati.
Tale rappresentazione pu avvenire in forma tabellare, grafica o algebrica.
Ved pag 69
La distribuzione di frequenza pu essere assoluta, quando ci si limita semplicemente riportare accanto ad
ogni valore della variabile il numero dei casi che presentano quel valore ci siamo limitati a contare, - senza
alcun altro intervento oppure relativa, quando sono rapportate ad un totale comune.

Es. se vogliamo confrontare la distribuzione di frequenza della variabile titolo di studio nel gruppo studiato
con la distribuzione della stessa variabile in un altro gruppo, di diversa numerosit, non possiamo effettuare
direttamente il confronto.
Se il secondo gruppo costituito da 500 persone ed il primo 1200 per poter effettuare il confronto al fine di
sapere se il secondo gruppo presenta livelli di istruzione diversi dal primo dobbiamo riferire le situazioni ad
un totale comune, ovvero, dobbiamo relativizzarle ad un totale comune , queste nuove frequenze sono le f.
relative.

Un modo per operare questa relativizzazione la proporzione, che consiste nel dividere ogni singola
frequenza assoluta per il numero totale di casi della distribuzione;
Es. le persone senza titolo di studio sono 30 su 1200, la frequenza relativa 30/1200=0.025.
Con questa pratica si relativizzano le frequenze ad un totale pari allunit la somma delle proporzioni di
tutte le classi d come totale 1.
Il modo pi consueto di relativizzare una distribuzione di frequenza quello di relativizzarle ad un totale pari
a 100. Sono queste le percentuali, che si ottiene dalle proporzioni moltiplicandole per 100.
Es: 30*100 / 1.200 = 2.5
Il fatto di relativizzare le frequenze permette di effettuare dei confronti fra distribuzioni di frequenza della
stessa variabile ma ottenute da popolazioni di diversa numerosit.
Una forma particolare di distribuzione di frequenza costituita dalla distribuzione cumulativa di frequenza,
nella quale in corrispondenza di ogni valore dalla variabile viene riportata non la sua frequenza ma la somma
delle frequenze corrispondenti a quel valore e a tutti quelli inferiori.
Es. si sommeranno i valori delle frequenze relative proporzioni e percentuali anche degli stati inferiori.
Es. licenza elementare

Tutto ci illustrato accade per le variabili ordinali e nomilali.


Se le variabili da sintetizzare sono cardinali, si tende a raggrupparli in classi (raggruppando i valori
adiacenti), perch spesso sono in numero elevato e altrimenti si otterrebbe una distribuzione troppo
dispersa.
Vedi pag 72-73

La presentazione delle tabelle

Distribuzione di frequenza in forma compatta


Abbiamo parlato di distribuzioni di frequenza assolute e relative, tuttavia nella maggior parte dei casi il
ricercatore si limiter a presentare un solo tipo di distribuzione di frequenza. il ricercatore deve attenersi al
massimo della parsimoniosit nella presentazione dei suoi dati per non confondere il lettore, per cui si
limiter a presentare nelle tabelle solo i numeri essenziali , evitando ogni ridondanza. Egli presenter solo le
frequenze percentuali accompagnate dallindicazione della base del calcolo delle percentuali, cio del totale
in valore assoluto (indicato dalla lettera N).
Ved pag 74
Il fatto di riportare alla base della colonna delle percentuali il numero N di casi sui quali le percentuali sono
state calcolate ha due finalit: comunicare al lettore la rilevanza numerica dei dati esaminati, il valore N
permette di risalire alle frequenze assolute.

Cifre decimali: di solito le percentuali si riportano con una cifra decimale oppure senza decimali se la base
delle percentuali minore di 100; questo perch sappiamo che esiste sempre un errore che pu essere di
diversi punti.
48
Arrotondamenti: se il decimale da eliminare si colloca tra 0 e 4, si arrotonda per difetto, se si colloca tra 0 e
5 si arrotonda per eccesso.
Il decimale zero: se si decide di riportare i decimali deve essere presente anche lo zero (es. 22,0%) poich
lo zero ha valore e dignit come gli altri numeri.

Quadratura: a causa degli arrotondamenti pu succedere che la somma delle percentuali sia diversa da 100;
in questo caso opportuno, per una pura questione di eleganza, alterare lievemente le cifre per avere delle
percentuali la cui somma sia 100.

Pulizia dei dati e preparazione del file di lavoro


Prima di iniziare lanalisi dei dati, sulla matrice degli stessi va condotta unoperazione di pulizia e di controllo ,
al fine di identificare gli eventuali errori di raccolta o di codifica delle informazioni.

Controlli di plausibilit: si tratta di controllare che tutti i valori delle variabili siano plausibili, appartengano
cio al ventagli di valori previsti dal codice.

Es. pag 77
Il codice della variabile prevede dei valori da 1 a 7, alcuni intervistati erroneamente indicano il valore 8 che
non presente.

Controlli di congruenza: si possono confrontare le distribuzioni di due variabili per far emergere eventuali
incongruenze tra le variabili stesse.
Es. se appaiono 512 occupati e poi nella domanda sul tipo di lavoro effettuato rispondono in 550 evidente
che hanno risposto alla domanda anche persone non occupate (possibilmente pensionati che si riferiscono al
loro lavoro). In questo caso per correggere lerrore o si risale alle informazioni originarie per individuare il
valore corretto da riportare nella matrice-dati oppure si sostituisce il valore implausibile con il valore
corrispondente a dato mancante.

Valori mancanti (missing values): ad un certo caso in una certa variabile viene assegnato valore mancante
se quel caso privo di informazioni su quella variabile. Es. se la rilevazione stata effettuata mediante
questionario si tratta dei soggetti che non hanno risposto a quella particolare domanda.

Esistono quattro casi di valore mancante:

- non sa : il soggetto non sa ripondere

- non applicabile: il soggetto non deve rispondere, la domanda non deve essergli posta. Es domanda sui
figli a chi non ha figli

- non risponde: il soggetto si rifiuta di rispondere

- valore implausibile: non previsto dal codice

I veri casi di situazioni di valore mancante sono gli ultimi due.


Per non escludere questi valori dalle analisi, ci comporterebbe una perdita di informazioni, di solito si tende
ad esporre i non risponde nellanalisi monovariata (ci permetter al lettore di rendersi conto della rilevanza
delle mancate risposte) e ad escluderli nellanalisi a pi variabili. Ponderazione.
Analisi monovariata

Lanalisi monovariata unanalisi puramente descrittiva dei fenomeni studiati, che si limita ad esporre come
ogni variabile distribuita fra i casi rilevati, senza porsi problemi sulle relazioni tra le variabili.
Es. ci dice che nel campione ci sono un tot di praticanti regolarmente ma non ci dice ancora se vanno a
messa di pi i giovani o gli anziani, uomini o donne etc.

49
Il ricercatore non si ferma mai ad essa poich il suo obiettivo quello di studiare le relazioni e le reciproche
influenze tra le variabili.
Essa rappresenta un passaggio inevitabile e necessario di ogni analisi bivariata e multivariata, perch solo
con questa analisi il ricercatore perviene a quella conoscenza diretta dei dati che gli permetter di analizzarli
con piena consapevolezza. Essa inoltre rappresenta una prima descrizione dei fenomeni analizzati e
contribuisce alla comprensione della struttura del campione e della sua rappresentativit.

Misure di tendenza centrale


La distribuzione di frequenza come la variabile distribuita nella popolazione.
E anche una descrizione minuziosa .es se la variabile let essa ci dice quante persone hanno 18.20 etc
anni.
In molte situazioni abbiamo bisogno di indici di sintesi della distribuzione. Questi indici si esprimono nella
forma di numeri e si chiamano valori caratteristici della distribuzione di frequenza.

Di tutte le caratteristiche di una distribuzione di frequenza ,le pi importanti sono due:


la sua tendenza centrale e la sua variabilit.
Le misure di tendenza centrale ci dicono qual , in una distribuzione di frequenza, quello che pu essere
considerato i baricentro dei suoi valori, ovvero il valore che meglio di qualsiasi altro esprime la distribuzione
quando si decidesse di sintetizzarla in un unico numero.

Le misure di tendenza sono:

Variabili nominali: la moda. Se la variabile nominale, lunica misura di tendenza centrale calcolabile la
moda. La moda la modalit di una variabile che si presenta nella distribuzione con maggior frequenza.
Individuare la moda corrisponde alloperazione che istintivamente facciamo quando, nel presentare i risultati
di una certa domanda, diciamo che la maggioranza ha risposto in un cero modo.
E lunico valore che possiamo cogliere poich non possiamo effettuare operazioni sui valori della variabile
nominale.

Variabili ordinali: la mediana. Nel caso delle variabili ordinali, oltre alla moda, poich i casi sono ordinabili,
si pu calcolare la mediana. Immaginiamo di ordinare , sulla base di una variabile ordinale, tutti i casi di una
distribuzione: se i casi sono 7 si tratter del 4 caso e cos via. La modalit assunta dalla variabile su questo
caso la mediana di distribuzione.
La mediana di una variabile dunque la modalit del caso che occupa il posto di mezzo nella distribuzione
ordinata dei casi secondo quella variabile.

Variabili cardinali: la media aritmetica. La media aritmetica la misura di tendenza centrale pi nota e
comune, ed data dalla somma dei valori assunti dalla variabile su tutti i casi divisa per il numero dei casi.
Se nella distribuzione di frequenza i dati sono raggruppati in classi, per il calcolo della media si assume il
valore centrale della classe.

La media si pu calcolare solo se la variabile cardinale, in quanto richiede operazioni che possono essere
effettuate solo se i valori hanno pieno significato numerico. (non si pu calcolare la religione media di ogni
nazione).

Tuttavia ci sono dei casi in cui preferibile usare la mediana anche nel caso di variabili cardinali, tipicamente
quando si desidera una misura meno sensibile ai casi estremi (come il reddito medio della popolazione in cui
se si utilizzasse la media potrebbero darsi situazioni di valori artificiosamente alzati per effetto di un numero
assai limitato di poche persone ricchissime.)

Se la distribuzione della variabile simmetrica attorno ad un valore centrale , moda, meridiana e media
coincidono.
In generale esse non coincidono e conviene utilizzare la media in quanto pi informativa ovvero sfrutta
tutte le informazioni che possediamo.

50
Misure di variabilit
La misura di variabilit o dispersione il secondo valore caratteristico di una distribuzione di frequenza e ci
dice, con un unico numero, quanto i valori sono addensati attorno al valore centrale oppure quanto sono
dispersi attorno ad esso.

Le misure di variabilit sono:

Variabili nominali: indici di omogeneit/eterogeneit. Una variabile nominale ha una distribuzione


massimamente omogenea quando tutti i casi si presentano con la stessa modalit (es. nel caso della
variabile religione il 100% delle persone cattolica); viceversa massimamente eterogenea quando i casi
sono equidistribuiti tra le modalit. (es. se la religione ha cinque modalit e noi abbiamo il 20% di casi di
ciascuna di esse).
Una distribuzione tanto pi omogenea quanto pi essa concentrata su una o poche modalit o in altri
termini quanto maggiore lo squilibrio fra le modalit (si parla anche di indici di concentrazione ,
squilibrio/equilibrio).
La statistica descrittiva propone numerosi indici di omogeneit/eterogeneit della distribuzione di una
variabile nominale, il pi semplice ed intuitivo indice di omogeneit ( assoluta) dato dalla somma dei
quadrati delle proporzioni (cio delle frequenze relativizzate al totale 1). Lindice di omogeneit relativa
invece neutralizza linfluenza del numero delle modalit.

Variabili ordinali: la differenza interquartile. La mediana ha la propriet di dividere la distribuzione ordinata


di una variabile in due parti uguali, met dei casi con valore inferiore, met superiore. Se dividiamo i casi
della distribuzione non in 2 ma in 4 parti di eguale numerosit, i valori che segnano i confini fra i quattro
quarti sono detti quartili. Il primo quartile quel valore che ha sotto di se il 25% e sopra il 75%, il secondo
coincide con la mediana, il terzo quello che ha il 75% sotto ed il 25% sopra.
I quartili sono i valori che segnano i confini tra i quattro quarti di una distribuzione ordinata divisa in quattro
parti di eguale numerosit.
Essi come la mediana sono valori di posizione poich non derivano da operazioni sui valori ma dalla
posizione dei casi.
La differenza interquartile la differenza tra il terzo ed il primo quartile;essa pu essere utilizzata come
indice della dispersione della variabile e si usa per eliminare il 25% dei valori pi alti e il 25% dei valori pi
bassi. Questa differenza si usa anche per le variabili cardinali.

Variabili cardinali:

Se la variabile standard, disponiamo di diversi modi per calcolare la variabilit della distribuzione.
Scostamento semplice medio: e costituito dalla media aritmetica degli scarti di ogni singolo valore della
media. gli scarti vanno considerati non in valore algebrico negativi e positivi ma in valore assoluto
tutti positivi trasformando i valori in positivi. Sommando i valori assoluti degli scarti dalla media e dividendoli
per il numero dei casi, otteniamo un valore chiamato scostamento semplice medio. E poco adoperato, si
predilige il successivo.

La deviazione standard (o scarto quadratico medio). Consideriamo ancora gli scarti dei singoli valori della
media. Per annullare il loro segno, invece di prenderli in valore assoluto, possiamo elevarli al quadrato (il
quadrato di un numero negativo positivo.)
Si sommano tutti questi scarti al quadrato, si dividono per il numero dei casi e poi si estrae la radice
quadrata di questo numero.
Otteniamo cos la deviazione standard detta scarto quadratico medio.

Varianza il quadrato della deviazione standard la varianza della distribuzione. Essa costituisce loggetto
primario di tutta lanalisi dei dati poich esprime la variabilit di una variabile

Coefficiente di variazione la deviazione standard risente della grandezza della media della variabile.
Se si vogliono confrontare tra di loro le variabilit di distribuzioni aventi medie fortemente diverse, conviene
utilizzare un indice di variabilit che tenga conto del valore della media. Otteniamo cos il coefficiente di
variazione che si ottiene dividendo la deviazione standard per la media.
51
Rappresentazioni grafiche della distribuzione di frequenza vedi p, 106 e ss

Le distribuzioni di frequenza oltre che in maniera tabellare possono essere rappresentate anche in forma
grafica .I grafici non forniscono informazioni aggiuntive rispetto alla forma tabellare ma sono di grande
efficacia comunicativa.

Rappresentazioni grafiche di distribuzione di frequenza di variabili nominali

Diagrammi a barre (o ortogramma): poich una distribuzione di una frequenza unassociazione fra i
valori di una variabile e le corrispondenti frequenze, il modo pi semplice di rappresentarla graficamente
consiste nel riportarla su un piano cartesiano, disponendo su un asse i valori della variabile e sullaltro le
corrispondenti frequenze. Il diagramma pu essere a colonne (raffigurazione si amplia in orizzontale) a nastri
(in verticale).
Le barre devono essere separate tra loro ed equidistanti.
Le modalit saranno disposte secondo un ordine arbitrario quello cio che il ricercatore ritiene pi utile per
lillustrazione del problema.
Se la variabile ordinale le modalit saranno allineate secondo il loro ordine.
Diagrammi a barre appaiate e contrapposte.

Diagrammi in composizione: rappresentazione della distribuzione di frequenza suddividendo larea di una


figura geometrica in parti proporzionali alle varie frequenze.
Si rappresenta lintero fenomeno nelle parti che lo compongono.
Le frequenze vengono rappresentate da aree proporzionali e partiamo di aerogrammi.

Diagramma a barre suddivise: la figura costituita da una colonna rettangolare divisa in fasce di altezza
proporzionale alle frequenze delle varie categorie. E comoda quando si vogliono confrontare fra di loro le
composizioni di due o pi gruppi.

Diagramma a settori circolari o a torta: consiste in un cerchio con settori circolari proporzionali alle
frequenze

Rappresentazioni grafiche di distribuzione di frequenza di variabili cardinali

Istogramma: se la variabile cardinale e divisa in classi possiamo rappresentare la sua distribuzione di


frequenza su un piano cartesiano, collocando su un asse la variabile e sullaltro la frequenza innalzando dei
rettangolo di area area, non altezza proporzionale alle preferenze, ottenendo un istogramma.
simile al diagramma a barre ma la differenza fondamentale consiste nel fatto che sullasse della variabile
non abbiamo una serie di categorie arbitrariamente collocate e separate in maniera discreta luna accanto
allaltra ma una variabile continua anche se suddivisa in classi.

Se la variabile stata raggruppata in classi di uguale ampiezza il risultato sar simile a quello visto per il
grafico a barre.

Se stata raggruppata per classi di diversa ampiezza larea dei rettangoli deve essere proporzionale alla
frequenza poich le basi dei rettangoli sono diverse occorrer costruire dei rettangolo aventi altezza
proporzionale al rapporto fra frequenza ed ampiezza della classe (questo rapporto si chiama densit di
frequenza).
Un istogramma molto adoperato in demografia costituito dalla piramide di et, la presentazione
contrapposta degli istogrammi delle distribuzioni per et dei maschi e delle femmine in una determinata
popolazione.

Poligono di frequenza: se in un istogramma congiungiamo con dei segmenti i punti medi dei lati superiori
dei rettangoli, otteniamo una linea spezzata che chiamiamo poligono di frequenza.

52
Man mano che le classi di una variabile cardinale diventano pi numerose (e diminuiscono di ampiezza)la
spezzata (del poligono di frequenza)si approssima sempre di pi ad una curva continua, diventando tale
quando la variabile non pi raggruppata in classi ma riportata in ascissa nella sua formula continuativa.
La curva cos ottenuta detta curva di frequenza.
Ogiva: curva che viene rappresentata attraverso delle linee spezzate.

Problemi tecnici relativi alla costruzione dei grafici:


nei grafici ogni variazione della scala di riferimento degli assi comporta una variazione nella percezione visiva
del fenomeno: cambiando scala si pu enfatizzare una differenza minima cos come attenuare una variazione
rilevante.
Questa soggettivit il limite maggiore.
Conviene sempre partire da zero, nel caso in cui questo non fosse conveniente in quanto si appiattirebbero
troppo le differenze essendo tutti i valori lontani da zero, si pu partire dallo zero e introdurre sullasse delle
frequenze un segno di interruzione rappresentato da una Z sullasse.
Analogamente nei diagrammi a barre se una barra fuori scala rispetto alle altre si introduce nel disegno un
segno di discontinuit, una sorta di frattura, per far vedere che la barra non stata riportata per vincoli di
spazio.

Altra questione riguarda la completezza delle informazioni, non possiamo mettere nel grafico tutti i numeri
della tabella , si deve cercare di introdurre i valori o nel grafico stesso o in calce.

Classificazioni, tipologie e tassonomie

La classificazione quel processo secondo il quale i casi studiati vengono raggruppati in sottoinsiemi
(classi) sulla base di loro similarit.
Le classi devono essere esaustive (tutti i casi devono trovare collocazione in una classe nessuno escluso) e
mutualmente esclusive (un caso pu appartenere ad una sola classe).
Questo processo pu essere condotto sulla base della somiglianza dei casi su una sola variabile,
classificazione unidimensionale, o su pi variabili, classificazione multi dimensionale.

Classificazione unidimensionale: aggregazione delle modalit in classi

La classificazione pi semplice quella in cui i casi sono classificati per la somiglianza relativamente ad una
sola variabile.
Es. gli individui possono essere classificati a seconda del partito votato, le regioni a seconda del tasso di
occupazione, le famiglie a seconda del numero dei figli.
In questi termini la determinazione delle classi corrisponde con quella delle modalit delle variabili.

Tuttavia, nel caso delle variabili nominali, in fase di analisi dei dati talvolta necessario aggregare alcune
modalit dal significato affine per poter procedere allanalisi bivariata.
Es. nellambito della variabile pratica religiosa, nella modalit pi volte a settimana un numero di casi
esiguo per cui si render necessario unirli a modalit pi prossime come pu essere la modalit una volta a
settimana
Questo processo spesso costringe il ricercatore a scelte insoddisfacenti e sforzate a causa della difficolt di
aggregare variabili troppo diverse tra loro; di solito quindi nellanalisi bivariata si tende a scartare le
componenti troppo esigue e non aggregabili.

Nel caso delle variabili cardinali (vale in linea di massima anche per le ordinali)il problema dellaggregazione
pi semplice, basta raggruppare le modalit in classi di maggiore ampiezza.
Non si pone il problema della prossimit di significato delle modalit da aggregare poich le classi contigue
hanno per definizione significati affini, trattandosi di modalit collocate con un continuum sottostante.

Esistono tre criteri di aggregazione: il primo puramente aritmetico e consiste nel raggruppare i valori
della variabile in intervalli di uguale ampiezza (es si pu aggregare la variabile et in intervalli di 5 o 10 anni
oppure i reddito di famiglie in intervalli di 10 milioni); il secondo nel raggruppare i valori assumendo a
riferimento il loro significato (let del figlio potrebbe essere aggregata sulla base della scansione scolastica:

53
0-2 anni asilo, 3-5 scuola materna; il reddito in base alle aliquote fiscali); il terzo si basa sulla configurazione
della distribuzione di frequenza, prendendo come soglia di divisione i quantili.

Nella pratica della ricerca empirica il criterio di aggregazione pi adoperato una combinazione del secondo
e del terzo,aggregare modalit dal significato affine facendosi guidare dalla numerosit dei gruppi.

Classificazione multidimensionale: tipologie e tassonomie

Le classificazioni multidimensionale (sulla base di pi variabili es. gli individui possono essere classificati sulla
base del reddito e del titolo di studio) si possono dividere in tassonomie e tipologie.

La tassonomia una classificazione nella quale le variabili che la definiscono sono considerate in
successione, in una struttura gerarchica che procede per variabili di generalit decrescente.
Es. tassonomia dei mammiferi che sono una classe di vertebrati, a loro volta sono una classe dei cordati.
Lo schema che nasce ad albero.

La tipologia pi usata invece una classificazione nella quale le variabili che la definiscono sono considerate
simultaneamente. ( es precedente in cui la classificazione una considerazione congiunta di professione,
reddito e genere). Le classi di una tipologia sono dette tipi. Un tipo un concetto il cui significato si colloca
allintersezione dei significati delle modalit delle variabili che costituiscono la tipologia e quindi il suo
significato superiore alla semplice combinazione dei significati delle due variabili.
Il numero dei tipi pari al numero do combinazioni fra le modalit delle variabili, cio pari al prodotto del
loro numero di modalit.
Es. se il titolo di studio a 4 modalit elementari, medie, diploma, laurea il reddito ne ha tre alto, medio,
basso il genere due, la tipologia determinata dalle tre variabili ha 4*3*2=24 tipi
La tipologia ha uno scopo euristico, cio non solo una mera classificazione, ma ha finalit di
interpretazione e spiegazione; un punto cruciale nel collegamento tra dato empirico e teoria.

Es
Orientamento Rapporto emotivo
pedagogico
Caldo Freddo
Permissivo 1 indulgente 2 ansioso
nevrotico
restrittivo 2 iperprotettivo 4 autoritario

Quando ci sono in gioco pi variabili, il numero dei tipi risulta molto elevato (perch esso dato dal prodotto
delle numero delle modalit che formano le variabili), quindi necessario procedere ad una riduzione del
loro numero mediante unificazione di alcuni tipi in un unico tipo (riduzione dello spazio degli attributi).
Che pu avvenire prima della formazione della tipologia stessa riducendo le modalit delle variabili che
definiscono la tipologia, attraverso la fusione in un unico tipo dei tipi con significato affine, aggregazione a
tipi confinanti dei tipi con numero di casi esiguo.

Trasformazioni delle variabili


Nel corso dellanalisi statistica le variabili possono essere trasformate per facilitarne lanalisi stessa.

La standardizzazione delle variabili


La standardizzazione delle variabili consiste nella trasformazione del valore originario in un valore standard
che non risenta della unit di misura della variabile e della dispersione della distribuzione. La
standardizzazione consiste nellottenere una nuova variabile sottraendo a quella originaria la media della
distribuzione e dividendo questa differenza per la deviazione standard della distribuzione. La nuova variabile
ha quindi media = 0 e deviazione standard = 1. In questo modo le variabili standardizzate sono tra loro
perfettamente confrontabili avendo eliminato le differenze di scala e di dispersione. La standardizzazione
consente di anche di confrontare variabili provenienti da diverse distribuzioni.

54
La costruzione di indici

Un indice una variabile funzione di altre variabili, che sintetizza le informazioni contenute nelle singole
variabili operativizzando un concetto complesso del quale le singole variabili sono espressioni parziali.
Gli indici si possono costruire in diversi modi, ad esempio lindice additivo quello ottenuto sommando i
punteggi delle singole variabili.
Esistono anche altri indici ottenuti attraverso procedure pi complesse, con punteggi diversi a domande
diverse e anche con punteggi negativi. Le operazioni attraverso le quali si costituiscono le nuove variabili
(indici) possono essere di tipo algebrico o di tipo logico.
Spesso alle spalle di questa differenza ci sono diversi tipi di variabile: ad esempio sulle variabili nominali non
possibile effettuare operazioni algebriche.

Dati aggregati
Dati individuali e dati aggregati

I dati individuali sono quelli che hanno in comune lunit di analisi individuo, i dati aggregati sono quelli che
si riferiscono ad aggregati territoriali di individui. Comuni, province, regioni.

Normalmente i dati aggregati non possono essere utilizzati in forma grezza ma vengono trasformati in
rapporti statistici che hanno lo scopo di uniformare fra di loro i dati di modo che non risentano pi della
dimensione del territorio al quale si riferiscono.

Se consideriamo una variabile nominale riferita ad un livello individuale, notiamo che quando lunit di analisi
un aggregato di individui questa variabile d luogo a tante variabili cardinali quante sono le sue modalit.

Quindi quando lunit di analisi un aggregato, la variabile nella grande maggioranza dei casi cardinale.
Naturalmente la variabile cos ottenuta deve essere messa in rapporto con la dimensione della popolazione.
Es. se la variabile individuale titolo di studio con le 4 modalit noi possiamo contare per es nella regione
lombardia quante sono le persone per ogni modalit.

Serie temporali e serie territoriali: numeri indice


Due forme nelle quali i dati aggregati vengono utilizzati.

Serie temporali e territoriali ved p 143


La serie temporale (o serie storica) la sequenza dei valori assunti da una variabile nello stesso aggregato
territoriale in tempi diversi; la serie territoriale la sequenza dei valori assunti da una variabile nello stesso
momento in diversi aggregati territoriali.

Pur non essendo distribuzioni di frequenza (non ci dicono come si distribuisce un totale fra i valori di una
variabile ma ci dicono quali valori assume quella variabile nel tempo e nello spazio), a queste serie
possibile applicare molte delle operazioni che si applicano alle distribuzioni di frequenza (tendenza centrale,
variabilit, ecc.); di esse si possono dare anche rappresentazioni grafiche.

Una rappresentazione grafica molto efficace per le serie territoriali il cartogramma, che raffigura la
distribuzione geografica del fenomeno studiato,
nel caso della serie storica si utilizza un piano cartesiano dove si colloca sullasse orizzontale la variabile
tempo e sullasse verticale la variabile in esame.

Lo studio della variazione: i numeri indice


Problemi particolari sono posti dallo studio della variazione di un determinato fenomeno. Di fronte ad una
differenza tra due misure ci si chiede come poter valutare le variazioni di un fenomeno rilevato in situazioni
tempo e spazio diverse.
Es. lincremento di 50 morti per droga in Italia fra il 1985 ed il 1986 da considerarsi una variazione
rilevante o modesta?e la differenza tra il tasso di suicidio tra Lombardia e Piemonte come da valutarsi?

55
Differenza assoluta e relativa: la differenza assoluta tra due grandezze omogenee ha un significato diverso
a seconda dellentit delle grandezze stesse.
Es. la differenza di due anni fra un bambino di 2 ed uno di 4 una differenza rilevante mentre due persone
di 60 e 62 anni possono essere considerate coetanee.
Esempi simili possono essere fatti anche su valori percentuali.
Se indichiamo con a e b le due grandezze possiamo calcolare fra di loro la variazione assoluta e relativa.
la variazione relativa tra le due grandezze, dobbiamo fare la differenza tra le due e successivamente dividere
per quella che si assume per riferimento.

Es. variazione numero di morti per droga dai 242 del 1985 ai 292 del 1986 pu essere cos espresso
Assoluta: b-a = 292-242 = + 50
Relativa: ( b a/a) *100 = (50/242)*100 = 20.7

Naturalmente la variazione relativa risente fortemente della base di partenza, sempre necessari controllare
il dato iniziale.

Quando le misure sono valori percentuali bisogna distinguere se si parla di variazioni di punti percentuali
variazione assoluta tra punti percentuali e per cento alla variazione relativa rapporto fra percentuali.

Numeri indice: il numero indice una proporzione che serve a mettere in luce le variazioni di una serie
temporale o territoriale rispetto ad un tempo o a un luogo assunti come base di riferimento.
Es. il numero indice permette di rispondere alla domanda.
Se ponessimo eguale a 100 i morti per droga del 1985, a quando ammonterebbero nel 1986?
Si tratta di fare una proporzione.
242:100=292:x
X: 292/242 *100 =120.7
Il numero di morti per droga passato da 100 a 120.7.
Per calcolare il numero indice si divide la frequenza in esame per quella assunta come base e si moltiplica
per 100.
Esso non dipende dallunit di misura o di conto in cui espresso, essi sono cio numeri puri, e permettono
quindi di fare confronti con variabili pi disparate.

LANALISI BIVARIATA
E la relazione tra due variabili distinguendo se sono nominali o cardinai.

Relazioni tra variabili


Affermare che c una relazione tra due o pi variabili significa dire che c una variazione concomitante tra i
loro valori (una covariazione) es. al variare del titolo di studio varia il reddito.

Si tratta di relazioni statistiche, ovvero probabilistiche, se affermiamo che c relazione fra titolo di studio e
reddito ovvero che al crescere di uno cresce anche laltro, questa affermazione vale a livello medio,
mediamente nei casi studiati stato riscontrato questo nesso. Ci non toglie che fra i nostri dati possano
anche essere presenti soggetti con la terza elementare che guadagnino pi di un laureato ma in generale
pi probabile il primo caso.

La statistica ci pu dire solo che esiste una relazione fra due variabili ma non ci pu dire se esiste
effettivamente una relazione causale tra le variabili esaminate (covariazione non significa causazione). Sar
il ricercatore a conferire a tale relazione il significato di nesso causale, sulla base di una teoria preesistente
che non ha alcun legame con lanalisi statistica.

Esamineremo solo lanalisi bivariata, in cui vengono considerate solo le relazioni tra due variabili, dette
rispettivamente dipendente e indipendente in quanto il ricercatore di solito interpreta le relazioni in termini
di nessi causali.
Le tecniche di analisi bivariata dipendono in maniera determinante del tipo di variabili considerate.
Se diconomizziamo le variabili abbiamo 4 variazioni:
56
Variabile
indipendente
Nominale Cardinale
Variabile nominale Tavole di /
dipendente contingenza
Cardinale Analisi della Regressione e
varianza correlazione

Se entrambe le variabili sono nominali, la tecnica usata sar quella delle tavole di contingenza; se
entrambe le variabili sono cardinali la tecnica sar quella della regressione-correlazione; se la variabile
indipendente nominale e quella dipendente cardinale si user la tecnica dell analisi della varianza.

Tavole di contingenza

Direzione delle percentuali (percentuali di riga e percentuali di colonna) ved pag 165
La tavola di contingenza consiste in una tabella a doppia entrata in cui collocata in riga una variabile
(variabile di riga) e laltra in colonna (variabile di colonna), mentre nelle celle definite dallincrocio fra le
righe e le colonne troviamo il numero di casi che presentano le corrispondenti modalit delle due variabili
(frequenza).

Es. si voglia studiare la relazione fra la variabile et e la variabile pratica religiosa a partire dai dati ottenuti
da uninchiesta campionaria.
Variabile riga: prativa religiosa
Variabile colonna : et
Celle: numero di casi che presentano le corrispondenti modalit delle due variabili (frequenze)

Lordine di una tavola di contingenza il prodotto delle righe per le colonne, mentre la
dimensione il numero di variabili in essa implicate.

Lanalisi bivariata tratta quindi solo tabelle bidimensionali.

Partendo da una tabella con valori assoluti (essa riporta il numero di casi aventi un certo valore sulla
variabile di colonna e sulla variabile di riga) possibile ricavare tre diversi tipi di percentualizzazione
ottenendo tre diverse tabelle percentuali:

le percentuali di riga (che si ottiene ponendo uguale a 100 la variabile di colonna e registrando quindi i
corrispondenti valori percentuali della variabile di riga), - abbiamo portato a 100 tutte le voci della prima
tabella, praticanti, saltuari, cos su 100 praticanti abbiamo rilevato che il 31% sono adulti , il 45% anziani

le percentuali di colonna (che si ottiene ponendo uguale a 100 la variabile di riga e registrando quindi i
corrispondenti valori percentuali della variabile di colonna) portando a 100 le persone per ogni fascia di et
abbiamo visto quanti in percentuale di questi sono praticanti, saltuari etc.

le percentuali sul totale (che si ottengono percentualizzando tutte le frequenze di cella sul totale
generale). Se la tabella stata costruita per analizzare la relazione tra le due variabili questultima
percentualizzazione inutile. su 100 sappiamo quanti sono praticanti e giovani, saltuari e giovani e cos
via

Lo scopo della percentuale infatti quello di pareggiare basi diverse.


La scelta della percentuale sbagliata invece di pareggiare pu portare ad evidenziare le differenze della
popolazione.

necessario che il ricercatore ponga molta attenzione nella scelta delle percentuali.
Agli effetti dellanalisi della relazione fra due variabili nominali una corretta mentre laltra errata.

57
Un criterio che ci pu aiutare nella scelta il seguente:

- si sceglie la percentuale di colonna quando si vuole analizzare linfluenza che la variabile posta in
colonna ha su quella posta in riga

- si sceglie la percentuale di riga quando si vuole analizzare linfluenza che la variabile poste in riga ha su
quella posta in colonna

in altri termini, si definisce qual la variabile indipendente e si percentualizza allinterno delle sue modalit.
La lettura dei dati a questo punto avverr attraverso le colonne (righe se abbiamo percentualizzato esse) di
percentuali.

Talvolta, quando gli obiettivi sono diversi dallobiettivo appena esaminato di studiare la relazione causale
esistente fra variabile indipendente o dipendente, pu essere utile calcolare invece laltra percentualizzazione
oppure calcolarle entrambe.

Es. lobiettivo quello di analizzare la composizione di chi va a messa tutte le domeniche , vogliamo sapere
su 100 praticanti quanti sono anziani, giovani senza porci il problema di sapere se gli anziani praticano pi
dei giovani.
In questo caso adopereremo le percentuali di colonna.
Cos otteniamo quello che possiamo chiamare un profilo per et dei praticanti.

La tecnica per la sua apparente semplicit , viene in genere trascurata nei manuali di statistica, di fatto si
tratta di una semplicit solo apparente e per questo ingannevole che induce facilmente ad errori sia di analisi
che di interpretazione.

Presentazione delle tavole

Gli elementi caratterizzanti di una buona presentazione delle tavole sono cinque.
Parsimoniosit: la tabella deve riportare solo le percentuali che servono allanalisi (es. solo quelle di riga).

Totali: ogni riga o colonna finisce con il totale 100 per far capire immediatamente al lettore in che direzione
sono state calcolate le percentuali.

Basi delle percentuali: sotto al totale deve essere sempre riportata la base percentuale, cio il numero
assoluto di casi sui quali stata operata la percentualizzazione.

Cifre decimali, decimale zero, arrotondamenti, quadratura: valgono le considerazioni gi sviluppate


riguardo alla presentazione delle distribuzioni di frequenza.

Intestazione: le tabelle devono sempre essere intestate per poter essere auto esplicative e contenere le
informazioni per la sua comprensione.

Somme di percentuali: la somma di percentuali legittima se i valori sommati appartengono alla stessa
Distribuzione percentuale , ma errata se le percentuali sommate appartengono a due diverse distribuzioni.

Interpretazione delle tavole

Nellinterpretazione e commento delle tabelle si suggerisce di selezionare le modalit pi significative della


variabile dipendente e centrare su queste lanalisi; inoltre preferibile trascurare differenze percentuali
esigue (inferiori ai 5 punti percentuali).
Per fare un commento efficace si prende una modalit significativa della variabile dipendente e si vede
come essa varia al variare della variabile indipendente.
La scelta della modalit da commentare sar effettuate dal ricercatore e dipender dalla linea argomentativa.

58
Es. nel caso della pratica religiosa egli sceglier a seconda delle convenienze di ragionare si praticanti o non
praticanti, certamente non sceglier mai di lavorare sui saltuari poich sono una categoria residua rispetto
agli altri due.
Nel caso di variabili ordinali la modalit scelta sar sempre una categoria estrema della variabile dipendente
(praticanti o non praticanti) e risulta utile aggregare le modalit estreme e contigue della variabile
dipendente per una maggiore chiarezza e per una maggiore pulizia del dato.

Un sistema spesso utilizzato per interpretare le tabelle consiste nell indice di differenza percentuale, cio
Nel calcolare la differenza tra due modalit di risposta o tra le risposte positive e negative; esso permette di
leggere i dati tenendo conto simultaneamente dellandamento di pi modalit della variabile dipendente.

Forma monotica: si ha quando al crescere di una variabile cresce anche laltra (al crescere della dimensione
del comune cresce e insoddisfazione) in questo caso positiva, mentre negativa se la vediamo allinverso
(al crescere della dimensione del comune diminuisce linsoddisfazione)

Presentazione compatta delle tavole


Spesso, per economizzare lo spazio o per facilitare il confronto tra domande aventi la stessa struttura, si
compattano pi tavole semplici a doppia entrata in ununica tavola, presentando ununica modalit. Si
possono incrociare diverse variabili dipendenti con la stessa variabile indipendente oppure viceversa.

Tavole di contingenza a pi di due variabili.


sono le tavole in cui sono presenti pi variabili

59