1) I PARADIGMI DI RIFERIMENTO
La parola paradigma ha unantica origine nella storia del pensiero filosofico, stata utilizzata da Platone
(nellaccezione si modello) e da Aristotele (esempio). In sociologia il suo uso molto inflazionato e resto
confuso da molteplici significati (sinonimo di teoria, articolazione interna di una teoria, scuola o corrente
di pensiero).
Il concetto di paradigma stato espresso nel 1962 da Thomas Kuhn nellopera La struttura della rivoluzioni
scientifiche. La riflessione di Kuhn ha per oggetto lo sviluppo storico delle scienze ed egli rifiuta la
concezione tradizionale della scienza come accumulazione progressiva e lineare di nuove acquisizioni,
affermando invece che in certi momenti (detti rivoluzionari) si interrompe il rapporto di continuit con il
passato e si inizia un nuovo corso,in modo non completamente razionale. Si tratta di un elemento arbitrario
composto di accidentalit storiche e personali sempre presente come elemento costitutivo nelle convinzioni
manifestate da una data comunit scientifica in un dato momento.
Secondo la tradizionale concezione cumulativa le singole invenzioni e scoperte si aggiungevano al corpo
conosciuto precedente, alla stregua dei mattoni che si sovrappongono nella costruzione di un edificio a pi
piani. Nei momenti rivoluzionari il processo di continuit con il passato si interrompe e si inizia una nuova
costruzione, viene fatto saltare in aria un vecchio palazzo di mattoni per fare spazio ad un edificio
strutturalmente diverso,
Il passaggio da una teoria a unaltra cos globale e ha tali conseguenze che Kuhn lo chiama rivoluzione
scientifica.
A seguito di queste rivoluzioni in una determinata disciplina si produce un cambiamento dei problemi da
proporre allindagine scientifica e dei criteri con cui si stabilisce cosa si considera come un problema
ammissibile e di seguito cambia anche la struttura concettuale Il paradigma - attraverso cui gli
scienziati guardano il mondo.
Il paradigma una prospettiva teorica che condivisa e riconosciuta dagli scienziati in una determinata
disciplina, fondata su acquisizioni precedenti della disciplina stessa ed opera indirizzando la ricerca
individuando e scegliendo i fatti rilevanti da studiare - formulando ipotesi entro le quali collocare la
spiegazione del fenomeno osservato individuando le tecniche di ricerca empiriche necessarie.
Senza un paradigma una scienza non ha orientamenti n criteri di scelta, perch tutti i criteri, i problemi e le
tecniche diventano ugualmente legittime. Il paradigma una guida e fornisce agli scienziati sia un modello
ma anche le indicazioni per costruirlo. Con il paradigma lo scienziato acquisisce contemporaneamente in una
mescolanza inestricabile, teorie, metodi e criteri. Il paradigma qualcosa di pi ampio e generale di una
teoria, una visione del mondo, una finestra mentale, una griglia di lettura che precede lelaborazione
teorica.
1
La scienza normale definita da Kuhn come quei periodi in cui esiste allinterno di una disciplina un
paradigma condiviso dalla comunit degli scienziati.
Ogni scienza matura possiede in ogni momento della sua storia un suo paradigma, esso rappresenta una
sorta di visione che orienta la comunit di scienziati indirizzando la loro ricerca.
Le scienze sociali non essendo scienze mature non hanno dei paradigmi.
Nella storia della sociologia ed in generale delle scienze sociali difficile individuare un paradigma
predominante, condiviso da tutti i sociologi.
Solo tra gli anni 40 e 50 ha prevalso il concetto di sistema e la teoria funzionalista di T. Parsons. Egli
rielabora il pensiero degli europei e crea una teoria basata sul sistema e sul consenso. A questo paradigma
viene contrapposto quello di Marx, basato sul conflitto sociale. In questo modo possiamo parlare di disciplina
multi paradigmatica ovvero una disciplina che contiene al suo interno pi paradigmi.
Positivismo e interpretativismo
Effettuando unanalisi storica possiamo individuare due paradigmi fondativi che hanno indirizzato la
ricerca sociale: il positivismo ( 2 versioni 800 Positivismo 900 Neopositivismo e Postpositivismo) e
linterpretativismo.
(nb: tra le funzioni di un paradigma c quella di definire i metodi e le tecniche di ricerca accettabili in una
disciplina)
La profonda differenza tra i due paradigmi emerge dalle risposte che essi danno alle domande principali a cui
si trova di fronte la scienza sociale: la realt (sociale) esiste ( ontologia)? conoscibile (epistemologia)?
Come pu essere conosciuta (metodologia)?
La Questione Ontologica (Ontologia: Quella parte della filosofia che studia lessere in quanto tale, dal greco
Ontos (essere, ente) e logos ( discorso, riflessione) la questione del che cosa, ci si chiede se il mondo dei
fatti sociali sia reale e oggettivo dotato d autonoma esistenza al di fuori della mente umana e
dellinterpretazione del soggetto. Ci si interroga se i fenomeni sociali siano cose in se stesse o
rappresentazioni di cose.
La questione Epistemologica (Epistemologia: riflessione sulla conoscenza scientifica , dal greco episteme
(conoscenza certa)) il rapporto tra il chi ed il che cosa, essa pone laccento tra lo studioso e la realt
studiata.
La questione Metodologica (Metodologia: dal greco metodo ( strada con cui, metodo). Questione
metodologica in quanto ha a che fare con i metodi della ricerca sociale, intesi come corpo organico di
teorie.) riguarda la strumentazione tecnica del processo conoscitivo
Positivismo
Il paradigma positivista (il primo ad essere utilizzato nelle scienze sociali) studia la realt sociale utilizzando
(quello che era allora il paradigma applicato alle scienze naturali )gli apparati concettuali, le tecniche di
osservazione e misurazione, gli strumenti di analisi matematica e i procedimenti di inferenza delle scienze
naturali. Esso infatti sosteneva che la realt sociale dovesse essere studiata con la stessa logica investigativa
le lo stesso metodo utilizzato dalle scienze sociali, da qui il nome di Fisica Sociale attribuito allo studio della
societ.
Il primo a tradurre la prospettiva teorica globale in termini di ricerca empirica fu Durkheim, per questo
diciamo che fu il primo scienziato sociale, il primo vero sociologo positivista.
La sua prassi empirica fondata sulla teoria del Fatto Sociale, essa impone di trattare i fatti sociali come
cose effettivamente esistenti al di fuori delle coscienze individuali e studiabili oggettivamente.
Essi hanno le medesime propriet delle cose del mondo naturale e come tali non sono soggette alla volont
delluomo e funzionano secondo proprie regole che possono essere studiate.
Lontologia del positivismo si basa sul Realismo Ingenuo: la realt sociale reale ed ha dunque un esistenza
effettiva ed conoscibile, come se si trattasse di una cosa.
2
Dal punto vista epistemologico, esso si basa sul dualismo tra lo studioso e loggetto di studio (che non si
influenzano a vicenda in nessun modo mantenendo una loro oggettivit),lo studioso analizza il fatto sociale
intenso come dato esterno ed immodificabile e presume di ottenere risultati veri e certi, il suo obiettivo
quello di spiegare e di formulare leggi naturali e generali immutabili poich si basano sulosservazione di
quelle che sono le categorie di causa effetto.
La metodologia positivista prevede quindi esperimenti e manipolazioni della realt, con osservazioni e
distacco tra losservatore e losservato; il suo modo di procedere prevalentemente induttivo (dal particolare
al generale-universale). Le tecniche utilizzate sono quantitative (esperimenti, statistica) e si utilizzano le
variabili.
Analisi per variabili.
Neopositivismo
Il neopositivismo nasce per rispondere alle critiche ed ai limiti che erano stati avanzati al positivismo.
Si ha un rifiuto delle questioni metafisiche definite prive di senso in quanto indimostrabili e ci si concentra sui
problemi metodici di ogni scienza, allanalisi del loro linguaggio e delle loro elaborazioni teoriche.
Si sviluppo un modo di parlare della realt sociale del tutto nuovo, mutato dalla matematica e dalla statistica
che Paul Lazarsfeld chiam linguaggio delle variabili.
Ogni oggetto sociale anche lindividuo veniva analiticamente definito sulla base di una serie di attributi e
propriet, le variabili, e a questa ridotto. La variabile con i suoi caratteri di neutralit, oggettivit diventava la
protagonista dellanalisi sociale.
Le teorie sociali non vengono espresse sotto forma di leggi deterministiche ma in termini probabilistici.
Ogni affermazione teorica assume una connotazione di provvisoriet e rimane sempre esposta alla possibilit
di una smentita.
Dal punto di vista ontologico, adotta il realismo critico, per cui afferma che esiste una realt sociale esterna
alluomo, ma che essa conoscibile solo imperfettamente data linevitabile imprecisione di una conoscenza
umana ed in modo probabilistico data la natura stessa delle sue leggi che hanno carattere probabilistico.
Realismo si assume che relazioni causa /effetto sono presenti al di fuori della mente umana. Critico
atteggiamento di continua messa in discussione da parte dello scienziato delle nozioni
Lepistemologia del neopositivismo prevede il riconoscimento del rapporto di interferenza tra studioso e
studiato, che deve essere il pi possibile evitato per poter formulare leggi non pi assolute, ma limitate nel
tempo e soggette alla continua falsificazione per poter arrivare sempre pi vicini alla conoscenza assoluta.
La metodologia resta sostanzialmente quella del positivismo, anche se c unapertura ai metodi qualitativi.
Analisi per variabili.
Interpretativismo
Linterpretativismo, che vede in Weber il suo esponente principale, fonda le sue basi sulla fondamentale
differenza epistemologica fra le scienze sociali e quelle naturali per il motivo che la realt sociale non pu
essere semplicemente osservata ma necessita di essere interpretata. Nelle scienze naturali loggetto di studio
consiste in una realt esterna al ricercatore e che tale rimane durante tutto il percorso di ricerca per cui la
conoscenza assume la forma di spiegazione mentre nelle scienze sociali non essendoci distacco tra
osservatore e ci che osservato la conoscenza pu essere raggiunta solo attraverso il processo di
comprensione; in questo modo si pone allopposto del positivismo per quanto riguarda i punti principali del
paradigma.
Il campo di indagine ora nuovo per la Sociologia il mondo della vita quotidiana, e se la vita umana
diversa dal mondo naturale essa andr studiata con metodi diversi da quelli positivistici, lattuale
impostazione soggettiva non pu adottare il linguaggio delle variabili.
Infatti, la sua ontologia prevede il costruttivismo e il relativismo (realt multiple), vale a dire che
non esiste una realt oggettiva (ogni individuo produce una sua realt, e solo questa realt conoscibile);
inoltre anche le singole realt individuali o anche condivise tra i gruppi sociali, variano comunque tra le
diverse culture e quindi non esiste una realt sociale universale valida per tutti ma bens realt multiple.
3
Lepistemologia prevede un non-dualismo, non-separazione, non oggettivit tra studioso e oggetto dello
studio ma interdipendenza, la ricerca sociale vista come una scienza interpretativa alla ricerca di significato
piuttosto che una scienza sperimentale in cerca di leggi. Nel perseguire il suo obiettivo,
che quello della comprensione del comportamento individuale, la ricerca sociale pu servirsi di astrazioni e
generalizzazioni: i tipi ideali e gli enunciati di possibilit.
La metodologia prevede linterazione empatica tra studioso e studiato, perch solo in questo modo
possibile comprendere il significato attribuito dal soggetto alla propria azione. Le tecniche sono quindi
qualitative e soggettive e il metodo usato quello dellinduzione (dal particolare al generale).
Analisi per casi.
Radicalizzazioni e critiche
Essi effettuano unindagine secondaria sui dati gi esistenti di uninchiesta campionaria sulla delinquenza
giovanile ed un esempio di ricerca quantitativa che si ispira al paradigma neopositivista.
Essa mette in luce un modo di procedere sistematico, nel quale ogni capitolo segue in una geometria
circolare uno schema a 4 fasi: inquadratura teorica, rilevazione empirica, analisi dei risultati, ritorno alla
teoria. Lanalisi dei dati viene condotta sulle variabili ( variabili di base: classiche variabili , povert,
disgregazione familiare, criminalit dei genitori / variabili di processo: fanno riferimento ai legami informali,
famiglia, scuola, lavoro) utilizzando tecniche statistiche al fine di produrre modelli causali nei quali le variabili
sono connesse da relazioni di causa-effetto.
4
Paradigma interpretativo: Islands in the street di Sanchez jankowski
Questo studio un esempio di osservazione partecipante, una delle tecniche classiche della ricerca
qualitativa basata sul paradigma interpretativo. Gli interrogativi sono simili alla ricerca precedente ma il
metodo di lavoro molto differente. Lautore ha partecipato personalmente alla vita delle gang oggetto della
sua indagine 37gang in 10 anni- , prendendo parte alle loro attivit e registrando le sue osservazioni su
taccuini nel corso dellosservazione stessa. Lo scopo non individuare le relazioni di causa-effetto tra le
variabili ma quello di capire le motivazioni che stanno dietro il comportamento dei membri delle gang e
costruire delle classificazioni e delle tipologie.
Le differenze fra ricerca quantitativa e ricerca qualitativa - intese non pi come riferimento alle loro
premesse filosofiche ed epistemologiche , ma guardando alle concrete applicazioni empiriche posso essere
comprese meglio se analizziamo le 4 fasi della ricerca empirica:
Disegno della ricerca Rilevazione delle informazioni Analisi dei dati Produzione dei risultati
Nei due approcci fondamentalmente diverso il rapporto instaurato tra teoria e ricerca.
Nel caso della ricerca quantitativa neopositivista, il rapporto strutturato in fasi logicamente sequenziali ,
secondo unimpostazione sostanzialmente deduttiva (la teoria precede losservazione), che si muove nel
contesto della giustificazione, cio di sostegno, tramite i dati empirici, della teoria precedentemente
formulata sulla base della letteratura.
Nel caso della ricerca qualitativa interpretativista elaborazione teorica e ricerca empirica procedono
intrecciate, in quanto il ricercatore vede nella formulazione iniziale di una teoria una possibile
condizionamento che potrebbe inibirgli la capacit di comprendere il soggetto studiato. In questo modo la
letteratura ha una minore importanza.
Anche i concetti sono usati in modo diverso dai due approcci. I concetti sono gli elementi costitutivi della
teoria, e tramite la loro operativizzazione (trasformazione in variabili empiricamente osservabili) permettono
alla teoria di essere sottoposta a controllo empirico.
Un ricercatore qualitativo avrebbe invece utilizzato il concetto come orientativo ( sensitizing concept), che
predispone alla percezione, ancora da definire non solo in termini operativi, ma anche teorici, nel corso della
ricerca stessa. I concetti diventano quindi una guida di avvicinamento alla realt empirica, non riduzioni della
realt stessa in variabili astratte.
Per quanto riguarda il rapporto generale con lambiente studiato, lapproccio neopositivista non ritiene che
la reattivit del soggetto possa rappresentare un ostacolo di base, e crede che un certo grado di
manipolazione controllata sia ammissibile. Viceversa la ricerca qualitativa si basa sull approccio
naturalistico, vale a dire che il ricercatore non manipola in alcun modo la realt in esame. I due modi di fare
ricerca trovano illustrazioni tipiche e opposte nelle tecniche dellesperimento e dellosservazione partecipante.
Se passiamo alla specifica interazione psicologica con i singoli soggetti studiati, il ricercatore quantitativo
assume un punto di vista esterno al soggetto studiato, in modo neutro e distaccato; inoltre studia solo ci
che egli ritiene importante. Il ricercatore qualitativo invece si immerge il pi completamente possibile nella
5
realt del soggetto e quindi tende a sviluppare con i soggetti una relazione di immedesimazione empatica.
Ma in questo modo sorge prepotentemente il problema delloggettivit della ricerca.
Anche linterazione fisica con i singoli soggetti studiati differente per i due approcci. La ricerca
quantitativa spesso non prevede alcun contatto fisico tra studioso e studiato il ricercatore ha un
atteggiamento nei confronti dei soggetti studiati neutrale e distaccato -, mentre nella ricerca qualitativa il
contatto fisico una precondizione essenziale per la comprensione empatia ed identificazione - .
Il soggetto studiato quindi risulta passivo nella ricerca quantitativa, mentre ha un ruolo attivo nella ricerca
qualitativa.
Nella ricerca quantitativa il disegno della ricerca (decisioni operative che sovrintendono allorganizzazione
pratica della ricerca) costruito a tavolino prima dellinizio della rilevazione ed rigidamente strutturato e
chiuso. Nella ricerca qualitativa invece destrutturato, aperto, idoneo a captare limprevisto, modellato nel
corso della rilevazione. Da queste diverse impostazioni deriva la diversa concezione della rappresentativit
dei soggetti studiati. Nella ricerca quantitativa il ricercatore pi preoccupato della rappresentativit del
campione di societ che sta studiando piuttosto che della sua capacit di comprendere, mentre lopposto
vale per la ricerca qualitativa, alla quale non interessa la rilevanza statistica bens limportanza che il singolo
caso sembra esprimere.
Anche lo strumento di rilevazione differente per i due tipi di ricerche. Nella ricerca quantitativa esso
uniforme o uniformante per tutti i soggetti per garantire la validit statistica (obiettivo: matrice dei dati) ,
mentre nella ricerca qualitativa le informazioni sono approfondite a livelli diversi a seconda della convenienza
del momento e dellinteresse del soggetto (non si tende alla standardizzazione).
Allo stesso modo, anche la natura dei dati diversa. Nella ricerca quantitativa essi sono oggettivi e
standardizzati (hard), mentre la ricerca qualitativa si preoccupa della loro ricchezza e profondit soggettive
(soft).
Lanalisi dei dati completamente differente per le due impostazioni della ricerca, a partire dalloggetto
dellanalisi. La ricerca quantitativa raccoglie le propriet individuali di ogni soggetto che sembrano rilevanti
per lo scopo della ricerca ( variabili) ((Nb: variabili: caratteristiche dei casi che vengono studiati)) e si limita
ad analizzare statisticamente queste variabili. Il soggetto non viene quindi pi ricomposto nella sua unitariet
di persona, ma i dati sono del tutto impersonali. (es. Sampson e laub: per ogni soggetto analizzato si
individuano le sue variabili atti di violenza commessi, composizione della famiglia, professione dei genitori)
Lobiettivo dellanalisi sar spiegare la varianza delle variabili dipendenti, trovare cio le cause che
provocano la variazione delle variabili dipendenti fra i soggetti, i fattori che spiegano perch alcuni ragazzi
per es sono diventati delinquenti ed altri no.
La ricerca qualitativa invece non frammenta i soggetti in variabili, ma li considera nella loro interezza, sulla
base del ragionamento che lindividuo qualcosa in pi della somma delle sue parti. Lobiettivo quindi
quello di comprendere i soggetti, interpretando il punto di vista dellattore sociale.
Le tecniche matematiche e statistiche sono fondamentali per la ricerca quantitativa, mentre sono considerate
inutili e dannose nella ricerca qualitativa.
- Variable-based Cased-based
Risultati
I risultati dei due tipi di ricerca sono naturalmente diversi. Gi nella presentazione dei dati notiamo che la
ricerca quantitativa si serve di tabelle, mentre quella qualitativa di narrazioni ( brani di interviste, testi). Le
tabelle hanno il pregio della chiarezza e della sinteticit, ma presentano il difetto di presentare uno schema
mentale proprio dei ricercatori che pu non corrispondere alle reali categorie mentali dei soggetti; inoltre
impoveriscono inevitabilmente la ricchezza delle affermazioni dei soggetti.
Le narrazioni riescono ad ovviare a questi difetti, perch riportano le parole degli intervistati e quindi si
pongono come una fotografia dei loro pensieri.
6
Per quanto riguarda la generalizzazioni dei dati, la ricerca quantitativa si pone lobiettivo di enunciare le
correlazioni ovvero i rapporti causali tra le variabili che possano spiegare i risultati ottenuti. La ricerca
qualitativa, invece, cerca di individuare tipi ideali (nel senso weberiano), cio opera delle classificazioni e
tipologie, categorie concettuali che non esistono nella realt, ma che liberano i casi reali dai dettagli e dagli
accidenti della realt per estrarne le caratteristiche essenziali ad un livello superiore di astrazione; lo scopo
dei tipi ideali quello di essere utilizzati come modelli con i quali illuminare e interpretare la realt stessa.
La ricerca qualitativa non si preoccupa di spiegare i meccanismi causali che stanno alla base dei fenomeni
sociali, cerca invece di descriverne le differenze interpretandole alla luce dei tipi ideali. Allopposto, il fine
ultimo della ricerca quantitativa proprio quello di individuare il meccanismo causale.
Unultima questione quella della portata dei risultati. A questo proposito notiamo che la profondit
dellanalisi e lampiezza della ricerca sono inversamente correlate, vale a dire che ad un maggior numero di
casi esaminati corrisponde un minore approfondimento dei singoli casi. Data la maggiore quantit di casi
necessariamente esaminati dalla ricerca quantitativa, risulta indubbiamente una maggiore generalizzabilit
dei risultati rispetto a quelli della ricerca qualitativa che punta sulla specificit.
Pi la ricerca sar ampia, pi ampio sar il numero dei soggetti investito ed il suo campione sar
rappresentativo della situazione reale, quindi legittimamente i suoi risultati saranno estensibili allintera
popolazione.
A questo punto ci si potrebbe chiedere se uno dei due approcci scientificamente migliore dellaltro. A
questo proposito si possono individuare tre posizioni. La prima afferma che i due approcci sono incompatibili
tra di loro, e quindi i rispettivi sostenitori dei due paradigmi dicono che il proprio corretto mentre laltro
sbagliato. La seconda si ritrova nei neopositivisti, che affermano lutilit dellapproccio qualitativo ma solo in
una prospettiva preliminare di stimolazione intellettuale brain storming che resta tuttavia esterno alla
fase scientifica vera e propria(ruolo ancillare). La terza posizione infine sostiene la
pari dignit e legittimit dei due metodi, e auspica lo sviluppo di una scienza sociale che, a seconda delle
circostanze e delle opportunit, scelga per luno o per laltro approccio. Infatti contributi importanti alle
scienze sociali sono arrivati da entrambi i tipi di ricerca, che possono essere rispettivamente adatti per
differenti situazioni.
Entrambi gli approcci si possono considerare come due diversi modi di fare ricerca che possono contribuire
insieme alla conoscenza dei fenomeni sociali, integrandosi vicendevolmente per una migliore comprensione
della realt da punti di vista differenti.
I due approcci vanno interpretati come un arricchimento, non un limite. Un approccio multiplo e differenziato
necessario per poter conoscere davvero la realt sociale.
La ricerca scientifica un processo creativo (nel senso di evocare le capacit personali del ricercatore, la sua
intelligenza intuitiva) di scoperta che si sviluppa secondo un itinerario prefissato e
secondo procedure prestabilite che si sono consolidate allinterno della comunit scientifica.
Questo significa che esiste un atto della scoperta che sfugge alle analisi logiche, ma allo stesso tempo la
ricerca empirica deve essere pubblica/collettiva (essa deve svilupparsi allinterno di un quadro
collettivamente condiviso), controllabile ( i concetti ed i procedimenti adoperati devono essere standardizzati
e i risultati della loro intuizioni devono essere verificate anche da altri) e ripetibile per poter essere definita
7
scientifica. Per questo esiste un percorso tipico una sequenza - della ricerca sociale che parte dalla
teoria, attraversa le fasi si raccolta e analisi dei dati e ritorna alla teoria.
Esso un percorso ciclico, che inizia dalla teoria ed alla teoria ritorna. Pi precisamente, si possono
individuare cinque fasi e cinque processi che le legano.
Teoria
Deduzione
Ipotesi -
Operativizzazione ( disegno della ricerca)
Rilevazione dei dati
Organizzazione dei dati (matrice-dati)
Analisi dei dati
Interpretazione
Risultati -
Induzione
Teoria
Teoria, cio un insieme di proposizioni tra loro organicamente connesse che si pongono a un elevato livello
di astrazione e generalizzazione rispetto alla realt empirica, le quali sono derivate da regolarit empiriche e
dalle quali possono essere derivate della previsioni empiriche.
Si tratta di un tentativo di spiegare un fenomeno sociale e deve essere verificata.
Insieme di proposizioni: sistema coerente non un semplice aggregato ma connesso attraverso regole
logiche di affermazioni.
Astrazione e generalizzazione: la teoria trascende le specifiche espressioni empiriche sia dal puto di vista
concettuale astrazione - sia da quello del campo di applicazione generalizzazione.
Derivata da regolarit empiriche: la teoria nasce dalla constatazione di ricorrenze nella realt osservata
Produttivit di previsioni empiriche:da una teoria ricavata dallosservazione di determinate regolarit
empiriche si possono inserire accadimenti in altri e diversi contesti.
Ipotesi
Una teoria deve essere articolata in ipotesi specifiche. Lipotesi una proposizione che implica una relazione
tra due o pi concetti, si colloca a un livello inferiore di astrazione e generalit rispetto alla teoria, e ne
permette una traduzione in termini empiricamente controllabili.
Il carattere di provvisoriet delle ipotesi dato dal fatto che lipotesi unaffermazione provvisoria ancora da
provare, che deriva dalla teoria ma che verr confermata solo attraverso un controllo empirico.
La validit di una teoria dipende dalla sua traduzione in ipotesi empiricamente verificabili, perch se una
teoria troppo vaga per dar luogo ad ipotesi, non pu essere verificata nella realt. Il criterio della
controllabilit empirica il criterio stesso della scientificit.
8
Dalla teoria alle ipotesi
importante la differenza tra generalizzazioni empiriche e teorie: le prima sono proposizioni isolate che
riassumono uniformit relazionali osservate tra due o pi variabili, mentre le seconde nascono quando
queste proposizioni sono raccolte e sussunte in un sistema concettuale che si colloca ad un livello superiore
di astrazione (ad esempio, permette di avanzare ipotesi in campi diversi e remoti da quelli originari).
Talvolta la pratica delle ricerca si sviluppa con ordini diversi rispetto a quello canonico: possibile che le
ipotesi vengano sviluppate dopo aver raccolto i dati, e con questi confrontati a posteriori. Oppure si ricorre
alla teoria dopo aver analizzato i dati, per spiegare un fatto anomalo o un risultato inaspettato. Infine, una
nuova teoria pu essere scoperta nel corso della fase empirica. Talora la rilevazione viene prima delle
ipotesi per ragioni di forza maggiore, nel caso dellanalisi secondaria, quando cio si applica una seconda
analisi a dati raccolti da altri ricercatori in tempi precedenti.
Nel suo significato pi ampio, il termine concetto si riferisce al contenuto semantico (significato) dei segni
linguistici e delle immagini mentali. Sarebbe latto di staccare dallimmediatezza delle impressioni sensibili e
dalle rappresentanze particolari unastrazione dal significato universale .
Il termine ha quindi unaccezione di generalit e da essa il concetto pu includere ogni specie di segno o di
procedura semantica quale sia loggetto a cui si riferisce, astratto, concreto, universale, individuale, ecc.
I concetti possono anche fare riferimento a costruzioni mentali astratte che impossibile osservare
direttamente, il potere, la felicit, la classe sociale.
Essendo lipotesi una interconnessione tra concetti, emerge il fatto che i concetti sono i mattoni della
teoria, e attraverso la loro operativizzazione si realizza la traduzione empirica di una teoria. Il concetto il
legame tra la teoria e il mondo empirico osservabile.
(es. lipotesi che il tasso di suicidio sia pi elevato fra le persone istruite costituito dalla relazione tra il
concetto di religione e di istruzione)
I concetti possono riferirsi ad astrazioni impossibili da verificare empiricamente (potere, felicit, ecc), oppure
a entit concrete (oggetti, persone, ecc). Ma se i concetti formano una teoria, come si pu verificarla
empiricamente - operativizzazione? I concetti possono essere trasformati in entit empiricamente osservabili
applicandoli ad oggetti concreti ovvero facendoli diventare attributi o propriet di specifici oggetti di studio
(chiamati unit di analisi). Es. il concetto di potere pu essere una propriet di ununit di analisi costituite
da ruoli aziendali o ruoli politici, consigliere comunale, deputato.
Il secondo passaggio per rendere operativo un il concetto consiste nel darne una definizione operativa, nello
stabilire cio regole per la sua traduzione in operazioni empiriche.
Es. si pu dare una definizione operativa del potere di un ruolo aziendale attraverso il numero di subordinati
che ad esso dipendono.
Il terzo passaggio consiste nellapplicare le regole esposte ai concreti casi studiati, questa la fase di
operativizzazione in senso stretto.
Gli stati operativizzati delle propriet sono chiamati modalit e ad ognuna di esse viene assegnato un
differente valore simbolico normalmente costituito da un numero.
Una propriet misurabile di una unit di analisi si chiama variabile.
Es. il concetto di livello culturale pu essere rilevato attraverso la propriet titolo di studio riferita agli
individui che assume stati diversi nei vari oggetti studiati, ottenendo varie modalit senza titolo, licenza
elementare, media etc, ad essi vengono rispettivamente assegnati i valori 0-1-2..
Per esempio, il peso un concetto, ma il peso di un oggetto la sua propriet. Il peso delloggetto misurato
con la bilancia una variabile. Oppure, il livello culturale un concetto astratto, ma se applicato a un
individuo diventa una propriet, e se misurabile una variabile.
9
In definitiva, una variabile una propriet di una unit di analisi a cui sono assegnati valori diversi.
Unit di analisi
Lunit di analisi rappresenta loggetto sociale al quale afferiscono, nella ricerca empirica, le propriet
studiate. Esse devono essere determinate con precisione nel momento in cui si vuole sottoporre a controllo
empirico una teoria mediante una specifica ricerca di tipo quantitativo, in quanto sono un elemento
importante del disegno della ricerca (il programma di lavoro empirico).
Nella ricerca sociale le pi comuni unit di analisi sono rappresentate da: l individuo (la pi comune),
laggregato di individui (di solito basate sugli aggregati territoriali di individui, comuni, province), dal
gruppo-organizzazione-istituzione (quando lunit di rilevamento rappresentata dal collettivo stesso e le
variabili sono di tipo globale es. studio sugli istituti scolastici dove le variabili sono relative al tipo di gestione
privata/pubblica al tipo di bacino sociale servito . Gruppi: famiglie,associazioni Organizzazioni Istituzioni:
sindacati, partititi, ospedali, fabbriche), dagli eventi sociali (quando gli eventi stessi sono le unit di analisi)
e dalle rappresentazioni simboliche prodotto culturale (quanto lunit di analisi consiste da messaggi di
comunicazione di massa di ogni genere).
Lunit di analisi singolare ed astratta, mentre chiamiamo casi gli esemplari specifici di quella data unit di
analisi che vengono studiati, sui quali si rilevano i dati. Essi sono gli oggetti specifici della ricerca empirica
Variabili
Notiamo che una propriet anche se variabile in linea di principio pu risultare invariante nello specifico
sottoinsieme degli oggetti studiati,es. la nazionalit una propriet che pu variare tra gli individui ma se lo
studio viene condotto sulla popolazione italiana essa sar invariante, nel qual caso non pi chiamata
variabile ma prende il nome di costante.
La variazione di una variabile pu realizzarsi in due modi: nel tempo, su uno stesso caso (studio
longitudinale o diacronico) oppure fra i casi, nello stesso tempo (studio trasversale o sincronico).
(Es tratti dal campo della medicina. 1 caso : vogliamo studiare la reazione di un paziente ad un farmaco per
vedere la variazione della percentuale di globuli bianchi alla somministrazione. Per fare ci variamo la
somministrazione del farmaco osservando la variazione di percentuale sui globuli bianchi le due variabili
variano nel tempo sullo stesso caso 2 caso: per sottoporre al controllo empirico lipotesi che il cancro al
polmone sia correlato al consumo di sigarette si metteranno a confronto un gruppo di pazienti sani con uno
malato e si valuteranno se a diversi stadi corrispondono livelli diversi di malattia le variabili considerate
malattia e fumo variano tra i soggetti )
Nelle scienze sociali il secondo metodo il pi utilizzato mentre il primo lo nelle scienze naturali.
Le variabili possono esser classificate secondo la loro manipolabilit, la posizione nella relazione
causa/effetto, losservabilit, il carattere individuale o collettivo e il trattamento dei loro valori.
10
La prima distinzione quella tra variabili manipolabili e non manipolabili. Le variabili manipolabili
sono quelle che possono essere modificate dal ricercatore, viceversa quelle non manipolabili non possono
essere
controllate. La maggior parte delle variabili sociali non sono manipolabili, anche se esistono dei casi in cui il
ricercatore pu controllarle.
La seconda distinzione quella tra variabili dipendenti e variabili indipendenti. In una relazione
asimmetrica tra due variabili, quando cio una variabile influenza unaltra, la variabile indipendente ci che
influenza (la causa), mentre la variabile dipendente ci che influenzato (leffetto). Nel caso in cui le
variabili indipendenti siano pi di una abbiamo una relazione multivariata.
La terza distinzione quella tra variabili latenti e variabili osservate. La distinzione si basa sulla
osservabilit, ossia sulla possibilit di rilevazione empirica. Le prime sono variabili non direttamente
osservabili in quanto rappresentano concetti molto generali o complessi, mentre le seconde sono facilmente
rilevabili. In ogni caso, entrambe possono essere operativizzate, per cui anche nel caso delle variabili latenti
c una sostanziale differenza con i concetti.
Lultima distinzione quella tra variabili individuali e variabili collettive. Le variabili individuali sono
specifiche di ogni individuo, mentre quelle collettive sono proprie di un gruppo sociale. Le variabili collettive
si suddividono a loro volta in variabili aggregate, dove la propriet del collettivo deriva dalle propriet dei
singoli componenti del gruppo, e variabili globali, quando le caratteristiche esclusive del gruppo non
derivano da propriet dei membri che lo compongono.
Le variabili sono assolutamente fondamentali nella ricerca empirica, anche se a ogni definizione operativa
lasciata allarbitrio del ricercatore, che deve solo esplicitare e giustificare le sue scelte. Per questo una
definizione operativa non mai perfettamente adeguata ed esiste sempre uno scarto tra variabile e
concetto. Un altro pericolo che porta loperativizzazione quello della reificazione, cio di identificare la
definizione operativa di un concetto (necessariamente arbitraria e impoverita) con il concetto stesso.
Tuttavia, con tutti i suoi limiti, la definizione operativa necessaria per fondare scientificamente e
oggettivamente la ricerca sociale.
Unaltra classificazione molto importante quella che riguarda le operazioni logico (operazioni di uguale e
diverso) -matematiche ( le quattro operazioni aritmetiche) che possono essere effettuate sulle variabili.
Questa classificazione fondamentale poich stabilisce in maniera determinante le procedure di elaborazione
statistica che ad esse possono essere applicate.
Il ricercatore fa ricorso alla variabile per trattare una propriet con gli strumenti della matematica e della
statistica.
A questo proposito abbiamo variabili nominali, ordinali e cardinali.
Le variabili nominali sono tali quando la propriet da registrare assume stati discreti non ordinabili, cio
finiti e delimitati che non hanno alcun ordine o gerarchia tra di essi. es. la religione pu essere cattolica o
mussulmana, non una via di mezzo possiamo definire la nazionalit di una persona italiana, svedese,
tedesca ma non possiamo stabilire una gerarchia tra di essi).
Le uniche relazioni che possiamo stabilire fra le modalit di una variabile sono le relazioni di eguale e diverso
(es. un cattolico uguale in ambito religioso ad un altro cattolico ma diverso da un protestante)
Gli stati di una propriet cos descritta si chiamano categorie, le categorie operativizzate (cio gli stati della
variabile) modalit e i simboli assegnati alle modalit valori.
Loperazione che permette di passare dalla propriet alla variabile la classificazione.
Le categorie nelle quali gli stati della propriet vengono classificati devono avere il requisito della -
esaustivit ( ogni caso che stiamo esaminando deve poter essere collocato in una delle categorie previste)
mutua esclusivit ( ogni caso pu essere classificato solo in una categoria)
Il valore non ha altro significato se non quello di identificare la categoria, in genere si tratta di un numero ch
e non ha alcun significato numerico, indifferente per es associare per la variabile religione il valore 1 per la
modalit cattolico, 2per protestante etc.
11
Loperazione di suddivisione di una propriet in categorie non ordinate consiste nella semplice associazione
ad ogni categoria di un nome, quale esso sia per questo, questo tipo di variabile si chiama nominale.
Nel caso in cui ci siano solo due modalit es, maschio / femmina - si parla di variabili dicotomiche.
Operazioni effettuabili sui valori- uguale/diverso
Le variabili ordinali sono tali quando la propriet da registrare assume stati discreti ordinabili.
Es. titoli di studio / oppure in caso di un questionario alla possibilit da parte dellintervistato di scegliere tra
le categorie poco-molto-abbastanza
In questo caso possibile stabilire non solo relazioni di eguaglianza e disuguaglianza, ma anche relazioni
dordine.
In questo caso la procedura di operativizzazione l ordinamento, che tiene conto dellordinabilit degli stati
della propriet. Lesistenza di un ordine ci permette di stabilire fra le modalit non solo le operazioni di
eguaglianza-diseguaglianza ma anche le relazioni dellordine (maggiore, minore di. )
Quindi lattribuzione dei valori alle singole modalit non potr essere casuale ma dovr utilizzare un criterio
che presevi lordine fra gli stati. Tipicamente si utilizzano i numeri naturali, che comunque non godono delle
loro propriet cardinali (cio la distanza che corre tra le varie modalit non pu essere confrontata con le
altre).
Se attribuiamo il valore 1 allassenza di titolo di studio, 2 alla licenza elementare, 3 licenza media etc tali
numeri vanno letti per la sequenza che esprimono ma non per il valore del numero.
Le variabili possono essere ordinali perch derivano da propriet originariamente costituite da stati discreti 8
vedi les del titolo di studio) oppure perch derivano da propriet continue che sono state registrate su una
sequenza sono ordinale perch non si dispone di strumenti di misurazione (es. domande di un questionario
che prevedono risposte graduate molto-abbastanza etc)
Le variabili cardinali sono tali perch i numeri che ne identificano le modalit ( i valori della variabile) non
sono delle semplici etichette, ma hanno un pieno significato numerico (hanno cio propriet sia ordinali che
cardinali).es. et, reddito, numero dei figli.
Tra le modalit delle variabili di questo tipo, oltre a stabilire relazioni di eguaglianza e diversit e dordine, si
possono effettuare le quattro operazioni aritmetiche (operazioni di somma e sottrazione tra i valori e tutte le
altre operazioni statistiche.)
Si possono ottenere variabili cardinali attraverso due processi di operativizzazione: la misurazione (quando
la propriet da misurare continua cio pu assumere infiniti stadi intermedi in un dato intervallo tra due
stadi qualsiasi e si possiede una unit di misura prestabilita che permetta di confrontare la grandezza da
misurare con una grandezza di riferimento) e il conteggio (quando la propriet da registrare discreta
assume stati infiniti non frazionabili - ed esiste una unit di conto, cio una unit elementare che
contenuta un certo numero finito di volte nelle propriet delloggetto).
Es. contiamo il numero di figli di una persona, il numero di stanze di una casa.
Nelle scienze sociali molte variabili cardinali derivano operazioni condotte su altre variabili cardinali.
Le variabili quasi-cardinali sono un sottoinsieme delle variabili cardinali. Le propriet pi caratteristiche delle
scienze sociali possono essere tutte immaginate come propriet continue, che per non riescono a passare
dalla condizione di propriet continua a quella di variabile cardinale per la difficolt di applicare una unit di
misura agli atteggiamenti umani. Un tentativo di superare questo limite dato dalla tecnica delle scale, che
cerca di avvicinarsi a misurazioni in senso proprio, cio a variabili in cui la distanza tra due valori sia nota. Le
variabili prodotte da questa tecnica sono dette quasi-cardinali.
Nelle scienze sociali esistono concetti che hanno un elevato grado di generalit es. alienazione,
socializzazione,potere, conflitto, e sono rappresentazioni lontane dallesperienza.
Per poterli definire in modo empiricamente controllabile necessario darne una definizione operativa
(tradurli in termini osservativi) tramite gli indicatori. Gli indicatori sono concetti pi semplici e specifici,
traducibili in termini osservativi, che sono legati ai concetti generali da unaffinit di significato da un
rapporto di indicazione, o rappresentanza semantica. Gli indicatori sono quindi dei ancora dei concetti, ma
pi facilmente operativizzabili.
12
In quanto specifici, gli indicatori rappresentano solo un aspetto della complessit del concetto generale,per
cui pu essere necessario identificare diversi indicatori per lo stesso concetto, uno per ogni sua dimensione.
Il rapporto tra concetto e indicatore parziale: da una parte un concetto generale non pu essere esaurito
da un solo indicatore specifico, dallaltra un indicatore pu sovrapporsi solo parzialmente al concetto per il
quale stato scelto, e dipendere per il resto da un altro concetto, anche profondamente diverso. Inoltre la
scelta di un indicatore lasciata unicamente allarbitrio del ricercatore, il cui unico obbligo quello di
argomentare la sua scelta, non di dimostrarne la correttezza.
Loperativizzazione di tali indicatori genera delle variabili che vengono combinate in indici al fine di ricorrere
al concetto originale.
Questa pratica avviene solo nel caso di concetti complessi, quando un concetto viene scomposto in
dimensioni e rilevato attraverso una molteplicit di indicatori si pone lesigenza di sintetizzare in un unico
indice la pluralit delle variabili che abbiamo prodotto.
Es. dopo aver rilevato la religiosit mediante variabili che operativizzano la religiosit ritualistica, ideologica,
esperienziale, possiamo desiderare di ricomporre lunit originaria in quello che potremmo chiamare indice
globale di religiosit.
La rilevazione empirica di un concetto non direttamente osservabile passa attraverso quattro fasi:
larticolazione del concetto in dimensioni (i diversi aspetti e significati del concetto), la scelta degli indicatori,
la loro operativizzazione, la formazione degli indici. Lindice la sintesi globale della pluralit delle variabili
che sono state prodotte dai diversi indicatori.
Errore di rilevazione
Lerrore sistematico (distorsione) un errore costante nel senso che si presenta in tutti i singoli casi di
rilevazione, il suo valore medio sul totale dei casi osservati non pari a zero ma assume un valore positivo o
negativo nel senso che in ogni caso il valore osservato tende sistematicamente a sovrastimare o sottostimare
il valore vero.
Es. rileviamo la partecipazione elettorale di un campione di cittadini alle ultime elezioni, sappiamo che c
una diffusa tendenza da parte degli intervistati a sovrastimare la loro partecipazione per cui otterremo un
tasso medio di valore elettorale osservato superiore a quello vero.
Lerrore accidentale invece un errore variabile, che varia da rilevazione a rilevazione, per cui si tratta di
unoscillazione che, ripetuta su tutti i soggetti, tende a zero.
Lerrore sistematico la parte di errore comune a tutte le applicazioni di una determinata rilevazione; lerrore
accidentale la parte di errore specifica di ogni singola rilevazione.
Gli errori possono verificarsi sia nella fase teorica, o di indicazione (in cui si scelgono gli indicatori), che in
quella empirica, o di operativizzazione (in cui si rilevano gli indicatori stessi).
Lerrore nella fase di indicazione sempre sistematico, perch lindicatore non del tutto adatto al concetto
e quindi si ha un difetto nel rapporto di indicazione.
Lerrore nella fase di operativizzazione pu esser sia sistematico sia accidentale, in quanto esistono tre fasi
nelloperativizzazione (selezione delle unit studiate, rilevazione dei dati o osservazione e trattamento dei
dati) in ognuna delle quali si possono compiere degli errori.
Gli errori di selezione sono quelli dovuti al fatto che in una certa ricerca non si operi solo su un campione
di soggetti e non sullintera popolazione.
Essi sono: lerrore di copertura (dovuta al fatto che la lista della popolazione da cui si estrae il
13
campione non completa), lerrore di campionamento (il fatto di condurre la ricerca su una frazione della
popolazione) e lerrore di non risposta (quando i soggetti del campione non possono o non vogliono
rispondere).
Gli errori di osservazione possono essere addebitati a quattro fonti: errori dovuti all intervistatore
(condizionamenti dellintervistato da parte dellintervistatore, registrazione errata delle risposte) , errori
dovuti allintervistato (errata comprensione della domanda), errori dovuti allo strumento (domande mal
formulate, tendenziose), ed errori dovuti al modo di somministrazione. (lintervista telefonica ha un ritmo di
lavoro affrettato),
Gli errori di trattamento dei dati si verificano dopo che i dati sono stati raccolti e sono errori di codifica,
trascrizione, memorizzazione, elaborazione, ecc.
Approccio allerrore globale, esso non stimabile, lunico errore quantificabile una componente di questo
errore globale, quello di campionamento, per questo spesso viene riportato come errore
globale della rilevazione.
Attendibilit e validit
Con riferimento alla fase dellerrore relativa allosservazione gli psicometrici hanno elaborato due nozioni:
Attendibilit e Validit.
Lattendibilit ha a che fare con la riproducibilit del risultato, e segnala il grado con il quale una certa
procedura di trasformazione di un concetto in variabile produce gli stessi risultati in test ripetuti con lo stesso
strumento di rilevazione (stabilit) oppure con strumenti equivalenti (equivalenza).
Es. una bilancia tanto pi attendibile quanto pi, replicando la pesata di uno stesso oggetto, si ottiene un
peso prossimo al primo, sia che la replica sia effettuata con quella o con unaltra bilancia.
La validit fa invece riferimento al grado con il quale una certa procedura di traduzione di un concetto in
variabile effettivamente rileva (operativizzi) il concetto che si intende rilevare (operativizzare).
Es. se misuriamo il grado di intelligenza delle persone attraverso il loro numero di scarpe, otteniamo un dato
attendibile ma privo di validit.
La validit invece meno facilmente controllabile, in quanto lerrore di validit in genere nasce dallerrore di
indicazione.
Per determinare la validit di un indicatore si utilizzano sue procedure di convalida: la validit di
contenuto e la validit per criterio.
La validit di contenuto indica il fatto che lindicatore prescelto per un concetto copre effettivamente lintero
dominio di significato del concetto; una convalida di questo tipo pu avvenire soltanto su un piano
puramente logico.
La validit per criterio consiste nella corrispondenza tra lindicatore e un criterio esterno che per qualche
motivo si ritiene correlato con il concetto.
Questo criterio pu essere rappresentato da un altro indicatore gi accettato come valido oppure da un
fatto oggettivo.
La validit per criterio stata distinta in validit predittiva (quando si correla il dato dellindicatore con un
evento successivo ad esso connesso), in validit concomitante (quando lindicatore correlato con un altro
indicatore rilevato nello stesso momento) e in validit per gruppi noti (quando lindicatore viene applicato a
14
soggetti dei quali sia nota la posizione sulla propriet da rilevare.
Esiste infine anche la validit di costrutto, che consiste nella rispondenza di un indicatore alle attese
teoriche in termini di relazioni con altre variabili.
CAUSALITA ED ESPERIMENTO
Il concetto di causa
Malgrado la nozione di causa-effetto rappresenti il cuore del ragionamento scientifico, essa una delle pi
difficili da tradurre in termini operativi. Tuttavia, anche se lesistenza di una legge causale non pu mai
essere empiricamente provata, il fatto di ipotizzare sul piano teoretico una relazione causale implica dei fatti
osservativi.
Queste osservazioni empiriche non costituiscono una prova definitiva dellesistenza nel nesso causale, ma
tuttavia forniscono una collaborazione empirica della loro ipotetica esistenza.
Es. non possiamo mai dire, sul piano empirico (lo possiamo ipotizzare sul piano teorico), che la variazione di
X produce la variazione di Y . Ma se osserviamo empiricamente che una variazione di X regolarmente
seguita da una variazione di Y tenendo costanti tutte le altre possibili cause di Y, abbiamo un forte elemento
empirico di corroborazione che X sia causa di Y.
Per poter corroborare empiricamente lesistenza di una relazione causale fra due variabili, sono necessari tre
elementi empirici:
- Distinzione tra variabile indipendente e dipendente. In una relazione asimmetrica tra due variabili,
quando cio una variabile influenza laltra, chiamiamo variabile indipendente la variabile che influenza, e
variabile dipendente la variabile che influenzata.
Nella relazione tra classe sociale ed orientamento politico, la classe la indipendente, lorientamento la
dipendente.
Essa si ha quando osserviamo in primo luogo una variazione della variabile indipendente.
Contemporaneamente al suo variare dobbiamo poter osservare una variazione della variabile dipendente.
Nel linguaggio statistico si usa il termine covariazione fra le due variabili: al variare di una varia laltra.
Es. vogliamo avere elementi empirici a conferma dellaffermazione teorica per cui lindividualismo sociale
produce un alto tasso di suicidi.
Possiamo fare ci solo se la variabile indipendente la situazione sociale osservata non costante societ
gruppi a diversi gradi di individualismo, societ cattoliche, protestanti, persone in contesti sociali diversi.
Direzione causale
Dobbiamo osservare che al variare della variabile indipendente consegue una variazione della variabile
dipendente ma che non vero il contrario.
La causa la variabile indipendente e leffetto la variabile dipendente.
Possiamo stabilire empiricamente questo fatto in due modi:
- Manipolazione della variabile indipendente il ricercatore in grado di fare variare con la sua azione la
variabile ( strada percorribile solo nel caso dellesperimento)
- Criterio della successione temporale esso nasce dallosservazione che variazione della variabile
indipendente X precede la variazione della dipendente Y.
15
Se diciamo che esiste un nesso causale fra la classe sociale e orientamento politico, esso pu esistere solo
nella direzione che va dalla prima alla seconda, impensabile linverso.
Dobbiamo poter escludere la variazione, simultanea al variare della variabile indipendente, di atre variabili ad
essa correlate che potrebbero esse loro stesse, invece della variabile indipendente studiata, le cause del
variare della dipendente.
Se vera laffermazione teorica che X causa di Y, allora dovremmo poter osservare, sul piano empirico,
che una variazione di X tenendo costanti tutte le altre possibili cause di Y accompagnata da una
variazione di Y. Ma come possiamo realizzare empiricamente la formula tenendo costanti tutte le altre
possibili cause di Y? la risposta diversa a seconda se ci muoviamo attraverso la logica dellanalisi della
covariazione o secondo quella dellesperimento.
Una covariazione non pu mai essere adottata come unica prova empirica a sostegno dellesistenza di una
relazione causale.
Pu esistere covariazione senza che esista causazione.
Gli scienziati dispongono di due tecniche base per sottoporre a test empirico le affermazioni causali.
Analisi di covariazione: il ricercatore osserva ed analizza come le variazioni di X siano connesse alle
variazioni di Y in un ambiente naturale , escludendo linfluenza delle variabili estranee attraverso il confronto
fra gruppi oppure il controllo statistico (depurazione).
Lesperimento nasce e trova una sua sistemazione epistemologica nelle scienze naturali, la sua applicazione
alle scienze sociali comporta degli adattamenti.
Se vogliamo definire leffetto della variabile X sulla variabile Y e cio rilevare le modalit di Y quando X =T
Trattamento e X=C Controllo, non possiamo farlo nella stessa unit e nello stesso tempo.
E questo il problema fondamentale dellinferenza causale
Es. immaginiamo sia possibile rilevare il voto di uno stesso individuo si nel caso in cui egli sia stato
sottoposto alla propaganda televisiva X = t sia nel caso egli non sia stato sottoposto X=C, non possiamo
verificare i due fattori perch o vi stata esposizione o non vi stata.
Nelle scienze sociali gli esperimenti vengono suddivisi in esperimenti di laboratorio o sul campo.
Nel primo caso lesperimento viene condotto in una situazione artificiale, mentre nel secondo caso si realizza
nel contesto della vita reale.
16
INCHIESTA CAMPIONARIA
Nella vita di tutti i giorni, quando vogliamo conoscere un determinato fenomeno sociale, sia esso individuale
o collettivo disponiamo fondamentalmente di due modi per raccogliere informazioni: osservare e domandare.
Per inchiesta campionaria intendiamo un modo di rilevare informazioni interrogando gli stessi individui
oggetto della ricerca, appartenenti ad un campione rappresentativo, mediante una procedura standardizzata
( a tutti i soggetti vengono poste le stesse domane nella stessa formulazione) di interrogazione, allo scopo di
studiare le relazioni esistenti tra le variabili.
Lo strumento di rilevazione costituito da due parti fondamentali domande e risposte che possono
essere formulate in modo standardizzato oppure possono essere lasciate libere.
Quando sono entrambe standardizzate abbiamo il questionario, che rappresenta il pi diffuso strumento di
raccolta dei dati nella ricerca sociale.
Quando la domanda standardizzata e la risposta libera abbiamo lintervista strutturata.
Quando domanda e risposta non sono standardizzate abbiamo lintervista libera.
Domande Risposte
Standardizzate Libere
Standardizzazione Questionario Intervista strutturata
Per poter analizzare i dati con tecniche statistiche necessario che oltre alle domane anche le risposte siano
standardizzate ovvero organizzate secondo uno schema di classificazione comune a tutti i soggetti.
Ci produrr a conclusione della rilevazione la matrice dati.
Dato che per tutti i casi studiati sono state rilevate le stesse informazioni possibile organizzare tali
informazioni nella forma di una matrice rettangolare di numeri, la matrice casi per variabili CxV. In quessta
matrice abbiamo in riga i casi, in colonna le variabili ed in ogni cella ( derivante dallincrocio tra una riga ed
una colonna) un dato, cio il valore assunto da una particolare variabile su un particolare caso.
Linchiesta campionaria non si limita ad esplorare e descrivere ma intende controllare empiricamente delle
ipotesi. Nello studio condotto sul comportamento elettorale, non si accontenter di conoscere gli
orientamenti di voto della popolazione studiata ma vorr conoscere le ragioni delle scelte .
Essa quindi non un sondaggio e si distingue da esso per lesistenza di unampia problematica teorica che
sta alle sue spalle e che struttura limpostazione stessa della rilevazione dei dati e per lampiezza dei temi
toccati.
Lespressione inchiesta campionaria con il quale chiamiamo la ricerca condotta attraverso il questionario
deriva dal termine survey che intraducibile, forse sondaggio ma come abbiamo visto molto riduttivo.
17
Due sono i dilemmi di fronte ai quali si trova il ricercatore che intende esplorare la realt sociale
interrogando gli stessi attori sociali e sono riconducibili ai due paradigmi fondamentali della ricerca sociale.
In particolare, si contrappongono coloro che ritengono che la realt sociale sia esterna allindividuo e
pienamente conoscibile quindi in modo oggetto (posizione oggettivista) e coloro che sostengono
che il dato sociale viene generato dallinterazione tra i soggetti studiante e studiato (posizione
costruttivista).
In secondo luogo, esiste una diatriba tra chi ritiene che nel mondo sociale esistano uniformit empiriche ai
quali pu essere ricondotto lagire individuale (posizione uniformista) e chi sottolinea la fondamentale
irriducibilit del soggetto umano a qualsiasi forma di generalizzazione e standardizzazione per cui ogni azione
sociale un evento unico (posizione individualista).
Queste due diversit di vedute implicano due specifiche questioni: la prima riguarda il rapporto tra
intervistato e intervistatore, la seconda concerne la standardizzazione dello strumento di informazione e
dellinformazione rilevata.
Per quanto riguarda il rapporto tra intervistato e intervistatore, lapproccio oggettivista ritiene che esso
debba essere il pi possibile spersonalizzato per non alterare lo stato delloggetto studiato. Tuttavia non
possibile instaurare un rapporto neutro tra intervistato e intervistatore, esiste sempre un certo grado di
interazione.
Per quanto riguarda invece la standardizzazione della rilevazione, lapproccio uniformista prevede luniformit
dello strumento della rilevazione-interrogazione (questionario con domande e risposte prefissate). I limiti del
questionario sono due: non tiene conto della disuguaglianza sociale e uniforma lindividuo al livello delluomo
medio.
Lobiettivo della posizione oggettivista-uniformista quindi quello di ottenere la neutralit dello strumento di
rilevazione, cio ottenere linvarianza dello stimolo finalizzato alla comparabilit delle risposte.
Ma non sicuro che allinvarianza dello stimolo corrisponda luniformit dei significati, infatti una stessa
domanda o parola possono avere diversi significati per lo stesso individuo, sia per motivi culturali che per le
circostanze stesse in cui si svolge lintervista.
A questo punto il ricercatore deve scegliere se appoggiarsi ad una tecnica che massimizza la ricerca di
uniformit (questionario) e una che predilige lindividualit del soggetto studiato (intervista strutturata). Se si
sceglie il questionario, bisogna essere consapevoli che studiando solo le uniformit del comportamento delle
persone (ci che esse hanno in comune) si limita inevitabilmente la piena comprensione dei fatti sociali.
La limitazione ad un minimo comun denominatore riduttiva e limitativa di confronti dellobiettivo da
raggiungere, una piena comprensione del comportamento umano. Questo il limite della ricerca quantitativa
che sceglie consapevolmente di lavorare sui grandi numeri piuttosto che in profondit.
Partiamo da una domanda: Il comportamento verbale pu essere unaffidabile fonte di esplorazione della
realt sociale?
Molti scienziati sociali hanno espresso dubbi sulla possibilit che la realt sociale possa essere compresa
attraverso i resoconti verbali delle risposte ottenute interrogando gli uomini.
Le risposte alle domande (standardizzate) degli intervistatori possono non essere attendibili per due motivi:
la desiderabilit sociale delle risposte e la mancanza di opinioni.
La desiderabilit sociale la valutazione, socialmente condivisa, che in una certa cultura viene data ad un
certo atteggiamento o comportamento individuale. Se uno di questi valutato positivamente o
negativamente, una domanda che abbia questo come oggetto pu dare risposte distorte, perch
lintervistato pu essere riluttante a rivelare opinioni o comportamenti che ritiene indesiderabili e pu essere
tentato di dare di s la migliore immagine possibile, anche se non veritiera, in modo volontario o anche
involontario.
La mancanza di opinioni concerne domande su tematiche complesse, sulle quali plausibile che un certo
numero di intervistati non abbia mai riflettuto, e quindi molti rispondono a caso oppure formulano sul
momento unopinione che pu essere solo passeggera. Questo fenomeno accentuato anche dal fatto che
spesso la risposta non so viene percepita come unammissione di incapacit mentale.
Un altro problema delle domande standardizzate che esse misurano lopinione, ma non la sua intensit n
il suo radicamento.
18
Le risposte ad un questionario produce da parte degli intervistati una affermazione chiedendo se sono
daccordo o contrari ma il ricercatore non in grado di distinguere al loro interno le opinioni profondamente
radicate ed emotivamente coinvolgenti.
La tecnica del questionario non in grado di distinguere le opinioni intense e stabili da quelle deboli e
volubili.
Le domande di un questionario possono essere classificate in base al loro contenuto, in tre classi, a seconda
che riguardino: propriet sociografiche di base, atteggiamenti e comportamenti.
Domande relative alle propriet sociografiche di base: si riferiscono alla pura descrizione delle
caratteristiche sociali di base di un individuo . Intendiamo quindi le sue caratteristiche permanenti come
quelle demografiche (genere, et, luogo di nascita), quelle ereditate dalla famiglia (classe sociale di origine,
titolo di studio), quelle temporanee (professione, stato civile, comune di residenza). Queste domande
seguono delle formulazioni standard.
Domande relative agli atteggiamenti. Si tratta delle propriet degli individui pi tipicamente rilevabili
(opinioni, motivazioni, sentimenti, giudizi, valor): interrogare direttamente gli individui lunica via per
ottenere queste informazioni, ma questo anche il campo pi difficile da esplorare, e le risposte sono
influenzate dal modo in cui sono poste le domande/collocazione nel questionario/modo di porsi
dellintervistatore.
Domande relative ai comportamenti. Nei casi precedenti si rileva quello che lintervistato dice di pensare,
ora si rileva quello che il soggetto dice di fare o di aver fatto. Questo un aspetto pi facile da indagare
rispetto agli altri. I comportamenti sono inequivoci, unazione o c stata o non c stata. I comportamenti si
caratterizzano dal fatto di essere empiricamente osservabili, unazione pu essere osservata da una terza
persona e pu lasciare una traccia oggettiva. E pi facile rispondere a questo tipo di domande ed pi
difficile mentire.
Con riferimento alla loro forma distinguiamo tra domande a risposta aperte e domande a risposta chiusa.
Le domande aperte sono quelle in cui si lascia piena libert allintervistato nella formulazione della risposta;
si rivolgono di solito ad un campione ridotto. Il vantaggio della domanda aperta quello di concedere una
maggiore libert di espressione e spontaneit, ma la risposta deve essere trascritta per intero. Lo svantaggio
consiste nel fatto che la risposta difficile da classificare successivamente in categorie predeterminate.
Questo crea dei problemi di codifica a posteriori, perch le risposte possono essere generiche o imprecise.
Solo un buon intervistatore pu sollecitare a precisare meglio il significato delle risposte, ma questo
comporta un maggiore impegno dellintervistato e quindi un maggior rischio di rifiuti, senza contare
laggravio dei costi.
Le domande chiuse offrono la possibilit di scegliere tra risposte prefissate, quindi la risposta sar standard.
Sono il solo tipo di domande che si possono utilizzare con un campione di grandi dimensioni. I vantaggi delle
domande chiuse consistono nella maggiore facilit di codifica, nello stimolo dellanalisi e della riflessione da
parte dellintervistato e nella maggiore economicit (in un campione ampio). La domande sono poste a tutti
con lo stesso schema di risposte e chiariscono allintervistato qual il piano di riferimento della ricerca,
evitando cos risposte vaghe.
I limiti sono il rischio di non considerare tutte le altre possibili alternative di risposta non previste e di
19
influenzare la risposta con le alternative proposte. A volte lintervistato sceglie una delle alternative anche se
non convinto. Le risposte, inoltre, non hanno significato uguale per tutti, e tutte le alternative possono
essere troppe per essere ricordate.
Semplicit di linguaggio: il linguaggio del questionario deve essere adatto alle caratteristiche del campione
studiato, il questionario autocompilato deve essere pi semplice rispetto a quello con intervistatore in quanto
non pu prevedere spiegazioni da parte di questultimo e in ogni caso non bisogna far conto sulle sue
spiegazioni, perch di solito gli intervistati provano imbarazzo ad ammettere di non capire le domande.
Lunghezza delle domande: di solito le domande devono essere concise perch la lunghezza distrarrebbe
lintervistato dal focus dellinterrogativo, ma nel caso di tematiche complesse sono preferibili le domande
lunghe perch facilitano il ricordo, danno pi tempo per pensare e agevolano una risposta pi articolata.
Numero delle alternative di risposta: non devono essere troppo numerose; se presentate a voce non
devono superare il numero di cinque, limite al di sopra del quale il ricordo delle prime risulta affievolito.
Espressioni in gergo: preferibile non utilizzare espressioni gergali perch potrebbero irritare lintervistato
pensando di essere considerato ridicolo.
Definizioni ambigue: occorre fare molta attenzione a non utilizzare termini dal significato non ben definito.
Parole dal forte connotato negativo: bene evitare anche i termini carichi di significato emotivo,
soprattutto se questo negativo.
Es: lei picchia suo figlio?
Domande sintatticamente complesse: la domanda deve avere una sintassi chiara e semplice, evitando ad
esempio la doppia negazione.
Domande con risposta non univoca: bisogna evitare le domande esplicitamente multiple (domande in cui
ne sia inclusa unaltra) e quelle dalla problematica non sufficientemente articolata.
Es. i suoi genitori erano religiosi? Risulta impossibile rispondere in caso di orientamento differente tra i due.
Domande non discriminanti: le domande devono esser costruite in modo tale da operare delle
discriminazioni significative nel campione degli intervistati.
Comportamenti presunti: indispensabile evitare di dare per scontati comportamenti che non lo sono.
Es. non chiedere allintervistato per chi ha votato nelle ultime elezioni senza chiedergli se andato a votare
Focalizzazione nel tempo: occorre sempre definire con precisione larco temporale al quale si riferisce la
domanda.
Concretezza astrazione: la domanda astratta pu dare facilmente luogo a risposte generiche o normative,
mentre la domanda concreta facilita la riflessione e rende pi difficile il fraintendimento.
Comportamenti e atteggiamenti: data la difficolt di determinare gli atteggiamenti, buona regola, quando
possibile, limitarsi ai comportamenti piuttosto che restare nellambito dellopinione.
Desiderabilit sociale delle risposte: per evitare risposte normative bisogna formulare domande il pi
possibile concrete. Altre indicazioni sono quelle di giustificare anche la risposta meno accettabile; considerare
20
normale e diffuso anche il comportamento negativo; equilibrare la desiderabilit delle risposte (Alcuni
dicono che altri pensano che); attribuire allintervistato il comportamento condannato, lasciandogli il
compito delleventuale smentita; formulare le domande in terza persona; e cos via. In ogni caso
impossibile eliminare del tutto gli effetti della desiderabilit sociale.
Es. riportato in tutti i manuali, Quante volte ha picchiato sua moglie questa settimana? Invece di dire Lei
picchia sua moglie?
Mancanza di opinione e non so: bisogna far presente allintervistato che non so una risposta legittima
come le altre, per esempio includendola espressamente tra le alternative possibili. Bisogna inoltre evitare di
indirizzarlo, anche in maniera indiretta o inconsapevole.
Intensit degli atteggiamenti: importante cogliere anche lintensit degli atteggiamenti, perch
questultima che determina i comportamenti. La rilevazione dellintensit degli atteggiamenti necessita di
solito di domante ulteriori.
Acquiescenza: si riferisce alla tendenza di scegliere risposte che esprimono accordo piuttosto che negative.
Tipica delle persone meno istruite.
Un problema simile quello delluniformit delle risposte response set, quando si tende a scegliere la
stessa risposta per una serie di domande che contemplano lo stesso tipo di alternativa.
Avviene per pigrizia o per mancanza di opinioni.
Il problema si risolve alternando la polarit delle risposte, formulandone in maniera che un individuo con
idee coerenti debba rispondere in maniera positiva a certe domande e ad altre in maniera negativa.
Effetto memoria: per ovviare alla inevitabile distorsione causata dalla memoria si possono stabilire limiti
temporali al ricordo; utilizzare punti di riferimento temporali relativi ad eventi pi salienti rispetto a quello
studiato; presentare allintervistato liste di possibili risposte; utilizzare diari o strumenti analoghi; ecc.
Sequenza delle domande: meglio mettere allinizio domande facili, che abbiano lo scopo di rassicurare
lintervistato e di metterlo a proprio agio. Le domande imbarazzanti si posizioneranno quindi a met
questionario, in modo che lintervistatore abbia avuto un po di tempo per conquistare la fiducia
dellintervistato. Anche le domande impegnative dovranno essere collocate a met dellintervista, in modo
tale da assecondare la curva di interesse dellintervistato e la possibile stanchezza. Alla fine si potranno porre
le domande pi noiose ma che non richiedono riflessione come quelle sociometriche.
bene seguire anche il passaggio da domande generali a domande particolari, stringendo progressivamente
sugli aspetti pi specifici.
Bisogna tenere conto infine delleffetto contaminazione, cio del fatto che in certi casi la risposta ad una
domanda pu essere influenzata dalle domande che lhanno preceduta.
Batterie di domande
Le batterie di domande sono domande che essendo, tutte formulate nello stesso modo (stessa domanda
introduttiva e stesse alternative di risposta, varia solo loggetto al quale si riferiscono), vengono presentate
allintervistato in un unico blocco. Le batterie di domande hanno gli obiettivi di risparmiare spazio sul
questionario e tempo dellintervista, facilitare la comprensione del meccanismo di risposta, migliorare la
validit della risposta e permettere al ricercatore di costruire indici sintetici che riassumono in un unico
punteggio le diverse domande della batteria. Gli svantaggi delle batterie di domande consistono nel pericolo
che le riposte siano date a caso e che le risposte siano meccanicamente tutte uguali tra di loro.
21
Quando una stessa domanda come nel caso delle batterie si applica a diversi oggetti, importante
distinguere il caso in cui in essa formulata in termini assoluti da quello in cui essa formulata in termini
relativi.
Assoluti: nel senso che ogni elemento della batteria unentit autosufficiente , alla quale lintervistato pu
rispondere indipendentemente dalle altre domande
Relativi: la domanda in cui la risposta nasce da un confronto con le altre possibili risposte
Es. pensiamo ad una batteria di domande aventi lo scopo di rilevare la popolarit dei personaggi pubblici. Si
pu presentare allintervistato un elenco di uomini pubblici domande in termini assoluti: si chiede di
esprimere una valutazione per es attraverso un punteggio da 1 a 10 - domande in termini relativi: si chiede
di mettere gli uomini politici dellelenco in graduatoria di preferenza oppure di scegliere i tre che preferisce.
Modalit di rilevazione
Tre sono i modi fondamentali di somministrazione di un questionario:
Le loro caratteristiche: lintervistatore ideale donna, sposata, di mezza et, diplomata, casalinga, di ceto
medio, con un abbigliamento neutrale. ricordandoci che in effetti le caratteristiche dellintervistatore ideale
dipendono molto da quelle del campione intervistato.
Le loro aspettative: le aspettative degli intervistatori possono essere trasmesse inconsciamente agli
intervistati, passando attraverso il tono di voce, la mimica facciale (sguardi di incredulit, assensi con il
capo), sottolineature ed enfasi nel leggere domande o le alternative di risposta - influenzandone le risposte
soprattutto per quanto riguarda intervistati insicuri.
La loro preparazione: lintervistatore deve essere consapevole dellinfluenza che ha nella formulazione delle
risposte e non deve essere un automa inerte ma deve poter intervenire in caso siano necessari dei
chiarimenti, e per questo deve essere istruito - saranno distribuite delle istruzioni scritte, saranno previsti
incontri preliminari ed in corso di rilevazione nonch dei supervisori ai quali gli intervistatori potranno
rivolgersi - per limitare al massimo questi effetti.
La loro motivazione: lintervistatore deve essere convinto dellimportanza del proprio lavoro, perch un
atteggiamento contrario potrebbe riverberarsi in modo negativo sullintervistato. E fondamentale negli
incontri preliminari che siano date istruzioni anche sugli obiettivi della ricerca.
Interviste telefoniche
Lintervista telefonica diffusa enormemente negli ultimi anni presenta numerosi vantaggi: permette una
grande velocit di rilevazione; ha costi ridotti il 50-70% di risparmio rispetto a quella faccia a faccia - ;
presenta minori resistenze alla concessione dellintervista e maggiore garanzia di anonimato;
permettere di raggiungere a parit di costo anche gli intervistati della periferia del paese; facilita
enormemente il lavoro di preparazione degli intervistatori e la loro supervisione; consente di utilizzare
direttamente il computer in fase di rilevazione.
I suoi svantaggi sono: il minore coinvolgimento dellintervistato che porta a una maggiore incidenza di
risposte superficiali; il pi rapido logoramento del rapporto con lintervistato; limpossibilit di utilizzare
materiale visivo; limpossibilit di raccogliere dati non verbali; limpossibilit di raggiungere tutti gli strati
sociali escludendo coloro che non hanno un telefono; il fatto che anziani e persone poco istruite risultano
sottorappresentate; il fatto che le domande sono spesso elementari a causa della ristrettezza del tempo a
disposizione. I limiti pi gravi sono comunque lassenza di contatto e la mancanza di tempo, che non
rendono adatta lintervista telefonica quando si
vogliono analizzare tematiche complesse.
22
Questionati autocompilati
I questionari autocompilati sono quelli che il soggetto compila da solo, senza lintervento dellintervistatore.
Il vantaggio principale di questa tecnica lenorme risparmio dei tempi di rilevazione.
I limiti invece consistono nel fatto che deve essere breve, conciso e il pi semplice possibile per venire
incontro al maggior numero possibile di persone;non essendo istruito lintervistato produrr errori grossolani
molti compileranno un questionario per la prima volta e non sapranno come fare, molti saranno
scarsamente motivati - inoltre di solito coloro che restituiscono il questionario sono un segmento particolare
della popolazione in esame (autoselezione), cosa che limita lestensibilit dei risultati.
La rilevazione di gruppo avviene in presenza di un operatore che distribuisce i questionari, assiste alla
compilazione e ritira i questionari; in questo caso i rischi di questa ricerca vengono molto ridotti.
La rilevazione individuale si pu dividere a sua volta in rilevazione con restituzione vincolata e con
restituzione non vincolata. Nel primo caso, loperatore deposita il questionario presso il soggetto in
questione e passa a ritirarlo in seguito (un tipico caso il censimento); anche questa tecnica limita i rischi
prima ricordati. Questa tecnica implicando lintervento personale di ogni rilevatore per lintervista non offre
costi inferiori rispetto alla procedura di intervista faccia a faccia ma molto adottata dallIstat.
Nel secondo caso, tipicamente quello del questionario postale, il questionario viene inviato per
posta con una lettera di presentazione e con una busta di ritorno gi affrancata.
I vantaggi di questa tecnica sono i risparmi altissimi dei costi, la possibilit di essere compilati in qualsiasi
momento anche a pi riprese, la maggiore garanzia di anonimato, lassenza di distorsioni dovute
allintervistatore, laccessibilit a soggetti residenti in zone poco raggiungibili.
Gli svantaggi sono la bassa percentuale di risposte, lautoselezione del campione, la necessit che il livello di
istruzione della popolazione studiata sia medio-alto, la mancanza di controllo sulla compilazione,
limpossibilit di questionari complessi e la sua lunghezza non eccessiva. Il problema principale di questa
tecnica dato dalla percentuale di ritorno dei questionari. E considerato adeguato almeno un 50% di
ritorno. Questo tasso di riuscita determinato da vari fattori, i principali: la misura in cui conosciuta
listituzione che patrocina la ricerca, la lunghezza del questionario e la sua forma grafica, le caratteristiche
degli intervistati ( si ha miglior riuscita quando la popolazione studiata rappresentata da un segmento
particolare accomunato da qualche caratteristica, soci di unassociazione,laureati di ununiversita),tipo di
sollecito, meglio se si sollecita almeno un paio di volte.
Sia nel caso dei questionari telefonici che di quelli autocompilati sono da escludere le domande aperte.
Il computer pu essere utilizzato sia nelle interviste telefoniche (CATI, Computer Assisted Telephone
Interviewing) che nelle interviste faccia a faccia (CAPI, Computer Assisted Personal Interviewing), che si
differenzia da una normale intervista faccia a faccia per il fatto che le risposte vengono riportate
direttamente su un PC portatile con risparmio notevole di tempo facendo scomparire la fase di codifica -
immissione.
Una altro impiego del computer quello della teleintervista, in cui lintervistato risponde direttamente con il
suo PC al questionario trasmesso per via elettronica. I vantaggi di questa tecnica consistono nelleliminazione
dellintervistatore ma soprattutto nel fatto che si possono condurre inchieste longitudinali, cio rilevazioni
ripetute nel tempo sugli stessi soggetti anche effettuando variazioni sul questionario finalizzando la ricerca a
monitorare i cambiamenti dellopinione pubblica, dei consumi.. I suoi limiti consistono nel fatto che non
possibile accertarsi di chi effettivamente compili il questionario e inoltre la consapevolezza di esser studiati
pu alterare il comportamento.
23
La raccolta delle informazioni finora analizzate normalmente preceduta dalle seguenti operazioni in
sequenza:
Interviste esplorative preliminari pre test di collaudo del questionario preparazione e supervisione dopo
che il lavoro su campo iniziato degli intervistatori contatto con le persone da intervistare forma grafica
del questionario.
Lo studio esplorativo: il ricercatore per poter formulare delle domande adeguate deve conoscere
perfettamente i problema oggetto del suo studio prima di iniziare a redigere le domande.
In particolar modo questo necessario per il questionario standardizzato che essendo composto da
domande chiuse esige che il ricercatore conosca non solo le questioni e gli interrogativi ma anche tutte e
possibili risposte.
Questa fase esplorativa preliminare verr condotta attraverso interviste preliminari, che partono da una
massima destrutturazione e da strumenti qualitativi fino a strumenti sempre pi strutturati, che hanno lo
scopo di analizzare perfettamente il problema di oggetto e di formulare con la massima precisione possibile
le risposte alternative per le domande chiuse.
Si effettueranno interviste libere ad osservatori privilegiati,interviste a risposta aperta, prove di domande al
fine di mettere a confronto differenti formulazioni.
Il pre-test: la fase di collaudo consiste in una sorta di prova generale del questionario, sottoposto a
poche decine di soggetti, che ha lo scopo di evidenziare eventuali problemi o cattive formulazioni del
questionario stesso. E necessario per testare lefficacia del test, una volta che sar stampato non potr pi
essere modificato.
Tra gli scopi oltre alla rilevazione degli errori c quella di determinare la durata dellintervista, esso contiene
un numero di domande maggiori rispetto a quelle che saranno poi somministrate.
La preparazione e la supervisione degli intervistatori: gli intervistatori devono essere preparati ( briefing)
informati su tutto ci che riguarda la ricerca, collaudati sul campo con il pre-test e controllati durante la
ricerca vera e propria da appositi supervisori.
Il contatto iniziale con i soggetti intervistati: il problema dei rifiuti. Il momento pi delicato dellintervista
quello iniziale, in cui i soggetti devono decidere se collaborare o meno. Per rendere massima la
collaborazione importante insistere sullanonimit delle risposte, sul prestigio dellistituzione committente e
sulla figura dellintervistatore. anche opportuno inviare una lettera di presentazione che spieghi
chiaramente chi il committente della ricerca, quali ne sono gli obiettivi, perch ci si rivolge proprio a lui,
sottolineare limportanza delle sue risposte e rassicurarlo sullanonimato.
La forma grafica del questionario: opportuno distinguere chiaramente il testo che riguarda lintervistato e
quello che di pertinenza dellintervistatore, i passaggi tra le domande devono essere indicati chiaramente, il
questionario deve essere graficamente compatto e non estendersi su troppe pagine. I questionari
autocompilati devono inoltre essere autoesplicativi, le domande devono essere semplici e brevi (meglio se
dello stesso formato), limpostazione grafica deve esser compatta e chiara.
I vantaggi di questi sviluppi si possono riassumere in un generale risparmio economico, nella garanzia del
24
rigore della rilevazione stessa quando viene effettuata con il controllo della comunit scientifica e nella
possibilit anche per i ricercatori con poche risorse di effettuare ricerche di ampio respiro.
Gli svantaggi sono legati alla qualit dei dati, in quanto i dati raccolti nel passato possono non essere stati
trattati in modo corretto ( la divisione del lavoro che viene introdotta fra chi si pone gli interrogativi ed
analizza i dati e chi li raccoglie pu condurre ad una limitazione degli interrogativi, domande importante
possono restare senza una risposta); altro svantaggio il fatto che possano nascere ricerche a partire dai
dati disponibili piuttosto che dalle ipotesi teoriche ( alcuni ricercatori ottengono un data set, vi applicano le
elaborazioni statistiche e poi decidono qual il problema da studiare; i risultati saranno banali e scontati.
Estato gi accennato in merito agli esperimenti che una variabile pu variare sia fra i casi nello stesso
tempo sia nel tempo sugli stessi casi.
Le inchieste replicate nel tempo (diacroniche) si possono dividere in longitudinali e trasversali replicate.
Le inchieste longitudinali consistono nellintervistare ripetutamente gli stessi soggetti in un ampio arco di
tempo (panel studies).
I problemi di questa tecnica consistono nella mortalit del campione (molti soggetti saranno irraggiungibili
per diversi motivi a ogni nuova rilevazione), nelleffetto memoria e nel fatto che il soggetto sapendosi
osservato pu modificare il suo comportamento normale.
Le inchieste trasversali consistono nel replicare linchiesta ma su un campione (equivalente) di differenti
soggetti.
Linchiesta trasversale retrospettiva invece una normale inchiesta trasversale nella quale si pongono agli
intervistati domande sul loro passato, con gli evidenti limiti che laffidamento alla memoria pu comportare.
Le inchieste trasversali replicate consistono nel rilevare le stesse informazioni in differenti momenti
temporali , ma non sugli stessi soggetti bens su differenti campioni di individui.
Il maggiore difetto degli studi che comportano il fattore tempo naturalmente il costo molto elevato
poich non si ci pu accontentare di sole due rilevazioni ma sembra indispensabile ripetere linchiesta in un
lungo periodo di tempo, anche decenni.
Da qui la necessit di affidare queste indagini ad istituzioni permanenti in grado di garantire la continit che
non pu essere assicurata da singoli ricercatori o isolati gruppi di ricerca.
Inchieste longitudinali.
Distinte in base al settore tematico di applicazione.
Campo della transizione scuola-lavoro es. indagine longitudinale sugli sbocchi professionali dei laureati
condotta dallIstat.
25
Campo economico sociale es. Indagine sul bilancio delle famiglie italiane condotta dallIstat
---- si passa ora ad affrontare uno dei problemi pi difficili della ricerca sociale,il problema della misurazione,
si spiega come si possano trasferire dal piano teorico a quello empirico i concetti complessi delle scienze
sociali , stai emotivi, tratti psicologici, atteggiamenti politici, orientamenti di valore ----
Es. un test di abilit matematica una scala: si ipotizza lesistenza di un concetto generale quale l abilit
matematica che viene rilevato attraverso una serie di prove specifiche ( soluzioni di equazioni, problemi,
prove logiche) i risultati delle quali alla fine vengono sintetizzati in un unico punteggi
In psicologia e sociologia la tecnica delle scale trova la sua applicazione pi comune soprattutto nella misura
degli atteggiamenti, dove lunit danalisi lindividuo, il concetto generale un atteggiamento (insieme di
tendenze e sentimenti, pregiudizi e nozioni preconcette, idee, convinzioni di una persona nei confronti di un
particolare argomento ; esso quindi un credenza di fondo non rilevabile direttamente) e i concetti specifici
sono le opinioni (espressione empiricamente rilevabile di un atteggiamento).
La procedura che rileva gli atteggiamenti consiste nel sottoporre ai soggetti studiati una serie di affermazioni
in qualche modo legate allatteggiamento studiato, chiedendo di esprimere la loro opinione in proposito.
Combinando opportunatamente le risposte si perviene ad un punteggio individuale che stima la posizione di
un soggetto sullatteggiamento in questione.
Tuttavia la misura degli atteggiamenti se costituisce il pi importante campo di applicazione della tecnica
delle scale non ne rappresenta lunico. La tecnica pu essere utilizzata non solo per rilevare la propriet degli
individui attraverso le loro risposte ad una serie di stimoli gli elementi della scala ma anche per attribuire
un punteggio agli stimoli sulla base delle risposte degli individui. Es. possiamo attribuire alle professioni un
punteggio di prestigio sociale, oppure stabilire una graduatoria di popolarit fra gli uomini politici.4
La tecnica delle scale pu essere adoperata per rilevare le propriet non di individui ma di altre unit, per es
per giudicare lefficienza delle istituzioni.
26
Le variabili prodotte dalla tecnica delle scale non possono essere considerate pienamente cardinali, perch
scaturiscono da dimensioni sottostanti immaginate come propriet continue il grado di pregiudizio razziale
di una persona , cos come la religiosit, variano in maniera graduale tra gli individui e non sono misurabili
poich vi lincapacit di definire ununita di misura anche se la teoria delle scale tenta di dare una risposta
a questo problema. Per questo le variabili della teoria delle scale vengono chiamate quasi-cardinali.
Il quasi sta ad indicare l irraggiungibilit dellobiettivo di attribuire pieno significato numerico ai punteggi
delle scale.
Infine ci sono le scale auto-ancoranti, dove solo le due categorie estreme sono dotate di
significato, mentre tra di esse si colloca un continuum rappresentato da caselle, cifre, segmento - entro il
quale il soggetto colloca la sua posizione.
Le variabili prodotte dalla prima situazione sono senza dubbio ordinali, mentre nella seconda probabile che
scatti un processo di comparazione quantitativa. Per quanto riguarda il caso delle risposte auto-ancoranti
ancora pi probabile che si metta in moto una procedura mentale di suddivisione graduata dello spazio tra i
due estremi, suddivisione che per soggettiva e non valida per tutti. Per questo si parla di variabili
quasi-cardinali.
Nel caso delle variabili a parziale autonomia semantica preferibile offrire la possibilit di un punto neutro e
dellopzione non saprei. Il numero delle opzioni disponibili di solito 5 o 7, tranne nellintervista telefonica,
dove si usano domande con risposte binarie- si/no- per motivi di semplicit.
Nel caso delle graduatorie auto-ancoranti si possono usare diverse soluzioni come quella delle caselle vuote,
della sequenza di cifre oppure della linea continua.
Le preferenze possono essere espresse in termini assoluti (quando ogni domanda riguarda isolatamente una
singola questione) oppure in termini relativi (nella forma di confronti e scelte tra diversi oggetti).
preferibile scegliere scale con pi domande rispetto a scale con una domanda sola per tre motivi: la
complessit dei concetti rende improbabile la loro copertura con un singolo indicatore; una rilevazione
singola manca di precisazione, in quanto non riesce a discriminare in maniera fine tra le diverse posizioni dei
soggetti sulla propriet considerata; infine le singole domande sono pi esposte agli errori accidentali.
Le domande ad un solo elementi sono quindi meno valide, meno precise e meno attendibili.
Scale a pi elementi:
Scala di Likert
La procedura che sta alla base delle scale di Likert proposte da Likert negli anni 30, parliamo di unampia
variet di scale , scale additive, la tecnica pi adoperata nella rilevazione degli atteggiamenti - consiste
nella somma dei punti attribuiti ad ogni singola domanda.
27
Es. La procedura che sta alla base semplice ed intuitiva la medesima di questo es. test scolastico composto
da 30 domande, attribuiamo 1 punto esatto ad ogni domanda e sommando i vari punti lo studente che non
ha fatto errori prender 30
Il formato delle singole domande della scala di Likert rappresentato da una serie di affermazioni per
ognuna delle quali lintervistato deve dire se e in che misura daccordo. Di solito le alternative di risposta
sono cinque, da molto daccordo a fortemente contrario, originariamente erano 7.
E importante che siano previste risposte non so e che le affermazioni non siano tutte nello stesso senso.
Nella seconda fase, la somministrazione delle domande, la scala viene sottoposta ad un campione limitato
di intervistati con un certo livello di istruzione.
In seguito, nella terza fase (analisi degli elementi), si selezionano le domande e si valuta il grado di
coerenza interna ( item analysis) della scala, cio se la scala misura effettivamente il concetto in esame e
leffettiva capacit della scala di conseguire lobiettivo per il quale stata costruita.
infatti possibile che alcuni elementi non risultino in linea con gli altri e vadano quindi eliminati.
Gli strumenti utilizzati nella terza fase sono la correlazione elemento-scala e il coefficiente alfa.
Per la correlazione elemento-scala, si calcola per ogni soggetto il punteggio su tutta la scala e si calcola il
coefficiente di correlazione tra questo punteggio e il punteggio di ogni singolo elemento.
Il coefficiente di correlazione una misura che quantifica il grado di relazione tra due variabili cardinali e
indica se il punteggio di ogni singolo elemento si muove nella stessa direzione del punteggio globale che
tiene conto di tutti gli altri elementi.
Se ci non avviene la domanda non congruente con la scala e va eliminata.
Es. stiamo rilevando lautoritarismo, se ad una persona viene attribuito un punteggio globale elevato
sommando le risposte tutte le domande e quindi risulta autoritaria - essa dovr avere un punteggio
abbastanza elevato - risposte di tipo autoritario anche su tutti i singoli elementi della scala.
Il coefficiente alfa serve invece a valutare la coerenza interna complessiva della scala.
Esso si basa sulla matrice di correlazione tra tutti gli elementi della scala e il loro numero; pi alti sono i
valori (da 0 a 1) maggiore la coerenza interna alla scala.
I pi noto tra tali indici lalfa di Cronbach. (Vedi pag 227)
Nelleliminare gli elementi pi insoddisfacenti della scala il ricercatore terr conto di entrambe le correlazioni,
eliminer gli elementi con correlazione elemento-scala troppo bassa finch questa operazione produrr un
aumento di alfa, fermandosi non appena questo intervento produrr invece una sua diminuzione.
Infine si apre la quarta fase, quella dei controlli sulla validit e lunidimensionalit della scala. Tralasciando i
controlli di validit ( analizziamo un modo di procedere dominane nellaattuale ricerca psicologia dove le
scale sono pi semplici costituite da una decina di elementi e la scala diventa uno degli aspetti della
ricerca, per cui le scale cos semplici comprendono un numero ridotto di elementi e non si necessita di
soffermarsi sui controlli di validit), la tecnica pi efficace per il controllo di unidimensionalit quella
dellanalisi fattoriale.
Il suo scopo quello di ridurre una serie di variabili tra loro collegate ad un numero inferiore di variabili
ipotetiche tra loro indipendenti, in modo da controllare se dietro agli elementi di una scala che si presume
unifattoriale, vi sia un solo fattore o pi fattori.
Es. la correlazione fra il voto in algebra ed in geometria di un gruppo di studenti se si va bene in una delle
materie si andr bene anche nellaltra o viceversa potrebbe essere ricondotta al fatto che entrambi i vosti
sono influenzati da un fattore sottostante, la capacit di astrazione matematica.
I vantaggi della scala Likert consistono nella sua semplicit e applicabilit, mentre i suoi svantaggi sono il
28
fatto che i suoi elementi vengono trattati come scale cardinali pur essendo ordinali ((Ogni elemento una
variabile ordinale , di solito del tipo a parziale autonomia semantica, nel caso pi frequente a cinque
modalit, da completamente daccordo a compl. contrario,alle quali vengono assegnati in maniera arbitraria i
punteggi in scala semplice 1.25, che vengono poi trattati come scale cardinali per es. nella correlazione
elemento-scala)) e la mancata riproducibilit (dal punteggio della scala non possibile risalire alle risposte
delle singole domande lo stesso punteggio pu essere ottenuto da diverse combinazioni di risposte) e il
fatto che il punteggio finale non rappresenta una variabile cardinale(non abbiamo elementi per dire che la
distanza fra un punteggio di 14 ed uno di 18 sia la stessa che intercorre tra 8 e 12).
Scalogramma di Guttman
La scala di Guttman una scala cumulativa o scalogramma. Nasce con lobiettivo di fornire una soluzione al
problema dellunidimensionalit della scala di Likert ed cumulativa nel senso che costituita da elementi di
difficolt crescente - una sequenza di gradini e si presume che il soggetto che ha risposto
affermativamente ad una certa domanda deve aver risposto affermativamente anche a quelle che la
precedono nella scala di graduatoria di difficolt.
In questo modo, se gli elementi della scala sono perfettamente scalati, solo alcune sequenze di risposte sono
possibili; inoltre dal risultato finale possibile risalire alle risposte date dal soggetto ai singoli elementi della
scala (riproducibilit).
Questa tecnica prevede solo elementi dicotomici, cio ogni domanda pu avere solo due risposte opposte e
distinte. si/no favorevole-sfavorevole /
Le due risposte possibili vengono di solito contrassegnate con i numeri 0 e 1.
Es. scala di distanza sociale proposta negli anni 20.
In questa scala per determinare il grado di pregiudizio degli intervistati nei confronti di determinate
minoranze etniche veniva posta una sequenza di domande del tipo:
Lei sarebbe disposto ad accettare un nero(coreano, giapponese) come visitatore del suo paese?
come vicino di casa?
avere come amico personale?
sposare n nero?
E evidente che chi disposto a sposare un nero risponder n modo affermativo alle altre domane.
Indichiamo con 1 il positivo e lo 0 il negativo, in linea di principio dovremmo avere possibili solo le sequenze:
1111 1110 1100 -1000 -0000 , mentre ad esempio la sequenza 1011 non dovrebbe verificarsi.
1 positivo, 0 negativo, sommando i punteggi di ogni individuo su tutti gli elementi otterremo per ogni
soggetto il punteggio complessivo della scala.
La specificit della scala di Guttman sta nellanalisi dei risultati, quando si valuta la scalabilit degli elementi,
si scartano quelli meno coerenti col modello, si stabilisce un indice di scalabilit della scale e se accettarla o
meno.
In primo luogo si devono individuare gli errori della scala, cio le risposte che non si inseriscono nelle
sequenze previste nel modello.
Per questo si utilizza un indice (coefficiente di riproducibilit) che misura il grado di scostamento della scala
osservata dalla scala perfetta.
Vedi pag. 235-236
Questo indice pu variare da 0 a 1; per poter essere accettabile, il valore dellindice deve essere maggiore o
uguale a 0,90 (cio errori pari o inferiori al 10% delle risposte).
Esiste anche un altro indice, detto di minima riproducibilit marginale, che segnala il valore minimo al di
sotto del quale il coefficiente di riproducibilit non pu scendere, quali che siano le sequenze delle risposte.
Esso deve essere confrontato con il coefficiente di riproducibilit: solo se il secondo, oltre ad essere
29
maggiore di 0,90, anche nettamente superiore al primo, si pu affermare che la buona riproducibilit della
scala dovuta ad uneffettiva scalabilit dei suoi elementi e non alla distribuzione marginale delle risposte.
Lultima fase quella di attribuire i punteggi ai soggetti; per far questo si sommano i punteggi 0/1 ottenuti
nelle varie risposte.
I problemi della scala di Guttman consistono nel fatto che il punteggio finale ancora una variabile ordinale;
si tratta di una tecnica applicabile solo ad atteggiamenti ben definiti e scalabili; il modello risulta rigidamente
deterministico di fronte ad una realt sociale interpretabile solo attraverso modelli probabilistici che
contemplino la possibilit di errore ed il passaggio graduale tra le posizioni.
Differenziale semantico
La tecnica del differenziale semantico di Osgood si propone di rilevare con il massimo della standardizzazione
il significato che i concetti assumono per gli individui, che cosa ci significa per te.
Il modo pi semplice per scoprire cosa significa una certa cosa per una certa persona quello di
chiederglielo direttamente, ma solo persone intelligenti, istruite e con eccellenti capacit verbali possono
fornire dati utilizzabili.
La tecnica del differenziale semantico supera questi limiti in quanto si basa sulle associazioni che
lintervistato instaura tra il concetto in esame ed altri concetti proposti in maniera standardizzata a tutti gli
intervistati. In concreto si utilizzano una serie di scale auto-ancoranti nelle quali solo le categorie estreme
hanno significato autonomo, mentre il significato graduato delle categorie intermedie viene stabilito a
giudizio dellintervistato.
Es. invece di chiedere che cosa significa per lei il termine sofisticato?
Si porranno una serie di domande del tipo: sofisticato duro o soffice? Gradevole o sgradevole? Etc
Per aumentare la sensibilit dello strumento si chiede di classificare lintensit di ogni giudizio su una scala di
7 punti.
La lista di questi attributi bipolari non deve avere necessariamente relazione con loggetto valutato, e quindi
deve essere sempre la stessa: anche coppie di aggettivi apparentemente estranei con il caso in esame es.
maschile/femminile , giovane/vecchio risultano utili per rilevare significati pi profondi ed anche inconsci
che loggetto ha per lintervistato.
Il test risulta di facile somministrazione e di solito viene accettato di buon grado da parte degli intervistati, in
genere nella presentazione delle batterie di domande si raccomanda allintervistato di rispondere distinto ,
sena riflettere troppo su ogni coppia.
Il numero delle domande di solito va dalle 12 alle 50, in base al disegno della ricerca.
Il presupposto che questa dimensione non sia unidimensionale, non si articoli cio in una sola direzione
,ma presenti diversi aspetti che contribuiscono al significato complessivo di quelloggetto.
Si ritiene cio che attraverso lanalisi fattoriale sia possibile determinare quali sono le dimensioni
fondamentali che stanno dietro ai giudizio di un certo campione di soggetti intervistati.
In linea generale, si possono trovare tre dimensioni fondamentali che sottostanno ai vari giudizi: la
valutazione, la potenza e lattivit, in ordine di importanza.
La valutazione sembra rappresentare latteggiamento( favorevole-sfavorevole) verso un certo oggetto.
Es. buono cattivo / positivo-negativo / giusto- ingiusto)
Potenza es. duro-soffice / pesante leggero
Attivit: attivo-passivo/caldo-freddo/veloce-lento
Le risposte ottenute si prestano a diverse elaborazioni tra cui ricordiamo,per una descrizione sintetica
dellimmagine del soggetto sottoposto a valutazione, si pu utilizzare il profilo , cio una rappresentazione
30
grafica consistente nel congiungere con una linea il punteggio medio ottenuto da quelloggetto su ogni copia
di attributi.
Il contributo pi importante della tecnica del differenziale semantico proprio quello di aver introdotto la
multidimensionalit dei significati nella struttura degli atteggiamenti.
Test sociometrico
Il test sociometrico proposto da Jacob Moreno si pone lobiettivo di individuare le relazioni interpersonali
esistenti tra gli individui di un gruppo; infatti il suo campo di applicazione ideale rappresentato da una
classe scolastica.
Nella sua forma pi semplice il test sociometrico consiste in un questionario con poche domande, che
ruotano intorno al tema della preferenza e rifiuto nei confronti degli altri appartenenti al gruppo.
In questo modo si pu conoscere lo status sociometrico personale, cio il grado di prestigio di cui gode un
elemento rispetto agli altri componenti del gruppo, e la struttura sociometrico del gruppo, cio
lorganizzazione interna del gruppo (con sottogruppi, persone isolate, relazioni tra i sottogruppi, ecc.). La
tecnica quindi utile sia come strumento di diagnosi individuale che per cogliere la struttura relazionale del
gruppo.
Tuttavia esso adatto solo per gruppi strutturati perch necessario che sia delimitato nettamente il raggio
di scelta del soggetto.
Es. tra i tuoi compagni di classe, quali sono quelli che desidereresti ritrovare lanno prossimo? Indicane
quanti vuoi mettendoli in ordine di preferenza. Etc.
Lelaborazione dei dati semplice come la somministrazione del questionario-
Si costruisce una matrice quadrata avente sul lato sx e superiore lelenco dei componenti del gruppo, e si
registrano nelle celle corrispondenti ad ogni coppia le preferenze/rifuiti.
Una prima elaborazione rappresentata dallanalisi dello status sociometrico individuale, ce si compone
analizzando per ogni individuo il numero di scelte effettuate e di rifiuti ricevuti.
In questi ultimi tempi questa tecnica ha ripreso piede allinterno della network analysis (analisi di rete).
A partire dalle distanze fra determinati oggetti ci si pone lobiettivo di ricostruire lo spazio concettuale nel
quale questi oggetti sono collocati , nella mente degli intervistati se si tratta di dati dellintervista.
Il problema quello di capire se esiste uno spazio comune a tutti i rispondenti, poi si tratta di individuare
quante dimensioni ha questo spazio ed infine occorre dare un nome a queste dimensioni.
Esse sono tecniche matematicamente e concettualmente complesse che rientrano nella branca dellanalisi dei
dati.
31
Una ricerca basata sulle statistiche ufficiali
Il primo importante studio basato sulle statistiche ufficiali fu quello di Emile Durkheim le Suicide condotto
alla fine del diciannovesimo secolo 1897. Sulla base dei tassi di suicidio nella varie nazioni europee, D. riusc
a corroborare empiricamente la sua complessa teoria dellintegrazione sociale, teoria che risulta tuttora
valida e stimolante.
Le statistiche ufficiali
Le statistiche ufficiali differiscono dagli altri dati normalmente utilizzati nella ricerca sociale in specie da
quelli raccolti mediante indagini campionarie surveys per quattro aspetti:
- Le unit di analisi (che non sono rappresentate da individui ma da aggregati territoriali di individui es.
sezioni elettorali, comuni, province, per questo sono chiamati dati aggregati in opposizione ai dati
individuali. Il dato aggregato deriva da unoperazione di conteggio effettuata sugli individui di un
collettivo, in questo caso il collettivo il territorio.)
- Lampiezza della rilevazione ( le fonti statistiche tradizionali es. censimenti fanno riferimento
allintera popolazione, non ad un suo campione)
- Sono prodotte da organismi pubblici ( e da qui prendono lattributo di ufficiali). In Italia si istitu nel
1861 un Ufficio centrale di statistica, nel 1921 lIstat istituto centrale di statistica nel 1989 si istitu il
Sistema statistico Nazionale sistan con lo scopo di coordinare tutte le competenze e le attivit
statistiche disperse nei vari organi centrali e periferici della pubblica amministrazione
32
In almeno quattro settori di ricerca il ricorso alle statistiche ufficiali appare irrinunciabile per lo scienziato
sociale:
- Analizzare e descrivere la struttura della societ
- Ripartizioni territoriali di un paese
- Studi comparati tra le nazioni
- Studi nel tempo.
Il ricorso alle statistiche ufficiali non privo di limiti. I tre pi rilevanti sono:
- la natura dei dati non soddisfa le esigenze del ricercatore
- limitate a variabili fattuali cio dati oggettivi e comportamentali e quindi lesclusione di tutta la sfera
soggettiva delle opinioni, motivazioni, atteggiamenti
- non sono adatti per lanalisi dei comportamenti individuali.
3) LE TECNICHE QUALITATIVE
LOSSERVAZIONE PARTECIPANTE
E la pi classica delle tecniche qualitative, che unisce lassunzione dellosservare come strumento di
rilevazione del dato sociale alla completa immersione nel segmento di societ studiato
Questa tecnica dallantropologo Bronislaw Malinowski dallesigenza di studiare le societ primitive nellambino
di ricerche di tipo antropologico - etnografico, successivamente con la scomparsa delle societ primitive i
campi di studio sono diventate le societ moderne.
Losservazione partecipante pu essere applicata allo studio di tutte le attivit umane e di tutti i
raggruppamenti di esseri umani quando si vuole scoprire dallinterno qual la visione del loro mondo.
Ci sono dei settori nei quali questa tecnica particolarmente utile: quando si sa poco di un fenomeno
(nuovo movimento politico un evento sociale imprevisto come la ribellione), quando esistono delle forti
differenze tra il punto di vista dellinterno e quello dellesterno ( gruppi etnici organizzazioni sindacali
gruppi professionali medici etc), quando il fenomeno si svolge al riparo da occhi indiscreti (rituali religiosi
vita familiare), quando il fenomeno deliberatamente occultato agli sguardi degli estranei ( comportamenti
illegali)
33
Sociologia autobiografica: si ha quando losservatore partecipante si propone come strumento naturale di
indagine, il ricercatore intende studiare una realt nella quale ha fatto o fa lui stesso parte.
Losservazione partecipante viene abitualmente utilizzata nella ricerca sociologica per studiare due tipo di
gruppi:
- studi di comunit : (risentono maggiormente del modello etnografico) piccole societ autonome, collocate
in ambiti territorialmente definiti e dotate di un universo culturale chiuso che investe tutti gli aspetti della vita
- studi di subculture: subculture sviluppatesi allinterno di segmenti sociali delle societ complesse, che
possono rappresentare aspetti della cultura dominante, oppure essere con essa in particolare conflitto .
Esiste un filone di studi della cosiddetta etnografia organizzativa che consiste in unanalisi delle
organizzazioni come culture: dove oggetto di studio sono la cultura dellorganizzazione (le conoscenze
implicite condivise fra gli appartenenti alla stessa istituzione, i modelli di riferimento utilizzati per interpretare
la realt, le regole non scritte che orientano lazione individuale) e le modalit con le quali questa cultura si
esplicita nellazione e nellinterazione sociale (lorganizzazione formale ed informale, la costruzione di processi
decisionali, i rapporti interpersonali, i simboli, i riti)
Lo.p. stata utilizzata anche per studiare istituzioni sanitarie, politiche etc.
- osservazione palese : chiarire apertamente da subito i suoi veri obiettivi, e cio che vuole entrare nel
gruppo non perch ne condivida gli obiettivi ma solo per studiarlo
- osservazione dissimulata : oppure si pu infiltrare nel gruppo fingendo di unirsi ad esso e di essere un
membro come gli altri ( paradosso dellosservatore: volere osservare come la gente si comporta
quando non osservata). La principale giustificazione a sostegno di questa pratica che lessere umano
se sa di essere osservato si comporter presumibilmente in maniera diversa da quella abituale ( si
visto che ci accade nelle prime fasi, successivamente con la consuetudine il soggetto si comporta
secondo le proprie attitudini)
La controindicazione di carattere morale , spia, e nel caso in cui si fosse scoperti si potrebbe correre in
conseguenze non prevedibili.
Semi-dissimulato: alcuni membri della comunit sono a conoscenza della presenza dellosservatore
Per entrare nella comunit oggetto dello studio il ricercatore spesso si serve di un mediatore culturale cio
di una persona che gode della fiducia della comunit e che pu fare accettare losservatore da parte del
gruppo, egli, per le sue caratteristiche culturali, anche capace di capire le motivazioni e le necessit del
ricercatore.
Unaltra figura dellosservazione partecipante rappresentata dall informatore, persona che appartiene alla
comunit studiata che losservatore utilizza per acquisire informazioni ed interpretazioni dallinterno della
cultura studiata. testimoni privilegiati: persone in posizione strategica interlocutori privilegiati: persone
normali.
Brumer parla di concetti sensibilizzanti la ricerca guidata non su una tabula rasa ma da una particolare
sensibilit verso certi concetti piuttosto che altri.
Losservatore decide che cosa chiedere e forgia i suoi interessi nel corso della ricerca stessa.
34
Spradley dice che ogni situazione sociale definita da tre elementi: posto , attori e le attivit.
- contesto fisico: Il ricercatore dovr limitarsi alla descrizione dei luoghi, pi che parlare di un quartiere
deprimente dovr descrivere lo stato delle strade, i negozi,i mezzi di trasporto etc
- contesto sociale: si descriver lambiente umano, le persone che frequentano le strade, le finalit dei
loro spostamenti spesa, lavoro, bighellonare -. In unazienda si descriver lorganigramma del
personale e degli uffici.
- interazioni formali: sono quelle che avvengono fra individui allinterno di istituzioni ed organizzazioni,
nella quali i ruoli sono prestabiliti e le relazioni si svolgono in un quadro di vincoli prefissati. le
comunicazioni che avvengono in unazienda tra i vari livello gerarchici.
- interpretazioni degli attori sociali: lindividuo il soggetto, attivo e protagonista,il ricercatore osserva e
domanda e linterrogazione nella duplice forma di colloquio informale e intervista formale si affianca
allosservazione come strumento di rilevazione.
Registrazione dellosservazione
Il processo di registrazione dei dati di fondamentale importanza.
Nel caso dellosservazione partecipante essa assume essenzialmente la forma di stesura di appunti fatta
giorno per giorno: una sorta di giornale di bordo nel quale viene attentamente riportato, con ricchezza di
particolari e riflessioni personali, tutto quello che il ricercatore ha osservato nel corso della giornata.
Le note del ricercatore nascono dallinterazione fra osservatore e realt osservata, per ci constatano
essenzialmente di due componenti:
- la descrizione: dei fatti, accadimenti, luoghi, persona
- linterpretazione: data dal ricercatore a questi avvenimenti con le sue impressioni, riflessioni e reazioni.
Latto della registrazione pu essere scomposto in tre aspetti:
- Che cosa.. registrare abbiamo gi detto che le note devono riguardare la descrizione dei fatti,
linterpretazione del ricercatore ed ora aggiungiamo linterpretazione dei soggetti studiati.
La descrizione degli avvenimenti deve essere dettagliata ma il ricercatore non pu scrivere tutto e su
tutto, si consiglia di partire da descrizioni estensive per poi definire in maniera pi restrittiva il fuoco
delle analisi.
Linterpretazione del ricercatore di solito composta da due parti: riflessioni teoriche (rappresenta il
primo sforzo riflessivo finalizzato ad accumulare materiale e spunti) e reazioni emotive (il coinvolgimento
del ricercatore non va trascurato, essa rappresenta una forma di autoanalisi utile per il controllo di se ed
una utile documentazione a posteriori della dinamica creata da osservato-osservati per individuare
possibili distorsioni generate dalle proprie emozioni.
- Come.. registrare applicando il criterio della distinzione (fra descrizioni e interpretazioni del ricercatore
e dei soggetti, bisogna attribuire con meticolosit le valutazioni da chi le ha espresse) e della fedelt
(nel riportare commenti dei soggetti, loro punti di vista etc es. riportare fedelmente le espressioni
verbali)
35
Analisi del materiale empirico
Lanalisi del materiale empirico che un processo continuo che in parte si sviluppa nel corso della stessa
osservazione passa normalmente attraverso le seguenti fasi con la costante che si parte dal particolare per
arrivare al generale:
- Classificazione : nellosservare il mondo sociale , la configurazione fisica degli ambienti e dei gruppi, i
comportamenti degli individui, le azioni, il ricercatore coglier delle ricorrenze nel tempo cos come delle
similitudini tra diversi oggetti sociali che gli permetteranno di costruire delle classificazioni. ( il caso pi
semplice consiste nellindividuare le sequenze temporali con cui si svolge un avvenimento)
- Identificazione delle dimensioni delle tipologie stesse o tipi ideali si colgono le caratteristiche che
rendono i tipi uguali/differenti tra loro
Il modo pi generale di leggere il materiale raccolto attraverso losservazione partecipante consiste nella
identificazione dei temi culturali definizione di Spradley - che attraversano la societ studiata.
La ricerca dellosservatore p. deve muoversi partendo esaminando i dettagli muniti che sta studiando per poi
tracciare le linee generali del panorama studiato.
In merito allo stile di scrittura esso narrativo (prossimo allo stile letterario del racconto o della cronaca
giornalistica)e riflessivo ( la scrittura legata alla personalit ed alla cultura del ricercatore).
Osservazione in Microsociolgia
Losservazione partecipante nata come strumento per studiare le altre culture.
Dallo studio delle trib primitive essa stata trasferita allo studio delle trib urbane continuando ad avere
tuttavia come obiettivo coloro che venivano considerati diversi.
Successivamente si compreso che ogni campo dellattivit umana ha una sua specifica cultura che pu
essere analizzata attraverso lapproccio etnografico e lo strumento dellosservazione partecipante.
Anche gli aspetti organizzativi della nostra vita sociale hanno una loro cultura, anche i momenti pi banali
della quotidianit, gli atti meccanici della vita di tutti i giorni sono carichi di significati impliciti.
La Microsociologia lo studio delle piccole azioni quotidiane. Le azioni di tutti i giorni sono regolate da ben
definite norme (implicite) che governano le interazioni fra la gente. Ogni significato non individuale ma
sociale e viene appreso dallindividuo nel processo di interazione sociale con i suoi simili.
lEtnometodologia lo studio dei metodi e delle pratiche utilizzate dalla gente comune per decodificare il
mondo, dargli significato e compiere qualsiasi azione.
Letnometodologia si pone come obiettivo quello di svelare e studiare tali norme di cui il soggetto agente
lindividuo umano non ha consapevolezza pur nel suo continuo adeguarsi ad esse.
Limiti e risorse
I limiti della tecnica dellosservatore partecipante sono principalmente tre:
36
Essi sono un limite ma nel contempo una risorsa.
La tecnica ha anche delle difficolt di realizzazione ( grande investimento di tempo e di risorse psicologiche)
LINTERVISTA QUALITATIVA
Rilevazione mediante interrogazione
Lintervista qualitativa pu essere definita come una conversazione provocata dallintervistatore, rivolta ai
soggetti scelti sulla base di un piano di rilevazione ed in un numero consistente, avente finalit di tipo
conoscitivo , essa guidata dallintervistatore, sulla base di uno schema flessibile e non standardizzato di
interrogazione.
La prospettiva quella non di vedere con i suoi occhi ma di accedere alla prospettiva del soggetto studiato,
cogliere le sue categorie mentali, le sue interpretazioni, i motivi delle sue azioni.
Tipi di intervista
Le interviste qualitative si differenziano per il loro grado di standardizzazione cio per il diverso grado di
libert-costrizione che viene concesso ai due attori.
Abbiamo gi distinto strutture standardizzate questionario e non standardizzate -intervista
dellinterrogazione
Le interviste si caratterizzano per essere uno strumento flessibile , aperto, adattabile ma la flessibilit pu
presentarsi a diversi gradi per cui esse possono essere ricondotte a tre tipi: vedi pag 80-83
Interviste strutturate: sono poste le stesse domande nella stessa formulazione e nella stessa sequenza a
tutti gli intervistati (le domande sono predefinite sia nel contenuto che nella forma come in un questionario a
risposta aperta)
Interviste semi-strutturate: lintervistatore non pone delle domande preformulate ma utilizza una traccia
che riporta gli argomenti che deve toccare nel corso dellintervista (le domande sono predeterminate nel
contenuto ma non nella forma)
Interviste non strutturate: lintervistatore deve solo accertarsi che determinati argomenti siano toccati
nel corso della conversazione, secondo le formule ed i modi che ritiene pi adeguati in quella specifica
situazione (n forma n contenuto delle domande sono prestabilite)
- interviste con testimoni (osservatori) privilegiati persone intervistate non perch fanno parte del
fenomeno studiato ma in quanto conoscitori ed esperti di questo fenomeno del quale hanno una visione
diretta e profonda.
37
Essi sono adoperati soprattutto allinizio di una ricerca quando si ancora nel momento esplorativo
- Interviste di gruppo - focus groups: le persone intervistate devono essere innanzi tutto coinvolte tutte
in una situazione particolare ( vedere un film, hanno partecipato ad un evento sociale), gli individui
vengono poi intervistati in gruppo da un intervistatore che ha studiato preventivamente lelenco in
esame e che stimola e dirige la discussione in modo da far emergere le diverse interpretazioni, reazioni
emotive etc. Si tratta di un dibattito focalizzato su un evento ben preciso.
Conduzione dellintervista
- le spiegazioni preliminari: il problema di affrontare il contatto iniziale non tanto quello di superare la
diffidenza dellintervistato quanto quello di fargli capire che cosa vogliamo da lui. Si descriver lo scopo
della ricerca, spiegando perch abbiamo scelto lui e perch faremo certe domande
- le domande primarie e secondarie: primarie: quelle che introducono un nuovo tema o aprono un
nuovo interrogativo, secondarie: finalizzate ad articolare ed approfondire largomento della domanda
primaria
- le domande sonda: non sono delle vere e proprie domande ma degli stimoli che intendono essere
neutrali ed hanno la funzione di incoraggiare lintervistato ad andare avanti ed aprirsi.(es. ripetizione
delle domande, incoraggiamento attraverso espressioni di interesse, pause, richiesta di
approfondimento.
Una volta che le interviste sono state concluse ( effettuate e trascritte) , esse devono essere analizzate,
interpretate e viene steso il rapporto di ricerca.
Lanalisi dei dati centrata sui soggetti (differisce dallapproccio quantitativo nel quale centrata sulle
variabili) secondo una visione olistica nel senso che lindividuo osservato e studiato nella sua interezza.
I risultati sono presenti in una prospettiva di tipo narrativo, si sviluppa attraverso racconti di si episodi,
descrizione di casi spesso utilizzando le stesse parole degli intervistati per non alterare il materiale raccolto.
Il modo standard di procedere alla presentazione dei risultati il seguente: si sviluppa unargomentazione e
al suo sostegno ed illustrazione viene riportato un brano dellintervista.
Nel caso delle interviste strutturate i dati si possono analizzare secondo un approccio:
Nellintervista strutturata per i due approcci convivono poich le domande sono prestabilite.
Si ottiene cos una matrice dati dove i soggetti studiati sono classificati sulle stesse variabili.
I dati standardizzati , comuni a tutti gli intervistati, vengono analizzati con gli strumenti classici della
statistica, i testi integrali delle trascrizioni secondo le modalit della ricerca qualitativa.
Si consiglia di stabilire lo schema della matrice dati prima dellintervista, in modo che ogni intervistatore
sia a conoscenza di quali sono le informazioni che deve chiedere.
E uno strumento adatto alla scoperta ed alla comprensione liber dellintervistato che pu fare risaltare il
proprio punto di vista, pochi vincoli allintervistatore i cui studi possono andare oltre la formulazione
originaria del problema.
Definizione delloggetto
Tre azioni elementari stanno alla base delle tecniche di ricerca quantitativa:
osservare interrogare leggere.
Trattiamo la parte relativa alla lettura dei documenti prodotti dagli individui e dalle istituzioni.
Documento: qualsiasi materiale che fornisce informazioni su un dato fenomeno sociale che esiste
indipendentemente dallintervento del ricercatore.
Esso viene prodotto dai singoli individui o dalle istituzioni per finalit diverse da quelle della ricerca sociale
ma essa pu impossessarsene e utilizzarlo ai propri fini.
Essendo riprodotti senza lintervento dei ricercatore essi contengono informazioni non reattive , cio che non
risentono dellinterazione tra studiante e studiato e attraverso di essi si pu studiare il passato.
Documenti personali
I documenti personali hanno natura privata, essendo prodotti dallindividuo gente comune - per uso
personale.
Vengono chiamati documenti espressivi in quanto esprimono i sentimenti, gli affari ed in generale la
personalit di chi li produce.
- diari: scritti per uno strettamente personale e contemporaneamente allaccadimento degli eventi
39
ai diari che scrivono spontaneamente i soggetti possiamo accostare quelli commissionati, sono resoconti
giornalieri compilati su richiesta del ricercatore (inchiesta campionaria uso dei bilanci del tempo
consistenti in schede consegnate ai soggetti studiati, nelle quali la giornata viene suddivisa in frazioni di
tempo e per ciascuna di esse si chiede ad ognuno di annotare che cosa ha fatto per un certo periodo)
- lettere , testimonianze orali: resoconti della propria esperienza di vita sollecitate dal ricercatore. Le
testimonianze orali possono essere distinte in storie di vita narrazione allintervistatore della propria
vita e storia orale resoconto di specifici eventi dei quali il soggetto stato testimone
Documenti istituzionali
I documenti istituzionali sono prodotti da istituzioni oppure da singoli individui nel contesto dei loro ruoli
istituzionali.
IL CAMPIONAMENTO
Nella grande maggioranza dei casi la ricerca sociale non pu essere condotta sulla totalit della realt sociale
oggetto dello studio ma costretta a ritagliare un sottoinsieme di tale realt sul quale condurre lo studio.
La procedura di campionamento rappresenta la prima operazione empirica che il ricercatore sociale si trova a
svolgere.
Popolazione e campione
Anche se pu sembrare strano, la scelta casuale (tipica del campionamento) deve seguire regole ben
precise.
40
Un campionamento infatti pu essere definito come un procedimento attraverso il quale si estrae, da un
insieme di unit costituenti loggetto di studio (popolazione), un numero ridotto di casi (campione) scelti
con criteri tali da consentire la generalizzazione allintera popolazione dei risultati ottenuti studiando il
campione. La rilevazione campionaria presenta numerosi vantaggi alla ricerca sociale per quanto riguarda il
costo di rilevazione, i vantaggi nei tempi di raccolta dati ed elaborazione, vantaggi organizzativi (nel senso
che non necessario reclutare , addestrare e gestire le legioni di rilevatori che sono necessari nella
rilevazione totale) lapprofondimento e laccuratezza (la minore complessit organizzativa permette di
concentrare risorse sulla qualit dei dati)
Errore di campionamento
La tecnica del campionamento presenta tuttavia anche degli svantaggi. Infatti, se lindagine totale fornisce il
valore esatto del parametro che si vuole conoscere, lindagine campionaria ne fornisce solo una stima, cio
un valore approssimato. Ci significa che il valore in questione non certo, ma solo probabile, e inoltre
questa probabilit pu variare entro un certo intervallo (detto intervallo di fiducia).
La stima del campione sar quindi sempre affetta da un errore, che si chiama errore di campionamento.
Se per il campione probabilistico (cio scelto secondo una procedura rigorosamente casuale), la statistica
ci permette di calcolare lentit di tale errore.
Campionamento casuale semplice: Il caso pi semplice del campione probabilistico, in cui ogni individuo
della popolazione ha uguali possibilit di essere scelto per il campione.
Si devono estrarre gli individui senza riferimento a caratteristiche individuali; il ricercatore parte dalla lista
completa dei membri della popolazione, in questo modo potr assegnare ad ognuna unit un numero ed
estrarre poi casualmente i numeri corrispondenti ai soggetti destinati a formare il campione.
Raramente applicato sia perch la selezione completamente casuale sia perch molto costosa e non
sempre i dati sui membri dellintera popolazione sono disponibili.
Campionamento sistematico: simile al casuale semplice, ma con diversa tecnica di estrazione. I soggetti
si scelgono secondo un intervallo stabilito (uno su k)
K=N/n : N la popolazione di riferimento n le unit che vogliamo k lintervallo di campionamento.
Su 8235 abitanti N - , vogliamo estrarre 500 unit n avremo k=8235/500 ovvero 16.7, ununit ogni
16.
Si usa quando non c periodicit e quando la lista non completa (ad esempio nei controlli di qualit sui
prodotti effettuato nelle ricerche di mercato delle persone che escono dal supermercato oppure negli exit
polls). In ogni caso deve essere rispettato il requisito che tutte le unit abbiano la stessa probabilit di
essere incluse nel campione e inoltre
deve essere evitata ogni forma di scelta diversa da quella predeterminata dallintervallo di campionamento.
I vantaggi di questa tecnica consistono nel fatto che non necessario avere la lista di tutta la popolazione,
ma solo delle unit primarie; inoltre la rilevazione viene concentrata sulle unit estratte, con notevole
riduzione dei costi e una semplificazione della procedura.
Gli svantaggi sono una perdita di efficacia dovuta al fatto che i casi appartenenti ad una stessa unit dordine
superiore tendono in parte ad assomigliarsi e la teoria statistica legata molto complessa.
Es. devo costruire un campione nazionale di maestri elementari , le unit primarie sono i circoli didattici di
appartenenza (purch ogni maestro appartenga ad una sola unit primaria)e le unit secondarie sono gli
stessi maestri. Il campionamento si effettua in due stadi ovvero in due estrazioni successive, al primo stadio
si estrae un campione di unit primarie per es. 50 circoli didattici, al secondo si estrae casualmente un
campione di unit secondarie, maestri, da ognuna delle unit primarie selezionate nella prima estrazione.
La lista dei maestri serve solo per le unit primarie.
Campionamento a grappoli: si usa quando la popolazione risulta naturalmente suddivisa in gruppi di unit
spazialmente contigue (grappoli). Al posto delle unit elementari vengono estratti i grappoli, e poi tutte le
unit elementari appartenenti ai grappoli vengono incluse nel campione. Questa tecnica semplifica di molto
la rilevazione ed molto utile quando manca la lista delle unit elementari mentre esiste la possibilit di
estrarre con procedura probabilistica i grappoli.
Es. ricerca sul tifo calcistico si pu assumere come popolazione di riferimento linsieme dei tifosi che seguono
in treno la trasferta della squadra. Scegliere con campionamento sistematico due scompartimenti per ogni
vagone ferroviario ed intervistare tutti gli individui presenti negli scompartimenti selezionati.
Campionamento per aree: molto simile al campionamento a stadi e si utilizza quando mancano del tutto i
dati sulla popolazione oppure quando le liste sono incomplete. Esso offre maggiori probabilit di rilevare i
clandestini, residenti temporanei etc.
Campioni complessi: sono quelli in cui si utilizzano congiuntamente le tecniche ora presentate.
42
infine moltiplicando ciascuno di questi pesi per lampiezza n del campione si stabiliscono le Quote ovvero il
numero di interviste da effettuare in ciascuno strato.
Restando il vincolo dellammontare complessivo di ogni quota il ricercatore libero di scegliere a sua
discrezione i soggetti da intervistare.
i soggetti allinterno degli strati rispettando la proporzione (non c casualit). I limiti di questa procedura
consistono nel fatto che il ricercatore segua criteri utilitaristici di selezione e cerchi i soggetti pi facilmente
raggiungibili, enfatizzando in questo modo lerrore di non-risposta.
Campionamento a valanga: particolarmente utile in caso di popolazioni clandestine e per quei gruppi
poco numerosi dispersi per il territorio.
Esso consiste nellindividuare i soggetti da inserire nel campione partendo dagli stessi soggetti intervistati.
Si parte da un piccolo numero di individui dai requisiti richiesti, i quali sono utilizzati come informatori per
identificare altri individui dalle medesime caratteristiche, con il procedere delle rilevazioni il numero dei
nominati dovrebbe crescere esponenzialmente da qui lanalogia con la valanga.
Campionamento a scelta ragionata: in questo caso le unit campionarie non sono scelte in maniera
probabilistica, ma sulla base di alcune loro caratteristiche.
Viene adoperato quando lampiezza del campione assai limitata.
Es. nella scelta dei quartieri di una citt si pu decidere di includere nel campione un egual numero di
quartieri centrali e periferici, operai e borghesi.
Campionamento bilanciato: una forma di campionamento ragionato, nel quale si selezionano la unit di
modo che la media del campione, per determinate variabili, sia prossima alla media della popolazione (deve
trattarsi quindi di variabili delle quali sia nota la distribuzione nella popolazione). Esso viene usato
soprattutto in caso di campioni molto piccoli e quando le unit di analisi non sono individui ma istituzioni,
comuni etc.
Nel caso in cui si conosce la lista della popolazione, possibile procedere con campionamenti probabilistici.
Questo accade di solito quando loggetto di studio lintera popolazione (anche nazionale), perch esistono
anagrafi e liste elettorali che forniscono lelenco completo della popolazione.
Il problema si pone per i sottoinsiemi della popolazione, perch di solito non si in possesso di una lista
completa della popolazione, pensiamo per esempio agli studi su operai, immigrati, cattolici etc.
Quando invece lunit di analisi non un individuo , come appena accennato, ma un collettivo, la situazione
migliore perch in genere un aggregato di individui esiste in forma istituzionalizzata e registrata.
Ma non sufficiente che le liste esistano, bisogna anche che siano aggiornate, complete ed esenti da
43
duplicazioni. Il problema dell incompletezza il pi grave; in questo caso il ricercatore ha tre vie:pu
ridefinire la popolazione, trascurare gli esclusi oppure procedere ad unintegrazione del campione.
La dimensione ideale del campione dipende dalla distribuzione delle variabili studiate e dal tipo di analisi che
si intende fare. In generale lampiezza del campione dovr essere tanto maggiore quanto pi il fenomeno da
studiare minoritario.
Il problema del mancato contatto con i soggetti estratti soprattutto un problema di costi, esso pu
presentarsi in due forme:
- pu essere causato dalla difficolt di raggiungere i soggetti (non si pu superare un certo limite stabilito
dalleconomia generale della rilevazione, es non si pu immaginare che nellambito di una ricerca sulla
popolazione nazionale, una volta effettuato il sorteggio si possano intervistare i soggetti dispersi su tutto
il territorio)
- oppure dalla loro irreperibilit; (sempre per motivi di costi dopo 2-3 volte di mancato contatto con la
persona che si ricerca essa venga sostituita da un nominativo di riserva)
in ogni caso si tratta di problemi fastidiosi ma risolvibili.
Molto pi grave il problema dei rifiuti a rispondere, in quanto spesso coloro che non vogliono rispondere
sono diversi dagli altri e quindi non rappresentano una selezione casuale del campione originario.
Spesso si tratta di persone anziane, con baso titolo di studio, donne, individui che vivono soli, oppure per es
persone con certe caratteristiche, in uninchiesta sugli operai di uno stabilimento possono rifiutarsi di
rispondere quelli pi politizzati.
In questo modo si compromette la validit del campione stesso, che sovrarappresenter alcune categorie di
persone a scapito di altre.
La percentuale di mancate risposte in Italia varia dal 20% al 50%, a seconda della diversa
forma di contatto utilizzata (ad esempio di solito le interviste faccia a faccia hanno un tasso di risposta
superiore a quelle telefoniche).
Una soluzione per rimediare alle mancate risposte pu essere quella di sostituire i soggetti con altri scelti a
caso, ma questa tecnica spesso non efficace perch i sostituti assomigliano pi ai rispondenti che non ai
non rispondenti e potrebbero non rappresentare segmenti di popolazione dalle caratteristiche particolari
marginali ma un gruppo medio essendo stati estratti casualmente.
Per contrastare efficacemente il problema delle mancate risposte ci sono due metodi: il primo quello di
tornare il pi possibile dalla persone che non rispondono per incontrarle o convincerle; il secondo consiste
nella ponderazione, cio nellattribuire alle persone non raggiunte dallintervista le risposte medie date dal
gruppo sociale al quale esse appartengono.
Ponderazione
La ponderazione quella procedura con la quale modifichiamo artificialmente la composizione del campione
(attraverso operazioni matematiche nella fase di elaborazione) onde renderla pi prossima alla distribuzione
della popolazione. Essa si realizza attribuendo un peso ai casi campionati che varia a seconda delle loro
caratteristiche.
Le procedure di ponderazione sono molto complesse e ci limitiamo ad illustrare quelle le cui forme e le
situazioni pi elementari a seconda che si basino sulle
44
a) probabilit di inclusione delle unit nel campione,
La ponderazione si effettua a partire dalle probabilit di inclusione dei soggetti nel campione.
Spesso i campioni utilizzati nella ricerca sociale non corrispondono alla situazione ideale in cui tutte le unit
hanno eguale probabilit di selezione e che viene richiamata nellimmagine delle palline estratte dallurna.
Essa consiste nel campionare negli strati in modo deliberatamente non proporzionale alla loro presenza nella
popolazione per avere un numero di soggetti sufficiente per lanalisi statistica.
In questo caso la probabilit di inclusione non uguale per tutti i soggetti, ma nota; ed a partire da
questa conoscenza si calcolano i pesi per la ponderazione. Siamo nellalveo del campione probabilistico.
Nei casi in cui il campione non probabilistico oppure p affetto da errori di copertura o di non risposta gli
intervento di ponderazione consistono in puri e semplici interventi di aggiustamento finalizzati a contenere gli
errori e le distorsioni.
Il caso pi comune di ponderazione effettuata sulla base di conoscenze che si hanno sulla popolazione
quello della cosiddetta post-stratificazione e consiste nel correggere la distribuzione nella popolazione del
campione di alcune variabili in modo da farla corrispondere alla distribuzione della popolazione totale.
Loperazione si effettua moltiplicando ogni caso del campione per un coefficiente di ponderazione ( peso) pari
al rapporto quota teorica /quota rilevata della categoria di appartenenza.
Es. se i maschi invece di essere il 49% - quota teorica nota attraverso il censimento risultano essere nel
campione a rilevazione avvenuta il 58% - quota rilevata si moltiplicher ogni soggetto maschio per il peso
49/58=0.84 ed ogni femmina per il peso 51/42=1.21. Di fatto come se riducessimo un po il numero dei
maschi imponendo che ogni maschio conti non per ununit ma per 0.84 unit ed aumentassimo il numero
delle femmine imponendo che ognuna di esse conti per 1.21 unit.
Esso copre lerrore di copertura. In questo caso non siamo pi in presenza di campioni
probabilistici.
Il caso che si basa sulle conoscenze che si hanno sulle non-risposte copre invece lerrore di non-risposta e
consiste nel classificare le persone che si rifiutano di rispondere sulla base di un certo numero di variabili e
quindi le risposte raccolte vengono ponderate attribuendo loro un peso che tiene conto dei rifiuti.
Lo scopo di questa procedura quello di attribuire ai non rispondenti il comportamento medio delle persone
appartenenti al loro stesso gruppo sociale.
Es. nellintervista alluscita dai seggi elettorali exit polls lintervistatore classifica le persone che rifiutano
di rispondere sulla base di due variabili, genere e classe di et. Le interviste raccolte vengono ponderate
attribuendo loro un peso che tiene conto dei rifiuti a rispondere. Se sul totale delle persone interpellate per
lintervista le donne anziane erano il 9% ma di queste solo una parte 5% de totale ha risposto -, a quelle
che hanno accettato di farsi intervistare verr attribuito un peso pari a 9/5=1.8.
In questo caso il coefficiente di ponderazione peso corrisponde al reciproco del tasso di risposta per
ciascuna classe.
45
Un campione rappresentativo quando fornisce unimmagine in piccolo ma senza distorsioni della
popolazione; la rappresentativit dipende dalla casualit della procedura con la quale stato costruito.
Questa rappresentativit valida per tutte le variabili della popolazione.
Possiamo infine dire che se le stime del campione sono sufficientemente piccole, il campione
rappresentativo.
Ma praticamente impossibile realizzare una procedura completamente casuale, per cui la rappresentativit
del campione un obiettivo limite al quale ci si pu solo avvicinare minimizzando gli errori di copertura e di
non-risposta (accuratezza).
In parte lampiezza del campione condizione della rappresentativit: se il campione troppo piccolo, allora
lerrore di campionamento troppo elevato e il campione non pu essere definito rappresentativo. In parte
invece lampiezza del campione un requisito autonomo dalla rappresentativit, e dipende dal tipo di analisi
che vogliamo fare sui dati (monovariata, bivariata o multivariata).
Tra i due requisiti dovrebbe essere privilegiata lampiezza per la sua maggiore importanza.
importante anche la finalit della ricerca: se si tratta di uno studio descrittivo, il campione deve essere il
pi possibile rappresentativo, se invece lobiettivo di tipo relazionale, il campione pu anche non essere
perfettamente rappresentativo. In ogni caso il ricercatore pu trascurare laccuratezza della rilevazione,
applicando il pi possibile il campionamento casuale nonostante la sua difficolt.
LANALISI MONOVARIATA
Lanalisi monovariata consiste nellanalizzare le variabili singolarmente, ad una ad una senza metterle in
relazioni tra loro.
Tale distinzione deriva dalle caratteristiche della propriet che la variabile operativizza ed ha delle
conseguenze sulla scelta delle tecniche statistiche da utilizzare per analizzare le variabili stesse e le loro
relazioni.
Sono le caratteristiche logico-matematiche delle variabili a definire le procedure da seguire nella fase di
analisi dei dati. Le diverse variabili sono quindi analizzate in modo diverso sin dai
livelli pi elementari.
- Nominali: deriva da unoperazione di classificazione degli stati della propriet. I numeri assegnati alle
modalit (ammesso che siano numeri, potrebbero essere lettere o qualsiasi altro segno)non hanno alcun
significato numerico ma sono dei puri nomi. Es. religione assegniamo 1 cattolica 2 mussulmana dove i
numeri sono puramente arbitrari privi di significato numerico.
Le sole relazioni possibili sono quelle di eguaglianza (due persone cattoliche sono uguali per quanto
riguarda la religione) e di diseguaglianza (un cattolico ed un protestante sono diversi per religione)
- Ordinali: nasce da unoperazione di ordinamento degli stati della propriet. I valori numerici attribuiti
alle modalit mantengono le propriet ordinali dei numeri, nel senso che attribuiamo 1 per molto
insoddisfatto, 2 per poco soddisfatto etc.
Oltre alle relazioni di eguaglianza e diseguaglianza possono essere instaurate anche le relazioni dordine
e cio di maggiore e minore.
Non si pu affermare la distanza tra valori e quindi quanto un valore sia maggiore dellaltro
Il fatto che sulle variabili non siano consentite le stesse operazioni fa si che esse vadano analizzate con
procedure diverse sin dai livelli pi elementari.
La maggior parte delle tecniche sono state elaborate per le variabili nominali o cardinali, mentre le variabili
ordinali dovrebbero essere trattate come nominali perch non corretto assegnare loro le propriet delle
variabili cardinali. Ricordiamo che le propriet dei tre tipi di variabili sono cumulative,- la variabile successiva
ha insite le caratteristiche di quella che lha preceduta- e i tipi possono essere visti come tre livelli ordinabili
per cui le tecniche di analisi delle variabili a livello inferiore sono applicabili anche a quelle poste su un livello
superiore. Un caso particolare delle variabili nominali quello delle cosiddette variabili dicotomiche, che
hanno la propriet di poter essere trattate statisticamente come variabili cardinali non ponendosi il problema
delle distanze tra i due valori; per questo talvolta il ricercatore dicotomizza variabili a pi categorie
(politomiche) aggregando modalit dal significato prossimo. (es aggregando il partito votato in partito di
destra o di sinistra)
Abbiamo il materiale empirico grezzo si tratta ora di organizzarlo in una forma che possa essere analizzato
con gli strumenti dellanalisi statistica.
Nella ricerca quantitativa lo strumento adoperato la matrice dei dati che consiste in un insieme
rettangolare di numeri, dove in riga abbiamo i casi e in colonna le variabili; in ogni cella derivante
dallincrocio tra una riga e una colonna abbiamo un dato, cio il valore assunto da una particolare variabile
su un particolare caso. Per potere essere organizzate in una matrice, le informazioni devono avere due
caratteristiche: lunit danalisi deve essere sempre la stessa (ovvero per es. trattare di informazioni raccolte
tutti su individui oppure tutti su comuni , famiglie etc) e su tutti i casi studiati devono essere rilevate le
stesse informazioni.
Loperazione di traduzione del materiale empirico grezzo (il pacco di questionari, la pila di documenti) in
matrice viene chiamata codifica ed avviene con due strumenti, il tracciato record (la posizione di ogni
variabile nella riga della matrice es. la variabile genere si trova nella colonna 4 della matrice) e il codice (che
assegna ad ogni modalit della variabile un valore numerico es. nella variabile genere si assegna il valore 1
ad un maschio 2 ad una femmina).
Nella pratica di ricerca spesso tracciato record e codice sono inseriti allinterno del questionario.
Ogni riga della matrice corrisponde ad un caso un individuo/ un questionario - (leggendo ogni riga
possiamo ottenere il profilo di un caso), mentre ogni colonna corrisponde ad una variabile (leggendo una
colonna conosciamo le risposte date a quella domanda da tutti gli intervistati).
Ogni singola riga della matrice , ovvero ogni singolo caso trasformato in dati, si chiama record.
La matrice dati memorizzata su supporto informatico si chiama files, limmissione dei dati si chiama data
entry.
Distribuzione di frequenza
47
Una volta costruita la matricedati si deve analizzare, lanalisi verr condotta per variabili.
Per dare una rappresentazione sintetica di una colonna della matrice si usa la distribuzione di frequenza, di
una variabile una rappresentazione nella quale ad ogni valore della variabile viene associata la frequenza
con la quale esso si presenta nei dati analizzati.
Tale rappresentazione pu avvenire in forma tabellare, grafica o algebrica.
Ved pag 69
La distribuzione di frequenza pu essere assoluta, quando ci si limita semplicemente riportare accanto ad
ogni valore della variabile il numero dei casi che presentano quel valore ci siamo limitati a contare, - senza
alcun altro intervento oppure relativa, quando sono rapportate ad un totale comune.
Es. se vogliamo confrontare la distribuzione di frequenza della variabile titolo di studio nel gruppo studiato
con la distribuzione della stessa variabile in un altro gruppo, di diversa numerosit, non possiamo effettuare
direttamente il confronto.
Se il secondo gruppo costituito da 500 persone ed il primo 1200 per poter effettuare il confronto al fine di
sapere se il secondo gruppo presenta livelli di istruzione diversi dal primo dobbiamo riferire le situazioni ad
un totale comune, ovvero, dobbiamo relativizzarle ad un totale comune , queste nuove frequenze sono le f.
relative.
Un modo per operare questa relativizzazione la proporzione, che consiste nel dividere ogni singola
frequenza assoluta per il numero totale di casi della distribuzione;
Es. le persone senza titolo di studio sono 30 su 1200, la frequenza relativa 30/1200=0.025.
Con questa pratica si relativizzano le frequenze ad un totale pari allunit la somma delle proporzioni di
tutte le classi d come totale 1.
Il modo pi consueto di relativizzare una distribuzione di frequenza quello di relativizzarle ad un totale pari
a 100. Sono queste le percentuali, che si ottiene dalle proporzioni moltiplicandole per 100.
Es: 30*100 / 1.200 = 2.5
Il fatto di relativizzare le frequenze permette di effettuare dei confronti fra distribuzioni di frequenza della
stessa variabile ma ottenute da popolazioni di diversa numerosit.
Una forma particolare di distribuzione di frequenza costituita dalla distribuzione cumulativa di frequenza,
nella quale in corrispondenza di ogni valore dalla variabile viene riportata non la sua frequenza ma la somma
delle frequenze corrispondenti a quel valore e a tutti quelli inferiori.
Es. si sommeranno i valori delle frequenze relative proporzioni e percentuali anche degli stati inferiori.
Es. licenza elementare
Cifre decimali: di solito le percentuali si riportano con una cifra decimale oppure senza decimali se la base
delle percentuali minore di 100; questo perch sappiamo che esiste sempre un errore che pu essere di
diversi punti.
48
Arrotondamenti: se il decimale da eliminare si colloca tra 0 e 4, si arrotonda per difetto, se si colloca tra 0 e
5 si arrotonda per eccesso.
Il decimale zero: se si decide di riportare i decimali deve essere presente anche lo zero (es. 22,0%) poich
lo zero ha valore e dignit come gli altri numeri.
Quadratura: a causa degli arrotondamenti pu succedere che la somma delle percentuali sia diversa da 100;
in questo caso opportuno, per una pura questione di eleganza, alterare lievemente le cifre per avere delle
percentuali la cui somma sia 100.
Controlli di plausibilit: si tratta di controllare che tutti i valori delle variabili siano plausibili, appartengano
cio al ventagli di valori previsti dal codice.
Es. pag 77
Il codice della variabile prevede dei valori da 1 a 7, alcuni intervistati erroneamente indicano il valore 8 che
non presente.
Controlli di congruenza: si possono confrontare le distribuzioni di due variabili per far emergere eventuali
incongruenze tra le variabili stesse.
Es. se appaiono 512 occupati e poi nella domanda sul tipo di lavoro effettuato rispondono in 550 evidente
che hanno risposto alla domanda anche persone non occupate (possibilmente pensionati che si riferiscono al
loro lavoro). In questo caso per correggere lerrore o si risale alle informazioni originarie per individuare il
valore corretto da riportare nella matrice-dati oppure si sostituisce il valore implausibile con il valore
corrispondente a dato mancante.
Valori mancanti (missing values): ad un certo caso in una certa variabile viene assegnato valore mancante
se quel caso privo di informazioni su quella variabile. Es. se la rilevazione stata effettuata mediante
questionario si tratta dei soggetti che non hanno risposto a quella particolare domanda.
- non applicabile: il soggetto non deve rispondere, la domanda non deve essergli posta. Es domanda sui
figli a chi non ha figli
Lanalisi monovariata unanalisi puramente descrittiva dei fenomeni studiati, che si limita ad esporre come
ogni variabile distribuita fra i casi rilevati, senza porsi problemi sulle relazioni tra le variabili.
Es. ci dice che nel campione ci sono un tot di praticanti regolarmente ma non ci dice ancora se vanno a
messa di pi i giovani o gli anziani, uomini o donne etc.
49
Il ricercatore non si ferma mai ad essa poich il suo obiettivo quello di studiare le relazioni e le reciproche
influenze tra le variabili.
Essa rappresenta un passaggio inevitabile e necessario di ogni analisi bivariata e multivariata, perch solo
con questa analisi il ricercatore perviene a quella conoscenza diretta dei dati che gli permetter di analizzarli
con piena consapevolezza. Essa inoltre rappresenta una prima descrizione dei fenomeni analizzati e
contribuisce alla comprensione della struttura del campione e della sua rappresentativit.
Variabili nominali: la moda. Se la variabile nominale, lunica misura di tendenza centrale calcolabile la
moda. La moda la modalit di una variabile che si presenta nella distribuzione con maggior frequenza.
Individuare la moda corrisponde alloperazione che istintivamente facciamo quando, nel presentare i risultati
di una certa domanda, diciamo che la maggioranza ha risposto in un cero modo.
E lunico valore che possiamo cogliere poich non possiamo effettuare operazioni sui valori della variabile
nominale.
Variabili ordinali: la mediana. Nel caso delle variabili ordinali, oltre alla moda, poich i casi sono ordinabili,
si pu calcolare la mediana. Immaginiamo di ordinare , sulla base di una variabile ordinale, tutti i casi di una
distribuzione: se i casi sono 7 si tratter del 4 caso e cos via. La modalit assunta dalla variabile su questo
caso la mediana di distribuzione.
La mediana di una variabile dunque la modalit del caso che occupa il posto di mezzo nella distribuzione
ordinata dei casi secondo quella variabile.
Variabili cardinali: la media aritmetica. La media aritmetica la misura di tendenza centrale pi nota e
comune, ed data dalla somma dei valori assunti dalla variabile su tutti i casi divisa per il numero dei casi.
Se nella distribuzione di frequenza i dati sono raggruppati in classi, per il calcolo della media si assume il
valore centrale della classe.
La media si pu calcolare solo se la variabile cardinale, in quanto richiede operazioni che possono essere
effettuate solo se i valori hanno pieno significato numerico. (non si pu calcolare la religione media di ogni
nazione).
Tuttavia ci sono dei casi in cui preferibile usare la mediana anche nel caso di variabili cardinali, tipicamente
quando si desidera una misura meno sensibile ai casi estremi (come il reddito medio della popolazione in cui
se si utilizzasse la media potrebbero darsi situazioni di valori artificiosamente alzati per effetto di un numero
assai limitato di poche persone ricchissime.)
Se la distribuzione della variabile simmetrica attorno ad un valore centrale , moda, meridiana e media
coincidono.
In generale esse non coincidono e conviene utilizzare la media in quanto pi informativa ovvero sfrutta
tutte le informazioni che possediamo.
50
Misure di variabilit
La misura di variabilit o dispersione il secondo valore caratteristico di una distribuzione di frequenza e ci
dice, con un unico numero, quanto i valori sono addensati attorno al valore centrale oppure quanto sono
dispersi attorno ad esso.
Variabili cardinali:
Se la variabile standard, disponiamo di diversi modi per calcolare la variabilit della distribuzione.
Scostamento semplice medio: e costituito dalla media aritmetica degli scarti di ogni singolo valore della
media. gli scarti vanno considerati non in valore algebrico negativi e positivi ma in valore assoluto
tutti positivi trasformando i valori in positivi. Sommando i valori assoluti degli scarti dalla media e dividendoli
per il numero dei casi, otteniamo un valore chiamato scostamento semplice medio. E poco adoperato, si
predilige il successivo.
La deviazione standard (o scarto quadratico medio). Consideriamo ancora gli scarti dei singoli valori della
media. Per annullare il loro segno, invece di prenderli in valore assoluto, possiamo elevarli al quadrato (il
quadrato di un numero negativo positivo.)
Si sommano tutti questi scarti al quadrato, si dividono per il numero dei casi e poi si estrae la radice
quadrata di questo numero.
Otteniamo cos la deviazione standard detta scarto quadratico medio.
Varianza il quadrato della deviazione standard la varianza della distribuzione. Essa costituisce loggetto
primario di tutta lanalisi dei dati poich esprime la variabilit di una variabile
Coefficiente di variazione la deviazione standard risente della grandezza della media della variabile.
Se si vogliono confrontare tra di loro le variabilit di distribuzioni aventi medie fortemente diverse, conviene
utilizzare un indice di variabilit che tenga conto del valore della media. Otteniamo cos il coefficiente di
variazione che si ottiene dividendo la deviazione standard per la media.
51
Rappresentazioni grafiche della distribuzione di frequenza vedi p, 106 e ss
Le distribuzioni di frequenza oltre che in maniera tabellare possono essere rappresentate anche in forma
grafica .I grafici non forniscono informazioni aggiuntive rispetto alla forma tabellare ma sono di grande
efficacia comunicativa.
Diagrammi a barre (o ortogramma): poich una distribuzione di una frequenza unassociazione fra i
valori di una variabile e le corrispondenti frequenze, il modo pi semplice di rappresentarla graficamente
consiste nel riportarla su un piano cartesiano, disponendo su un asse i valori della variabile e sullaltro le
corrispondenti frequenze. Il diagramma pu essere a colonne (raffigurazione si amplia in orizzontale) a nastri
(in verticale).
Le barre devono essere separate tra loro ed equidistanti.
Le modalit saranno disposte secondo un ordine arbitrario quello cio che il ricercatore ritiene pi utile per
lillustrazione del problema.
Se la variabile ordinale le modalit saranno allineate secondo il loro ordine.
Diagrammi a barre appaiate e contrapposte.
Diagramma a barre suddivise: la figura costituita da una colonna rettangolare divisa in fasce di altezza
proporzionale alle frequenze delle varie categorie. E comoda quando si vogliono confrontare fra di loro le
composizioni di due o pi gruppi.
Diagramma a settori circolari o a torta: consiste in un cerchio con settori circolari proporzionali alle
frequenze
Se la variabile stata raggruppata in classi di uguale ampiezza il risultato sar simile a quello visto per il
grafico a barre.
Se stata raggruppata per classi di diversa ampiezza larea dei rettangoli deve essere proporzionale alla
frequenza poich le basi dei rettangoli sono diverse occorrer costruire dei rettangolo aventi altezza
proporzionale al rapporto fra frequenza ed ampiezza della classe (questo rapporto si chiama densit di
frequenza).
Un istogramma molto adoperato in demografia costituito dalla piramide di et, la presentazione
contrapposta degli istogrammi delle distribuzioni per et dei maschi e delle femmine in una determinata
popolazione.
Poligono di frequenza: se in un istogramma congiungiamo con dei segmenti i punti medi dei lati superiori
dei rettangoli, otteniamo una linea spezzata che chiamiamo poligono di frequenza.
52
Man mano che le classi di una variabile cardinale diventano pi numerose (e diminuiscono di ampiezza)la
spezzata (del poligono di frequenza)si approssima sempre di pi ad una curva continua, diventando tale
quando la variabile non pi raggruppata in classi ma riportata in ascissa nella sua formula continuativa.
La curva cos ottenuta detta curva di frequenza.
Ogiva: curva che viene rappresentata attraverso delle linee spezzate.
Altra questione riguarda la completezza delle informazioni, non possiamo mettere nel grafico tutti i numeri
della tabella , si deve cercare di introdurre i valori o nel grafico stesso o in calce.
La classificazione quel processo secondo il quale i casi studiati vengono raggruppati in sottoinsiemi
(classi) sulla base di loro similarit.
Le classi devono essere esaustive (tutti i casi devono trovare collocazione in una classe nessuno escluso) e
mutualmente esclusive (un caso pu appartenere ad una sola classe).
Questo processo pu essere condotto sulla base della somiglianza dei casi su una sola variabile,
classificazione unidimensionale, o su pi variabili, classificazione multi dimensionale.
La classificazione pi semplice quella in cui i casi sono classificati per la somiglianza relativamente ad una
sola variabile.
Es. gli individui possono essere classificati a seconda del partito votato, le regioni a seconda del tasso di
occupazione, le famiglie a seconda del numero dei figli.
In questi termini la determinazione delle classi corrisponde con quella delle modalit delle variabili.
Tuttavia, nel caso delle variabili nominali, in fase di analisi dei dati talvolta necessario aggregare alcune
modalit dal significato affine per poter procedere allanalisi bivariata.
Es. nellambito della variabile pratica religiosa, nella modalit pi volte a settimana un numero di casi
esiguo per cui si render necessario unirli a modalit pi prossime come pu essere la modalit una volta a
settimana
Questo processo spesso costringe il ricercatore a scelte insoddisfacenti e sforzate a causa della difficolt di
aggregare variabili troppo diverse tra loro; di solito quindi nellanalisi bivariata si tende a scartare le
componenti troppo esigue e non aggregabili.
Nel caso delle variabili cardinali (vale in linea di massima anche per le ordinali)il problema dellaggregazione
pi semplice, basta raggruppare le modalit in classi di maggiore ampiezza.
Non si pone il problema della prossimit di significato delle modalit da aggregare poich le classi contigue
hanno per definizione significati affini, trattandosi di modalit collocate con un continuum sottostante.
Esistono tre criteri di aggregazione: il primo puramente aritmetico e consiste nel raggruppare i valori
della variabile in intervalli di uguale ampiezza (es si pu aggregare la variabile et in intervalli di 5 o 10 anni
oppure i reddito di famiglie in intervalli di 10 milioni); il secondo nel raggruppare i valori assumendo a
riferimento il loro significato (let del figlio potrebbe essere aggregata sulla base della scansione scolastica:
53
0-2 anni asilo, 3-5 scuola materna; il reddito in base alle aliquote fiscali); il terzo si basa sulla configurazione
della distribuzione di frequenza, prendendo come soglia di divisione i quantili.
Nella pratica della ricerca empirica il criterio di aggregazione pi adoperato una combinazione del secondo
e del terzo,aggregare modalit dal significato affine facendosi guidare dalla numerosit dei gruppi.
Le classificazioni multidimensionale (sulla base di pi variabili es. gli individui possono essere classificati sulla
base del reddito e del titolo di studio) si possono dividere in tassonomie e tipologie.
La tassonomia una classificazione nella quale le variabili che la definiscono sono considerate in
successione, in una struttura gerarchica che procede per variabili di generalit decrescente.
Es. tassonomia dei mammiferi che sono una classe di vertebrati, a loro volta sono una classe dei cordati.
Lo schema che nasce ad albero.
La tipologia pi usata invece una classificazione nella quale le variabili che la definiscono sono considerate
simultaneamente. ( es precedente in cui la classificazione una considerazione congiunta di professione,
reddito e genere). Le classi di una tipologia sono dette tipi. Un tipo un concetto il cui significato si colloca
allintersezione dei significati delle modalit delle variabili che costituiscono la tipologia e quindi il suo
significato superiore alla semplice combinazione dei significati delle due variabili.
Il numero dei tipi pari al numero do combinazioni fra le modalit delle variabili, cio pari al prodotto del
loro numero di modalit.
Es. se il titolo di studio a 4 modalit elementari, medie, diploma, laurea il reddito ne ha tre alto, medio,
basso il genere due, la tipologia determinata dalle tre variabili ha 4*3*2=24 tipi
La tipologia ha uno scopo euristico, cio non solo una mera classificazione, ma ha finalit di
interpretazione e spiegazione; un punto cruciale nel collegamento tra dato empirico e teoria.
Es
Orientamento Rapporto emotivo
pedagogico
Caldo Freddo
Permissivo 1 indulgente 2 ansioso
nevrotico
restrittivo 2 iperprotettivo 4 autoritario
Quando ci sono in gioco pi variabili, il numero dei tipi risulta molto elevato (perch esso dato dal prodotto
delle numero delle modalit che formano le variabili), quindi necessario procedere ad una riduzione del
loro numero mediante unificazione di alcuni tipi in un unico tipo (riduzione dello spazio degli attributi).
Che pu avvenire prima della formazione della tipologia stessa riducendo le modalit delle variabili che
definiscono la tipologia, attraverso la fusione in un unico tipo dei tipi con significato affine, aggregazione a
tipi confinanti dei tipi con numero di casi esiguo.
54
La costruzione di indici
Un indice una variabile funzione di altre variabili, che sintetizza le informazioni contenute nelle singole
variabili operativizzando un concetto complesso del quale le singole variabili sono espressioni parziali.
Gli indici si possono costruire in diversi modi, ad esempio lindice additivo quello ottenuto sommando i
punteggi delle singole variabili.
Esistono anche altri indici ottenuti attraverso procedure pi complesse, con punteggi diversi a domande
diverse e anche con punteggi negativi. Le operazioni attraverso le quali si costituiscono le nuove variabili
(indici) possono essere di tipo algebrico o di tipo logico.
Spesso alle spalle di questa differenza ci sono diversi tipi di variabile: ad esempio sulle variabili nominali non
possibile effettuare operazioni algebriche.
Dati aggregati
Dati individuali e dati aggregati
I dati individuali sono quelli che hanno in comune lunit di analisi individuo, i dati aggregati sono quelli che
si riferiscono ad aggregati territoriali di individui. Comuni, province, regioni.
Normalmente i dati aggregati non possono essere utilizzati in forma grezza ma vengono trasformati in
rapporti statistici che hanno lo scopo di uniformare fra di loro i dati di modo che non risentano pi della
dimensione del territorio al quale si riferiscono.
Se consideriamo una variabile nominale riferita ad un livello individuale, notiamo che quando lunit di analisi
un aggregato di individui questa variabile d luogo a tante variabili cardinali quante sono le sue modalit.
Quindi quando lunit di analisi un aggregato, la variabile nella grande maggioranza dei casi cardinale.
Naturalmente la variabile cos ottenuta deve essere messa in rapporto con la dimensione della popolazione.
Es. se la variabile individuale titolo di studio con le 4 modalit noi possiamo contare per es nella regione
lombardia quante sono le persone per ogni modalit.
Pur non essendo distribuzioni di frequenza (non ci dicono come si distribuisce un totale fra i valori di una
variabile ma ci dicono quali valori assume quella variabile nel tempo e nello spazio), a queste serie
possibile applicare molte delle operazioni che si applicano alle distribuzioni di frequenza (tendenza centrale,
variabilit, ecc.); di esse si possono dare anche rappresentazioni grafiche.
Una rappresentazione grafica molto efficace per le serie territoriali il cartogramma, che raffigura la
distribuzione geografica del fenomeno studiato,
nel caso della serie storica si utilizza un piano cartesiano dove si colloca sullasse orizzontale la variabile
tempo e sullasse verticale la variabile in esame.
55
Differenza assoluta e relativa: la differenza assoluta tra due grandezze omogenee ha un significato diverso
a seconda dellentit delle grandezze stesse.
Es. la differenza di due anni fra un bambino di 2 ed uno di 4 una differenza rilevante mentre due persone
di 60 e 62 anni possono essere considerate coetanee.
Esempi simili possono essere fatti anche su valori percentuali.
Se indichiamo con a e b le due grandezze possiamo calcolare fra di loro la variazione assoluta e relativa.
la variazione relativa tra le due grandezze, dobbiamo fare la differenza tra le due e successivamente dividere
per quella che si assume per riferimento.
Es. variazione numero di morti per droga dai 242 del 1985 ai 292 del 1986 pu essere cos espresso
Assoluta: b-a = 292-242 = + 50
Relativa: ( b a/a) *100 = (50/242)*100 = 20.7
Naturalmente la variazione relativa risente fortemente della base di partenza, sempre necessari controllare
il dato iniziale.
Quando le misure sono valori percentuali bisogna distinguere se si parla di variazioni di punti percentuali
variazione assoluta tra punti percentuali e per cento alla variazione relativa rapporto fra percentuali.
Numeri indice: il numero indice una proporzione che serve a mettere in luce le variazioni di una serie
temporale o territoriale rispetto ad un tempo o a un luogo assunti come base di riferimento.
Es. il numero indice permette di rispondere alla domanda.
Se ponessimo eguale a 100 i morti per droga del 1985, a quando ammonterebbero nel 1986?
Si tratta di fare una proporzione.
242:100=292:x
X: 292/242 *100 =120.7
Il numero di morti per droga passato da 100 a 120.7.
Per calcolare il numero indice si divide la frequenza in esame per quella assunta come base e si moltiplica
per 100.
Esso non dipende dallunit di misura o di conto in cui espresso, essi sono cio numeri puri, e permettono
quindi di fare confronti con variabili pi disparate.
LANALISI BIVARIATA
E la relazione tra due variabili distinguendo se sono nominali o cardinai.
Si tratta di relazioni statistiche, ovvero probabilistiche, se affermiamo che c relazione fra titolo di studio e
reddito ovvero che al crescere di uno cresce anche laltro, questa affermazione vale a livello medio,
mediamente nei casi studiati stato riscontrato questo nesso. Ci non toglie che fra i nostri dati possano
anche essere presenti soggetti con la terza elementare che guadagnino pi di un laureato ma in generale
pi probabile il primo caso.
La statistica ci pu dire solo che esiste una relazione fra due variabili ma non ci pu dire se esiste
effettivamente una relazione causale tra le variabili esaminate (covariazione non significa causazione). Sar
il ricercatore a conferire a tale relazione il significato di nesso causale, sulla base di una teoria preesistente
che non ha alcun legame con lanalisi statistica.
Esamineremo solo lanalisi bivariata, in cui vengono considerate solo le relazioni tra due variabili, dette
rispettivamente dipendente e indipendente in quanto il ricercatore di solito interpreta le relazioni in termini
di nessi causali.
Le tecniche di analisi bivariata dipendono in maniera determinante del tipo di variabili considerate.
Se diconomizziamo le variabili abbiamo 4 variazioni:
56
Variabile
indipendente
Nominale Cardinale
Variabile nominale Tavole di /
dipendente contingenza
Cardinale Analisi della Regressione e
varianza correlazione
Se entrambe le variabili sono nominali, la tecnica usata sar quella delle tavole di contingenza; se
entrambe le variabili sono cardinali la tecnica sar quella della regressione-correlazione; se la variabile
indipendente nominale e quella dipendente cardinale si user la tecnica dell analisi della varianza.
Tavole di contingenza
Direzione delle percentuali (percentuali di riga e percentuali di colonna) ved pag 165
La tavola di contingenza consiste in una tabella a doppia entrata in cui collocata in riga una variabile
(variabile di riga) e laltra in colonna (variabile di colonna), mentre nelle celle definite dallincrocio fra le
righe e le colonne troviamo il numero di casi che presentano le corrispondenti modalit delle due variabili
(frequenza).
Es. si voglia studiare la relazione fra la variabile et e la variabile pratica religiosa a partire dai dati ottenuti
da uninchiesta campionaria.
Variabile riga: prativa religiosa
Variabile colonna : et
Celle: numero di casi che presentano le corrispondenti modalit delle due variabili (frequenze)
Lordine di una tavola di contingenza il prodotto delle righe per le colonne, mentre la
dimensione il numero di variabili in essa implicate.
Partendo da una tabella con valori assoluti (essa riporta il numero di casi aventi un certo valore sulla
variabile di colonna e sulla variabile di riga) possibile ricavare tre diversi tipi di percentualizzazione
ottenendo tre diverse tabelle percentuali:
le percentuali di riga (che si ottiene ponendo uguale a 100 la variabile di colonna e registrando quindi i
corrispondenti valori percentuali della variabile di riga), - abbiamo portato a 100 tutte le voci della prima
tabella, praticanti, saltuari, cos su 100 praticanti abbiamo rilevato che il 31% sono adulti , il 45% anziani
le percentuali di colonna (che si ottiene ponendo uguale a 100 la variabile di riga e registrando quindi i
corrispondenti valori percentuali della variabile di colonna) portando a 100 le persone per ogni fascia di et
abbiamo visto quanti in percentuale di questi sono praticanti, saltuari etc.
le percentuali sul totale (che si ottengono percentualizzando tutte le frequenze di cella sul totale
generale). Se la tabella stata costruita per analizzare la relazione tra le due variabili questultima
percentualizzazione inutile. su 100 sappiamo quanti sono praticanti e giovani, saltuari e giovani e cos
via
necessario che il ricercatore ponga molta attenzione nella scelta delle percentuali.
Agli effetti dellanalisi della relazione fra due variabili nominali una corretta mentre laltra errata.
57
Un criterio che ci pu aiutare nella scelta il seguente:
- si sceglie la percentuale di colonna quando si vuole analizzare linfluenza che la variabile posta in
colonna ha su quella posta in riga
- si sceglie la percentuale di riga quando si vuole analizzare linfluenza che la variabile poste in riga ha su
quella posta in colonna
in altri termini, si definisce qual la variabile indipendente e si percentualizza allinterno delle sue modalit.
La lettura dei dati a questo punto avverr attraverso le colonne (righe se abbiamo percentualizzato esse) di
percentuali.
Talvolta, quando gli obiettivi sono diversi dallobiettivo appena esaminato di studiare la relazione causale
esistente fra variabile indipendente o dipendente, pu essere utile calcolare invece laltra percentualizzazione
oppure calcolarle entrambe.
Es. lobiettivo quello di analizzare la composizione di chi va a messa tutte le domeniche , vogliamo sapere
su 100 praticanti quanti sono anziani, giovani senza porci il problema di sapere se gli anziani praticano pi
dei giovani.
In questo caso adopereremo le percentuali di colonna.
Cos otteniamo quello che possiamo chiamare un profilo per et dei praticanti.
La tecnica per la sua apparente semplicit , viene in genere trascurata nei manuali di statistica, di fatto si
tratta di una semplicit solo apparente e per questo ingannevole che induce facilmente ad errori sia di analisi
che di interpretazione.
Gli elementi caratterizzanti di una buona presentazione delle tavole sono cinque.
Parsimoniosit: la tabella deve riportare solo le percentuali che servono allanalisi (es. solo quelle di riga).
Totali: ogni riga o colonna finisce con il totale 100 per far capire immediatamente al lettore in che direzione
sono state calcolate le percentuali.
Basi delle percentuali: sotto al totale deve essere sempre riportata la base percentuale, cio il numero
assoluto di casi sui quali stata operata la percentualizzazione.
Intestazione: le tabelle devono sempre essere intestate per poter essere auto esplicative e contenere le
informazioni per la sua comprensione.
Somme di percentuali: la somma di percentuali legittima se i valori sommati appartengono alla stessa
Distribuzione percentuale , ma errata se le percentuali sommate appartengono a due diverse distribuzioni.
58
Es. nel caso della pratica religiosa egli sceglier a seconda delle convenienze di ragionare si praticanti o non
praticanti, certamente non sceglier mai di lavorare sui saltuari poich sono una categoria residua rispetto
agli altri due.
Nel caso di variabili ordinali la modalit scelta sar sempre una categoria estrema della variabile dipendente
(praticanti o non praticanti) e risulta utile aggregare le modalit estreme e contigue della variabile
dipendente per una maggiore chiarezza e per una maggiore pulizia del dato.
Un sistema spesso utilizzato per interpretare le tabelle consiste nell indice di differenza percentuale, cio
Nel calcolare la differenza tra due modalit di risposta o tra le risposte positive e negative; esso permette di
leggere i dati tenendo conto simultaneamente dellandamento di pi modalit della variabile dipendente.
Forma monotica: si ha quando al crescere di una variabile cresce anche laltra (al crescere della dimensione
del comune cresce e insoddisfazione) in questo caso positiva, mentre negativa se la vediamo allinverso
(al crescere della dimensione del comune diminuisce linsoddisfazione)
59