Sei sulla pagina 1di 96

1

8829 - METODOLOGIA DELLA RICERCA SOCIALE


Prof. Piergiorgio Corbetta

Conoscenze e abilit da conseguire
Allo studente verranno presentate le principali tecniche di ricerca sociale;
nella parte conclusiva del corso si dedicher un certo spazio anche
allanalisi dei dati. La finalit del corso quella di fornire le conoscenze
specifiche necessarie per a) effettuare una ricerca empirica elementare e b)
saper valutare criticamente un rapporto di ricerca.

Programma/Contenuti
Argomenti del corso:
1 - La traduzione empirica della teoria
2 - L'inchiesta campionaria
3 - Le fonti statistiche ufficiali
4 - L'analisi dei dati: analisi ad una variabile
5 - L'analisi dei dati: analisi a due variabili

Testi/Bibliografia
Piergiorgio Corbetta, La ricerca sociale: metodologia e tecniche,
Bologna, Il Mulino
Vol II. Le tecniche quantitative: Cap. I: par. da 1 a 6. Cap. III: par. da 1 a
8. Cap. V: tutto
Vol IV. L'analisi dei dati: Cap. II: par. 1, 2, 3, 8, 12, 13. Cap. III: par. 1,
2 (con esclusione di 2.5, 2.6), par. 7.1 (solo questo sotto-paragrafo del
par. 7)

Alternativamente:
Piergiorgio Corbetta, Metodologia e tecniche della ricerca sociale,
Bologna, Il Mulino
Cap. III: par. da 1 a 6. Cap. V: par. da 1 a 7. Cap. VII: tutto. Cap. XII:
par. 1, 2, 3, 8, 12, 13. Cap. XIII: par. 1, 2 (con esclusione di 2.5 e 2.6),
par. 7.1 (solo questo sotto-paragrafo del par. 7).

Nota: i due programmi sono identici. Si tratta dello stesso volume
pubblicato sia in modo frazionato in quattro volumi (di questi il primo e
il terzo non servono per questo esame) sia in forma di unico volume.

Modalit di verifica dell'apprendimento
Esame scritto: test a risposte multiple.
2

Orario di ricevimento
Mercoled ore 10-11 presso il Dipartimento di scienze dell'educazione, Via
Filippo Re 6

Calendario Corso
N
Lez
Argomento
1 Introduzione con presentazione ricerche in educazione
2 Ricerca quantitativa e ricerca qualitativa
3 Struttura della ricerca, teoria, ipotesi

4 Loperativizzazione dei concetti
5 Le variabili
6

7 Linchiesta campionaria
8
9

10 Le fonti statistiche ufficiali
11
12 La matrice dei dati

13 Analisi monovariata
Distribuzioni di frequenza; rappresentazioni tabellari e grafiche
14 Dati aggregati e rapporti statistici
15 Serie temporali e territoriali; numeri indice

16 Analisi bivariata: Tabelle a doppia entrata
17
18 Esercizi di analisi dati

19 Analisi bivariata: diagrammi di dispersione
20
21 Esercizi di analisi dati

3
LUCIDI UTILIZZATI ALLE LEZIONI
Precisazione importante: questi lucidi sono pensati per gli studenti che seguono le lezioni, come
promemoria di quanto fatto a lezione. Non sono assolutamente sufficienti per superare lesame, n per chi ha
frequentato, n per chi non ha frequentato. Le domande del test desame, infatti, fanno riferimento agli
argomenti trattati nel libro adottato, molti dei quali, per la limitatezza del tempo a disposizione delle lezioni,
non sono stati in queste trattati e quindi non compaiono sui lucidi che seguono.
Delle dispense che seguono, le Lezioni n. 1 e n. 2 servono per illustrare i vari tipi di ricerca sociale; gli
esempi ed i temi in esse trattati, tuttavia, non entrano nelle domande del test desame.
La numerazione delle lezioni che seguono non corrisponde allindice delle lezioni sopra riportato: alcuni
degli argomenti delle lezioni che seguono vengono trattati in due lezioni

LEZIONE N 1
ALCUNI ESEMPI DI RICERCHE EMPIRICHE IN CAMPO
EDUCATIVO

Xin Ma, Bullying and Being Bullied: to What Extent Are Bullies also
Victims?, in American Educational Research Journal, 2001, pp. 351-370.

Introduzione (rassegna della letteratura)
- Bullismo: una forma di aggressione attraverso la quale uno studente o un
gruppo di studenti ripetutamente disturba una vittima verbalmente o
fisicamente senza essere provocato (es. p. 452)
- Effetti devastanti del bullismo, che spesso arrivando a conseguenza
violante e disastrose sia per le vittime che per gli aggressori

Caratteristiche salienti degli aggressori:
- famiglie con genitori autoritari, ostili, che rifiutano i figli
- precedenti di comportamenti aggressivi
- non c relazione con caratteristiche socio-economiche
- genere: pi maschi che femmine (3/1)

Caratteristiche salienti delle vittime:
- studenti senza amici nella scuola e eccessivamente protetti dai genitori
- non incidono caratteristiche fisiche (sovrappeso, occhiali, razza, o altre
diversit es. nel vestire, nel dialetto...)
- scarse capacit relazionali, capacit di difendersi o di vendicarsi
- bassa autostima, alta ansiet sociale, paura delle valutazioni negative dei
pari

Caratteristiche del contesto (scuola)

La scuola pu far molto per ridurre il bullismo, in quanto gli atti relativi si
compiono in genere negli edifici scolastici:
4
- disciplina, intensa supervisione, assistenza psicologica per studenti,
formazione per gli insegnanti

Metodo

Questionario fatto i due scuole del 6 grado (N=6800) e dell8 grado
(N=6800), indagando attraverso le domande del questionario se gli
studenti fossero mai stati oggetto di prepotenze o se essi avessero mai
compiuto atti di bullismo [Questionario p. 358]

C. Goldenberg, R. Gallimore, L. Reese and H. Garnier, Cause or Effect? A
Longitudinal Study of Immigrant Latino Parents Aspirations and
Expectations, and Their Childrens School Performance, in American
Educational Research Journal, 2001, pp. 547-582

Studio longitudinale, durato sei anni (dal kindergarten al 6 grado) su 81
bambini latino americani dellarea di Los Angeles, e sui loro genitori. Sul
tema della profezia che si autoadempie: se le aspettative di genitori ed
insegnati sul rendimento scolastico di un bambino sono elevate, il suo
rendimento sar pure elevato. In particolare pare che il basso successo dei
bambini latino-americani nelle scuole americane sia dovuto al basso livello
di aspettative dei loro genitori.

Strumenti

a. Aspirazioni e attese dei genitori
Ogni anno stata fatta unintervista in autunno ai genitori. Domande su
loro aspirazioni e previsioni
a1. Aspirazione: Quanto lei vorrebbe che suo/a figlio/a proseguisse negli
studi?
a2. Attesa (previsione): Fino a quanto lei pensa che suo/a figlio/a prosegua
negli studi?
Per entrambe: finire le elementari / le medie / le superiori / frequentare il
college / frequentare luniversit / laurearsi.

b. Risultati scolastici
Basati sulla valutazione degli insegnanti su 4 temi: andamento generale dei
voti nellanno, andamento nella capacit di lettura, interesse-motivazione,
capacit di apprendimento

5
Fra i risultati emerge non solo, come noto, che le aspettative dei genitori
influenzano il rendimento scolastico dei figli; ma anche linteressante fatto
che le aspirazioni dei genitori sono a loro volta influenzate dal rendimento
scolastico dei figli


6
K. J. Quirk, T.Z. Keith e J.T.Quirk, Employment During High School and
Student Achievement: Longitudinal Analysis of National Data, in The
Journal of Educational Research, Sept-Oct, 2001, 4-10.

Il fatto che lo studente lavori, che effetto ha sul rendimento scolastico
(studenti delle superiori)?
Incertezze della ricerca sul problema. Effetti sia positivi che negativi.
Alcuni ricercatori hanno trovato effetti leggermente positivi se il lavoro
non supera le 15-20 ore settimanali; negativi se le supera. Nessuno studio
longitudinale.

La ricerca
Campione nazionale di 15.552 studenti dal8 al 12 grado. Studio
longitudinale (intervistati ogni due anni).

Risultato: influenza curvilinea dellesperienza di lavoro sul rendimento
scolastico: chi ha lavorato fino a 12 ore alla settimana va meglio di chi non
ha lavorato; gli studenti con lavoro oltre le 12 ore alla settimana sono
quelli che vanno peggio a scuola.

Avvertenza dei ricercatori: bisognerebbe differenziare lanalisi a seconda
del lavoro compiuto (lavoro nei campi, in fabbrica, baby sitting...):
7
J. W. Wimer, C.S. Ridenour, K. Thomas e A.W. Place, Higher Order
Teacher Questioning of Boys and Girls in Elementary Mathematics
Classrooms, in The Journal of Educational Research, Nov-Dec, 2001,
84-92.

Ricerca sul diverso rendimento in matematica di maschi e femmine (le
Higher Order Questions sono domande fatte agli studenti che non sono
basate sulla memoria di quanto studiato, ma su un ragionamento
applicativo di queste conoscenze). Bambini e bambine mostrano stesso
entusiasmo per la matematica nella scuola elementare (81% bambine e
84% maschi). Nella prima adolescenza le relazione comincia a cambiare
(72% maschi e 61% femmine). Nella high school di 25% fra i ragazzi e
15% fra le ragazze.
8
L. Alczar et. al., Why are teachers absent? probing service delivery in
Peruvian primary schools, in International Journal of Educational
Research, 45 (2006): 117-136.

1. Introduction
- Importanza in campo educativo della motivazione degli insegnanti.

2. Literature review: what do we know about teacher absence?
- Pochi studi sistematici, men che meno nella nazione studiata (Per)

3. Study approach and methodology
- Studio finanziato dalla World Bank sullassenteismo in campo educativo
e sanitario in 6 nazioni: Peru, Bangladesh, Ecuador, India, Indonesia,
Uganda.
- Visite non annunciate in un campione di 100 scuole elementari distribuite
in 7 regioni rappresentative della costa, sierra e giungla. Due visite: una
per rilevare le presenze, una seconda per intervistare gli insegnanti. Oltre
al questionario individuale (agli insegnanti), anche schede per dati sulla
scuola.

4. Absence and incentives: conceptual framework and Peruvian
institutional context
Fattori che intervengono casualmente sul coinvolgimento degli insegnanti
(incentivi): analisi della letteratura:
Institutional context: stabilit del lavoro, benefici contrattuali (ferie,
pensione...)
Modalit di assunzione: concorsi nazionali, clientele locali...
Salare and bonuses
Monitoring and discipline

5. Descriptive results: what is the extent of absence and who is absent?
% assenza
Bangladesh 16
Ecuador 14
India 25
Indonesia 19
Peru 11
Uganda 27

9
Segue tabella sulle motivazioni dellassenza addotte dal direttore

6. Why are school teacher absent?
Analisi multivariata
6.1. Caratteristiche della comunit
. povert (dellarea)
. lontananza (della scuola)
6.2. Caratteristiche demografiche dellinsegnate
. et, genere, stato civile
6.3. Incentivi finanziari
. salario
6.4. Caratteristiche del contratto
6.5. Controllo e disciplina
. controlli dallalto dalla gerarchia
. controlli dal basso dalle famiglie
. incentivi non economici: . legami comunitari
. condizioni di lavoro (infarastrutture ed
equipaggiamento
. competizione da parte di scuole private
10
D. Filmer, Gender and wealth disparities in schooling: Evidence from 44
countries, in International Journal of Educational Research, 43 (2005):
351-369.

1. Introduction
Dichiarazione dei diritti delluomo delle nazioni unite del 1948: istruzione
primaria fra i diritti umani. Oltre 50 anni dopo lobiettivo non ancora
raggiunto.
Ricerca condotta sui dati del Demographic and Health Surveys (DHS) in
oltre 40 nazioni

2. Why would one expect differences in schooling?
Genere
- diverso valore dato dalle famiglie allistruzione dei maschi o delle
femmine
- effetto se le scuole sono segregate per genere o se il corpo insegnante
prevalentemente maschile o femminile
- diverso ruolo di M o F nella produzione familiare: es. cura familiare
(sorelle maggiori che devono prendersi cura dei fratelli e sorelle piccoli),
lavoro nei campi, in casa (es tappeti)
Ricchezza-Povert
Il reddito familiare influenza linvestimento nella scuola.
Genere e reddito
Poco studiato. P. es. in area rurale potrebbe essere pi facile trovare lavoro
per i ragazzi non istruiti (lavori nei campi) per cui ai ragazzi non
converrebbe andare a scuola. Allopposto nelle zone dove le ragazze
sostituiscono la madre nella cura domestica, c disincentivo ad andare a
scuola per le ragazze.

3. Data and methodological approach

Base dati per 44 nazioni, solo paesi in via di sviluppo, met della
popolazione mondiale, campioni nazionali di famiglie fra i 2000 e i 87.000
casi!
Istruzione, tre domande:
se sono mai stati a scuola
pi alto livello raggiunto
voto finale avuto
Per coloro che avevano fra 6 e 25 anni chiesto anche se stavano
frequentando una scuola
11
Variabili utilizzate:
- frequenza: % di ragazzi fra 6 e 14 anni che frequentano una scuola
- adempimento: % di giovani fra 15 e 19 anni con i 5 anni delle elementari

Ricchezza-povert: con dati individuali, vantaggio di poter misurare le
differenze entro le nazioni; tuttavia variabile molto difficile da misurare
(non si pu fare domanda diretta su reddito). Utilizzati indicatori su
possesso di beni. Esempio (sommati punteggio 0-15):
- 6 beni posseduti (radio, frigo, tv, bicicletta, moto-auto...)
- 3 indicatori su approvvigionamento acqua
- 3 su servizi igienici
- 1 su elettricit
- 1 di persone in stanza
- 1 su materiale del pavimento della casa

Misure delle disuguaglianze nellistruzione per genere e ricchezza
Disuguaglianze per genere: rapporto fra M/F frequentanti
Disuguaglianze per ricchezza: (% bambini frequentanti nel 50% delle
famiglie pi ricche) / (% bambini frequentanti nel 50% delle famiglie pi
povere)

4. The magnitude on gender and wealth inequalities in education

Disuguaglianze per genere: particolarmente alte nellAfrica centrale e
occidentale; poi in Asia meridionale; poi in Nord Africa. In 7 nazioni la
tendenza opposta, concentrate in America latina (es Brasile...)
Disuguaglianze per reddito: maggiori in Africa centrale e occidentale, Asia
meridionale, Nord Africa (v. tab. 1)

Confronto fra disuguaglianze di genere e di reddito su istruzione (v. fig. 1)
Linea dei 45: disug di genere e di ricchezza sono eguali
Quasi tutte le nazioni sono sopra questa linea: le diseg. nellistruzione per
reddito sono maggiori di quelle per genere.

Tre gruppi:
- nazioni lungo lasse verticale (Nigeria, Tanzania): diseg. dovute al genere
basse, dovute al reddito alte;
- nazioni con entrambe le disug alte (es. Pakistan)
- nazioni con disug entrambe alte, ma assai maggiore quella per reddito
(es. Mali, Marocco)
12






Problemi della ricerca nelle scienze sociali (Robertson, 34):
- Reattivit
- Individualit
- Complessit
- Non-manipolabilit
- Appartenenza

13
LEZIONE N 2
METODI QUANTITATIVI E METODI QUALITATIVI

Fasi del dibattito:
anni 1920-30: confronto
1940-60: trionfo quantitativo
fine anni 60: ritorno del dibattito e della valorizzazione del
qualitativo
dalla seconda met anni 80: forte sviluppo metodi qualitativi

Quantitativo-qualitativo: contrapposizione dalle radici profonde
Presentazione di due "tipi ideali" di ricerca

A. Paradigma neopositivista:
Sociologia nasce in ambito positivistico
- Auguste Comte, Montpellier1789 - Parigi1857; Cours de philosophie
positive, 1835-1842
- Herbert Spencer, Derby 1820 - Brighton 1903; Principi di filosofia
sintetica, 1862 - 1885.
Ingenuo fideismo metodi scienze naturali.
Positivismo: studiare la realt utilizzando gli apparati concettuali, i
metodi di osservazione e misurazione, gli strumenti d'analisi matematica, i
procedimenti dinferenza, delle scienze naturali.

Crime in the making, di Robert Sampson e John Laub.

Storia della ricerca: ritrovamento materiale originario ricerca longitudinale

1. Ipotesi teoriche:
- necessit di studio longitudinale, non concentrazione solo su
adolescenza:
. studi trasversali (cross-sectional) o sincronici
. studi longitudinali (longitudinal) o diacronici (prospettiva di ciclo di
vita)
- ipotesi 1: tesi della stabilit del comportamento disadattato
(antisocialit che si forma nell'infanzia)
- ipotesi 2: tesi del cambiamento: i bambini antisociali non diventano
necessariamente degli adulti antisociali: teoria del "controllo sociale
informale";
14
Legami informali in: famiglia, scuola, gruppo dei pari, lavoro,
matrimonio

2. Disegno della ricerca
1939: 500 "autori di reato" e 500 ragazzi "normali" fra i 10 e 17 anni
Seguiti sistematicamente fra il 1939 ed il 1948
Interviste successive all'et di 25 e 32 anni (raggiunti quasi 450 per
gruppo)

3. Analisi dei dati e risultati
Variabili dipendenti:
- devianza ufficiale (autori/non-autori di reato)
- devianza non ufficiale: punteggio sulla base di comportamenti anche
di semplice "cattiva condotta" (fumare, bere, scappare di casa,
marinare la scuola, cattiva condotta a scuola...)

Cinque capitoli:
- contesto familiare
- ruolo della scuola del gruppo dei pari e di fratelli/sorelle
- continuit nel tempo
- legami sociali adulti e cambiamento
- modelli comparativi di crimine e devianza

Cap. 1: Contesto familiare e delinquenza giovanile
a) quadro teorico:
- la probabilit di devianza cresce col peggiorare delle condizioni socio-
economiche di partenza
- variabili di base o strutturali (structural background variables) e
variabili di processo (processual variables), legami informali (v.
schema a due stadi)

15


b) misure empiriche
c) risultati dell'analisi
regressione standard (devianza non-ufficiale) e logistica (devianza
ufficiale)
. esiste relazione fra variabili di base e devianza (1)
. esiste relazione fra variabili processuali e devianza (2)
. se considerate tutte assieme, le relazioni (1) spariscono: "le variabili
strutturali non hanno effetto diretto sul comportamento deviante, ma
mediato dalle variabili processuali": il 73% dell'effetto (1) mediato
dalle variabili processuali familiari

Tab. 2.1. Influenza delle variabili strutturali e processuali sul comportamento deviante, sulla base di una regressione
logistica (Sampson e Laub 1993).

b rapporto t
Variabili strutturali
Mobilit residenziale 0,03 1,19
Dimensione della famiglia 0,15 2,72*
Affollamento familiare -0,32 -1,75
Disgregazione familiare 0,36 1,50
Occupazione della madre -0,11 -0,48
Status socio-economico della famiglia -0,12 -1,68
Nascita all'estero 0,00 0,01
Devianza del padre -0,06 -0,44
Devianza della madre 0,15 0,84
Variabili processuali
Padre erratico/ostile 0,48 3,47*
Madre erratica/ostile 0,45 3,35*
Supervisione materna -1,24 -8,16*
Rifiuto dei genitori 0,65 3,60*
Attaccamento ai genitori -0,38 -2,66*


Chi-quadrato di massima verosimiglianza = 491; gl = 14.
* Indica relazione statisticamente significativa al livello dello 0,05 (p < 0,05)
Affollamento abitativo
Disgregazione familiare
Dimensione familiare
Basso status socio-economico
Nascita all'estero
Mobilit residenziale
Occupazione della madre
Devianza paterna
Devianza materna


Padre erratico, freddo e minaccioso
Madre erratica, fredda e minacciosa
Mancanza di supervisione materna
Rifiuto, ostilit da parte dei genitori
Rifiuto dei genitori da parte del ragazzo
Reato
Variabili strutturali di base
Variabili processuali
16

d) ritorno alla teoria ("i processi familiari di controllo...)

4. Conclusioni teoriche

Applicazione di modello simile a ruolo di scuola, gruppo dei pari, fratelli,
lavoro, matrimonio
Arrivano a un "modello teorico dinamico del crimine, la devianza ed il
controllo sociale informale lungo il ciclo di vita"


17
B. Paradigma interpretativo: Islands in the street, di Martin Sanchez
Jankowski
(Sociologia comprendente, sociologia fenomenologica, ermeneutica)

Wilhelm Dilthey (filosofo tedesco: 1833-1911)
Contrapposizione scienze della natura e scienze dello spirito: lo scopo
delle prime la spiegazione (Erclren) mentre scopo delle seconde la
comprensione (Verstehen)

Analisi dellazione come una scienza interpretativa in cerca di significato,
non una scienza sperimentale in cerca di leggi.
Noi spieghiamo la natura, mentre intendiamo la vita psichica (Dilthey).
Comprensione o Verstehen, .. fenomeni di empatia e simpatia tra
osservatore ed osservato ... sotto i nomi pi diversi: intuizione, percezione
dellaltro, stato mentale, ricostruzione immaginativa (Erlebnis = subitanea
intuizione)

Spiegare e comprendere (Nelle conclusioni del precedente volume...T 50)

1. Disegno della ricerca e raccolta dei dati

Osservazione partecipante: 37 gang, 10 anni. Partecipazione: 1 mese; 10
giorni; 1 settimana

2. Ipotesi teoriche

Non c' riflessione teorica pre-empirica basata sulla letteratura, n
elaborazione di ipotesi da validare empiricamente (la teoria dovr essere
"scoperta" nel corso dell'indagine). Ipotesi iniziali gi derivano dalla
ricerca.

- la gang non nasce da disorganizzazione sociale ma risponde ad
esigenze di organizzazione per accaparrarsi le scarse risorse
(Loriginalit dellapproccio... T 51)

- Individuo (tipo ideale) dal "carattere individualistico e ribelle"
(defiant inividualistic character)
. senso della competizione che arriva all'aggressione fisica
. sfiducia verso gli altri (individualismo, isolamento sociale, contare
solo su se stessi)
18
. visione darwinistica del mondo: sopravvivono solo i pi forti,
istinto di sopravvivenza

- Gang (tipo ideale):
. sistema sociale quasi-privato (non aperta a tutti)
. quasi-segreto
. struttura di leadership con ruoli definiti dove l'autorit passata
attraverso meccanismo di legittimazione
. persegue suoi obiettivi senza preoccuparsi che siano legali o meno
. priva di burocrazia

3. Interpretazione materiale empirico

Tre parti:
- l'individuo ed il suo rapporto con la gang
- la gang come organizzazione
- la gang e la comunit

Cap. 1: Gang involvement. Chi entra in una gang e perch

Risposte date dalla letteratura:
- famiglie disgregate dove padre assente e ricerca di identificazione con
figura d'autorit maschile
- gang come sostituto della famiglia
- espulsi dal sistema scolastico impreparati per poter aspirare a lavoro
- giovanissimi che seguono l'esempio dei pi grandi

Secondo Jankonwski tutte risposte sbagliate: si entra nella gang per calcolo
di convenienza razionale. Sei motivazioni incontrate:
- Incentivi materiali
- Divertimento
- Rifugio e nascondiglio
- Protezione fisica
- Luogo di resistenza
- Impegno comunitario

Obiettivo conclusivo: non individuazione di nessi causali ma esperienza
vissuta (capire le manifestazioni nella loro individualit)


19
LEZIONE N 3
STRUTTURA DELLA RICERCA, TEORIA, IPOTESI

1. LA STRUTTURA TIPO DELLA RICERCA QUANTITATIVA

La ricerca scientifica :
a) un processo creativo di scoperta
b) che si sviluppa secondo un itinerario prefissato e secondo procedure
prestabilite
c) che si sono consolidate allinterno della comunit scientifica

a) Contesto della giustificazione e della scoperta (Let 1)
b) Scienza = accumulazione sistematica di conoscenza (Let 2)
c) La scienza pubblica e non privata (pubblicit e ripetibilit = controllo)
(Let 3)

Lo scienziato non pu fare di testa sua

20
La struttura tipo del processo di ricerca quantitativa











Ipotesi
Teoria
Rilevazione
Analisi dati
Risultati
FASI PROCESSI
Deduzione
Operativizzazione
(disegno della ricerca)
Organizzazione dei dati
(matrice-dati)
Interpretazione
Induzione
21
2. DALLA TEORIA ALLE IPOTESI

Operativizzazione = il processo di traduzione di unaffermazione teorica in
operazioni empiriche

Teoria = insieme di proposizioni organicamente connesse, che si pongono
ad un elevato livello di astrazione e generalizzazione rispetto alla realt
empirica, le quali sono derivate da regolarit empiriche e dalle quali
possono essere derivate delle previsioni empiriche

Esempio da Durkheim: pi elevato il tasso di individualismo in un
determinato gruppo sociale, maggiore sar il tasso di suicidi in quel
gruppo. Connessione causale con i caratteri di:
- astrazione
- generalizzazione
- derivata da regolarit empiriche
- d luogo a previsioni

La proposizione teorica si articola in ipotesi specifiche

Ipotesi = interconnessioni fra concetti (in genere un nesso causale, ma non
necessariamente), che si colloca su un livello inferiore di astrazione e di
generalit rispetto alla teoria e che permette una traduzione della teoria in
termini empiricamente controllabili

Rispetto a teoria: - minor astrazione
- provvisoriet (ipoteticit)
Empiricamente controllabili: NON verificabili. Verificare =
dimostrare vero; opposto di falsificare (dimostrare falso). Non possiamo
verificare, ma solo non falsificare. Es tutti i cigni sono bianchi

Sequenza teoria-ricerca
Teoria ---> ipotesi specifiche
Revisione della teoria a partire dai risultati (es. astensionismo e
pressioni incrociate)
Sequenza con rilevazione che viene prima della teoria (es. Gambetta;
Sampson e Laub)

22
LETTURE LEZIONE N 3

LET 1
L'atto della scoperta sfugge all'analisi logica; non vi sono regole logiche
in termini delle quali si possa costruire una "macchina scopritrice" che
assolva la funzione creativa del genio [Reichenbach 1951, trad. it. 1961,
227

LET 2
Cumulativit:
Se ho visto pi lontano perch stavo sulle spalle di Giganti [Isaac
Newton]
Scienza = accumulazione sistematica di conoscenza

LET 3
Controllo:
La scienza pubblica e non privata
I concetti e i procedimenti adoperati anche dal pi intuitivo dei sociologi,
devono essere standardizzati, e i risultati delle loro intuizioni debbono
poter essere verificati anche da altri [Merton 1968, trad. it. 1971, vol. 1,
119].

Pubblicit, Controllabilit, Ripetibilit = l'unica possibile oggettivit della
conoscenza sociologica [Statera 1984, 250]

23
LEZIONE N 4
OPERATIVIZZAZIONE DEI CONCETTI

1. DAI CONCETTI ALLE VARIABILI

Ipotesi = interconnessione fra concetti (proposizione che implica una
relazione fra due o pi concetti)

Definizione di concetto (Let 1)

Operativizzazione della teoria = operativizzazione dei concetti

Fasi:
1. Far diventare i concetti propriet di oggetti (unit danalisi) (es.
partecipazione elettorale e marginalit sociale)
2. Stabilire le regole per la traduzione delle propriet (degli oggetti) in
operazioni empiriche (definizione operativa) (Let 2)
3. Applicare queste regole ai concreti casi studiati (operativizzazione
vera e propria)

concetto -----------> propriet ---------------------> variabile
operativizzazione
(classificazione
ordinamento
misurazione
conteggio)

Definizioni: propriet (stati)
variabili (modalit)

24
2. UNITA DANALISI

Unit danalisi = loggetto sociale al quale afferiscono le propriet studiate
(Let3)

Possibili unit danalisi:
- individuo (Runciman 1962, 1400 intervistati)
- aggregato di individui (Tocqueville, regioni francesi)
- gruppo-organizzazione-istituzione (ist. scolast., famiglie, gang, governi)
- evento (Gurr episodi ribellione, elezioni)
- prodotto culturale (analisi del contenuto)

Unit danalisi (singolare, astratta) e casi (plurali, concreti)

25
LETTURE LEZIONE N 4

LET 1
Definizione di concetto
Concetto (cum capio = prendere assieme): contenuto semantico (=
significato) dei segni linguistici e delle immagini mentali

Il termine concetto ha un significato generalissimo, e pu includere
ogni specie di segno o procedura semantica, quale che sia loggetto cui si
riferisce, astratto o concreto, vicino o lontano, universale o individuale,
ecc. Si pu avere un concetto del tavolo come del numero 3, delluomo
come di Dio. del genere e della specie... di un periodo storico come di una
istituzione storica (il Rinascimento o il Feudalesimo) [Abbagnano 1971,
146]. E ancora possiamo dire che i concetti possono far riferimento a
costruzioni mentali astratte che impossibile osservare direttamente, come
il potere o la felicit o la classe sociale, oppure riferirsi ad entit concrete
ed immediatamente osservabili, come il fiore o loperaio.

LET 2
La definizione operativa:
Criterio di scientificit: la necessit di definire operativamente le
propriet che si studiano un aspetto caratteristico dell'attivit scientifica,
al punto da costituire probabilmente la discriminante pi sicura fra essa ed
altri generi di attivit, ad esempio la speculazione filosofica [Marradi
1980, 25].
Criterio di oggettivit: solamente dopo che si stabilita una catena
di operazioni attraverso le quali lo stato di una serie di soggetti sulle
propriet X, Y e Z viene rilevato, classificato e registrato, abbiamo
compiuto un passo per ridurre l'opinabilit delle nostre affermazioni
[ibidem]. La definizione operativa d infatti le direttive affinch la stessa
rilevazione possa essere replicata da altri ricercatori. In questo modo
riduce la soggettivit delle affermazioni del ricercatore. Esse non sono pi
opinioni, ma affermazioni dotate di un sostegno empirico.

LET 3
Runciman, W.G.
1966 Relative Deprivation and Social Justice, London, Routledge &
Kegan, trad. it. Ineguaglianza e coscienza sociale, Torino, Einaudi, 1972.

26
Raramente gli atteggiamenti delle persone nei confronti delle ineguaglianze sociali
sono rigorosamente correlati coi fatti che caratterizzano la loro posizione. Si potrebbe
pensare che i sentimenti di una persona verso la struttura della societ in cui vive
varino con la sua collocazione; quale che sia il sistema di stratificazione, non forse
ragionevole aspettarsi che chi sta in alto lo approvi e chi sta in basso ne sia
insoddisfatto? Ma le cose non stanno in questo modo. Linsoddisfazione per il
sistema di privilegi e di compensi di una data societ non viene mai provata in
proporzione al grado di ineguaglianza cui sono soggetti i suoi diversi membri. Molti
che stanno in basso hanno meno risentimenti verso il sistema di quanto non sembri
giustificato dalla loro effettiva posizione, e molti pi vicini al vertice ne hanno di pi.
Il contadino reazionario, il radicale benestante, il povero rispettoso, si ritrovano nella
storia di molti luoghi e di molte epoche: in tutti questi casi c una discrepanza tra la
posizione di ineguaglianza e la sua accettazione o il suo rifiuto [p. 9].

Le nozioni collegate di privazione relativa e di gruppi di riferimento derivano
entrambe da una banale verifica: gli atteggiamenti, le aspirazioni, le lamentele della
gente, dipendono largamente dallo schema di riferimento allinterno del quale sono
concepite. ... Le soddisfazioni di una persona... sono condizionate dalle sue
aspettative... e per renderci conto dei nostri vantaggi confrontiamo la nostra
situazione con chi sta peggio di noi... Da una parte, una persona che stata indotta ad
aspettarsi, per esempio, una promozione sul lavoro, si sentir pi offesa dal mancato
ottenimento di quella le cui ambizioni non state ugualmente alimentate. Dallaltra,
una persona condotta allospedale dopo un piccolo infortunio si compianger molto
meno se posta nel letto accanto a quello di chi uscito permanentemente invalido da
un grave incidente.
La stessa cosa accade al livello delle classi o anche delle nazioni. E diventato un
luogo comune, bench possa apparire a prima vista come un paradosso, che la
povert costante rappresenta la miglior garanzia della conservazione: se la gente non
ha ragione di aspettarsi o di sperare pi di quel che pu ottenere, sar meno scontenta
di quel che possiede, o addirittura sar grata di riuscire a conservarlo. Se per, daltro
canto, stata indotta a scorgere come meta possibile la relativa prosperit di qualche
comunit pi fortunata con cui pu facilmente confrontarsi, rimarr scontenta della
sua posizione finch non sar riuscita a migliorarla. E questa naturale reazione che
sta alla base della cosiddetta rivoluzione delle aspettative crescenti (17-18)

Per cui l'aperto malcontento relativamente raro in periodi di costanti privazioni,
mentre tende a crescere... quando si intravede una possibilit di miglioramento... [ed]
probabile che le rivoluzioni avvengano in periodi di benessere crescente [ibidem,
31].

27
LEZIONE N 5
LE VARIABILI

1. DEFINIZIONE DI VARIABILE

Variabile = concetto operativizzato (pi esattamente: propriet
operativizzata di un concetto)

Fig. 3.2 Dai concetti alle variabili





Peso

Operativizzazione
Concetto Propriet

Variabile
Kg 0,7

(peso di un libro)


Peso ---------> Peso di un oggetto------> Peso misurato con bilancia
(concetto) (propriet) (variabile)

Un concetto pu essere operativizzato in modi diversi
- pu essere associato (come propriet) a differenti unit danalisi
es. potere:
. individuo
. ruolo (aziendale, politico)
. istituzione (banca, azienda)

- in quanto propriet pu dar luogo a diverse variabili
es. livello culturale:
. titolo di studio
. numero libri letti
. consumi culturali
. test di cultura generale

28
Variabile = che pu variare
Costante

Variazione nel tempo (studio longitudinale, diacronico; es. reazione di un
paziente ad un farmaco)
Variazione fra i casi (studio trasversale, sincronico; es. relazione fra fumo
e cancro al polmone )

Tipi di variabili

- Manipolabilit: variabili manipolabili e non manipolabili

- Causa-effetto: variabili indipendenti e dipendenti
Causa Effetto
Var indipendente Var dipendente
Stimolo (trattamento) Risposta (reazione)

- Osservabilit: variabili latenti ed osservate

- Unit danalisi: variabili individuali e collettive
Collettive: aggregate e globali

Definizione operativa di una variabile (es. postmaterialismo di Inglehart)


2. VARIABILI NOMINALI, ORDINALI, CARDINALI

Tipi di variabili
Stati della
propriet
Procedura di
operativizzazione
Tipo di
variabile
Caratteristiche
dei valori
Operazioni
effettuabili
sui valori
Discreti non
ordinabili
classificazione nominale mere etichette =
Discreti
ordinabili
ordinamento ordinale numeri con
caratteristiche
solo ordinali
= > <
Discreti
enumerabili
conteggio cardinale numeri con
caratteristiche
cardinali
= > <
+
Continui misurazione

29

LEZIONE N 6
LINCHIESTA CAMPIONARIA

1. LINCHIESTA CAMPIONARIA NELLA RICERCA SOCIALE

Conoscere la realt = osservare, domandare, leggere

Inchiesta campionaria: rilevare informazioni
a) interrogando
b) gli stessi individui oggetto della ricerca
c) appartenenti ad un campione rappresentativo
d) mediante una procedura standardizzata di interrogazione
e) allo scopo di individuare e studiare le relazioni esistenti tra le variabili

Sondaggio (d'opinione): indagine puramente esplorativa volta ad accertare
l'esistenza e la consistenza di un fenomeno.

Inchiesta campionaria si differenzia da sondaggio per:
- problematica teorica (non solo esistenza e consistenza dei fenomeni)
- ampiezza temi toccati
- tipo di analisi sui dati (non solo descrittiva ma anche esplicativa)

Standardizzazione: - domanda
- risposta ---> matrice-dati

DOMANDE RISPOSTE
Standardizzate Libere

Standardiz
zate
Questionario
(Inchiesta campionaria -
survey)
Intervista strutturata

Libere Intervista libera


ricerca quantitativa
ricerca qualitativa

30
Storia survey
Marx e Weber
L'introduzione del campione rappresentativo (anni 30, Neyman)
Sviluppi tecnologici: computer e telefono


2. LA STANDARDIZZAZIONE OVVERO LINVARIANZA DELLO
STIMOLO

1. Approccio oggettivista versus approccio costruttivista

Approccio oggettivista: la realt sociale esiste allesterno dello studioso
e da questi oggettivamente conoscibile

Approccio costruttivista: latto stesso del conoscere produce
unalterazione della realt, per cui la realt conoscibile solo quella
generata dal processo interattivo fra studiante e studiato

Conseguenze: rapporto intervistato-intervistratore
Lettura: T 175-6

2. Approccio uniformista versus approccio individualista

Approccio uniformista: esistono se non delle leggi, almeno delle
uniformit empiriche, delle regolarit nei fenomeni sociali e umani

Approccio individualista: irriducibilit dellindividuo umano a qualsiasi
forma di generalizzazione e standardizzazione; comprensione solo
attraverso rapporto empatico; ogni azione sociale un evento unico

Conseguenze: standardizzazione dello strumento di rilevazione
Lettura: T 176-7

3. Lobiettivo del minimo comun denominatore

Lobiettivo minimo: il ricercatore che ha scelto linchiesta campionaria fa
una scelta di campo: privilegia la ricerca di uniformit rispetto
allinseguimento dellindividualit; ricerca ci che accomuna gli individui
piuttosto di ci che li distingue. Sceglie di lavorare in superficie sui grandi
numeri invece che in profondit sui piccoli
31

3. LAFFIDABILITA DEL COMPORTAMENTO VERBALE

Lettura: T 179-80 (Williams)

1. Desiderabilit sociale (delle risposte)

La valutazione socialmente condivisa che in una certa cultura data ad un
certo atteggiamento o comportamento

2. Mancanza di opinioni

Gli effetti della pressione a rispondere (facilitata anche dalla
formulazione della domanda chiusa)

3.3. Intensit

La domanda standardizzata rileva lopinione, ma non la sua intensit o
radicamento
32
4. SOSTANZA E FORMA DELLE DOMANDE

Costruire questionario
- esperienza ricercatore (surrogabile con consultazione questionari
precedenti)
- conoscenza popolazione
- chiarezza delle ipotesi

1. Dati sociografici, atteggiamenti e comportamenti

- Domande relative a propriet sociografiche di base (descrizione delle
caratteristiche sociali)
- Domande relative a atteggiamenti
- Domande relative a comportamenti: inequivoci (esiste una risposta
esatta), osservabili (esternamente controllabili)

(domande fattuali o motivazionali)

2. Domande aperte e domande chiuse

Domanda aperta:
- libert di espressione, ma va comunque codificata per matrice dati; pre-
codifica / post-codifica
Limiti:
- vaghezza delle espressioni
- mancanza di omogeneit negli interventi degli intervistatori
- difficolt in fase di interpretazione e di codifica

Domanda chiusa:
Vantaggi:
- offre a tutti stesso quadro di riferimento
- facilita il ricordo
- stimola l'analisi e la riflessione

33
Limiti:
- lascia fuori tutte le alternative di risposta che il ricercatore non ha
previsto
- le alternative influenzano le persone (pseudo-opinioni)
- le risposte offerte non hanno lo stesso significato per tutti (e mascherano
l'incomprensione grossolana)
Non praticabile se:
- le alternative di risposta non sono perfettamente conosciute
- argomenti troppo complessi
- intervistati livello culturale basso
- argomenti delicati

Sintesi:
- sui grandi numeri non c' alternativa alla domanda chiusa e quindi al
questionario standardizzato

Condizioni per la domanda chiusa:
- tutte le possibili alternative devono essere previste (studio esplorativo)
- non applicabile:
. quando tutte le possibili alternative di risposta non sono note
. quando sono troppo numerose o complesse
. livello culturale troppo basso degli intervistati
. argomenti delicati



34
5. FORMULAZIONE DELLE DOMANDE

Esempi formulazione: frati, proibire/non permettere, invasione comunista
1. Semplicit di linguaggio
2. Lunghezza delle domande
3. Numero delle alternative di risposta
4. Espressioni in gergo
5. Definizioni ambigue
6. Parole dal forte connotato negativo
7. Domande sintatticamente contorte
8. Domande con risposta non univoca
9. Domande non discriminanti
10. Domande tendenziose
11. Comportamenti presunti
12. Focalizzazione nel tempo
13. Concretezza-astrazione
14. Comportamenti e atteggiamenti
15. Desiderabilit sociale delle risposte
. formulare le domande legandole a fatti concreti
. rendere accettabile anche la risposta meno desiderabile
. considerare normale e diffuso anche il comportamento negativo
. equilibrare la desiderabilit delle risposte
. attribuire allintervistato il comportamento negativo
. formulare la domanda in terza persona
16. Domande imbarazzanti
17. Mancanza dopinione e non so (il non so legittimo e a volte va
incoraggiato)
18. Intensit degli atteggiamenti
19. Acquiescenza (tendenza a dare risposte affermative e response set)
20. Effetto memoria (stabilire limiti temporali; presentare liste, es. vie
seguite per cercare lavoro; se si pu evitare di basarsi sul ricordo,
evitarlo, es. uso diari per i consumi; rischio di attribuire al passato
latteggiamento corrente, e band wagon effect)
21. Sequenza delle domande
. dinamica del rapporto intervistato-intervistatore (allinizio domande
rassicuranti, alla fine imbarazzanti)
. interesse e stanchezza
. sequenzialit dellintervista (domande a imbuto)
. effetto contaminazione

35
Concludendo:
- effetto della formulazione della domanda soprattutto nell'analisi ad una
variabile, minore sulle loro relazioni
- cautela nei confronti fra domande formulate diversamente (es. nel tempo
o fra nazioni)
- sempre riportare l'esatta formulazione della domanda

36
6. BATTERIE DI DOMANDE

Domande formulate tutte nello stesso modo (stessa domanda, stesse
alternative di risposta, cambia solo loggetto). Finalit:

- risparmiare spazio (sul questionario)
- facilitare la comprensione del meccanismo di risposta
- migliorare la validit delle risposte
- facilitare costruzione di indici

Tecnica delle scale (scaling)

Buon esempio di operativizzazione: domanda su prossimit alla droga da
Quetionario Iard 2000

37
7. MODALITA' DI RILEVAZIONE

1. Interviste faccia-a-faccia

Centralit dellintervistatore
Lintervistatore deve inibirsi qualsiasi comportamento che pu influenzare
l'intervistato

Intervistatori:
- Caratteristiche
- Aspettative
- Preparazione
- Motivazione

2. Interviste telefoniche

Vantaggi:
- rapidit
- costi (telefonata sopra i 60 km costo indifferenziato)
- raggiunge anche i lontani
- minori resistenze alla concessione dellintervista
- facilita preparazione, coordinamento e supervisione intervistatori
- consente di utilizzare il computer in fase di rilevazione (CATI)

Svantaggi:
- intervistato meno coinvolto (manca contatto personale)
- il rapporto si logora prima (20 invece che 40-60)
- impossibile usare materiale visivo
- l'intervistatore non pu raccogliere dati osservativi (abitazione, ecc.)
- impossibile per chi non ha telefono (ceti sociali inferiori); difficile per
uso segreterie telefoniche (ceti sociali superiori); molti hanno solo
telefonino (giovani)
- anziani e persone con basso titolo di studio sottorappresentati (malgrado
le istruzioni, es. chi compie per primo gli anni)
- la limitatezza del tempo costringe a semplificazione della domanda e
della risposta
Difetti pi gravi: primo e ultimo


38
3. Questionari autocompilati

Vantaggio: costi
Limiti: mancanza di controlli sulla compilazione
autoselezione

Per eliminare gli svantaggi:
- rilevazione di gruppo
- rilevazione individuale con restituzione vincolata (es. censimento)

4. Questionario postale

Vantaggi:
- risparmi altissimi nei costi
- pu essere compilato dall'intervistato quando vuole
- maggiore garanzia di anonimato
- assenza di effetto dell'intervistatore
- accessibilit anche a zone lontane

Svantaggi:
- bassa percentuale di risposte
- distorsione del campione dovuta all'autoselezione
- il livello di istruzione della popolazione: deve essere medio-alto
- mancanza di controllo sulla compilazione (pu compilarlo un familiare o
la segretaria)
- impossibilit di questionari complessi (es. evitare le domande
condizionate)
- lunghezza del questionario: deve essere ridotta.

Escludere domande aperte
Problema principale: i "ritorni" (50% buono)
Solleciti: invio con lettera; sollecito (anche cartolina); seconda lettera di
sollecito con nuova copia; telefonata.

5. Interviste computerizzate (elettroniche)

Cati, Capi, Teleinterviste


39
8. ORGANIZZAZIONE DELLA RILEVAZIONE

- Studio esplorativo
- Pre-test
- Preparazione e la supervisione degli intervistatori
- Contatto iniziale
- Forma grafica del questionario

40
LEZIONE N 7
LE FONTI STATISTICHE UFFICIALI

ESEMPI: le tabelle sul suicidio di Durkheim (Durkheim_Sucidio.doc)

Statistica: da Stato
Scienza che descrive gli stati

Allinizio ricerca sociale solo con questo tipo di dati. Poi dominio survey
(inchiesta campionaria)

Due significati del termine statistica (Devoto-Oli):
- scienza che studia con metodi matematici fondati sul calcolo delle
probabilit fenomeni collettivi (statistica come scienza)
(scienza del collettivo: analisi quantitativa dei fenomeni collettivi)
- raccolta di dati che si proponga di dare una visione dinsieme a
determinati fatti (statistica come dato)

Utilizzeremo la seconda accezione
Classificazione Istat:
statistiche demografiche
sociali
economiche
ambientali

ESEMPI: Esempi Istat.doc

1. LA PRODUZIONE

Rilevazione diretta
Censimenti: antichissimi. Sumeri (IV-II millennio a.C), Assiri, Babilonesi,
antico Egitto, impero cinese, Grecia e Roma antiche.

Rilevazione indiretta:
Atti amministrativi: statistiche demografiche, giudiziarie, del commercio
con lestero, sanitarie, previdenziali ed assistenziali, sul risparmio

Oggi nuovi tipi di rilevazioni dirette: indagini campionarie ad hoc
41
Rilevazione esaustiva (o totale)
Rilevazione campionaria (o parziale)
riduzione dei tempi
riduzione dei costi
riduzione del carico organizzativo
possibilit di approfondimento


2. LE UNIT DANALISI

Unit di analisi rappresentata dal territorio (aggregati versus individui)
anche se dati raccolti a livello individuale
. unit di rilevamento
. unit danalisi
Comuni
Province
Regioni

Sezioni di censimento, sezioni elettorali
Aree metropolitane (attorno ai comuni >250.000 ab): Rm, Mi, Na, To, Pa,
Ge, Bo, Fi, Ba, Ct, Ve

5 ripartizioni geografiche: Italia nord-occidentale
nord-orientale
centrale
meridionale
insulare

Analisi:
variazioni territoriali (nello stesso tempo)
variazioni nel tempo (sullo stesso territorio)


3. CONTENUTO INFORMATIVO

Solo comportamenti
Informazioni generali: Annuario statistico italiano
Aree:
- Popolazione
- Sanit, assistenza e previdenza
42
- Giustizia
- Istruzione e cultura
- lavoro
- Consumi, reddito e benessere
- Elezioni
- Indagini multiscopo sulle famiglie

ESEMPI:
Questionario: Istat_Quest sicurezza.doc
Istat_Quest condiz salute.doc
Multiscopo: www.istat.it / cerca / multiscopo / la vita quotidiana nel 2006
Ricchissimo di informazioni, molto utile


4. CONCLUSIONI SU USO DELLE FONTI STATISTICHE
UFFICIALI

Indispensabilit

1. Per lo studio della struttura della societ. Struttura demografica,
fenomeni migratori, voto politico, occupazione e mercato del lavoro,
struttura di classe, mobilit sociale, organizzazione aziendale e delle
imprese (in generale tutti i fenomeni economici), struttura della famiglia
(figli convivenze, anziani), devianza (reati e attivit giudiziaria),
Marginalit sociale, assistenza e previdenza

2. Per lo studio delle ripartizioni territoriali del paese. Differenze fra nord
e sud, regioni, aree metropolitane e non: impossibile da farsi si campioni
della popolazione, a meno che siano di enorme dimensioni (e comunque
non si riesce ad andare al di sotto del dato per regione)

3. Per gli studi comparati fra nazioni. Sempre pi importanti (vedi Unione
Europea)

4. Per gli studi nel tempo (longitudinali o diacronici). Analisi delle serie
temporali; studio delle societ che hanno preceduto quelle attuali


Limiti

43
1. La natura dei dati pu non corrispondere alle esigenze del ricercatore.
Dati gi esistenti e raccolti con finalit diverse. Il problema degli
indicatori.

2. Limitati a variabili fattuali. Mancano le motivazioni

3. Non adatti per l'analisi dei comportamenti individuali. Il rischio della
"fallacia ecologica"

44
LEZIONE N 8
LA MATRICE DEI DATI
pagine corrispondenti
- sul testo La ricerca sociale: metodologia e tecniche, Bologna, Il Mulino Vol IV. L'analisi dei dati:
Cap. II: par. 1, 2
- oppure sul testo Metodologia e tecniche della ricerca sociale, Bologna, Il Mulino - Cap. XII: par. 1, 2

QUESTIONARIO (estratto)



Fondazione di ricerca Istituto Carlo Cattaneo
Via Santo Stefano 11 40125 Bologna


RENDIMENTO SCOLASTICO, SENSO CIVICO, IDENTIT ITALIANA
E IDENTIT EUROPEA TRA I GIOVANI ITALIANI
QUESTIONARIO

Scrivi le risposte nellapposito spazio oppure indica la tua risposta facendo un cerchietto intorno al
numero corrispondente.

Sigla della provincia in cui si svolge la prova


Tipo di scuola: Istituto tecnico industriale [1]
Istituto tecnico commerciale [2]
Liceo scientifico [3]
Liceo classico [4]

Sezione


Cognome e nome (o codice sostitutivo)


Mese e anno di nascita

mese anno

In quale comune risiedeva la tua famiglia quando sei nato?
Indica anche la sigla della provincia.


In quale comune risiedi? Indica anche la sigla della provincia.
45



Sesso Maschio [1]
Femmina [2]
46
I tuoi genitori lavorano attualmente? Indica una risposta sia per tuo padre sia per tua madre.
Padre Madre
S, lavora [1] [1]
No, in pensione [2] [2]
No, deceduto/a [3] [3]
No, disoccupato/a [4] [4]
No, casalingo/a [5] [5]


Che lavoro svolgono tuo padre e tua madre? Se sono in pensione o deceduti o disoccupati, indica lultimo
lavoro che hanno svolto.
Padre Madre
Bracciante, salariato agricolo [01] [01]
Lavorante a domicilio [02] [02]
Affittuario coltivatore, mezzadro [03] [03]
Coltivatore diretto (proprietario) [04] [04]
----------------------------------------------------------------------------------------------------------------------------- --------------------------------------------------------
Operaio [05] [05]
Artigiano senza dipendenti (o coadiuvante in az. familiare artigianale) [06] [06]
Artigiano con dipendenti [07] [07]
----------------------------------------------------------------------------------------------------------------------------- --------------------------------------------------------
Commerciante senza dipendenti
(o coadiuvante in azienda familiare commerciale) [08] [08]
Commerciante con dipendenti [09] [09]
Impiegato [10] [10]
Insegnante, maestro, docente universitario [11] [11]
------------------------------------------------------------------------------------------------------------------------------------------------------------------ -------------------
Dirigente [12] [12]
Libero professionista [13] [13]
Imprenditore (anche agricolo) [14] [14]


Quali sono i titoli di studio conseguiti dai tuoi genitori?
Indica il titolo sia di tuo padre che di tua madre. Padre Madre
Nessun titolo di studio [1] [1]
Licenza elementare [2] [2]
Licenza di scuola media o avviamento professionale [3] [3]
Diploma di scuola secondaria superiore o di scuola professionale [4] [4]
Laurea universitaria [5] [5]


Con quale giudizio hai conseguito Sufficiente [1]
la licenza di scuola media inferiore? Buono [2]
Distinto [3]
Ottimo [4]

Nel corso della tua frequenza della scuola media superiore, quante volte
sei stato bocciato e hai dovuto ripetere un anno di corso?
Se non sei stato mai bocciato, scrivere 0.

Nel corso della tua frequenza della scuola media superiore, quante volte (cio in
quanti anni diversi) hai dovuto sostenere esami di riparazione a settembre, oppure
hai dovuto seguire corsi di sostegno e recupero, oppure sei stato promosso con
un debito formativo? Se nessuna di queste cose ti mai successa, scrivere 0.
47
26. Valuta la gravit di ciascuno dei seguenti comportamenti, indicando un punteggio, dove 5
corrisponde alla massima gravit e 1 corrisponde al minimo di gravit: cerchia il punteggio
corrispondente alla risposta scelta.
Nessuna Massima
gravit gravit
Cercare di ottenere dallo Stato benefici cui
non si ha diritto (pensioni di invalidit,
assegni familiari, ecc.) [1] [2] [3] [4] [5]
Non pagare il biglietto sui mezzi di trasporto [1] [2] [3] [4] [5]
Non pagare le tasse (o pagarle meno del dovuto) [1] [2] [3] [4] [5]
Comperare qualcosa sapendo che
proviene da un furto (fatto da altri) [1] [2] [3] [4] [5]
Prendere e guidare unauto di
sconosciuti per divertimento [1] [2] [3] [4] [5]
Tenersi il denaro trovato [1] [2] [3] [4] [5]
Dire il falso nel proprio interesse [1] [2] [3] [4] [5]
Accettare denaro non dovuto (una bustarella)
nelladempimento del proprio dovere [1] [2] [3] [4] [5]
Non segnalare il danno fatto senza volerlo
a un veicolo in sosta [1] [2] [3] [4] [5]
Gettare rifiuti in un luogo pubblico [1] [2] [3] [4] [5]
Passare con il rosso a un semaforo [1] [2] [3] [4] [5]
Procurarsi illegalmente il testo di un tema
di esame a un concorso pubblico [1] [2] [3] [4] [5]
Dare una somma di denaro a un vigile
per non prendere una pesante multa [1] [2] [3] [4] [5]



27. Negli ultimi tre mesi, con quale frequenza hai partecipato attivamente allattivit dei seguenti
tipi di organizzazioni?
Solo Almeno
Mai una volta 2 volte
Organizzazione politica [1] [2] [3]
Organizzazione religiosa o parrocchiale [1] [2] [3]
Organizzazione sportiva (di praticanti) [1] [2] [3]
Organizzazione sportiva (di tifosi) [1] [2] [3]
Organizzazione culturale (teatrale, dibattiti, ecc.) [1] [2] [3]
Organizzazione ricreativa, turistica [1] [2] [3]
Organizzazione per la difesa della natura [1] [2] [3]
Organizzazione di impegno sociale e assistenziale [1] [2] [3]
Collettivi, gruppi di base, centri sociali [1] [2] [3]
Organizzazione studentesca [1] [2] [3]
Organizzazione della giovent (scout, ecc.) [1] [2] [3]
Organizzazione di tutela dei diritti delluomo [1] [2] [3]

48
LIBRO-CODICE (estratto)

Etichetta
colonna
Codici Corrispondenza con le domande del questionario
IDENT (Numero identificazione questionario)
PROV Sigla provincia Sigla della provincia in cui ha sede la scuola
TIPOSKL 1 Iti Tipo di scuola
2 Itc
3 Ls
4 Lc
ANNONASC anno e decennio (99= manca o n.r.) Anno di nascita
SESSO 1 maschi Sesso
2 femmine
I tuoi genitori lavorano attualmente? Indica una risposta sia per tuo padre
sia per tua madre.
CONLAVPA 1 occupato Padre
2 pensionato
3 deceduto
4 disoccupato
5 casalingo
9 Non risponde/mancante/non deve
CONLAVMA Come CONLAVPA Madre
Che lavoro svolgono tuo padre e tua madre? Se sono in pensione o deceduti
o disoccupati, indica lultimo lavoro che hanno svolto.
OCC_PAD 1 Bracciante Padre
2 Lav. a domicilio
3 Affittuario
4 Coltivatore diretto
5 Operaio
6 Artigiano senza dipendenti
7 Artigiano con dipendenti
8 Commerciante senza dipendenti
9 Commerciante con dipendenti
10 Impiegato
11 Insegnante
12 Dirigente
13 Libero professionista
14 Imprenditore
99 Non risponde/mancante/non deve
OCC_MAD Come OCC_PAD Madre
Quali sono i titoli di studio conseguiti dai tuoi genitori?
TITPAD 1 Nessuno Padre
2 Elementare
3 Scuola media o avv. prof.
4 Scuola media superiore o prof.
5 Laurea
9 Non risponde/mancante/non deve
TITMAD Come TITPAD Madre
GIUDMED 1 sufficiente Con quale giudizio hai conseguito la licenza di scuola media inferiore?
2 buono
3 distinto
4 ottimo
9 Non risponde/mancante/non deve
BOCC Numero bocciature
(9= Non risponde/mancante/non deve)
Nel corso della tua frequenza della scuola media superiore, quante volte sei
stato bocciato e hai dovuto ripetere un anno di corso?
RIPA Numero riparazioni
(9= Non risponde/mancante/non deve)
Nel corso della tua frequenza della scuola media superiore, quante volte
(cio in quanti anni diversi) hai dovuto sostenere esami di riparazione a
settembre, oppure hai dovuto seguire corsi di sostegno e recupero, oppure
sei stato promosso con un debito formativo?
TRASF 1 Unica scuola Questa scuola lunica scuola media superiore che hai frequentato oppure ti
sei trasferito da unaltra scuola media superiore? 2 Trasferito
9 Non risponde/mancante/non deve
TIPOTRAS 1 Ha cambiato tipo di scuola Hai cambiato tipo di scuola (ad esempio, da liceo classico a liceo scientifico,
da istituto tecnico industriale e istituto tecnico commerciale, e cos via)
oppure sei rimasto nello stesso tipo di scuola?
2 Non ha cambiato tipo
3 Non trasferito
9 Non risponde/mancante/non deve
49


NOTA: distribuire un estratto da un questionario (IARD 2000), farlo compilare e codificare
50
Forma della matrice dei dati (casi x variabili: CxV)

codifica
(tracciato record e codice)
Informazioni -----------------------------------> Matrice dei dati


Matrice dei dati
Variabili
X
1
X
2
X
3
...

X
p

1 X
11
X
12
X
13
...

X
1p
2 X
21
X
22
X
23
...

X
2p

Casi 3 X
31
X
32
X
33
...

X
3p

... ... ... ... ...
... ... ... ... ...

n X
n1
X
n2
X
n3
...

X
np



51
Glossario

lunit danalisi (o anche semplicemente unit) loggetto sociale studiato; nella
situazione pi frequente lunit danalisi costituita dallindividuo (ma pu anche essere la
classe scolastica, la famiglia, il comune, la nazione, levento, larticolo di giornale, ecc.);
localizzando nel tempo e nello spazio lunit danalisi si viene a definire la popolazione
di riferimento (o semplicemente popolazione) della ricerca (per esempio, gli elettori italiani
alle elezioni del 1976; gli episodi di protesta politica avvenuti in Italia fra il 1966 ed il
1973);
i casi sono gli esemplari dellunit danalisi inclusi nella ricerca (per esempio i soggetti
intervistati);
linsieme dei casi costituisce il campione studiato;
le caratteristiche delle unit studiate sono dette propriet; ogni propriet pu assumere
degli stati diversi (per esempio, la propriet pratica religiosa assume gli stati di
praticante, saltuario, non praticante);
la variabile la propriet operativizzata, cio rilevata sui casi attraverso una certa
procedura detta definizione operativa; per esempio possiamo operativizzare la propriet
pratica religiosa attraverso la domanda Nellultimo anno lei andato in chiesa?;
le modalit sono gli stati della variabile e valori i simboli assegnati alle modalit; i valori
in genere, anche se non necessariamente, sono numeri. Per esempio, la variabile pratica
religiosa operativizzata nel modo sopra riportato, ha le seguenti modalit: mai, due-tre
volte lanno, una volta al mese, due-tre volte al mese, una o pi volte la settimana; i
cui rispettivi valori sono: 1, 2, 3, 4, 5. Se la variabile nominale gli stati della propriet
vengono anche chiamati categorie;
variabili dicotomiche (dicotome) sono le variabili con due modalit; variabili
politomiche quelle a pi di due modalit;
la matrice dei dati contiene le informazioni raccolte durante un'indagine in forma
numerica e organizzate in forma di rettangolo diviso in righe e colonne, dove ciascuna riga
rappresenta un caso (contiene tutti i dati relativi alle propriet/variabili di quel caso) e
ciascuna colonna rappresenta una delle propriet/variabili misurate (contiene i dati di tutti
i casi per quella variabile). Solitamente la matrice dati contenuta in un file.
lanalisi monovariata consiste nellanalizzare le variabili singolarmente prese, cio ad
una ad una senza metterle in relazione fra di loro. In altri termini, si individua la colonna
della matrice-dati corrispondente alla variabile e si conta con che frequenza appaiono i
diversi valori contenuti nella colonna.
lanalisi bivariata lo studio delle relazioni fra due variabili. In pratica, si individuano
le due colonne corrispondenti alle due variabili da mettere in relazione e si contano tutte le
diverse coppie di valori presenti nella coppia di colonne. I risultati vengono riportati in
tabelle a doppia entrata.
lanalisi multivariata lo studio delle relazioni intercorrenti fra pi di due variabili.

52
LEZIONE N 9
LANALISI MONOVARIATA
pagine corrispondenti
- sul testo La ricerca sociale: metodologia e tecniche, Bologna, Il Mulino Vol IV. L'analisi dei dati:
Cap. II: par. 3, 8
- oppure sul testo Metodologia e tecniche della ricerca sociale, Bologna, Il Mulino - Cap. XII: par. 3, 8

1. LE DISTRIBUZIONI DI FREQUENZA: RAPPRESENTAZIONI
TABELLARI

Con il termine "Distribuzione di frequenza di una variabile" si intende la
rappresentazione sintetica (in forma tabellare o grafica), consistente nellassociare ad
ogni modalit (o categoria) della variabile il numero di casi che appartengono a
quella modalit.

Una distribuzione di frequenza pu contenere uno o pi dei seguenti tipi di
frequenze (vedi tab. 1) :
- Frequenze assolute: cio il numero di casi per ciascuna categoria della variabile.
- Frequenze relative - proporzioni: posto uguale a 1 il totale dei casi del campione,
per ogni categoria viene riportata la proporzione dei casi che appartengono a quella
categoria (rispetto al totale pari a 1)
- Frequenze relative - percentuali: posto uguale a 100 il totale dei casi del
campione, per ogni categoria viene riportata la percentuale dei casi che
appartengono a quella categoria (rispetto al totale pari a 100)
- Frequenze cumulate percentuali: per ogni categoria viene riportata la percentuale
di casi che appartiene a quella categoria e a quelle di grado inferiore. La frequenza
dell'ultima categoria e sempre 100% (questo tipo di frequenze pu essere usato
soltanto con variabili ordinali e cardinali, in quanto richiede che le modalit siano
ordinabili).

Tab. 1 Distribuzione di frequenza della variabile titolo di studio.
Frequenze
assolute
a

Frequenze
relative
Frequenze
cumulate
Proporzioni Percentuali
Senza titolo 30 0,025 2,5 2,5
Licenza elementare 509 0,424 42,4 44,7
Licenza media 342 0,285 28,5 73,4
Diploma 264 0,220 22,0 95,4
Laurea 55 0,046 4,6 100,0

Totale

1200

1,000

100,0

a
dette anche valori assoluti (v.a.)

Come si calcolano le percentuali

30 : 1200 = X : 100 5 , 2
1200
100 30

X

53

Come si presenta una tabella di distribuzione di frequenza?
- Di solito si usano soltanto le frequenze percentuali; non occorrono segni di
percentuali, perch il tipo di numero chiaramente indicato nel titolo.
- Inserire nella tavola una riga che riporta il totale 100 (indirizza la lettura)
- Inserire il totale dei casi sui quali le percentuali sono state calcolate (base delle
percentuali, vedi la riga intestata con (N)); in questo modo ci si pu rendere conto
della significativit della percentuale e inoltre possibile ricalcolare le frequenze
assolute della distribuzione
- Utilizzare un solo decimale (anche usare numeri interi, senza decimali, va bene); se
il decimale zero, va riportato (si veda sotto 22,0)
- A volte, si possono ritenere interessanti anche le frequenze assolute, in tal caso si
presentano i dati come in tab. 3.

Quadratura: a causa degli arrotondamenti pu succedere che la somma delle
percentuali faccia 99,9 oppure 100,1. In questi casi alterare una cifra per far tornare il
100,0: agendo o sul secondo decimale alterando quello pi prossimo a 5 (es. 42,34
diventa 42,4), oppure agendo sulla percentuale pi elevata (sulla quale questa
forzatura ha un impatto relativo minore)

Tab. 2 Istruzione degli intervistati. Valori percentuali
Titolo di studio
Senza titolo 2,5
Licenza elementare 42,4
Licenza media 28,5
Diploma 22,0
Laurea 4,6
Totale 100,0
(N) (1200)

Tab. 3 Distribuzioni di frequenza assolute e relative della variabile
Partito votato alle elezioni per la Camera del 1996, parte proporzionale
in Lombardia e in Emilia Romagna (variabile nominale)
Valori assoluti
(in migliaia)
Valori percentuali
Lombardia Emilia R. Lombardia Emilia R.
Forza Italia 1510 451 23,6 15,1
Alleanza nazionale 575 344 9,0 11,5
Ccd-Cdu 298 144 4,6 4,8
Lega Nord 1636 216 25,5 7,2
Pds 965 1065 15,1 35,7
Lista Dini 267 116 4,2 3,9
Ppi 398 238 6,2 8,0
Verdi 152 75 2,4 2,5
Rifond. com. 437 249 6,8 8,3
Altri 168 90 2,6 3,0

Totale

6406

2988

100,0

100,0

54
Arrotondamenti

16,7
7
16,75
7
16,8
7
16,76
7
16,751
7
55
Variabili cardinali
Le variabili cardinali come l'et mal si prestano ad essere rappresentate in tabella a
causa dell'elevato numero di categorie. Per cui nella distribuzione di frequenza si
raggruppano i dati in categorie

Tab. 2.4 Distribuzione di frequenza di una
variabile cardinale (distribuzione per et
degli operai di uno stabilimento): valori
singoli e raggruppati in classi.
et v.a. classi d'et v.a
15 1
16 2
17 3 15-20 32
18 7
19 7
20 12
21 10
22 12
23 12 21-25 72
24 17
25 21
26 ... 26-30 96
... 31-35 112
... 36-40 130
41-45 138
46-50 159
51-55 142
56-60 107
61-65 83


Dati mancanti

Tab. 12.6 Distribuzione di frequenza della variabile nominale Nell'ultimo anno lei andato in
chiesa? (se s) Ogni quanto?.

a) tabella di lavoro b) tabella di presentazione dati c) tabella di presentazione
dati
v.a. % %
No, mai 1 132 No, mai 8,8 No, mai 9,4
2-3 volte l'anno 2 416 2-3 volte l'anno 27,9 2-3 volte l'anno 29,5
1 volta al mese 3 167 1 volta al mese 11,2 1 volta al mese 11,8
2-3 volte al mese 4 233 2-3 volte al mese 15,6 2-3 volte al mese 16,5
1 v. la settimana 5 415 1v. la settimana 27,8 1v. la settimana 29,5
Pi v. la settimana 6 35 Pi v. la settimana 2,3 Pi v. la settimana 2,5
Altra religione 7 11 Altra religione 0,7 Altra religione 0,8
8 5 Non risponde 5,7 Totale 100
NR 9 86 Totale 100 (N) (1409)
Totale 1500 (N) (1495)
valori mancanti: 5 valori mancanti: 91

56
2. LE DISTRIBUZIONI DI FREQUENZA:
RAPPRESENTAZIONI GRAFICHE

Diagrammi a barre (voto per la Camera nel 1996; sui dati di tab. 12.5) -
Lunghezze della barre proporzionali alle frequenze (ortogrammi)

a) diagramma a barre (a colonne)

Lombardia
0
5
10
15
20
25
30
Forza
Italia
All.
naz.
Ccd-
Cdu
Lega
Nord
Pds Lista
Dini
Ppi Verdi Rifond.
com.
Altri



b) diagramma a barre (a nastri)

Lombardia
0 5 10 15 20 25 30
Altri
Rif ond. com.
Verdi
Ppi
Lista Dini
Pds
Lega Nord
Ccd-Cdu
All. naz.
Forza Italia




57

c) diagramma a barre appaiate

0
5
10
15
20
25
30
35
40
Forza
Italia
All.
naz.
Ccd-
Cdu
Lega
Nord
Pds Lista
Dini
Ppi Verdi Rifond.
com.
Altri
Lombardia
Emilia R.




d) diagramma a barre contrapposte

-40 -20 0 20 40
Forza Italia
All. naz.
Ccd-Cdu
Lega Nord
Pds
Lista Dini
Ppi
Verdi
Rifond. com.
Altri
Lombardia
Emilia R.






58
Fig. 12.11 Diagrammi di composizione - Aree proporzionali alle frequenze
(areogrammi)

a) diagramma a barra suddivisa

0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
1881 1983
Boghesia
Classi medie urbane
Coltivatori diretti
Salariati agricoli
Operai ind. e terz.


Classi sociali in Italia nel 1891 e 1993 [Sylos Labini 1986,20]


b) diagramma a settori circolari

Lombardia
24%
9%
5%
25%
15%
4%
6%
2%
7%
3%
Forza Italia
All. naz.
Ccd-Cdu
Lega Nord
Pds
Lista Dini
Ppi
Verdi
Rifond. com.
Altri


Voto nel 1996 in Lombardia (sui dati di tab. prec)

59
LEZIONE N 10
DATI AGGREGATI
pagine corrispondenti
- sul testo La ricerca sociale: metodologia e tecniche, Bologna, Il Mulino Vol IV. L'analisi dei dati:
Cap. II: par. 12, 13
- oppure sul testo Metodologia e tecniche della ricerca sociale, Bologna, Il Mulino - Cap. XII: par.
12, 13


1. Dati individuali e dati aggregati

Dati individuali: unit danalisi lindividuo

Dati aggregati: lunit danalisi un aggregato di individui (es. comune,
regione, nazione...)

Problema dei dati aggregati: diversa dimensione dellaggregato, per cui i
dati vanno relativizzati alla dimensione dellaggregato

Fra le seguenti regioni, qual quella che presenta un maggior tasso di
divorziati ? (Istat, censimento 1991; dati in migliaia)

Celibi e
nubili
Coniugati Separati
legalmente
Divorziati Vedovi
Piemonte 1604 2215 57 44 383
Lombardia 3559 4424 91 73 710
Emilia R. 1424 2049 42 38 355
Campania 2679 2597 24 20 310
Sicilia 2214 2404 23 19 306



% Divorziati Totale
(N)
Piemonte 1,02 4303
Lombardia 0,82 8857
Emilia R. 0,97 3908
Campania 0,36 5630
Sicilia 0,38 4966


60
Quale di queste citt ha il maggior indice di vecchiaia?

0-14 15-29 30-44 45-64 65 e oltre Totale
Bologna 32.764 62.542 82.548 108.094 99.188 385.136
Napoli 196.165 247.757 215.473 236.136 150.343 1.045.874
Palermo 139.435 157.531 146.364 154.905 89.620 687.855
Roma 345.119 521.082 608.546 723.006 447.569 2.645.322
Torino 99.291 177.544 200.495 261.489 180.793 919.612
Venezia 28.954 55.456 63.610 84.658 63.744 296.422

Due possibilit:
- % di anziani su tutti
- rapporto: popolazione sopra i 65 anni / popolazione sotto i 15

% 65 anni e oltre
sulla
popolazione
65 anni e oltre /
sotto i 15 anni
Bologna 25,8 3,03
Napoli 14,4 0,77
Palermo 13,0 0,64
Roma 16,9 1,30
Torino 19,7 1,82
Venezia 21,5 2,20

61
2. Rapporti statistici

Rapporti di composizione: parte al tutto (* 100 = percentuali). Esempi:
- Proporzione di spesa per affitto = spesa della famiglia per affitto /
spesa totale della famiglia
- Proporzione di maschi = maschi / (maschi + femmine).

Esempio
Distribuzione dei consumi delle famiglie

2007
Generi Valori
assoluti (in
euro/anno)
Valori
percentuali
Alimentari 3922 26,4
Tabacchi 212 1,4
Abbigliamento 1447 9,7
Abitazione 1818 12,2
Combustibili 942 6,3
Mobili 1270 8,5
Igiene 245 1,6
Trasporti 2298 15,5
Istruzione 912 6,1
Altre spese 1800 12,1
Totale 14866 100,0

Altro esempio: distribuzione degli studenti dell'universit di Bologna per
facolt

Rapporti di coesistenza: rapporto fra due parti, cio il rapporto fra la
frequenza di una modalit e la frequenza di unaltra. Esempi:
- Rapporto (o quoziente) di mascolinit = maschi / femmine
- Rapporto di matrimoniabilit per sesso = coniugati / non coniugati
- Occupati nellindustria manifatturiera / occupati in agricoltura.
- Indice di vecchiaia = popolazione sopra i 65 anni / popolazione sotto i
15 anni.

Rapporti di derivazione: rapporto fra la misura di un fenomeno e quella di
un altro che pu essere considerato un suo presupposto necessario
- Quoziente di natalit = nati / popolazione x 1.000.
Rientrano in questa categoria molti quozienti demografici che hanno
62
alla loro base lammontare della popolazione (quoziente di nuzialit, di
mortalit, di immigrazione, di abortivit, ecc.). Altri esempi di rapporti di
derivazione sono:
- Laureati / iscritti alluniversit;
- Pensioni / popolazione;
- Operai cassaintegrati / totale operai;
- Suicidi / popolazione;
- Reati / popolazione.

Rapporti medi: sono diffusissimi e si hanno tutte le volte che il fenomeno
posto al numeratore si pu associare mediamente ad ogni unit posta al
denominatore. Per esempio:
- rendimento medio per ettaro = tonnellate di grano prodotto / ettari
coltivati;
- densit della popolazione = n. abitanti / superficie del territorio
(interpretabile come numero medio di abitanti per kmq);
- indice di affollamento = n. componenti la famiglia / n. stanze
dellabitazione (interpretabile come n. medio di persone per stanza);
- n. posti letto in ospedali / popolazione;
- n. ore di sciopero / n. occupati.

Regione N posti letto N abitanti in
migliaia
N posti letto x
1000 abitanti
Valle d'Aosta 621 112 5,6
Piemonte 35339 4479 7,9
Lombardia 63975 8892 7,2
Veneto 47889 4345 11,0
Liguria 17789 1808 9,8


Fare attenzione: rapporto = numeratore / denominatore; massima
attenzione quando gli concessa libert di scelta per il denominatore (il
problema non si pone per altri tipi di rapporti, come il rapporto di
composizione).

Tab. 12.20 Rapporti medi. Tassi di fatalit per mezzo di trasporto (Gran Bretagna,
1992).
Incidenti mortali per 100.000 passeggeri
Tipo di trasporto per viaggio per ora di viaggio per km percorso
Motocicletta 100 300 9,7
63
Aereo 55 15 0,03
Navigazione 25 12 0,6
Bicicletta 12 60 4,3
A piedi 5,1 20 5,3
Auto 4,5 15 0,4
Furgone 2,7 6,6 0,2
Treno 2,7 4,8 0,1
Autobus 0,3 0,1 0,04
Fonte: The Economist, 11.1.1997


3. Serie temporali e serie territoriali

Serie temporale (o serie storica) la sequenza dei valori assunti da una
variabile nello stesso aggregato territoriale in tempi diversi

Serie territoriale la sequenza dei valori assunti da una variabile nello
stesso momento in diversi aggregati territoriali

64
Serie temporale

Tab. 12.21 Andamento dei morti per droga (in valore assoluto) in Italia dal 1985 al
1996
Anno Morti per
droga (v.a.)
Incremento
percentuale
N. indice

(1985=100)
N. indice
a base
mobile
1985 242 100
1986 292 20,7 121 121
1987 543 86,0 224 186
1988 809 49,0 334 149
1989 974 20,4 402 120
1990 1161 19,2 480 119
1991 1383 19,1 571 119
1992 1217 -12,0 503 88
1993 888 -27,0 367 73
1994 867 -2,4 358 98
1995 1195 37,8 494 138
1996 1551 29,8 641 130

media 927
dev.stand. 393
Fonte: Ministero dell'Interno

Fig. 12.23 Serie temporale: morti per droga in Italia dal 1985 al 1996

0
200
400
600
800
1000
1200
1400
1600
1800
1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996


65
Serie territoriale

Tab. 12.22 Suicidi (per 1 milione di abitanti) in Italia nel 1974-83 per regione

Regione Suicidi N. indice
(Italia=100)
Suicidi N. indice
(Italia=100)
Valle
d'Aosta
135,41 288 Basilicata 49,46 105
Friuli V.G. 97,27 207 Veneto 43,67 93
Emilia R. 88,95 189 Sicilia 38,15 81
Umbria 82,11 175 Sardegna 37,77 80
Trentino
A.A.
80,43 171 Lombardia 37,27 79
Piemonte 70,43 150 Puglia 28,14 60
Liguria 69,95 149 Lazio 24,75 53
Molise 61,70 131 Calabria 24,68 53
Toscana 60,97 130 Campania 21,08 45
Marche 57,70 123
Abruzzo 50,31 107 Italia 46,94 100
Fonte: Istat

0 20 40 60 80 100 120 140 160
Valle d'Aosta
Friuli V.G.
Emilia R.
Umbria
Trentino A.A.
Piemonte
Liguria
Molise
Toscana
Marche
Abruzzi
Basilicata
Veneto
Sicilia
Sardegna
Lombardia
Puglia
Lazio
Calabria
Campania
Italia



66
Differenza assoluta e differenza relativa

a = numero morti per droga nel 1985 = 242
b = numero morti per droga nel 1986 = 292


Variazione del numero di morti per droga fra 1985 e 1986

Variazione assoluta: b a = 292 242 = +50

Variazione relativa:

(b - a) : a = X : 100


b a
a
100=
50
242
100= 20, 7


Nel periodo considerato i casi di morte per droga sono cresciuti del
20,7%.


Numeri indice

Se ponessimo eguale a 100 i morti per droga nel 1985, a quanto essi
ammonterebbero nel 1986?

242 : 100 = 292 : X



X =
292
242
100= 120, 7


Quindi il numero di morti per droga fra il 1985 ed il 1986 passato
da 100 a 120,7

67
Secondo esempio
2007 2000
Generi Valori
assoluti (in
euro/anno)
Valori
assoluti (in
euro/anno)
N indice
2007
(2000=100)
Alimentari 3922 3876 101
Tabacchi 212 241 88
Abbigliamento 1447 1334 108
Abitazione 1818 1491 122
Combustibili 942 923 102
Mobili 1270 1278 99
Igiene 245 241 102
Trasporti 2298 2172 106
Istruzione 912 894 102
Altre spese 1800 1746 103
Totale 14866 14196 105

68
Numeri indici territoriali

Si pone a 100 il tasso nazionale. Se il tasso di suicidi della Valle dAosta
135,41 e quello nazionale di 46,94, se poniamo il secondo = 100 il primo
diventer:

46,9 : 100 = 135,41 : X


X =
135, 41
46,94
100= 288


69
I numeri indice:
- non sono mai negativi (quando il valore inferiore a quello di
riferimento assumono valori inferiori a 100)

- non dipendono dallunit di misura in cui sono espressi (permettono
confronti fra unit di misura diverse)

Esempio andamento nel tempo di medici ed abitanti in Italia (dati fittizi)

a) valori assoluti
anno medici abitanti
1881 20.000 30.000.000
1911 30.000 35.000.000
1941 50.000 50.000.000
2001 100.000 60.000.000




0
10.000.000
20.000.000
30.000.000
40.000.000
50.000.000
60.000.000
70.000.000
1881 1911 1941 2001
medici
abitanti
70

b) Numeri indice
medici abitanti
1881 100 100
1911 150 117
1941 250 167
2001 500 200

0
100
200
300
400
500
600
1881 1911 1941 2001
medici
abitanti



Ancora sul fatto che i numeri indice sono dei numeri puri, cio sono
indipendenti dallunit di misura dei dati

Variazione dei costi nelledilizia (dati fittizi)
2000 2007 2000 2007
Materiali
Cemento (alla tonnellata) 215 217 100 101
Calce (alla tonnellata) 123 118 100 96
Ferro tondini (al metro) 54 75 100 139
Legname (per metro cubo) 18 22 100 122
Mattoni (per confezione di 1000) 75 80 100 107
Manodopera (paga oraria) 15 25 100 167
Aree al mq) 215 418 100 194


71
Variazioni nella produzione (valori fittizi)




1970 1980 1990 2000 N. indice
2000
(1970=100)

N automob. 235.000 278.000 312.000 375.000 160
T. di patate 1.556.000 1.580.214 1.178.214 1.432.212 92
N televisori 425.200 1.560.000 2.121.415 1.512.271 356
N laureati 55.213 84.218 115.219 218.425 396
Posti letto osp 7.245 8.213 8.432 8.546 118


Esemplificazione: relazione della Commissione didattica della facolt




72

LEZIONE 11
ANALISI BIVARIATA: TABELLE A DOPPIA ENTRATA
pagine corrispondenti
- sul testo La ricerca sociale: metodologia e tecniche, Bologna, Il Mulino Vol IV. L'analisi dei dati -
Cap. III: par. 1, 2 (con esclusione di 2.5, 2.6, 2.7)
- oppure sul testo Metodologia e tecniche della ricerca sociale, Bologna, Il Mulino - Cap. XIII: par.
1, 2 (con esclusione di 2.5, 2.6).

Le tecniche di analisi bivariata

Variabile indipendente
Variabile dipendente nominale cardinale
nominale Tavole di
contingenza

cardinale Analisi della
varianza
Regressione
e correlazione

Le variabili ordinali, a seconda dei casi, possono essere trattate come se fossero
nominali oppure cardinali


1. Che cos' una tabella a doppia entrata (o tavola di contingenza)

Tab. 2.7 Pratica religiosa per et. (Valori assoluti)
18-34 35-54 Oltre 54 Totale
Praticanti 223 313 182 718
Saltuari 266 317 88 671
Non praticanti 425 504 168 1097

Totale 914 1134 438 2486
Domanda: Mi pu dire con quale frequenza si recato in chiesa nel corso
dell'ultimo anno?.
Risposte: Una o pi volte la settimana = Praticanti; 2-3 volte al mese + 1 volta
al mese = Saltuari; 2-3 volte all'anno + Mai = Non praticanti. (Fonte: Itanes
[1996]).


- Una tabella a doppia entrata (detta anche "tavola di contingenza" o
"incrocio") una distribuzione di frequenza a due variabili (di ogni
intervistato considera contemporaneamente la posizione su due variabili,
nell'esempio, pratica religiosa ed et).

73
- Le due variabili sono collocate sulle righe e sulle colonne della tabella;
all'incrocio tra una riga e una colonna troviamo una casella o cella della
tabella. Il numero allinterno la frequenza con la quale si presentano
congiuntamente le corrispondenti modalit di riga e di colonna (es: 223 =
numero di praticanti fra i 18 e i 34 anni)

- La colonna e la riga 'Totale' si chiamano (frequenze) marginali della
tabella. Sono le distribuzioni semplici di frequenze rispettivamente dell'et
e della pratica. Sono distribuzioni semplici perch si riferiscono a tutto il
campione.


2. A cosa serve una tabella a doppia entrata

- Serve a studiare la relazione tra due variabili.

- Si dice che c' relazione tra due variabili (et e pratica nell'esempio) se
dividendo il campione in sottocampioni secondo una variabile (l'et:
giovani, adulti, anziani) la distribuzione semplice della seconda variabile
(la pratica religiosa) diversa nei differenti sottocampioni di et.
Viceversa, se le distribuzioni sono identiche si dice che non c' relazione.

- La variabile usata per dividere il campione in sottocampioni detta
variabile indipendente, la variabile di cui si studia la distribuzione nei
sottocampioni detta variabile dipendente.

- Da un punto di vista statistico sia l'et che la pratica religiosa possono
assumere il ruolo di variabile indipendente. Dal punto di vista sociologico,
tuttavia, non ha molto significato chiedersi se la distribuzione delle et
varia al variare della pratica religiosa, come se la pratica di un soggetto
potesse influire sulla sua et.

- Nella tabella 2.7 compaiono frequenze assolute: difficile dire a colpo
d'occhio se la proporzione di praticanti tra i giovani maggiore, minore,
uguale a quella dei praticanti tra gli anziani. Per questo necessario
passare al calcolo percentuale (percentualizzare significa porre uguale a
100 il totale; in tal modo si rendono uguali i totali dei gruppi da
confrontare che cos diventano confrontabili)
74
3. Direzione delle percentuali nelle tabelle a doppia entrata

Tab. 2.7 Pratica religiosa per et. (Valori assoluti)
18-34 35-54 Oltre 54 Totale
Praticanti 223 313 182 718
Saltuari 266 317 88 671
Non praticanti 425 504 168 1097

Totale 914 1134 438 2486


Tab. 2.8 Pratica religiosa per et. (Valori percentuali per riga)
18-34 35-54 Oltre 54 Totale
Praticanti 31,1 43,6 25,3 100,0
Saltuari 39,6 47,2 13,1 100,0
Non praticanti 38,7 45,9 15,3 100,0


Tab. 2.9 Pratica religiosa per et. (Valori percentuali per colonna)
18-34 35-54 Oltre 54
Praticanti 24,4 27,6 41,6
Saltuari 29,1 28,0 20,1
Non praticanti 46,5 44,4 38,4

Totale 100,0 100,0 100,0


Tab. 2.10 Pratica religiosa per et. (Valori percentuali sul totale)
18-34 35-54 Oltre 54 Totale
Praticanti 9,0 12,6 7,3 28,9
Saltuari 10,7 12,8 3,5 27,0
Non praticanti 17,1 20,3 6,8 44,1

Totale 36,8 45,6 17,6 100,0


75

1. La percentualizzazione per riga (tab. 2.8) risponde a questa domanda:
il gruppo dei praticanti mediamente pi giovane o pi anziano
rispetto ai non praticanti e ai saltuari? Non una domanda 'esplicativa',
non intendiamo che essere praticante o meno abbia effetti sull'et
dell'intervistato, il nostro scopo meramente descrittivo.

2. La percentualizzazione per colonna (tab. 2.9) risponde a questa
domanda: "l'et degli intervistati influenza il loro grado di pratica
religiosa?". Come si vede si tratta di una domanda esplicativa: "l'et
la causa della pratica religiosa?".

3. La percentualizzazione sul totale (tab. 2.10) risponde a questa
semplice domanda: "qual la consistenza di ciascun sottogruppo
(praticanti giovani, praticanti adulti ecc..) nel campione?". Ha scopi
puramente descrittivi. In generale si usa per confrontare un campione
con la popolazione da cui estratto.

76
Scelta della direzione di percentualizzazione.

Di solito siamo interessati ad analizzare relazioni esplicative, da cui una
semplice regoletta:
a. si individua la variabile indipendente (la causa)
b. si usa la variabile indipendente come variabile di colonna.
c. si percentualizza per colonna.

Detto diversamente:
Si definisce qual la variabile indipendente, e si percentualizza all'interno
delle sue modalit.
- si sceglie la percentuale per colonna quando si vuole analizzare
l'influenza che la variabile posta in colonna ha sulla variabile posta in riga;
- si sceglie le percentuale per riga quando si vuole analizzare l'influenza
che la variabile posta in riga ha sulla variabile posta in colonna.

Questa regoletta di solito funziona, ma ha delle eccezioni: a) non sempre la
domanda cui siamo interessati esplicativa e b) non sempre facile
individuare a colpo d'occhio la variabile indipendente (causa). E' pertanto
pi opportuno partire dall'interrogativo cui vogliamo rispondere. In genere
l'interrogativo contiene gi l'indicazione della direzione corretta.
Prendiamo l'esempio dell'et e della pratica religiosa: ci chiediamo se l'et
influenza la pratica religiosa. Posta in altri termini, la domanda se i
giovani sono pi o meno praticanti degli anziani. Cosa vogliamo
confrontare? Il campione dei giovani con quello degli anziani. Quindi
dobbiamo calcolare la percentuale di praticanti giovani (anziani) sul totale
dei giovani (anziani), cio per colonna.
77
Altri esempi di percentualizzazioni di tabella a doppia entrata

Sulla base della seguente tabella a doppia entrata, stabilire se c una
relazione fra soddisfazione / insoddisfazione della propria situazione
economica e zona di residenza
"Secondo lei, negli ultimi 12 mesi, la situazione della sua famiglia
migliorata, rimasta la stessa o peggiorata?

Migliorata Rimasta
uguale
Peggiorata Totale
Nord-ovest 45 445 203 693
Nord-est 17 188 78 283
Centro 27 308 142 477
Sud 56 579 408 1043
Totale 145 1520 831 2496

Migliorata Rimasta
uguale
Peggiorata
Nord-ovest 31,0 29,3 24,4
Nord-est 11,7 12,4 9,4
Centro 18,6 20,3 17,1
Sud 38,6 38,1 49,1
Totale 100 100 100

Migliorata Rimasta
uguale
Peggiorata Totale
Nord-ovest 6,5 64,2 29,3 100
Nord-est 6,0 66,4 27,6 100
Centro 5,7 64,6 29,8 100
Sud 5,4 55,5 39,1 100

78
A partire dalla seguente tabella a doppia entrata, effettuare gli opportuni
calcoli per poter rispondere alla domanda se esiste una relazione fra classe
sociale e fiducia nel governo

Per
nulla
Poco Non so Abbast Molto Totale
Classe operaia 241 300 15 118 25 699
Piccola borghesia
autonoma
166 227 21 85 13 512
Ceto medio impiegatizio 237 332 22 119 14 724
Ceti superiori 165 234 18 77 10 504
Totale 809 1093 76 399 62 2439

Domanda: Quanta fiducia lei ha nelloperato del governo?

Per
nulla
Poco Non so Abbast Molto
Classe operaia 29,8 27,4 19,7 29,6 40,3
Piccola borghesia
autonoma 20,5 20,8 27,6 21,3 21,0
Ceto medio impiegatizio 29,3 30,4 28,9 29,8 22,6
Ceti superiori 20,4 21,4 23,7 19,3 16,1
Totale 100 100 100 100 100

Per
nulla
Poco Non so Abbast Molto Totale
Classe operaia 34,5 42,9 2,1 16,9 3,6 100
Piccola borghesia
autonoma 32,4 44,3 4,1 16,6 2,5 100
Ceto medio impiegatizio 32,7 45,9 3,0 16,4 1,9 100
Ceti superiori 32,7 46,4 3,6 15,3 2,0 100





79
Casi (rari) in cui non si segue il criterio sopra enunciato per la direzione
delle percentuali

Tab. 13.3 Confronti fra i profili degli abbonati al telefono e dell'intera popolazione
italiana nel 1991
Residenza Abbonati Popolazio
ne
Titolo di
studio
Abbonati Popolazione
Nord
ovest
27,9 26,3 Lic. Elem. 24,2 38,0
Nord est 18,9 18,3 Lic. Media 27,7 35,8
Centro 19,8 19,2 Diploma 37,4 21,7
Sud 33,4 36,2 Laurea 11,7 4,5
Totale 100 100 100 100


Tab. Relazione fra pratica religiosa e comportamento di voto nel 2008 (dati fittizi)

a) Voto a seconda della pratica religiosa (come votano le persone classificate secondo
la loro religiosit)

Non pratic Saltuari Praticanti Totale
Sinistra arc. 17,4 11,4 6,9 13,3
Pd 42,9 39,2 35,6 40,2
Udc 3,5 7,4 12,6 6,7
Pdl 33,1 37,9 40,8 36,3
Lega 3,0 4,1 4,0 3,6
Totale 100,0 100,0 100,0 100,0
(N) (1132) (704) (522) 2358

Commento: si vede che i praticanti scelgono in maggioranza il Pdl, e i non praticanti
il Pd

b) Pratica religiosa a seconda del voto (come sono religiosamente connotati gli
elettori dei vari partiti)

Non pratic Saltuari Praticanti Totale (N)
Sinistra arc. 62,9 25,6 11,5 100,0 (313)
Pd 51,3 29,1 19,6 100,0 (948)
Udc 25,3 32,9 41,8 100,0 (158)
Pdl 43,9 31,2 24,9 100,0 (855)
Lega 40,5 34,5 25,0 100,0 (84)

Commento: si vede che il partito che fra i suoi elettori la maggior presenza di cattolici
lUdc

80


La tabella a) risponde alla seguente domanda: "L'orientamento religioso
influenza l'orientamento di voto?" (dom. esplicativa)
La tabella b) risponde alla seguente domanda: "Sono pi religiosi gli
elettori del Polo o dell'Ulivo?" (dom. descrittiva)

81
Quando si commette un grave errore

Supponiamo di essere interessati alla composizione degli elettori dell'Ulivo
secondo l'orientamento religioso a fini di propaganda elettorale. Se
usassimo la tabella a) e sostenessimo che tra gli elettori dell'Ulivo ben il
54,7% rappresentato da Cristiani non cattolici commetteremmo un
errore. In questa tabella la percentuale di 54,7 rappresenta la quota di
cristiani che votano Ulivo, non la quota di elettori dell'Ulivo di
orientamento cristiano. L'errore consiste nel porsi un interrogativo che
richiede percentuali per riga, calcolando le percentuali per colonna (o
viceversa).



4. Analisi bivariata: presentazione delle tavole

a) prima forma di presentazione consigliata

Tab. 2.12. Grado di pratica religiosa per et. (Valori percentuali)
18-34 35-54 Oltre 54
Praticanti 24,4 27,6 41,6
Saltuari 29,1 28,0 20,1
Non praticanti 46,5 44,4 38,4

Totale 100,0 100,0 100,0
(N) (914) (1134) (438)


b) seconda forma di presentazione consigliata (con il
marginale della variabile dipendente)

Tab. 2.13. Grado di pratica religiosa per et. (Valori percentuali)
18-34 35-54 Oltre 54 Totale
Praticanti 24,4 27,6 41,6 28,9
Saltuari 29,1 28,0 20,1 27,0
Non praticanti 46,5 44,4 38,4 44,1

Totale 100,0 100,0 100,0 100,0
(N) (914) (1134) (438) (2486)

82
5. Criteri guida per la presentazione delle tavole:

1. Parsimonia. La tabella deve contenere solo i dati significativi per
valutare la relazione. In genere si escludono i valori assoluti, salvo che
non si ritengano necessari. I titoli come negli esempi devono essere
sintetici, ma contenere l'indicazione delle variabili coinvolte.

2. La tabella deve contenere sempre la riga (o colonna ) totale
contenente i valori 100. Serve ad indicare in che direzione sono state
calcolate le percentuali.

3. La tabella deve contenere sempre una riga (o colonna) in cui sono
indicate le basi delle percentuali, cio i valori assoluti corrispondenti al
100,0%. Il lettore deve sapere se i dati percentuali riguardano molti o
pochi casi.

4. I dati percentuali devono essere arrotondati alla prima cifra decimale,
come negli esempi, o arrotondati alla prima cifra intera (cio senza
decimali). La seconda cifra decimale non si userebbe mai nei
commenti e quindi non significativa. Le singole percentuali devono
essere arrotondate: se si usa una cifra decimale, i calcoli vanno fatti
fino alla seconda che verr usata per gli arrotondamenti (da 0 a 4, per
difetto, da 5 a 9 per eccesso). Dopo gli arrotondamenti occorre
controllare che il totale dia effettivamente 100,0 (non 99,9 o 100,1). Se
non accade correggere il valore pi alto (quadratura).

5. Se il decimale pari a zero, va riportato ugualmente.

6. La forma della tabella 2.13 da preferire, soprattutto se non stata
precedentemente presentata la distribuzione di frequenza della
variabile dipendente (orientamento al voto - la colonna totale infatti
presenta tale distribuzione). Questa colonna utile perch permette il
raffronto tra le singole colonne e il dato medio del campione.

Avvertenze: Se le percentuali sono calcolate per colonna, possono essere
sommate solo entro la colonna stessa, ma non fra le colonne. Se si
decide di accorpare due colonne bisogna sommare i valori assoluti e
solo dopo calcolare le percentuali.

83
6. Cosa fare se si vogliono ricavare i valori assoluti da una tabella che
contiene solo percentuali

L'esempio che segue mostra come si pu ricavare la colonna 'Totale' in una
tabella in cui era stata omessa. Mostra indirettamente perch importante
indicare le basi assolute delle percentuali.

Tab. 2.15 Composizione sociale degli iscritti alla facolt di
Lettere
Maschi Femmine
Ceti superiori 12,2 20,2
Ceti medi autonomi (art. comm.) 27,5 30,2
Ceti medi dipendenti (impiegati) 23,2 23,4
Operai 37,1 26,2

Totale 100,0 100,0
(N) (237)
(1178)

Se si vuole ricavare la percentuale complessiva di maschi e di femmine
che proviene dai ceti superiori, occorre passare attraverso i valori assoluti:

- ricavare quanti sono i maschi dei ceti superiori
12,2 : 100 = X : 237 X = 12,2*237/100 = 29

- quante sono le femmine dei ceti superiori: (1178*20,2/100 = 238)

- sommare i due valori assoluti cos ottenuti: (29+238 = 267)

- percentualizzare sul totale dei casi: [267/(237+1178)*100 = 18,7].

84
7. Interpretazione delle tavole

Tab. 13.7. Risposte alla domanda Lei soddisfatto dell'operato del governo? per
ampiezza del comune di residenza

a) valori assoluti

>250.000 100-
250.000
50-
100.000
10-
50.000
1-10.000 <1.000 Totale
Per nulla 97 26 29 23 62 10 246
Poco 168 71 99 249 253 8 848
Non so 89 36 49 118 153 1 446
Abbastanza 159 66 92 246 326 5 894
Molto 3 2 2 8 14 1 30
Totale 516 201 271 643 808 25 2464

Semplificazione della tabella (non si possono fare % su N < 50)
b) percentuali per colonna

>250.000 100-
250.000
50-
100.000
10-
50.000
<10.000
Per nulla 18,8 12,8 10,8 3,5 8,6
Poco 32,5 35,3 36,5 38,8 31,3
Non so 17,3 18,0 18,0 18,3 18,5
Abbastanza 30,8 32,9 34,0 38,2 39,8
Molto 0,6 1,0 0,7 1,2 1,8
Totale 100 100 100 100 100
(N) (516) (201) (271) (643) (833)
Idp -17,9 -14,2 -12,6 -2,9 +1,7

Nulla+poco 51,3 48,1 47,3 42,5 39,9
Abb+molto 31,4 33,9 34,7 39,4 41,6


Interpretazione: Si prende una modalit significativa della variabile
dipendente, e si vede come essa varia al variare della variabile
indipendente.
Commenti inutili e commenti sbagliati

Idp: Indice di differenza percentuale = soddisfatti - insoddisfatti


85
8. Forma della relazione

Tab. 13.8 Risposte alla domanda Con che frequenza si vede con amici o
amiche, al di fuori dell'orario scolastico o di lavoro?, per et
dell'intervistato.

Tutti i
giorni
Almeno
una volta
a
settimana
Almeno
una
volta
al mese
Non ha
amici
Totale (N)
19-25 anni 41,4 52,9 5,7 0,1 100 (87)
26-35 anni 15,0 67,1 12,1 5,7 100 (173)
36-45 anni 8,3 66,2 15,2 10,3 100 (145)
46-55 anni 4,9 54,0 27,6 13,5 100 (163)
56-65 anni 10,5 43,7 29,3 16,5 100 (133)
0ltre 65 23,1 35,5 18,8 22,6 100 (208)


9. Presentazione compatta di tavole


Tab. 3.8 Giudizio sulla partecipazione a scioperi spontanei per et.(Valori
percentuali)
15-19 20-29 30-29 40-49 50-59 60-69 70 e pi
Approva 45,2 42,1 32,8 17,7 13,1 11,8 11,2
Non approva 54,8 57,9 67,2 82,3 86,9 88,2 88,8
Totale 100.0 100.0 100.0 100.0 100.0 100.0 100.0
(N) (55) (132) (212) (75) (53) (83) (62)


Tab. 3.7 - Percentuale di persone che approvano le diverse forme di azione politica
non istituzionalizzata per et.
15-19 20-29 30-39 40-49 50-59 60-69 70 e pi
Partecipare a scioperi spontanei 45,2 42,1 32,8 17,7 13,1 11,8 11,2
Bloccare il traffico 11,1 19,0 13,3 11,4 9,8 7,9 2,2
Fare l'autoriduz dell'affitto 18,3 22,3 15,8 12,0 14,3 13,9 15,8
Fare l'autoriduz delle bollette 19,1 20,0 18,7 15,4 21,7 16,3 17,7
Occupare case sfitte 32,2 38,9 27,4 24,2 27,6 29,2 12,1
Occupare fabbriche 33,7 44,8 48,7 35,6 36,8 31,9 22,7
Scrivere slogan sui muri 9,1 7,2 4,8 2,1 3,3 1,0 2,3

(N) (55) (132) (212) (75) (53) (83) (62)
Domanda: Ora le legger alcune azioni che la gente talvolta fa per protestare o per
influire sul governo. Per ciascuna di queste lei mi dovrebbe dire se la approva o la
disapprova.

86


Tab. 3.9 - Il ritratto dell'elettorato italiano (percentuali di voto per diverse
variabili indipendenti; elezioni politiche del 1996).

Polo Lega Ulivo Altri Totale Polo Lega Ulivo Altri Totale

Totale 40 10 46 4 100 (1962) Lettura quotidiani
Lettore quot. 39 9 48 4 100 (1045)
Dimensione del comune Non legge quot.42 11 43 4 100 (917)
< 10.000 ab 38 15 44 3 100 (654) Esposizione Tv
10-100.000 41 9 44 6 100 (808) Alta 43 11 42 4 100 (797)
100-250.000 39 6 50 5 100 (189) Moderata 38 9 48 5 100 (1148)
>250.000 ab 44 4 49 3 100 (313) Momento della decisione di voto
Genere Ultima settim. 34 16 44 6 100 (502)
Maschio 39 11 46 4 100 (1079) Tempo prima 43 7 46 4 100 (1459)
Femmina 41 8 46 5 100 (883)
Anno di nascita
Fino al 1945 42 7 48 3 100 (431)
1948-1965 38 9 48 5 100 (1016)
Dopo 1965 43 13 40 4 100 (516) Titolo di studio
Classe sociale Lic. elementare32 9 51 8 100 (187)
Borghesia 57 7 32 4 100 (195) Lic. media 39 15 42 4 100 (659)
Picc. borghesia41 12 39 8 100 (275) Diploma 44 7 45 4 100 (416)
Dirigenti-quadri44 6 45 5 100 (170) Laurea 38 6 52 4 100 (153)
Insegnanti 31 4 62 3 100 (188)
Imp. concetto 39 9 48 4 100 (392)
Impieg. esec. 45 9 45 1 100 (240)
Operai 34 14 47 5 100 (493)
87

10. Rappresentazioni grafiche

Fig. 13.1 Rappresentazioni grafiche di tavole di contingenza: diagramma a barre

a) insoddisfazione nei confronti dell'operato del governo per dimensione della citt di
residenza (dati di tab. 13.7b)

Insoddisf atti
39,9
42,5
47,3
48,1
51,3
0
10
20
30
40
50
60
<
1
0
.
0
0
0
1
0
-
5
0
.
0
0
0
5
0
-
1
0
0
.
0
0
0
1
0
0
-
2
5
0
.
0
0
0
>
2
5
0
.
0
0
0


b) frequenza con la quale vede gli amici per et (dati di tab. 13.8)

0
5
10
15
20
25
30
35
40
45
19-25 26-35 36-45 46-55 56-65 0ltre 65
Tutti i giorni
Non ha amici



88
Fig. 13.3 Rappresentazioni grafiche di tavole di contingenza: spezzata


a) soddisfazione nei confronti dell'operato del governo per dimensione della citt di
residenza

0
10
20
30
40
50
60
<10.000 10-
50.000
50-
100.000
100-
250.000
>250.000
Insodd.
Sodd.



b) frequenza con la quale vede gli amici per et

0
5
10
15
20
25
30
35
40
45
19-25 26-35 36-45 46-55 56-65 0ltre 65
Tutti i giorni
Non ha amici


89
LEZIONE 12
ANALISI BIVARIATA: DIAGRAMMA DI DISPERSIONE

ATTENZIONE: lo studente deve solo capire che cosa un diagramma di dispersione
e come da una tabella in cui sono riportate i valori per le variabili X e Y si passa alla
rappresentazione grafica. Non necessario che sappia calcolare i coefficienti a e b
della retta di regressione, n il coefficiente di correlazione r

Pagine di testo corrispondenti
- sul testo La ricerca sociale: metodologia e tecniche, Bologna, Il Mulino - Vol IV. L'analisi dei dati
Cap. III: par. 7.1 (solo questo sotto-paragrafo del par. 7)
- oppure sul testo Metodologia e tecniche della ricerca sociale, Bologna, Il Mulino - Cap. XIII: par.
7.1 (solo questo sotto-paragrafo del par. 7)

Tab. Voti in italiano (X) e in matematica (Y) dei 10 allievi di una classe
Caso n. X Y
1 9 7
2 4 4
3 6 5
4 5 5
5 5 6
6 7 8
7 8 6
8 4 3
9 7 5
10 7 6

Relazione fra i voti in italiano e in matematica degli alunni di una classe
0
1
2
3
4
5
6
7
8
9
0 1 2 3 4 5 6 7 8 9 10
italiano
m
a
t
e
m
a
t
i
c
a


90
9; 7
4; 4
6; 5 5; 5
5; 6
7; 8
8; 6
4; 3
7; 5
7; 6
0
1
2
3
4
5
6
7
8
9
0 1 2 3 4 5 6 7 8 9 10
italiano
m
a
t
e
m
a
t
i
c
a


Fig. 13.4 Diagrammi di dispersioni raffiguranti quattro tipi di relazioni fra due
variabili

a) lineare positiva (o diretta; r = 0,74)

0
1
2
3
4
5
6
7
8
9
0 2 4 6 8 10



91
b) lineare negativa (o indiretta; r = -0,81)

0
1
2
3
4
5
6
7
8
9
0 2 4 6 8 10



e) nessuna relazione (r = 0,03)

0
1
2
3
4
5
6
7
8
9
0 2 4 6 8 10



d) curvilinea (r = 0,06)

0
1
2
3
4
5
6
7
8
9
0 2 4 6 8 10

92


ESEMPIO 1

Interrogativo: nelle regioni italiane c una relazione fra la frequenza con la quale la
gente va al cinema e la ricchezza della regione (nelle regioni pi ricche si va al
cinema di pi?)
X: Ricchezza = prodotto interno lordo per abitante (in euro)
Y: Affluenza al cinema = Persone di 6 anni e pi che hanno fruito del cinema per
regione di appartenenza nellanno 2003 (valori percentuali)

Regioni X. Pil per
abitante ()
Y.
Affluenza(%)
Piemonte 25.796,60 48,1
Valle d'Aosta 29.952,80 40
Lombardia 28.869,90 48,5
Trentino Alto
Adige
30.430,60 38,7
Veneto 25.796,60 47,6
Friuli Venezia
Giulia
26.552,50 45,3
Liguria 25.511,50 46,5
Emilia Romagna 28.182,40 48,3
Toscana 25.137,60 50,3
Umbria 22.117,10 45,3
Marche 23.080,60 48,9
Lazio 27.126,90 52,8
Abruzzo 19.109,60 48,9
Molise 18.207,40 41,5
Campania 15.642,00 52,2
Puglia 15.494,00 47,2
Basilicata 16.077,70 42,3
Calabria 15.161,90 35,8
Sicilia 15.854,00 47,9
Sardegna 18.054,60 42,8
Italia 23.114,50 48,1
Fonte: Istat, Cultura, socialit e tempo libero. Indagine multiscopo sulle famiglie Aspetti della vita
quotidiana Anno 2003

93
Relazione fra affluenza al cinema e prodotto
interno lordo per abitante nelle regioni italiane
30
35
40
45
50
55
10.000,00 15.000,00 20.000,00 25.000,00 30.000,00 35.000,00
Pil
A
f
f
l
u
e
n
z
a

r=0,09.


94
ESEMPIO 2

Relazione fra Pil e tasso di utilizzo del pc a livello regionale. Italia 2003.

Regioni
PIL
1

Tasso di utilizzo
del pc
Piemonte 122,0 39,8
Valle d'Aosta 136,1 41,8
Lombardia 137,4 44,6
Trentino-Alto Adige 139,3 45,4
Veneto 121,5 42,7
Friuli-Venezia Giulia 125,1 40,5
Liguria 119,2 40,4
Emilia-Romagna 133,7 42,8
Toscana 118,0 41,5
Umbria 103,3 36,1
Marche 108,2 42,5
Lazio 124,3 40,8
Abruzzo 90,8 39,3
Molise 83,4 38,0
Campania 72,1 33,0
Puglia 71,6 33,7
Basilicata 74,9 37,2
Calabria 68,5 33,7
Sicilia 73,1 31,3
Sardegna 83,4 39,4
Italia 107,9 39,2
1
I valori dei PIL sono espressi in numeri indice, in cui la base fissa 100 la media dei PIL dei 25 paesi dellUnione
Europea nel 2003.

Fonte: ISTAT, Cultura, socialit e tempo libero, Roma, 2005.
Fonte per il PIL: http://www.regioni.it/mhonarc/readsqltop5.aspx


1
I valori dei PIL sono espressi in numeri indice, in cui la base fissa 100 la media dei PIL dei 25 paesi dellUnione
Europea nel 2003.
95
Relazione fra uso del pc e pil a livello regionale
30
32
34
36
38
40
42
44
46
48
60 80 100 120 140 160
Uso pc
P
i
l

r = 0,88

ESEMPIO 3

Tab. Tasso di suicidio e pratica religiosa per regione
X. % Praticanti (1) Y. Suicidi x
100.000 ab.
Piemonte 43,3 9,3
Valle dAosta 26,8 14,1
Lombardia 36,5 6,7
Trentino-Alto Adige 43,0 11,5
Veneto 44,7 8,1
Friuli-Venezia Giulia 28,3 11,7
Liguria 24,6 10,7
Emilia-Romagma 26,6 9,3
Toscana 26,2 7,2
Umbria 29,5 11,3
Marche 40,8 5,9
Lazio 28,6 6,6
Abruzzo 37,4 6,7
Molise 45,5 9,0
Campania 43,2 4,0
Puglia 45,1 4,2
Basilicata 35,5 5,2
Calabria 38,8 4,6
Sicilia 43,2 5,6
Sardegna 21,2 10,3
(1) % di persone che nella regione vanno a messa tutte le settimane
Fonte: per la pratica religiosa -Indagine multiscopo sulle famiglie "aspetti della vita quotidiana"
dicembre 2001- marzo 2002, http://www.istat.it/dati/catalogo/20030708_01/
Fonte: per il suicidio Annuario statistico 2004, http://www.istat.it/dati/catalogo/20040927_00/
96


Relazione fra pratica religiosa e suicidio per
regione
0
2
4
6
8
10
12
14
16
20 25 30 35 40 45 50
% praticanti
s
u
i
c
i
d
i

x

1
0
0
.
0
0
0

a
b
.



Relazione fra pratica religiosa e suicidio per
regione
R
2
= 0,2474
0
2
4
6
8
10
12
14
16
20 25 30 35 40 45 50
% praticanti
s
u
i
c
i
d
i

x

1
0
0
.
0
0
0

a
b
.


r = 0,50