Sei sulla pagina 1di 6

STATISTICA SOCIALE

“Conoscere per deliberare” -> Luigi Eiunaudi

La statistica è una disciplina scientifica che aiuta a prendere le decisioni, però i dati devono essere
correttamente presi.

La statistica è la disciplina che studia i fenomeni collettivi allo scopo di metterne in evidenza le regolarità.

Il vocabolo statistica deriva dal latino “status”, perché inizialmente questa scienza si occupava esclusivamente degli avvenimenti
dello Stato.

La parola Statistica viene usata sia al singolare che al plurale. Usata al singolare sta a significare l’insieme dei metodi e delle
teorie che permettono di studiare i fenomeni collettivi, mentre usata al plurale sta ad indicare un insieme di dati numerici relativi
a gruppi di persone o fatti in senso lato.

Non è possibile dare una definizione specifica di statistica.

In tutti i problemi di statistica ci si trova di fronte ad un insieme di dati che sono stati raccolti in vista di determinati
scopi. Poiché questi possono presentare aspetti diversi, oggi nella statistica si presentano tre rami principali:

1. Statistica descrittiva: descrive, illustra gli universi statistici, le popolazioni statistiche. Gli universi e le
popolazioni statistiche rappresentano la totalità degli elementi di studio.
Prende in considerazione tutti gli elementi di studio.
Studia la globalità e la totalità degli elementi presi in esame, per questo è molto percisa.
- vantaggi: precisione alta
- svantaggi: implica molto denaro e molto tempo
È quella branca della Statistica che si limita alla raccolta dei dati, al loro esame diretto e alla loro elaborazione. I dati raccolti
servono solamente a descrivere certe caratteristiche di un determinato fenomeno. Inoltre siccome ci si limita ad operare
sull’accertato non comporta la probabilità.
2. Statistica inferenziale o teoria dei campioni: si usa quando si ha difficoltà nello stimare un dato. Si fa una
rilevazione di carattere campionistico. Il campione è un sottoinsieme statistico dell’universo.
E’ poco precisa. Fa uso del calcolo della probabilità, per questo è veritiera per il 90-95%. basandosi su una
probabilità può avere un margine di errore (probabilità di errore: 5-10%).
Il campione deve essere casuale. Ogni elemento del mio campione deve avere la medesima probabilità di
estrazione per questo si utilizza una tavola dei numeri casuali. La tavola dei numeri casuali può essere letta in
tutte le direzioni, con questa si ha la certezza che l’elemento scelto abbia la stessa probabilità di estrazione.
È quella branca della statistica che conduce da una parte al tutto della popolazione nella presunzione che la parte sia
rappresentativa delle caratteristiche qualitative o quantitative della popolazione.
È la statistica usata nel campionamento, e tratta pertanto qualunque forma di scelta del campione, di esame di esso, di
riferimento del campione alla popolazione.
Essa opera su grandezze di tipo probabilistico ed il suo scopo può essere così sintetizzato: da una certa popolazione, i cui
caratteri sono ignoti, si estrae un campione casuale, e sulla base di dati da esso forniti, si vuol provare una certa ipotesi che
riguarda la popolazione. Questa branca della statistica, oltre che inferente, suole denominarsi anche “induttiva”.
Per conoscere le caratteristiche di una popolazione, difficilmente saremo in grado di misurare tutti i suoi elementi, per
motivi di costo, di tempo e di opportunità. Perciò si ricorre al campionamento statistico. Si definisce campionamento un
procedimento attraverso il quale da un insieme di unità costituenti l’oggetto dello studio, si estrae un numero ridotto di
casi scelti con criteri tali da consentire la generalizzazione all’intera popolazione dei risultati ottenuti.
Ci sono diversi tipi di campionamenti:
- Campionamento semplice o casuale (random): interessa tutti gli elementi della popolazione. Si procede selezionando n
unità da un insieme di N elementi, tale che ogni soggetto abbia le stesse probabilità di essere estratto. Per raggiungere
questo scopo, si può ipotizzare che tutti i soggetti della popolazione siano imbussolati in una ipotetica urna e che essi siano
numerati da 1 fino ad N.
- Campionamento stratificato random: interessa differenti strati della popolazione, identificati tramite caratterizzazione
della stessa (es. differente livello di reddito). Viene anche chiamato campionamento proporzionale o campionamento a
quota. Si procede dividendo la popolazione in sottogruppi omogenei ed estraendo da ogni strato un campione casuale
semplice; i diversi campioni così ottenuti vanno poi uniti per ottenere il campione globale. Con questa strategia di
campionamento possiamo assicurare la rappresentatività dei sottogruppi della popolazione. Utilizzando gli stessi rapporti di
campionamento per i diversi strati possiamo avere un campionamento proporzionale.

3. Statistica decisionale o prova delle ipotesi statistiche: aiuta il ricercatore a prendere delle decisioni in sede di
incertezza.
La teoria delle decisioni, pur essendo senza dubbio la branca più moderna della statistica, le rifiuta le tecniche, le procedure
della statistica tradizionale, anzi essa cerca di ampliarla, aprendoci la via per decidere se, obiettivamente, una particolare
ipotesi debba essere accettata o rifiutata.

La Statistica descrittiva è un metodo matematico adatto allo studio quantitativo dei fenomeni di massa o collettivi. La
Statistica inferente risulta un metodo per ricavare, da un insieme di dati campionari, delle informazioni sulla
popolazione, da dove provengono quei dati. La Statistica decisionale è invece un insieme di metodi, che ci permette di
prendere decisioni ottime in presenza di incertezza.

Come fare una ricerca di tipo statistico?


Non esistono delle regole tassative per dire come si fa una ricerca di tipo statistico. Conta soprattutto l’esperienza del
ricercatore.

In linea di massima nessun testo è in grado di dire come si fa una ricerca ed in particolare una ricerca di tipo statistico.

La creazione di un dato statistico avviene attraverso varie fasi che non devono considerarsi tassative ma puramente
indicative. Nell’ordine esse sono:

1. Studio del problema ed impostazione della ricerca : Lo studio del problema avviene attraverso la letteratura
esistente sull’argomento, bibliografia, ecc..
Nell’impostazione della ricerca ci sono tre fasi:
a) Indicare subito gli obbiettivi di ricerca (gli obbiettivi possono essere anche più di uno e sono modificabili
durante la ricerca);
b) Analisi della letteratura;
c) Scelta della metodologia della raccolta dei dati.

2. Scelta ed individuazione delle unità statistiche pertinenti la ricerca

3. Raccolta dei dati da ciascuna unità statistica: I dati vengono raccolti attraverso diversi metodi:
a) Questionario;
b) Intervista faccia a faccia;
c) Intervista telefonica o CATI (Client Assestament Telephonic Interview);
d) Questionario autocompilato.
Durante la raccolta dei dati può avvenire il fenomeno dell’acquiescenza che è la tendenza a rispondere
favorevolmente alle domande senza aver pienamente compreso il quesito. Questo fenomeno può verificarsi
nell’intervista faccia a faccia o in quella telefonica.

4. Classificazione e misura dei dati

5. Presentazione dei dati statistici sottoforma di tabelle statistiche, grafici , ecc.

6. Sintesi dei dati statistici, elaborazioni e presentazione dei più importanti risultati

7. Discussione e implicazione dei risultati

8. Conclusioni.

QUESTIONARIO:

Il questionario si configura come un insieme strutturato di domande volte ad acquisire le informazioni necessarie per
soddisfare le finalità conoscitive dell’indagine.

Stabiliti gli obiettivi, diventano cruciali le fasi della messa a punto del questionario e della scelta della modalità di
somministrazione agli intervistati.
La sua predisposizione, che chiama in causa competenze assai diverse, in particolare di psicologia cognitiva e di
tecnica della comunicazione statistica, coinvolge decisioni che riguardano principalmente i seguenti aspetti:

- valutazione preliminare riguardante la scelta della popolazione e delle modalità di contatto con gli intervistati;

- formulazione dei quesiti;

- forma e definizione della scala di misura delle risposte;

- sequenza dei quesiti;

- pre-test ed eventuale revisione.

Prima di mettere a punto il questionario, è necessario fissare con esattezza le informazioni che dovranno essere
rilevate, presso quali unità statistiche e in che modo. Come è stato a più riprese precisato, si tratta di definire
l’obiettivo conoscitivo dell’indagine, di stabilire i criteri di selezione di un campione dopo aver identificato la
popolazione di riferimento per l’indagine, di fissare le modalità di contatto con gli intervistati mediante intervista
personale o telefonica o tramite autocompilazione del questionario (generalmente spedito per posta o accessibile via
internet).

Per costruire un questionario bisogna seguire alcune linee guida:

1) Progettazione dell’insieme delle domande: Le domande devono avere 3 caratteristiche:


- Devono focalizzarsi su un singolo aspetto (le domande che coprono due aspetti generano confusione)
- Devono essere brevi (ogni domanda dovrebbe essere la più breve possibile più lunga è la domanda meno essa
è comprensibile)
- Devono essere chiare (L’intento della domanda dovrebbe essere chiaro ad ogni soggetto. Le domande
dovrebbero essere formulate nel linguaggio del rispondente)
Prima di esserevarato il questionario deve essere sottoposto a prove di validità o qualità.

2) Formulazione della domanda

Nella costruzione di un questionarioci sono alcuni distorsioni da evitare:


- Evitare il linguaggio tecnico o le sigle;

- Evitare domande irrilevanti;

- Evitare domande dal significato vago;

- Evitare domande che implicano giudizi multipli;

- Evitare domande che siano troppo specifiche o troppo generali.

La validità si estrinseca in 3c:

1°c = Validità del contenuto: deve saper tenere in considerazione non solo il pensiero di chi lo crea ma anche del

pensiero di chi viene somministrato

2°c = Validità del costrutto: il costrutto è il macroaspetto su cui imdaga il questionario. Si capisce se il questionario ha
una buona validità di costrutto se viene somministrato a un certo campione di un’unità statistica per provarlo. Se il
questionario ha una buona validità di costrutto si dice che il questionario ha la proprietà del 2°c.

3°c = Validità del criterio

INTERVISTA FACCIA A FACCIA:

Vantaggi:

- Può rappresentare l’approccio più praticabile considerato il tipo di popolazione che si vuole investigare (utenza con
disabilità fisiche e mentali).

- Possibilità di esplorare i problemi più in profondità, specie se lo strumento contiene delle componenti qualitative.

- Facilità di risposta e quindi elevati tassi di partecipazione.


- Opportunità di precisare meglio le domande, se l’utente non le comprende bene.

- Opportunità per l’intervistatore di esplorare le ragioni delle risposte ricavandone ulteriori informazioni.
- Opportunità per gli utenti di essere maggiormente coinvolti nel processo di consultazione.

- Consente di utilizzare materiale visivo che riporta alternative di risposta quando esse risultano complicate.

- Migliore identificazione dei non rispondenti.

Svantaggi:

- Richiede molto tempo ed è costosa.

- Necessità di personale motivato, specializzato ed addestrato.

- Può condurre a risposte compiacenti verso le aspettative dell’intervistatore.

INTERVISTA TELEFONICA:
Vantaggi:
- Elevati tassi di risposta dovuti alla possibilità di contattare più volte l’utenza.

- Più conveniente per utenti lontani dalla sede di erogazione del servizio.

- Maggiore semplicità di amministrazione e di immediata disponibilità dei dati per l’elaborazione con utilizzo di
tecniche quali, ad esempio, il CATI.

- Necessità di minor formazione per gli intervistatori.

Svantaggi:
- Per interviste complesse può risultare costosa a causa delle spese telefoniche.

- Può condurre a risposte compiacenti verso le aspettative dell’intervistatore.

QUESTIONARIO POSTALE O AUTOCOMPILATO:


Vantaggi:
- Basso costo.

- Facile da amministrare.

- Maggiore riservatezza nelle informazioni raccolte (garanzia dell’anonimato).

- Misura più obiettiva per mancanza dell’effetto intervistatore.

- Voci standardizzate.

- Possibilità per il rispondente di valutare con maggiore tranquillità le domande.

Svantaggi:
- Molti utenti non sono in grado di prendervi parte a causa di loro disabilità fisiche e mentali.

- Rappresenta una forma passiva di consultazione.

- Gli utenti anziani possono non rispondere a tutte le domande.

- Non c’è la possibilità di controllare le mancate risposte.

Ciascun rispondente, nella compilazione del questionario, per poter esprimere la propria opinione con sincerità, deve
sapere che le sue risposte non possono essere ricondotte alla sua persona.

La garanzia dell’anonimato è un principio irrinunciabile, in assenza del quale si rischia di vanificare la finalità
dell’indagine. Per assicurare il principio dell’anonimato sono necessari alcuni accorgimenti tecnici:

- non personalizzare il questionario con una pre-compilazione dei dati anagrafici;

- consentire la compilazione del questionario in ambiente riservato, senza l’osservazione diretta dei rilevatori/incaricati
della raccolta dei questionari/colleghi/ecc.;

- garantire l’anonimato durante l’elaborazione dei dati anche attraverso il ricorso a procedure informatiche.
MATRICE DEI DATI

In linea di massima possiamo definire la matrice dei dati come uno specchio ordinato di numeri su righe e colonne.

Ciascuna riga individua una unità statistica. Le colonne individuano i caratteri che vanno a qualificare ciascuna unità
statistica.

La lettura per riga di una matrice dei dati consente di accorpare unita
statistiche che presentano un profilo simile. La lettura per colonna
consente di accorpare le variabili relazionate fra di loro, che si suppone
essere espressione di un comune carattere latente.

I caratteri che formano l’oggetto di una rilevazione statistica, si possono classificare in due branche fondamentali:

1) Caratteri qualitativi;

2) Caratteri quantitativi.

I caratteri qualitativi sono quelli espressi con aggettivi, attributi o espressioni verbali (es. bello,
brutto,maschio,femmina)

Sono espressi da forme verbali come ad esempio sesso o titolo di studio; inoltre presentano queste specificità:

- non possono subire, almeno direttamente un trattamento matematico;

- non sempre consentono un ordine logico di successione.


I caratteri quantitativi sono quelli espressi in numeri. Possono essere continui o discreti. I caratteri discreti sono quelli
che variano per quantità finite. Questi caratteri sono detti anche enumerabili, perché risultano da un’operazione di
conteggio (es. numero dei componenti di una famiglia, numero dei matrimoni celebrati in Italia). I caratteri continui
variano per quantità piccole a piacere, assumendo tutti i valori reali in un certo intervallo. Alcuni caratteri continui sono
peso, età, altezza. Il carattere discreto è sempre il risultato di un conteggio, mentre il carattere continuo è sempre il
risultato di una misurazione, che consiste nel rapportare la quantità in esame con l’unità di misura scelta.
SCALE DI MISURA:

La scala è un tipo di matrice che si utilizza per misurare un fenomeno. Possono essere:
- Verbali;
- Numeriche.
Le scale verbali a loro volta possono essere nominali o ordinali. La scala nominale si adotta quando il confronto tra
due unità statistiche permette soltanto di effettuare delle operazioni di ugulianza (=) o di disugualianza (  ). Invece, la
scala ordinale è una scala di giudizio. In questa scala si ha una scala gerarchica delle risposte.
Le scale numeriche a loro volta possono essere ad intervallo o a rapporto. Le scale a rapporto si hanno quando il
carattere non ha origine fissa, può anche corrispondere a 0. Questa scala permette il confronto tra unità statistiche tra
le quali c’è differenza, cioè intervallo (es. componenti di una famiglia). La scala a rapporto si ha quando c’è assenza
fisica del fenomeno (es. età). Ammette 0 come origine e che rappresenta l’assenza fisica del rapporto.
SCALA LIKERT:
Nell’ambito delle scale ordinali, una particolare attenzione merita la scala Likert. Il suo utilizzo si basa sulle seguenti
motivazioni:
1. Consente la misurazione degli atteggiamenti e/o delle percezioni dei soggetti rispetto agli ambiti di indagine;
2. E’ facilmente applicabile e, quindi, utilizzabile per qualunque modalità di distribuzione del questionario che il
ricercatore deciderà di utilizzare;
3. L’ampiezza delle alternative di risposta rispetto a quelle che ne prevedono soltanto una di tipo dicotomico rende
tale scala più flessibile e quindi, fornisce maggiori informazioni e dati da elaborare;
4. L’uso della forma lessicale utilizzata per graduare il gradimento può essere rappresentato da una serie di
affermazioni per ognuna delle quali l’intervistato può rispondere con questa alternative: ad es. “da molto insoddisfatto
a molto soddisfatto”, “da molto d’accordo a fortemente contrario o in disaccordo”, ecc., consentendo anche di poter
esprimere una posizione di incertezza o di neutralità.

DA MATRICE DEI DATI A TABELLE STATISTICHE:


Si passa da una matrice a una tabella statistica estraendo colonna per colonna le variabili che sono oggetto di studio.

FREQUENZE:

f
 Frequenza assoluta = i o frequenza con i
Indica un numero delle unità statistiche che possiedono quel determinato carattere.

 Frequenza relativa = f r fi fi
Indica il rapporto fra la frequenza assoluta ed il totale N dei casi osservati, cioè f r= o xf100.
r=
N N
La frequenza relativa, a differenza di quella assoluta, ci permetterà di confrontare più distribuzioni statistiche, pur
riferentesi a totali diversi.
La frequenza relativa è un numero positivo, compreso tra 0 e 1 o tra 0 e 100. La somma di tutte le frequenze
relative è uguale all’unità.
cum
 Frequenza relativa cummulata = f r
Indica quando delle unità statistiche presentano un valore non superiore o uguale a una determinata unità.

TABELLE STATISTICHE:
Le tabelle statistiche possono essere classificate in tre gruppi:
1. Tabelle statistiche che si ricollegano a modalità qualitative (serie statistiche).
2. Tabelle statistiche che si ricollegano a modalità quantitative (seriazioni statistiche).
3. Tabelle miste (tabelle a doppia entrata).
Le serie statistiche sono una sucessione di frequenze assolute o relative che si riferiscono a un carattere misurabile
su scala nominale.
Le tabelle miste o a doppia entrata sono tabelle nelle quali si tiene conto contemporaneamente di più modalità
qualitative e quantitative. Le tabelle a doppia entrata possono essere di associazione (o di contingenza) o di
correlazione. E’ di associazione quando i caratteri sono legati tra di loro. E’ di correlazione quando invece esiste un
nesso logico.
Quando si studia la relazione tra due variabili nominali o ordinali, scegliere fra le percentuali di riga e le percentuali di
colonna non è indifferente: una scelta è esatta mentre l’altra è errata. Esiste un criterio che ci può guidare in questa
scelta? Esiste ed è il seguente:
- Si sceglie la percentuale di colonna quando si vuole analizzare l’influenza che la variabile posta in colonna ha sulla
variabile posta in riga.
- Si sceglie la percentuale di riga quando si vuole analizzare l’influenza che la variabile posta in riga ha sulla variabile
posta in colonna.