In Psicologia:
• Ricerche condotte su individui o gruppi di individui
• Le caratteristiche variabili oggetto di indagine sono tratti e stati psicologici, atteggiamenti e
comportamenti
Ma non solo: le unità possono anche essere oggetti, come domande di un questionario, stimoli di un test, di
cui vogliamo a studiare le proprietà
Formulazione
Risultati
Delle I potesi
Operativizzazione
Interpretazione / \ (disegno della
ricerca)
Analisi dati
i
Organ izzazione dati
Davide Marengo, davide 1 re 1 .lt 14
Obiettivo: Sintetizzare e descrivere i dati raccolti Obiettivo: Generalizzare i risultati dell'analisi condo
su un collettivo. su un gruppo limitato di soggetti (campione
rappresentativo)all'intero collettivo (popolazione, o
Descriviamo la distribuzione di variabili universo).
demografiche, sociali e psicologiche nell'intera
popolazione, o sottogruppi della stessa 1. Identifichiamo una popolazione di riferimento.
(organizzazioni, istituzioni, gruppi sociali).-> 2. Sulla base di una lista di campionamento,
CENSIMENTO. reclutiamo individui rappresentativi della
popolazione.
Tipi di ricerca:
INFERENZA: Attraverso un processo di inferenza, la distribuzione dei fenomeni osservati nel campione (ed
eventuali relazioni emerse tra gli stessi), è generalizzata alla popolazione generale.
Il processo di inferenza basato su dati campionari è necessariamente affetto da una fonte non interamente
conoscibile di errore dovuta a:
• Errori nella operativizzazione delle variabili
• Errori nel processo di rilevazione delle variabili
• Errori nel processo di inserimento dei dati
• Errori nella selezione dei partecipanti
Ciò che è misurabile è l'errore di campionamento: calcolo dell'errore provocato dal fatto di operare su un
campione di numerosità ridotta invece che sull'intera popolazione sotto esame. Un altro elemento che
incide sulla capacità di fare inferenze in modo affidabile è la variabilità del fenomeno studiato.
Tratteremo questi aspetti in modo approfondito quando studieremo i contenuti relativi alla statistica
inferenziale
UNIVERSO
Campione
Popolazione/Collettivo Definizione e)
o erativa Casi effettivamente
Insieme di unità o oggetti a cui si osservati
interessa la ricerca
Proprietà
.________ Definizione operativa
Ri levare gli stati di una proprietà
Attribuire un codice a cia scu no stato
~
-i--v-a-r-
ia-b-ile--
Davide Marengo, dav1de.marengo@umto.1t
La funzione di corrispondenza
Una variabile di scala o di misura è un sistema che mette in relazione di corrispondenza, utilizzando una
funzione f gli stati di oggetti (ad es., individui) su proprietà (sistema empirico o SE), e numeri reali (sistema
numerico o SN).
Esprimiamo questa relazione attraverso la funzione di corrispondenza: SN = f (SE)
f: funzione che fa corrispondere a ogni elemento di SE uno di SN
ex: PAZIENTE 1 (SE)-> OTTIENE 3 PT (SN)
Proprietà Variabile
Definizione
Caratteristica oggetto Insieme dei codici
della ricerca
o erativa
inseriti in matrice
X Your Activity
Time on lnstagram
..
1 13
Oaily Aver ge
Average time you spent per day us ng th lnstagram 2 90
app on thls devlce ,n th last week
3 27
4 32
5 240
~ .. Todty
I, Du,.,,nl I uh m du ~• - • ,
.
,
o J
Casi PHQ-8
..
o 1 2
o l 2 3
o 3 o
o
4 8
o 2 3
5 5
o 2
1 13 2
2 90 3
3 27 o
4 32 8
5 240 5
La codifica delle proprietà in dati numerici permette di studiare la distribuzione delle singole variabili, e
le loro relazioni reciproche con gli strumenti della statistica descrittiva (e inferenziale, se campione
rappresentativo).
Operazioni
Le operazioni che permettono di passare dalle proprietà alle variabili sono:
• Classificazione: suddivisione di un concetto in sottoinsiemi, chiamate classi di equivalenza su cui
valgono le proprietà: esaustività (capacità delle categorie di coprire il dominio della proprietà, tutti i casi
devono poter essere attribuiti alla categoria) e esclusività (l'impossibilità che un caso possa essere
attribuito a più categorie) .
• Ordinamento: partizione del dominio di una proprietà che gode anche della relazione di ordine, oltre
che di equivalenza. ex. A>B B>C C=D, ma non si può quantificare in numeri la distanza.
• Misurazione: presuppone l'esistenza di una unità di misura
• Conteggio: enumerazione degli oggetti posseduti, delle attività possedute .. . (numero di figli)
CLASSIFICAZIONE IN LIVELLI DI SCALA DI STEVENS:
Stevens distingue 4 tipi di scale di misura in base alle famiglie di trasformazioni ammissibili:
• Variabili nominali
• Variabili ordinali
• Variabili ad intervalli o intervallari (misurazione)
• Variabili a rapporti o razionali (misurazione)
Trasformazioni ammissibili:
Le diverse scale di misura sono formalmente definite attraverso le classi di trasformazioni ammissibili, ossia
quelle funzioni T che consentono di passare da una misura del sistema empirico ad una qualsiasi altra
misura dello stesso sistema.
Per trasformazione ammissibile si intende l'insieme delle trasformazioni che alterano solo gli aspetti
convenzionali di una scala.
SCALA NOMINALE:
Sistema empirico di tipo classificatorio in cui la realtà può essere suddivisa in categorie distinte e
mutualmente esclusive (classi di equivalenza).
Classificare vuol dire attribuire numeri uguali agli elementi della stessa categoria e numeri diversi ad
elementi appartenenti a categorie diverse.
I sistema numerico ha la sola proprietà di simbolo.
Qual è la tua piattaforma socia l media preferita? Scegli tra le opzioni di seguito :
1. lnstagram
2. Facebook
3. TikTok
4. Twitter
5. Snapchat
6. Altro _ _
Matrice Casi x Variabili
Trasformazione Trasformazione
Casi Piattaforma social
Ammissibile (T) Ammissibile (T)
Lucia lnstagram 1 8
Marco Facebook 2 2
Andrea TikTok 3 1
Paolo lnstagram 1 8
Sara Twitter 4 6
SCALA ORDINALE:
In un sistema empirico ordinabile gli elementi godono della stessa caratteristica ma in quantità o grado
diverso, ordinabile rispetto a tale grado (relazioni di ordine). li sistema numerico rispecchia le stesse
caratteristiche del sistema empirico di ordinabilità.
Ad uno stesso numero è associata la stessa quantità di caratteristica e i numeri indicano solo una
graduatoria.
EX->Scala Moh della durezza dei minerali, Voti ottenuti negli esami, Grado militare, Titolo di studio, Graduatorie
in un concorso
- • • ..
Lucia 3
Marco 3
Andrea 2
- ..
Lucia 1
- Marco
Andrea
3
4
I '
Davide Marengo, dav1de.marengo@unito.it
Paolo
Sara
2
4
47
Marco 4
Andrea 2 3 4
Paolo 3 4 9
Sara 4 5 16
MISURAZIONE:
Quando nel sistema empirico è possibile stabilire una relazione di uguaglianza degli intervalli (o delle
distanze) tra gli stati di una proprietà, allora possiamo parlare di misurazione in senso stretto. Nel sistema
numerico corrispondente è possibile stabilire l'entità delle differenze di intensità della caratteristica.
L'intervallo costante a cui viene attribuito il valore"l" all'interno di una scala di misura si chiamaunità di
misura.
Trasformazioni ammissibili:
1. Dilatazione y' = my, dove m > O
Tale che dati tre oggetti i, j , k - (yi - yj)/(yj - yk) = (y'i - y'j)/(y'j - y'k)
m: coefficiente angolare
Non bisogna alterare lo Zero convenzionale
QI
Oggetti Età mentale/età cronologica (Età mentale/età
cronologica)* 100
. . I •
Il
Claudia-Marco 0.45
a: intercetta
Altera lo zero convenzionale.
QI
QI centrato sulla media
Oggetti (Età mentale/età
(QI -100)
cronologica)*l00
Marco 95 -5
Claud ia-Marco 45
Francesca 102 2
Claudia 140 40 Claudia-Luca 20
Confronto tra
Carla 103 3 intervalli 2.2s
Sergio 160 60
Luca 120 20
Matteo 89 -11
m = coefficiente angolare
a= intercetta
Altera lo zero convenzionale
Trasformazione
Temperatura Ammissibile (T)
Oggetti
Celsius Fahrenheit Il
m = 9/5, a= 32 Roma -Milano 6
• • I Roma -Torino 4
->Consideriamo la seguente affermazione: oggi è il doppio più caldo di ieri, dato che la temperatura di ieri era
di 20° centigradi e la temperatura di oggi è di 40° centigradi. Questa affermazione è priva di senso dato che una
misura (40) è il doppio di un'altra (20) solo in una certa arbitraria scala di misura (scala Celsius). Se avessimo
misurato queste medesime temperature usando un'altra scala, la scala Fahrenheit, per esempio, i due valori
sarebbero stati 68° F e 104° F. Questo significa che la relazione "il doppio di" che avevamo individuato in
precedenza si applicava ai numeri della scala centigrada, ma non alla proprietà che è stata misurata
(temperatura).
Trasformazioni ammissibili:
1. Trasformazione di similarità y' = m*y dove m>O
Tale che dati due oggetti i e j __. yi /yj = y'i/y'j
Trasformazione Trasformazione
Ammissibile (T) Ammissibile (T)
Peso Kg
tonnellata libbre
m = 1/1000 m = 2.20462262185
•
100 0.100
• •
220.4622622
325 0.325 716.5023521
60 0.060 132.2773573
91 0.091 200.6206586
45 0.045 99.20801798
78 Davide Mar O.Oi78 ,, go@un,to t 171.9605645 59
SCALA ASSOLUTA:
Deriva dall'operazione di conteggio, in essa nessun elemento è convenzionale e di conseguenza l'unica
trasformazione ammissibile è la trasformazione identica: y'=y tale che y'i= yi
->Esempi: il numero di libri letti in un mese, il numero di figli, numero di followers su lnstagram
Si tratta quindi di unità non ulteriormente scomponibili!
ordine no si SI si
intervallo unitario no no SI SI
zero assoluto no no no si
no • Dilatazione, Traslazione, e
Scala a intervalli
sl Esiste uno zero Trasformazione lineare o affi ne
assoluto?
Scale autoancoranti:
Etichette verbali soltanto per le due modalità estreme.
minima massima
Polizia 1 2 3 4 5 6 7 8 9 10
Partiti 1 2 3 4 5 6 7 8 9 10
Stimolo= TORINO
Bella 1 2 3 4 5 6 7 Brutta
Dolce 1 2 3 4 5 6 7 Amara
Pericolosa I 2 3 4 5 6 7 Sicura
Morta 1 2 3 4 5 6 7 Viva
Attiva 1 2 3 4 5 6 7 Passiva
L'inchiesta campionaria con questionari si basa sulla presunzione che il comportamento verbale degli
individui sia una fonte attendibile su cui basare lo studio della realtà (psicologica o sociale).
Possibili problemi di attendibilità delle risposte:
- - - - • -• - - - • - •••• ~ - - -• - ■ -
• ues1aeraomta sociale
• Mancanza di opinioni (o pseudo-opinioni)
• Response set (risposte uguali a domande diverse, perchè la batteria di domande è troppo lunga).
•• Marco
Francesca
23
41
Maschio
1
o
o
Femmina
o
1
Elementare
1
o
M.lnf.
o
o
M.Sup.
o
o
Laurea
o
1
Claudia 37 1 o 1 o o
Carla 19 o 1 o o 1 o
Sergio 28 1 o o 1 o o
Le variabili politomiche sono espresse con tante variabili in forma binaria/dicotomica (o variabili dummy)
quante sono le categorie della variabile politomica di origine.
Tipo di CONDIZIONAMENTO:
Una matrice a 2 vie si dice:
• Unconditional consente confronti tra le celle sia per riga che per colonna;
• Row conditional solo confronti entro le righe
• Column conditional solo confronti entro le colonne
Matrice rettangolare
Due vie (casi x variabili), due modi (casi, variabili)
VARIABILI
ID Età Genere Tltolo di studio Estroversione
1 23 m E 45
2 45 f L 25
vi 3 33 f 45
<
u 4 67 f s 70
5 78 m s 15
6 23 m 30
---- 4 8 5
-- 4
8 9
9 10
- 5 10 3
Davide Marengo, dav1de.marengo@un1to.lt
Matrice Unconditional
16700 40 10 90
15600 52 53 14
14502 35 21 10
15600 185 2 14
14502 172 1 10
Frequenze:
FREQUENZA ASSOLUTA: Conteggio di individui (o oggetti) per livello della scala. Applicabile a tutti i livelli di
scala. FA= nj
FREQUENZA RELATIVA: Rapporto tra la frequenza assoluta e il totale degli individui/oggetti. fj=nj/N
~
7 ore o più O.1 04452054 79
TOTALE 4 1.00000000000
Nel confronto tra gruppi (ad esempio, maschi e femmine), le frequenze assolute non permettono il
confronto se i gruppi hanno numerosità diverse.
Le frequenze relative permettono di confrontare la frequenza di specifici valori o modalità della variabile
anche per gruppi con numerosità diverse.
X1 n f1 n1 f
X2 n2 f2 n +n 2 f +f2
... ... ... ... . ..
X·J n·J f·J n +n2+ .. . + nJ f1+f2+ ... + fj
. .. . .. ... .. ...
XJ nJ fJ N 1
Totale N 1
Esiste anche la FREQUENZA PERCENTUALE CUMULATA.
ARROTONDAMENTO
Nel calcolo di frequenze, mediane e medie (e in genere molti altri indicatori statistici), si producono valori con
decimali.
Riportare valori con decimali appesantisce la lettura. Utilizziamo l'arrotondamento per ridurre il numero di
decimali visualizzati
Procedura:
• Scegliamo il numero d di decimali da visualizzare (ad esempio, d = 2)
• Se la cifra successiva alla d-esima è< 5. arrotondiamo la cifra d-esima «oer difetto». owero. rioortiamo il
-- ,- - -- - --- , - - - , ,- - - -·
valori come sono: 13.761 -> 13.76
• Se la cifra successiva alla d-esima è> 5, arrotondiamo la cifra d-esima «per eccesso», ovvero, riportiamo il
valori come sono: 13.767 -> 13.77
• Se la cifra successiva alla d-esima è= 5, possiamo sceglie se arrotondare per eccesso o per difetto, ma
dobbiamo dichiararlo: 13.765 = 13.76 (difetto) o 13.77 (eccesso)
Qualitative Quantitative
(Categoriali) (Cardinali
(suddivisione in classi)
1. Variabile nominale:
Tipo di sodai media utilizzati (combinazioni)
istogramma, grafico a barre: per ciascuna categoria, l'altezza della barra indica la frequenza assoluta
della categoria.
In alternativa, possono essere utilizzate le frequenze relative o percentuali.
88
.___... ....
Palterns ofsoclal media use: Ali groups
■ None
■-
□--• · ..,..,
□---·-- ·
■ F1ceuoco • hll-
11,..,_
---
□-...
Cate aria
None 174 0.0579 20.85914
Whatsapp 725 0.2414 86 .91309
Whatsapp & Facebook 677 0.2254 81 .15884
Whatsapp & lnstagram 363 0.1209 43 .51648
Whatsapp, Facebook & lnstagram 997 0.3320 119.5205
Facebook & lnstagram 21 0.0070 2.517483
Facebook 38 0.0127 4.555445
lnstagram 8 0.0027 0 .959041
Total 3003 1.0000 360
2. VARIABILE CARDINALE:
Seriazione di frequenze
li calcolo delle frequenze per tutti i valori di una variabile cardinale (ad esempio l'età), non è molto
informativo. Troppe categorie, spesso con frequenze simili. Difficile da visualizzare.
C: l d
Percentuale
Frequenza Percentuale cumulata
19 3 15,00 15,0
·21 1 5,00 20 ,0
"23 1 5,00 25 ,0
·27 1 5,00 30 ,0
'28 1 5,00 35,0
'35 1 5,00 40 ,0
'35 1 5,00 45,0
'38 1 5,00 50 ,0
'39 1 5,00 55 ,0
'40 1 5,00 60 ,0
'45 1 5,00 65 ,0
'47 1 5,00 70 ,0
'53 1 5,00 75 ,0
'54 1 5,00 80 ,0
'57 1 5,00 85 ,0
'54 1 5,00 90 ,0
·55 1 5,00 95 ,0
82 1 5,00 1~~. o
unltolt
Totale 20
Con variabili quantitative o cardinali è utile raggruppare le unità in classi. Il sistema di classi deve essere
esausuvo e mutuatmente esc1us1vo.
Ogni classe è individuata dai sui limiti, che possono individuare classi equinumerose (stesso numero di
individui per classe) o con intervalli della stessa ampiezza.
L'uso di limiti reali permette una maggiore precisione nel definire i limiti delle categorie (dove colloco un
individuo di 34 e 3 mesi?), ma può risultare meno facilmente leggibile.
-•35.528
500 Ampiezza classe di età: Sld On • 13.53'&1
N • 3.00, ,mo Ampiezza classe di età:
,...,.,s.531
Sld Ort • 13.53'1
N•lmJ
5 anni 10 anni
400,0
""'
~
~ ,00
.,.
:,
...e
400
lOO.O
200
,m
10.0 1S.0 20.0 25.D JD.OlS.D .0 4S.0 50.,0 SS.0a:,015,010D 75,0 -,,o
io,o 15 ,o :-o.o 2S.O 30 .0 35.0 •o.o ' 50 50.0 55 .0 eoo ss.o 70 .0 75.0 eo.o Da111de Marengo, davide marengo unito ,t Aga 93
Aa•
age roups
cumulabve
Fr qu ncy Percent Valld Pere nt P rcent
Valld 11-20 453 15,1 15,1 15,1
~t-30 709 23,6 23,6 38,7
31-40 822 27,4 27,4 66,1
41-50 545 18,1 18,1 84,2
51-60 360 12,0 12,0 96,:?
61-70 94 3,1 3,1 99,3
71-80 20 ,7 ,7 100,0
Total 3003 100,0 100,0
aQtJlrOUpl
Davide Marengo, dav1de.marengo@uri1to.1t 95
Operatori monovariati:
Gli operatori monovariati sono indicatori che riassumono in forma numerica (scalare) informazioni
relative alla distribuzione di una variabile (vettore):
• Operatori di tendenza centrale
• Operatori di dispersione
• Operatori di forma
Operatore Applicabilità
...l
!. •o.o·
~-
~~- .,
Z>
I z, s, ., ., ~, ., ., ., ., ., -.,
"' "' ...
Più di una moda? UNIMODALE o BIMODALE
UNIMODALE BIMODALE
! ti)
• MEDIANA
Modalità o valore entro cui si trova (almeno) il 50% dei casi osservati.
Per calcolare la mediana è necessario:
1. Ordinare le modalità (o valori) in modo crescente
2. Calcolare le frequenze cumulate
3. Osservare in quale modalità (o valore) cade il caso mediano (il caso che per rango ordinale, è in
posizione superiore al 50% dei casi).
ESEMPI:
MEDIANA (N dispari), formula:
N+l
mediana:
2
Frequenza Percentuale
Frequenza Percentuale
cumulata cumulata
licenza media 89 89 3.0 3.0
MEDIANA (N pari)
N+ l N
mediana: - - - e -
2 2
Si misura ugualmente in variabili Cardinali e ordinali. Solo se i casi sono pari e sono in
categorie diverse si fa la media della numerazione:
Frequenza
Frequenza Frcquenr.,
Frequenza assoluta percentuale
assoluta cumulata percentuale
cumulata
11 128 128 24 .33 24.3:l
12 25 .67 50.0C
4 105 513
- 27 ,57
1
77.57
97, 3
5 13 52 2.47 100 oc
N 2 ,~o.o
r, " rlu ,-- r"llnn rt u11r1 m
I
Perce e 1 5 10 o 30 50 60 70 80 90 95 99
I I I I I I I I I I
n rd (Z) Score -3.0 -2 .5 -2 .0 -1 5 -1 O -0.5 o 0.5 1O 1.5 20 2.5 30
• MEDIA ARITMETICA
Operatore utilizzato nel caso di variabili cardinali (assolute, intervalli, rapporti).
La somma dei valori osservati xi per ogni caso i, diviso per il numero totale di osservazioni N.
:E~ l Xi
X
N
esempio: applico la formula-> (Xl+ X2 + X3 + X4 + X5 + X6 )/N
ovvero (166 + 25 + 275 + 261 + 248 + 265)/6 = 206.67
- 3
1
2
Numero di post
{Facebook)
166
275
25
4 261
5 248
6 265
2· OPERATORI DI DISPERSIONE
I valori media, mediana, mode sono valori tanto rappresentativi di una distribuzione quanto le osservazioni
sono ad essi prossimi.
Gli operatori di dispersione consentono una quantificazione del grado di rappresentatività di un
particolare operatore di tendenza centrale.
Gli operatori di dispersione producono un valore scalare con cui si valuta la variabilità (diversità) esistente
nei dati osservati.
La dispersione assume nomi differenti a seconda del livello di scala di misura della variabile:
• Variabili categoriali -+ Eterogeneità (o all'inverso, di omogeneità)
• Variabili nominali -+ Mutabilità Variabili ordinali -+ Variabilità non metrica
• Variabili cardinali -+ Variabilità metrica
dev-iazione == Ef (X i - m) 2
0 Varianza : media degli scarti dalla media elevati al quadrato (MISURA ASSOLUTA)
N .· --:- 2
E i= l ( X i - .a:-)
82 ==
lV
Nella popolazione utilizziamo il simbolo a2
0 Scarto quadratico medio, o deviazione standard: radice quadrata della varianza (misura assoluta)
"µ "'=mean
2.15%
mu: è la media
° Coefficiente di variazione: rapporto tra deviazione standard e media aritmetica (misura relativa)
. I Ef- (a:i-x) 2
s
V
1
Ov= N
X
(ZxS)+x media= Xi
JJ'
1. Primo passo della procedura consiste nella «centratura» del valore x rispetto alla media
2. La variabile di scarto così ottenuta è divisa per la deviazione standard s
3. li valore ottenuto è detto punteggio z
Z=+0.166667
-3 -2 -1 o 1 2 3
E1 = 1 - EZ=l f;.
-> Se l'eterogeneità è minima, abbiamo la massima omogeneità! Tutti i casi sono concentrati in un'unica
classe/categoria.
-> Se l'eterogeneità è massima! I casi si distribuiscono in modo equivalente nelle diverse categorie.
E' possibile esprime l'indice di mutabilità del Gin i (E) anche come misura relativa (e). Per ottenere la misura
relativa, divido la statistica per il massimo valore ottenibile data una variabile con k categorie. La misura
Proprietà della media aritmetica:
La somma degli scarti dei valori xi dalla media è pari a O
La somma dei quadrati degli scarti dei valori xi dalla media è minima
K
Li k=l nk Xk
X
N
ESEMPIO:
anni frequenza
assoluta
11 128
12 158
13 94
14 72
15 3
N 455
(nlXl + n2X2 + n3X3 + n4X4 + n5X5 )/N owero (128*11 + 158*12 + 94*13 + 72*14 + 3*15)/455 = 12.26