Sei sulla pagina 1di 33

Lista argomenti da fare le slide:

- Che cos’è la statistica? «una specie di contabilità umana»


- Differenza tra popolazione e campione?  campionamento
- Misurazione quantitativa o qualitativa
- Le frequenze: la prima misurazione statistica
- Cosa possiamo usare per rappresentare una distribuzione di frequenze
- Progettare un questionario
- Media matematica e ponderata, mediana, moda, quartili (indici di posizione)
- Indici di dispersione o di variabilità = dev. stand (scarto quadratico medio), varianza, range, scarto semplice
medio,
Elementi di
statistica

dott. Tommaso Pompili


Che idea avete della statistica?

 Popolazione  Campione
Macro «entità» composta da tutti i Sottogruppo della popolazione
gruppi presenti al suo interno. (esempio gli alunni di una sezione
corrispondono ad un campione degli
(esempio una nazione composta da
alunni di una scuola)
60mln di persone oppure una
scuola, un’azienda)

E’ raro avere a disposizione i dati Se il campione è abbastanza


provenienti da un’intera popolazione numeroso potrebbe avere proprietà
simili alla popolazione e quindi
sarebbe possibile GENERALIZZARE i
risultati ma ci vuole cautela.
Statistica
Disciplina che studia i metodi per interpretare i
dati raccolti e le informazioni che da questi si
possono dedurre per trarre conclusioni
sull’andamento dei fenomeni studiati.

Nella pratica si traduce come uno strumento applicabile e


interpretabile in diversi contesti;
ci permette di ottenere informazioni o proprietà tramite lo
sviluppo di modelli
Quanti tipi di misurazione ci sono?

 Quantitative  Qualitative
Sono informazioni MISURATE. Sono informazioni relative alla
QUALITA’
Esempio il peso, un dato retributivo,
altezza, una spesa pubblicitaria … Esempio il colore degli occhi, la
professione, se un prodotto è buono
oppure no …

ESEMPIO MISURAZIONE QUALITATIVA …


La prima cosa che possiamo fare è
quantificare

1543124532145213452312345213
Frequenza assoluta
La sola raccolta iniziale di dati produce 8

tabelle di scarso interesse statistico, se 7

Frequenza
non ci si pongono altri quesiti. 6

5
Un’iniziale
quantificazione o una prima
misurazione si traduce nel concetto di 4

frequenza statistica. 3

Esempio abbiamo una sequenza di 0


1 2 3 4 5
numeri e bisogna verificare la frequenza di
ciascun punteggio
Punteggio
Frequenza Quantificare
Punt. assoluta Freq. relativa Freq. %
1 6 0,21 21%
2 5 0,17 17% Freq. Relat = n Freq ass. /
tot freq ass.
3 7 0,24 24%
4 5 0,17 17% Freq. % = Freq. Relativa x
5 6 0,21 21% 100

  tot = 29 tot = 1 tot = 100%


Quantificare
Risultato
Nome Disciplina (tot= 68)
Valerio Matematica 30
Giulia Matematica 25 Confronto voti
Luca Matematica 18 35
30
25
20
15
10
5
0
Valerio Giulia Luca
Risultato Reputazione in
Nome Disciplina (tot = 68) classe
Valerio Matematica 30 96
Giulia Matematica 25 32
Luca Matematica 18 16

Confronto Risultato-Reputazione
120
Reputazione in classe

100

80

60

40

20

0
16 18 20 22 24 26 28 30 32
Risultato
Indici di posizione o di tendenza
centrale
Media Moda Mediana
Media aritmetica e media ponderata
(Indici di tendenza centrale)
Moda
(Indici di tendenza centrale)
Mediana
(Indici di tendenza centrale)
Quartili
(Indici di tendenza centrale)
Indici di dispersione
«Range» o campo di variazione
(Indici di dispersione)
Scarto
(Indici di dispersione)
Varianza
(Indici di dispersione)
Deviazione standard o
scarto quadratico medio
(Indici di dispersione)
Covarianza
(Indici di dispersione)
Correlazione

Una correlazione significativa tra due o più variabili non è mai una condizione
sufficiente perché vi sia un legame causale tra le due variabili.
Il coefficiente di correlazione anche detto coefficiente di correlazione di Pearson
indica il grado di associazione tra variabili.

Graficamente la retta passerà per l’origine.

Una relazione può essere significativa se il p-value è:


< 0,05*
< 0,01** (la correlazione sarà più forte rispetto a 0,05*)
La direzione della relazione è indicata dal segno del valore della correlazione:

Una correlazione POSITIVA è presente quando le variabili sono significative e si “muovono” in modo concorde.
La direzione della relazione è indicata dal segno del valore della correlazione:

Una correlazione NEGATIVA è presente quando i valori di una variabile crescono, i valori dell’altra diminuiscono e
comunque rimangono significative.
La direzione della relazione è indicata dal segno del valore della correlazione:

Una correlazione NEUTRALE è presente quando non vi è significatività tra le due variabili e non è presente nel
grafico una direzione evidente.
Regressione

La regressione lineare è un modello statistico di stima


del valore atteso di una variabile dipendente ed è associata alla risoluzione del modello
lineare.

All’aumentare di 1 unità nel valore di X quanto aumenta o diminuisce il valore di Y?


Quali fattori vengono utilizzati per analizzare se una regressione è significativa?

- La significatività
- Il Beta
- R-quadrato
Regressione … in poche parole?
 La maggior parte delle ricerche psicologiche utilizzano più di
una variabile indipendente, infatti molti fenomeni umani e
psicologici sono multi- determinati.
 Per testare l’effetto contemporaneo di più variabili
indipendenti su una variabile dipendente si utilizza il
modello di regressione multipla.
 Esempio: quali sono i predittori dell’irritabilità?

 È possibile studiare l’effetto dei disturbi del sonno (X) e dei


conflitti con i colleghi (W) per predire l’irritabilità (Y).
Regressione … in poche parole?
 La funzione di regressione multipla è quindi:

 Dove:
α = il coefficiente costante o intercetta
byx.w = coefficiente di regressione tra y e x, sapendo che nella
regressione è presente anche w.
byw.x = coefficiente di regressione tra y e w, sapendo che nella
regressione è presente anche x.
Come si evince dalla formula, la funzione della regressione multipla
non può essere una retta, in quanto considera più di due v.i.
 Il modello di regressione multipla è volto a determinare quanto la
variabilità dei punteggi rappresentati sull’asse Y dipenda dalla
variabilità dei punteggi rappresentati sull’asse X e W.
 Si intende testare la seguente relazione diretta:

Disturbi del
Irritabilità
sonno
 La rappresentazione grafica con più v.i. avviene attraverso uno
scatterplot (grafico) multidimensionale.
 Per due v.i. lo scatterplot è tridimensionale, per più di due v.i. la
rappresentazione grafica è molto complessa.
Disturbi del
Irritabilità
sonno

Variabile Indipendente o Variabile Dipendente


Predittore

Quanto il predittore influenza la relazione


con la variabile dipendente?
Disturbi del Variabile
Irritabilità
sonno Dipendente

Predittori Conflitti

X3

Xn

Quanto i predittori influenzano la relazione con la variabile dipendente?


Descrizione del campione o analisi
dei dati?
 Statistiche descrittive  Statistiche inferenziali

Riassume e descrive un Generalizza i risultati ottenuti su un


insieme di dati relativi ad campione all’intera popolazione,
un campione. attraverso l’uso delle probabilità.

La maggior parte degli studi scientifici è volto a


comprendere un fenomeno. La maggior parte delle
analisi che si limitano a descrivere le variabili
misurate hanno scopo esplorativo (media, dev.
Stand., moda, mediana) sono quindi di portata
limitata ma essenziale nello studio dei fenomeni.
Essenziale perché tramite questi dati possiamo
affrontare analisi più complesse.
Testiamo la statistica su
Excel / SPSS
Case study su Marketing_Dataset
Statistiche descrittive
Correlazione & Scatterplot
Test T di Student
Regressione lineare semplice e
multipla

Report sui dati

Potrebbero piacerti anche