Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Concetti introduttivi
Preparare il DB:
la decodifica dei dati
Tecniche di analisi
Scala a
Scala nominale Scala ordinale
intervallo
Frequenze
Deviazione
relative e Interquartile
Standard
assolute
Le tecniche di analisi statistica
rispetto al procedimento
Approccio
Descrittivo Inferenziale
Analisi statistica dei dati
Analisi univariata
Analisi Univariata
Distribuzione di frequenza
Tabelle e grafici
Misure di sintesi
Tendenza centrale e non centrale
Dispersione
Forma della distribuzione
Frequenza e intensità
X Carattere osservato X n f n n
n Numero di unità statistiche
i i i
x1 n1 f1
k Numero di x2 n 2 f2
modalità/intensità di X
xi i-esima
modalità/intensità di X xi ni fi
n i Frequenza assoluta
della i-esima modalità xi xk n k fk
fi Frequenza relativa della T o ta le n 1
i-esima modalità xi
12
In un sondaggio fatto all'interno di una facoltà composta da
250 studenti (la popolazione statistica), si intende rilevare il
carattere "gradimento dei professori", secondo le cinque
modalità "molto deluso", "insoddisfatto", "parzialmente
Esempio
soddisfatto", "soddisfatto", "entusiasta". 10 studenti si
dicono entusiasti dell'operato dei professori, 51 si dicono
soddisfatti, 63 mediamente soddisfatti, 90 insoddisfatti, 36
molto delusi.
Frequenze
Gradimento dei Frequenze Frequenze
relative Nel caso
professori assolute relative ipotizzato, la
cumulate colonna delle
frequenze
molto deluso 36 36/250 = 0,144 0,144 relative
cumulate
0,144+0,360 = mostra che è
insoddisfatto 90 90/250 = 0,360 molto deluso il
0,504 14,4% degli
studenti e che
parzialmente 0,504+0,252 = la percentuale
63 63/250 = 0,252 degli studenti
soddisfatto 0,756 non
La distribuzione di frequenza viene rappresentata pienamente
con una 51tabella come la seguente: 0,756+0,204 = soddisfatti
soddisfatto 51/250 = 0,204 (modalità da
0,960 "molto deluso"
a
0,960+0,040 = "parzialmente
entusiasta 10 10/250 = 0,040 soddisfatto")
1,000 arriva al 75,6%
250/250 =
Totali 250
1,000
Definizione di frequenza relativa
Suddivisione in classi
La suddivisione in classi
Le intensità di un carattere quantitativo
discreto possono essere suddivise in
classi.
Due possibili criteri di suddivisione:
1. Classi equamente ampie
2. Classi di diversa ampiezza e
frequenza
15
Rappresentazione grafica
dei fenomeni statistici
1 Economia Aziendale 27 9
2 Ist. diritto pubblico 22 6
3 Metodi di matematica applicata 25 9
4 Macroeconomia 20 6
5 Ragioneria 28 9
27
Media ponderata: calcolo
N. voto cfu voto*cfu
Esame (xi) (pi) (xi*pi)
1 27 9 243
2 22 6 132
3 25 9 225
4 20 6 120
5 28 n
9 252
n
n
p i 39 xipi 972
xp
i1
i1
i i
972
xa i1
n
24,92 Il voto medio (su 39 cfu) è pari a
39
p
i1
i 24,92
28
Media da dati raggruppati
Moda
Classe modale
Mediana
Esempio calcolo della mediana
Misure non centrali: i quantili
Quartili
Percentili
Tra Q1 e Q2 è Tra Q2 e Q3 è
contenuto il 25% contenuto il
dei valori 25% dei valori
35
Calcolo dei quartili
La prima F ad essere maggiore
i
o uguale a 0,25 è la terza
Ricavi Ricavi Freq.
(valori cum. rel.
ordinati) Q 1 x ( 3 ) 205
350 X(1)=180 1/9=0,11
Il 25% dei punti vendita con i ricavi
200 X(2)=200 2/9=0,22 più bassi registrano ricavi che non
600 X(3)=205 3/9=0,33 superano 205 mila euro
500 X(4)=270 4/9=0,44
La prima Fi ad essere maggiore o
270 X(5)=280 5/9=0,56 uguale a 0,75 è la settima
180 X(6)=340 6/9=0,67
205 X(7)=350 7/9=0,78 Q 3 x ( 7 ) 350
340 X(8)=500 8/9=0,89 Per essere nel 25% dei punti
280 X(9)=600 9/9=1 vendita con i ricavi più alti si
devono superare 350 mila euro di
ricavi
36
Percentili
Sono quei valori che dividono la distribuzione
in cento parti di uguale numerosità
Mediana=50-esimo percentile
Q3= 75-esimo percentile
37
Indici di variazione
Supponiamo che i rilevamenti compiuti su un campione di individui sulla pressione minima sanguigna
abbia dato i seguenti risultati:
80 80 85 90 85 60 90 95 95 80 85 115
Il campo di variabilità di questi dati è dato da 115 – 60 = 55; se basassimo le nostre considerazioni
solo su questo valore, saremmo portati a dire che in quel gruppo di persone vi è un’alta variabilità fra
i dati, mentre in realtà, osservando meglio, si nota che la maggior parte di essi (tranne due) si
distribuiscono in un ambito più ristretto compreso fra 80 e 95. Questo è un indice poco sensibile che
è grandemente influenzato dai valori esterni.
39
Deviazione standard e varianza
Scarto quadratico medio o deviazione standard σ: media quadratica degli scarti dalla media aritmetica
M.
√
n
Σ (xi – M)2 Nel caso di dati semplici
σ= i=1
n
√
n
Σ {(xi – M)2 fi }
σ= i=1 Nel caso di dati ponderati con pesi fi
n
Σ fi
i=1
40
ESEMPIO
Ad otto gruppi di persone è stato chiesto di provare due tipi particolari di shampoo che indicheremo
con A e B, e di sceglierne quindi uno. Gli esiti di questa scelta sono riportati nella seguente tabella.
A 15 12 10 8 11 18 20 10
B 15 12 24 12 14 2 10 18
Sommando le preferenze accordate ai due prodotti, sia A che B ne hanno totalizzate 104.
104
Mediamente = 13 voti da ciascun gruppo
8
continua
41
ESEMPIO
15 2 4 12 -1 1
112 -1 1 12 -1 1
10 -3 9 24 11 121
8 -5 25 12 -1 1
11 -2 4 14 1 1
18 5 25 2 -11 121
20 7 49 10 -3 9
10 -3 9 18 5 25
√
8
√
8
Σ (xi – 13)2
√
Σ (x – 13)2
√
i=1 i 126 280
σA = = = 3,969 σB = i=1
= = 5,916
8 8 8 8