Sei sulla pagina 1di 33

La statistica è la scienza che studia i fenomeni collettivi in maniera quantitativa

DESCRITTIVA La statistica è descrittiva quando va ad


indagare su tutta la popolazione statistica

STATISTICA

INFERENZIALE La statistica è inferenziale quando va ad


indagare solo su una parte di popolazione
statistica

UNIVARIATA La statistica descrittiva è univariata


quando ha per oggetto 1 solo carattere

DESCRITTIVA

BIVARIATA La statistica descrittiva è bivariata quando


ha per oggetto 2 o più caratteri
FENOMENO COLLETTIVO:
E’ un fenomeno che riguarda un insieme di unità statistiche
UNITA’ STATISTICA :
E’ un’unità in cui si raccolgono le informazioni

UNIVERSO STATISTICO O POPOLAZIONE STATISTICA:


E’ l’insieme di tutte le unità statistiche
CARATTERE STATISTICO :
E’ la caratteristica da esaminare nella popolazione statistica
MODALITA’ DI UN CARATTERE STATISTICO :
E‘ il modo in cui si presenta un carattere, quando ha valore numerico si chiama
intensità
CARATTERE QUALITATIVO:
E’ un carattere , le cui modalità si esprimono con aggettivi o sostantivi

ORDINATE Quando le modalità possono essere disposte in


un certo ordine
CARATTERE
QUALITATIVO
NON ORDINATE Quando non è possibile ordinarle

CARATTERE QUANTITATIVO:
E’ un carattere , le cui modalità si esprimono con singoli valori numerici o intervalli
di valori
DISCRETI Quando le modalità assumono solo valori interi
(Numeri Interi)
CARATTERE
QUANTITATIVO
CONTINUI Quando le modalità possono assumere
qualunque valore all’interno di un intervallo
(Numeri Reali)
E’ il numero di volte che viene rilevata E’ il rapporto tra la frequenza assoluta
Una data modalità nell’ambito della E il totale delle osservazioni
popolazione

Basta moltiplicare la frequenza relativa


*100. Il totale delle frequenze relative
percentuali deve essere SEMPRE La prima frequenza relativa percentuale
100% cumulata è uguale alla prima frequenza
relativa percentuale, per le altre si andrà
sommando in ordine, ovvero la prima + la
seconda; la prima + la seconda + la terza
etc…
La variabile statistica è l’insieme delle intensità e delle corrispondenti frequenze

Xi X1 X2 … XK
Fi F1 F2 … FK

La mutabile statistica è la distribuzione di frequenza di un fenomeno qualitativo

Stato Civile Nubile Celibe Coniugato Vedovo


Fi F1 F2 F3 F4
Interviste dirette
Compilazione di un questionario
RACCOLTA
DATI
Rilevazioni sperimentali
Tabelle fornite da enti (ISTAT)

APERTO: a risposta aperta


INTERVISTE
DIRETTE
IL
QUESTIONARIO
CHIUSO: a risposta chiusa
Non troppo
lungo
Chiaro

INTERVISTE
DIRETTE
Espresso in un
IL linguaggio
QUESTIONARIO comprensibile
Senza domande non agli intervistati
rilevanti ai fini
dell’indagine

Può contenere
domande di
controllo
MANUALMENTE: si utilizzano tabelle
di spoglio dove vengono calcolate le
frequenze assolute di ogni modalità

LO SPOGLIO
DEI DATI

TRAMITE COMPUTER
Sono delle tabelle in cui si dispongono due caratteri e le relative modalità.All’incrocio
tra righe e colonne stanno le frequenze, cioè il n° di unità statistiche che presentano
simultaneamente i caratteri oggetto di studio

Per caratteri Caratteri


quantitativi qualitativi e
Per caratteri
quantativi
qualitativi

Freq. Congiunte
Associate

Capelli Castani Bruni Totale Freq. Marginali


Per riga
Occhi
Castani 3 2 5
Bruni 4 3 7
Totale 7 5 12
N(Collettivo)
Freq. Marginali
Per colonna
Si dividono in :

Gli indici di variabilità Gli indici di variabilità


assoluti sono quelli che relativi sono quelli che non
dipendono da una unità di dipendono da una unità di
misura. misura.
Tra essi troviamo: Tra essi troviamo:
Il Campo di variazione è la differenza tra il maggiore e il minore dei dati, tiene
presente solo dei valori estremi e non degli altri.
La varianza è la media aritmetica degli scarti dalla media elevati al quadrato.
Si indica con sigma al quadrato e la formula per calcolarla è :

Quando non vi sono frequenze Quando vi sono frequenze

Il numeratore della varianza si chiama DEVIANZA


ESERCIZIO:
Calcolare la varianza dei seguenti valori: 1,5,7,12,15

Xi Xi-M (Xi-M)^2 Step 1:


Calcolo la media aritmetica dei valori
1 -7 49 (1+5+7+12+15)/5= 8

5 -3 9 Step 2:
Calcolo gli scarti dalla media e poi li
7 -1 1 elevo al quadrato
12 4 16 Step 3:
Calcolo la varianza facendo la
15 7 49
sommatoria delle (Xi-M)^2/n
Totale 40 0 124
Var(x)= 124/5 = 24,80
ESERCIZIO:
Calcolare la varianza dei seguenti valori con le seguenti frequenze

Xi Fi XiFi Xi-M (Xi-M)^2 (Xi-M)^2*Fi


1 8 8 -1,72 2,9584 23,6672
2 12 24 -0,72 0,5184 6,2208
3 20 60 0,28 0,0784 1,5680
4 6 24 1,28 1,6384 9,8304
5 4 20 2,28 5,1984 20,7936
50 136 62,0800

M=136/50=2,72 Var(x)=62,08/50= 1,2416


Lo Scarto Quadratico Medio (SQM), chiamato anche deviazione standard è la
radice quadrata della Varianza

Si indica con sigma e si calcola con la seguente formula


La differenza media, è la media delle differenze in valore assoluto fra tutte le
possibili coppie di valori della distribuzione. Può essere semplice o con
ripetizione, si indica con Delta e Delta r e si calcola con le seguenti formule

Differenza semplice Differenza con ripetizione


Calcolare la differenza media semplice e con ripetizione è molto semplice, per
farlo basta creare una tabella con i dati da calcolare ,sottrarre quelli della parte
laterale con quelli della parte verticale, sommare tutti i risultati e metterli in
formula.
753 841 1005 1184 1690 Tot
753 0 0
841 88 0 88
1005 252 164 0 416
1184 431 343 179 0 953
1690 937 849 685 506 0 2977
Il Coefficiente di Variazione è un numero puro (non dipende da unità di
misura) e rappresenta il rapporto tra indice assoluto e la media aritmetica,
ovvero tra SQM e media aritmetica.
Si indica con V e si calcola con la seguente formula

E varia tra
Per concentrazione si intende la tendenza all’ammontare di una determinata
quantità a concentrarsi nelle mani di poche unità. E’ storicamente legata alla
disuguaglianza dei redditi, ed è stata seguita e studiata in particolare da
Lorenz. Per far si che esista concentrazione i caratteri devono essere
trasferibili (le misure fisiche non sono trasferibili)

Studio della disuguaglianza dei redditi

Studiare come si distribuisce una quantità


T tra N unità

Persone benestanti oppure un solo ricco

Stabilire se c’è equidistribuzione cioè


(concentrazione nulla) stessa quantità a tutti
oppurae concentrazione massima, tutto nelle
mani di una persona
È un aspetto della variabilità e i suoi elementi più importanti sono :

Il reddito o la quantità I soggetti


Da analizzare Detentori
(qi) (pi)

N sono le unità statistiche

Rapporto di
concentrazione
Determinare la concentrazione con il metodo di Gini

j Xj Pj=J/n Qj Qi=qj/qn pi-qi


1 1,8 0,1 1,8 0,018 0,082
2 2 0,2 3,8 0,038 0,162
3 2,2 0,3 6 0,060 0,24
4 2,4 0,4 8,4 0,084 0,316
5 3,9 0,5 12,3 0,123 0,377
=2,672/4,5 = 0,5938
6 6,5 0,6 18,8 0,188 0,412
7 8,4 0,7 27,2 0,272 0,428
8 10,9 0,8 38,1 0,381 0,419
9 28,3 0,9 66,4 0,664 0,236 Rapporto di concentrazione
10 33,6 / 100 1,000 / di Gini
N=10 100 4,5 2,672
Rapporto di Concentrazione:
Area di Concentrazione:
area della superficie compresa tra la
spezzata di concentrazione e il
segmento di equidistribuzione.
Area Massima di Indice di Gini e metodo dei trapezi sono
Concentrazione: area del legati dal seguente rapporto
triangolo definito da bisettrice,
ascissa massima, ordinata massima
La moda è la modalità che si presenta con la massima frequenza.

Settore di attività Percentuale


La frequenza più alta è 35%
Agricoltura 10% quindi la moda è Industria
Ristorazione 30%
Servizi 20%
Industria 35%
Sport 5%

Nel caso in cui tutti le frequenze siano uguali, la moda non esiste.

Settore di attività Percentuale


Agricoltura 10%
Le frequenze sono tutte
Ristorazione 10%
uguali quindi non vi è moda
Servizi 10%
Industria 10%
Sport 10%
Quando troviamo le classi, nel caso in cui sono tutte uguali, la moda è
la modalità con la frequenza più alta, ma quando troviamo per
esempio due o più modalità con la stessa frequenza per capire qual è
la moda dobbiamo calcolare la densità di frequenza.

N° di ore fuori Percentuale Ampiezza Densità % di


del centro della classe frequenza
0|-3 40% 3 13,3%
3|-8 20% 5 4%
8|-10 40% 2 20%

La classe modale è la 8|-10


La mediana è l’osservazione che occupa la posizione centrale in un
insieme di dati. In altre parole il valore mediano lascia metà delle
osservazioni al di sopra e metà al di sotto di se stesso.

Nel caso in cui il numero di Nel caso in cui il numero di


Osservazioni n sia dispari è Osservazioni n sia pari è
L’osservazione di posizione L’osservazione di posizione

UNICITA’: In un dato insieme vi è una sola mediana


SEMPLICITA’: La mediana è facile da calcolare
ROBUSTA: Non è drasticamente influenzata dai
valori estremi come la media
E’ applicabile anche per variabili ordinali
Rende minima la somma degli scarti
Per calcolare la mediana è fondamentale per prima cosa ordinare i dati.

Dati:
Dati ordinati 0,1,2,3,4
1,3,2,0,4

Conto i dati

I dati sono 5 e Quindi n=5 (dispari)

Calcolo la mediana

(n+1)/2=(5+1)/2=3

Vado nella posizione 3 e trovo il


valore 2, quindi la mediana è 2
Per prima cosa bisogna vedere se n è pari o dispari, dopodichè si applica la formula.

Xi Fi Freq. N=20 (pari)


Cumulate n/2=20/2=10
(n/2)+1= 11
3 4 4 Calcolo le frequenze cumulate
5 1 5 La mediana è la modalità alla
7 5 10 quale corrisponde la prima
frequenza che supera o
11 7 17 eguaglia il valore del posto.
13 3 20 Quindi il 10 rientra nella modalità
TOT: 20 / 7 e l’11 nella modalità 11.
Mediana= (11+7)/2= 9
Per prima cosa mi calcolo le frequenze cumulate. Vedo se n è pari o dispari, e grazie
a questo mi calcolo la classe mediana poi con la seguente formula mi calcolo la
mediana esatta.
Freq.cum.precedente
Limite inferiore
classe Ampiezza classe

Xi Fi Fc
80-86 2 2 N=39 (dispari)
86-92 10 12 P=39/2=19,5 (classe mediana 92-98)
92-98 20 32 Applico la formula:

98-104 4 36
104-110 3 39
Totale (N) 39
I QUARTILI:
Sono quei valori che per esempio per Q1 lasciano alla propria sinistra ¼ e
alla propria destra ¾

ESERCIZIO:
Calcolare il primo ed il terzi quartile dei seguenti dati:
5,11,20,21,23,26,29,34,37,41
Con i quartili quando si ottengono
N=10 (pari) Valori con la virgola si arrotondano
Q1= N/4= 10/4=2,5=3 Sempre per eccesso.
P=3 quindi il primo quartile è 20
Q3= (N/4)*3= 7,5 = 8
P=8 quindi il terzo quartile è 34

Con i quartili quando si ottengono


Valori con la virgola si arrotondano
Sempre per eccesso.
N=34 (pari)
Xi Fi Fc
P1= N/4= 34/4=8,5=9
37 15 15 P3= (N/4)*3= 25,5 = 26
40 8 23 E’ quartile la modalità a cui
corrisponde la prima frequenza
52 11 34
cumulata che supera o eguaglia il
Totale 34 / valore del posto
Quindi Q1=37 e Q3=52

Xi Fi Fc N=123 (dispari)
0-30 47 47 P1= N/4= 123/4=30,75=31
P3= (N/4)*3= 92,25=93
30-50 25 72 Applico la formula :
50-100 51 123
Totale 123 /