Sei sulla pagina 1di 34

Media geometrica

La media geometrica di un insieme di n valori positivi x1, x2, , xn di un carattere quantitativo X pari alla radice n-esima del prodotto dei singoli valori:
xg =
n

x1 x2 K xn

Esempio sulla media geometrica


Capitale iniziale: 10.000 Investimento in obbligazioni a tasso variabile

Qual il tasso di interesse medio annuo?


xg = 6 (1,015)(1,02)(1,072)(1,09)(1,074)(1,045) = 1,05229
2

Propriet della media geometrica


1- Il prodotto dei valori x1, x2, , xn assunti da un insieme di unit statistiche pari alla potenza n-esima della media geometrica:
x1 x2 K xn = (xg )
n

2- Il logaritmo della media geometrica uguale alla media aritmetica dei logaritmi:
1 n log xg = log(xi ) n i=1
3

Media armonica
La media armonica di un insieme di n valori x1, x2, , xn di un carattere quantitativo X definita da:
xa = n n 1 x i=1 i

Media potenziata di ordine r


Si definisce media potenziata di ordine r la radice r-esima della media aritmetica delle potenze r-esime delle osservazioni:
1 n xr = n (xi ) i =1
1 r r

Box-plot
Q0 Q1 Q2 Q3 Q4
32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16
6

= = = = =

18 22 24 27 30

Differenza interquartile Iqr = 5 Q2-(Iqr1,5) = 16,5 Q2+(Iqr1,5) = 31,5

Voti

Confronti fra dati statistici


{

Differenza assoluta x 2 x1

Divario relativo x 2 / x1

Variazione relativa
x2 x1 x1

I rapporti statistici
{ {

Composizione: rapporti di parte al tutto Coesistenza: rapporti tra le frequenze di modalit alternative di uno stesso carattere Derivazione: rapporti tra il numero di eventi in un intervallo di tempo prefissato e la numerosit della popolazione che li ha generati

Rapporto di composizione

nCalcio/nTotale=2.518/13.494=0,1866
9

Su 100 atleti 18,66 praticano calcio

Esempio sui rapporti di composizione

Quanti sono gli individui maschi? 23+20=43 E le femmine? 18+10=28 E nel complesso? 43+28=41+30=71

10

Esempio sui rapporti di composizione

Qual la composizione per sesso dellintero gruppo?

n Maschi 43 = = 0,6056 n Maschi + n Fem min e 43 + 28 n Fem min e 28 = = 0,3944 n Maschi + n Fem min e 43 + 28
11

Esempio sui rapporti di composizione

Qual la composizione del gruppo rispetto al fumo?

n Fumatori 41 = = 0,5775 n Fumatori + n Non fumatori 41 + 30 n Non fumatori 30 = = 0,4225 n Fumatori + n Non fumatori 41 + 30
12

Esempio sui rapporti di composizione

Fumano di pi i maschi o le femmine?


n Maschi fumatori 23 = = 0,5349 n Maschi (Fumatori e Non fumatori) 23 + 20
n Fem min e fumatrici 18 = = 0,6429 n Fem min e (Fumatrici e Non fumatrici) 18 + 10
13

Esempio sui rapporti di composizione

Tra i fumatori, pi facile trovare un maschio o una femmina?


n Maschi fumatori 23 = = 0,5610 n Fumatori (Maschi e Fem min e) 23 + 18 n Fem min e fumatrici 18 = = 0,4390 n Fumatori (Maschi e Fem min e) 23 + 18
14

Rapporto di coesistenza

nCalcio/nTennis=2.518/1.034=2,4352
15

Su 100 tennisti ci sono 243,52 calciatori

Esempio sui rapporti di coesistenza

Rapporto di mascolinit

n Nati Vivi Maschi 322.536 = = 1,07 n Nati Vivi Fem min e 302.269
Rapporto di femminilit n Nati Vivi Fem min e 302.269 = = 0,94 n Nati Vivi Maschi 322.536
16

Esempio sui rapporti di coesistenza

Rapporto di mascolinit

Pop. Re s. Maschile 27.889.911 = = 0,945 Pop. Re s. Fem min ile 29.509.197

17

Esempio sui rapporti di coesistenza

Indice di vecchiaia Pop.65 e + 736.943 Iv = 100 = 100 = 160,17 Pop.0||14 460.102 Indice di dipendenza degli anziani Pop.65 e + 736.943 Id.a. = 100 = 100 = 27,27 Pop.15||64 2.702.125

18

Rapporto di derivazione

27.746 1000 = 7,12 3.899.170

12.320 1000 = 9,91 1.243.690

In Emilia-Romagna ci sono 7,12 nati vivi ogni 1000 abitanti In Abruzzo ci sono 9,91 nati vivi ogni 1000 abitanti
19

Rapporto di derivazione
Per confrontare la propensione a trascorrere le vacanze allestero dei turisti di due nazioni A e B, si deve tener conto del fatto che le due nazioni hanno popolazioni numericamente diverse. Si dovr quindi individuare una grandezza che esprima, per una qualsiasi nazione, quanti turisti si sono recati allestero ogni 1000 abitanti.
Turisti andati all' estero 1000 Popolazione
20

Calcolo di un numero indice


04-feb 05-feb 06-feb 07-feb 08-feb 09-feb 10-feb 11-feb 12-feb 13-feb

PIACENZA PARMA REGGIO NELL'EMILIA MODENA BOLOGNA FERRARA RAVENNA FORLI' RIMINI

64 63 60 48 70 51 38 54 70

44 51 46 38 44 33 35 n.d. 42

51 47 43 54 37 43 46 28 41

75 54 53 52 59 50 59 n.d. 66

75 66 53 51 60 55 68 n.d. 76

94 103 78 97 82 106 93 56 86

112 92 76 99 69 128 78 76 90

106 73 71 82 48 123 46 52 62

96 68 65 96 86 150 59 48 41

26 40 50 58 60 89 49 44 40

Livelli PM10

b It =
>50 0-50

Superiore al limite di legge (al 2005) Entro il limite di legge Dato non disponibile

qt qb

n.d.

4feb I5feb =

21

Fonte: www.liberiamolaria.it

PM105feb 44 = = 0,629 PM104feb 70

Numeri indici semplici


{ {

Numeri indici a base fissa Numeri indici a base mobile

22

04-feb

05-feb

06-feb

07-feb

08-feb

09-feb

10-feb

11-feb

12-feb

13-feb

BOLOGNA

70

44

37

59

60

82

69

48

86

60

4feb I5feb

PM105feb 44 = = 0,629 PM104feb 70

4feb I6 feb =

PM106feb 37 = = 0,529 PM104feb 70

4feb I13 feb

PM1013 feb 60 = = 0,857 PM104feb 70

Serie dei numeri indice con base 4 febbraio (%)


t
4feb
04-feb 05-feb 06-feb 07-feb 08-feb 09-feb 10-feb 11-feb 12-feb 13-feb

It
100 62.9 52.9 84.3 85.7 117.1 98.6 68.6 122.9 85.7

(%)

23

Serie dei numeri indice a base mobile


Se interessa studiare le variazioni relative di Q da un tempo t -1 a quello successivo t, si divide ogni valore qt per il precedente qt-1, e si ottiene la serie dei numeri indice a base mobile
t 1It

qt qt 1

Numero indice a base mobile riferito al tempo t

Numero indice a base mobile delle concentrazioni di PM10


t 1 It =
24

PM10t PM10t 1

04-feb

05-feb

06-feb

07-feb

08-feb

09-feb

10-feb

11-feb

12-feb

13-feb

BOLOGNA

70

44

37

59

60

82

69

48

86

60

4feb I5feb

PM105feb 44 = = 0,629 PM104feb 70


PM106feb 37 = = 0,841 PM105feb 44

5feb I6 feb =

12 feb I13 feb

PM1013 feb 60 = = 0,698 PM1012 feb 86

Serie dei numeri indice a base mobile (%)


t
t-1
04-feb 05-feb 06-feb 07-feb 08-feb 09-feb 10-feb 11-feb 12-feb 13-feb

It
62.9 84.1 159.5 101.7 136.7 84.2 69.6 179.2 69.8

(%)

25

Propriet dei numeri indici semplici


Identit
t It

=1

Reversibilit delle basi

b It

1 t Ib

Circolarit

s It r Is =r It

26

La variabilit
Il valor medio fornisce una sintesi della distribuzione di un carattere. Accanto agli indici di posizione considerati fino a ora, introduciamo altri indicatori il cui proposito misurare la attitudine a variare del fenomeno oggetto di studio. Lattitudine di un carattere quantitativo X ad assumere valori differenti tra le unit componenti un insieme statistico chiamata variabilit.
27

La variabilit

La terna {S1,S2,S3} ha minore variabilit della terna {T1,T2,T3}.

28

La variabilit
La variabilit costituisce una caratteristica degli insiemi statistici e pu essere descritta mediante indicatori che godano di particolari propriet:
{

una misura di variabilit deve annullarsi quando, e solo quando, tutte le unit del collettivo presentano il medesimo stato di grandezza del carattere una misura di variabilit deve assumere valori crescenti allaumentare della variabilit

29

La variabilit
Gli indicatori comunemente adoperati possono essere distinti in tre categorie fondamentali:
{

indicatori che misurano la diversit fra due particolari termini della distribuzione o fra due quartili (intervallo di variabilit, differenza interquartile) indicatori che misurano la dispersione dei valori osservati xi attorno a un valor medio (scostamenti medi) indicatori che misurano le disuguaglianze a due a due fra tutti i valori individuali (differenze medie)

30

Alcune misure di variabilit


Sia x1x2 xn linsieme delle osservazioni del carattere X
{

Intervallo di variabilit Iv = xn x1

Differenza interquartile W = x x

31

Intervallo di variabilit e Differenza interquartile


Voti 18 19 20 21 22 23 24 25 26 27 28 29 30 Totale
32

Studenti 3 5 7 5 10 6 10 6 11 6 5 10 4 88

Intervallo di variabilit x1 = 18 xn = 30 Iv = 30-18 = 12

Differenza interquartile x = 22 x = 27 W = 27-22 = 5

Indicatori di variabilit

Consideriamo la serie delle differenze in valore assoluto tra ciascuna unit statistica e le altre. Le due somme, pari a 9 e 140, indicano che il carattere statura presenta nei riguardi del gruppo (S1,S2,S3) variabilit minore che non nei riguardi del gruppo (T1,T2,T3).
33

Indicatori di variabilit
30 25 20 15 10 5 0 -4 -3 -2 -1 0 1 2 3 4

x1 = 0 x2 = 0

Distrib. 1

Distrib. 2

34

La varianza
La varianza di un insieme di n valori osservati x1, x2, , xn di una variabile X con media aritmetica x data da:
1 n 2 = (xi x ) n i =1
2

Il numeratore della varianza detto devianza:


2 Dev = (xi x ) i=1
35

La radice quadrata della varianza detta deviazione standard:


s= 1 n (xi x )2 n i=1

Esempio
X = Ore di allenamento settimanale n = 6 atleti che si preparano a una gara Dati relativi a 4 differenti situazioni

Determinare la media aritmetica. La media aritmetica sempre 9,5


36

Esempio
Per i medesimi protocolli elementari, calcolare intervallo di variazione, devianza, varianza e deviazione standard.

x = 9,5

37

Esempio
In un campione di 128 uomini adulti sono stati rilevati: X = Circonferenza del torace (in cm) Y = Peso corporeo (in kg)

38

a) Misurare la variabilit di X e Y mediante la deviazione standard b) E maggiore la variabilit di X o quella di Y?

Coefficiente di variazione

Cv =

S(X) x

Cvn =

Cv n 1

39

Esempio: Distribuzione con outlier


10%

8%

6%

4%

2%

0%

40

Esempio: Asimmetria a destra


10%

8%

6%

4%

2%

0%

41

Esempio: Distribuzione bimodale


10%

8%

6%

4%

2%

0%
42

Esempio
Reti segnate in serie A (1996/97-2003/2004)
10%

% di giornate di campionato

8%

6%

4%

2%

0% 9 12 15 18 21 24 27 30 33 36

Reti segnate in una giornata di campionato


43

Esempio
Reti segnate in serie A (1996/97-2003/2004)
10%

% di giornate di campionato

8%

6%

4%

2%

0% 9 12 15 18 21 24 27 30 33 36

Reti segnate in una giornata di campionato


44

Esempio
Reti segnate in serie A (1996/97-2003/2004)
10%

% di giornate di campionato

8%

6%

4%

2%

0% 9 12 15 18 21 24 27 30 33 36

Reti segnate in una giornata di campionato


45

Curva di densit
Una curva di densit una curva tale che:
{ {

Si trova sempre sopra o sullasse orizzontale Larea sotto di essa esattamente pari a 1

Una curva di densit rappresenta il modello complessivo di una distribuzione. Larea che sta sotto la curva relativamente a un certo intervallo rappresenta la proporzione di tutte le osservazioni che cadono in quellintervallo
46

Esempi di curve di densit

Mediana e media
47

Mediana

Media

Curva di densit: Media e mediana


{

La mediana di una curva di densit il punto che divide larea sotto la curva esattamente a met La media di una curva di densit il punto in cui, se la curva fosse di materiale solido, essa rimarrebbe in equilibrio

48

Distribuzione uniforme

altezza = 1

0
{ { { {
49

Quanto vale la superficie totale sotto questa curva? Quale percentuale di osservazioni al di sopra di 0,8? Quale percentuale di osservazioni al di sotto di 0,6? Quale percentuale di osservazioni fra 0,25 e 0,75?

Distribuzione normale

x1

x2

50

Distribuzione normale
A 1 B A < 1 < B
51

Distribuzione normale

x
52

Importanza della Normale


{

Le distribuzioni normali sono ottime rappresentazioni per alcune distribuzioni di dati reali Le distribuzioni normali sono ottime rappresentazioni dei risultati casuali Molte elaborazioni dellinferenza statistica sono basate sulle distribuzioni normali

53

La regola della Normale


Nella distribuzione Normale con media x e deviazione standard :
{

il 68% delle osservazioni compreso nellintervallo [ x -, x +] il 95% delle osservazioni compreso nellintervallo [ x -2, x +2] il 99,7% delle osservazioni compreso nellintervallo [ x -3, x +3]

54

Standardizzazione
Se x unosservazione da una distribuzione con media x e deviazione standard , il valore standardizzato di x :

xx z=

55

Relazione tra caratteri quantitativi


180 170 160 150 140 130 120 110 100 5 5,2 5,4 5,6 5,8 6 6,2 6,4 6,6 6,8 7

56

Relazione tra caratteri quantitativi


x = 5,92
y = 134,69
40,00

Scostamenti concordi
30,00 20,00 10,00 0,00 -10,00 -20,00 -30,00 -40,00 -0,80

Scostamenti discordi

Scostamenti discordi
-0,60 -0,40 -0,20 0,00

Scostamenti concordi
0,20 0,40 0,60 0,80 1,00

57

Concordanza e Discordanza
{

Due caratteri quantitativi presentano concordanza se la maggior parte degli scostamenti sono concordi Al contrario, sussiste discordanza se la maggior parte degli scostamenti sono discordi Un indice simmetrico per misurare la concordanza o la discordanza la covarianza

58

La covarianza
xy
1 n = (yi y )(xi x ) n i =1

xy = Media(xy ) y x
Il numeratore della covarianza la codevianza

59

Calcolo della covarianza


xy = Media(xy ) y x
x = 5,92
y = 134,69

xy = 792,685 5,92 134,69 xy = 5,268

60

Coefficiente di correlazione lineare


xy r = x y
Codev xy DevxDev y

r=

61

Calcolo di r
xy r = x y
xy = 5,268
x = 0,3652

xy = 16,8267

r=
62

5,268 = 0,8573 0,3652 16,8267

Propriet di r
{ {

-1 r 1 r = 1 se tra X e Y sussiste un perfetto legame lineare e i due caratteri sono concordi r = -1 se tra X e Y sussiste un perfetto legame lineare e i due caratteri sono discordi r = 0 se i due caratteri sono linearmente indipendenti

63

Regressione
180 170 160 150 140 130 120 110 100 5 5,2 5,4 5,6 5,8 6 6,2 6,4 6,6 6,8 7

64

Parametri della retta di regressione


Y = b0 + b1X

b0 = y b1x
Codev xy Dev x

b1 =
65

Calcolo dei parametri della retta


xy = 5,268
Devx = 1,734
x = 5,92
y = 134,69

Codev xy = n xy = 13 (5,268) = 68,4846


b1 = Codev xy Devx = 68,4846 = 39,495 1,734

b0 = y b1x = 134,69 (39,495) 5,92 = 368,5


66

La retta di regressione
180 170 160 150 140 130 120 110 100 5
67

y = 368,67 - 39,497x

5,2

5,4

5,6

5,8

6,2

6,4

6,6

6,8