Sei sulla pagina 1di 72

INFORMAZIONI

Prossime lezioni
Giorno Ora Dove
10/02 14:30 P50
11/02 14:30 Laboratorio (via Loredan)
17/02 14:30 P50
23/02 14:30 P50
25/02 14:30 Aula informatica (6-7 gruppi)
02/03 14:30 P50
04/03 14:30 Aula informatica (6-7 gruppi)
09/03 14:30 P50

– p. 1/1
INFORMAZIONI
Prossime lezioni
Giorno Ora Dove
10/02 14:30 P50
11/02 14:30 Laboratorio (via Loredan)
17/02 14:30 P50
23/02 14:30 P50
25/02 14:30 Aula informatica (6-7 gruppi)
02/03 14:30 P50
04/03 14:30 Aula informatica (6-7 gruppi)
09/03 14:30 P50
Mercoledí10/02 raccolta moduli compilati

– p. 1/1
STIME STATISTICHE
Consideriamo il caso della misura di una grandezza
fisica che sia affetta da errori casuali.

– p. 2/24
STIME STATISTICHE
Consideriamo il caso della misura di una grandezza
fisica che sia affetta da errori casuali.
Per ottenere maggior informazione sul valore vero della
grandezza ripeto più volte la misura. Avendo raccolto N
valori (non tutti coincidenti), mi domando quale
funzione, tra tutte le possibili funzioni dei dati fornisca
con maggior probabilità il valore vero della grandezza in
esame.

– p. 2/24
STIME STATISTICHE
Consideriamo il caso della misura di una grandezza
fisica che sia affetta da errori casuali.
Per ottenere maggior informazione sul valore vero della
grandezza ripeto più volte la misura. Avendo raccolto N
valori (non tutti coincidenti), mi domando quale
funzione, tra tutte le possibili funzioni dei dati fornisca
con maggior probabilità il valore vero della grandezza in
esame.
Supponiamo di aver eliminato tutti gli errori sistematici.
Poiché gli errori casuali hanno ugual probabilità di
spostare il risultato in difetto o in eccesso rispetto il
valore vero, il valore vero deve trovarsi in una posizione
centrale nella distribuzione dei valori osservati. Pertanto
quello che cerco è una funzione che mi permetta di
stimare il valore centrale dell’insieme dei dati raccolti.
– p. 2/24
STIME DI TENDENZA CENTRALE

MODA : x
b

– p. 3/24
STIME DI TENDENZA CENTRALE

MODA : x
b

MEDIANA: x
e

– p. 3/24
STIME DI TENDENZA CENTRALE

MODA : x
b

MEDIANA: x
e

MEDIA ARITMETICA:x̄

– p. 3/24
LA MODA
MODA : xb valore corrispondente al massimo della
frequenza, ossia al dato che compare più
frequentemente.

– p. 4/24
LA MODA
MODA : xb valore corrispondente al massimo della
frequenza, ossia al dato che compare più
frequentemente.
Una distribuzione è detta unimodale se possiede un
solo massimo (assoluto), bimodale se possiede due
massimi (relativi), trimodale se ...

– p. 4/24
LA MODA
MODA : xb valore corrispondente al massimo della
frequenza, ossia al dato che compare più
frequentemente.
Una distribuzione è detta unimodale se possiede un
solo massimo (assoluto), bimodale se possiede due
massimi (relativi), trimodale se ...
Se tutti i valori hanno la stessa frequenza o il massimo
cade agli estremi, la moda non c’è. Distrib. amodale.

– p. 4/24
LA MODA
MODA : xb valore corrispondente al massimo della
frequenza, ossia al dato che compare più
frequentemente.
Una distribuzione è detta unimodale se possiede un
solo massimo (assoluto), bimodale se possiede due
massimi (relativi), trimodale se ...
Se tutti i valori hanno la stessa frequenza o il massimo
cade agli estremi, la moda non c’è. Distrib. amodale.
Non influenzata dai valori estremi.

– p. 4/24
LA MODA
MODA : xb valore corrispondente al massimo della
frequenza, ossia al dato che compare più
frequentemente.
Una distribuzione è detta unimodale se possiede un
solo massimo (assoluto), bimodale se possiede due
massimi (relativi), trimodale se ...
Se tutti i valori hanno la stessa frequenza o il massimo
cade agli estremi, la moda non c’è. Distrib. amodale.
Non influenzata dai valori estremi.
Dipende dalla scelta delle classi dell’istogramma.

Vediamolo subito! – p. 4/24


LA MODA

– p. 5/24
LA MEDIANA
In una lista ordinata, la mediana è il valore centrale
(50% sopra, 50% sotto).

– p. 6/24
LA MEDIANA
In una lista ordinata, la mediana è il valore centrale
(50% sopra, 50% sotto).

Non influenzata dai valori estremi.

– p. 6/24
LA MEDIANA
In una lista ordinata, la mediana è il valore centrale
(50% sopra, 50% sotto).

Non influenzata dai valori estremi.


Nel calcolare la mediana possono presentarsi piccoli
problemi di calcolo dato che:

– p. 6/24
LA MEDIANA
In una lista ordinata, la mediana è il valore centrale
(50% sopra, 50% sotto).

Non influenzata dai valori estremi.


Nel calcolare la mediana possono presentarsi piccoli
problemi di calcolo dato che:
Non è detto che esista un valore maggiore di un 50% esatto dei
dati e minore dei restanti.

– p. 6/24
LA MEDIANA
In una lista ordinata, la mediana è il valore centrale
(50% sopra, 50% sotto).

Non influenzata dai valori estremi.


Nel calcolare la mediana possono presentarsi piccoli
problemi di calcolo dato che:
Non è detto che esista un valore maggiore di un 50% esatto dei
dati e minore dei restanti.
Questo valore può esistere, ma non essere unico.

– p. 6/24
Come si trova la mediana di una successione?

Ordinare i valori dal più piccolo al più grande

– p. 7/24
Come si trova la mediana di una successione?

Ordinare i valori dal più piccolo al più grande


Nella sequenza ordinata trovare la posizione di:
valore centrale se il numero di valori è dispari
due valori centrali se il numero di valori è pari

– p. 7/24
Come si trova la mediana di una successione?
La mediana di una successione di n numeri ordinati in
senso non decrescente {x1 , x2 , x3 , · · · xn } è:
x
e = x(n+1)/2 se n è dispari
xn/2 + xn/2+1
x
e= se n è pari
2

– p. 8/24
Come si trova la mediana di una successione?
La mediana di una successione di n numeri ordinati in
senso non decrescente {x1 , x2 , x3 , · · · xn } è:
x
e = x(n+1)/2 se n è dispari
xn/2 + xn/2+1
x
e= se n è pari
2
Attenzione: n+1
2 non è il valore della mediana, ma la
posizione della mediana nella sequenza ordinata.

– p. 8/24
Calcolo della mediana: esempio I
Dati: 1, 4, 2, 9, 5.

– p. 9/24
Calcolo della mediana: esempio I
Dati: 1, 4, 2, 9, 5.
Dati ordinati: 1, 2, 4, 5, 9.

– p. 9/24
Calcolo della mediana: esempio I
Dati: 1, 4, 2, 9, 5.
Dati ordinati: 1, 2, 4, 5, 9.
Ci sono n = 5 dati. La terza osservazione lascia a
sinistra e a destra lo stesso numero di dati −→
5+1
posizione mediana: =3
2

– p. 9/24
Calcolo della mediana: esempio I
Dati: 1, 4, 2, 9, 5.
Dati ordinati: 1, 2, 4, 5, 9.
Ci sono n = 5 dati. La terza osservazione lascia a
sinistra e a destra lo stesso numero di dati −→
5+1
posizione mediana: =3
2
La mediana è x e = x3 = 4

– p. 9/24
Calcolo della mediana: esempio II
Dati: 5, 7, 5, 9.

– p. 10/24
Calcolo della mediana: esempio II
Dati: 5, 7, 5, 9.
Dati ordinati: 5, 5, 7, 9.

– p. 10/24
Calcolo della mediana: esempio II
Dati: 5, 7, 5, 9.
Dati ordinati: 5, 5, 7, 9.
Ci sono n = 4 dati. Qualsiasi numero tra 5 e 7 lascia a
sinistra e a destra esattamente un 50% delle
osservazioni la posizione mediana è data dai due valori
centrali (4/2) = 2 e (4/2) + 1 = 3.

– p. 10/24
Calcolo della mediana: esempio II
Dati: 5, 7, 5, 9.
Dati ordinati: 5, 5, 7, 9.
Ci sono n = 4 dati. Qualsiasi numero tra 5 e 7 lascia a
sinistra e a destra esattamente un 50% delle
osservazioni la posizione mediana è data dai due valori
centrali (4/2) = 2 e (4/2) + 1 = 3.
Mediana = punto centrale dell’intervallo individuato dai
sue valori centrali; in questo caso la mediana è
x2 + x3 5+7
x
e= = =6
2 2

– p. 10/24
Calcolo della mediana: esempio III
Dati: 4, 3, 2, 2, 5, 2, 6, 5, 1, 3.

– p. 11/24
Calcolo della mediana: esempio III
Dati: 4, 3, 2, 2, 5, 2, 6, 5, 1, 3.
Dati ordinati: 1, 2, 2, 2, 3, 3, 4, 5, 5, 6.

– p. 11/24
Calcolo della mediana: esempio III
Dati: 4, 3, 2, 2, 5, 2, 6, 5, 1, 3.
Dati ordinati: 1, 2, 2, 2, 3, 3, 4, 5, 5, 6.
Ci sono n = 10 dati (numero pari).Le due posizioni
centrali, la 5o e la 6o , sono occupate dallo stesso valore
3 −→ La mediana è x e = 3.

– p. 11/24
Calcolo della mediana: esempio III
Dati: 4, 3, 2, 2, 5, 2, 6, 5, 1, 3.
Dati ordinati: 1, 2, 2, 2, 3, 3, 4, 5, 5, 6.
Ci sono n = 10 dati (numero pari).Le due posizioni
centrali, la 5o e la 6o , sono occupate dallo stesso valore
3 −→ La mediana è x e = 3.
La presenza di misure ripetute rende la situazione
simile a quella dell’esempio I.

– p. 11/24
LA MEDIANA DI UN ISTOGRAMMA

Nel caso di distribuzioni di frequenze con valori


raggruppati in classi, la classe mediana si determina
utilizzando il metodo delle frequenze cumulate

– p. 12/24
LA MEDIANA DI UN ISTOGRAMMA

Nel caso di distribuzioni di frequenze con valori


raggruppati in classi, la classe mediana si determina
utilizzando il metodo delle frequenze cumulate

La mediana e’ il valore
dell’ascissa del punto di or-
dinata pari a 1/2.

– p. 12/24
LA MEDIA ARITMETICA
N
X
1
MEDIA ARITMETICA: x̄ = xi , ovvero somma
N
i=1
algebrica dei dati divisa per il numero di dati.

– p. 13/24
LA MEDIA ARITMETICA
N
X
1
MEDIA ARITMETICA: x̄ = xi , ovvero somma
N
i=1
algebrica dei dati divisa per il numero di dati.
Influenzata da valori estremi (outliers).

– p. 13/24
LA MEDIA ARITMETICA
N
X
1
MEDIA ARITMETICA: x̄ = xi , ovvero somma
N
i=1
algebrica dei dati divisa per il numero di dati.
Influenzata da valori estremi (outliers).

Nel caso di misure dirette affette da soli errori casuali la


media aritmetica fornisce la miglior stima del valore
vero delle grandezza fisica. – p. 13/24
Relazioni tra media, moda e mediana

– p. 14/24
Proprietà della media aritmetica
Def. SCARTO di una misura dalla media si = xi − x

– p. 15/24
Proprietà della media aritmetica
Def. SCARTO di una misura dalla media si = xi − x

PN
Per costruzione vale la relazione: i=1 (xi − x̄) ≡ 0
La somma degli scarti (positivi e negativi) è
identicamente nulla.

– p. 15/24
Proprietà della media aritmetica
Baricentro o punto di equilibrio della distribuzione dei
dati:

– p. 16/24
Proprietà della media aritmetica
Baricentro o punto di equilibrio della distribuzione dei
dati:

Supponendo che i rettangoli dell’istogramma abbiano


un peso proporzionale alla loro area, la media
aritmetica individua il punto in cui mettere un dito sotto
l’ascissa per tenere in equilibrio la distribuzione.
– p. 16/24
Proprietà della media aritmetica
La somma dei quadrati degli scarti dei valori di una
distribuzione dalla media è minore della somma dei
quadrati
nP degli scartioda un qualsiasi altro valore.
N 2
PN 2
min i=1 (x i − x) = i=1 (x i − x̄)

– p. 17/24
Proprietà della media aritmetica
La somma dei quadrati degli scarti dei valori di una
distribuzione dalla media è minore della somma dei
quadrati
nP degli scartioda un qualsiasi altro valore.
N 2
PN 2
min i=1 (x i − x) = i=1 (x i − x̄)

Vedremo in seguito che tale quantità è collegata all’


errore statistico di una serie di misure.

– p. 17/24
Proprietà della media aritmetica
La somma dei quadrati degli scarti dei valori di una
distribuzione dalla media è minore della somma dei
quadrati
nP degli scartioda un qualsiasi altro valore.
N 2
PN 2
min i=1 (x i − x) = i=1 (x i − x̄)

Vedremo in seguito che tale quantità è collegata all’


errore statistico di una serie di misure.
Pertanto, la proprietà dei minimi quadrati implica che la
media aritmetica è la stima del valore vero affetta dal
minimo errore statistico.

– p. 17/24
Media aritmetica espressa mediante le frequenze

Entro una serie di N misure, siano stati osservati M


valori distinti della grandezza X : x1 , x2 , · · · , xM , con
frequenze assolute n1 , n2 , · · · , nM .

– p. 18/24
Media aritmetica espressa mediante le frequenze

Entro una serie di N misure, siano stati osservati M


valori distinti della grandezza X : x1 , x2 , · · · , xM , con
frequenze assolute n1 , n2 , · · · , nM .
M
X
Vale la relazione nj = N
j=1

– p. 18/24
Media aritmetica espressa mediante le frequenze

Entro una serie di N misure, siano stati osservati M


valori distinti della grandezza X : x1 , x2 , · · · , xM , con
frequenze assolute n1 , n2 , · · · , nM .
M
X
Vale la relazione nj = N
j=1

La media aritmetica in funzione delle frequenze


N M
1 X 1 X
x = xi = nj xj (frequenze assolute)
N N
i=1 j=1
M
X M
X
nj
x = xj = fj xj (frequenze relative)
N
j=1 j=1

– p. 18/24
Approssimazione della media aritmetica per dati in classi
Classe Freq. Freq. rel.
Si siano organizzate le
x0 − x1 n1 f1
misure in un istogramma.
Entro una data classe non x1 − x2 n2 f2
cadono misure identiche, ··· ··· ···
ma quei valori compresi xj−1 − xj nj fj
entro la larghezza della ··· ··· ···
classe.
xM −1 − xM nM fM

Ipotesi: equidistribuzione delle frequenze all’interno di


ogni classe.

– p. 19/24
Approssimazione della media aritmetica per dati in classi
Classe Freq. Freq. rel.
Si siano organizzate le
x0 − x1 n1 f1
misure in un istogramma.
Entro una data classe non x1 − x2 n2 f2
cadono misure identiche, ··· ··· ···
ma quei valori compresi xj−1 − xj nj fj
entro la larghezza della ··· ··· ···
classe.
xM −1 − xM nM fM

Ipotesi: equidistribuzione delle frequenze all’interno di


ogni classe.
xi + xj+1
Valore centrale della classe j -esima: c̃j =
2

– p. 19/24
Approssimazione della media aritmetica per dati in classi
Classe Freq. Freq. rel.
Si siano organizzate le
x0 − x1 n1 f1
misure in un istogramma.
Entro una data classe non x1 − x2 n2 f2
cadono misure identiche, ··· ··· ···
ma quei valori compresi xj−1 − xj nj fj
entro la larghezza della ··· ··· ···
classe.
xM −1 − xM nM fM

Ipotesi: equidistribuzione delle frequenze all’interno di


ogni classe.
xi + xj+1
Valore centrale della classe j -esima: c̃j =
2
XM M
X
1
Quindi: x = cj n j = cj f j
N
j=1 j=1

– p. 19/24
STIME DI DISPERSIONE
Cerchiamo una stima dell’mpiezza dell’intervallo in cui
sono distribuite le misure, che serva a valutare
l’incertezza della misura ∆m, per definire l’espressione
m ± ∆m.

– p. 20/24
STIME DI DISPERSIONE
Cerchiamo una stima dell’mpiezza dell’intervallo in cui
sono distribuite le misure, che serva a valutare
l’incertezza della misura ∆m, per definire l’espressione
m ± ∆m.
1. semidispersione massima

– p. 20/24
STIME DI DISPERSIONE
Cerchiamo una stima dell’mpiezza dell’intervallo in cui
sono distribuite le misure, che serva a valutare
l’incertezza della misura ∆m, per definire l’espressione
m ± ∆m.
1. semidispersione massima
2. Scarto medio dalla media

– p. 20/24
STIME DI DISPERSIONE
Cerchiamo una stima dell’mpiezza dell’intervallo in cui
sono distribuite le misure, che serva a valutare
l’incertezza della misura ∆m, per definire l’espressione
m ± ∆m.
1. semidispersione massima
2. Scarto medio dalla media
3. Varianza e scarto quadratico medio

– p. 20/24
SEMIDISPERSIONE MASSIMA
semidispersione massima è la semi-ampiezza del
campo di variazione, cioè dell’intervallo tra il valore
xmax − xmin
minimo e il valore massimo osservati: .
2

14 − 1
∆m = = 6.5
2

– p. 21/24
SEMIDISPERSIONE MASSIMA
semidispersione massima è la semi-ampiezza del
campo di variazione, cioè dell’intervallo tra il valore
xmax − xmin
minimo e il valore massimo osservati: .
2

14 − 1
∆m = = 6.5
2
L’intervallo xmax − xmin contiene il 100% delle misure, ma

– p. 21/24
SEMIDISPERSIONE MASSIMA
semidispersione massima è la semi-ampiezza del
campo di variazione, cioè dell’intervallo tra il valore
xmax − xmin
minimo e il valore massimo osservati: .
2

14 − 1
∆m = = 6.5
2
L’intervallo xmax − xmin contiene il 100% delle misure, ma
Ignora la distribuizione dei
dati

– p. 21/24
SEMIDISPERSIONE MASSIMA
semidispersione massima è la semi-ampiezza del
campo di variazione, cioè dell’intervallo tra il valore
xmax − xmin
minimo e il valore massimo osservati: .
2

14 − 1
∆m = = 6.5
2
L’intervallo xmax − xmin contiene il 100% delle misure, ma
Ignora la distribuizione dei
dati

È sensibile ai valori outliers

– p. 21/24
SCARTO MEDIO ASSOLUTO
Posso definire lo scarto medio
N
1 X
s=x−x = (xi − x̄)
N
i=1

– p. 22/24
SCARTO MEDIO ASSOLUTO
Posso definire lo scarto medio
N
1 X
s=x−x = (xi − x̄)
N
i=1
Non ha senso perchè è identicamente nullo per
costruzione!

– p. 22/24
SCARTO MEDIO ASSOLUTO
Posso definire lo scarto medio
N
1 X
s=x−x = (xi − x̄)
N
i=1
Non ha senso perchè è identicamente nullo per
costruzione!
Scarto medio assoluto è la media aritmetica dei moduli
N
X
1
degli scarti: |s| = |x − x| = |xi − x̄|
N
i=1

– p. 22/24
SCARTO MEDIO ASSOLUTO
Posso definire lo scarto medio
N
1 X
s=x−x = (xi − x̄)
N
i=1
Non ha senso perchè è identicamente nullo per
costruzione!
Scarto medio assoluto è la media aritmetica dei moduli
N
X
1
degli scarti: |s| = |x − x| = |xi − x̄|
N
i=1
Tiene conto di tutti i dati, a differenza della
semi-dispersione massima.... ma esiste un indice molto
più significativo dal punto di vista statistico....

– p. 22/24
VARIANZA E SCARTO QUADRATICO MEDIO
N
X
1
La varianza è definita come σ 2 = (xi − x̄)2
N
i=1

– p. 23/24
VARIANZA E SCARTO QUADRATICO MEDIO
N
X
1
La varianza è definita come σ 2 = (xi − x̄)2
N
i=1
Lo scarto quadratico medio σ (deviazione standard) è
definito come la radice quadrata della varianza.

– p. 23/24
VARIANZA E SCARTO QUADRATICO MEDIO
N
X
1
La varianza è definita come σ 2 = (xi − x̄)2
N
i=1
Lo scarto quadratico medio σ (deviazione standard) è
definito come la radice quadrata della varianza.
Si dimostra che la varianza può essere ottenuta
utilizzando direttamente le misure e la loro media,
senza dover calcolare gli scarti:
N
X
1
σ2 = xi 2 − x̄2
N
i=1

– p. 23/24
VARIANZA E SCARTO QUADRATICO MEDIO
N
X
1
La varianza è definita come σ 2 = (xi − x̄)2
N
i=1
Lo scarto quadratico medio σ (deviazione standard) è
definito come la radice quadrata della varianza.
Si dimostra che la varianza può essere ottenuta
utilizzando direttamente le misure e la loro media,
senza dover calcolare gli scarti:
N
X
1
σ2 = xi 2 − x̄2
N
i=1
Dimostreremo che per un campione finito di N misure è
opportuno utilizzare la formula corretta (N −→ N − 1):
s
PN 2
i=1 (x i − x̄)
σ=
N −1
– p. 23/24
VARIANZA E SCARTO QUADRATICO MEDIO

Dimostreremo che σ dà un’indicazione della


dispersione delle misure. L’intervallo (m − σ, m + σ)
contiene circa i 2/3 delle misure effettuate.

– p. 24/24
VARIANZA E SCARTO QUADRATICO MEDIO

Dimostreremo che σ dà un’indicazione della


dispersione delle misure. L’intervallo (m − σ, m + σ)
contiene circa i 2/3 delle misure effettuate.

Lo scarto quadratico medio dà l’ampiezza dell’intervallo


in cui sono distribuite buona parte delle misure. Indica
quindi la precisione: la precisione della singola misura
dovuta all’insieme di apparato di misura, procedura
seguita, sperimentatore, ecc.
– p. 24/24