Sei sulla pagina 1di 43

4/6/2017

Affidabilità e Sicurezza nell’Industria


di Processo

ELEMENTI di TEORIA degli


ERRORI e STATISTICA

POLITECNICO DI MILANO

Teoria degli Errori

1- Misure ed errori assoluti


2- Cifre significative
3- Discrepanza
4- Valore accettato
5- Tipologie di Errore
6- Accuratezza e Precisione
7- Propagazione dell’errore

POLITECNICO DI MILANO

1
4/6/2017

Teoria degli Errori

1- Misure ed errori assoluti


2- Cifre significative
3- Discrepanza
4- Valore accettato
5- Tipologie di Errore
6- Accuratezza e Precisione
7- Propagazione dell’errore

POLITECNICO DI MILANO

Misure ed Errori Assoluti

La misura di ogni sperimentatore è data nella forma:


Magnitudo della grandezza ± Errore Assoluto di misura
Ciò significa che ad ogni misura sperimentale è
indissolubilmente associata una incertezza non eliminabile.
Densità
[g/cm3]
17

Misura 1 16
oro (15.5 g/cm3)
(15.0 ± 1.5) 15
Misura 2 14
lega (13.8 g/cm3)
(14.0 ± 0.5) 13

POLITECNICO DI MILANO

2
4/6/2017

Teoria degli Errori

1- Misure ed errori assoluti


2- Cifre significative
3- Discrepanza
4- Valore accettato
5- Tipologie di Errore
6- Accuratezza e Precisione
7- Propagazione dell’errore

POLITECNICO DI MILANO

Cifre significative

a) Quante cifre significative devono accompagnare


l’incertezza assoluta associata ad una misura?

v = 3.45  0.02385 m/s ?


E’ buona norma arrotondare sempre le incertezze
sperimentali ad una cifra significativa

v = 3.45  0.02 m/s !


Eccezione: Se la cifra significativa dell’incertezza è pari a 1 è possibile
mantenere 2 cifre significative.

POLITECNICO DI MILANO

3
4/6/2017

Cifre significative

b) Quante cifre significative devono accompagnare una


misura nota la sua incertezza assoluta?

Accelerazione misurata = 9.82  1 m/s2 ?


L’ultima cifra significativa di qualunque misura
sperimentale dove essere dello stesso ordine di
grandezza dell’incertezza relativa alla misura stessa
Accelerazione misurata = 10  1 m/s2 !

POLITECNICO DI MILANO

Teoria degli Errori

1- Misure ed errori assoluti


2- Cifre significative
3- Discrepanza
4- Valore accettato
5- Tipologie di Errore
6- Accuratezza e Precisione
7- Propagazione dell’errore

POLITECNICO DI MILANO

4
4/6/2017

Discrepanza

Come è possibile confrontare due (o più) misure di una


stessa grandezza effettuate da due (o più) sperimentatori
differenti? E’ necessario analizzare la DISCREPANZA tra
le due (o più) misure.
DISCREPANZA = valore assoluto della differenza tra due
valori misurati della stessa grandezza

Misura di A: 15  1
Discrepanza = 25 – 15 = 10
Misura di B: 25  2

Misura di C: 16  8
Discrepanza = 26 – 16 = 10
Misura di D: 26  9

POLITECNICO DI MILANO

Discrepanza

Come viene analizzata la discrepanza? Attraverso il


computo della SIGNIFICATIVITA’ DELLA DISCREPANZA.
Misura di A: 15  1 Misura di C: 16  8
Misura di B: 25  2 Misura di D: 26  9

30 30
B D
20 Discrepanza = 10 20 Discrepanza = 10
A C
10 10

0 0

Significativa Non significativa

POLITECNICO DI MILANO

5
4/6/2017

Teoria degli Errori

1- Misure ed errori assoluti


2- Cifre significative
3- Discrepanza
4- Valore accettato
5- Tipologie di Errore
6- Accuratezza e Precisione
7- Propagazione dell’errore

POLITECNICO DI MILANO

Valore accettato

Valore ACCETTATO = Magnitudo accettata della


grandezza da misurare = Stima del VALORE VERO di
una grandezza assunta priva di ERRORE
Es. Confronto di misure con il valore accettato.
Consideriamo la misura della velocità del suono nell’aria.
Il suo valore accettato è:

C Velocità del suono nell’aria = 331 m/s


340
(a T e P standard)

330
A
Valore accettato Velocità misurata da A = 329  5 m/s

B Velocità misurata da B = 325  5 m/s


320

POLITECNICO DI MILANO

6
4/6/2017

Teoria degli Errori

1- Misure ed errori assoluti


2- Cifre significative
3- Discrepanza
4- Valore accettato
5- Tipologie di Errore
6- Accuratezza e Precisione
7- Propagazione dell’errore

POLITECNICO DI MILANO

Tipologie di errore

Relativamente a:

- DISCREPANZA TRA MISURE


- CONFRONTO TRA VALORE ACCETTATO E
MISURE

è possibile distinguere due differenti tipologie di


errore:
a) CASUALI
b) SISTEMATICI

POLITECNICO DI MILANO

7
4/6/2017

Tipologie di errore

Difetti o deterioramento dello strumento

Perturbazioni esterne

Uso di formule errate nelle misure indirette


Sistematici
POSSONO ESSERE ELIMINATI

COMPORTANO UNA DEVIAZIONE COSTANTE


DAL VALORE VERO

Sono associati agli SPERIMENTATORI e alla


variabilità delle condizioni di misura
Casuali
Possono essere ridotti ma non eliminati

Possiedono proprietà statistiche

POLITECNICO DI MILANO

Tipologie di errore

Casuali: piccoli Casuali: piccoli


Sistematici: piccoli Sistematici: grandi

Valore Vero

Casuali: grandi Casuali: grandi


Sistematici: piccoli Sistematici: grandi

POLITECNICO DI MILANO

8
4/6/2017

Teoria degli Errori

1- Misure ed errori assoluti


2- Cifre significative
3- Discrepanza
4- Valore accettato
5- Tipologie di Errore
6- Accuratezza e Precisione
7- Propagazione dell’errore

POLITECNICO DI MILANO

Accuratezza e Precisione

In base alla minore o maggiore presenza di errori CASUALI


e SISTEMATICI è possibile classificare le misure
sperimentali di un determinato set come:

- PRECISE
- ACCURATE

La PRECISIONE di una misura risulta associata alla sua


RIPETIBILITA’ (vicinanza relativa).
L’ACCURETEZZA di una misura risulta associata alla sua
vicinanza al VALORE VERO.

POLITECNICO DI MILANO

9
4/6/2017

Accuratezza e Precisione

Come è possibile valutare quanto “PRECISA” sia UNA


misura?

VALORE MISURATO DI x = x  dx
N.B L’incertezza assoluta dx non è in grado di indicare la
precisione di una misura

1 cm di errore su 1 km  misura molto precisa


1 cm di errore su 3 cm  misura molto grossolana

Introduciamo a questo fine l’INCERTEZZA RELATIVA.

POLITECNICO DI MILANO

Accuratezza e Precisione

L’INCERTEZZA RELATIVA viene definita come:


dx
ε=
x

Lunghezza x = 50  1 cm
dx 1 cm
Incertezza relativa = = = 0.02
x 50 cm

Lunghezza x = 50 cm  2%
N.B L’incertezza assoluta dx ha la stessa unità di misura
di x.
L’incertezza relativa è adimensionale !

POLITECNICO DI MILANO

10
4/6/2017

Teoria degli Errori

1- Misure ed errori assoluti


2- Cifre significative
3- Discrepanza
4- Valore accettato
5- Tipologie di Errore
6- Accuratezza e Precisione
7- Propagazione dell’errore

POLITECNICO DI MILANO

Propagazione dell’errore

Vengono di seguito riportate le regole che


permettono di ricavare l’incertezza associata
ad un valore ricavato utilizzando misure
sperimentali affette da errore.

POLITECNICO DI MILANO

11
4/6/2017

Propagazione dell’errore

1. Incertezza nelle somme e nelle differenze:

Se le grandezze misurate x1, x2 …, xn aventi incertezze assolute dx1,


dx2, …, dxn vengono utilizzate per calcolare la seguente espressione:

q = x1 + x2 + …+ xm – (xm+1 + xm+2 + …+ xn)

l’incertezza nel valore calcolato q è la somma di tutte le incertezze


originali:

dq  dx1 + dx2 + …+ dxm + dxm+1 + dxm+2 + …+ dxn

N.B Quando si sommano o sottraggono un numero qualsiasi di


misure, le incertezze si sommano sempre!

POLITECNICO DI MILANO

Propagazione dell’errore

2. Incertezza nei prodotti e nei quozienti:

Se le grandezze misurate x1, x2 …, xn aventi incertezze assolute dx1,


dx2, …, dxn vengono utilizzate per calcolare la seguente espressione:
x1 x2 …xm
q=
xm+1 xm+2 …xn
l’incertezza relativa nel valore calcolato q è la somma di tutte le
incertezze relative:
dq dx1 dx2 dxm dxm+1 dxm+2 dxn
 + +…+ + + +…+
q x1 x2 xm xm+1 xm+2 xn

N.B Quando si moltiplicano o dividono un numero qualsiasi di


misure, le incertezze relative si sommano sempre

POLITECNICO DI MILANO

12
4/6/2017

Propagazione dell’errore

3. Prodotto di una grandezza misurata per un


numero esatto

Se la grandezza misurata x, avente incertezza assoluta dx, viene


utilizzata per calcolare il prodotto:

q = Bx

(dove B non ha incertezza)


l’incertezza di q è |B| volte quella di x:

dq = |B| dx

POLITECNICO DI MILANO

Propagazione dell’errore

4. Incertezza in una potenza

Se la grandezza misurata x, avente incertezza dx, viene utilizzata per


calcolare la potenza:

q = xn

allora l’incertezza relativa in q è n volte quella di x:

dq dx
= n
q x

POLITECNICO DI MILANO

13
4/6/2017

Propagazione dell’errore

5. Incertezza di una funzione di più variabili

Se le grandezze x1, x2 …, xn, aventi incertezze assolute dx1, dx2, …,


dxn, vengono utilizzate per calcolare una generica funzione q(x 1, x2
…, xn)
l’incertezza assoluta nel valore calcolato di q è dato da:

dq dq dq
dq  dx1+ dx2 + … + dx
dx1 dx2 dxn n

POLITECNICO DI MILANO

Propagazione dell’errore

Altri Casi
- Se solo una delle misure con cui calcolare q fosse affetta da
incertezza (es. x2) allora si avrebbe:

dq
dq  dx2
dx2

- Se le incertezze di x1, x2 …, xn sono indipendenti e casuali allora


l’incertezza in q diviene:

2 2 2
dq dq dq
dq = dx1 + dx2 + … + dxn
dx1 dx2 dxn

POLITECNICO DI MILANO

14
4/6/2017

Elementi di Statistica

1- Definizioni e concetti di base


2- Integrazione: Probabilità
3- Variabili casuali discrete
4- Variabili casuali continue
5- Valore atteso e varianza
6- Stima di parametri
7- Caratteristiche della stima
8- Stimatori di valore centrale
9- Stimatori di dispersione

POLITECNICO DI MILANO

Elementi di Statistica

1- Definizioni e concetti di base


2- Integrazione: Probabilità
3- Variabili casuali discrete
4- Variabili casuali continue
5- Valore atteso e varianza
6- Stima di parametri
7- Caratteristiche della stima
8- Stimatori di valore centrale
9- Stimatori di dispersione

POLITECNICO DI MILANO

15
4/6/2017

Definizioni e concetti di base

Statistica:
Disciplina che si occupa di COLLEZIONARE, ANALIZZARE
ed INTERPRETARE dati estratti da una POPOLAZIONE
(es. concentrazione di un inquinante aerodisperso).

1) COLLEZIONARE:
Obiettivo  Ottimizzazione raccolta dati = minimo
numero sperimentazioni / osservazioni (selezione
campione);

2) ANALIZZARE ed INTERPRETARE
Obiettivo  Trarre inferenze sulla popolazione
analizzando i dati estratti da essa.

POLITECNICO DI MILANO

Definizioni e concetti di base

Noi ci occuperemo unicamente dell’ANALISI e


dell’INTERPRETAZIONE dei dati estratti da una
generica popolazione!

I tipi di INFERENZE che si possono trarre sono


essenzialmente di DUE differenti tipologie:

- INFERENZE basate su TEST di SIGNIFICANZA (o


d’IPOTESI);

- INFERENZE basate su LIMITI di FIDUCIA di un


PARAMETRO.

POLITECNICO DI MILANO

16
4/6/2017

Definizioni e concetti di base

VARIABILE CASUALE:
Variabile Y (es. concentrazione = caratteristica di interesse) il cui
valore (= valore argomentale, y) non è noto prima di una
sperimentazione/osservazione.

VARIABILE CASUALE DISCRETA:


Una variabile casuale Y viene definita DISCRETA se può assumere
solo un numero FINITO di valori entro un dato intervallo di
variabilità (MAI ∞).

VARIABILE CASUALE CONTINUA:


Una variabile casuale Y viene definita CONTINUA se può
assumere tutti i valori compresi entro un dato intervallo di
variabilità (es. (+∞, -∞), (-5,5), ecc…).

POLITECNICO DI MILANO

Definizioni e concetti di base

DATO:
Elemento statistico di base. Risultato di una
sperimentazione/osservazione atta a determinare il valore
(y) assunto da una variabile casuale Y (sia discreta sia
continua).

POPOLAZIONE:
Insieme di tutte le osservazioni possibili per una data variabile
casuale Y in analisi.

CAMPIONE:
Insieme di osservazioni che rappresentano solo una parte della
popolazione in analisi.

POLITECNICO DI MILANO

17
4/6/2017

Elementi di Statistica

1- Definizioni e concetti di base


2- Integrazione: Probabilità
3- Variabili casuali discrete
4- Variabili casuali continue
5- Valore atteso e varianza
6- Stima di parametri
7- Caratteristiche della stima
8- Stimatori di valore centrale
9- Stimatori di dispersione

POLITECNICO DI MILANO

Integrazione: Probabilità

Ad ogni variabile casuale DISCRETA o


CONTINUA è sempre associata una
PROBABILITA’ di ACCADIMENTO p.

PROBABILITA’ di ACCADIMENTO p:

Valore numerico che esprime il grado di incertezza


di una sperimentazione.

POLITECNICO DI MILANO

18
4/6/2017

Integrazione: Probabilità

PROBABILITA’ di ACCADIMENTO:
E’ la probabilità di ottenere il dato E come risultato di una
sperimentazione.
N° osservazioni che danno origine a E
Pr (E) =
N° tot osservazioni possibili
Essa viene espressa come frequenza di accadimento di lungo
termine :
PrE   lim nE
N  N
dove nE/N è la frequenza di accadimento di E (numero di volte in cui
si è verificato E dopo N sperimentazioni).
Esempi:
Pr(Testa) = 1/2 (E = Testa al lancio di una moneta)
Pr(3) = 1/6 (E = 3 nel lancio di un dado 6)

POLITECNICO DI MILANO

Elementi di Statistica

1- Definizioni e concetti di base


2- Integrazione: Probabilità
3- Variabili casuali discrete
4- Variabili casuali continue
5- Valore atteso e varianza
6- Stima di parametri
7- Caratteristiche della stima
8- Stimatori di valore centrale
9- Stimatori di dispersione

POLITECNICO DI MILANO

19
4/6/2017

Variabili casuali discrete

Dopo questa breve panoramica sulla probabilità ritorniamo alla


considerazione secondo la quale ad ogni variabile casuale
DISCRETA è associata una probabilità di ACCADIMENTO.
Ciò implica la possibilità di definire:

DISTRIBUZIONE DI PROBABILITA’ DI UNA VARIABILE


CASUALE DISCRETA

Si definisce distribuzione di probabilità di una variabile discreta Y,


indicata con p(y), la somma delle probabilità di ottenere quel
particolare valore (y) di Y. Al variare di y si ottengono diversi
valori di p che possono essere sia visualizzati mediante un
grafico sia condensati in una formula matematica.

POLITECNICO DI MILANO

Variabili casuali discrete

Esempio 1.
Qual è la POPOLAZIONE di Y = “somma del punteggio ottenuto
dal lancio di 2 dadi”?

p(2)

p(4)

POLITECNICO DI MILANO

20
4/6/2017

Variabili casuali discrete

Y p(y)
Risulta la seguente funzione di distribuzione di probabilità:
2 1/36
3 2/36
p(y)
4 3/36
7/36 5 4/36
6/36 6 5/36
5/36
7 6/36
4/36
8 5/36
3/36
2/36 9 4/36
1/36 10 3/36
0 11 2/36
2 3 4 5 6 7 8 9 10 11 12 Y
12 1/36
1

POLITECNICO DI MILANO

Variabili casuali discrete

Noti tutti i possibili valori (y) che può assumere una variabile
casuale discreta Y e la sua funzione di distribuzione di
probabilità (p(y)) è possibile ricavare il VALORE ATTESO di
Y(μ), cioè quel valore che caratterizza la posizione della
curva p(y) lungo l’asse y.

Esso è anche chiamato VALORE di POSIZIONE CENTRALE e


viene definito come la media pesata sulle probabilità dei
singoli valori y che Y può assumere:
yf
μ  E{Y}   y  p( y )
y  y0

POLITECNICO DI MILANO

21
4/6/2017

Variabili casuali discrete

Se consideriamo l’Esempio 1 è molto semplice


calcolare il valore atteso della sua funzione di
distribuzione p(y).

Esso viene calcolato come:


12
μ  E{Y}   y  p( y ) 
y 2

 1   2  1 
 2     3     ...  12     7
 36   36   36 

POLITECNICO DI MILANO

Elementi di Statistica

1- Definizioni e concetti di base


2- Integrazione: Probabilità
3- Variabili casuali discrete
4- Variabili casuali continue
5- Valore atteso e varianza
6- Stima di parametri
7- Caratteristiche della stima
8- Stimatori di valore centrale
9- Stimatori di dispersione

POLITECNICO DI MILANO

22
4/6/2017

Variabili casuali continue

Anche ad ogni variabile casuale CONTINUA è


associata una probabilità di ACCADIMENTO.

E’ perciò possibile definire:

DISTRIBUZIONE DI PROBABILITA’ DI UNA


VARIABILE CASUALE CONTINUA
Si definisce distribuzione di probabilità di una variabile
continua Y (F(y)), la probabilità di ottenere un valore
di Y minore o uguale a y. La funzione F(y) viene
anche definita funzione di distribuzione cumulativa
di Y.

POLITECNICO DI MILANO

Variabili casuali continue

ESEMPIO DI DISTRIBUZIONE DI PROBABILITA’ DI UNA


VARIABILE CASUALE CONTINUA
Proprietà:

F(y) - lim F  y   0
y 
1
- lim F  y   1
y 

0 yfin y - F(y) è una funzione


sempre crescente di y

POLITECNICO DI MILANO

23
4/6/2017

Variabili casuali continue

Molto spesso si è però interessati a conoscere la


probabilità che la variabile Y assuma un valore
compreso tra y1 e y2.

In tale caso è sufficiente sottrarre le rispettive funzioni


di distribuzione cumulativa F(y2) e F(y1):

P y1  Y  y2   PY  y2   PY  y1  
 F  y2   F  y1 

POLITECNICO DI MILANO

Variabili casuali continue

P y1  Y  y2   PY  y2   PY  y1  
 F  y2   F  y1 
F(y)
F(y2)

F(y1)

y1 y2 y

POLITECNICO DI MILANO

24
4/6/2017

Variabili casuali continue

A volte invece si è interessati a conoscere la probabilità che la


variabile Y assuma un valore che si colloca in un intorno
indefinitamente ristretto di un valore y.
Ciò porta a definire:

FUNZIONE DENSITA’ DI PROBABILITA’ DI UNA VARIABILE


CASUALE CONTINUA
Si definisce funzione densità di probabilità (“Probability Density
Function”, PDF) di una variabile continua Y (f(y)), la derivata
della funzione di distribuzione cumulativa (F(y)) rispetto a y.

N.B Il valore del prodotto f(y)*dy fornisce la probabilità che Y


assuma un valore compreso tra y e y+dy.

POLITECNICO DI MILANO

Variabili casuali continue

ESEMPIO DI FUNZIONE DENSITA’ DI PROBABILITA’


DI UNA VARIABILE CASUALE CONTINUA
y2

P y1  Y  y2   F  y2   F  y1    f  y dy
y1

f(y)

y1 y2 y
POLITECNICO DI MILANO

25
4/6/2017

Elementi di Statistica

1- Definizioni e concetti di base


2- Integrazione: Probabilità
3- Variabili casuali discrete
4- Variabili casuali continue
5- Valore atteso e varianza
6- Stima di parametri
7- Caratteristiche della stima
8- Stimatori di valore centrale
9- Stimatori di dispersione

POLITECNICO DI MILANO

Valore atteso e varianza

Al fine di valutare il VALORE ATTESO di una variabile


casuale continua Y appartenente ad una popolazione
è sufficiente calcolare:

μ  E{Y}   y  f(y)dy

N.B1 Si noti come questa definizione sia del tutto analoga
a quella relativa al valore atteso di una variabile
casuale discreta Y (la sommatoria è sostituita dal
termine di integrale).
N.B2 L’operatore valore atteso (E) per una variabile
casuale continua non ha significato fisico, ma solo
matematico.

POLITECNICO DI MILANO

26
4/6/2017

Valore atteso e varianza

La sola conoscenza del PARAMETRO di POSIZIONE


CENTRALE della distribuzione di probabilità NON è in
grado di caratterizzare in modo completo la
distribuzione stessa.

E’ necessario conoscere anche la dispersione dei dati della


popolazione attorno al valore centrale μ (valore atteso).
Si definisce VARIANZA di una popolazione:

σ 2  V(Y)  E{(Y - μ) 2 }
Si definisce DEVIAZIONE STANDARD di una popolazione
la RADICE QUADRATA della varianza.

POLITECNICO DI MILANO

Elementi di Statistica

1- Definizioni e concetti di base


2- Integrazione: Probabilità
3- Variabili casuali discrete
4- Variabili casuali continue
5- Valore atteso e varianza
6- Stima di parametri
7- Caratteristiche della stima
8- Stimatori di valore centrale
9- Stimatori di dispersione

POLITECNICO DI MILANO

27
4/6/2017

Stima di parametri

Valore di posizione centrale e varianza sono parametri


caratteristici di una PDF e, generalmente, NON sono
NOTI in quanto non è NOTA la PDF di una determinata
popolazione.

Ciò di cui lo sperimentatore dispone è:

UN CAMPIONE di DATI ESTRATTI da una


POPOLAZIONE

Ci chiediamo perciò come sia possibile STIMARE:


- VALORE ATTESO (= valore di posizione centrale)
- VARIANZA
di una popolazione noto solo un campione di dati estratti da
essa.

POLITECNICO DI MILANO

Stima di parametri

STIMATORE (o STATISTICO):

Viene definito stimatore una qualsiasi funzione dei


dati campionari che non contenga parametri
sconosciuti. Esso fornisce una stima, b, di un
parametro β della popolazione utilizzando n
valori sperimentali, yi (i = 1, n).

N.B Uno stimatore è a sua volta una variabile


casuale con una distribuzione di probabilità che
dipende dalla variabile Y (es. concentrazione) e
dalle caratteristiche dello stimatore usato.

POLITECNICO DI MILANO

28
4/6/2017

Stima di parametri

Il parametro μ di una popolazione è molto importante


perché rappresenta il valore centrale della variabile
casuale Y. Normalmente quello che si conosce non è il
parametro μ della popolazione, ma n valori sperimentali
yi (i = 1, n) utilizzando i quali si desidera stimare μ.

Gli stimatori di valore atteso più utilizzati sono:

- Media aritmetica campionaria;


- Mediana;
- Media tagliata campionaria;
- Media geometrica;
- Moda.

POLITECNICO DI MILANO

Stima di parametri

La varianza σ2 di una popolazione (o la deviazione


standard σ) è molto importante perché è un indice
della dispersione della variabile casuale Y intorno
al suo valore centrale, μ.

Più grande è il valore di σ2 o di σ e maggiore sarà la


dispersione dei dati intorno al valore centrale.

Anche in questo caso normalmente quello che si


conosce non è σ2, ma n valori sperimentali yi (i =
1, n) utilizzando i quali si desidera stimare σ2 o σ.

POLITECNICO DI MILANO

29
4/6/2017

Stima di parametri

Gli stimatori di σ2 più utilizzati sono:

- Varianza campionaria (s2);


- Quadrato della mediana delle deviazioni dei valori assoluti
(mad2).

Gli stimatori di σ più utilizzati sono:

- Deviazione standard campionaria (s);


- Deviazione standard priva di errore (usd);
- Mediana delle deviazioni dei valori assoluti (mad);
- Media della somma degli scarti assoluti (sa);
- Deviazione standard geometrica.

POLITECNICO DI MILANO

Elementi di Statistica

1- Definizioni e concetti di base


2- Integrazione: Probabilità
3- Variabili casuali discrete
4- Variabili casuali continue
5- Valore atteso e varianza
6- Stima di parametri
7- Caratteristiche della stima
8- Stimatori di valore centrale
9- Stimatori di dispersione

POLITECNICO DI MILANO

30
4/6/2017

Caratteristiche della stima

Prima di descrivere nel dettaglio ciascuno degli


stimatori elencati in precedenza è necessario
caratterizzare gli attributi fondamentali della
STIMA.

In particolare parleremo di:

- CONTAMINAZIONE DA ERRORE
- CONSISTENZA
- EFFICIENZA
- ROBUSTEZZA
- DIFFICOLTA’ DI CALCOLO

POLITECNICO DI MILANO

Caratteristiche della stima

- CONTAMINAZIONE DA ERRORE
Sia b la stima di un parametro β di una popolazione, stima
ricavata utilizzando n valori sperimentali, yi (i = 1, n).
La stima b è non contaminata da errore (“unbiased”)
se:

E{b}  β
ovvero il valore atteso di b (= stimatore inteso come nuova
variabile casuale avente una propria PDF) è pari al
valore atteso β della popolazione in analisi.

POLITECNICO DI MILANO

31
4/6/2017

Caratteristiche della stima

- CONTAMINAZIONE DA ERRORE
Esempio:
La media aritmetica campionaria
n

y i
y i 1
n
è una stima non contaminata da errore se lo sono tutti i
valori sperimentali yi utilizzati per il suo calcolo.
Infatti risulta:
 n  n

_   i   E{y i } nμ
y
E{y}  E  i1   i1  μ
 n  n n
 

POLITECNICO DI MILANO

Caratteristiche della stima

- CONSISTENZA
Una stima b di un parametro β è consistente se
all’aumentare del numero delle osservazioni effettuate
tende sempre di più al valore β.

- EFFICIENZA
Poiché la stima b è una variabile casuale, anch’essa
possiede una varianza che rappresenta la dispersione
di b intorno al valore atteso β.
Più la varianza di b è piccola, più i valori di b sono
concentrati intorno al suo valore atteso.
Uno stimatore è perciò più efficiente di un altro se ha una
varianza minore.

POLITECNICO DI MILANO

32
4/6/2017

Caratteristiche della stima

- EFFICIENZA
Esempio:
Se una popolazione ha una PDF NORMALE, si può
dimostrare che la varianza della media aritmetica è pari
a: _
 _  σ
2
V{ y}  E ( y μ) 2  
  n
mentre la varianza della mediana è pari a:
  πσ 2 π _
V{m y }  E (m y  μ) 2   V{ y}
2n 2
Perciò la media aritmetica, per una popolazione avente pdf
normale, è una stima del parametro β di posizione
centrale più efficiente della mediana.

POLITECNICO DI MILANO

Caratteristiche della stima

- ROBUSTEZZA

Uno stimatore è robusto quando non viene modificato molto


anche se alcuni valori dei dati sperimentali yi sono
contaminati da errore (dati aberranti o outlier).

Più è alto il numero di dati contaminati da errore che uno


stimatore riesce ad assorbire senza subire grosse
variazioni e più lo stimatore è robusto.

Uno stimatore che fornisce una stima molto diversa anche


se un solo dato è contaminato da errore è uno stimatore
non robusto.

POLITECNICO DI MILANO

33
4/6/2017

Caratteristiche della stima

- ROBUSTEZZA
Esempio:
La media aritmetica non è uno stimatore robusto perché
basta che uno solo dei dati sperimentali sia contaminato
da errore (aberrante) per modificarne il valore in
maniera consistente.

Consideriamo la seguente serie di valori:


3.112, 3.115, 3.114, 3.121, 3.112, 3.123, 3.116
La media aritmetica è 3.116.

Consideriamo ora la seguente serie di valori:


3.112, 3.115, 31.14, 3.121, 3.112, 3.123, 3.116
La media aritmetica è 7.12.

POLITECNICO DI MILANO

Caratteristiche della stima

- ROBUSTEZZA

È perciò bastato un solo dato ABERRANTE per modificare


notevolmente il valore della media aritmetica.

La mediana è invece uno stimatore molto robusto che


riesce a stimare il parametro β di posizione centrale
anche quando quasi la metà dei dati sono contaminati
da errore.

I valori delle due mediane dell’esempio precedente sono:

- 3.115
- 3.116

POLITECNICO DI MILANO

34
4/6/2017

Caratteristiche della stima

- DIFFICOLTA’ NEL CALCOLO

Alcuni stimatori possono richiedere tempi di calcolo


maggiori di altri soprattutto quando il numero di dati
sperimentali è elevato.

In qualche caso la difficoltà si presenta quando i dati sono


talmente numerosi da non poter essere memorizzati in
memoria centrale.

In questo caso è fondamentale sapere quante volte devono


essere letti i dati memorizzati su file per poter stimare il
parametro.

POLITECNICO DI MILANO

Elementi di Statistica

1- Definizioni e concetti di base


2- Integrazione: Probabilità
3- Variabili casuali discrete
4- Variabili casuali continue
5- Valore atteso e varianza
6- Stima di parametri
7- Caratteristiche della stima
8- Stimatori di valore centrale
9- Stimatori di dispersione

POLITECNICO DI MILANO

35
4/6/2017

Stimatori di valore centrale

1) MEDIA ARITMETICA CAMPIONARIA


n

_ y i
y i
n
- E’ una stima consistente del parametro μ.
- E’ una stima non contaminata da errore di μ se lo sono
tutte le osservazioni yi.
- Non è una stima robusta. Infatti basta un solo outlier per
inficiare la stima.
- E’ lo stimatore più efficiente del parametro μ se la pdf è
simmetrica.
- Richiede poco tempo di calcolo (i dati vengono letti una
sola volta).

POLITECNICO DI MILANO

Stimatori di valore centrale

2) MEDIANA

Se i valori sperimentali yi vengono ordinati in ordine


crescente la mediana my è il termine di mezzo, ossia è
quel VALORE per cui il numero di termini aventi valore
maggiore è uguale al numero di termini aventi un valore
inferiore.

N=7 my = 6
2.5 3.5 5 6 7.5 8 8.5

N=6 2.5 3.5 5 6 7.5 8 my = 5.5

y
POLITECNICO DI MILANO

36
4/6/2017

Stimatori di valore centrale

2) MEDIANA

- Se la pdf della popolazione è simmetrica la mediana è una


stima consistente di μ.
- Se la pdf della popolazione è simmetrica la mediana è una
stima non contaminata da errore di μ.
- La mediana è una stima molto robusta di μ quando la pdf
della popolazione è simmetrica. La stima rimane buona
anche se circa la metà dei dati sono outlier.
- Se la pdf della popolazione è normale la mediana è uno
stimatore meno efficiente della media aritmetica.
- La mediana può richiedere un notevole tempo di calcolo
quando il vettore dei dati è di grandi dimensioni. Infatti il
riordinamento dei dati è un’operazione molto più costosa
della loro somma.

POLITECNICO DI MILANO

Stimatori di valore centrale

3) MEDIA GEOMETRICA

La media geometrica viene definita come la radice n-esima


della produttoria dei valori sperimentali yi.
n
GM  n y
i 1
i

La media geometrica viene usata soprattutto quando i


diversi valori sperimentali vengono per loro natura
moltiplicati tra di loro e non sommati.

POLITECNICO DI MILANO

37
4/6/2017

Stimatori di valore centrale

4) MEDIA TAGLIATA (Trimmed Mean)

La media tagliata è un compromesso fra la media aritmetica


e la mediana.

Passi per il calcolo della media tagliata TM:


- gli elementi yi vengono ordinati sequenzialmente;
- si elimina una frazione nota di tutti gli elementi a destra e
a sinistra del valore centrale;
- si esegue la media aritmetica degli elementi rimasti.

Le caratteristiche della media tagliata sono intermedie fra


quelle della media e quelle della mediana.

POLITECNICO DI MILANO

Stimatori di valore centrale

5) MODA

La moda è l’elemento che si presenta più


frequentemente.

Questo stimatore non è molto usato per variabili


casuali continue anche se concettualmente è
molto importante.

POLITECNICO DI MILANO

38
4/6/2017

Stimatori di valore centrale

OSSERVAZIONI

- Nel caso di PDF SIMMETRICHE rispetto al valore di


posizione centrale tutti gli stimatori analizzati
forniscono la stessa STIMA del valore atteso della
popolazione in oggetto;

- L’EFFICIENZA di uno statistico nello stimare il valore


centrale di posizione di una PDF dipende dalla PDF
stessa.

POLITECNICO DI MILANO

Elementi di Statistica

1- Definizioni e concetti di base


2- Integrazione: Probabilità
3- Variabili casuali discrete
4- Variabili casuali continue
5- Valore atteso e varianza
6- Stima di parametri
7- Caratteristiche della stima
8- Stimatori di valore centrale
9- Stimatori di dispersione

POLITECNICO DI MILANO

39
4/6/2017

Stimatori di dispersione

1) VARIANZA CAMPIONARIA

La varianza σ2 di una popolazione può essere stimata


mediante la seguente relazione che utilizza la media
aritmetica dell’insieme dei dati sperimentali:
n _
 (y i  y)
2

s2  i 1
n 1
- s2 è una stima non contaminata da errore di σ2.

- s2 non è uno stimatore robusto. Infatti basta un solo


outlier per inficiare la stima.

POLITECNICO DI MILANO

Stimatori di dispersione

1) VARIANZA CAMPIONARIA

Si osservi che anche la seguente relazione può essere


utilizzata per stimare la varianza della popolazione σ2:
n _
 (y i  y) 2
v2  i 1
n

- La stima v2 è una stima contaminata da errore di σ2.


Infatti si può dimostrare che:
n
E{v 2 }   2
n -1

POLITECNICO DI MILANO

40
4/6/2017

Stimatori di dispersione

2) mad2

Quando la distribuzione di probabilità della popolazione è


NORMALE, la varianza σ2 può essere stimata
mediante la seguente relazione che utilizza la mediana
dell’insieme dei dati sperimentali yi:

mad 2  1.253313  mediana  yi  mediana(y i ) 


2

- mad2 è una stima consistente di σ2.

- mad2 è uno stimatore molto robusto.

- mad2 è uno stimatore meno efficiente di s2.

POLITECNICO DI MILANO

Stimatori di dispersione

3) DEVIAZIONE STANDARD CAMPIONARIA

La deviazione standard σ di una popolazione può essere


stimata facendo la radice quadrata della stima della
varianza, s2.
n _

 (yi  y) 2
s i 1
n 1
- s è una stima contaminata da errore di σ.
Infatti:

E{s} 
c

POLITECNICO DI MILANO

41
4/6/2017

Stimatori di dispersione

3) DEVIAZIONE STANDARD CAMPIONARIA



E{s} 
c
dove: n3
!
n 1 2
c
2 n  2!
2
- Poiché c tende a 1 al tendere di n all’infinito s è una stima
consistente di σ.

Se si desidera una stima non contaminata da errore si dovrà


utilizzare la stima (“unbiased standard deviation”):
usd    c

POLITECNICO DI MILANO

Stimatori di dispersione

5) mad (“Median of Absolute Deviations”)

Quando la distribuzione di probabilità della popolazione è


NORMALE, la deviazione standard σ può essere stimata
mediante la seguente relazione che utilizza la mediana
dell’insieme dei dati sperimentali:

mad  1.253313  mediana  yi  mediana(y i ) 

- mad è una stima consistente di σ.

- mad è uno stimatore molto robusto.

POLITECNICO DI MILANO

42
4/6/2017

Stimatori di dispersione

6) MEDIA DELLA SOMMA DEGLI SCARTI ASSOLUTI

La deviazione standard σ di una popolazione può


essere stimata facendo la media della somma degli
scarti assoluti:
n _
 yi  y
sa  i 1
n

- sa non è una stima consistente di σ.

POLITECNICO DI MILANO

Stimatori di dispersione

7) DEVIAZIONE STANDARD GEOMETRICA

Viene spesso utilizzata (soprattutto per la valutazione di


misure di concentrazione di composti aerodispersi
nell’ambiente di lavoro) la deviazione geometrica
standard, definita come l’esponenziale della
trasformata logaritmica dei dati misurati:
n  ln yi  yln 2 
 



GSD  e i 1 
n 
dove:
n
ln yi
yln  
i 1 n

POLITECNICO DI MILANO

43

Potrebbero piacerti anche