11 ‐ Test d’ipotesi e
introduzione all’analisi della varianza
Statistica Sperimentale e Misure
Meccaniche
Stabilita la presenza di effetti non giustificati dal gioco del caso, è necessario
trovare un collegamento ai fattori che possono averli prodotti. In questa fase è
fondamentale il collegamento con gli esperti del processo in esame. La
statistica, come si è visto con il GPN, fornisce utili indicazioni sulla tipologia del
fattore da cercare (discontinuità o tendenza), ma è la parte tecnica che deve
produrre concrete ipotesi di collegamento con i fattori d’influenza del
processo. Per validare tali ipotesi è utile ricorrere ad metodi di valutazione
statistica, come i cosiddetti test d’ipotesi e l’analisi della varianza (Analysis Of
Variance, ANOVA).
Tale domanda è del tutto analoga ad altre simili domande che
potrebbero riguardare procedure e strumentazioni diverse, per
l’ambito delle misure, o anche, in ambito produzione, lotti
provenienti da reparti o stabilimenti differenti.
L’obiettivo è comprendere se le differenze nei risultati o nei
prodotti ottenuti siano solo casuali o se si debba ritenere che
siano causate da fattori sistematici.
Poiché, come si è visto sia con l’informazione trasferita dai risultati di misura,
sia con le risposte date dai test statistici, non si può giungere mai ad una
condizione di uguaglianza o di accettazione dell’ipotesi, ma solo ad una
dichiarazione d’ignoranza oppure ad un rifiuto (seppure espresso sempre con
un rischio d’errore), la prova cercata è nel rifiuto dell’ipotesi posta.
c) Valutare, sulla base di tale rischio d’errore α, i limiti dell’intervallo
fiduciario della distribuzione adottata. Ciò può essere facilmente fatto
utilizzando le funzioni statistiche della distribuzione della variabile di
controllo adottata.
G. Barbato ‐ A. Germak ‐ G. Genta 10
L’USO DEI TEST D’IPOTESI
Caso studio
1) Vi è omogeneità tra i risultati prodotti da tutti gli operatori?
La distribuzione di riferimento è la distribuzione delle medie dei q
risultati di ogni operatore (distribuzione normale, come si desume dal
teorema del limite centrale).
La migliore informazione sullo scarto tipo σ della popolazione è data
dal valore dello scarto tipo s degli n=50 dati. Quindi, lo scarto tipo sm
delle medie dei q risultati ottenuti da ogni operatore risulta:
s
sm
q
I dati dei primi operatori sono anche quelli iniziali, quelli degli
ultimi sono anche quelli finali. Non si può sapere se i primi
operatori ottengono valori più bassi degli ultimi per il loro modo di
operare o perché i valori di misura all’inizio erano più bassi che alla
fine a causa della deriva!
x x
k
2
j
SS B
s ns n
2 2 J 1
k 1 k 1
B m
x x j
n
x x j
2 n
2
k ij
1 SSW
s
ij
2 i 1
ove la parte: i 1
n 1 k n 1
W
k j 1 n 1
x
x xij x j x j x
k n k n
2 2
ij
J 1 i 1 J 1 i 1
J 1 i 1 J 1 i 1 J 1 i 1
J 1 i 1 J 1
G. Barbato ‐ A. Germak ‐ G. Genta 21
ANALISI DELLA VARIANZA
UN SOLO FATTORE SOTTO CONTROLLO
I contributi assumono tradizionalmente la forma:
x
k n k n k
SS TC xij x n x j x
2 2 2
ij x j SSW SS B
J 1 i 1 J 1 i 1 J 1
J 1 i 1
SS B n x j x
k
gruppi (Sum of Squares Between groups), 2
J 1
che sono proprio i numeratori delle due varianze sW2 ed s B2 prima
considerate.
Dovuta al k-1
k
n x j x
2
fattore s B2
k
SS B n x j x
2
Fcalc 2
esaminato sB2 J 1
sW
J 1 k 1
Totale kn - 1
k n
SS TC xij x
2
J 1 i 1
Poiché al livello di fiducia 80%, con 4 gradi di libertà per il numeratore
e 45 per il denominatore il limite è F = 1,6, si può affermare, con un
rischio d’errore del 20%, che le differenze tra le medie degli operatori
sono causate da fattori sistematici.
G. Barbato ‐ A. Germak ‐ G. Genta 26
ANALISI DELLA VARIANZA
UN SOLO FATTORE SOTTO CONTROLLO
Possiamo osservare che anche l’analisi della varianza è impotente
davanti alla sovrapposizione dei due effetti della deriva e dei
differenti operatori, ed indica, giustamente, che un fattore
sistematico interviene sulla differenza delle medie successive,
senza poter dire se tale fattore dipende dagli operatori o dalla
deriva.
x x n x j x k x i x x ij x j x i x
k n k n k n
2 2 2 2
ij
j 1 i 1 j 1 i 1 j 1 i 1
j 1 i 1
Totale nk - 1 k n
SS TC xij x
2
J 1 i 1
Totale 49 3,65E-04
Si può, quindi, affermare, con un rischio d’errore del 20%, che le
differenze tra gli operatori sono causate da fattori sistematici,
mentre nulla si può dire per le differenze dovute alla successione
delle misure.
Come per ogni test statistico, anche per l’analisi della varianza è
necessario osservare criticamente il risultato ottenuto.