Sei sulla pagina 1di 77

STRUMENTI PER

L’ANALISI STATISTICA DEI


DATI
Perché Testare le Ipotesi?

• I Test delle Ipotesi sono un insieme di metodi


statistici che, quando usati correttamente, offrono
potenti meccanismi per:

• Gestire incertezze

• Mettere in dubbio assunzioni

• Gestire il rischio di errori decisionali


Perché Testare le Ipotesi?
Fare il Test delle Ipotesi quando:

• Non si è sicuri delle conclusioni


• Le differenze sono troppo piccole per determinare se
sono significative
• Le conclusioni possono essere impopolari
• Validazioni di conclusioni grafiche per il management
Perché Testare le Ipotesi?
Production in Tonnes

1550

1500

1450
Production in Tonnes

1400

1350 Day Shift

1300 Night Shift

1250

1200

1150

1100
1

3
5
7
9

11
13
15
17

19
21
23

25
27
29
31

33
35
37
39

41
43
45

47
49
51
Tim e in Weeks

C’è una differenza significativa tra le medie (varianze)


della produzione per il turno di giorno e il turno di notte?
Guardiamo gli istogrammi.
Perché Testare le Ipotesi?

C’è una differenza significativa tra le medie (varianze)


della produzione per il turno di giorno e il turno di notte?
Facciamo il test delle ipotesi!
Scegliere il Test Appropriato
¦ Ipotesi
coinvolte

¦ Proporzioni ¦ Medie ¦ Varianze

¦ Più di 2
¦ Dati ¦ 1 campione: ¦ 2 campioni:
¦ 2 campioni campioni:
conteggiabili ¦ 1 sample t test ¦ 2 variances
¦ ANOVA

¦ Più di 2
¦ Dati ¦ Dati non campioni:
¦ Test chi- accoppiati: accoppiati:
square ¦ test for equal
¦ Paired t test ¦ 2 sample t test variances
Test delle Ipotesi
Il Test delle Ipotesi risponde alle domande:
• “A è differente da B?” dove A & B sono due diversi gruppi di dati

• “La differenza è significativa?”

I P-Valori sono usati per misurare quando una differenza è o non è


statisticamente significativa

Differente Non Differente

P-Value 0.00 0.05 1.00

Iniziare sviluppando l’Ipotesi Nulla e l’Ipotesi Alternativa.


Ipotesi Nulla, H0
• Campioni dalla stessa popolazione
• Non c’è differenza tra le popolazioni

Esempi:
Due proporzioni sono uguali H0: p1 = p2
La media eguaglia un numero H0: m = m0
Due medie sono uguali H0: m1 = m2
Due varianze sono uguali H0: s12 = s 22

NOTA: L’Ipotesi Nulla dice sempre “nessuna differenza” o =


Ipotesi Alternativa, HA
• C’è differenza tra le popolazioni
Può essere
• bilaterale: i parametri non sono uguali
• unilaterale: un parametro è maggiore (minore) dell’altro

Esempi:
HA: m1 ¹ m2 HA: s12 ¹ s22
HA: m1 > m2 HA: s12 > s22
HA: m1 < m2 HA: s12 < s22
Livello di significatività alfa
• Il rischio che si prende concludendo che Ho è falsa
quando Ho è vera .
• Un rischio del 5% (a pari a 0.05) si usa
frequentemente nel DMAIC.
• Che livello di rischio prendete quando concludete
che:
• La resistenza media allo scoppio di un lotto di valvole è
superiore ad un certo livello minimo?
• Un nuovo sistema di saldatura è migliore di un sistema
precedente?
Procedura Generale

1. Definire l’Ipotesi Nulla


2. Definire l’Ipotesi Alternativa
• Unilaterale o Bilaterale
3. Scegliere il livello di significatività, a (0.05)
4. Scegliere il test appropriato
5. Verificare le assunzioni per il test
6. Calcolare il test statistico
Procedura Generale
7. Calcolare il p-valore: la probabilità che il test
statistico abbia almeno lo stesso valore di quello
calcolato quando H0 è vera.
Distribuzione del Test Statistico
Sotto H0 P-valore - l’area
sotto la curva

p/2 p/2 p

C C*

Test Bilaterale Test Unilaterale


C* - valore critico
Procedura Generale
8. Se c’è poca probabilità che il test si verifichi sotto
l’ipotesi nulla, rifiutiamo H0

• Rifiutiamo H0 se il p-valore è < alfa

• Se a è < 0.05 allora:
• Rifiutiamo l’Ipotesi Nulla con un livello di rischio 0.05 di
prendere una decisione sbagliata.
Procedura Generale

Il p-valore è la vostra fiducia


nell’ipotesi nulla.
Concetti Base
Popolazione:
• L’intero gruppo di oggetti che devono essere esaminati
Può essere:
• Finita - Tutti gli impiegati ad agosto 2015.
• Infinita - Tutti i ricoveri in un ospedale.
Campione:
• Un sottogruppo rappresentativo di una popolazione usato per
trarre conclusioni su di essa
Dati accoppiati:
• Quando si comparano 2 gruppi che sono naturalmente
accoppiati; vale a dire che entrambe le letture si riferiscono
allo stesso fenomeno proveniente da sottogruppi accoppiati e
ordinati (es: stesso oggetto prima e dopo un trattamento)
Esempio
Un call center serve tre grandi aziende TLC.
Si registrano gli esiti delle risposte alle problematiche dei clienti.
La proporzione tra problemi risolti dall’operatore, problemi risolti dall’esperto e
problemi non risolti è indipendente dall’azienda erogatrice di servizi TLC? (simile
tra le aziende?)

Y = # risposte al giorno
X1= Esito della risposta
X2= Azienda TLC
Azienda TLC Risolti_operatore Risolti_Esperto Non_Risolti
Vodafone 50 20 8
Wind 32 27 7
3 35 9 5

Data set: Chi square V1


Scegliere il Test Appropriato
¦ Ipotesi
coinvolte

¦ Proporzioni ¦ Medie ¦ Varianze

¦ Più di 2
¦ Dati ¦ 1 campione: ¦ 2 campioni:
¦ 2 campioni campioni:
conteggiabili ¦ 1 sample t test ¦ 2 variances
¦ ANOVA

¦ Più di 2
¦ Dati ¦ Dati non campioni:
¦ Test chi- accoppiati: accoppiati:
square ¦ test for equal
¦ Paired t test ¦ 2 sample t test variances
Test Chi-Square
• H0: Non c’è differenza nelle proporzioni tra due fattori.
• HA: C’è differenza nelle proporzioni tra due fattori.
• Scegliere il livello di significatività a (0.05).
• Test Chi-square : Il livello di un fattore è indipendente dal
livello dell’altro?
I dati sono conteggiabili per due fattori, entrambi con numerosi
livelli.
• I conteggi sono registrati in una tavola:
• - Le righe sono i livelli di un fattore,
• - Le colonne sono i livelli dell’altro fattore.
• I conteggi devono essere > 5 (requisito)
Test Chi-Square
• La statistica chi-square è basata sulla differenza tra
conteggi osservati (o) e attesi (e) :
( o  e ) 2
2  
e
• I valori attesi sono calcolati moltiplicando i totali di
righe e colonne e dividendo per il totale complessivo.

• Calcolare il p-valore comparando questa statistica ad


una distribuzione chi-square con Gradi di Libertà =
(# righe-1)*(# colonne-1).
• Rifiutare H0 se il p-valore <α.
Calcolo
Comandi Minitab :
Stat>Tables>Chi-Square Test
Conclusioni

Poiché p = 0.086 è maggiore di 0.05, non possiamo


rifiutare l’ipotesi nulla al rischio prefissato. Non
abbiamo evidenze sufficienti per affermare che
diverse TLC implicano diverse proporzioni per la
risoluzione dei problemi dei Clienti.
Confrontare un campione con un target -
esempio
• Un’azienda produce accelerometri per la gestione
dello scoppio degli air-bag. La specifica prevede che
essi non debbano generare l’input di scoppio con
media al di sotto dei 10g.
• Un campione casuale di 5 elementi preso da un lotto
di produzione ha dato il seguente esito per
l’emissione del segnale Decelerazione
11,183
• Possiamo accettare il lotto?
10,056
10,014
11,571
Data set: Air bag v1 10,303
Scegliere il Test Appropriato
¦ Ipotesi
coinvolte

¦ Proporzioni ¦ Medie ¦ Varianze

¦ Più di 2
¦ Dati ¦ 1 campione: ¦ 2 campioni:
¦ 2 campioni campioni:
conteggiabili ¦ 1 sample t test ¦ 2 variances
¦ ANOVA

¦ Più di 2
¦ Dati ¦ Dati non campioni:
¦ Test chi- accoppiati: accoppiati:
square ¦ test for equal
¦ Paired t test ¦ 2 sample t test variances
1-Sample t-Test
• H0: µ = µ0
• HA: µ ≠ µ0 (bilaterale) o
HA: µ > µ0 (unilaterale) o
HA: µ < µ0 (unilaterale)
• Selezionare α.
• Il t-test verifica l’ipotesi che la media sia pari ad un certo
numero.
• Assunzioni:
• campione casuale
• dati normali
• (per dimensione campionaria > 30 è corretto assumere la normalità)
1-Sample t-Test
• Calcolo della t-statistica:
x  0
t
s/ n
• Calcolare il p-valore comparando la
distribuzione con una distribuzione t con n-1
gradi di libertà.

• Rifiutare H0 se il p-valore è < a.


Calcolo
H0: m = 10 HA: m > 10

Test di Normalità: p-valore = 0.197


I dati possono essere considerati Normali

Comandi Minitab :
Stat>Basic Statistics>1-Sample t
Options:Alternative:Grather Than

OUTPUT:
One-Sample T: Decelerazione

Test of mu = 10 vs > 10

95% Lower
Variable N Mean StDev SE Mean Bound T P
Dec norm 5 10,626 0,708 0,317 9,951 1,98 0,060
Conclusioni

Poiché p = 0.060 è maggiore di 0.05, non possiamo


rifiutare l’ipotesi nulla e concludiamo che il lotto
deve essere scartato.
Homogeneity of Variance
• Molti test statistici per le differenze tra le medie
assumono che le varianze siano uguali.
• Potete dire a MINITAB di non fare questa assunzione
e le risposte saranno comunque corrette.
• Se non assumete l’uguaglianza delle varianze il
calcolo dei gradi di libertà può diventare complesso.
Esempio: omogeneità della varianza
I tempi di ordinazione (ore) per due
siti web differenti vengono registrati. Website A Website B
Order Time Order Time
Testare l’ipotesi che le varianze dei
tempi di tali ordinazioni siano uguali. 22 29
25 21
24 21
29 26
27 19
23 23
22 11
23 24
21 28
20 20
22 21
23 30
19 17
24 17
Data set: HOV v1 20 23
Scegliere il Test Appropriato
¦ Ipotesi
coinvolte

¦ Proporzioni ¦ Medie ¦ Varianze

¦ Più di 2
¦ Dati ¦ 1 campione: ¦ 2 campioni:
¦ 2 campioni campioni:
conteggiabili ¦ 1 sample t test ¦ 2 variances
¦ ANOVA

¦ Più di 2
¦ Dati ¦ Dati non campioni:
¦ Test chi- accoppiati: accoppiati:
square ¦ test for equal
¦ Paired t test ¦ 2 sample t test variances
Homogeneity of Variance
• H0:   
2
1
2
2

• HA:   
2 2
1 2

• Selezionare a
• Il test di omogeneità della varianza confronta le varianze
di due o più gruppi.
• Questo test deve essere fatto prima di altri test che richiedono
l’uguaglianza delle varianze nei diversi gruppi.
• Assunzioni:
• Campioni casuali e indipendenti
• Dati Normali
Homogeneity of Variance
• La statistica F è il rapporto delle varianze dei
campioni:
s12
F 2
s2

• Calcolare il p-valore tramite il confronto con una


distribuzione F con n1-1 e n2-1 gradi di libertà, dove n1
e n2 sono i numeri di osservazioni nei 2 campioni.

• Rifiutare H0 se il p-valore è < a.


Comandi
Comandi Minitab : 2 variances
Stat>Basic Statistics>2 Variances
OPPURE
Più di 2 varianze:
Stat>ANOVA> Test for Equal Variances.
Nota: i dati devono essere impilati .

Minitab calcola 2 p-valori:


• F-Test o Bartlett’s Test per dati normali
• Levene’s Test per qualunque tipo di dato continuo
Se i dati possono essere considerati normali usare
F-Test (2 varianze) oppure
Bartlett’s Test (>2 varianze).
Calcoli
Test per la normalità:
Website A p-valore = 0.434 Website B p-valore = 0.788

Test for Equal Variances


Level1 Website A
Level2 Website B
ConfLvl 95.0000
Bonferroni confidence intervals for standard deviations
Lower Sigma Upper N Factor Levels
1.86571 2.65832 4.50571 15 Website A
3.54907 5.05682 8.57104 15 Website B
F-Test (normal distribution)
Test Statistic : 0.276
P-Value : 0.022
Levene's Test (any continuous distribution)
Test Statistic: 3.671
P-Value : 0.066
Conclusioni
• I dati possono essere considerati normali poiché i
p-valori per i websites A & B sono >0.05

• Uso dell’ F-Test

Poiché il p-valore = 0.02 è minore di 0.05, rifiutiamo


l’ipotesi nulla e concludiamo, con un 2% di rischio di
sbagliare, che c’è una differenza significativa tra le
varianze dei due websites.
Esempio: confrontare le medie di 2 gruppi
di dati BasOpen ModOpen BasClose ModClose
• Si vuole testare la differenza per i 22,46 23,3 100,27 98,88
23,05 22,51 98,7 98,18
tempi di chiusura e di apertura di 22,38 23,53 98,5 94,66
uno switch nel caso del design 22,5 23,23 97,16 96,01
attuale (Bas) e di un design 21,91 22,27 100,02 100,74
semplificato (Mod). 22,25 21,97 100,55 96,14
23,32 22,66 100,05 95,46
23,05 20,51 99,49 98,3
• Vengono collezionati 38 dati per i 21,9 23,05 98,25 96,3
22,9 21,59 100,26 93,83
design attuali e confrontati con 10 23,53 97,32
elementi del design semplificato. 24,03 100,1
24,57 98,54
21,9 104,09
• Le specifiche sono:
23,41 96,52
Time LSL USL 24,33 99,01
Open time [ms] 18 26
Close time [ms] 90 105
Data set: Switches
Scegliere il Test Appropriato
¦ Ipotesi
coinvolte

¦ Proporzioni ¦ Medie ¦ Varianze

¦ Più di 2
¦ Dati ¦ 1 campione: ¦ 2 campioni:
¦ 2 campioni campioni:
conteggiabili ¦ 1 sample t test ¦ 2 variances
¦ ANOVA

¦ Più di 2
¦ Dati ¦ Dati non campioni:
¦ Test chi- accoppiati: accoppiati:
square ¦ test for equal
¦ Paired t test ¦ 2 sample t test variances
2-Sample t-Test
• H0: m1 = m2

• HA: m1 ¹ m2 (bilaterale) oppure

HA: m1 > m2 o HA: m1 < m2 (unilaterale)


• Selezionare a.
• 2-Sample t-Test: le medie di due popolazioni sono
uguali .
• Richiede campioni casuali o dati normali
(per dimensioni campionarie >30 si assume la normalità).
• Rifiuto H0 se il p-valore < a
2-Sample t-Test
• Calcolare la statistica t:
• Il numeratore è la differenza tra le medie dei
campioni
• Il denominatore è la misura della variazione delle
medie

• Calcolare il p-valore. (Minitab calcola i gradi di


libertà per una distribuzione t)

• Pre-requisiti: dati normali, varianze omogenee


Verifica delle Assunzioni
Verifica delle Assunzioni
Calcoli
Comandi Minitab :
Stat>Basic Statistics>2-Sample t
Samples in different columns
First: BasOpen
Second: ModOpen

NON FARE CHECK SU “ASSUME


EQUAL VARIANCES”.
Output
Conclusioni

• Per i tempi di apertura non risultano differenze


statistiche significative.

• Per i tempi di chiusura il design modificato sembra


essere più centrato rispetto alle specifiche.
Esempio
Un’azienda di aspirapolveri
House Brand A Brand B Difference
desidera testare due modelli A 4.2 4.4 0.2
di aspirapolvere. La stessa B 3.1 3.2 0.1
persona pulisce 15 case per C 4.8 4.9 0.1
D 5.9 5.9 0.0
due settimane di fila; la E 5.8 5.8 0.0
prima settimana con il F 6.4 6.5 0.1
modello A, la seconda con il G 2.2 2.2 0.0
H 4.3 4.5 0.2
modello B registrando la I 5.7 5.7 0.0
quantità in grammi di J 3.3 3.6 0.3
K 3.8 3.8 0.0
polvere aspirata. L 2.7 2.8 0.1
C’è differenza tra i modelli? M 2.5 2.6 0.1
N 3.5 3.4 -0.1
O 3.7 3.8 0.1

Data set :4- paired t v1.MTW


Scegliere il Test Appropriato
¦ Ipotesi
coinvolte

¦ Proporzioni ¦ Medie ¦ Varianze

¦ Più di 2
¦ Dati ¦ 1 campione: ¦ 2 campioni:
¦ 2 campioni campioni:
conteggiabili ¦ 1 sample t test ¦ 2 variances
¦ ANOVA

¦ Più di 2
¦ Dati ¦ Dati non campioni:
¦ Test chi- accoppiati: accoppiati:
square ¦ test for equal
¦ Paired t test ¦ 2 sample t test variances
Paired t-Test
• H0: m = 0 ( la differenza tra le medie è zero)
• HA: m ¹ 0 (bilaterale) o
• HA: m > 0 o HA: m < 0 (unilaterale)
• Selezionare a.
• Paired t-test testa la differenza tra le medie tra popolazioni.
• Assunzioni:
• Campionamento casuale
• Dati normali (per campioni >30 assumiamo la normalità)
• I dati dai 2 campioni sono accoppiati.
• Fare la differenza tra ogni coppia.
• Calcolare la statistica t sulle differenze.
• Calcolare il p-valore dalla distribuzione t con gradi di libertà = numero di
coppie -1.
• Rifiutare H0 se il p-valore è < a.
Calcoli
Comandi Minitab :
Stat>Basic Statistics>Paired t
First Sample ‘Brand A’
Second Sample ‘Brand B’
Options: Alternative: Not Equal

OUTPUT:
Paired T-Test and CI: Brand A, Brand B
Paired T for Brand A - Brand B
N Mean StDev SE Mean
Brand A 15 4.127 1.333 0.344
Brand B 15 4.207 1.322 0.341
Difference 15 -0.0800 0.1014 0.0262

95% CI for mean difference: (-0.1362, -0.0238)


T-Test of mean difference = 0 (vs not = 0): T-Value = -3.06 P-Value = 0.009
Conclusioni
• H0: m = 0 HA: m ¹ 0
• Poiché il p-valore = 0.009 < 0.05, rifiutiamo l’ipotesi nulla.
C’è una differenza significativa tra i due modelli di
aspirapolvere.
• Confrontiamo questo risultato con il 2-sample t-test fatto
prima.
• Molta variazione è dovuta a fattori quali animali
domestici, dimensione delle case, etc. Il paired t-test
elimina questi fattori.
• Esempio: Alcune case – non ci sono cucce
Altre case – hanno le cucce
Esempio: comparare le medie di più di 2
campioni
Si vogliono confrontare le prestazioni (resistenza a rottura)
di 4 tipi di membrane.
MembraneA MembraneB MembraneC MembraneD
95,50 90,50 86,30 89,50
103,20 98,10 84,00 93,40
93,10 97,80 86,20 87,50
89,30 97,00 80,20 89,40
90,40 98,00 83,70 87,90
92,10 95,20 93,40 86,20
93,10 95,30 77,10 89,90
91,90 97,10 86,80 89,50
95,30 90,50 83,70 90,00
84,50 101,30 84,90 95,60

Data set : Membrane


Scegliere il Test Appropriato
¦ Ipotesi
coinvolte

¦ Proporzioni ¦ Medie ¦ Varianze

¦ Più di 2
¦ Dati ¦ 1 campione: ¦ 2 campioni:
¦ 2 campioni campioni:
conteggiabili ¦ 1 sample t test ¦ 2 variances
¦ ANOVA

¦ Più di 2
¦ Dati ¦ Dati non campioni:
¦ Test chi- accoppiati: accoppiati:
square ¦ test for equal
¦ Paired t test ¦ 2 sample t test variances
One-Way ANOVA
• H0: le medie dei gruppi sono tutte uguali.
• HA: non tutte le medie dei gruppi sono uguali.
• Scegliere il livello di significatività, a (0.05).
• One-way ANOVA testa le differenze tra le medie di 3 o più gruppi.

Residuo = Valore Osservato – media del gruppo


• Assunzioni:
• Campioni casuali
• I residui sono normali
• La varianza è costante
One-Way ANOVA

Variazione Variazione Dovuta + Variazione Dovuta al


Totale = al Fattore Rumore
SST SSF SSE
Somma Somma dei Quadrati dei Somma dei Quadrati
Totale dei Fattori tra Gruppi dell’Errore tra i Gruppi
Quadrati
One-Way ANOVA
• Quando H0 è vera, si ottengono 2 stime della varianza
della popolazione, s2:
• 1. MSF - Somma della Media dei quadrati dovuti al
fattore
- La varianza delle medie del fattore
• 2. MSE - Somma della media dell’errore casuale
- Varianza tra ogni livello del fattore

• MSF/MSE ha una distribuzione F con un appropriato


grado di libertà.
La tavola dell’ANOVA
Source DF SS MS F P
Factor k-1 SSF MSF=SSF/(k-1) MSF/MSE p-value
Error k(n-1) SSE MSE=SSE/(k(n-1))
Total kn-1 SST

k: gruppi differenti SS: somma dei quadrati


n: responso per ciascuno MS: medie dei quadrati
DF: gradi di libertà F: statistica F
P: p-valore

Rifiutare H0 se il p-valore < a.


Calcolo dell’ANOVA
Comandi Minitab : Membrana Resistenza
MembraneA 95,5
MembraneA 103,2
Nota: occorre impilare i dati (stack) MembraneA 93,1
MembraneA 89,3
MembraneA 90,4
Stat>ANOVA>One-way MembraneA 92,1
Response; Resistenza MembraneA 93,1
Factor: Membrana MembraneA 91,9
Store residuals:Fare Check MembraneA 95,3
MembraneA 84,5
MembraneB 90,5
Comparisons: selezionare MembraneB
MembraneB
98,1
97,8
Fare Check su Tukey’s
Porzione di dati impilati
family error rate

Graphs: selezionare
Fare Check su Box Plots
Risultati dell’ANOVA

Medie dei Campioni


Risultati dell’ANOVA – box plot
Tukey test
Intervalli di confidenza delle differenze
che non contengono lo zero implicano
differenze significative
Risultati dell’ANOVA - residui
I residui non evidenziano particolari trend.
Verificare le Assunzioni
Le varianze sono omogenee.
Conclusioni

• Poiché il p-valore = 0.000 < 0.05 per la variazione


tra i gruppi, c’è differenza significativa per la
resistenza delle membrane.

• Il test di Tukey dà i dettagli per le differenze.


Sommario degli Strumenti
Strumento Usare quando si cercano differenze… Pre-requisiti
Chi-Square In proporzioni in una tavola con 2 - Dati enumerabili
fattori - Dati per ogni cella > 5

1 Sample Tra la media di un campione e una - Campione casuale


t-test media obiettivo - Dati normali
- Campione> 30,
assumiamo normalità
2 sample Tra medie di due campioni - Campione casuale
t-test - Dati normali
- Campione> 30,
assumiamo normalità
- Testare varianze uguali
Paired t-test Tra medie di due campioni con dati - Campione casuale
accoppiati - Dati normali
- Campione> 30,
assumiamo normalità
- Dati accoppiati
Homogeneity of Variance Tra varianze di due o più campioni - Campione casuale
- Dati normali
- Campione> 30,
assumiamo normalità
ANOVA Tra medie di più di 2 campioni - Campioni casuali
indipendenti
- Residui normali
- Varianza costante
ANOVA a 2 vie
Quando si usa:
• Ci sono due Xs (fattori) ognuno a numerosi livelli
• Un responso, Y.
• Estensione della one-way ANOVA

Perché si usa?
• Guarda a tutte le possibili combinazioni dei due
Xs.
ANOVA a 2 vie
Esperimento pianificato con due fattori ognuno a livelli fissati.
Visualizzare i risultati in una tabella:
• Fattore riga
• Fattore colonna
1R. H0 fattore riga: le medie della riga sono uguali.
2R. HA fattore riga: le medie della riga non sono tutte uguali.
1C. H0 fattore colonna: le medie delle colonne sono uguali.
2C. HA fattore colonna: le medie delle colonne non sono tutte
uguali.
3. Scegliere il livello di significatività α (0.05).
Tavola dell’ANOVA
Source DF SS MS F P

Row Factor I-1 SSR MSR=SSR/(I-1) FR = MSR/MSE pR


Column Factor J-1 SSC MSC=SSC/(J-1) FC = MSC/MSE pC
Error (I-1)(J-1) SSE MSE=SSE/((I-1)(J-1))
Total IJ-1 SST

MSR è una stima di s2 basata sull’ipotesi nulla delle righe.


- Somma delle medie dei quadrati delle righe
MSC è una stima di s2 basata sull’ipotesi nulla delle colonne.
- Somma delle medie dei quadrati delle colonne
MSE è una stima di s2 basata sulla somma dei quadrati degli errori indipendente dall’’ipotesi
nulla.
- Somma delle medie dei quadrati degli errori

FR e FC hanno distribuzione F.
pR and pC sono i p-valori.
Rifiutare l’ipotesi nulla se minori di a.
Variazione
Variazione Variazione Variazione Variazione
totale
= Dovuta al + Dovuta al Fattore + Dovuta al
Fattore riga colonna Rumore

SST SSR SSC SSE


Somma Totale Somma dei Somma dei Somma dei Quadrati
dei Quadrati Quadrati Riga Quadrati Colonna dell’Errore

Assunzioni:
• Campioni Casuali
• I residui sono approssimativamente normali
• Le varianze sono uguali
• Se non si ripete la misurazione: nessuna interazione tra i fattori riga e colonna.
(Le interazioni si possono determinare con le replicazioni.)
2 way ANOVA: esempio
• Si ritiene che la resistenza allo stress
meccanico di un componente di Formula
1 sia influenzata dalla grandezza di sue
due dimensioni critiche, A e B. ¦B
• Il test è effettuato assegnando tre valori,
codificati con 1,2 e 3 sia alla dimensione
A sia alla dimensione B.
¦A
• Si sono quindi costruiti 3 campioni per
ogni combinazione (27 pezzi) e sono stati
sottoposti a test.
• I risultati delle prove, espressi in milioni
di cicli, sono di seguito riportati.
2 way ANOVA: esempio

A B Durata A B Durata A B Durata


1 1 1,93 1 2 2,73 1 3 4,56
1 1 3,72 1 2 3,21 1 3 6,46
1 1 2,45 1 2 1,57 1 3 4,29
2 1 4,51 2 2 6,07 2 3 4,17
2 1 3,54 2 2 3,03 2 3 6,15
2 1 4,95 2 2 4,13 2 3 5,69
3 1 6,77 3 2 4,19 3 3 3,16
3 1 8,69 3 2 5,93 3 3 1,72
3 1 7,16 3 2 7,61 3 3 2,53

Data set Formula 1


2 way ANOVA: esempio

Comandi Minitab™ :
Stat>ANOVA>Two way…
Response: Durata; Row Factor:A;Column Factor:B
Display Means: check
Store Residuals: check
Graphs: check all boxes

Nota:
I dati per la Two-way Anova si vedono
meglio in tabella (non impilati).
Minitab™ richiede che i dati per
l’analisi siano impilati.
2 way ANOVA: output Minitab

Risultano significativi A e l’interazione tra A e B


2 way ANOVA: box plot
2 way ANOVA: effetti principali
2 way ANOVA: interazioni
2 way ANOVA: interazioni
Contour plot
Verifica delle assunzioni - residui

Potrebbero piacerti anche