Sei sulla pagina 1di 22

DOE-LEZIONE INTRODUTTIVA

Rossella Berni
LEZIONE BASE

Docente: Rossella BERNI

Dipartimento di Statistica, Informatica, Applicazioni ”G.Parenti”


DiSIA

Università di Firenze

Email: rossella.berni@unifi.it

sito-web: http://local.disia.unifi.it/berni

1
Primi concetti del DISEGNO SPERIMENTALE (e ANOVA)
Consideriamo inizialmente n osservazioni (sperimentali) ottenute effettuando un es-
perimento con variabile di risposta quantitativa continua (Y), in cui le unità di os-
servazione sono associate casualmente secondo k gruppi o k livelli di un fattore,
che si suppone (ed è questo che si vuole verificare) abbia influenza sulla variabile
dipendente (o di risposta) Y.
Introduciamo quindi il concetto di Fonte di variabilità.
Il nostro scopo iniziale è quello di capire se la variabilità complessiva dello studio
effettuato, e quindi della variabile di risposta quantitativa (Y), può essere suddivisa
secondo distinte fonti di variabilità che su di essa hanno effetto.

2
Esempio delle Plantule (Biometria- Salvi e Chiandotto, 1977)-
nota: unico esempio fuori ”tema”
Si vuole controllare l’azione di un fitormone sull’allungamento del caule
(fusto, stelo) di plantule di una stessa specie. Si hanno quindi 4 diversi
tipi (livelli) di fitormone, applicati a n=20 plantule (campione), es-
tratte casualmente da un semenzaio. Ciascuna modalità di fitormone
è assegnata casualmente a 5 plantule.
Esempio iniziale; Y=crescita (cm)

Fitormone A B C D
19 17 16 11
17 17 18 13
20 15 19 16
16 20 16 11
19 19 14 11

3
Devianza Within (entro); fonte accidentale

(yij − µi)2
XX
DW = (1)
i j
Devianza Between (tra): fonte sistematica

(µi − µ)2ni
X
DB = (2)
i
dove le ȳi i = 1, ....., k sono k medie campionarie, calcolate su k campioni
estratti da k popolazioni distribuite normalmente, e quindi anch’ esse
distribuite normalmente con E(ȳi) = µi.

4
Esempio plantule- segue
ȳA = 18.2; ȳB = 17.6; ȳC = 16.6; ȳD = 12.4; ȳ = 16.2
Risultati dell’analisi della varianza per i dati delle plantule

Fonte var. Dev. g.l. Var F-value


Fitormone 102.8 3 34.27 9.09∗∗
Errore 60.4 16 3.77 -
Totale 163.2 19 -

F (α = 0.01; ν1 = 3; ν2 = 16) = 5.29

5
ANOVA ONE-WAY
Si può ipotizzare che la generica osservazione sperimentale yij sia cosı̀
esprimibile:
yij = µi + eij i = 1, ....., k j = 1, ....., ni (3)
dove k sono i livelli del fattore considerato, ni indica la numerosità delle
replicazioni entro il generico i − mo gruppo o livello. La componente
µi è esprimibile anche come somma di:

µi = µ + αi i = 1, ....., k (4)
Dove αi è l’effetto sistematico del generico livello i − mo del fattore
sperimentale; la componente eij rappresenta invece la componente di
variabilità accidentale imputabile alla j −ma replicazione entro lo i−mo
livello.

Inoltre si assume che:

eij IID ∼ N (0, σ 2)

6
ANOVA ONE-WAY-segue
Per valutare se vi sia un effetto significativo del fattore coinvolto nel
disegno sperimentale qui studiato (disegno completamente randomiz-
zato), si ricorre ai test di ipotesi e al concetto di ipotesi nulla H0 e di
ipotesi alternativa: H1. Per il modello (3) si ha:

H0 : αi = 0; ∀i (5)
e
H1 : αi 6= 0 ∗ ∗ ∗ ∗per − almeno − un − i (6)

7
ANOVA ONE-WAY-segue
Supponiamo, per semplicità, che ni = n ∀i.

Si può dimostrare che entrambe le Devianze sono tra loro indipendenti


e ortogonali.

Inoltre, ognuna ( DB e DW ) esprimibile come somma di quadrati (Sum


of Squares), i.e. (k − 1) e (N − k) rispettivamente.

Se vale H0 ***ed è stata effettuata correttamente la randomizzazione***,


la DB risulta una stima alternativa alla componente accidentale, stima
alternativa a DW . Se invece NON vale H0, la distribuzione delle (k − 1)
variabili casuali normali standardizzate al quadrato è χ2 non centrale
con (k−1) gradi di libertà, con parametro di non centralità cosı̀ definito:
(µi − µ)2n
P
(7)
k−1
si noti come in formula (7) tutto dipenda dalla componente additiva
αi .
8
Il test di riferimento è il test F (Test di Fisher), con statitica test:

DB /(k − 1)
F = (8)
DW /(N − k)

se vale (H0) la statistica test (8) si distribuisce secondo una dis-


tribuzione di Fisher con (k − 1; N − k) gradi di libertà: F(α;k−1,N −k),
ricordando che la distribuzione Fisher è esprimibile come il rapporto di
due distribuzioni χ2 (centrali) divise per i rispettivi gradi di libertà.

9
II esempio-(Logothetis e Wynn, 1989)
Si abbiano n = 16 osservazioni sperimentali relative alla misurazione
in µA (microampere) dell’ emissione di luce (Y) per tubi catodici (4
tipi). Il fattore sperimentale di interesse è rappresentato dal ”tipo di
fosforo” con k = 4 livelli (A,B,C,D) con cui sono trattati i tubi catodici.
Il disegno è completamente casualizzato.
Disegno completamente casualizzato

Tubo catod. 1 2 3 4
A(25) C(4) D(9) A(28)
B(22) A(12) C(2) B(11)
C(18) B(3) A(10) D(20)
C(22) D(10) B(5) D(15)

10
II esempio-segue
Risultati dell’analisi della varianza per i dati relativi allo studio dell’emissione
di luce

Fonte var. Dev. g.l. F-value


fosforo 168.5 3 0.8
errore 841.5 12 -
Totale 1010.0 15 -

Valore tabulato: F(3,12;0.05) = 3.49.

11
III esempio-(Logothetis e Wynn, 1989)
Disegno a Blocchi Randomizzati Completi; esempio ”didattico” dal
precedente.
Disegno a blocchi randomizzati completi-BRC

Tipo F./Tubo cat. 1 2 3 4


A A(25) C(4) D(9) A(28)
B B(22) A(12) C(2) B(11)
C C(18) B(3) A(10) D(20)
D D(15) D(10) B(5) C(22)

12
III esempio-segue

Risultati di ANOVA per i dati del disegno BRC

Fonte var. Dev. g.l. F-value


fosforo 168.5 3 3.7
tubo catodico 703.5 3 15.3??
errore 138.0 9 -
Totale 1010.0 15 -

valori tabulati: F(3,9;0.10) = 2.81; F(3,9;0.01) = 6.99.

13
Modello di ANOVA (two-way) per disegno BRC

Il modello statistico di ANOVA sottostante ad un disegno a blocchi


randomizzati completi è:

yij = µ + αi + bj + eij j = 1, ....., 4; i = 1, ....., 4 (9)


dove αi indica l’effetto del generico i − mo livello del fattore sperimen-
tale, bj indica l’effetto del generico j − mo livello del fattore blocco ( a
livelli fissi), che è anche Fattore sub-sperimentale.
IMPORTANTE: l’additività del modello implica che un disegno BRC
si può pianificare sse si puo’ ipotizzare la non esistenza di una asso-
ciazione tra fattore sperimentale e fattore blocco; in sostanza di deve
poter ipotizzare a priori che non vi sia **interazione** tra fattore sper-
imentale e fattore blocco.

14
Disegno Fattoriale completo- Esempio da: Montgomery (1991)
I dati riguardano n = 36 osservazioni sperimentali relative alla mis-
urazione (in ore) della durata di vita della batteria (Y). I due fattori
sperimentali di interesse, A e B, entrambi a tre livelli, rappresentano
rispettivamente il tipo di materiale per la batteria (1,2,3) e la temper-
atura, espressa in gradi centigradi: 15◦, 70◦, 125◦.

Disegno Fattoriale completo

Mat./Temp. 15 70 125
1 130;155;74;180 30;40;80;75 20;70;82;58
2 150;188;159;126 136;122;106;115 25;70;58;45
3 138;110;168;160 174;120;150;139 96;104;72;60

15
Disegno Fattoriale completo: modello statistico Con assenza di inter-
azione del I-ordine tra A e B:

yijr = µ + αi + βj + eijr j = 1, ..p; i = 1, ..q; r = 1, .., t (10)

nel momento in cui è necessario verificare la presenza dell’interazione,


il modello corrispondente risulta:

yijr = µ + αi + βj + (αβ)ij + eijr j = 1, ..p; i = 1, ..q; r = 1, .., t (11)

16
Concetto di Interazione
Risultati Fattoriale Completo
Esempio No.2- DoE
Analisi della Varianza- two way
• Si vuole confrontare la resistenza alla rottura dei laminati prodotti con 3 tipi di legno
(fattore A) e 3 tipi di colla (fattore B). Per ogni combinazione sperimentale si effettuano 5
prove (replicazioni) per un totale di N=45 osservazioni sperimentali che vengono
valutate tramite un test di sollecitazione per misurarne il carico di rottura (Y= valori
della pressione di rottura)
(fonte “Probabilità e statistica per l’ingegneria e le scienze”, Ross M.S., Apogeo, 2003)

DISEGNO SPERIMENTALE FATTORIALE BILANCIATO COMPLETO CON DUE FATTORI A e B CIASCUNO A 3


LIVELLI e 5 REPLICAZIONI
LEGNO/TIPO COLLA 1 2 3

196; 208; 247 214; 216; 235 258; 250; 264


A 216; 221 240; 252 248; 272
216; 228; 240; 215; 217; 235 246; 247; 261
B 224; 236 219; 241 250; 255
230; 242; 232; 212; 218; 216 255; 251; 261
C 244; 228 224; 222 258; 247
POSSIBILI FONTI DI VARIABILITA’ DA VERIFICARE:
Effetto (principale) del tipo di legno su rottura
Effetto (principale) del tipo di colla su rottura
Effetto di Interazione (AB del I ordine) tra i due fattori
Ulteriore risultato: valutazione della situazione sperimentale migliore (più forte alla rottura) tra quelle considerate
ANOVA-Parametrizzazione cornered point
Supponiamo di avere dati relativi ai tempi di coagulazione del sangue (misurato in
secondi) di 24 animali sottoposti casualmente a quattro tipi di dieta (A,B,C,D).
Il modello di ANOVA e’ il seguente:

yij = µ + αi + eij (12)


α1 = 0

j = 1, ..6; i = 1, ..4;
ANOVA one-way; risultati corner point based
coeff estimate s.e. t-value p-value
int. 6.100 1.18 51.55 < 0.000
dietaA 0 - - -
dietaB 5.000 1.53 3.27 0.0038
dietaC 7.000 1.53 4.58 0.0001
dietaD 2.99e-15 1.45 2.06e-15 1.0000
residual 2.366 (20 df); SS fattore DIETA: 228(3 df)**
commento: dietaB e dietaC effetto significativo sul t.m. di coagulazione rispetto
alla dietaA (livello di riferimento- intercetta); nessun effetto dietaD. DietaB ha un
effetto medio (incremento) sul t.m. di 5sec; DietaC ha effetto medio (incremento)
di 7sec.
NOTA: si tenga ben presente la distinzione tra ANOVA e scomposizione della SS, e
ANOVA con stima dei coefficienti del fattore.
17
References per i dati

Logothetis, N., Wynn, H. P. (1989). Quality through design- Experi-


mental design, off-line quality control and Taguchi’s contributions.
Oxford, UK: Clarendon Press.

Montgomery D.C. Design and analysis of experiments, 5th ed., New


York, U.S.A.: John Wiley & Sons, Inc., 2001.

Salvi, F. e Chiandotto B. (Ed.), (1978), Biometria, principi e metodi,


Piccin Editore, Padova.

18

Potrebbero piacerti anche