Sei sulla pagina 1di 62

Planejamento e Anlise de Experimentos

Aula 3
Felipe Campelo
http://www.cpdee.ufmg.br/~fcampelo
Programa de Ps-Graduao em Engenharia Eltrica
Belo Horizonte
Agosto de 2011
ANOVA para Fator nico
Anlise de Varincia para Fator nico
Science is simply common sense at its best,
that is, rigidly accurate in observation,
and merciless to fallacy in logic.
Thomas H. Huxley
1825-1895
Bilogo Ingls
ANOVA para Fator nico
Exemplo: resistncia a trao
Denio do problema
Resistncia a trao (RT) uma
caracterstica importante para determinados
tipos de papel;
Conjectura: RT inuenciada pelo
percentual de bra de madeira na
manufatura do papel;
Como testar?
ANOVA para Fator nico
Exemplo: resistncia a trao
Denio do problema
Resistncia a trao (RT) uma
caracterstica importante para determinados
tipos de papel;
Conjectura: RT inuenciada pelo
percentual de bra de madeira na
manufatura do papel;
Intervalo de interesse: 5 20%;
Ideia: investigar concentraes de 5, 10, 15 e 20%, seis
espcimes para cada caso;
Um nico fator (% de bra), a = 4 nveis (5, 10, 15, 20%)
e n = 6 rplicas (espcimes testados).
ANOVA para Fator nico
Exemplo: resistncia a trao
Randomizao
As 24 observaes devem ser coletadas em ordem
aleatria:
Evitar efeitos esprios, e.g., efeitos de aquecimento no
equipamento de teste, etc;
ANOVA para Fator nico
Exemplo: resistncia a trao
Anlise grca
Anlise grca sugere a existncia
de um efeito do fator na varivel de
resposta;
Simetria na distribuio amostral;
Varincia razoavelmente
consistente;
ANOVA para Fator nico
Exemplo: resistncia a trao
Modelo estatstico linear
Os dados observados podem ser descritos por um
modelo estatstico linear:
y
ij
=
j
+
ij
. .
Modelo de mdias
= +
j
+
ij
. .
Modelo de efeitos
_
i = 1, . . . , a
j = 1, . . . , n
onde a mdia geral,
j
representa o efeito do nvel
j , e
ij
o resduo (erro aleatrio);
ANOVA para Fator nico
Exemplo: resistncia a trao
Modelo estatstico linear
y
ij
= +
j
+
ij
_
i = 1, . . . , a
j = 1, . . . , n
Premissa:
ij
i.i.d. N
_
0,
2
_
;
Planejamento completamente aleatorizado:
Ordem aleatria das observaes;
Ambiente de coleta dos dados o mais uniforme possvel;
ANOVA para Fator nico
Modelo de efeitos xos e aleatrios
Modelo de efeitos xos
Nveis especicamente determinados pelo
experimentador;
Teste de hiptese sobre as mdias dos nveis testados;
Concluses se aplicam somente aos nveis testados;
Estimativa dos parmetros do modelo (,
j
,
2
);
ANOVA para Fator nico
Modelo de efeitos xos e aleatrios
Modelo de efeitos aleatrios (componentes de
varincia)
Nveis testados so amostras aleatrias de uma
populao de nveis possveis;
Concluses podem ser generalizadas para nveis no
testados;
Efeitos dos nveis
j
tratados como variveis aleatrias;
Teste de hipteses sobre a variabilidade dos
j
, e
estimativa desta variabilidade;
Modelo de Efeitos Fixos
O Modelo de Efeitos Fixos
Desenvolvimento
y
ij
= +
j
+
ij
_
i = 1, . . . , a
j = 1, . . . , n
Efeitos dos nveis como desvios da mdia geral:
a

i =1

i
= 0;
Modelo de Efeitos Fixos
O Modelo de Efeitos Fixos
Desenvolvimento
Somas de quadrados:
SS
T
=
a

i =1
n

j =1
_
y
ij

_
2
= n
a

i =1
(

y
i

)
2
. .
SS
E
+
a

i =1
n

j =1
_
y
ij

y
i
_
2
. .
SS
Nveis
Modelo de Efeitos Fixos
O Modelo de Efeitos Fixos
Desenvolvimento
Quadrados mdios:
MS
T
=
SS
T
an 1
MS
E
=
SS
E
a (n 1)
MS
Nveis
=
SS
Nveis
a 1
Somas de quadrados ponderadas pelos DoF
correspondentes;
Modelo de Efeitos Fixos
O Modelo de Efeitos Fixos
Desenvolvimento
Valores esperados:
E [MS
E
] =
2
E [MS
Nveis
] =
2
+
n

a
i =1

2
i
a 1
MS
E
um estimador no-tendencioso de
2
;
Se H
0
verdadeira, MS
Nveis
tambm
no-tendencioso;
Diferena pode ser usada para testar a hiptese de
igualdade dos nveis.
Modelo de Efeitos Fixos
O Modelo de Efeitos Fixos
Desenvolvimento
Se H
0
verdadeira,
F
0
=
MS
Nveis
MS
E
F
(a1),(ana)
Se H
0
falsa, MS
Nveis
superestima o valor de
2
;
Rejeitar H
0
se f
0
> f
,(a1),(naa)
;
Modelo de Efeitos Fixos
O Modelo de Efeitos Fixos
Anlise de Varincia
Tabela ANOVA para um experimento de fator nico,
modelo de efeitos xos:
Modelo de Efeitos Fixos
Exemplo: resistncia a trao
Anlise de Varincia
Baseado nos dados do exemplo:
O valor observado para a estatstica de
teste F implica na rejeio da hiptese
nula H
0
;
Mas quais mdias so diferentes de
quais?
Testes Post-hoc
Comparaes Mltiplas Post-hoc
Testes de mltiplas hipteses
Determinao de quais nveis so signicativamente
diferentes;
Comparao grca de mdias;
Teste LSD de Fisher;
Teste de Tukey;
Contrastes ortogonais;
Mtodo de Bonferroni-Dunn;
Mtodo de Benjamini-Hochberg;
Testes Post-hoc
Comparaes Mltiplas Post-hoc
Comparao grca de mdias
Sejam

y
1
, . . . ,

y
a
as mdias amostrais observadas para
cada nvel;
Premissa de homocedasticidade implica em:

y
i
N
_
( +
i
) ,
2
/n
_
Se H
0
verdadeira,
i
= 0 para todos os nveis;
Testes Post-hoc
Comparaes Mltiplas Post-hoc
Comparao grca de mdias
Sob H
0
, todos os efeitos devem se comportar como
amostras de uma distribuio N
_
,
2
/n
_
;
Estimadores dos parmetros do modelo:
=

y


i
=

y
i

=
_
MS
E
Testes Post-hoc
Comparaes Mltiplas Post-hoc
Comparao grca de mdias
Procedimento:
Traar a curva de uma distribuio N (

, MS
E
/n) (ou
t
n1
, se o tamanho amostral for pequeno);
Plotar localizao das mdias amostrais

y
i
no eixo
horizontal;
Observar desvios do comportamento esperado;
Testes Post-hoc
Comparaes Mltiplas Post-hoc
Comparao grca de mdias

y
1
= 10.0

y

= 15.96

y
2
= 15.7 MS
E
= 7.56

y
3
= 17.0

y
4
= 21.2
Testes Post-hoc
Comparaes Mltiplas Post-hoc
Teste LSD de Fisher
Comparao de todos os pares de mdias:
_
H
0
:
i
=
j
H
1
:
i
=
j
Estatstica de teste:
t
0
=

y
i

y
j
_
2MS
E
n
Testes Post-hoc
Comparaes Mltiplas Post-hoc
Teste LSD de Fisher
Menor diferena signicativa: |

y
i

y
j
| tal que
|t
0
| > t
(/2,ana)
:
LSD = t
(/2),ana
_
2MS
E
n
Um dado par de nveis considerado
signicativamente diferente se |

y
i

y
j
| > LSD;
Testes Post-hoc
Comparaes Mltiplas Post-hoc
Ajustes para teste de mltiplas hipteses
Problema com LSD: aumento do erro tipo I
Se k comparaes independentes so realizadas, o
nvel de signicncia geral da famlia de hipteses
(FWER) dado por:

f
= 1 (1 )
k
Tcnicas de correo para mltiplos testes: alteram o
nvel de signicncia dos testes individuais de forma a
controlar o FWER ou a taxa de falsas descobertas
(FDR):
Correo de Bonferroni-Dunn;
Correo de Benjamini-Hochberg;
Vericao de Premissas
Vericao de Premissas
Testes de adequao do modelo
Premissas do modelo:
Independncia;
Homoscedasticidade;
Normalidade;
y
ij
= +
j
+
ij
_
i = 1, . . . , a
j = 1, . . . , n
Testadas a partir da anlise dos resduos e
ij
:
e
ij
= y
ij

y
ij

y
ij
= +
i
=

y
i
Vericao de Premissas
Vericao de Premissas
Testes de adequao do modelo
Normalidade:
Plot de probabilidade normal;
Teste de Lilliefors;
ANOVA (efeitos xos): robusto
a violaes moderadas de
normalidade;
Vericao de Premissas
Vericao de Premissas
Testes de adequao do modelo
Independncia:
Teste de Pearson;
Plot dos resduos em ordem
de observao;
ANOVA sensvel a violaes
de independncia;
Randomizao apropriada tende a evitar estruturas
nos resduos;
Vericao de Premissas
Vericao de Premissas
Testes de adequao do modelo
Homoscedasticidade:
Teste F;
Plot de resduos versus

y
ij
(=

y
i
);
ANOVA balanceada: robusta a
violaes modestas;
Tende a ocorrer quando variabilidade funo do valor
medido
Ex: erro percentual em medies;
Vericao de Premissas
Vericao de Premissas
Testes de adequao do modelo
Estabilizao da varincia: transformao de dados;
Executar ANOVA em uma amostra transformada dos
dados;
Concluses se aplicam s populaes transformadas;
Transformaes usuais:
Raiz quadrada: y

ij
=

y
ij
(obs Poisson);
Logartmica: y

ij
= logy
ij
(obs Lognormal);
Arco-seno: y

ij
= arcsin

y
ij
(obs Binomial);
Transformaes genricas;
Vericao de Premissas
Vericao de Premissas
Outliers
Uma situao comum a
presena de uma observao
discrepante (outlier ) em uma
amostra aparentemente
regular;
Podem distorcer gravemente a
anlise
Vericar condies experimentais, erros de clculo,
codicao dos dados, etc;
No descartar a menos que haja uma boa razo
(no-estatstica) para tal;
Tcnicas no-Paramtricas
Tcnicas no-Paramtricas
Tcnicas no-paramtricas para Anlise de Varincia
Quando a premissa de normalidade no pode ser
vericada, pode ser interessante utilizar tcnicas
no-paramtricas;
No caso da Anlise de Varincia, uma alternativa que
no depende desta premissa o teste de
Kruskall-Wallis;
Outra opo o uso de tcnicas de reamostragem
(bootstrap, etc.);
Tcnicas no-Paramtricas
Tcnicas no-Paramtricas
Teste de Kruskall-Wallis
Substituio dos valores das observaes por ranks:
ordenao das observaes de forma crescente
substituio do valor pelo rank R
ij
;
no caso de empates, atribuio de valor mdio aos
ranks;
Seja R
i
a soma dos ranks para o nvel i :
R
i
=
n
i

j =1
R
ij
Tcnicas no-Paramtricas
Tcnicas no-Paramtricas
Teste de Kruskall-Wallis
A estatstica de teste dada por:
H =
1
S
2
_
a

i =1
R
2
i
n
i

N (N + 1)
2
4
_
com:
S
2
=
1
N 1
_
_
a

i =1
n
i

j =1
R
2
ij

N (N + 1)
2
4
_
_
Tcnicas no-Paramtricas
Tcnicas no-Paramtricas
Teste de Kruskall-Wallis
Se n
i
moderadamente alto (e.g., n
i
5), a estatstica
H distribuda aproximadamente como uma varivel

2
a1
sob H
0
;
Valores crticos podem ento ser derivados a partir
desta distribuio:
2
(,a1)
;
Blocos Completos Balanceados
Fatores Incmodos
Fatores incmodos
Fatores que inuenciam a resposta, mas em cujo efeito
o experimentador no est interessado;
Desconhecidos, incontrolveis: randomizao;
Conhecidos, incontrolveis: anlise de covarincia;
Conhecidos, controlveis: blocagem;
Blocagem utilizada para eliminar sistematicamente o
efeito de fatores incmodos;
Blocos Completos Balanceados
Exemplo: diferena entre pontas de prova
Denio do problema
Determinar se quatro pontas de prova
diferentes inuenciam na leitura de uma
mquina de avaliao de dureza;
Mquina pressiona ponta de prova em
um lingote de teste e mede
profundidade da fenda;
Observador decide obter 4 observaes para cada
ponta: 16 lingotes de teste necessrios;
Problema: diferenas entre os lingotes podem
contaminar os resultados (fonte de erro);
Blocos Completos Balanceados
Exemplo: diferena entre pontas de prova
Denio do problema
Erro experimental seria variabiidade das
pontas + variabilidade dos lingotes;
Deseja-se remover a variabilidade entre
os lingotes do erro;
Possibilidade: testar cada ponta uma
vez em cada um de 4 lingotes;
Este tipo de planejamento conhecido como
planejamento completo em blocos aleatorizados;
Blocos Completos Balanceados
Plan. Completo em Blocos Aleatorizados
RCBD
Plan. completo: cada bloco (lingote)
contm todos os nveis (pontas);
Plan. aleatorizado: a ordem dos
testes em cada bloco aleatria;
Unidades experimentais mais homogneas;
Melhora as comparaes
entre as pontas, eliminando
os efeitos da variabilidade
entre lingotes;
Blocos Completos Balanceados
Anlise do RCBD
Modelo estatstico linear
Caso geral: a nveis, b blocos;
Uma observao por nvel em cada
bloco, ordem aleatria;
y
ij
= +
i
+
j
+
ij
_
i = 1, . . . , a
j = 1, . . . , b

ij
N
_
0,
2
_
a

i =1

i
= 0
b

j =1

j
= 0
Blocos Completos Balanceados
Anlise do RCBD
Hipteses de teste
_
H
0
:
i
= 0, i = 1, , a
H
1
:
i
= 0 para algum i
Totais e mdias amostrais:
y
i
=
b

j =1
y
ij
y
j
=
a

i =1
y
ij
y

=
a

i =1
b

j =1
y
ij

y
i
=
y
i
b

y
j
=
y
j
a

y

=
y

ab
Blocos Completos Balanceados
Anlise do RCBD
Hipteses de teste
_
H
0
:
i
= 0, i = 1, , a
H
1
:
i
= 0 para algum i
Totais e mdias amostrais:
y
i
=
b

j =1
y
ij
y
j
=
a

i =1
y
ij
y

=
a

i =1
b

j =1
y
ij

y
i
=
y
i
b

y
j
=
y
j
a

y

=
y

ab
Blocos Completos Balanceados
Anlise do RCBD
Soma de quadrados
Partio da varincia:
SS
T
=
a

i =1
b

j =1
_
y
ij

_
2
= b
a

i =1
(y
i

)
2
. .
SS
nveis
+a
b

j =1
_
y
j

_
2
. .
SS
blocos
+. . .
. . . +
a

i =1
b

j =1
_
y
ij

y
i

y
j
+

y

_
2
. .
SS
E
Blocos Completos Balanceados
Anlise do RCBD
Quadrados mdios e graus de liberdade
Assim como no planejamento completamente
aleatorizado:
MS

=
SS

Graus de Liberdade
MS
T
=
SS
T
ab 1
MS
nveis
=
SS
nveis
a 1
MS
blocos
=
SS
blocos
b 1
MS
E
=
SS
E
(a 1)(b 1)
Blocos Completos Balanceados
Anlise do RCBD
Valores esperados e estatstica de teste
E [MS
nveis
] =
2
+
b
a

i =1

2
i
a 1
E [MS
blocos
] =
2
+
a
b

j =1

2
j
b 1
E [MS
E
] =
2
Estatstica de teste:
F
0
=
MS
nveis
MS
E
Blocos Completos Balanceados
Anlise do RCBD
ANOVA para um RCBD
Se H
0
verdadeira, F
0
F
a1,(a1)(b1)
A regio crtica a cauda superior da distribuio, e H
0
rejeitada se F
0
> F
,a1,(a1)(b1)
;
Blocos Completos Balanceados
Efeitos dos Blocos
Inferncias sobre blocos
Pode ser interessante comparar as mdias dos blocos:
Diferenas pequenas podem indicar no-necessidade
de blocagem;
Podemos usar F
0
= MS
blocos
/MS
E
?
Problema: randomizao foi aplicada apenas aos
nveis dentro de cada bloco;
Em geral pode ser usado como um indicador, mas no
como um teste convel.
Blocos Completos Balanceados
Exemplo: diferena entre pontas de prova
Dados coletados no experimento:
Para facilitar os clculos, os dados so transformados
y

ij
= 10(y
ij
9.5):
Blocos Completos Balanceados
Exemplo: diferena entre pontas de prova
Tabela ANOVA para o experimento
Anlise incorreta, desconsiderando blocagem:
Blocos Completos Balanceados
Anlise post-hoc
Comparaes mltiplas
Determinao de quais
i
so diferentes;
Similar ao caso do planejamento completamente
aleatorizado:
Teste LSD de Fisher;
Teste HSD de Tukey;
Comparaes grcas;
. . .
Necessidade de ajuste de signicncia para mltiplas
hipteses;
Blocos Completos Balanceados
Vericao da Validade do Modelo
Validao das premissas
Ateno particular para:
Premissa de normalidade;
Homogeniedade das varincias (entre blocos e nveis);
Interaes bloco-nvel;
Blocos Completos Balanceados
Vericao da Validade do Modelo
Blocos Completos Balanceados
Observaes Ausentes
Tratamento de observaes ausentes
Em alguns casos, pode haver observaes faltantes no
experimento
Falha na coleta dos dados, quebra de equipamento,
etc.
Blocos Completos Balanceados
Observaes Ausentes
Tratamento de observaes ausentes
Problema: nveis deixam de ser ortogonais aos blocos;
Duas abordagens para tratar este problema:
Anlise aproximada (estimao de observao);
Anlise exata;
Blocos Completos Balanceados
Observaes Ausentes
Anlise aproximada
Sejam y

, y

i
e y

j
os totais
computados com uma observao
faltante;
Deseja-se estimar a observao ausente x de forma a
minimizar a contribuio desta SS
E
;
SS
E
=
a

i =1
b

j =1
_
y
ij

y
i

y
j
+

y

_
2
Encontrar x que minimize SS
E
;
Blocos Completos Balanceados
Observaes Ausentes
Expandindo SS
E
:
SS
E
=
a

i =1
b

j =1
y
2
ij

1
b
a

i =1
_
_
b

j =1
y
ij
_
_
2

1
a
b

j =1
_
a

i =1
y
ij
_
2
+
1
ab
_
_
a

i =1
b

j =1
y
ij
_
_
2
= x
2

1
b
_
y

i
+ x
_
2

1
a
_
y

j
+ x
_
2
+
1
ab
_
y

+ x
_
2
+ R (Termos ind. de x)
Blocos Completos Balanceados
Observaes Ausentes
Fazendo SS
E
/x = 0:
SS
E
x
= 2
_
x
1
b
_
y

i
+ x
_

1
a
_
y

j
+ x
_
+
1
ab
_
y

+ x
_
_
= 0
x =
ay

i
+ by

j
+ y

(a 1)(b 1)
Para o exemplo dado,
x = y
23
=
4(1) + 4(6) 17
(3)(3)
= 1.22
Blocos Completos Balanceados
Observaes Ausentes
Anlise aproximada
A anlise pode ento ser realizada utilizando o valor
estimado x = 1.22, e reduzindo-se o nmero de graus
de liberdade do erro em 1;
Blocos Completos Balanceados
Observaes Ausentes
Anlise aproximada
Se mais de uma observao estiver ausente, a mesma
tcnica pode ser empregada: iguala-se o gradiente a
zero e estima-se os valores dos x
k
faltantes de forma a
minimizar SS
E
;
O nmero de graus de liberdade do erro reduzido em
um para cada valor faltante;
Leitura recomendada
Leitura recomendada
Leitura recomendada
Leitura recomendada
Essenciais
1 D.C. Montgomery, G.C. Runger, Applied Statistics and
Probability for Engineers, 3rd ed. - Captulo 13;
2 D.C. Montgomery, Design and Analysis of Experiments, 5th
ed. - Captulos 3, 4;
3 P. Li, Box-Cox Transformations: An Overview -
http://goo.gl/Xl1bK
Leitura recomendada
Leitura recomendada
Adicionais
1 D.C. Montgomery, G.C. Runger, Applied Statistics and
Probability for Engineers, 3rd ed. - Captulo 11;
2 J.P. Shaffer, Multiple Hypothesis Testing. Annual Review of
Psych., 46, 561-584, 1995 - http://goo.gl/xsEV0

Potrebbero piacerti anche