Sei sulla pagina 1di 25

Anlise da Varincia

(ANOVA)

ANOVA
Anlise da Varincia (ANOVA) um mtodo para
testar a igualdade de trs ou mais mdias populacionais,
baseado na anlise das varincias amostrais.

Os dados amostrais so separados em grupos segundo


uma caracterstica (fator).

Fator (ou tratamento): uma caracterstica que


permite distinguir diferentes populaes umas das
outras. Cada fator contm dois ou mais grupos
(classificaes).

2
Exemplos:
(1) amostras do consumo de combustvel para 3 tipos de
carros, de fbricas (marcas) diferentes.

Neste caso temos amostras de 3 populaes de carros.

Temos um nico fator: A marca. Este fator se separa em 3


tratamentos, cada uma das marcas.

(2) Amostras do consumo de combustvel para 3 tamanhos


de motor (1,5 L, 2,2 L e 2,5 L) e tipo de transmisso (manual
ou automtica).
Temos dois fatores:
- O fator tamanho do motor, que contm trs categorias: 1,5
L, 2,2 L e 2,5 L.
- O fator tipo de transmisso, que contm duas categorias:
manual e automtica. 3

ANOVA de um critrio (um fator)


SUPOSIES:

Populaes normalmente distribuida

Populaes tem mesma varincia (ou mesmo desvio


padro).

Amostras so aleatrias e mutuamente


independentes.

As diferentes amostras so obtidas de populaes


classificadas em apenas uma categoria.
4
O estatstico George E. P. Box mostrou
que os resultados so confiveis desde
que o tamanho das amostras so iguais
(ou quase iguais), a diferena entre as
varincias podem ser de tal ordem que
a maior seja nove vez a menor.

Se a distribuies so fortemente no
normais devemos utilizar outros mtodos,
por exemplo, o teste de Kruskal-Wallis.

Hipteses do ANOVA de um critrio


HIPTESE NULA: a mdia de todas as populaes so iguais,ou
seja, o tratamento (fator) no tem efeito (nenhuma variao em mdia
entre os grupos).

HIPTES ALTERNATIVA: nem todas a mdias populacionais so


iguais, ou seja:
Pelo menos uma mdia diferente, isto , existe efeito do
tratamento.
No quer dizer que todas as mdias so diferentes (alguns pares
podem ser iguais)

H 0 : 1 2 3 ... k

H1 : Nem todas as mdias populacion ais so iguais.


6
ANOVA de um fator
H 0 : 1 2 3 ... k
H1 : Nem todos os k so iguais

Todas a mdias so iguais:


Ho verdadeira
(Sem efeito do tratamento)

1 2 3
7

ANOVA de um fator
H 0 : 1 2 3 ... k
H1 : Nem todos os k so iguais

Ao menos uma mdia diferente:


Ho NO verdadeira
(Existe efeito do tratamento)

or

1 2 3 1 2 3
8
Exemplo: Para k amostras (tratamentos)
amostra 1 amostra 2 amostra 3 ... amostra k
observao 1 x11 x 12 x13 ... x 1k
observao 2 x 21 x 22 x 23 ... x 2k
observao 3 x 31 x 32 x 33 ... x 3k
. . . . . .
. . . . . .
observao n k x n1 1 x n2 2 x n3 3 x n kk
...

mdia amostral x1 x2 x3 ... xk


2 2 2 2
varincia amostral s1 s2 s3 ... sk
n1x1 n 2 x 2 ... n k x k
x mdia sobre todos o valores amostrais (grande mdia)
n1 n 2 ... n k
x1 x 2 ... x k
para amostras de tamanhos iguais : x 9
k

Note que o livro texto define as amostras


(tratamentos) em linhas e as observaes em
colunas

Correspondncia de notao entre livro texto e slides


livro texto slides
observaes y ij x ij
mdia das observaes k yk xk
grande mdia y x

10
A ideia bsica de ANOVA: partio da variabilidade

Variabilidade
dos grupos
(entre grupos)
Variabilidade total
Variabilidade
devido a outros
fatores (dentro
dos grupos)

11

Decomposio das observaes em contribuies de


diferentes fontes:

Observao = grande mdia + desvio devido ao tratamento + resduo

x ij x (x j x) (x ij x j )

12
Exemplo

Foram selecionados vrios


automveis de 3 modelos
diferentes e neles colocados a
mod. 1 mod. 2 mod. 3
mesma quantidade de gasolina. A
tabela ao lado mostra a 254 234 200
quilometragem obtida pelos 263 218 222
automveis. Existe diferena entre 241 235 197
de distncia mdia percorrida pelos 237 206
diferentes tipos de automveis? 1
Fator (tratamento): tipo de
251
atutomvel
Nveis: modelo1, modelo 2, modelo
3

13

Temos:

modelo 1 : x1 249.2
modelo 2 : x 2 229
modelo 3 : x 3 206.25

n1x1 n 2 x 2 n 3 x 3 5.249,2 3.229 4.206,25


grande mdia : x 229,833
n1 n 2 n 3 534

Por exemplo : o elemento da amostra 1 x 31 241


pode ser decomposto assim :
x 31 x (x1 x) (x 31 x1 )
241 229.83 (249.2 - 229.83) (241 249.2) 229.83 19.367 8.2

14
Para o nosso exemplo:

Observaes = grande mdia + efeitos do tratamento + resduos

254 234 200 229.83 229.83 229.83 19.367 - 0.83 - 23.58 4.8 5 200
263 218 222 229.83 229.83 229.83 19.367 - 0.83 - 23.58 13.8 11 222

241 235 197 229.83 229.83 229.83 19.367 - 0.83 - 23.58 8.2 6 197

237 206 229.83 229.83 19.367 - 23.58 12 . 2 206
251 229.83 19.367 1.8

15

Medida de variao: varincia amostral

x i x 2
(que depende de uma soma de quadrados)
S2 i
n 1

Variao total = variao entre as amostras + variao dentro das


amostras

Em smbolos: SQ(total) = SQ(entre amostras)+SQ(dentro das


amostras)
SQ(total) ou soma total de quadrados : uma medida da variao
total (em torno de x ) em todos os dados amostrais combinados.
SQ(entre) : uma medida da variao entre as mdias amostrais
combinados.
Tambm conhecida como SQ(tratamento).
SQ(dentro) ou SQ(erro) : soma de quadrados que representa a variabilid ade
comum a todas a populaes em considera o. 16
Variao total

SQ(total) = SQ(dentro) + SQ(entre)


k nj

SQ(total) (X ij X )2
j1 i1

Onde:
k = nmero de amostras (tratamentos)
nj = nmero de observaes na amostra j
Xij = i-sima observao da amostra j
X = mdia de todos os valores (grande mdia) 17

Variao entre amostras

SQ(total) = SQ(entre) + S(dentro)


k
SQ(entre) n j ( X j X )2
j1

Onde:
k = nmero de amostras
nj = nmero de elementos da amostra j
Xj = mdia da amostra j
X = grande mdia
18
Variao entre amostras
k
SQ(entre) n j ( X j X )2
j1

Variao devido a SQ(entre)


diferena entre amostras.
QM(entre)
k 1
Quadrado mdio entre =
SQ(entre)/graus de liberdade

i j
19

Variao dentro das amostras


SQ(total) = SQ(entre) + SQ(dentro)
k nj

SQ(dentro) (X ij X j ) 2
j1 i 1

Onde:
k = nmero de amostras
nj = nmero de elementos da amostra j
Xj = mdia da amostra j
Xij = i-sima observao na amostra j
20
Variao dentro das amostras
k nj

SQ(dentro) (X ij X j )2
j1 i1

Soma-se a variao dentro de


cada amostra e ento soma- SQ(dentro)
se todas as amostras QM(dentro)
nk
n n1 n2 n3 ... nk
Quadrado mdio dentro =
j SQ(dentro)/graus de liberdade 21

Variao dentro das amostras


n1 n2 nk
k nj x i1 x1 x i2 x 2 x ik x k
2
SQ(dentro) (Xij X j ) (n1 1) i 1 (n 2 1) i 1 ... (n k 1) i 1
j1 i 1 (n1 1) (n 2 1) (n k 1)


2 2 2 2
(n 1 1)s1 (n 2 1)s 2 (n 3 1)s 3 ... (n k 1)s k

Ou seja:

k
2
n
i 1
i 1 s i
QM(dentro)
n k
22
As variaes entre, dentro e total
SQ(entre)
S2entre
k 1
SQ(dentro)
S2dentro
nk
SQ(total)
S2 total
n 1

k nmero de amostras

n n1 n2 n3 ... nk (nmero total de elementos) 23

Tabela ANOVA 1- fator

Fonte da SQ gl Varincia Razo F


Variao
Entre SQE S2entre
SQE k-1 S2entre=
k-1 F= 2
S dentro
Dentro 2
SQD
SQD n-k S dentro=
n-k
SQT =
Total n-1
SQE+SQD
k = nmero de amostras (grupos)
n = soma do nmero de elementos de todas as amostras
gl = graus de liberdade 24
ANOVA 1-fator
H0: 1= 2 = = k
H1: pelo menos uma das mdias diferente

Estatstica de teste:

S2entre Varincia entre amostras


F 2
S dentro Varincia dentro das amostras
graus de liberdade: Numerador: gl1 = k 1
Denominador: gl2 = n k

k = nmero de amostras
25
n = n1 + n1 + n3 + + nk

ANOVA de um fator
Clculos com tamanhos amostrais diferentes
n1 x1 n 2 x 2 ... n k x k
x
k 2 n1 n 2 ... n k
n i x i x a mdia de todos os valores
i 1
k 1 amostrais combinados
Grau de Liberdade
Fteste
k 2
Numerador: gl1 = k -1
n i 1s i Denominador: gl2 = n - k
i 1 k
n k

n n
i 1
i

SQ(tratamento) Soma de quadrados


Componentes-chave: SQ(erro) Representa a variao
Varincia(...) = SQ(...)/nmero: uma Mdia Quadrtica26
27

28
Valores crticos so obtidos da tabela da distribuio F.

Como o numerador maior que o denominador


o teste ser unilateral a direita.

Rejeite H0 se F > FC.


= .05

0
No rejeite H0 Rejeite H0
FC

29

Exemplo
Foram selecionados vrios
automveis de 3 modelos
diferentes e neles colocados a mod. 1 mod. 2 mod. 3
mesma quantidade de gasolina.
254 234 200
A tabela ao lado mostra a
quilometragem obtida pelos 263 218 222
automveis. Existe diferena 241 235 197
entre de distncia mdia 237 227 206
percorrida pelos diferentes tipos 251 216 204
de automveis? Faa o teste
com nvel de significncia de
0.05?
1 Fator (tratamento): tipo de
atutomvel
Nveis: modelo1, modelo 2,
modelo 3 30
Examplo de anova de 1 fator:

Distancia
tipo 1 tipo 2 tipo 3 270
254 234 200 260
263 218 222
241 235 197
250 X1
240
237 227 206
251 216 204 230
220

X2 X

210
x1 249.2 x 2 226.0 x 3 205.8
X3
200
x 227.0 190

1 2 3 31
Modelo do automvel

mod. 1 mod. 2 mod. 3 X1 = 249.2 n1 = 5


254 234 200 X2 = 226.0 n2 = 5
263 218 222
X3 = 205.8 n3 = 5
241 235 197
237 227 206 n = 15
X = 227.0
251 216 204 k=3
SQE = 5 (249.2 227)2 + 5 (226 227)2 + 5 (205.8 227)2 = 4716.4
SQD = (254 249.2)2 + (263 249.2)2 ++ (204 205.8)2 = 1119.6

S2entre = 4716.4 / (3-1) = 2358.2 2358.2


F 25.275
S2dentro = 1119.6 / (15-3) = 93.3 93.3
32
ANOVA 1-fator
H0: 1 = 2 = 3 Estatstica de teste:
H1: nem todos j so iguais
S 2 entre 2358.2
= 0.05 F 2 25.275
S dentro 93.3
gl1= 2 gl2 = 12

Valor crtico: Fc = 3.89


Deciso:
Rejeitar H0 com = 0.05
= .05 Concluso:
H evidncia que pelo
0 No Rejeita H0 uma das mdias j
F = 25.275
rejeita H0
Fc = 3.89 diferente das outras. 33

ANOVA 2- fatores
Dois fatores de interesse: A e B com vrios nveis (categorias).

A B

A1 A2 A3 ... Ar B1 B2 B3 ... Bk
Exemplo: Amostras do consumo de combustvel para 3 tamanhos
de motor (1,5 L, 2,2 L e 2,5 L) e tipo de transmisso (manual ou
automtica).
Temos dois fatores:

(A) O fator tamanho do motor, que contm trs categorias: 1,5 L


(A1), 2,2 L (A2) e 2,5 L (A3).

(B) O fator tipo de transmisso, que contm duas categorias:


manual (B1) e automtica (B2). 34
Fator A A1 A2 A3
Fator B
X111 X121 X131
X112 X122 X132
B1 X113 X123 X133
.
X114 . X134
. .
. . X135
. .
. . .
.
X211 X221 X231
X212 X222 X232
B2 X213 X223 X233
.
. x224 X234
.
X225 .
. .
. 35

Correspondncia de notao entre slides e livro


texto:

- O fator A (A1, A2,..., Ak) corresponde aos blocos


(Bloco 1, Bloco 2,...,Bloco k) no livro texto.

- O fator B (B1, B2,...,Bk) corresponde aos


tratamentos (tratamento 1,..., tratamento k)no
livro texto.

36
ANOVA 2 fatores: A e B

r = nmero de categorias do fator A

c = nmero de categorias do fator B

n = nmero de repeties em cada clula

n = nmero total de observaes (n = rkn)

Xijk = valor da k-sima observao na categoria i


do fator A e na categoria j do fator B

37

Fontes de variao
SQT = SQA + SQB + SQAB + SQE Grau de
liberdade:
SQA r1
Variao no fator A

SQT SQB c1
Variao no fator B
Variao total
SQAB
Variao devido a interao (r 1)(c 1)
entre A e B
n-1
SQE rc(n 1)
Variao aleatria (Erro)
38
Soma de Quadrados para cada variao:

r c n
Variao total: SQT (Xijk X )2
i1 j1 k 1

Variao do fator A : r
SQA cn ( X i.. X )2
i1

Variao do fator B : c
SQB rn ( X.j. X )2
j1
39

Variao devido a interao:


r c
SQAB n ( Xij. X i.. X.j. X )2
i1 j1

Variao devido ao erro aleatrio

r c n
SQE ( X ijk X ij. )2
i 1 j1 k 1

40
r c n
ONDE: X
i1 j1 k 1
ijk

X Grande mdia
rcn
c n

X
j1 k 1
ijk

X i.. Mdia do i - simo nvel do fator A (i 1, 2, ..., r)


cn
r n

X
i1 k 1
ijk
X .j. Mdia do j - simo nvel do fator B (j 1, 2, ..., c)
rn
n

X
k 1
ijk
X ij. Mdia da clula ij
n
r = nmero de nveis do fator A
c = nmero de nveis do fator B 41
n = nmero de repeties em cada clula

Quadrados mdios (Varincias)


SQA
QMA (Quadrado Mdio do fator A)
r 1

SQB
QMB (Quadrado Mdio do fator A)
c 1

SQAB
QMAB (Quadrado Mdio da interao entre A e B)
(r 1)(c 1)

SQE
QME (Quadrado Mdio do erro)
rc(n'1)
42
ANOVA de 2 fatores: Estatstica de teste

Teste-F para o efeito do fator A


H0: 1.. = 2.. = 3.. =
QMA Rejeite H0
H1: Nem todos os i.. so iguais F
QME se F > Fc

Teste-F para o efeito do fator B


H0: .1. = .2. = .3. =
QMB Rejeite H0
H1: Nem todos os .j. so iguais F
QME se F > Fc

Teste-F para o efeito da interao


H0: a interao de A e B zero
QMAB Rejeite H0
H1: a interao de A e B no zero F se F > Fc
QME
43

Tabela ANOVA 2 fatores


Soma
Fonte de de graus de Quadrados Mdios F
Variao Quadra liberdade (varincias)
dos
QMA
Fator A SQA r1 QMA = SQA/(r 1)
QME
QMB
Fator B SQB c1 QMB = SQB /(c 1)
QME

AB QMAB= QMAB
SQAB (r 1)(c 1)
(Interao) SQAB/(r 1)(c 1) QME

Erro SQE rc(n 1) QME = SQE/rc(n 1)

Total SQT n1 44
ANOVA 2 fatores: procedimento
Incio

Test for an interaction between the


two factors. Use:
QMAB
F= QME

Existe efeito PARE. No considere


devido a interao SIM os efeitos de qualquer
dos dosis fatortes (Rejeite H0: Efeito da um dos fatores sem
? interao nulo.) considerar o efeito do outro

NO (no rejeite H0 : efeito da


interao nulo.)
Teste para o efeito do fator linha (A)
QMA
F= QME

Teste para o efeito do fator coluna (B)


QMB
F= QME 45

ANOVA de dois fatores


Clculos individuais em categorias de acordo com dois
fatores. Em outras palavras: os valores amostrais so
categorizados de duas maneiras. Ex. Na corrida de NY:

Fatores: idade e sexo.

Tempo (s) para corredores da Maratona NY


Idade
21-29 30-39 40 ou mais
13615 14677 14528
Masculino

18784 16090 17034


14256 14086 14935
10905 16460 14996
Sexo

12077 20808 22146


16401 15357 17260
Feminino

14216 16771 25399


15402 15036 18647
15326 16297 15077
46
12047 17636 25898
ANOVA de dois fatores
Clculos individuais em categorias de acordo com dois
fatores. Em outras palavras, os valores amostrais so
categorizados de duas maneiras. Ex. Na corrida de NY:

Fatores: idade e sexo. Subcategorias (clulas), neste


caso seis clulas
Tempo (s) para corredores da Maratona NY
Idade
21-29 30-39 40 ou mais
Masculino

1 2 3
Sexo

Feminino

4 5 6

47

ANOVA de dois fatores


Anova: fator duplo com repetio
Tempo (s) para corredores da Maratona NY
Idade
RESUMO 21-29 30-39 40 ou mais Total 21-29 30-39 40 ou mais
Masculino 13615 14677 14528
Masculino

Contagem 5 5 5 15 18784 16090 17034


Soma 69637 82121 83639 235397 14256 14086 14935
Mdia 13927,4 16424,2 16727,8 15693,1 10905 16460 14996
Sexo

12077 20808 22146


Varincia 9087754,3 6962640,2 10125758,2 9165617,8
16401 15357 17260
Feminino

14216 16771 25399


Feminino 15402 15036 18647
Contagem 5 5 5 15 15326 16297 15077
Soma 73392 81097 102281 256770 12047 17636 25898
Mdia 14678,4 16219,4 20456,2 17118
Varincia 2762103,3 1115302,3 24117287,7 14392308,6

Total
Contagem 10 10 10
MQ(sexo)
Soma 143029 163218 185920 MQ(idade)
Mdia 14302,9 16321,8 18592
MQ(interao)
Varincia 5423270,3 3601847,5 19080511,1
MQ(erro)
ANOVA
Fonte da variao
Amostra
SQ
15226837,6
gl MQ
1 15226837,6
F
1,69
valor-P F crtico
0,21 4,26
Excel:
Colunas 92087146,9 2 46043573,4 5,10 0,01 3,40
Interaes 21040438,9 2 10520219,4 1,17 0,33 3,40 Ferramenta >
Dentro 216683384,0 24 9028474,3

Total 345037807,4 29
Anlise de dados >
48
ANOVA Fator Duplo com repetio
ANOVA de dois fatores
Procedimento para o clculo (continuao)
Passo 2. Efeitos de Linha/Coluna
Linha: Teste H0, No h qualquer efeito do fator linha (As
mdias das linhas so iguais)

F = MQ(sexo) / MQ(erro)

ANOVA
Fonte da variao SQ gl MQ F valor-P F crtico
Sexo Amostra 15226837,6 1 15226837,6 1,69 0,21 4,26
Idade Colunas 92087146,9 2 46043573,4 5,10 0,01 3,40
Interao Interaes 21040438,9 2 10520219,4 1,17 0,33 3,40
Erro Dentro 216683384,0 24 9028474,3

Total 345037807,4 29

49

ANOVA de dois fatores


Concluso do exemplo:

Com base nos dados amostrais, conclumos que os tempos


parecem ter mdias desiguais para diferentes categorias de
idade, mas os tempos parecem ter mdias iguais para
ambos os sexos.

50

Potrebbero piacerti anche