Sei sulla pagina 1di 51

ANLISE DE VARINCIA

Comparao de mdias para


mais de duas populaes

Conhecemos os testes de hipteses para a


mdia/proporo de uma populao, para a diferena entre
mdias/propores de duas populaes e para a
comparao de varincias de duas populaes.
Agora, o procedimento de teste de hipteses ser utilizado
para comparar as mdias de mais de duas populaes.
A anlise de varincia ou ANOVA um teste de hipteses
para mdias de mais de duas populaes.

Aplicaes:
Comparar a eficincia de diversas marcas de remdios para
o tratamento de uma mesma doena.
Comparar o consumo em km/litro de um modelo de carro
abastecido com combustveis do mesmo tipo, porm de
marcas diferentes.
Comparar a eficincia de uma lavoura tratada com diferentes
fertilizantes.
Comparar o tempo de reao de uma pessoa em funo do
estmulo de luz de quatro cores diferentes.

Exemplo:

Amostra 1
5
6
5
4

Amostra 2
7
9
7
6
6

Amostra 3
8
6
10
11
9
10

Boxplot
12

Dados

10

2
Amostra 1

Amostra 2

Amostra 3

A diferena entre as trs mdias apenas conseqncia


da variao amostral?
A diferena entre as mdias das amostras
conseqncia da variao amostral ou uma evidncia
da diferena entre as mdias das populaes?

A variabilidade total das amostras pode ser dividida em duas partes:


Variabilidade devido ao fato de que as populaes so
diferentes, denominada variabilidade entre (entre as
populaes).
Quanto maior for a variabilidade entre, mais forte a
evidncia de que as mdias das populaes so diferentes.
Variabilidade devido diferenas dentro de cada amostra,
denominada variabilidade dentro.
Quanto maior for a variabilidade dentro, maior ser a
dificuldade para concluir que as mdias das populaes so
diferentes.

Exigncias da Anova

As populaes tm a mesma varincia.


As amostras so retiradas de populaes com distribuio
normal.
As amostras so independentes.

O teste de hipteses para comparao de k amostras


estabelecida da seguinte forma:
H 0 : 1 2 ... k

H1: Nem todas as populaes tm a mesma mdia.

A distribuio F conduzir a deciso de aceitar o rejeitar a


hiptese nula, comparando o valor da estatstica de teste F

Varincia entre

se2
F
2
Varincia dentro sd
com o valor F tabelado correspondente ao nvel de significncia
adotado.

F grande (maior que o valor tabelado) indica que


Varincia entre > Varincia dentro.
Logo F grande evidncia contra a hiptese nula. Logo, se
F > F tabelado rejeitamos a hiptese nula.
F pequeno (menor que o valor tabelado) indica que
Varincia entre < Varincia dentro.
Logo F pequeno evidncia a favor da hiptese nula. Logo, se
F F tabelado no rejeitamos a hiptese nula.

Varincia dentro
k

s
2
d

2
(
n

1
)
s
j j
j 1

nT k

SQD

nT k

nj: tamanho da j-sima amostra.


k: nmero de amostras.
s2j: varincia da j-sima amostra.
nT: nmero total de dados.
SQD: Soma de Quadrados Dentro

Varincia entre
k

s
2
e

2
n
(
x

x
)
j j
j 1

k 1

x j : mdia do grupo j
x : mdia geral
k : nmero de amostras
n j : tamanho da j sima amostra
SQE : Soma de Quadrados Entre

SQE

k 1

Estatstica F
Varincia entre

s
SQE / k 1 QME
F

Varincia dentro s
SQD / nT 1 QMD

QME: Quadrado Mdio Entre


QMD: Quadrado Mdio Dentro

2
e
2
d

Varincia total
nT

s
2
T

2
(
x

x
)
i
i 1

nT k

SQT

nT k

nT

SQT (xi x) 2 SQD SQE


i 1

x : mdia geral
nT : nmero total de dados
SQT : Soma de Quadrados Total

Tabela de Anlise de Varincia (ANOVA)

Fonte

gl

SQ

QM

Entre

k-1

SQE

QME=SQE/(k-1)

QME
QMD

Dentro nT-k

SQD

QMD=SQD/(nT-1)

Total

SQT

nT-1

Exemplo:

Amostra 1
5
6
5
4

Amostra 2
7
9
7
6
6

Amostra 3
8
6
10
11
9
10

Resultados:

Medida

Amostra 1 Amostra 2 Amostra 3

Mdia

Varincia 0,67

1,500

3,2

nT 15 k 3 x 7,27

Tabela de Anlise de Varincia (ANOVA)

Fonte

gl

SQ

QM

Entre

38,93

38,93/2=19,47

19,47/2=9,73

Dentro 12

24,00

24,00/12=2,00

Total

62,93

14

- F = 9,73 indica que a variao entre as amostras 9


vezes maior que a variao dentro das amostras.

- valor-p = P(F > 9,73) = 0,003


- Para =0,05 (5% de significncia): rejeitamos a hiptese
nula.
- Para =0,01 (1% de significncia): rejeitamos a hiptese
nula.

Exerccio
A anemia uma doena que afeta muitas pessoas e que pode ter
diversas origens. Pretendendo-se avaliar possveis diferenas entre
diferentes tratamentos para esta doena, planejou-se uma experincia
com 120 indivduos anmicos, divididos aleatoriamente em trs grupos
de 40, aos quais se atribuiu cada um dos tratamentos.
O primeiro tratamento era constitudo apenas por uma dieta rica em
ferro. O segundo tratamento combinava um suplemento de ferro com a
dieta do primeiro tratamento e o ltimo acrescentava um complexo
vitamnico. No sentido de avaliar possveis diferenas entre os
tratamentos, efetuou-se uma ANOVA com base nos valores de
hemoglobina dos 120 indivduos aps um perodo de 3 meses de
tratamento.

a) Estabelea as hipteses de interesse.


b) Construa a tabela ANOVA sabendo que
SQD=121,4

SQT=122,9

c) Qual a concluso ao nvel de 5% de significncia?

Exerccio
Um estudo foi realizado para verificar se o consumo mdio de um
modelo de carro abastecido com combustveis de marcas diferentes
era o mesmo ou no.
30 carros foram abastecidos com o combustvel da marca A, 50 carros
com o combustvel da marca B, 20 carros com o combustvel da marca
C e 37 carros com o combustvel da marca D. O consumo foi medido
em km por litro.
Os dados esto representados no boxplot abaixo.

Boxplot

Consumo (km por litro)

15,0

12,5

10,0

7,5

5,0
A

a) Estabelea as hipteses de interesse.


b) Construa a tabela ANOVA sabendo que
SQD=384,2

SQE=34,7

c) Qual a concluso ao nvel de 5% de significncia?


d) O valor-p para este teste 0,009. Qual a concluso ao nvel
de 1% de significncia?

Comparaes Mltiplas

Suponha que atravs da Anova para comparao de k mdias


conclumos que a hiptese nula deve ser rejeitada ao nvel alfa de
significncia, ou seja, conclumos que nem todas as populaes
tm a mesma mdia.

Neste caso devemos usar um dos testes de Comparaes Mltiplas


para identificar qual ou quais grupos tem mdias diferentes das
demais.

Testes de Comparaes Mltiplas: teste de Tukey e teste de


Scheff.

Teste de Tukey
Utilizado quando se deseja comparar todos os pares de mdias de k
populaes, adotando-se um nico nvel de confiana.
H0 : i j 0
H1: i j 0

i j

O teste consiste em calcular um valor (Dcrt), acima do qual, a diferena


entre duas mdias amostrais (em mdulo) significativamente diferente
de zero.

Dcrit

qk ,nT k
2

1 1
QMD

n n
j
i

onde qk , nT k representa o valor tabelado (da distribuio da amplitude


studentizada studentized range) associado ao nvel de significncia
adotado.

Distribuio da Amplitude Studentizada

P qr k ,v nT k qtab 0,05
k
nT -k

Exemplo: comparao de 4 mdias

12

14

19

24

18

12

17

30

13

21

Total

Total

30

39

57

54

180

Mdia

15

13

19

27

18

10

ANOVA (Anlise de Varincia)

Fonte de
Variao

SQ

Graus de
Liberdade

QM

Entre

258

86

Dentro

46

7,67

Total

304

Valor - p

11,2

0,0072

Concluso: rejeito H0 a 5%, ou seja, pelo menos uma mdia


diferente das demais.

0,05

Dcrit

Dcrit

qk ,nT k
2

q4 , 6
2

1 1
1 1
q4,10 4

QMD

7,67

n n
n n
2
j
j
i
i

1 1
1 1
4,90

7,67

7,67

n n

2
j
i
ni n j

Mdias
B=13 A=15

C=19

D=27

Comparando mdias de B e A:

Xi

13
15
19
27

D 15 13 2

Dcrt

4, 90
2

1 1
8, 76
3 2

7, 67

D Dcrit
Concluso: no rejeito a hiptese nula de igualdade de mdias entre B e A.

Comparando mdias de B e C:

Xi

13
15
19
27

D 19 13 6

Dcrt

4, 90
2

1 1
7,83
3 3

7, 67

D Dcrit
Concluso: no rejeito a hiptese nula de igualdade de mdias entre B e C.

Comparando mdias de B e D:

Xi

13
15
19
27

D 27 13 14 Dcrt

4, 90
2

1 1
8, 76
3 2

7, 67

D Dcrit
Concluso: rejeito a hiptese nula de igualdade de mdias entre B e D.

Comparando mdias de A e C:

Xi

13
15
19
27

D 19 15 4

Dcrit

4,90
1 1
7,67 7, 83
2
3 3

D Dcrit
Concluso: no rejeito a hiptese nula de igualdade de mdias entre A e C.

Comparando mdias de A e D:

Xi

13
15
19
27

D 27 15 12 Dcrt

4, 90
2

1 1
7, 67
9, 60
2
2

D Dcrit
Concluso: rejeito a hiptese nula de igualdade de mdias entre A e D.

Comparando mdias de C e D:

Xi

13
15
19
27

D 27 19 8 Dcrt

4, 90
2

1 1
8, 76
3 2

7, 67

D Dcrit
Concluso: no rejeito a hiptese nula de igualdade de mdias entre C e D.

Resultado
Teste de Tukey

Teste de Scheff
H0 : i j 0
H1: i j 0

i j

Neste teste a hiptese nula rejeitada se

1 1
xi x j (k 1) F QMD

Dcrit
ni n j
onde F o valor tabelado da distribuio F com (k-1) graus de liberdade no
numerador e (nT-k) graus de liberdade no denominador para o nvel de
significncia adotado.

Exemplo: comparao de 4 mdias

12

14

19

24

18

12

17

30

13

21

Total

Total

30

39

57

54

180

Mdia

15

13

19

27

18

10

ANOVA (Anlise de Varincia)

Fonte de
Variao

SQ

Graus de
Liberdade

QM

Entre

258

86

Dentro

46

7,67

Total

304

Valor - p

11,2

0,0072

Concluso: rejeito H0 a 5%, ou seja, pelo menos uma mdia


diferente das demais.

0,05
Dcrit (k 1) F QMD
Dcrit 10,46

1 1
1 1

(4 1) 4,757 7,67

ni n j
ni n j

1 1

ni n j

Mdias
B=13 A=15

C=19

D=27

Comparando mdias de B e A:

Xi

13
15
19
27

D 15 13 2

Dcrit 10,46

1 1
9,55
2 3

D Dcrit
Concluso: no rejeito a hiptese nula de igualdade de mdias entre B e A.

Comparando mdias de B e C:

Xi

13
15
19
27

D 19 13 6

Dcrit

1 1
10,46 8,54
3 3

D Dcrit
Concluso: no rejeito a hiptese nula de igualdade de mdias entre B e C.

Comparando mdias de B e D:

Xi

13
15
19
27

D 27 13 14

Dcrit

1 1
10,46
9,55
2 3

D Dcrit
Concluso: rejeito a hiptese nula de igualdade de mdias entre B e D.

Comparando mdias de A e C:

Xi

13
15
19
27

D 19 15 4

Dcrit 10,46

1 1
9,55
2 3

D Dcrit
Concluso: no rejeito a hiptese nula de igualdade de mdias entre A e C.

Comparando mdias de A e D:

Xi

13
15
19
27

D 27 15 12

Dcrit 10,46

1 1
10,46
2 2

D Dcrit
Concluso: rejeito a hiptese nula de igualdade de mdias entre A e D.

Comparando mdias de C e D:

Xi

13
15
19
27

D 27 19 8

Dcrit 10,46

1 1
9,55
2 3

D Dcrit
Concluso: no rejeito a hiptese nula de igualdade de mdias entre C e D.

Resultado
Teste de Scheff

Tukey vs. Scheff

Quando as amostras tm tamanhos iguais o teste de Tukey


mais adequado do que o teste de Scheff.

Para amostras com tamanhos diferentes, a probabilidade do erro


tipo I no teste de Tukey () na verdade um pouco menor que o
valor especificado. Consequentemente, o poder do teste tambm
um pouco menor.

P(erro tipo I ) P(rejeitar H 0 H 0 verdadeira )


P(erro tipo II ) P(nao rejeitar H 0 H 0 falsa )
1 Poder P (rejeitar H 0 H 0 falsa )

Outros testes para Comparaes Mltiplas

Teste de Duncan

Teste de Dunnett
O teste de Dunnett serve para comparaes mltiplas onde apenas
um tratamento serve de referncia, quer dizer, deseja-se comparar
todos os tratamentos com apenas um. O tratamento de referncia
pode ser por exemplo o tratamento padro, no havendo interesse
na comparao dos demais tratamentos entre si.

Potrebbero piacerti anche