Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
TESTES NO PARAMTRICOS
JANANA RIBEIRO COSTA ROUWS
PESQUISADORA-ESTATSTICA E EXPERIMENTAO
EMBRAPA AGROBIOLOGIA
Agrobiologia
1. INTRODUO
Estatstica Experimental: cincia que tem como
objetivo estudar experimentos (ensaios),
englobando etapas como o planejamento,
execuo, coleta e anlise de dados
experimentais e interpretao dos resultados
obtidos.
Planejamento do experimento ATENO
Fisher (1919): ANAVA Cincias biolgicas
Agrobiologia
Pressuposies bsicas da anlise de varincia
Aditividade dos efeitos do modelo (Tukey, 1949)
Independncia dos erros (Durbin-Watson)
Normalidade dos erros
Homogeneidade de varincias dos erros
Violao Alternativas:
Transformao dos dados
Testes no paramtricos
Anlise multivariada
Agrobiologia
Natureza das variveis :
Qualitativas:
Nominais (categorias, atributos, sem ordenao natural) Ex: tipo de
cultura (alface, couve, beterraba), ocorrncia do fungo/bactria, cvs,
etc.
Ordinais (atributos com ordenao natural) Ex: suscetibilidade da
seringueira ao mal das folhas: alta, mdia e baixa; gosto do caf:
muito bom, bom, ruim e pssimo, conceitos: A, B e C, etc.
Quantitativas:
Discretas (contagem) Ex: n
o
folhas atacadas por bicho mineiro em
caf; fauna, etc .
Contnuas (mensurao de valores reais) Ex: peso, altura,
densidade, pH, produo, etc.
Agrobiologia
Hipteses:
H
o
(nula): que ser testada, admite-se que a diferena entre
a estimativa e o parmetro devida ao acaso.
H
1
(alternativa): que ser aceita caso H
o
seja rejeitada,
diferena entre a estimativa e o parmetro devida
realmente ao(s) tratamento(s).
Na tomada de decises se aceita ou rejeita H
o
comete-se
ERROS.
Agrobiologia
Erros associados a testes de hipteses:
ERRO TIPO I: se comete ao rejeitar H
o
, sendo ela verdadeira
ERRO TIPO II: se comete ao aceitar H
o
, sendo ela falsa
PODER DO TESTE: probabilidade se de rejeitar H
o
, sendo ela
falsa
(nvel de significncia): probabilidade de se cometer erro tipo I
: probabilidade de se cometer erro tipo II
1- : Poder do Teste
Agrobiologia
Realidade
Deciso
H
o
verdadeira H
o
falsa
Aceitar H
o
Deciso correta (nvel de confiana) Erro Tipo II
1-
Rejeitar H
o
Erro tipo I Deciso correta (poder do teste)
1-
TABELA 1. Erro tipo I e tipo II e suas respectivas probabilidades e
tambm, probabilidades de tomar decises corretas.
Obs.:
Erro tipo I e II so negativamente correlacionados.
Erro tipo I controlado com a escolha de .
A nica forma de reduzir simultaneamente e aumentar o tamanho
da amostra.
Agrobiologia
2. TESTES NO PARAMTRICOS
So aqueles que dispensam o conhecimento da forma e
dos parmetros da funo de distribuio da varivel
aleatria em considerao (Rodrigues, 1970). Def. exclui
entre outras a binomial (Pimentel Gomes).
Testes de distribuio livre: indicam que os mtodos so
aplicveis independentemente da forma da distribuio,
ou que so vlidos para um ou mais largo espectro de
distribuies.
http://www.mat.ufrgs.br/~viali/estatistica/mat2282/material/textos/Te
stes_Nao_Parametricos.pdf
Agrobiologia
MTODOS NO PARAMTRICOS (Conover,
1999)
Um mtodo estatstico no paramtrico se satisfaz pelo menos
um dos seguintes critrios:
1) o mtodo pode ser usado nos dados com uma escala nominal de
medida,
2) em uma escala ordinal de medidas,
3) em uma escala intervalar ou razo de medidas, onde a funo
distribuio aleatria produzindo os dados no especificada ou
especificada exceto para um nmero infinito de parmetros
desconhecidos.
Agrobiologia
Vantagens (Particularidades):
Amostra deve ser aleatria como nos paramtricos, porm a
distribuio de probabilidade da populao pode permanecer
desconhecida.
No exigem distribuio normal e nem varincias homogneas
Podem ser aplicados em dados qualitativos nominais e ordinais
(paramtricos no se aplica).
Desvantagens
Menos poderosos: < prob. de rejeitar H
o
falsa
Obs.: Preferir: testes paramtricos so robustos (para n grande:
pequenos desvios s pressuposies exigidas no invalidam
os resultados)
Agrobiologia
2.1. TESTE DE QUi-QUADRADO (
2
)
H
o
: Probabilidades iguais: p
1
=p
2
Exigncias:
Independncia dos grupos em comparao. Por ex., um o
controle e outro o experimental (um grupo avaliado pela
presena de fungo e outro pela ausncia)
Tamanho da mostra (n) 20 cc no usar dados para
inferncia
20 n 40 exige fes > 5. Todos casos no pode haver
nenhuma fe < 1.
Agrobiologia
ESTATSTICA
2
:
( )
=
n
i
fe
fe fo
1
2
2
=
=
n
i
c
fe
fe fo
Agrobiologia
Obs.: Para tabelas de contigncias 2x2 frmula alternativa para 2
Varivel X \ Varivel Y 1 2 Total
1 a b a+b
2 c d c+d
Total a+c b+d n
AC \ AA Presente Ausente Total
Presente a = 18 b = 9 a + b = 27
Ausente c = 10 d = 2 c + d =12
Total a + c =28 b + d = 11 n =39
( )
( )( )( )( )
( )
) o aproxima de erro ( 16 , 1 14 , 1
11 . 28 . 12 . 27
39 . 10 . 9 2 . 18
d b c a d c b a
n bc ad
2
2
2
c
=
=
+ + + +
=
Agrobiologia
5) Comparar dado por:
2 2
com
t c
6) Concluir o teste:
Se Rejeita H
o
2 2
t c
Se Aceita H
o 2 2
t c
<
2
t
= 0,05
GL = (r-1) (s-1) = (2-1) (2-1) = 1
84 , 3
2
=
t
+
=
2
1
1 1
1
n n
R U
= 28,5 [7(7+1)/2] =0,5
6) Calcule
( )
12
1
2
2 1 2 1
2 1
+ +
=
n n n n
n n
U
Z
Agrobiologia
7) Comparar Z
c
com Z
t
dado por
Teste bilateral: Prob (1- )/2 = (1-0,05)/2 = 0,4750 Z
t
= 1,96
8) Concluir o teste
Se Z
c
Z
t
Rejeita H
o
Se Z
c
< Z
t
Aceita H
o
No exemplo 3,18 > 1,96 Rejeita H
o
: a durao do perodo
ninfal de machos difere do de fmeas.
( )
18251 , 3
12
1 8 7 8 7
2
8 7
5 , 0
=
+ +
=
x
x
Z
c
Agrobiologia
9) Calcule as mdias dos postos para facilitar comparao
Grupo 1 (machos) R
1
/n
1
= 28,5/7 = 4,1
Grupo 2 (fmeas) R
2
/n
2
= 91,5/8 = 11,4
Obs.: observada entre as mdias grande e pelo teste
significativa (no devida ao acaso).
Agrobiologia
2.3. TESTE DE KRUSKAL-WALLIS
Aplica-se ao DIC com 3 tratamentos (2 trats Teste de
Wilcoxon: Campos, 1983; Vieira, 2003)
Ho: as k populaes tm a mesma funo de distribuio
Somente usar para n pequeno e/ou violaes nas
pressuposies da anava
Testes que usam estatstica de ordem devem ser evitados
(Gomes, 2000). Ex.: 2 conjuntos distintos de dados com vars
s podem dar o mesmo resultado do teste pois baseia-se
somente em postos.
Agrobiologia
EXEMPLO E PASSOS PARA REALIZAR O TESTE DE
KRUSKAL-WALLIS
Ex.: Considere os dados de % de plantas doentes em um
experimento com tomateiros em delineamento inteiramente
casualizado (DIC) com 3 tratamentos e 4 repeties (Gomes,
2000)
Trat 1 Trat 2 Trat 3
10 27 40
15 28 70
5 44 55
30 35 60
Agrobiologia
Passos:
1) Estabelecer:
Ho: no h diferena entre os 3 tratamentos
Nvel de significncia ( ) = 0,05
2) Junte os n
1
+n
2
+...+n
k
= n dados em um s conjunto
4+4+4 =12 dados
Ordene e atribua postos aos n dados (o menor valor
receber posto 1 e o maior, posto n).
Agrobiologia
TRAT 1 TRAT 2 TRAT 3
Dados Postos Dados Postos Dados Postos
10 2 27 4 40 8
15 3 28 5 70 12
5 1 44 9 55 10
30 6 35 7 60 11
R
1
= 12
R
2
= 25
R
3
= 41
3) Ache R
1
= 12; R
2
= 25; ...; R
k
= R
3
=41 e verifique se:
R
1
+ R
2
+ ....+ R
k
= n(n+1)/2
12+25+41 = 12(13)/2 = 78 OK!
Agrobiologia
4) Calcule H
( ) ( ) ( )
) 1 ( 3 ...
) 1 (
12
2
2
2
2
1
2
1
+
(
(
+ + +
+
=
n
n
R
n
R
n
R
n n
H
k
k
115 , 8 ) 1 12 ( 3
4
41
4
25
4
12
13 12
12
2 2 2
= +
(
+ + =
x
H
c
5) Comparar H
c
com
2
t
2
t
=0,05
GL = k-1 = 3-1 = 2
99 , 5
2
=
t
(Distribuio aproximada)
Agrobiologia
6) Concluir o teste
Se H
c
Rejeita H
o
Se H
c
< Aceita H
o
No exemplo 8,115 > 5,99 Rejeita H
o
h diferena na % de
plantas doentes dos 3 tratamentos
Obs.: Caso haja empates a estatstica :
2
t
2
t
C
H
H =
1
( )
) 1 (
1
1
2
2
=
n n
t t
C
i i
t
i
o n
o
de obs. empatadas em cada grupo de empates. Ex.: se o dado
20 repetiu 2 vezes e o dado 36 repetiu 3 vezes t
1
= 2 e t
2
= 3.
Agrobiologia
COMPARAO DE MDIAS NO DIC
1
o
caso) k = 3 e n
i
6
a) Calcular as mdias das ordens de cada tratamento
i
i
i
n
R
R
=
No exemplo:
25 , 10
4
41
25 , 6
4
25
3
4
12
3 2 1
= = = = = = R R R
Agrobiologia
b) Calcula-se a DMS para cada par de mdias
h .
n
1
n
1
12
) 1 n ( n
j i
ij
|
|
\
|
+
+
=
Tabela de h
n
1
, n
2
, n
3
= 4, 4, 4
= 0,049 0,05 (usual)
h = 5,692
08 , 6 692 , 5
4
1
4
1
12
13 x 12
23 13 12
=
|
\
|
+ = = = =
Agrobiologia
25 , 10
3
= R b
25 , 6
2
= R ab
3
1
= R a
= 6,08
2
o
caso) k > 3 e n
i
> 6 para alguns ou todos tratamentos.
|
|
\
|
+
+
=
j i
ij
n n
n n
t
1 1
12
) 1 (
Tabela de t:
n = (1/2)k(k-1) contrastes
n
2
= (sempre)
t
Agrobiologia
2.4. TESTE DE FRIEDMAN
Aplica-se ao DBC com 3 tratamentos (2 trats
Teste do Sinal: Gomes, 2000; Vieira, 2003)
Ho: vrias (k) populaes tm a mesma
distribuio
Somente usar para n pequeno e/ou violaes nas
pressuposies da anava
Agrobiologia
EXEMPLO E PASSOS PARA REALIZAR O TESTE DE
FRIEDMAN
Ex.: Considere os dados de % de plantas doentes num
experimento com tomateiros em um delineamento em blocos
casualizados (DBC) com 3 tratamentos e 5 blocos (Gomes,
2000)
Bloco Trat 1 Trat 2 Trat 3
1 20 27 40
2 28 15 60
3 5 20 15
4 40 35 60
5 18 20 25
Agrobiologia
Passos:
1) Estabelecer:
Ho: no h diferena entre os 3 tratamentos
Nvel de significncia ( ) = 0,05
2) Atribuir um posto a cada dado dentro de cada bloco. Os postos iro de
1 (menor valor) a k = n
O
de trats (maior valor)
Dados Dados Dados Posto Posto Posto
Bloco
Trat 1 Trat 2 Trat 3 Trat 1 Trat 2 Trat 3
1 20 27 40 1 2 3
2 28 15 60 2 1 3
3 5 20 15 1 3 2
4 40 35 60 2 1 3
5 18 20 25 1 2 3
R
1
= 7 R
2
= 9 R
3
= 14
Agrobiologia
3) Ache R
1
= 7; R
2
= 9; ...; R
k
= R
3
= 14
4) Calcule a Estatstica K (chamada Qui-quadrado de
Friedman)
( ) ( ) ( ) [ ] ) 1 ( 3 ...
) 1 (
12
2 2
2
2
1
+ + + +
+
=
k b R R R
k bk
K
k c
( ) ( ) ( ) [ ] 20 , 5 4 5 3 14 9 7
4 3 5
12
2 2 2
= + + = x x
x x
K
c
Agrobiologia
5) Comparar K
c
com K
t
ou
Se 3 k 5 Tabela de K
t
acha prob. sig.
No exemplo: k = 3 trats, b = 5 blocos e K
c
= 5,20 prob =
0,093
Se k > 5 ou b exceder os da tabela Tabela de
2
t
k
b
K
c
2
t
GL = k-1
Agrobiologia
6) Concluir o teste
Para 3 k 5
Se Prob. Sig. (Usual) Rejeita H
o
Se Prob. Sig. > >> > Aceita H
o
No exemplo 0,093 > 0,05 Aceita H
o
: no h diferena na % de
plantas doentes entre os 3 tratamentos
Para k > 5
Se Kc Rejeita Ho
Se Kc < Aceita Ho
2
t
2
t
Agrobiologia
Obs.: Caso haja empates a estatstica :
C
K
K =
1
) 1 (
1
2
=
k bk
T
C
j
k t T
i
ij j
=
3
em que t
ij
o n
o
de obs. empatadas no grupo de empates i do bloco j.
(mais detalhes Gomes, 2000).
Agrobiologia
COMPARAO DE MDIAS NO DBC (Campos, 1983)
1
o
caso) Pequenas Amostras (quando b=n blocos e k tratamentos esto
includos na Tabela 24 de Campos, 1983)
a) Considerar os
3
2
) 1 3 ( 3
: exemplo No
s tratamento de pares
2
) 1 k ( k
=
K tratamentos
1
= =
n
Y
Y
n
X
X
n
Y X
XY
Y Var X Var
Y X Cov
r
2
2
2
2
) ( ) (
) ( ) (
) , (
-1 r 1. Opo: grfico de disperso das variveis para
verificar se correlao +, - ou 0.
r = 0 : inexistncia de associao linear entre as variveis;
r = -: uma varivel aumenta e outra diminui em magnitude;
r = +: as 2 variveis diminuem juntas ou aumentam juntas;
Quanto mais prximo de 1 , > correlao entre variveis
Agrobiologia
Obs.: r = 0 pode haver outra correlao que no a linear entre as
variveis tentar linearizar transformando dados. Ex.:
crescimento de culturas bacterianas: no h relacionamento
linear entre o n
o
de clulas viveis e o tempo, mas linear
entre log (n
o
cels) e o tempo.
TESTE t PARA DETERMINAR A SIGNIFICNCIA DE r
H
O
: r = 0 (no existe correlao linear entre as 2 variveis)
H
1
: r 0 (h correlao linear significativa entre as 2
variveis)
Agrobiologia
2
1
2
= n
r
r
t
c
Se t
c
t
t
Rejeita H
o
(h correlao linear entre as
variveis)
Se t
c
< t
t
Aceita H
o
(no h)
GL = n-2
t
t
Agrobiologia
Ex.: Ache a correlao entre o teor de K trocvel no solo (varivel X) e o
aumento de produo de cana (Y) (Gomes, 2000)
Teor de K (X) Aumento de produo (Y)
0,109 31,8
0,138 24,5
0,206 11,8
0,153 18,8
0,156 17,3
0,240 11,0
0,270 12,2
0,126 20,6
0,608 10,8
0,199 5,3
0,112 29,3
0,138 8,0
0,103 35,8
0,127 19,6
0,063 21,4
X = 2,748 Y = 278,2
X = 2,748 X
2
= 0,739042 Y = 278,2 Y
2
= 6288,64
XY = 42,9143
Agrobiologia
TESTE t:
494 , 0
15
) 2 , 278 (
64 , 6288
15
) 748 , 2 (
739042 , 0
15
) 2 , 278 )( 748 , 2 (
9143 , 42
2 2
=
= r
05 , 2 2 15
) 494 , 0 ( 1
494 , 0
2
=
=
c
t
Agrobiologia
TESTE t:
Como t
c
< t
t
ou seja 2,05 < 2,16 Aceita H
o
(no h correlao
linear significativa entre teor de K e aumento na produo).
GL = n-2 = 15-2 =13
t
t
= 2,16 t
t
Agrobiologia
COEFICIENTE DE CORRELAO DE SPEARMAN (r
s
)
Serve para medir o grau de associao entre 2 variveis
No Paramtrico usado quando os dados observados so
variveis ordinais ou quando nenhuma das variveis em
anlise tem distribuio normal.
Obs.: r
s
caso particular de r de Pearson :
os 2 do resultados iguais se aplicados a postos qdo no
h empates atravs de transformaes algbricas
transforma-se r em r
s
.
Agrobiologia
( )
(
(
=
1 n n
D 6
1 r
2
2
s
-1 r 1. Opo: grfico de disperso das variveis para
verificar se correlao +, - ou 0.
r = 0 : inexistncia de associao entre as variveis;
r = -: uma varivel aumenta e outra diminui em magnitude;
r = +: as 2 variveis diminuem juntas ou aumentam juntas;
Quanto mais prximo de 1 , > correlao entre variveis
Agrobiologia
Ex.: Ache o r
s
entre as notas de aulas tericas (X) e prticas
de estatstica (Y) (Adaptado de Vieira, 2003)
AlunoX (Terica) Y (Prtica)
1 30 60
2 55 55
3 65 45
4 80 90
5 85 50
6 45 85
7 50 80
8 60 95
Agrobiologia
Passos:
1) Atribuir postos aos valores das 2 variveis.
2) Calcular a diferena (D) entre cada par de postos.
0 D =
Obs.:
3) Calcular D
2
e
2
D
4) Calcular
( )(
(
=
1 n n
D 6
1 r
2
2
s
5) Aceitar ou rejeitar Ho que pode ser:
a) X e Y tm correlao (hiptese bilateral, pode ser tanto positiva quanto
negativa
b) X e Y tm correlao negativa (unilateral, s negativa)
c) X e Y tm correlao positiva (unilateral, s positiva)
Agrobiologia
Aluno X (Terica) Y (Prtica) Posto de X Posto de Y D D2
1 30 60 1 4 -3 9
2 55 55 4 3 1 1
3 65 45 6 1 5 25
4 80 90 7 7 0 0
5 85 50 8 2 6 36
6 45 85 2 6 -4 16
7 50 80 3 5 -2 4
8 60 95 5 8 -3 9
0 D =
100 D
2
=
( ) ( )
19048 , 0
1 8 8
100 x 6
1
1 n n
D 6
1 r
2 2
2
s
=
(
=
(
(
=
Agrobiologia
Concluir o teste:
Para =0,05 e n=8 r
c
= 0,7143 (Vieira, 2003)
Se |r
s
| < r
c
: Aceita Ho
Se | r
s
| r
c
: Rejeita Ho
Como 0,19048 < 0,7143 : Aceita Ho (as mdias obtidas nas aulas
tericas de estatstica no diferem das aulas prticas)