Sei sulla pagina 1di 15

1

Testes No Paramtricos
(Para k>2 amostras)
Jos Manuel Toms da Silva
Universidade de Coimbra
Universidade de Coimbra 2 Toms da Silva (2007)
Dados contnuos vs. ordinais e
nominais
Designs experimentais, quasi-experimentais, ex
post facto e correlacionais frequentemente
geram resultados que no so dados contnuos
(intervalar ou rcio), mas antes nominais e
ordinais
As estatsticas paramtricas no so as
ferramentas correctas para resolver as
hipteses ou descrever associaes entre as
variveis
2
Universidade de Coimbra 3 Toms da Silva (2007)
Exigncia da normalidade das distribuies nos testes
paramtricos
A maior parte das estatsticas inferenciais assumem
distribuies normais.
Embora os testes estatsticos funcionem bem mesmo
quando a assuno da normalidade violada,
desvios extremos da normalidade podem distorcer os
resultados.
Habitualmente o efeito da violao da normalidade
diminuir a taxa de erro de Tipo I, o que seria bom
se, simultaneamente, no ocorresse um decrscimo
substancial no poder do teste.
Universidade de Coimbra 4 Toms da Silva (2007)
Testes no paramtricos ou de
distribuio livre
Existe uma coleco de testes designados de no
paramtricos ou de distribuio livre que no fazem
nenhumas assunes acerca da distribuio a partir
da qual os nmeros foram extrados. Da o nome,
distribuio livre.
A principal vantagem dos testes no paramtricos
de que estes providenciam maior poder do que os
testes tradicionais quando as amostras so
provenientes de distribuies altamente assimtricas.
3
Universidade de Coimbra 5 Toms da Silva (2007)
Vantagens dos testes no paramtricos
Siegel e Castellan (1988):
So aplicveis a pequenas amostras quando a
distribuio subjacente desconhecida
Podem se mais apropriados para a questo de
investigao
Apropriados para usar com dados sobre a forma
de postos/ordens
Apropriados para usar com dados categoriais
(nominais)
Universidade de Coimbra 6 Toms da Silva (2007)
Alguns tipos de testes no paramtricos
e reas mais comuns de aplicao
Variveis nominais
Teste binomial
Aplica-se a variveis de tipo nominal com duas categorias apenas.
Teste do qui-quadrado (uma varivel)
Aplica-se o teste do qui-quadrado de aderncia (goodness-of-fit)
para testar se existe uma diferena entre o nmero observado e o
nmero esperado de casos repartidos por vrias categorias.
Teste do qui-quadrado da independncia de variveis
categricas
Este teste permite responder a questes relacionadas com
hipotticas diferenas entre duas variveis categricas.
4
Universidade de Coimbra 7 Toms da Silva (2007)
Testes no paramtricos e reas mais
comuns de aplicao continuao
Variveis ordinais/duas amostras
O teste U de Mann-Whitney
Utiliza-se para planos com dois grupos independentes, isto , quando os
sujeitos so aleatoriamente distribudos pelas duas condies. A escala de
medida pode ser ordinal ou intervalar/razo. Se for do tipo
intervalar/razo, o teste U de Mann-Whitney utilizado como substituto
do teste t de Student quando a validade da assuno de normalidade
questionvel.
O teste dos sinais ordenados para dados emparelhados de Wilcoxon
Utiliza-se para planos com dois grupos emparelhados onde assumimos que
os resultados so quantitativos e que as diferenas nos resultados atingem
um nvel ordinal de medida, isto , as diferenas nos resultados podem
legitimamente ser ordenadas da menor para a maior ou vice-versa.
Universidade de Coimbra 8 Toms da Silva (2007)
Testes no paramtricos e reas mais
comuns de aplicao continuao
Variveis ordinais/mais de duas amostras
O teste H de Kruskal-Wallis para trs ou mais amostras
Utiliza-se para planos com grupos independentes. O teste H de Kruskal-Wallis
semelhante ao teste U de Mann-Whitney na medida em que as observaes nas
diferentes amostras so ordenadas em conjunto numa nica srie. Contudo, ao
contrrio do teste U, pode ser usado para comparar resultados em mais do que dois
grupos. a verso alternativa da ANOVA paramtrica uni-factorial, para amostras
independentes.
O teste de Friedman
Se queremos comparar os resultados de trs ou mais amostras relacionadas,
podemos usar o teste da varincia bivariado de Friedman. Este teste ordena os
resultados para cada um dos casos e depois calcula a mdia das ordens para cada
amostra. Se no existem diferenas entre as amostras, as suas mdias das ordens
devem ser similares. A estatstica deste teste tem uma distribuio de qui-quadrado.
a verso alternativa da ANOVA paramtrica uni-factorial, para amostras
dependentes.
5
Universidade de Coimbra 9 Toms da Silva (2007)
ANOVA unifactorial, no mtrica
(Grupos independentes)
Variveis ordinais/mais de duas amostras
O teste H de Kruskal-Wallis para trs ou mais amostras
Objectivo de um estudo hipottico:
Comparar a necessidade de realizao (nach need for
achievement) de rapazes e raparigas provenientes de diferentes
meios escolares.
A varivel independente o Tipo de Escola (com cinco
nveis/condies)
A varivel dependente so os respostas ordenadas dos
participantes na necessidade de realizao.
Universidade de Coimbra 10 Toms da Silva (2007)
Dados*
24 22 20 18
23 19 16 14 13
21 15 10 8 5
17 11 9 4 3
12 7 6 1 2
E D C B A
Tipo de Escola
* Ordens das pontuaes obtidas num inventrio de nach (Anote que as
observaes j so os postos ou ordens).
6
Universidade de Coimbra 11 Toms da Silva (2007)
Teste estatstico
( )
( ) 1 3
1
12
+
+
= N
N N
K
H
Onde:
N= Nmero total de participantes (combinando todas as amostras)
K= Total das somas dos quadrados das ordens (R
K
) em cada uma
das amostras (nveis da VI), divididas pelo respectivo nmero de
casos.
K
K
i
K
N
R
K

=
2
Universidade de Coimbra 12 Toms da Silva (2007)
Algoritmo (Cohen e Holliday)
1. Ordene todos os casos
independentemente da condio/amostra
a que pertenam
2. Some as ordens para cada condio
3. Calcule K.
4. Substitua os valores na frmula da
estatstica H.
7
Universidade de Coimbra 13 Toms da Silva (2007)
Clculos
n
E
= 5 n
D
= 5 n
C
= 5 n
B
= 5 n
A
= 4
R
E
= 97 R
D
= 74 R
C
= 61 R
B
= 45 R
A
= 23
24 22 20 18
23 19 16 14 13
21 15 10 8 5
17 11 9 4 3
12 7 6 1 2
E D C B A
Universidade de Coimbra 14 Toms da Silva (2007)
Clculo do K e do H
16 . 10
) 1 24 ( 3
) 1 24 ( 24
45 . 4258 12
) 1 ( 3
) 1 (
12
45 . 4258
5
) 97 (
5
) 74 (
5
) 61 (
5
) 45 (
4
) 23 (
2 2 2 2 2
=
+
+

= +
+

=
=
+ + + + =
H
N
N N
K
H
K
K
8
Universidade de Coimbra 15 Toms da Silva (2007)
Teste da Significncia
Estatstica de H
Grandes amostras
Quando h mais de cinco casos em cada condio/amostra,
ou
Quando h mais de trs condies/amostras.
Pequenas amostras
Alguns autores recomendam que no caso de k = 3 e em que
o nmero de observaes em cada uma das 3 amostras seja
cinco ou inferior, que a significncia estatstica de H seja
testada com recurso a uma tabela de probabilidades distinta
da distribuio do qui-quadrado.
Universidade de Coimbra 16 Toms da Silva (2007)
Aplicao ao exemplo
Grande amostra (k> 3)
Obtenha os graus de liberdade, definidos como: g.l.= K-1
(onde K o nmero de amostras)
Assim, para o problema, g.l.= 5-1= 4.
Entre com 4 g.l. na Tabela da Distribuio do
2
(= .05); O
valor necessrio para rejeitar a hiptese nula (declarar a
significncia estatstica) 9.49 ou superior.
Conclui-se, dado que H = 10.16 maior do 9.49 (valor
crtico) devemos rejeitar H
0
e aceitar H
1
. Ou seja, existe uma
relao entre o meio escolar e a nach.
9
Universidade de Coimbra 17 Toms da Silva (2007)
Testes post hoc
No h consenso sobre a melhor maneira de prosseguir
a anlise depois de ter-se rejeitado a hiptese nula
Todavia, Siegel e Castellan (1988), apresentam um
procedimento de contraste post hoc (tambm descrito
por Maroco & Bispo, 2005, pp. 246-249).
Prope-se que, no SPSS, sejam efectuadas pares de
comparaes recorrendo ao teste U de Mann-Whitney,
desejavelmente com a introduo da correco de
Bonferroni, para controlar a taxa de erro de Tipo I.
Universidade de Coimbra 18 Toms da Silva (2007)
Poder do teste H
A eficincia do teste da ANOVA de
Kruskal-Wallis relativamente ANOVA
paramtrica de 95%.
10
Universidade de Coimbra 19 Toms da Silva (2007)
Aplicao informtica
Problema
Decidir se diferentes zonas de uma cidade
apresentam taxas de assaltos estatisticamente
significativas.
Os investigadores dividem a cidade em 4 zonas (k
= 4) norte, sul, este e oeste (VI)
A VD representada pelas taxas diferenciais de
assaltos registadas, durante um certo perodo de
tempo, em cada uma das zonas.
Universidade de Coimbra 20 Toms da Silva (2007)
Output SPSS:
NPar Tests
Descriptive Statistics
30 5,187 1,2022 3,7 7,1
30 2,60 1,102 1 4
Taxa de assaltos
Localizao
N Mean Std. Deviation Minimum Maximum
Kruskal-Wallis Test
Ranks
6 16,00
8 23,50
8 11,94
8 10,69
30
Localizao
norte
sul
este
oeste
Total
Taxa de assaltos
N Mean Rank
Test Statistics
a,b
10,426
3
,015
Chi-Square
df
Asymp. Sig.
Taxa de
assaltos
Kruskal Wallis Test
a.
Grouping Variable: Localizao
b.
11
Universidade de Coimbra 21 Toms da Silva (2007)
ANOVA unifactorial, no mtrica
(Grupos dependentes)
Variveis ordinais/mais de duas amostras
O teste de Friedman
Alternativa no paramtrica ANOVA uni-
factorial de medidas repetidas
Objectivo:
O teste de Friedman pretende testar se as
diferentes amostras repetidas ou emparelhadas
provm de uma mesma populao ou de
populaes diferentes
Universidade de Coimbra 22 Toms da Silva (2007)
Algoritmo (segundo Maroco &
Bispo, 2005, pp. 254-255)
1. Ordenar as observaes por ordem
crescente dentro de cada nvel da VI
(atribuindo aos empates as mdias das
ordens que estas observaes teriam se
no estivessem empatadas)
2. Calcular a soma das ordens para cada
amostra: R
j
= r
i
12
Universidade de Coimbra 23 Toms da Silva (2007)
Estatstica de teste (segundo
Cohen & Holliday)
=
=
=
+

+
=

=
=
k
j
j
k
j
j r
R
onde
K N R
K NK
1
2
1
2 2
N
K
) 1 ( 3
) 1 (
12

Nmero de tratamentos (geralmente representa


o nmero de condies, ou nveis da VI)
Tamanho ou efectivo da amostra
Soma do quadrado das ordens em cada
coluna (condio)
Universidade de Coimbra 24 Toms da Silva (2007)
Exemplo de aplicao
Assumimos que seis avaliadores (N),
apreciam o desempenho de cinco
candidatos (condies, K) para o
desempenho de um cargo numa empresa.
Cada avaliador ordena cada candidato a
uma dada funo executiva os
resultados so, desde a origem, ordens ou
postos.
13
Universidade de Coimbra 25 Toms da Silva (2007)
Dados (Cohen & Holliday)
R
5
= 26 R
4
= 11 R
3
= 17 R
2
= 23 R
1
= 13
5 1 4 3 2 F
4 2 1 5 3 E
5 1 3 4 2 D
5 4 1 2 3 C
4 2 3 5 1 B
3 1 5 4 2 A
5 4 3 2 1
Candidatos Gestores de
recursos humanos
Universidade de Coimbra 26 Toms da Silva (2007)
Hipteses
Hiptese nula: As escolhas dos
avaliadores no revelam uma preferncia
por um candidato
Hiptese alternativa: Negao de H0
14
Universidade de Coimbra 27 Toms da Silva (2007)
Aplicao da frmula
N = 6
K = 5
R
j
2
= 1784
( )
( )
93 . 10
1 5 6 * 3 1784
1 5 6 * 5
12
2
=
+

+
=
r

Universidade de Coimbra 28 Toms da Silva (2007)


Teste a significncia estatstica
Procure na tabela do qui-quadrado o valor
crtico, para um nvel de alfa previamente
especificado (e.g., .05, ou 5%).
Os gl = K -1 (no caso, 5-1=4)
Para o caso presente o
.05
2
crtico = 9.488
Concluso: Como o valor de
2
observado >
2
crtico, rejeitamos a hiptese nula.
15
Universidade de Coimbra 29 Toms da Silva (2007)
Correco para empates
Quando as observaes esto empatadas
num dada posto -lhes atribuda a mdia
das ordens/postos que teriam recebido se
no existissem empates
Na prtica o valor de
2
de Friedman deve
ser corrigido quando h empates (apenas
se existirem mais de 50% de empates ou
mais de dois grupos de empates).
Universidade de Coimbra 30 Toms da Silva (2007)
Test Statistics
a
6
10,933
4
,027
N
Chi-Square
df
Asymp. Sig.
Friedman Test
a.
Ranks
2,17
3,83
2,83
1,83
4,33
candidato1
candidato2
candidato3
candidato4
candidato5
Mean Rank
Aplicao com o SPSS
Friedman Test
Como .027 < .05, rejeitamos a hiptese nula
Qui-quadrado de Friedman
O candidato n. 4 parece recolher a preferncia dos avaliadores (mdia de
postos mais baixa), mas seguido de perto pelo candidato n. 1!

Potrebbero piacerti anche