Sei sulla pagina 1di 23

Paul o Ri c ar do

Bi t t enc our t Gui mar es


Doutorando em Engenharia Florestal com
concentrao em Economia e Poltica Florestal
pela Universidade Federal do Paran (UFPR).
Mestre em Estatstica pela Universidade Esta-
dual de Campinas (Unicamp). Bacharel em Es-
tatstica pela Universidade Federal do Paran
(UFPR). Professor do Departamento de Estats-
tica da Universidade Federal do Paran (UFPR).
Especialista em avaliao do Programa Nacional
de Incluso de Jovens (Projovem) da Secretaria
Geral da Presidncia da Repblica. Consultor em
Bioestatstica e Pesquisa de Mercado.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anl i se de Cor r el a o e Medi das
de Assoc i a o
Introduo
Muitas vezes, precisamos avaliar o grau de relacionamento entre duas ou
mais variveis. possvel descobrir, com preciso, o quanto uma varivel in-
terfere no resultado de outra. As tcnicas associadas Anlise de Correlao
representam uma ferramenta fundamental de aplicao nas Cincias Sociais
e do comportamento, da Engenharia e das Cincias Naturais. A importncia
de se conhecer os diferentes mtodos e suas suposies de aplicao exa-
tamente pelo cuidado que se deve ter para no se utilizar uma tcnica inade-
quada. Existem diversos critrios de avaliao dessa relao, alguns prprios
para variveis que seguem uma distribuio normal e outros para variveis
que no seguem uma distribuio terica conhecida. comum a utilizao
do Coefciente de Correlao de Pearson. No entanto, existem situaes em
que o relacionamento entre duas variveis no linear, ou uma delas no
contnua ou as observaes no so selecionadas aleatoriamente. Nesses
casos, outras alternativas de coefcientes devem ser aplicadas. Entre as diver-
sas alternativas, veremos aqui algumas das mais importantes: Coefciente de
Spearman e Coefciente de Contingncia.
Segundo o dicionrio Aurlio, correlao signifca relao mtua entre dois
termos, qualidade de correlativo, correspondncia. Correlacionar, signifca
estabelecer relao ou correlao entre; ter correlao. Enquanto que a pa-
lavra regresso signifca ato ou efeito de regressar, de voltar, retorno, regresso;
dependncia funcional entre duas ou mais variveis aleatrias. A palavra re-
gredir signifca ir em marcha regressiva, retroceder.
Mas, onde e como surgiram os termos correlao e regresso? Foi Francis
Galton (1822-1911), primo de Charles Darwin, quem usou pela primeira vez
esses termos, cujo trabalho infuenciou a Estatstica e a Psicologia. Galton
publicou o livro Gnio Hereditrio, em 1869, no qual aplicou conceitos es-
tatsticos a problemas da hereditariedade. O primeiro relato em que Galton
usou o termo correlaes foi em 1888.
189
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
190
Anlise de Correlao e Medidas de Associao
Diagramas de Disperso
Um dos mtodos mais usados para a investigao de pares de dados a
utilizao de diagramas de disperso cartesianos (ou seja, os conhecidos dia-
gramas x-y). Geometricamente, um diagrama de disperso simplesmente
uma coleo de pontos num plano cujas duas coordenadas cartesianas so
os valores de cada membro do par de dados. E para qu fazemos um diagra-
ma de disperso? Este o melhor mtodo de examinar os dados no que se
refere ocorrncia de tendncias (lineares ou no), agrupamentos de uma
ou mais variveis, mudanas de espalhamento de uma varivel em relao
outra e verifcar a ocorrncia dos valores discrepantes. Observe o exemplo
a seguir:
Podemos notar pela anlise da fgura acima, a relao linear entre as duas
variveis. Os coefcientes apresentados a seguir nos auxiliam na quantifca-
o do grau de relacionamento entre as variveis de interesse.
A Covarincia e o Coefciente de Correlao de Pearson
Quando estudamos a relao entre duas variveis X e Y, devemos pri-
meiramente compreender o conceito de covarincia. Se a varincia uma
estatstica por meio da qual chegamos ao desvio-padro que uma medida
de disperso, da mesma maneira a covarincia uma estatstica pela qual
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Correlao e Medidas de Associao
191
chegamos ao coefciente de correlao que mede o grau de associao
linear entre duas variveis aleatrias X e Y.
Observe o exemplo abaixo. Sejam X e Y duas variveis aleatrias quais-
quer, que tomam os seguintes valores:
Tabela 1 Clculo do Coefciente de Correlao de Pearson
X Y
DesvioX
(X X)
i
2

DesvioY
(Y Y)
i

D X D Y
(X X) . (Y Y)
i i

Desvio X
2
(X X)
i
2

Desvio Y
2
(Y Y)
i
2

PRE_1
Y=a+bX
1 0 4,50 6,00 27,00 20,25 36,00 0,92727
2 2 3,50 4,00 14,00 12,25 16,00 2,05455
3 4 2,50 2,00 5,00 6,25 4,00 3,18182
4 5 1,50 1,00 1,50 2,25 1,00 4,30909
5 5 0,50 1,00 0,50 0,25 1,00 5,43636
6 8 0,50 2,00 1,00 0,25 4,00 6,56364
7 7 1,50 1,00 1,50 2,25 1,00 7,69091
8 7 2,50 1,00 2,50 6,25 1,00 8,81818
9 11 3,50 5,00 17,50 12,25 25,00 9,94545
10 11 4,50 5,00 22,50 20,25 25,00 11,07273
55 60 0 0 93,00 82,50 114,00 60,0000
Na tabela anterior est uma ilustrao dos clculos dos componentes da
covarincia e correlao.
A fgura a seguir mostra a relao entre as duas variveis X e Y, bem como
a linha ajustada a esses valores pelo mtodo de mnimos quadrados. Obser-
ve que a mdia de X 5,5 e a mdia de Y 6,0, e que elas esto formadas
pelas linhas paralelas ao eixo Y e ao eixo X respectivamente. Vejamos agora
o que signifca os desvios de cada ponto em relao mdia. Observe que
cada ponto est formado pelo par ordenado (X
i
,Y
i
), onde X
i
indica o valor da
varivel X e Y
i
o valor da varivel Y naquele ponto.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
192
Anlise de Correlao e Medidas de Associao
DesvioX = (X X)
(9 5, 5) = +3, 5
9

DesvioY = (Y Y)
(11 6, 0) = +5, 0
9

(X Y )
9
,
9
X=5, 5
Y=6, 0
Tome, agora, por exemplo,
DesvioX = (X
9
X) = ( 9 5,5) = + 3,5 e DesvioY = (Y
9
Y) = (11 6,0) = + 5,0
O produto dos desvios:
DesvioX . DesvioY = (X
9
X).(Y
9
Y) = (9 5,5).(11 6,0) = (+ 3,5).(+5,0) = 17,5
Se calcularmos esses produtos para todos os valores de X e Y e somarmos
temos o numerador da covarincia de X e Y:

i i
(X X).(Y Y) 93
C(X, Y) = = = 9, 3
n 10
(1)
Logo, covarincia signifca covariao, como as duas variveis variam de
forma conjunta. Agora, vejamos o que acontece se os pontos estivessem no
quadrante I. Nesse caso, os desvios de X seriam todos positivos, enquanto
que os desvios de Y seriam todos negativos, logo, os produtos tomam valo-
res negativos. O mesmo vai acontecer com os pontos do quadrante III, nele
os desvios de X tomam valores negativos e os desvios de Y, valores positivos,
logo, os produtos tomam valores negativos. Assim, se a maioria dos pontos
caem nos quadrantes I e III, a covarincia toma valores negativos, indicando
IV
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Correlao e Medidas de Associao
193
que essas duas variveis se relacionam de forma negativa ou inversa, ou seja,
quando uma cresce a outra diminui e vice-versa.
Quando os pontos se distribuem nos quatro quadrantes, haver valores posi-
tivos e negativos, logo a soma tende para zero, e nesse caso, afrmamos que no
existe relao linear entre essas variveis. Observamos que essa estatstica tende
para zero, mesmo havendo uma relao que no seja linear, por exemplo se os
dados tivessem o formato de uma parbola, ou relao quadrtica.
Apesar de a covarincia ser uma estatstica adequada para medir relao
linear entre duas variveis, ela no adequada para comparar graus de rela-
o entre variveis, dado que ela est infuenciada pelas unidades de medida
de cada varivel, que pode ser metros, quilmetro, quilogramas, centmetros
etc. Para evitar a infuncia da ordem de grandeza e unidades de cada vari-
vel, dividimos a covarincia pelo desvio-padro de X e de Y, dando origem ao
coefciente de correlao de Pearson:
Notao:
Coefciente de correlao amostral: r
Coefciente de correlao populacional:
Y X
C(X,Y)
r =
S .S
(2)
9,3
r = = 0,95896
2,8723 . 3,3764
Onde:

2
x
2
y
82, 5
S = = 8, 25 S = 2, 8723
x
10
114, 0
S = = 11, 4 S = 3, 3764
y
10
Como o coefciente de correlao est isento de unidades e da ordem de
grandeza das variveis, este toma valores entre 1 e 1.
Relao positiva r tomar o valor 1 quando a relao perfeita.
Relao negativa r tomar o valor 1 quando a relao perfeita.
Relao difusa ou no linear r ser igual a 0.
No Excel, usando a opo Correlao em Anlise de dados, obtemos:
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
194
Anlise de Correlao e Medidas de Associao
O coefciente de Determinao
Outro coefciente amplamente utilizado para mensurar o grau de correla-
o entre duas variveis o coefciente de determinao. defnido elevando
o valor do coefciente de Pearson ao quadrado e denotado por r
2
. Pode ser
interpretado como a proporo da variao de Y que explicada pela vari-
vel X (e vice-versa).
Muito embora o coefciente de determinao seja relativamente fcil de
interpretar, ele no pode ser testado estatisticamente. Contudo, a raiz qua-
drada do coefciente de determinao, que o coefciente de correlao (r),
pode ser testada estatisticamente, pois est associada a uma estatstica de
teste que distribuda segundo uma distribuio t de Student, quando a
correlao populacional
= 0.
O coefciente de correlao para dados populacionais :
Populao:
2
=
O coefciente de correlao para dados amostrais :
Amostra:
2
r = r
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Correlao e Medidas de Associao
195
Signifcncia do coefciente de correlao
Para comprovarmos se o coefciente de correlao signifcativo, deve-
mos realizar o seguinte teste de hipteses:
Hipteses:

0
1
H : = 0
H : 0
A estatstica de teste

c
2
r n 2
t =
1 r
com n-2 graus de liberdade na tabela t de Student. Caso o valor de t
c
seja supe-
rior ao valor crtico de t, devemos rejeitar a hiptese nula. Se a hiptese nula,
ao nvel de signifcncia , for rejeitada podemos concluir que efetivamente
existe uma relao signifcativa entre as variveis.
Exemplo 1: Para estudar a poluio de um rio, um cientista mediu a concen-
trao de um determinado composto orgnico (Y) e a precipitao pluvio-
mtrica na semana anterior (X):
X Y
0,91 0,10
1,33 1,10
4,19 3,40
2,68 2,10
1,86 2,60
1,17 1,00
Existe alguma relao entre o nvel de concentrao e a precipita-
o pluviomtrica? Teste sua significncia, ao nvel de 5%.
Calculando a mdia de X e de Y temos X = 2,023 e Y = 1, 717.
Calculando a covarincia entre X e Y pela expresso (1),
( ) ( ) ( ) ( ) ( ) ( ) 0,91 2,023 . 0,10 1,717 + 1,33 2,023 . 1,10 1,717 +...+ 1,17 2,023 . 1,00 1,717
C(X, Y) =
6
C(X,Y) = 1,0989
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
196
Anlise de Correlao e Medidas de Associao
Calculando os desvios-padro de X e Y temos: S
x
= 1,125 e S
y
= 1,10
E assim, pela expresso (2),
y x
C(X,Y) 1,0989
r = = = 0, 888
S .S 1,125.1,1
Testando a signifcncia do coefciente,


c
2 2
r n 2 0,888 6 2
t = = = 3, 86
1 r 1 (0,888)
O valor crtico de t para n 2 = 4 graus de liberdade e 5% de nvel de signi-
fcncia 2,78. Note que o teste de signifcncia do coefciente ser sempre
bilateral.
Como o valor calculado de t superior ao valor crtico, podemos concluir
que existem evidncias sufcientes para afrmar que o composto orgnico
(Y) e a precipitao pluviomtrica (X) estejam correlacionados.
Exemplo 2: Procurando quantifcar os efeitos da escassez de sono sobre a
capacidade de resoluo de problemas simples, um agente tomou ao acaso
10 sujeitos e os submeteu a experimentao. Deixou-os sem dormir por di-
ferentes nmeros de horas, aps o que solicitou que os mesmos resolves-
sem os itens contas de adicionar de um teste. Obteve, assim, os seguintes
dados:
N. de erros - Y Horas sem dormir - X
8 8
6 8
6 12
10 12
8 16
14 16
14 20
12 20
16 24
12 24
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Correlao e Medidas de Associao
197
Calcule o coefciente de correlao linear de Pearson e teste a sua signif-
cncia ao nvel de 1%.
Calculando a mdia de X e de Y temos X = 16 e Y = 10, 6 .
Calculando a covarincia entre X e Y pela expresso (1),
( ) ( ) ( ) ( ) ( ) ( ) 8 16 . 8 10,6 + 8 16 . 6 10,6 +...+ 24 16 . 12 10,6
C(X, Y) = =15, 2
10
Calculando os desvios-padres de X e Y temos:
S
x
= 5,656854 e S
y
= 3,352611
E assim, pela expresso (2),
y x
C(X,Y) 15,2
r = = = 0, 801467
S .S 5,656854. 3,352611
Observao: procure sempre usar o maior nmero de casas decimais
possvel.
Usando a planilha Excel poderemos tambm obter uma matriz de covarin-
cia, que nos fornece a covarincia entre X e Y alm da varincia de X e de Y.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
198
Anlise de Correlao e Medidas de Associao
Agora testando a signifcncia do coefciente,


c
2 2
r n 2 0,801467 10 2
t = = = 3, 79
1 r 1 (0,801467)
O valor crtico de t para n2 = 8 graus de liberdade e 1% de nvel de
signifcncia 3,355 (bilateral).
Como o valor calculado de t superior ao valor crtico, podemos con-
cluir que existem evidncias sufcientes para afrmar que o nmero
de horas sem dormir (X) infuencia signifcativamente o nmero de
erros (Y).
Medidas de Associao
Frequentemente, estamos interessados em verifcar a existncia de asso-
ciao entre dois conjuntos de escores e tambm o grau dessa associao.
No caso paramtrico, a medida usual o coefciente de correlao r de Pear-
son que exige mensurao dos escores no mnimo ao nvel intervalar. Ainda,
se estivermos interessados em comprovar a signifcncia de um valor obser-
vado de r de Pearson deveremos supor que os escores provenham de uma
distribuio normal. Quando essas suposies no so atendidas, podemos
utilizar um dos coefcientes de correlao no paramtricos e suas respecti-
vas provas de signifcncia.
Coefciente de Contingncia C
Este coefciente mede a associao entre dois conjuntos de atributos
quando um ou ambos os conjuntos so medidos em escala nominal.
Considere uma tabela de contingncia k x r, que representa as frequn-
cias cruzadas dos escores A (divididos em k categorias) e escores B (divididos
em r categorias). O grau de associao entre dois conjuntos de atributos
calculado por:
2
2

C =
n+
onde
2
a estatstica Qui-quadrado.
O p-valor associado ao valor da estatstica Qui-quadrado com (r-1) x (k-1) graus
de liberdade a prova de signifcncia do coefciente de contingncia C.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Correlao e Medidas de Associao
199
O coefciente C se caracteriza por assumir valor zero quando h inexistn-
cia de associao, porm nunca ser igual 1. O limite superior do coefcien-
te dado por
k 1
k
(quando k = r). Note que para calcular o coefciente C, a
tabela de contingncia deve satisfazer as restries do teste Qui-quadrado.
Exemplo: Estudantes de escolas particulares e de escolas pblicas selecio-
nados aleatoriamente foram submetidos a testes padronizados de conhe-
cimento e produziram os resultados abaixo. Verifque o grau de associao
entre as variveis mensuradas e teste a signifcncia ao nvel de 5%.
Escores
Escola 0 275 276 350 351 425 426 500
Particular 6 14 17 9
Pblica 30 32 17 3
Queremos aqui verifcar o grau de associao entre as variveis Escola e
Escore de conhecimento. A varivel Escola mensurada em nvel nominal,
o que inviabiliza a utilizao do coefciente r de Pearson.
Obtendo ento o coefciente de Contingncia, necessitamos inicialmente
calcular o valor da estatstica

2
:

Freq.
Obs.
6 14 17 9
30 32 17 3
Freq.
Esp.
12,94 16,53 12,22 4,31
23,06 29,47 21,78 7,69
( ) ( ) ( )

2
2 2 2
6 12,94 14 16,53 3 7,69
= + +... + = 17, 28
12,94 16,53 7,69
O coefciente de contingncia :

2
2
17,28
C = = = 0, 345
128+17,28 n+
Para testar a signifcncia do coefciente, precisamos verifcar o valor cr-
tico de

2
considerando =0,05 e (r1) x (k1) = 3 graus de liberdade. Esse
valor igual a 7,81. Comparando com o valor calculado de 17,28, podemos
admitir a existncia de associao signifcativa entre a escola e o escore de
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
200
Anlise de Correlao e Medidas de Associao
conhecimento. Analisando atentamente, poderamos acrescentar que o fato
de um estudante pertencer a uma escola particular faz com que ele obtenha
um escore de conhecimento mais alto.
Coefciente de correlao de Spearman
uma medida de associao que exige que ambas as variveis se apre-
sentem em escala de mensurao pelo menos ordinal. Basicamente, equi-
vale ao coefciente de correlao de Pearson aplicado a dados ordenados.
Assim,
.


s
2 2
xy
r = = r
x y
ou seja, o coefciente de correlao de Spearman se utiliza da expresso do
coefciente de Pearson, porm calculado com postos. Essa expresso equi-
vale

n
2
i
i=1
s 3
6
d
r =1

n n
onde d
i
= x
i
y
i
a diferena de postos dos escores X e Y.
Para verifcar a signifcncia do valor observado de r
s
, podemos usar a ex-
presso de t de Student

s
2
s
n 2
t = r
1
r
onde t tem n2 graus de liberdade.
Exemplo: As notas obtidas por 10 estudantes de Administrao e o seu QI
(quociente de inteligncia) so apresentadas no quadro abaixo:
Notas 8 9,5 10 9,1 6,5 9 9,5 5,2 9,1 9,3
QI 127 149 150 135 122 129 142 100 136 139
Utilize o coefciente de Spearman para verifcar se as variveis esto asso-
ciadas e qual o seu grau de associao.
Inicialmente, ordenamos os valores originais, transformando-os em
postos. Aqui ento substitumos os valores originais pelos seus respectivos
postos, ou seja, o menor valor da varivel em questo ser substitudo pelo
valor 1 e assim por diante. Em seguida, calculamos as diferenas de postos:
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Correlao e Medidas de Associao
201
Notas 3 8,5 10 5,5 2 4 8,5 1 5,5 7
QI 3 9 10 5 2 4 8 1 6 7
di 0 0,5 0 0,5 0 0 0,5 0 0,5 0
(di)2 0 0,25 0 0,25 0 0 0,25 0 0,25 0
Calculando o coefciente:
( )



n
2
2 2 2
i
i=1
s 3 3
6
d
6. 0 + 0,25 ++0
6. 0,25
r = 1 = 1 =1 = 0, 998
n 990 10 10
n
( )



n
2
2 2 2
i
i=1
s 3 3
6
d
6. 0 + 0,25 ++0
6. 0,25
r = 1 = 1 =1 = 0, 998
n 990 10 10
n
Verifcando a signifcncia estatstica do coefciente:
( )


s 2 2
s
n 2 8 8
t = r = 0, 998 = 0, 998 = 44, 63
1 0,004
r 1 0,998
O valor crtico da estatstica t de Student obtido defnindo-se n2 = 8
graus de liberdade e o nvel de signifcncia, que admitiremos igual a 1%.
Este valor igual a 3,36. Mais uma vez temos aqui um teste bilateral pois
estamos verifcando se o coefciente diferente de zero.
Assim, podemos comprovar que o coefciente de associao altamente
signifcativo, ou seja, existem fortes indcios que apontam para notas altas
obtidas por aqueles que possuem maiores quocientes de inteligncia.
Ampliando seus conhecimentos
Teste de Kappa
(LANDIS; KOCH, 1977)
O Teste de Kappa uma medida de concordncia interobservador e mede
o grau de concordncia, alm do que seria esperado to somente pelo acaso.
Para descrevermos se h ou no concordncia entre dois ou mais avaliado-
res, ou entre dois mtodos de classifcao, utilizamos a medida Kappa que
baseada no nmero de respostas concordantes, ou seja, no nmero de casos
cujo resultado o mesmo entre os avaliadores. Esta medida de concordncia
assume valor mximo igual a 1, que representa total concordncia ou, ainda,
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
202
Anlise de Correlao e Medidas de Associao
pode assumir valores prximos e at abaixo de 0, os quais indicam nenhuma
concordncia.
O coefciente Kappa calculado a partir da seguinte frmula:
Kappa =

0 E
E
P P
1 P

onde P
0
=

nmero de concordncias
nmero de concordncias + nmero de discordncias

e P
E
=
( )
n
i1 i2
i=1
p .p sendo que:
n o nmero de categorias;
i o ndice da categoria (que vale de 1 a n);
p
i1
a proporo de ocorrncia da categoria i para o avaliador 1;
p
i2
a proporo de ocorrncia da categoria i para o avaliador 2.
Para avaliar se a concordncia razovel, Landis, JR e Koch, GG (1977) su-
gerem a seguinte interpretao:
Valores obtidos de Kappa Interpretao
<0 Nenhuma concordncia
0 0,19 Concordncia pobre
0,20 0,39 Concordncia leve
0,40 0,59 Concordncia moderada
0,60 0,79 Concordncia substancial
0,80 1,00 Concordncia quase perfeita
Exemplo: Em certo rgo de fnanciamento, em cada edital aberto, se apre-
sentam diversos pesquisadores que enviam projetos, solicitando recursos
para desenvolv-los. Estes projetos recebem uma avaliao, muitas vezes sub-
jetiva, baseada na opinio de um consultor.
Considere a tabela a seguir, que resume as avaliaes feitas por dois ava-
liadores a 30 projetos que concorrem ao fnanciamento. O interesse deste
estudo saber qual a concordncia entre estes dois profssionais e se h
alguma classifcao com concordncia maior do que as demais.
(
L
A
N
D
I
S

J
R
;

K
O
C
H

G
G
.

T
h
e

m
e
a
s
u
r
e
m
e
n
t

o
f

o
b
s
e
r
v
e
r

a
g
r
e
e
m
e
n
t
f
o
r

c
a
t
e
g
o
r
i
c
a
l

d
a
t
a
.

B
i
o
m
e
t
r
i
c
s
,

1
9
7
7
;

3
3
:

1
5
9
-
1
7
4
)
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Correlao e Medidas de Associao
203
AVALIADOR 2
A B C Total
AVALIADOR 1
A 14 (0,47) 1 (0,03) 1 (0,03) 16 (0,53)
B 3 (0,10) 3 (0,10) 2 (0,07) 8 (0,27)
C 0 (0,00) 1 (0,03) 5 (0,17) 6 (0,20)
Total 17 (0,57) 5 (0,16) 8 (0,27) 30 (1,00)
* entre parnteses as propores
Calculando o coefciente Kappa:
0
14+3+5 22
P = = = 0, 7333
30 30
P
E
=
( )
n
i1 i2
i=1
p .p = (0,57 . 0,53) + (0,16 . 0,27) + (0,27 . 0,20) = 0,3021 + 0,0432

+ 0,054 = 0,3993
Kappa =

0,733 0,3993
= 0, 556
1 0,3993

Note que a concordncia geral pode ser considerada apenas moderada.
Avaliando cada uma das trs classifcaes, notamos que a concordncia
alta quando os avaliadores atribuem o conceito A e o conceito C. No entanto,
para atribuir o conceito B, um conceito intermedirio, a concordncia j no
to satisfatria.
Atividades de aplicao
1. Foi tomada uma amostra aleatria de 10 carregamentos recentes fei-
tos por caminho de uma companhia, anotada a distncia em quil-
metros e o tempo de entrega. Os dados seguem abaixo:
Carregamento 1 2 3 4 5 6 7 8 9 10
Distncia em Km (X) 825 215 1 070 550 480 920 1 350 325 670 1 215
Tempo de entrega
em dias (Y)
3,5 1,0 4,0 2,0 1,0 3,0 4,5 1,5 3,0 5,0
a) Construa o diagrama de disperso.
b) Calcule o coefciente de correlao de Pearson para os dados desta
amostra.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
204
Anlise de Correlao e Medidas de Associao
c) Calcule o coefciente de determinao.
d) Verifque se o coefciente de correlao signifcativo (=0,05).
2. Para uma amostra de n = 10 tomadores de emprstimos em uma com-
panhia fnanceira, o coefciente de correlao entre a renda familiar
mdia e dbitos a descoberto de curto prazo foi calculado r = 0,50.
Teste a hiptese de que no existe correlao entre as duas variveis,
usando um nvel de signifcncia de 5%.
3. Para avaliar a relao entre habilidade verbal e habilidade matemtica,
escores de 8 estudantes foram obtidos, gerando a tabela abaixo:
Estudantes
Escore 1 2 3 4 5 6 7 8
Matemtica 80 50 36 58 72 60 56 68
Verbal 65 60 35 39 48 44 48 61
Calcule o coefciente de correlao e teste sua signifcncia.
4. Em um estudo conduzido com 10 pacientes, estes foram colocados
sob uma dieta de baixas gorduras e altos carboidratos. Antes de iniciar
a dieta, as medidas de colesterol e de triglicerdeos foram registradas
para cada indivduo .
a) Construa um grfco de disperso para esses dados.
b) H alguma evidncia de relao linear entre os nveis de colesterol
e de triglicerdeos?
c) Calcule o coefciente de correlao de Spearman e teste sua signi-
fcncia.
Paciente Colesterol (mmol/l) Triglicerdeos (mmol/l)
1 5,12 2,30
2 6,18 2,54
3 6,77 2,95
4 6,65 3,77
5 6,36 4,18
6 5,90 5,31
7 5,48 5,53
8 6,02 8,83
9 10,34 9,48
10 8,51 14,20
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Correlao e Medidas de Associao
205
Gabarito
1.
a)

b) C( , )=
( ).( )
n
=
4 653
10
=465,3
i i
X Y
X X Y Y


r =
C(X, Y)
S . S
=
465, 3
360, 26.1, 36
=0, 9497
Y X
c) r
2
= (r)
2
= (0,9497)
2
= 0,9019
d) t
r n
r
c
=
2
1
=
0,9497 8
1 0,9019
=8,576
2


Comparando o valor calculado com o valor crtico, considerando 8
graus de liberdade e 5% de signifcncia temos t
crtico
= 2,31. Assim, po-
demos considerar o coefciente de correlao altamente signifcativo.
2. t
r n 2
r
c
=
1
=
0,50 8
1 0,25
=1,63
2


Comparando o valor calculado com o valor crtico, considerando 8
graus de liberdade e 5% de signifcncia temos t
crtico
= 2,31. Assim,
no podemos considerar o coefciente de correlao signifcativo. No
existe correlao entre a renda familiar e os dbitos a descoberto de
curto prazo.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
206
Anlise de Correlao e Medidas de Associao
3. C( , )=
( ).( )
=
654
8
= 81,75 X Y
X X Y Y
n
i i


r
X Y
S S
Y X
=
C( , )
=
81,75
12,77.10,22
= 0,626
.

t
r n
r
c
=
2
1
=
0,626 6
1 0,392
=1,967
2


Comparando o valor calculado com o valor crtico, considerando 6
graus de liberdade e 5% de signifcncia temos t
crtico
= 2,45. Assim,
podemos considerar o coefciente de correlao no signifcativo, ou
seja, no existem evidncias de correlao signifcativa entre habilida-
de verbal e habilidade matemtica.
4.
a)

b) baseado no diagrama acima, no est muito clara a existncia de
relao linear entre colesterol e triglicerdeos.
Paciente Colesterol
(mmol/l)
Triglicerdeos
(mmol/l)
Postos
Colesterol
Postos
Triglicerdeos
d
i
d
i
2
1 5,12 2,30 1 1 0 0
2 6,18 2,54 5 2 3 9
3 6,77 2,95 8 3 5 25
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Correlao e Medidas de Associao
207
Paciente Colesterol
(mmol/l)
Triglicerdeos
(mmol/l)
Postos
Colesterol
Postos
Triglicerdeos
d
i
d
i
2
4 6,65 3,77 7 4 3 9
5 6,36 4,18 6 5 1 1
6 5,90 5,31 3 6 3 9
7 5,48 5,53 2 7 5 25
8 6,02 8,83 4 8 4 16
9 10,34 9,48 10 9 1 1
10 8,51 14,20 9 10 1 1
Soma 96
c) r =1
6 d
n n
=1
6. 96
1000 10
=0,418
s
i
2
i=1
n
3

Para verifcar a signifcncia do valor observado de r


s
podemos
usar a expresso de t de Student
t=r
r
s
.
n 2
1
=0,418.
8
1 0,1748
=1,30
s
2


Comparando o valor calculado com o valor crtico, considerando 8
graus de liberdade e 5% de signifcncia temos t
crtico
= 2,31. Assim,
podemos considerar o coefciente de associao signifcativo, ou
seja, existem evidncias de correlao signifcativa entre colesterol
e triglicerdeos.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Ref er nc i as
BUSSAB, W. O.; MORETIN, P. A. Estatstica Bsica. 4. ed. So Paulo: Saraiva, 2003.
BARROS, Emilio. Aplicaes e Simulaes Monte Carlo e Bootstrap. Monografa
(Bacharelado em Estatstica) Universidade Estadual de Maring, Maring, 2005.
Disponvel em: <www.des.uem.br/graduacao/Monografas/Monografa_Emilio.
pdf.>. Acesso em: 23 nov. 2007.
CAMPOS, G. M. Estatstica Prtica para Docentes e Ps-Graduados. Disponvel em:
<www.forp.usp.br/restauradora/gmc/gmc_livro/gmc_livro_cap14.html>. Acesso
em: 23 nov. 2007.
COSTA NETO, P. L. de O. Estatstica Bsica. 2. ed. So Paulo: Edgard Blcher, 2002.
GONALVES, Lren Pinto Ferreira. Avaliao de Ferramentas de Minerao de
Dados como Fonte de Dados Relevantes para a Tomada de Deciso: aplica-
o na Rede Unido de Supermercados. Dissertao (Mestrado Interinstitucio-
nal em Administrao) Universidade da Regio da Campanha (Urcamp), So
Leopoldo, 2001. Disponvel em: <http://volpi.ea.ufrgs.br/teses_e_dissertacoes/
td/000410.pdf>
HOAGLIN, D. C.; MOSTELLER, F.; TUKEY, J. W. Anlise Exploratria de Dados
Tcnicas Robustas. Lisboa: Edies Salamandra, 1983.
HOEL, PORT & STONE. Introduo Teoria da Probabilidade. Rio de Janeiro: Edi-
tora Intercincia ,1981.
KAZMIER, L. J. Estatstica Aplicada Economia e Administrao. 4. ed. So
Paulo: Bookman 2007.
LANDIS JR, Koch GG. The measurement of observer agreement for categorical
data. Biometrics 1977.
LEVINE, D. M.; BERENSON, M. L.; STEPHAN, D. et al. Estatstica: Teoria e
Aplicaes Usando Microsoft Excel. 3. ed. Rio de Janeiro: LTC, 2005.
MATTAR, F. N. Pesquisa de Marketing. So Paulo: Atlas, 2001.
______. So Paulo: Atlas, 1996. (Edio compacta).
247
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
248
Referncias
MEYER, P. L. Probabilidade: Aplicaes Estatstica. 2. ed. Rio de Janeiro: LTC,
2000.
SIEGEL, S.; CASTELLAN JR., N. J. Estatstica No Paramtrica para Cincias do
Comportamento. Porto Alegre: Artmed, 2006.
TRIOLA, M. F. Introduo Estatstica. 9. ed. Rio de Janeiro: LTC, 2005.
VIEIRA, S., WADA, R. O que Estatstica? 3. ed. So Paulo: Brasiliense, 1991.
WONNACOT, T. H. WONNACOTT, R. J. Estatstica Aplicada Economia e Admi-
nistrao. Rio de Janeiro: LTC, 1981.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

Potrebbero piacerti anche