Sei sulla pagina 1di 10

COEFICIENTES DE CORRELAO PARA VARIVEIS ORDINAIS E

DICOTMICAS DERIVADOS DO COEFICIENTE LINEAR DE PEARSON


CORRELATION COEFFICIENT DERIVED FROM PEARSON
LINEAR COEFFICIENT FOR ORDINAL AND DICHOTOMIC VARIABLES

Sachiko Araki Lira Anselmo Chaves Neto


Instituto Paranaense de Desenvolvimento Econmico e Universidade Federal do Paran
Social - IPARDES Programa de Ps-Graduao em Mtodos Numricos
Rua Mximo Joo Kopp, 274 - Bloco 2 - Santa Cndida em Engenharia - Centro Politcnico
CEP: 82630-900 - Curitiba - Paran CEP: 81531-990 - Curitiba - Paran
sachiko@onda.com.br anselmo@est.ufpr.br

RESUMO
Devido a grande utilizao da Anlise de Correlao em diferentes reas do conhecimento, importante conhecer os
diferentes mtodos para a obteno dos coeficientes de correlao. comum as situaes em que as variveis no so
medidas em nvel intervalar, mas em nvel ordinal e/ou dicotmica. Apresentam-se no presente trabalho os mtodos de
coeficientes de correlao derivados do coeficiente linear de Pearson, para situaes que envolvem variveis medidas em
nvel intervalar, ordinal e dicotmica, quais sejam: coeficiente de correlao ponto bisserial, phi, de Spearman, entre
variveis intervalar e ordinal e entre variveis ordinal e dicotmica.
Palavras-chave: coeficiente de correlao; coeficiente de correlao para variveis ordinais e dicotmicas.

ABSTRACT
As the Correlation Analysis is used in several knowledge areas, it is important to be familiar with the different methods
existing to obtain correlation coefficients. Usually, we can find situations where variables are not measured by interval level
but according to ordinal and/or dichotomic. The present work shows the correlation coefficient methods derived from
Pearson linear coefficient and applied to situations involving variables measured by interval, ordinal and dichotomic levels,
such as: bi-serial point, phi and Spearman correlation coefficient, between interval and ordinal variables, and between
ordinal e dichotomic variables.
Keywords: correlation coefficient; correlation coefficient for ordinal and dichotomic variables

1 - INTRODUO primeiro mtodo de correlao, introduzido por Karl


Pearson em 1897, conforme apresentado em Lira [7].
A Anlise de Correlao uma ferramenta importante para as Uma das suposies para a utilizao deste coeficiente
diferentes reas do conhecimento, no somente como de que as variveis envolvidas na anlise sejam medidas
resultado final, mas como uma das etapas para a utilizao de no mnimo em nvel intervalar. Entretanto, em muitas
outras tcnicas de anlise. situaes, no possvel a utilizao desse tipo de escala
A anlise de confiabilidade em sistemas de engenharia de medida. Foram ento desenvolvidos os coeficientes de
tem como objetivo avaliar a probabilidade de no haver falha correlao derivados do coeficiente linear de Pearson para
durante a sua vida til, atendendo aos objetivos para os quais situaes que envolvem variveis medidas em nvel ordinal
o sistema foi projetado. e dicotmica.
A avaliao da probabilidade de falha usualmente
identificada como a anlise de confiabilidade estrutural.
2 - OBJETIVO
Dois mtodos analticos bastante utilizados so: First Order
Reliability Method (FORM) e Second Order Reliability O objetivo deste trabalho apresentar uma reviso sobre os
Method (SORM). Segundo Haldar e Mahadevan [6], os diferentes mtodos de correlao derivados do coeficiente
mtodos FORM e SORM assumem implicitamente que as linear de Pearson, quais sejam: coeficiente de correlao
variveis envolvidas na anlise so no correlacionadas. ponto bisserial, coeficiente de correlao phi, coeficiente de
Portanto, deve-se, obter inicialmente as correlaes entre correlao de Spearman, coeficiente de correlao entre
as variveis. varivel ordinal (rank) e varivel intervalar e coeficiente
O mtodo usualmente conhecido para medir a de correlao entre varivel ordinal (rank) e varivel
correlao entre duas variveis o coeficiente de dicotmica. Estes dois ltimos coeficientes so apresentados
correlao linear de Pearson, tambm conhecido como em Wherry [10].
coeficiente de correlao do momento produto. Este foi o

RECIE, Uberlndia, v. 15, n. 1/2, p. 45-53, jan.-dez. 2006 45


Sachiko Araki Lira e Anselmo Chaves Neto

3 - MTODOS PARA A OBTENO DO Cabe lembrar que o coeficiente de determinao a


COEFICIENTE DE CORRELAO relao entre a variao explicada pelo modelo linear
(Y = + X , onde e so constantes) e a variao
3.1. Coeficiente de correlao linear de Pearson
total.
A significncia do coeficiente de correlao estimado
O coeficiente de correlao populacional (parmetro) e sua
verificada atravs de teste de hipteses. A estatstica para
estimativa amostral esto intimamente relacionados com a testar a hiptese H 0 : = 0 contra H 1 : 0 tem
distribuio normal bivariada, cuja funo densidade de distribuio t com n - 2 graus de liberdade, ou seja:
probabilidade dada por:
n 2
t= ~ t n 2 (4)
1

1 X


2
X X Y Y Y Y
2

1 2
f X, Y (X, Y) = exp X
2 +
2 X Y
2
2(1 ) X









1 2 X Y Y
onde:
(1) n o nmero de observaes da amostra
o coeficiente de correlao linear de Pearson
COV ( X , Y ) X ,Y
sendo X , Y = = = (2) 3.2. Coeficientes de correlao derivados do coeficiente
XY XY linear de Pearson

o parmetro populacional 3.2.1. Coeficiente de correlao ponto bisserial

onde: Embora seja usada normalmente como medida de correlao


COV ( X , Y ) a covarincia entre X eY entre escores e itens de testes, a correlao ponto bisserial
X o desvio padro de X pode ser empregada em outras situaes onde a varivel
dicotmica pode ser, a ttulo de exemplo, perfeito ou
Y o desvio padro de Y defeituoso, certo ou errado.
O Estimador de Mxima Verossimilhana dado pela O coeficiente de correlao ponto bisserial derivado
expresso: do coeficiente de correlao linear de Pearson. Esse
mtodo indicado quando uma das variveis (Y)
dicotmica e a outra (X), contnua.
(Xi X)(Yi Y) (Xi X)(Yi Y)
n n
Conforme apresentado em Ferguson [4], a correlao
X,Y = = i=1
= i=1 ponto bisserial fornece uma medida da relao entre uma

n
n (X X) (Y Y)
i
2
n
i
2 n X Y varivel contnua, e outra varivel com duas categorias ou
dicotmicas, como perfeito ou defeituoso.
i=1 n i=1 n Segundo Ferguson [4], Downie e Heath [3] e Guilford
[5], a correlao ponto bisserial a correlao do momento
(3)
produto. Se for atribudo 1 para observaes de uma
onde:
categoria e zero para outra, e se for calculado o coeficiente
n o nmero de observaes da amostra
de correlao do momento produto, o resultado ser o
X a mdia aritmtica de X coeficiente ponto bisserial. Ele interpretado da mesma
Y a mdia aritmtica de Y forma que .
O estimador do coeficiente de correlao ponto
Este coeficiente tambm conhecido como bisserial foi obtido a partir do estimador do coeficiente de
Coeficiente de Correlao do Momento Produto. correlao linear de Pearson, conforme apresentado em
Na prtica, conforme apresentado em Lira [7], o Guilford [5].
coeficiente de correlao interpretado como um Fazendo x i = Xi X e yi = Yi Y , o estimador do
indicador que descreve a interdependncia entre as coeficiente linear de Pearson :
variveis X e Y.
Outra forma de interpretar o coeficiente de correlao n n n

em termos de 2 = R 2 , denominado coeficiente de


x i yi x i yi x i yi
i =1 i =1 i =1
= = =
n x y
(X i X ) (Yi Y )
determinao ou de explicao. Quando multiplicado por n n n 2 n 2
100, o 2 = R 2 fornece a percentagem da variao em Y x i2 y i2
i =1 i =1 i =1 i =1
n
(varivel dependente), que pode ser explicada pela n n
variao em X (varivel independente), ou seja, o quanto (5)
de variao comum s duas variveis.
onde:
n o nmero de observaes da amostra

46 RECIE, Uberlndia, v. 15, n. 1/2, p. 45-53, jan.-dez. 2006


Coeficientes de correlao para variveis ordinais e dicotmicas derivados do coeficiente linear de pearson

X o desvio padro amostral de X De acordo com Wherry [10], a significncia do


coeficiente estimado testada pela estatstica:
Y o desvio padro amostral de Y
pb n 2
Sendo X uma varivel aleatria contnua e Y uma t= ~ t n2 (12)
varivel aleatria com distribuio de Bernoulli, tem-se, 1 2pb
ento, que, por convenincia:
onde:
n o nmero de observaes da amostra
(X i X )
n 2
pb o coeficiente de correlao ponto bisserial
x =
Sx = i =1
(6)
n 3.2.2. Coeficiente de correlao de Spearman

S y = Y = pq , onde p = e q = (1 - ) da Este coeficiente o mais antigo e tambm o mais


distribuio de Bernoulli. (7) conhecido para calcular o coeficiente de correlao entre
variveis mensuradas em nvel ordinal, chamado tambm
Desenvolvendo (5), tem-se: de coeficiente de correlao por postos de Spearman,
designado rho e representado por s .
x i yi = (Xi X )(Yi Y )
n n
(8)
i =1 i =1 importante enfatizar, segundo Bunchaft e Kellner
[2], que as correlaes ordinais no podem ser
x i yi = [Xi Yi Xi Y XYi + X Y ]
n n
interpretadas da mesma maneira que para variveis
i =1 i =1 medidas em nvel intervalar. Inicialmente, no mostram
n n necessariamente tendncia linear, mas podem ser
x i yi = Xi Yi n X Y (9) consideradas como ndices de monotonicidade, ou seja,
i =1 i =1 para aumentos positivos da correlao, aumentos no valor
Substituindo (9) em (5), tem-se: de X correspondem a aumentos no valor de Y, e para
coeficientes negativos ocorre o oposto. O quadrado do
n coeficiente de correlao no pode ser interpretado como a
Xi Yi n XY n proporo da varincia comum s duas variveis.
= i =1
mas X i Yi = n p X p Seu estimador foi derivado a partir do estimador do
nSx pq i =1
coeficiente de correlao linear de Pearson, conforme
apresentado em Siegel [8].
e n X Y = n X p = n p X , ento,
Tem-se da expresso (5) que:
n
np Xp np X
= (10) x i yi
nS x pq i =1
= (13)
n n
Dividindo por n, tem-se: x i2 y i2
i =1 i =1

=
pXp pX
=
(X p X p ) onde: x i = Xi X e yi = Yi Y
S x pq S x pq n
n ( n + 1)
Dividindo por p , tem-se:
Pode-se escrever: X
i =1
i =
2
, onde

pb =
(
Xp X ) p
(11)
n = postos=rank = 1, 2, 3,..., n (14)

Sx q Os quadrados dos postos so: 12 , 2 2 , 32 ,..., n 2

n
onde: n ( n + 1)(2n + 1)
pb o coeficiente de correlao ponto bisserial
Ento: X
i =1
2
i
=
6
(15)

X p a mdia dos valores de X para o grupo superior 2


n
(grupo cuja varivel Y assume valor 1) Xi
x i2 = ( )
n n n
Xi X = Xi2 i =1
2
X a mdia total de X da amostra Assim, (16)
i =1 i =1 i =1 n
Sx o desvio padro total de X da amostra
p a proporo de casos do grupo superior (grupo cuja n n ( n + 1)( 2n + 1) [n ( n + 1) / 2] 2
varivel Y assume valor 1) x i2 =
i =1 6 n
q a proporo de casos do grupo inferior (grupo cuja
varivel Y assume valor 1)

RECIE, Uberlndia, v. 15, n. 1/2, p. 45-53, jan.-dez. 2006 47


Sachiko Araki Lira e Anselmo Chaves Neto

n n3 n Para n 10 , a expresso acima tem distribuio t de


x i2 =
12
(17) Student com n-2 graus de liberdade.
i =1
Segundo Silveira [9], a relao entre uma escala
intervalar e ordinal de monotonicidade e a transformao
Da mesma forma, obtm-se:
monotnica em uma varivel causa pouco efeito sobre
n n3 n coeficientes de correlao, razes t e F. Assim, uma varivel
y 2i = 12
(18) medida em nvel ordinal pode ser tratada como intervalar.
i =1

Fazendo a diferena de postos: 3.2.3. Coeficiente de correlao phi

d i = x i yi (19) Em algumas situaes, as variveis so medidas em nvel


elevando ao quadrado tem-se: nominal ou por categorias discretas e expressas em forma
de freqncias. Nesses casos, no possvel a utilizao de
d 2 = (x i yi )2 = x i2 2x i yi + yi2 (20) nenhum dos mtodos vistos anteriormente.
i
O estimador do coeficiente de correlao phi tambm
fazendo o somatrio:
foi obtido a partir do estimador do coeficiente linear de
n n n n Pearson, bastando fazer com que a varivel X tambm seja
d 2i = x i2 + yi2 2 x i yi (21) dicotmica e distribuda conforme apresentada a seguir:
i =1 i =1 i =1 i =1

n Varivel X
x i yi 1 0 TOTAL
i =1
fazendo s = , tem-se que
n n Varivel 1 a b np
x i2 y i2
i =1 i =1 Y 0 c d nq
TOTAL n p' n q' n
n n n
x i yi = s x i2 yi2 (22)
i =1 i =1 i =1 Tem-se da expresso (11) que o estimador do
coeficiente de correlao ponto bisserial :
substituindo (17), (18) e (22) em (21) tem-se:

bp =
(
Xp X ) p
(25)
n n3 n n n
Sx q
d 2i = 2 12 2 s x i2 yi2
i =1 i =1 i =1
a a c c
mas X p = = e Xq = = (26)
Assim, obtm-se: np a + b nq c+ d

6 di2
n
p=
(a + b ) e q=
(c + d ) (27)
n n
s = 1 i =1
2
(23)
n (n 1)
X = pX p + q X q =
(a + b ) a
+
(c + d ) c = (a + c ) (28)
onde: n (a + b ) n (c + d ) n
s o coeficiente de correlao de Spearman
(a + c) ( b + d ) 1
d i a diferena entre as ordenaes S x = n p' n q' = = (a + c)(b + d ) (29)
n n n
n o nmero de pares de ordenaes
Ento, substituindo as expresses (26), (27), (28) e
Quando a seleo dos elementos que compem a amostra
(29) na (25), tem-se:
feita de forma aleatria, a partir de uma populao,
possvel determinar se as variveis em estudo so associadas
na populao. Ou seja, possvel testar a hiptese de que as
a

(a + c) na (a + b )(a + c )
(a + b) (a + b) n (a + b ) (a + b)
duas variveis esto associadas na populao. = n
=
Para amostras superiores a 10, segundo Siegel [8], a
1
(a + c)(b + d ) (a + c) 1
(a + c)(b + d ) (a + c)
n n
significncia de um valor obtido de s pode ser verificada
atravs de t calculado pelo estimador apresentado a seguir. = na (a + b )(a + c ) (a + b )
(a + b ) (a + c )(b + d ) (a + c )
n2
t = s (24)
1 s2 = (ad bc ) (30)
(a + b)(a + c)(b + d)(c + d)

48 RECIE, Uberlndia, v. 15, n. 1/2, p. 45-53, jan.-dez. 2006


Coeficientes de correlao para variveis ordinais e dicotmicas derivados do coeficiente linear de pearson

onde: n 2 1
Y = (36)
o coeficiente de correlao phi 12
a,b,c,d so as frequncias da tabela de contingncia Sendo X uma varivel dicotmica, ento:
n a soma das frequncias a,b,c e d
n = n 0 + n1
O coeficiente de correlao phi est relacionado com
onde:
2 para a tabela 2x2, dada pela expresso a seguir, como
n o nmero total de observaes da amostra
apresentada em Ferguson [4]: n 0 o nmero de observaes cuja varivel X assume
2 valor zero
= ou 2 = n 2 (31) n 1 o nmero de observaes cuja varivel X assume
n
valor um

Por essa razo, pode-se testar a significncia de n n1 n0 n1
X i Yi = Yi 1 + Yi 0 = Yi (37)
calculando o valor de = n 2 2
e comparando com o i =1 i =1 i =1 i =1

valor de 2 , com 1 grau de liberdade [4]. n n

variam entre -1 e +1. Entretanto, para Xi = Xi2 = n1 (38)


Os valores de i =1 i =1

Bunchaft e Kellner [2] suficiente que a e d indiquem ou A mdia e a varincia de X sero dadas por:
concordncia ou discordncia, o mesmo acontecendo com
n
b e c.
Xi n1
i =1
X= = (39)
3.2.4. Coeficiente de correlao entre variveis dicotmica n n
e ordinal (rank)
n2 n n 1 n 12
Este coeficiente utilizado, segundo Wherry [10], quando n1
n = n n 1 (n n 1 )
uma das variveis (X) dicotmica e a outra ordinal X = = (40)
(rank). O seu estimador tambm foi obtido a partir do
n n n2
coeficiente de correlao linear de Pearson.
O estimador do coeficiente de correlao linear de Substituindo (35), (36), (39) e (40) em (32) tem-se:
Pearson dado pela expresso (3) pode ser reescrito como: n n1 n (n + 1) n
n n Yi - n
2 Yi - n1 (n + 1)
i =1
X i Yi 2
i =1
n
dr = n = 2n
X i Yi i =1 i =1
[n1(n1 + n 0 )] n 2 - 1
(X i X )(Yi Y ) n1 (n n1 ) n 2 - 1
n
i =1 n
i =1 n n2 12 n2 12
X ,Y = = (32)
n X Y X Y
Sendo X a varivel dicotmica e Y a varivel ordinal Resultando em:
(rank), ento tem-se: n
2 Yi n 1 (n + 1)
i =1
n n (n + 1) dr = (41)
Yi
i =1 2
= onde
(
n1 n 0 n 2 1 )
n = postos=rank = 1, 2, 3,..., n (33) 3
onde:
Os quadrados dos postos so: 1 , 2 , 3 ,..., n 2 2 2 2 dr o coeficiente de correlao entre as variveis X e Y
n
n n ( n + 1)( 2n + 1) Yi a soma da varivel ordinal Y
Ento: Yi2 = 6
(34) i =1
i =1 n o nmero total de observaes
n 0 o nmero de observaes cuja varivel X assume
A mdia de Y dada por:
valor zero;
n n 1 o nmero de observaes cuja varivel X assume
Yi n +1 valor um.
i =1
Y= = (35)
n 2 A significncia do coeficiente estimado para amostras
E a varincia ser dada por: com n 30 , poder ser obtida atravs da estatstica Z,
como segue:

RECIE, Uberlndia, v. 15, n. 1/2, p. 45-53, jan.-dez. 2006 49


Sachiko Araki Lira e Anselmo Chaves Neto

Z = dr n 1 (42) ri o coeficiente de correlao entre a varivel ordinal e


intervalar
3.2.5. Coeficiente de correlao entre varivel ordinal Y o desvio padro da varivel Y
(rank) e intervalar
n o nmero de observaes da amostra
Quando tem-se uma varivel (X) ordinal e outra (Y)
A significncia do coeficiente estimado poder ser
intervalar, possvel estimar o coeficiente atravs do
estimador apresentado em Wherry [10], que tambm obtida atravs de:
derivou-se do coeficiente linear de Pearson. n2
Conforme apresentado na expresso (32), o estimador t = ri ~ t n 2 (50)
do coeficiente linear de Pearson : 1 2ri
n n

n X i Yi 4 - RESULTADOS E DISCUSSO
X i Yi i =1 i =1

(X i X )(Yi Y )
n
i =1 n Para a aplicao de diferentes mtodos de coeficiente de
X ,Y = i =1
= n (43) correlao derivados do coeficiente linear de Pearson,
n X Y X Y gerou-se diferentes amostras pelo processo de simulao
Monte Carlo, utilizando o Statistical Software Analysis
Se X uma varivel ordinal (rank), ento possvel (SAS), atendendo s suposies quanto ao nvel de
escrever: mensurao das variveis envolvidas na anlise. Os
algoritmos utilizados encontram-se no apndice.
n n (n + 1)
Xi =
2
onde n = postos= rank = 1, 2, 3,..., n
i =1 4.1. Aplicao do coeficiente de correlao ponto bisserial

Os quadrados dos postos so: 12 , 2 2 , 32 ,..., n 2 Gerou-se uma amostra aleatria em que a varivel X
intervalar e a varivel Y dicotmica. A amostra aleatria
n ( n + 1)( 2n + 1)
n
e as estatsticas encontram-se nos quadros A.1 e A.2 do
Ento: X 2i = 6
(44)
apndice.
i =1
A mdia e a varincia da varivel X sero obtidas por: O coeficiente de correlao ponto bisserial calculado
n foi pb = 0,76533 . Calculando-se o coeficiente linear de
Xi n (n + 1) n + 1 Pearson para as variveis X e Y, evidentemente obteve-se o
i =1
X= = = (45) mesmo valor, pois trata-se do mesmo coeficiente.
n n2 2
2
A significncia do coeficiente de correlao ponto
n bisserial quanto do coeficiente linear de Pearson
X i
< 0,01 , cujo valor de t calculado foi 7,33.
(X i X )
n n
2 i =1
X i2 n
i =1 i =1
X = = (46) 4.2. Aplicao do coeficiente de correlao de Spearman
n n
Tem-se que: As variveis X e Y geradas aleatoriamente so ordinais,
apresentadas no quadro A.3. Foram calculados os
2
n coeficientes de correlao de Spearman e o linear de
Xi Pearson, cujo coeficiente estimado foi = S = 0,80423 ,
n n3 n
Xi2 i =1 n = 12 (47) com t = 7,16 , significativo, portanto, para < 0,01.
i =1

Substituindo (47) em (46) tem-se: 4.3. Aplicao do coeficiente de correlao phi

n3 n n 2 1 Gerou-se uma amostra aleatria de variveis dicotmicas


X = = (48)
12 n 12 X e Y que se encontra no quadro A.4.
O coeficiente de correlao phi calculado a partir da
Substituindo (45) e (48) em (43) tem-se: tabela de contingncia apresentada na tabela A.1
n n n exatamente igual ao coeficiente linear de Pearson,
X i Yi (n + 1) Yi X i Yi calculado a partir das variveis dicotmicas X e Y, qual
i =1
i =1 (n + 1) Y
i =1

ri =
n 2n
= n 2 (49) seja = = 0,78667 .
n 2 1 n 2 1 O teste de significncia utilizando a estatstica t indica
Y Y nvel de significncia < 0,01 , com t = 7,85 . Utilizando-se
12 12

onde:

50 RECIE, Uberlndia, v. 15, n. 1/2, p. 45-53, jan.-dez. 2006


Coeficientes de correlao para variveis ordinais e dicotmicas derivados do coeficiente linear de pearson

o teste 2 , a significncia tambm de < 0,01 , para 5 CONCLUSO


= 31,47 .
2
Conclui-se portanto que possvel utilizar o coeficiente
Para Andenberg [1], quando as variveis nominais so linear de Pearson para variveis medidas a nvel intervalar,
definidas como dicotmicas, podem ser consideradas nas ordinal e dicotmica, tendo as devidas precaues na
anlises como variveis medidas em nvel intervalar. interpretao, ou seja, o quadrado do coeficiente de
Evidentemente, as estatsticas t e 2 diferem em seus correlao no pode ser interpretado como a proporo da
valores, no entanto, as signficncias so iguais. Portanto, varincia comum s duas variveis ( R 2 ), quando
uma vez definido o nvel de significncia, aceita-se ou envolvem variveis ordinais e dicotmicas.
Dentre os fatores que afetam o coeficiente linear de
rejeita-se H 0 , tanto para a estatstica t quanto para 2 .
Pearson, pode-se citar o tamanho da amostra, principalmente
quando pequeno. Assim, apesar da possibilidade da
4.4. Aplicao do coeficiente de correlao entre variveis utilizao do coeficiente linear de Pearson, para as variveis
dicotmica e ordinal que no so medidas no mnimo em nvel intervalar, h que
se atentar para a questo do tamanho da amostra, das
Tem-se que a varivel X medida em nvel ordinal e a variveis envolvidas na anlise.
varivel Y dicotmica. A amostra aleatria gerada pelo
processo de simulao encontra-se no quadro A.5 e as REFERNCIAS BIBLIOGRFICAS
estatsticas da varivel X, no quadro A.6.
O coeficiente de correlao dr calculado foi 0,86458, [1] Andenberg, Michel R.; Cluster analysis for applications.
exatamente igual ao coeficiente linear de Pearson. A New York: J. Wiley & Sons, 1958.
significncia do coeficiente < 0,01 para t = 9,10 . A [2] Bunchaft, G. and Kellner, S. R. O.; Estatstica sem
mistrios. 2.ed. Petrpolis: Vozes, 1999. v.2.
estatstica Z calculada para testar a significncia de dr foi
[3] Downie, N. M. and Heath, R. W.; Basic statistical methods.
4,66, significativo tambm para < 0,01 .
New York: Harper & Brothers, 1959.
[4] Ferguson, G. A.; Statistical analysis in psychology and
4.5. Aplicao do coeficiente de correlao entre variveis
education. 5.ed. New York: McGraw-Hill book, 1981.
intervalar e ordinal
[5] Guilford, J. P.; Fundamental statistics in psychology and
education. 4.ed. New York: McGraw-Hill Book, 1950.
A amostra aleatria encontra-se no quadro A.7 do
Apndice. O coeficiente de correlao estimado [6] Haldar, A. and Mahadevan, S.; Probability, reliability and
statistical methods in engineering design. New York: J. Willey
= ri = 0,87289 , cuja estatstica t igual a 12,39,
& Sons, 2000.
significativa portanto para < 0,01 .
[7] Lira, S. A.; Anlise de correlao: abordagem terica e de
Os coeficientes de correlao ponto bisserial, phi , de construo dos coeficientes com aplicaes. Curitiba, 2004. 196
Spearman, dr e ri so derivados do coeficiente linear de p. Dissertao (mestrado). Setores de Cincias Exatas e de
Pearson, desenvolvidos para situaes em que a suposio Tecnologia, UFPR.
de que as variveis devem ser medidas no nnimo em nvel [8] Siegel, Sidney; Estatstica no-paramtrica: para as cincias
intervalar no so atendidas. No entanto, verificou-se que do comportamento. So Paulo: McGraw-Hill do Brasil, 1975.
para cada um dos coeficientes considerando-se o nvel de [9] Silveira, F. L.; Estatstica paramtrica versus no-
mensurao das variveis envolvidas, obteve-se a mesma paramtrica: um estudo emprico. Scientia, v. 2, n. 2, pp. 115-
estimativa do coeficiente linear de Pearson, o que indica a 122, jul-dez 1991.
possibilidade de utilizao deste ltimo coeficiente mesmo [10] Wherry, R. J.; Contributions to correlational analysis.
em situaes que envolvem variveis ordinais e dicotmicas. Orlando: Academic Press, 1984.
Para os coeficientes de correlao ponto bisserial, de
Spearman e ri , as significncias dos coeficientes
estimados so exatamente iguais a do coeficiente de
Pearson, uma vez que a estatstica para o clculo da
significncia a mesma, ou seja, t de Student com n-2
graus de liberdade.
J no caso do coeficiente de correlao phi, utiliza-se a
estatstica 2 . Porm, a significncia igual ao da
estatstica t, para o coeficiente linear de Pearson.
O mesmo ocorre para o coeficiente dr , cuja
estatstica utilizada para verificar a significncia Z, que,
embora difiram nos valores calculados, as significncias
so iguais.

RECIE, Uberlndia, v. 15, n. 1/2, p. 45-53, jan.-dez. 2006 51


Sachiko Araki Lira e Anselmo Chaves Neto

APNDICE QUADRO A.2 - ESTATSTICA DESCRITIVA DA VARIVEL X


SEGUNDO VALORES DA VARIVEL Y E
TOTAL
1- ALGORITMOS UTILIZADOS PARA OBTENO Y FREQ. MDIA DESVIO PADRO
DAS VARIVEIS 0 21 67,9715 1,7979
1 19 72,4942 2,0555
1.1. Algoritmo para gerar variveis normais bivariadas
TOTAL 40 70,1198 2,9510

data normalbi;
keep x y; QUADRO A.3 - VARIVEIS ALEATRIAS X E Y NORMAIS E
m1=5; m2=20; v1=2; v2=10; ro=0.80; TRANSFORMADAS EM ORDINAIS
do i=1 to 30; /* tamanho da amostra */ OBS. X Y OBS. X Y OBS. X Y
x=m1+sqrt(v1)*rannor(123); 1 4 1 11 14 11 21 22 21
y=(m2+ro*(sqrt(v2)/sqrt(v1))*(x-m1))+ sqrt(v2*(1- 2 1 2 12 15 12 22 21 22
3 2 3 13 17 13 23 20 23
ro**2))*rannor(123); 4 8 4 14 10 14 24 27 24
output; 5 6 5 15 16 15 25 13 25
end; 6 3 6 16 28 16 26 25 26
7 9 7 17 12 17 27 24 27
run;
8 18 8 18 23 18 28 19 28
9 7 9 19 5 19 29 30 29
1.2. Algoritmo para gerar varivel normal 10 11 10 20 26 20 30 29 30

data normal; QUADRO A.4 - VARIVEIS ALEATRIAS BERNOULLI X E Y


seed=45; OBS. X Y OBS. X Y OBS. X Y OBS. X Y
n=20; 1 1 1 11 1 1 21 0 0 31 0 0
2 0 1 12 1 1 22 1 1 32 1 1
do i=1 to n; 3 0 0 13 1 0 23 1 1 33 1 1
x=rannor(seed); 4 1 1 14 0 0 24 0 0 34 0 0
output; end; 5 0 0 15 1 1 25 1 1 35 1 1
6 1 1 16 1 1 26 1 1 36 0 1
run; 7 1 1 17 1 1 27 1 1 37 1 1
1.3. Algoritmo para gerar varivel Bernoulli 8 1 0 18 1 1 28 1 1 38 0 0
9 1 1 19 0 0 29 1 1 39 0 0
data bernoulli; 10 0 0 20 1 1 30 0 0 40 0 0

seed=45;
n=20;
TABELA A.1 - TABELA DE CONTINGNCIA DAS VARIVEIS X E Y
do j=1 to n;
X
x=ranbin(seed,1,0.4); Y
output; end; 1 0
run; 1 23 2 25
0 2 13 15
25 15 40
2 AMOSTRAS UTILIZADAS PARA APLICAO
DOS MTODOS DE CORRELAO
QUADRO A.5 - VARIVEIS ALEATRIAS NORMAL X TRANSFOR-
QUADRO A.1 - VARIVEIS ALEATRIAS NORMAL X E
MADA EM ORDINAL E BERNOULLI Y
BERNOULLI Y
OBS. X Y OBS. X Y OBS. X Y
OBS. X Y OBS. X Y
1 1 0 11 11 0 21 21 1
1 68,53943 0 21 70,74722 1
2 2 0 12 12 0 22 22 1
2 68,76153 0 22 69,78154 1
3 3 0 13 13 0 23 23 1
3 67,51424 0 23 67,87615 0
4 4 0 14 14 0 24 24 1
4 71,33978 1 24 74,37667 1
5 5 0 15 15 0 25 25 1
5 69,90114 1 25 71,52511 1
6 6 0 16 16 0 26 26 1
6 65,23922 0 26 66,89329 0
7 7 0 17 17 1 27 27 1
7 75,64971 1 27 71,57874 1
8 8 0 18 18 1 28 28 1
8 69,04248 0 28 70,93864 0
9 9 0 19 19 1 29 29 1
9 74,65876 1 29 68,87160 0
10 10 0 20 20 1 30 30 1
10 67,57904 0 30 73,79670 1
11 68,24473 0 31 73,26968 1
12 62,99353 0 32 68,13456 0 QUADRO A.6 - ESTATSTICA DESCRITIVA DA VARIVEL X
13 77,46998 1 33 68,69880 0 SEGUNDO VALORES DA VARIVEL Y
14 66,05733 0 34 73,09149 1
Y X S
15 73,28209 1 35 71,65980 1
16 71,05588 1 36 72,43791 1 0 8,5000 4,7610
17 69,54481 1 37 68,48637 0 1 23,5000 4,1833
18 70,79316 0 38 69,62983 0
19 66,96403 0 39 66,57056 0
20 72,22281 1 40 69,57349 0

52 RECIE, Uberlndia, v. 15, n. 1/2, p. 45-53, jan.-dez. 2006


Coeficientes de correlao para variveis ordinais e dicotmicas derivados do coeficiente linear de pearson

QUADRO A.7 - VARIVEIS ALEATRIAS NORMAL X TRANSFOR-


MADA EM ORDINAL E NORMAL Y
OBS X Y OBS X Y
1 1 50,1236 26 26 58,1540
2 2 51,1531 27 27 55,4734
3 3 51,1754 28 28 59,6157
4 4 56,7419 29 29 60,1809
5 5 51,1830 30 30 64,0449
6 6 54,5408 31 31 59,9498
7 7 55,5512 32 32 56,5022
8 8 55,2186 33 33 66,6750
9 9 54,5424 34 34 63,8418
10 10 52,2496 35 35 63,0514
11 11 54,8710 36 36 62,3340
12 12 55,9186 37 37 62,6357
13 13 56,1823 38 38 60,7527
14 14 58,7238 39 39 61,2694
15 15 50,9812 40 40 66,5862
16 16 62,0726 41 41 65,3720
17 17 55,7658 42 42 62,2744
18 18 56,9581 43 43 66,4326
19 19 56,4535 44 44 67,7780
20 20 54,9055 45 45 66,9581
21 21 56,3960 46 46 63,9188
22 22 60,1621 47 47 60,6948
23 23 58,0464 48 48 67,7532
24 24 60,8010 49 49 69,7136
25 25 64,1540 50 50 67,1037

RECIE, Uberlndia, v. 15, n. 1/2, p. 45-53, jan.-dez. 2006 53

Potrebbero piacerti anche