Numa situao em que se observam pares de valores (xi; yj),
podemos ter interesse em estudar as relaes existentes entre os dois fenmenos, nomeadamente relaes estatsticas.
No se trata de estudar relaes funcionais (isto , a
medida em que o valor de uma varivel determinado exatamente pela outra), mas sim de estudar a forma como a variao de uma varivel poder afetar a variao da outra, em mdia. A presena ou ausncia de relao linear pode ser investigada sob dois pontos de vista:
a)Quantificando a fora dessa relao:
correlao. b)Explicitando a forma dessa relao: regresso.
Representao grfica de duas variveis
quantitativas: Diagrama de disperso Duas variveis ligadas por uma relao estatstica dizem-se correlacionadas.
Se as variaes ocorrem,no mesmo sentido, a correlao ser
positiva. Se ocorrem em sentidos opostos, a correlao ser negativa. Quando existirem duas sries de dados, existiro vrias medidas estatsticas que podem ser usadas para capturar como as duas sries se movem juntas atravs do tempo. As duas mais largamente usadas so a correlao e a covarincia. Para duas sries de dados, X (X1, X2,.) and Y(Y,Y... ), a covarincia fornece uma medida no padronizada do grau no qual elas se movem juntas, e estimada tomando o produto dos desvios da mdia para cada varivel em cada perodo. Embora o valor da covarincia cresa com o poder do relacionamento entre as variveis (quanto maior o valor da covarincia mais forte a relao entre as variveis), relativamente difcil fazer julgamentos sobre o poder do relacionamento entre as duas variveis observando apenas a covarincia, pois ela no uma medida padronizada. Logo, covarincia significa co-variao, como as duas variveis variam de forma conjunta. Trata-se ento de estudar se: - Se existe alguma correlao entre os fenmenos ou variveis observadas - Se existir, se traduzvel por alguma lei matemtica, nem que seja uma tendncia. - SE existe, se possvel medi-la A representao grfica dos dados bivariados designa-se de diagrama de disperso. O diagrama de disperso uma representao grfica em que cada par de dados (xi, yj) representado por um ponto de coordenadas num sistema de eixos ordenados. Interpretando o valor de r O sinal de r nos diz se a relao positiva ou negativa O valor deve estar entre 0 e 1 e nos d o grau de associao entre as variveis: 0 significa nenhuma associao e 1 significa associao linear perfeita. No caso de avaliarmos a correlao usando uma amostra, preciso determinar se h diferena entre o r calculado e zero.