Sei sulla pagina 1di 4

2.2.

Diagrama de disperso e o coeficiente de correlao


O professor est confiante de que existe uma forte relao entre o tempo de estudo e a nota de desempenho. Ele prossegue seu experimento com um grupo de 10 alunos e veja que resultados observou: Aluno Tempo de estudo(em horas) 1 4 2 10 3 5 4 5 5 4 6 1 7 10 8 5 9 8 10 6 Nota (de 0 a 10) 5 9 5 6 3 2 10 7 9 7

Novamente, vamos colocar estas informaes num grfico: o primeiro grfico conhecido como diagrama de disperso.

Comandos do R para gerar os grficos:

Observe que aqui temos 10 pontos e estes no esto alinhados. No possvel passar uma nica reta por todos estes pontos. Sabemos que dois pontos definem uma reta, mas se tivermos 3 ou mais isso passa a ser um problema que s poder ser resolvido se todos os pontos estiverem alinhados. Acontece que os alunos possuem caractersticas diferentes e dificilmente o tempo de estudo estar alinhado com a capacidade de absoro dos contedos estudados. Mas o professor no desistiu do seu modelo no!!!!

x<-c(4,10,5,5,4,1,10,5,8,6) y<-c(5,9,5,6,3,2,10,7,9,7) par(mfrow=c(1,2)) #primeiro grfico plot(x,y,main="tempo de estudo x nota") #segundo grfico plot(x,y,main="tempo de estudo x nota") lines(x[c(6,1)],y[c(6,1)],col=1) lines(x[c(6,2)],y[c(6,2)],col=2) lines(x[c(6,3)],y[c(6,3)],col=3) lines(x[c(6,4)],y[c(6,4)],col=4) lines(x[c(6,5)],y[c(6,5)],col=5) lines(x[c(6,7)],y[c(6,7)],col=6) lines(x[c(6,8)],y[c(6,8)],col=7) lines(x[c(6,9)],y[c(6,9)],col=8) lines(x[c(6,10)],y[c(6,10)],col=9)

O que ele fez? Resolver lanar mo de uma ferramenta estatstica chamada MODELOS DE REGRESSO LINEAR. Ele descobriu que existe um coeficiente que calcula o grau de alinhamento dos pontos em torno de uma reta. Esse coeficiente chamado de coeficiente de correlao linear. Uma vez calculado o coeficiente, se este der como resultado o valor 1 ou -1, significa que todos os pontos esto alinhados e portanto uma nica reta passa por todos eles. Se o coeficiente for muito prximo de zero o melhor abandonar a idia de utilizar a reta como um modelo matemtico que relacione as duas variveis em questo: x e y. Como obter o valor do coeficiente de correlao????
O coeficiente de correlao linear r um nmero puro que varia de 1 a +1 e sua interpretao depender do valor numrico e do sinal, como segue: r = -1 correlao perfeita negativa -1<r<0 correlao negativa -0,9<r<-0,7 correlao negativa forte -0,7<r<-0,4 correlao negativa moderada -0,4<r<-0,2 correlao negativa fraca r = 0 correlao nula r= 1 correlao perfeita positiva 0,9<r<0,7 correlao positiva forte 0,7<r<0,4 correlao positiva moderada 0,4<r<0,2 correlao positiva fraca

Seu valor obtido pela expresso:

Onde - chamado de covarincia de X e Y. chamado de varincia de X. chamado de varincia de Y. No se assuste com as frmulas acima!!!! Na prtica, utilizando sua calculadora, dever realizar as seguintes operaes que apresentamos passo a passo. Para exemplificar, utilizaremos o exemplo inicial dos dois pontos (4,8) e (6,9) onde x=(4,6) e y=(8,9)
Passo a passo 1- Obtenha a mdia e o desvio padro de X Os valores de x no exemplo so 4 e 6 mdia 5 desvio padro 1.414214

2- Obtenha a mdia e o desvio padro de Y Os valores de y no exemplo so 8 e 9

mdia 8,5 desvio padro 0.7071068

3- Realize o produto entre os valores de X e Y e obtenha seu total. X 4 6 Total Y 8 9 produto 32 54 86

4- Calculamos o numerador da expresso do coeficiente r, ou seja, sxy: 86 - 2*5*8.5 = 1

(Total do produto entre x e y) (nmero de observaes)*(mdia de x)*(mdia de y)

5- Calculamos o denominador da expresso do coeficiente r, ou seja, raiz quadrada do produto entre sxx e syy: (nmero de observaes 1)*(desvio padro de X)*(desvio padro de Y) (2-1)* 1.414214*0.7071068=1 6- Finalmente dividimos os ltimos dois valores para obter r: R=1/1 = 1
R=1 significa perfeita correlao positiva, ou seja, todos os pontos sob a mesma reta, cuja equao j foi obtida anteriormente. Lembrando que o problema surgiu quando no pudemos passar uma nica reta sob os 10 pontos. Vamos obter o coeficiente de correlao para estes pontos: x=(4,10,5,5,4,1,10,5,8,6) e
y=(5,9,5,6,3,2,10,7,9,7)

Passo a passo 1- Obtenha a mdia e o desvio padro de X mdia 5.8 desvio padro 2.820559

2- Obtenha a mdia e o desvio padro de Y mdia 6.3 desvio padro 2.626785

3- Realize o produto entre os valores de X e Y e obtenha seu total. X 4 10 y 5 9 produto 20 90

5 5 4 1 10 5 8 6 Total

5 6 3 2 10 7 9 7

25 30 12 2 100 35 72 42 428

4- Calculamos o numerador da expresso do coeficiente r, ou seja, sxy: (Total do produto entre x e y) (nmero de observaes)*(mdia de x)*(mdia de y) 428-10*5.8*6.3 = 62.6 5- Calculamos o denominador da expresso do coeficiente r, ou seja, raiz quadrada do produto entre sxx e syy: (nmero de observaes 1)*(desvio padro de X)*(desvio padro de Y) (10-1)* 2.820559*2.626785=66.68102 6- Finalmente dividimos os ltimos dois valores para obter r: R=62.6/66.68102= 0.9387979 Arredondando o valor de r para duas casas decimais obtemos: R=0.94 o que indica forte correlao linear positiva.

Desse modo o professor decide adotar um modelo de atribuio de notas atravs do tempo de estudo. Mas agora surge um novo problema, como obter a equao da reta?

Potrebbero piacerti anche