Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Relatório
1) Para verificar a natureza linear da relação foi necessário plotar um gráfico de dispersão que
fornece uma indicação visual da intensidade e comportamento da relação entre as variáveis
estudadas que são tempo de estudo (variável explicativa) e nota (variável resposta). Com ele
pode-se verificar um comportamento linear crescente, ou seja, quanto maior o tempo de estudo
maior a nota. Também observa-se relativa proximidade entre os pontos, indicando uma associação
forte positiva.
O intercepto é o valor que a reta de regressão toca no eixo Y, que neste caso apresentou o valor de
21,3971, ou seja, mesmo que o aluno estude 0 horas (x=0), a média da nota será 21,3971. O
intercepto só possui significado, se o zero (x=0) for um valor possível no conjunto de dados
avaliados (horas estudadas), que neste caso pode ocorrer. Isto também pode ser comprovado pelo
valor de R² (coeficiente de determinação) com valor de 72,79 %, que representa o quanto da
variação do modelo pode ser explicado, assim, existe 27,21% de variação não explicada no modelo,
por isso faz sentido que mesmo que o aluno estude 0 horas possa obter uma nota de 21,3971. O
coeficiente angular é a inclinação da reta de regressão, como este coeficiente é positivo indica que a
cada hora estudada há um acréscimo de 1,6833 na nota do aluno. Conforme o valor-p obtido para os
teste T do coeficiente angular e intercepto, verifica-se que eles são significativamente diferentes de
zero.
Por fim, fornece a estatística F no valor de 65,2 referente ao ajuste geral do modelo, que quanto
mais distante de 0, melhor o ajuste do modelo. Ainda é apresentado o valor p, que para um nível de
significância de 0,05%. O valor-p da estatística F no valor de 3,657e-08 indica que se a hipótese de
que não relação entre o tempo de estudo e a nota enfrentamos o risco Tipo I equivalente ao valor-p
obtido.
Verifica-se que a partir dos resultados dos resíduos (valore observados-valores estimados) que os
valores observados das notas não diferem muito dos valores estimados.
O gráfico abaixo apresenta o intervalo de confiança de predição dos resultados das notas, ou seja,
em 95% das vezes os valores estimados das notas estarão neste intervalo. Observa-se ainda que o
intervalo é mais estreito quando estiver perto da média, sendo mais preciso e mais largo nas
extremidades, onde é menos preciso.
4) Para verificar as condições de homogeneidade e normalidade, verifica-se os gráficos dos
resíduos.
-Rediduals vs Fitted: A linha vermelha representa os pontos dos resíduos e quanto mais próximo da
linha pontilhada seria caracterizada como homocedástico, ou seja, com variância constante, porém
isso não ocorre caracterizando o gráfico como heterocedástico. São apresentados também três
pontos críticos (3,7,13) para avaliação da variância.
-Normal Q-Q: Conforme apresentado no gráfico, verifica-se que a normalidade pode ser violada
pois o comportamento dos pontos não apresenta um formato linear exato, como os pontos 3,7,13
que se apresentam mais distantes da reta.
-Residuals vs Leverage: Mostra a influência de retirada dos valores, onde quanto mais um ponto se
aproxima da linha da distância de Cook mais influência no modelo. É o caso dos pontos 3,16 e 17.
Todos os gráficos destacam três pontos que possuem grande influência no modelo, todos estes
valores são incomuns, visto que são <=2 na escala dos resíduos padronizados.
De acordo com os gráficos acima existe indícios de que os valores não possuem variâncias
constantes, contudo, quando aplica-se o teste de Heterocedasticidade Breusch-Pagan, verifica-se
que o p-valor é < α, assim, os dados são considerados homocedasticos, não violando a primeira
suposição da avaliação de resíduos.
O gráfico forneceu um indicativo de não normalidade dos parâmetros em estudo, para uma
confirmação e embasamento mais consistente, foi feito o teste de normalidade de Shapiro-Wilk
através do software R que calcula uma estatística W que testa se uma amostra aleatória de tamanho
n provém de uma distribuição normal.
Logo, rejeita-se a hipótese de normalidade dos dados, visto que p-valor é < α.