Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Essa expresso usualmente utilizada para afirmar que uma armao ofensiva mais eficiente do que
jogar na retranca. Salvo melhor engano, no entanto, essa hiptese nunca foi testada. Esse artigo replica
dados do Brasileiro 2013 com dois objetivos: (1) explicar como os coeficientes do modelo de
regresso linear de mnimos quadrados ordinrios devem ser interpretados e (2) explicar as aplicaes
e limites do coeficiente de determinao (r2). Em termos substantivos, o modelo de regresso pode ser
utilizado para entender/explicar/predizer a variao de uma determinada varivel dependente a partir
de um conjunto de variveis independentes. O modelo bsico o seguinte:
Y = +1X1 +
Existe uma correlao positiva entre o nmero de gols marcados e o total de pontos conquistados (r =
0,773; p-valor<0,001; n=20). Contrariamente, existe uma correlao negativa entre a quantidade de
gols sofridos e o nmero de pontos auferidos no campeonato (r = -0,670; p-valor<0,001; n =20). A
questo agora saber como e em que medida o nmero de gols marcados e sofridos explica a
quantidade de pontos conquistados? O modelo abaixo responde essa indagao.
1
O Cruzeiro marcou 77 gols e sagrou-se campeo com 76 pontos. Por outro lado, o clube Nutico marcou 22
gols e conquistou 20 pontos.
2
O Nutico sofreu 79 gols em 38 rodadas, ou seja, uma mdia de 2,08 por partida.
Total de Pontos = + 1 Gols marcados + 2 Gols sofridos +
Coeficientes
Coeficientes no padronizados
padronizados
Erro padro BETA t p-valor
Intercepto 46,733 5,188 9,008 0,000
Gols_marcados 0,651 0,071 0,685 9,144 0,000
Gols_sofridos -0,547 0,073 -0,563 -7,517 0,000
2 2
r = 0,907; r adj = 0,896; F = 82,802
O intercepto () representa mdia de pontos esperada para um time que no marcou nenhum
gol, mas tambm no sofreu nenhum gol durante todo o campeonato (46,733). Como so 38 rodadas,
isso significa que um time que empatou todos os jogos totalizaria 38 pontos.
O coeficiente de regresso no padronizado da varivel gols_marcados ilustra o efeito mdio
do nmero de gols pr sobre a variao da quantidade de pontos. Em particular, a cada gol marcado
espera-se, em mdia, um incremento de 0,651pontos, controlando pelo nmero de gols sofridos.
Similarmente, o coeficiente de regresso no padronizado da varivel gols_sofridos representa o efeito
mdio da quantidade de gols sobre a variao da quantidade de pontos conquistados. Em mdia, a cada
gol sofrido espera-se uma reduo de 0,547 pontos, controlando pelo nmero de gols marcados.
O erro padro indica o nvel de preciso da estimativa produzida pelo modelo. Quanto menor,
mais precisa estimativa, tanto melhor. Quando o erro padro do mesmo tamanho ou superior ao
prprio coeficiente estimado, o valor da estatstica t no ser significativo. Logo, o p-valor ser grande
e o pesquisador no poder rejeitar a hiptese nula de que o coeficiente estimado igual a zero (Ho:
=0).
O coeficiente de determinao (r2) uma medida do poder explicativo/preditivo de um modelo
de regresso linear (LEWIS-BECK, 1980). Como medida de ajuste do modelo, ele indica quo bem o
modelo estimado se ajusta aos dados observados. Ele varia entre 0 e 1 e pode ser interpretado como a
variao observada na varivel dependente que explicada pelo modelo. Ou seja, o nmero de gols
explica 90,7% da variao dos pontos conquistados3.
A estatstica F extrada da tabela da anlise de varincia (ANOVA) e auxilia a tomada de
deciso a respeito da significncia estatstica das variveis includas no modelo. Quanto maior o F,
maior a confiana do pesquisador de que pelo menos uma varivel includa no modelo exerce um
efeito diferente de zero sobre a variao da varivel dependente. A tabela abaixo sumariza a
quantidade de gols marcados (GP), gols sofridos (GC), total de pontos, o valor predito pelo modelo e o
erro de previso para cada time.
3
Para mais informaes sobre o R2 ver Lewis-Beck e Skalaban (1990), King (1991), Luskin (1991) e Figueiredo
Filho, Silva Jnior e Rocha (2011).
Tabela 1 - Observado x Predito