Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
UM GUIA PRTICO
O QUE REGRESSO?
Na anlise bidimensional de variveis, foi introduzida a noo de condicionalidade: a proporo da populao que fazia parte de um determinado grupo, condicional ao fato de ter uma caracterstica. No exemplo, calculou-se a freqncia de mulheres que so chefes de famlia dada a informao que trabalham. Regresso o clculo do valor esperado de uma varivel Y, dado o conjunto de informaes fornecido por um conjunto de caractersticas X. Ou seja, a mdia de Y, condicional s informaes de X (E[Y|X]).
HIPTESES BSICAS:
Relacionamento linear entre as variveis E() = 0 E(2) = 2 (constante) Os resduos so independentes entre si: E(i j) = 0, i,j = 1, 2, 3... Os resduos e as variveis so independentes: E(X) = 0 As variveis Xn no podem ser combinaes lineares entre si
O AJUSTE DA REGRESSO
Graficamente, a anlise de regresso implica no ajuste de uma reta que represente de uma boa forma a estrutura dos dados.
70 60 50 40 30 20 10 5 6 7
Mas o que boa forma de ajuste da reta? Note que a diferena entre a reta ajustada (que produto do valor esperado condicional) e a observao realizada corresponde ao resduo. Logo, o ajuste ideal da reta deve respeitar a condio de menor distncia possvel em relao aos valores observados.
60 55 50 45 40 35 30 25 E[Y|X] 20 15 5 6 7 i
Logo, a idia de ajuste dos parmetros do valor esperado condicional passa por Minimizar a Soma dos Quadrados dos Resduos. O estimador de Mnimos Quadrados Ordinrios possui propriedades interessantes, quando as hipteses bsicas no so violadas: ele noviesado e o mais eficiente entre os estimadores lineares. O estimador de mnimos quadrados, escrito na forma matricial, : b = (XX)-1(XY)
ESTATSTICAS DE AVALIAO
R2 busca decompor a variao total de Y entre variao prevista e variao no explicada pelo modelo (variao dos resduos). Fazendo a separao, temos: SQT = SQE + SQR onde SQT = Soma dos quadrados total (S(Y-Y)2), SQE = Soma dos quadrados explicada (S(Y*-Y)2) e SQR = Soma dos quadrados dos resduos (Se2), Y a mdia de Y e Y* o valor previsto de Y
Logo, temos:
1 = (SQE/SQT) + (SQR/SQT) O R2 busca verificar o quanto de Y foi explicado pelo modelo. Logo: R2 = SQE/SQT = 1 - (SQR/SQT) Note que, por definio, 0 < R2 < 1. R2 ajustado: o problema da estatstica de R2 o seu comportamento diante do acrscimo de variveis no modelo. Qualquer varivel adicionada, por menor que seja o seu poder de explicao, gera um crescimento no R2 normal. Logo, o R2 ajustado busca penalizar a estatstica pelo acrscimo de variveis irrelevantes.
F = [(SQE)/SQR][(n-k-1)/k] onde SQE e SQR foram definidos acima, e n = tamanho da amostra, k = nmero de coeficientes angulares.
O logaritmo natural como expresso da elasticidade: Ln(Yt) = A + B Ln(Xt) Ln(Yt) = B Ln(Xt) Ln(Yt)/Ln(Xt) = B Mas: Ln(Yt) = Ln(Yt) - Ln(Yt-1) = Ln(Yt / Yt-1) (Yt - Yt-1)/Yt-1
Exerccio Prtico:
CAPM - calculando o Beta de uma ao
A idia da autocorrelao serial que os resduos contm mais informao sobre a varivel dependente do que aquilo que foi filtrado pelas variveis explicativas. Em termos tcnicos, o resduo ainda pode ser sistematizado. Exemplos de autocorrelao so normalmente encontrados em trabalhos que utilizam sries de tempo como dados de anlise.
Teste de Breush-Godfrey: Teste de certa forma semelhante ao teste de White, consiste em efetuar uma regresso do resduo como varivel explicada tendo como explicativas o prprio resduo defasado no tempo e as variveis explicativas do modelo original. Usa-se a estatstica F de significncia conjunta dos parmetros da equao de teste. Este teste talvez seja o mais indicado para verificar autocorrelao, pois considera a possibilidade de resduos correlacionados com valores defasados acima de um perodo e pode ser usada com variveis explicativas defasadas.
As variveis recebem este nome por assumirem apenas dois valores ao longo de toda a amostra: zero ou um. O funcionamento da varivel o seguinte: Perodo sem a quebra: D = 0 Yt = + dD + bXt + t Portanto: Yt = + bXt + t Perodo da quebra: D = 1 Yt = ( + d) + bXt + t
Outro formato possvel que a varivel dummy pode assumir refere-se a mudanas na inclinao. A varivel, assim, assume o valor zero para o perodo sem a mudana e o valor igual ao da varivel cuja inclinao mudou para o perodo com mudana. O modelo passa a funcionar da seguinte forma: Perodo sem a quebra: D = 0 Yt = + dXt + bXt + t Portanto: Yt = + bXt + t Perodo da quebra: D = Xt Yt = + (b + d)Xt + t
Jan/80 Jan/81 Jan/82 Jan/83 Jan/84 Jan/85 Jan/86 Jan/87 Jan/88 Jan/89 Jan/90 Jan/91 Jan/92 Jan/93 Jan/94 Jan/95 Jan/96 Jan/97 Jan/98 Jan/99 Jan/00 Jan/01
Perodo
Uma funo de demanda por importaes assume o seguinte formato: lnMt = + b1t + b2lnYt + b3lnRERt + t onde: Mt = importaes; t = tendncia linear; Yt = PIB real; RERt = taxa de cmbio real. O uso de uma tendncia justifica-se por no existir com freqncia mensal uma medida de utilizao da capacidade instalada da economia. Todas as variveis, pelos motivos j conhecidos, encontram-se transformadas para o seu logaritmo natural. Estimando-se a regresso por OLS, temos o seguinte grfico dos resduos:
Resduos
-0,8 0,2 0,4 0,6 0,8 0 -0,6 -0,4 -0,2
Jan/80 Jan/81 Jan/82 Jan/83 Jan/84 Jan/85 Jan/86 Jan/87 Jan/88 Jan/89 Jan/90 Jan/91 Jan/92 Jan/93 Jan/94 Jan/95 Jan/96 Jan/97 Jan/98 Jan/99 Jan/00 Jan/01
Perodo
Note como o resduo exibe, aparentemente, um padro sazonal, alm de uma quebra estrutural localizada no incio dos anos 90. Como o resduo corresponde a tudo aquilo que no foi explicado pelo modelo, temos aqui o problema de especificao por no termos considerado a quebra estrutural indicado pela mudana de tendncia dos resduos. Lembre-se: devem existir motivos relevantes para a quebra!!! A presena de outliers por si s no quer dizer que existam quebras. No nosso caso, devemos lembrar a mudana ocorrida na economia com a sua abertura comercial no incio dos anos 90. Logo, justifica-se uma correo no modelo.