Sei sulla pagina 1di 79
co UNIVERSIDADE CATOLICA DE ANGOLA ECONOMETRIA A Maa Ml tis lpi Fale Hat A Contetido 1 Mu, Vv. VIL. VU Inrropuco, - Aspectos conceituais.. A Natureza ea fonte dos dados . Elementos Chave dos Conceitos B: A REGRESSAO SIMPLES . A Fungdo de Regres Propriedades |. Minimos Quadrados Ordindrios -OLS...............:::ss0ssse . seseecnauneeeseen . Elementos Chave da Regressio Simples ....0.nmsnennnnnnnesnnnnnsnnnnnnsesne Jo Populacional (FRP).. Repo Casos PRATICos. 1s 1. Teste de hipdtese e intervalos de confianga; 15 2. Diagnostico basico da Andlise de regressao... AREGRESSAO MULTIPLA 20 - Pressupostos basicos; 7 Inferéncia a versdo matricial da regressaio maltipla . Inferéncia ao método de Crammer para a mat . Inferéneia aos experimentos de Monte Carlo Outros indicadores na versio matricial . Exercicio: Ilustrago Tustragio Microsoft Exeel para Clculos Feonométricos FORMAS FUNDAMENTAIS DOS MODELOS DE REGRESSAO, RELAXANDO AS HIPOTESES BASICAS DO MoDELO 39 Raveena A Micronumerosidade e Multicolinearidade. 39 . Elementos Chave da Multicolinearidade.. A Heteroskedasticidade versus Homoskedesticidade. sevnnnnseennnnnnesin A Autocorrelagao. 47 . Elementos Chave da Autocorrelacio. ween ‘TOricos QUALITATIVOS i. A regressio de varidveis dummies ii, Exercicio: Inferéncia de dumies no angulo de inclinagao iii, Elementos Chave da Inferéncia das Variiveis Dummies. EcoNOMETRIA UTILIZANDO O STATA. 56 I. INTRODUGAO O QUE E A ECONOMETRIA * A econometria pode ser definida como a anilise quantitativa de fenémenos econdmicos concretos, bascada no desenvolvimento simultineo de teoria ¢ da observagao, relacionadas por métodos de inferéncia adequados.' * A econometria, consiste na aplicagdo da estatistica matemitica aos dados econdmicos para dar suporte empirico aos modelos construidos pela economia matemitica e para obter resultados numéricos. * A econometria pode ser definida como a ciéneia social na qual as ferramentas da teoria econémica, matematica e inferéncia estatistica so aplicadas 4 andlise dos fenémenos econdmicos. * A cconometria se ocupa da determinagao empirica das leis econémicas. * A arte do econometrista consiste em achar 0 conjunto de hipéteses que sejam tanto suficientemente especificas quanto realistas, para the permitir tirar o maximo proveito possivel dos dados 4 sua disposigio." * Os econometristas.., prestam uma inegavel contribuigao a tentativa de afastar a pobre imagem publica da economia (quantitativa ou nao), tida como um assunto no qual latas vazias so abertas, supondo a existéncia de abridores de lata, para revelar. * 0 principal interesse da economia matemtica é expressar a teoria econémica na forma matemética (equagdes), sem levar em conta a imensurabilidade ou a verificagio empfrica da teoria. Jé a econometria, como destacamos anteriormente esti interessada na verificagao da verificagdo empirica da teoria; SOBRE A METODOLOGIA Embora as questdes de metodologia tém sido objecto de constantes criticas e sugestdes, a abordagem classica apresenta 7 passos ou eixos sequenciais que nos sugerem a metodologia de estudo da econometria: © Formulagao da teoria ou da hipétese Especificagao do modelo matemdtico da teoria Especificacao do modelo econométrico da teoria Obtengio de dados Estimativa dos pardmetros do modelo econométrico Teste de hipatese Previstio ou predigao ooo0ce 1, ASPECTOS CONCEITUAIS a) REGRESSAO O termo “regresso” foi introduzido por Francis Galton num estudo relacionado a hereditariedade, no qual descobriu a tendéncia dos filhos nascerem com caracteristicas proximas as dos pais, Outros nomes adicionados a estas descobertas, dizem respeito a Karl Pearson que encontrou resultados robustos ao verificar que a altura média de filhos pertencentes a um grupo de pais baixos era superior 4 altura de seus pais. A andlise de regressio diz respeito ao estudo da dependéncia de uma variével em relaco a uma ou mais varidveis cujo comportamento é independente. Este estudo visa determinar o valor médio da variavel dependente. b) CORRELAGAO A relagdo de correlagio & 0 processo no qual medimos a intensidade da relagio existente entre duas variéveis, sempre que desenvolvermos um calculo de regressio, 0 coeficiente de ajustamento do modelo, permite-nos obter a nogdo do grau de correlagZo entre ambas as variveis. Podemos dizer, que trata-se do grau de associacdo linear. Na andlise de correlagdo nao se estabelece distingdo entre variveis dependentes ou independentes, como fizemo-lo na andlise de regresséo, Numa situagao de correlagao bascamo-nos numa hipdtese de aleatoridade enquanto que para a andlise de regressio consideramos a aleatoridade apenas para a varidvel dependente contrariamente as vaiaveis independentes em cujo valores sao fixados ¢ ou ndo-estocéstico. o) CAUSAGAO A regressio explica a relagdo de dependéncia entre uma varidvel ¢ outra, Este tipo de relagdo consiste numa relagdo meramente estatistica, que ndo obstante permitir encontrar uma relagdo, ndo implica necessariamente uma relagZo de causagao. A teoria econémica faz referéncia a Causalidade de Granger @) RELACAO DETERMINISTA E ESTOCASTICA No estudo do comportamento das varidveis, encontramos variaveis cujo comportamento obedece tendéncias probabilisticas. Estas variéveis seguem um comportamento aleatério também chamadas varidveis estocdsticas. Exemplo: pluviosidade, a temperatura ambiental, queda de aeronaves soviéticas em Angola ete. Quando nos referimos a relagdes deterministicas, tratam-se de relagdes nas quais intervém varidveis cujo comportamento é deterministico ¢ nao aleatério. Exemplo: Lei de gravidade de Newton, Nascimento de um ser como resultado da fecundagdo de espermatozoides ete. Alguns Conceitos Sinénimos: Variivel Endégena Variavel Exégena Varidvel de Resposta Varidvel de Estimulo ou Controlo Regredida Regressor Predita Preditor Varidvel Explicada Varidvel Explicativa Varidvel Dependente Varidvel Independente 2. ANATUREZA EA FONTE DOs DADOS Os tipos de dados existentes para o trabalho empirico séries temporais, dados ceross-secionais, dados qualitativos, e ainda dados de painel. Sao dados qualitativos quando no acto da colheita tomamos uma categoria ou um atributo cujo resultado toma 0 valor | ou 0 exemplo: homem ou mulher, empregado ou desempregado, A este tipo de dados também chamamos por dummies. ‘Na maior parte dos casos, os economistas fazem recurso ou uso de séries de varidveis temporais. Na maior parte das séries temporais econémicas apresentam um comportamento dindmico isto é, a sua media e varidncia tendem ambas a variar em fungio do tempo. Os dad também chamados por “dados de corte”, so dados de uma ou mais variével colectados ano mesmo ponto de tempo, Uma grande implicagao das séries cross-seccionais, diz respeito a heterogeneidade forgada por hiatos no tamanho e no efeito de escala. Por outro lado, existem situagdes nas quais consideramos a combinagdo de dados de séries temporais ¢ de dados cross-seccionais. Dados Em Painel, também conhecidos como panel data, sio informagdes de unidades, individuos ou empresas, por exemplo, que podem ser acompanhadas ao longo do tempo. Mas os métodos de andlise também podem ser aplicados, com as devidas consideragdes, a diferentes séries de dados observados em duas dimensdes, por exemplo, observar as unidades, como empresas, em diferentes estados, ou paises. Quanto a fontes dos dados, estes podem ser colectados por agéncias governamentais ou independentes. E os dados colectados podem ser experimentais ou ndo-experimentais. Todavia os dados colectados no dominio das ciéncias sociais sio quase sempre ndo-experimentais 0 que pressupde dizer que sio dados em que o pesquisador nao consegue exercer influéncia significativa. A preciso dos dados constitui um outro factor importante. Certamente que a colecta de dados raramente ilustra 100% da realidade; quase sempre ocorrem erros de observacdo, omisso e ou execugio. Porém do esforgo em aproximar os dados estatisticos realidade especifica, é um factor muito importantissimo. 3,_ELEMENTOS CHAVE Dos CoNCEITOS BASICOS 1. Alideia chave da andlise de regressdo 6 a dependéncia estatistica de uma variavel (a variavel dependente) em relagéo a uma outra ou outras variéveis (as variéveis explicativas) 2. 0 objectivo desta andlise ¢ estimar e/ou prever a média ou o valor médio da varidvel dependente, com base nos valores conhecidos ou fixados das variaveis explicativas. 3. Na pratica, 0 sucesso da anélise de regresséo depende da disponibilidade de dados apropriados. Este capitulo discutiu a natureza, as fontes e as limitagdes dos dados que geralmente estdo disponiveis para pesquisa, especialmente nas ciéncias sociais. 4, Em qualquer pesquisa, o pesquisador deve informar claramente as fontes dos dados utilizados na andlise, suas definigées, seus métodos de colecta e quaisquer lacunas ou omissdes nos dados, bem como quaisquer revisdes dos dados. Lembre-se de que os dados macro-econémicos publicados pelo governo sao frequentemente revistos. 1, A FUNCA0 DE REGRESSAO POPULACIONAL (FRP) Diremos que geometricamente, a curva de uma fungdo de regressio é 0 espago geométrico onde as médias ou expectativas condicionais das varidveis dependentes para 0s valores fixados da variavel explicativa; EYX,)=fC%,) Equagio | Onde X é uma fungdo explicativa e Y a variével explicada, linear em X. Chamaremos assim a equagdo 1 como fungio de populacio de regressio (FPR) de duas vari sumindo que X pode tomar valores nulos, podemos transcrever aFPRem EX) 1 BX, Equagdo 2 onde os pardmetros beta um e beta dois so desconhecidos, todavia fixos e chama- se coeficientes de regressdo, Também sio conhecidos como intercepto e coeficiente de inclinagdo, respectivamente. 0 objectivo presente consiste em estimar os pardmetros desconhecidos da FRP deserita na equagdo N° 2. 2, PROPRIEDADES a) A LINEARIDADE Assumimos que a nossa FRP é linear, 0 que significa que a expectativa condicional de Y em relac&o a X é consequéncia de uma fungdo linear, podendo esta ser representada geometricamente por um grafico. Semelhantemente, a FRP é linear nos pardmetros, ou seja a expectativa condicional de Y em relago a X linear nos pardmetros. Todavia, se obtivermos uma fungo do tipo ECY|X,)=B, +B,X? ela continua sendo linear nos pardmetros embora nao seja na varidvel. Todavia, um caso como E(Y|X,)=6, + yP,X,ndo é um modelo de regressio linear nos parametros. Consideraremos um Modelo de Regressio Linear (MRL) E(Y|X,) = B, +B.X. todo aquele modelo onde E(Y|X,) é linear quer nos pardmetros como nas varidveis b) A ESPECIFICAGAO ESTOCASTICA Consideremos que dada a variavel Y ¢ a sua estimativa condicional em relagdo a Y, ocorrerd sempre um desvio a que chamaremos 0 erro termo, a perturbacio estocéstica ou ainda 0 white noise : Y, -EQ|X) =, Equagao 3 Alternativamente, podermos escrever da seguinte maneira Y, = E(Y|X,)+p, € consequentemente Y, =B, +B,X, +1, Assim sendo o primeiro clemento do lado esquerdo seré o elemento sistemitico ou deterministico, © © segundo termo, corresponde ao componente assistemética ou aleatéria, cuja propriedade facilmente podemos obter quando aplicamos expectativas em ambos os lados da equaco condicional a X: E(Y|X, = EIECY|X,)]+ Bq |X,) Equagiio 4 E(YX,) = BCY|X,) + BUX) note que para que a igualdade vigore, é necessario que E(1,|X,)seja igual a zero EQ |X, =0 Equagao 5 Neste contexto, considerando que ao extrapolar 0 caso para a vida pritica, encontraremos varidveis sendo explicadas por outras, 0 termo erro pi, representard sempre aqueles factores ndo considerados na explica pode ser 0 caso de varidveis omissas. (0 da variével dependente, Isso c) A PERTURBACAO ESTOCASTICA E A FUNGAO DE REGRESSAO AMOSTRAL Para além do aspecto da omissio de varidveis destacado no ponto anterior, existem outros factores que justificam a razio de existéncia da perturbagdo estocistica no nosso modelo, apontando-se: Inexactidao da teoria Escassez de dados Forma funcional errada Casualidade intrinseca ao comportamento humano Variéveis fracas Principio da parciménia e 7. Variéveis essenciais versus varidveis periféricas SANS Considerando a aleatoriedade do erro, a representagdes de uma fungdio de regressio populacional para varias amostragens, da origem a chamada fungio de regresso amostral (FRA), tal que a amostra da equagdo 2 pode ser representada por: y, + Equagio 6 onde o ¥ é estimador de E(Y|X,), beta um chapéu é estimador de B, ¢ beta dois chapéu € 0 estimador de B,. Assim sendo, podemos representar a FRP de duas formas, demonstradas pelas equagées 2 ¢ a extensio da equagio 3, teremos: Y=, + +A, Equagao 7 em sintese, concluimos que o nosso principal objectivo consiste em determinar FRP Y, =B, +B,X, +p, dada a fungdo amostral FRA. Y, =, +B,X, +, Adicionalmente podemos ainda apresentar FRA. do seguinte modo: y,=¥, +A, Equagio 8 e-em termos de FRP Y, =E(Y[X,) +4, Equagao 9 3. MiNIMOS QUADRADOS ORDINARIOS -OLS @) ACESSIBILIDADE DOS MQO-OLS; Conforme referido anteriormente, constitui objecto principal testar a FRP tendo como referéncia a FRA. Dos enumeras métodos existentes', vamos aqui considerar 0 método dos quadrados minimos MQO também denominado por Ordinary Least Squares -OLS desenvolvido pelo matematico Alemdo Car Friederich Gauss. © método em causa baseia-se nos principio dos mi mos quadrados. Sabe-se que a FRP Y,=B,+B,X; +H, nao € directamente observavel, o que a +f,X,+fi, conforme as equagdes 6 ¢ 7 0 elemento erro ou residuo € dado pela diferenga do Y observado e Y estimado, nos conhecemos é sim Y, Hn, =Y¥,-¥, Equago 10 =Y,-B,+B.x, © iinteresse consistiré neste caso em determinar a FRA mais proxima do Y observado , © que em outras palavras pressupée dizer que quanto menor for residuo quadrado melhor seré. Df, = YY, -¥,). Note que o critério MQO consiste em minimizar a soma do erro. Porém, veja na figura, a soma do erro fi,,fiz,fi,eft, & mula, dada a sua assimetria, Entretanto, nés estamos mais interessados ¢ no quadrado da soma, pois fazendo assim tornamos os valores negativos em positivos e 0 interesse consistiré em encontrar o menor valor possivel o que em outras palavras significa obter residuos mais proximos da FRA. xX, xX, XX, Mustracio 1 Demonstracio do eritério dos minimos quadrados. Vexizten og métodos de Méxima Verosimithanga, OLS-te stage, Equagaes simulténeas © outros Assim sendo, lomamos a equago 10 e aplicamos sobre ela o quadrado. de =du-¥) Equagdo 11 =D -i-8.x,F Em outras palavras podemos dizer que o residuo quadrado & fungao dos estimadores. Quanto maior for o grau de significdncia dos estimadores, maior é a probabilidade de se obter um residuo quadrado menor. 74? = £(5,.8,) Abaixo temos um exemplo hipotético no qual assumimos inicialmente que (,= 2.752 e ,-1.673 com estes estimadores ¢ conhecendo a série de X, estimamos a populagao real ou seja, obtemos Y, na coluna (3) uma vez conhecido Y, , determinamos fina coluna (4) efectuando a diferenga entre as colunas (1) ¢ (3) conforme a equagdo 10. Seguidamente a coluna (6) representa a aplicagio da equagdo 11 obtendo um YA? =104.115460 . No segundo cenirio, assumimos novos valores para os parimetros de estimagdo B,=3 e B,= 1 o que permite encontrar um quadrado da soma do residuo x 4 inferior ao obtide no cendrio inicial. Us chepau Uz chap Yi X% ——Yrictapeu Ur enaren 428982 Yoiehape Uzenapey — useado 1 2 3 4 5 6 z 5 1 44250 0.5760 0.530625 40000 1 7 8 3 77710 0.2290 0.052441 6.0000 2 4 10 7 14,4930 -4.4630 19.918369 10,0000 ° ° 12 11 ___-21.1550__-9.1550 _83.814025 14.0000 2 4 35 22 12814000 _104.115460 1 2 ‘Tabela 1 Determinagio Experimental da FRA. Assim, podemos representa a equagao computada em (3) e (6) como: Y,, =2.752+1.673X, e Y, +X, respectivamente. 4) HIPOTESES BASICAS DO MODELO; Veremos agora as hipdteses bisicas do Modelo Classico de Regressdo Linear (MCRL), que de uma forma mais avangada, infere as hipéteses enunciadas por Gauss Markov. > Hipétese 1- Modelo de Regressio Linear - O modelo ¢ linear nos, parimetros conforme mostrado em Y, =P, +B,X, +4;3 > Hipétese 2- Os valores de X sio fixados em amostras iterativas — Os valores assumidos pelo regressor X so considerados fixados em repetidas’ amostras. A varidvel ¢ um dado nio estocdstico. > Hipétese 3-0 valor médio do residuo 1, é nulo — Dado o valor X, 0 valor esperado da perturbagio residual p,¢ zero, E(j,|X,)=0 Para 0 caso especif 10 dos experimentos de Monte Carle, considerando que © residue segue uma distribuiggo aleatéria, conforme verenes adian > Hipétese 4 -Homoskedasticidade ou varifncia igual de 1, - Dado o valor da varidvel independente, a variéncia de j1, ¢ invariante ao var( I, tempo. > Hipétese 5 -Nao existe autocorrelacao entre as perturbagdes* e, entre a perturbasio j1,e a varidvel independente X. — Dados dois valores u,e u, tal que (i+ j) a correlagdo entre quaisquer valores residuais de periodos distintos é zero, cov] %,)= Bhs, — Bs, JX hs, ~ Ela, = la, )o, 2) =0 cov(i,,.X,)= El, El, IE, - E(X,)] Eh. &, 26, E(u,X,)- te )E(X, Jonde B(X, )éndo estocastico 0 > Hiptese 6 - O ntimero de observagies n deve ser superior ao nimero de pardmetros*. ) PROPRIEDADES DOS ESTIMADORES- GAUSS MARKOV THEOREM; GAUSS MARKOV — dadas as hipéteses bisicas do modelo classico de regressao linear, os estimadores por minimos quadrados ordinirios so os melhores estimadores lineares ndo enviesados MELNV com variéncia minima, Com ajuda das hipétese basicas do modelo classico e do teorema de Gauss Markov, os estimadores dos minimos quadrados apresentam algumas propriedades basicas dentre as quais: 1. Os estimadores OLS sao lineares; 2. Os estimadores OLS ndo sio viesados (unbiesed), isto quer dizer que 0 valor esperado da estimativa de beta E(p,)converge ao seu valor real B. *Lembre-se que para c keteroskedastici sdobramento, aplicamos a hipétese 4. Sempre que a tempo, estarenos em presenca da ou da corzelagae sda nec rinero positive finito var(X)-hipocese de mu olinearidade) , m como @ hipstese de que © “se a hipdtese de existéncia de zeclamente especificado ~ de especificagio. 10 3. Os estimadores OLS sito eficientes — possuem a variéncia minima a nivel da classe dos estimadores lineares. hPa lastrasio 2 Dstribuisdo amostral de Be © grafico demonstra a distribuigio amostral de dois estimadores. Onde B, é MELNV. d) DETERMINAGAO DOS ESTIMADORES (i). Derivagao dos estimadores por OLS (modelo univarivel) Como derivar a estimativas dos minimos quadrados? Tomamos a fungdo expressa na equagao 1] e determinamos as derivadas parciais em relagdo a B,e 6. ada’) a “a = 2D (y-6,-8.x, D2 2D 1, Equagio 12 20 (¥, -8,-B.x, x = 200, Equagao 13 B, Resolvendo estas equagdes igualando-as a zero e efectuando os cortes necessarios, resulta em: 6, -Y-B.X Equagio 14 A DAY « Equagao 15 IK (i) Lineatidade e auséncia de vigs Como provar que os estimadores OLS sio de facto MELNV? Tomando a equagdo 15, considerando a anotagao feita no rodapé, tornamos a fungo da estimativa deB, como uma fungao linear de Y onde: 5 XY b, so logo assumimos que 6, =DkY, Equagdo 16 = k,, logo escreveremos “Lombra-se que esta fungao pode ser desdobrada para ap: esentagses alternativas Geavios de Xe ¥ em relagdo a nédia dades p y, = DY, « sinaisente os = (x,-Xpy, =(¥,-¥) ul Note agora que a equagao 16 apresenta o estimador f, é apresentado como uma fungio linear de Y dado o valor de k. Agora como demonstrar que a 0 MELNV converge ao seu valor real? Assumimos que 0 somatério de k é nulo, que o somatério do quadrado de k & igual | sobre o somatorio de x (no seu desvio em relagao a media). E finalmente Dkx, VX <1 ‘Vejamos por exemplo provando que 0 somatério de k é nulo. xk =y em relagdo a média é nulo, a multiplicagao do dltimo termo resulta num valor nulo. x, considerando que o somatério do desvio de X Agora substitua a FRP Y, = B, +B,X, +}, na equagdo 16 resultara em: B =k B, +8.Xi +H) B, =BDK +B OKX: +k” B, =B. + kw, Equagio 17 aplicando expectativas na nossa fungdo teremos: EAB, )=B, +k, E(u,) sabendo que o valor esperado do residuo é nulo, conseguimos provar que 0 estimador OLS converge ao scu valor real. Equago 18 (iii) Variancia e erro padrao dos estimadores OLS Conhecendo a definigdo da varidncia como sendo o quadrado do valor esperado da diferenga entre 0 estimador ¢ 0 seu valor médio, escreveremos: Equagio 19 usando a demonstragiio de convergéncia da estimativa ao seu valor real, substituimos eG.) var.) Ef, -p,]° var(B,)= E(k )* varlf, )= BCS Rig + Aza; +. FHS + 2k Kah +k ak Hyate) vari} DKF plicando as propriedades enunciadas acima, somatério de k igual a zero @ jo de k vezes X igual a un. 12 Equago 20 Equaso 21 (iv) Covaridineia entre as estimativas de B, © By Existira correlagao entre dois estimadores diferentes 8, ¢ B.,? Vejamos por definigao: fi, -F6)| 6,-6.6. -P.) cov(B,.B,) =— 8) Equagao 22 =-Xvar(f,) Consequentemente teremos cov.) =-¥ ss] Equsgto 23 (s: (¥)_Propriedades da varidncia minima. Lembra-se da equagao 16 na qual demonstramos que f, é um estimador linear em relagdo a Y, efectuamos algumas consideragdes para k. Consequentemente, podemos representa-las do seguinte modo. x,-X x D&-x! Lx Agora, no mesmo espitito que a equagio 16, achemos estimador alternativo, também linear em relagdo a B, B=y wy, Equagio 25 k, Equagio 24 onde embora w seja um coeficiente linear de beta em relagio a Y todavia ndo necessariamente igual a k. EBD=Dwkv) = Lw.bG, +8.%,) =BIW + DwX, agora para que o presente estimador seja nao enviesado, é necessirio que > w, =O econsequentemente > w,X, =1 Semelhantemente, nota que: var = var 1 w.Y, var B: = ow? var, “Sw Equagio 26 var = Tomando a equagao 26, podemos introduzir transformagdes de formas a atingir um resultado desejado: \ og } SSF Equagdo 27 fica assim provado que var(;)~var(},) considerando que w, = k,, a varidneia do estimador lincar beta asterisco deve ser igual a varineia do estimador de minimos quadrados, 4, ELEMENTOS CHAVI DA REGRESSAO SIMPLES 1. A idéia-chave que fundamenta a andlise de regressdo 6 0 da fungao de regressao populacional(FRP) 2, Consideramos a FRP lineares, isto é regressdes Iineares nos parametros desconhecidos. Elas podem nao ser obrigatoriamente lineares na varidvel dependente © na variavel independente. Para trabalhos empiricos interessa mais a FRP estocdstica, FRP é um conceit idealizado, pois na realidade quotidiana, o que se tem 6 uma observacdo da populagao. Por esta razdo uliiza-se a fungao de regressao amostral estocdstica FRA, para estimar FRP. 5. Aestrutura basica da analise de regressao ¢ 0 MCRL, baseado num conjunto de hipéteses. Com base nessas hipéteses, os estimadores por minimos quadrados adquirem certas propriedades resumidas no teorema de Gauss-Markov, em que, na classe dos estimadores, lineares ndo-viesados, os estimadores de minimos quadrados tém minima variancia. Em ‘suma, eles so MELNV 6. Apreciséo dos estimadores por MAO & medida por seus erros-padrdo. © grau de ajuste global do modelo de regressao 6 medido pelo coeficiente de determinagSo, R?. Com ele se tem a proporgo da variagio na vardvel dependente, ou regradido, que é cexplcada pela variével explicativa, ou regressor. Este R* esté entre 0 ¢ 1; quanto mais préximo de 7, melhor é o ajuste. 8. Um conceitoligado a0 cosficiente de determinagdo € 0 de coeficiente de correlagéo, r. E uma medida da associagao linear entre duas varidvels e estd entre 1 © +1 9, O MCRL 6 uma abstracgdo ou construgao teérica, pois se baseia em um conjunto de hipdteses que podem ser rigidas ou ‘irrealislas’. Mas tal abstracgao ¢ com frequéncia necesséria nos estagios iniciais do estudo de qualquer campo do conhecimento. Uma vez alcangado 0 dominio do MCRL, pode-se descobrir 0 que acontece se uma ou mais de suas hipéteses nao forem satisfeitas. 14 IIL. Casos PRATICOS 1, TESTE DE HIPOTESE E INTERVALOS DE CONFIANGA; Para abordagem do teste de hipétese, importa fazer mengo a conceitos fundamentais como: ‘© distribuigdo de probabilidade, * eros do tipo, ertos do tipo II, intervalos de confianga, poder de um teste estatistico e a) O INTERVALO DE CONFIANGA Recordando a estatistica I: O melhor intervalo para um parémetro seré aquele para o qual a probabilidade de conter © valor do parémetro é a maior: Pla<0Bi tara Cauda a Esquerda B,y.-¥ rk -¥ dy -¥,F Equagio 36 teremos assim teremos a representagiio dos desvios em relagio a média: Ly =r +de note que sendo S°d? a representago da componente residual, e querendo nés climinar esta, introduziremos transformag6es no modelo tal que: ry ZF ye yy ye Le? ya ye Lae #1 Equagao 37 18 onde alternativamente, podem se encontrar outros desdobramentos do teste F como sendo: ¢) ANALISE DA MUDANGA ESTRUTURAL COM O TESTE DE CHOW O teste de Chow, é uma versio do teste de F, Trata-se de um cenirio no qual 0 modelo é sujeito a restrigdes. As restrigdes submetidas a um modelo podem obedecer varias formas, desde os pardmetros do modelo, especificagio ao tamanho da populagao. No teste de chow, procuramos saber até que ponto o nivel de significdncia global do modelo sofre alteragdes ao longo do tempo. O teste de Chow respeita algumas propriedades bésicas dentre as quais: 1. py ~N(0,s) o residuo € normalmente distribuido com esperanga nula e variancia conhecida; 2. [ysH, 08 ettos de periodos distintos distribuem-se de forma independente, quer dizer que no estdo correlacionados. Pata o cfeito, tomamos a populagdo em estudo ¢ fixamos um periodo de referéncia no qual achamos estar caracterizado com um acontecimento especifico, seja de politica econémica ou secular, Assim a populagdo inicial reparte-se em dois periodos, sendo I~n, e II=n, permitindo-os estimar separadamente. Os passos a seguir seriam L. 1° Passo ~ efectuamos uma regressdo inicial combinando os dados todos, digamos I =n, ¢ II=n,; com os graus de liberdade (n,+n,-k) , onde k & © niimero de pardmetros estimados. © objective consistiré na determinagdo do quadrado da soma dos residuos S, y, hy +hsX\ +h Equagdo 38 3. 2° Passo estimamos em separado as regressdes compreendendo os periodos I =n,e T=n, com os graus de liberdade (n,-k) © (n,-k) igualmente determinamos a soma do quadrado residual SQR, S, ¢ S, De seguida, somamos os quadrados do residuo S,=S, +8, com os graus de liberdade (n, +n, -2k). Yan t1X +h, Equagao 39 12, ny Y¥, = 0, +0,X, +4, Equagao 40 12, ny 4, 3° Passo Obtemos a diferenga entre a SQE da primeira regressio ¢ da soma das duas regressdes em separado. S, = S, -S, 19 monta-se assim 0 teste de chow: —__* Equagao 41 Ao, Conhecendo os graus de liberdade dados por (K;n1+n2-2k) vamos para tabela estatistica e tomamos o valor critico dado o nivel de significéncia (5% preferencialmente). Se o valor de F caleulado exceder o valor eritico, rejeitamos a hipdtese de que as regressdes I e II so semelhantes, isto que dizer que existe mudanga estrutural no comportamento da variével d) O COEFICIENTE DE DETERMINACAO Por definicao, o coeficiente de determinagao, é 0 racio entre a soma do quadrado do erro e a soma do quadrado total 2 _SQE_ Bb, Dy.x, R a7 sQr yy Equagio 42 ‘© que em outra palavras significa perguntar, em que nivel a variivel dependente capta a informagao proveniente das varidveis independentes. Quando este indicador aproxima- sea 1, significa dizer que 0 modelo afigura-se poderoso e estatisticamente significante Quando o indicador é baixo, pressupde dizer que existem outras variaveis que explicam de melhor forma o modelo. IV. AREGRESSAO MULTIPLA A Regressio Miltipla ¢ um dos modelos mais utilizados no tratamento de séries temporais. A anilise de Regressio Miltipla & uma metodologia econométrica de previstio de valores da varidvel dependente tendo com base um conjunto de varidveis explic ivas. Sua aplicagdo ¢ importante porque possibilita que se estime © valor de uma variével com base num conjunto de outras varidveis, Quanto mais significante for o peso de uma varidvel isolada, ou de um conjunto de variaveis explicativas, melhor poder-se-A afirmar os factores que afectam mais © comportamento de uma varidvel de resposta especificamente procurada, do que outros. 0 formato da equago de Regresso Linear Miltipla é : Y = Bo + Bika + BoX2 +--+ BuXe + ui Onde: Y &a Variavel Dependente; Bx. Corresponde aos coeficientes técnicos atrelados is variaveis Independentes; 20 X,,_as Varidveis Independentes 1. PRESSUPOSTOS BASICOS; Os pressupostos bisicos a serem observados na regresso miltipla, dizem respeito aos abordados no modelo clissico, porem resumindo-se em 5 hipétese basicas. Notagio Escalar Notagio Matricial 1, E(u) = 0 para cadai 1. E(H) = 0 em que u e0 sio vectores coluna nxt, sendo 0 um vector nulo B(Hyn,) =0 2,E(up') = 07 em que I é uma matriz 2 ome ij idenidade w xn =6' 3. X,,X,, X,sio 3, Amatrizn xk, X no é estocéstica, ou soja 6 formada por um nimero de conjuntos fixes 4. Nici nehuna el near exact eneas 4. 0 potent) deX 6 P(X) = Keamquek 60 estocdsticos e fixos, simero de colunas em X ek é menor que o snlimero de observagies 1, 5, Para testarhipSteses assumimos que 5.0 vector édistribuido normalmente Hh ~N@,o°) mukivavidade isto & 1, ~ N(Q,07D) 2, INFERENCIA A VERSAO MATRICIAL DA REGRESSAO MULTIPLA, Uma abordagem mais realista do modelo de regress4o miiltipla, sugere-nos o uso de matrizes devido ao facto de maior parte dos modelos implicarem a inclusdo de k varidveis. Seja: Y,=B,+B:X2, +BXy tt BXy uy onde i=1,2,3, Equagao 43 Onde beta um 0 intercepto, e os demais betas sdo os coeficientes parci tomando um comportamento aleatério. Adicionalmente, a equagao pode ser apresentada sob forma de um sistema de equagSes ¢ posterior sob forma de um sistema de equagdes. is. ué 0 ert =B, +BXai + BAX5) FBX + Equagio 44 B, +BaXay +BaXoq +--+ B Xin + Up Segue-se a forma matricial: Y 1X3, Xs, ..Xer] [Br Y> 1X2 Xr2...Miea | | Ba U, + Equagio 45 Yodaxr LEXan Xan Xen Joa Be Ser La dane Podendo ainda assumir a forma matricial reduzida: 21 y xB su squach Equaco 46 nxt mk kal nxl Onde y-n X | éum vector coluna da varidvel dependente Xn X k € a matriz das variéveis independentes, Bk X | vector coluna dos pardmetros por estimar. u=n X I vector coluna nos n erros(distirbios).. Efectuamos assim 0 célculo dos estimadores dos minimos quadrados ordindrios (MQO): Y= B+ B.Xai + BX + Equagio 47 Assim teriamos a equagao do residuo quadrado Dwi=Dly,-8,-8.X,, BX BX) Equaydo 48 Matricialmente teriamos a equagio representada do seguinte modo: i= y'y- BX'y Equagio 49 Equagao 50 é ser B=(X'xXy'x'y Equagio 51 3. INFERENCIA AO METODO DE CRAMMER PARA A MATRIZ INVERSA © método de Crammer é recorrido apenas com o interesse de determinar-se quer os parimetros como a matriz inversa da matriz produto das varidveis exégenas B=(X’xY'X’y considerando ser elemento determinante para o calculo do vector dos estimadores, Nesta secgdo seria mais sensato que vocé desse uma vista aos velhos conhecimento de algebra linear em como determinar a matriz inversa. Todavia, eu apresentar-lhe ei aqui os passos basicos, visto que 0 conhecimento da matriz. inversa faz-se necessario, 22 PARA O CALCULO DOS PARAMETROS A regra de Crammer requer que a Matriz A tenha uma solugao tnica, tal que X=(KjsennX,) de um sistema de ordem nxn Ax=b det B. « ats Tal que x, =S=— onde B é a matriz A com o membro dirito igual ab let A, ‘Assim para um modelo: aX, +a :X, #a sx, =b, @y)X, +4,)X, +a,,X, =b, Equagao $2 Ay X) Ag X, HayX; =Ds © que seria mo mesmo dizer sy B32 Aas, Note que embora a simbologia nao seja proporcional ao modelo de regressio, quando no modelo de regressio precisamos calcular o vector beta, aqui o vector beta corresponde a ao veetor x quando a matriz. dos modelo de regressao. ssim sendo, a regra de Crammer pressupde que: corresponde a matriz de “x” no bay aay a as ay by ay Vay a, ay)" X=]B2 @2 ay fan ae ay] X2=/a br asf a2 as by ay Ags Aas A Ads as, by Aa as, ay Asaf a, a, b, Ya, a, ay)" X=! 8x1 Ao Ay. ys as As: As ass) Logo, conhecendo a matriz inversa, o resto reduz-se numa multiplicagao, PARA O CALCULO DA MATRIZ INVERSA Podera recorrer a esta opgdo, calculando a matriz inversa e depois fazer 0 uso da formula obtida no desdobramento dos MQO na versao matricial. A formula para o célculo & At | MatrixAgjunta A Equagao 53. detA, Um exemplo da Regra de Crammer: 2 4 5) A=|0 3 0 101 primeiro passo, encontrar o determinante da matriz, assegurando que |A| #0 para jue exista um solugao tnica c Do calculo ficamos a saber que |A|= -9 Segundo passo, determinamos a matriz. dos co-factores: 3 o Matriz Adjunta A seria igual a: Cy Cy Cy a=], Cy Cy ley a Cn) ‘Note que esta matriz foi transposta; temos primeiro expressas as colunas depois as linhas, contrariamente ao pressuposto normal, o que nos leva a afirmar que a a Matriz adjunta, é a matriz dos co-factores na sua transposta, 4, INFERENCIA AOS EXPERIMENTOS DE MONTE CARLO Os experimentos de Monte Carlo constituem um mecanismo que nos permite colocar em teste a propriedade MELNV dos estimadores, procurando saber até que ponto elas so validas. Para melhor entendimento quanto a nogio bisica dos experimentos de Monte Carlo, apresentaremos em sintese um conjunto de passos sucessivos: a) Considere uma funcdo de _regresséopopulacional do tipo: Y=B, +B:X, +u, b) Admitimos a hipétese que os pardmetros reais so conhecidos, sendo: 8, = 20 B=0,6. ©) Assumimos um tamanko da amosira de 25 observagées, assim como fixamos os valores de X para cada observagao. d) Escolhemos 25 observacées aleatérias tomando uma distribuigéo normal ~N(0,c) ¢ chamamos estes de residuos yx, Considerando que o valor de By, B,, X, € 41, sdo conhecidos, implica dizer que podemos determinar 0 valor de Y, ©) Agora, com o valor de Y,, € tomando os valores de X,, calcule uma regressio para determinar ,, 6. 24 f) Imagine agora que vocé repete 0 mesmo 19 vezes, tomando os valores de f,, B,, X,, @ medida que se forem criando aleatoriamente os valores de \1, chagaré ao ponto de obter 20 de ,, fs, entao, tomando estas observacoes, determinamos as média dos pardmetros ficando com (,. :. Se porventura as medias encontradas forem iguais ou bem préximas aos valores iniciais de B, © B,, enti estes estimadores sdo de facto estimadores ndo viesados. Na verdade este tipo de experimentos faz-se para 1000, 2000, 5000 ou muito mais iteragées, geralmente com ajuda do computador. 2) Em sintese 0 método de Monte Carlo é 0 mecanismo pritico para testar as hipéteses: Blp,)-B, ede E(,)-B, 8. OUTROS INDICADORES NA VERSKO MATRICIAL a) O TESTE DEF Na versio matricial, a estatistica de F obedece os mesmos pressupostos enumeiados na versio ese: No entanto, a formula para o calculo da estatistica de F conforme jé foi dito, diz nos qual é o grau de significdncia global do modelo, Geralmente, infere-se ao modelo ANOVA (designado para o estudo da variancia), permitindo-nos analisar todos os possiveis de cendrios de significdncia global do modelo, (xy ay ‘y-BXy nk F= Equagio 54 onde o teste segue a distribuigao de F, com kel ¢ n-k graus de liberdade. Considerando a relagdo proxima entre 0 coeficiente de determinagio © a estatistica de F, podemos apresentar F como sendo: Equagdo 55 25 4) O COEFICIENTE DE DETERMINAGAO® Equacio 56 Lembre-se que [i'X'y—nY° representa a soma do quadrado do erro -SQE ¢ é um escalar. Analogamente y'y—nY’ representa a soma do quadrado total -SQT também um escalar. ©) O COEFICIENTE DE DETERMINAGAO AJUSTADO © grande aspecto a considerar, é que R? é uma fungdo ndo decrescente em ralagéio ao namero de varidveis independentes ou dos pardmetros regressores presentes no modelo. Conforme aumenta o niimero de regressores, R? também tende a aumentar. Para resolver este problema, expurgamos 0 efeito dos graus de liberdade obtendo o coeficiente de determinagiio ajustado: AG ty fs-1) curiosamente, repare que 0 que temos acima ndo & nada mais do que os conceites da variancia do erro e a varidncia de Y, logo podemos escrever Equacdo 57 Equacdo 58 mais além, nota que ainda podemos manipular R? usando R? passando a ser: ee) a) assim sempre que k>1 implica que R?>R* Equagio 59 d) AVARIANCIA E A MATRIZ VARIANCIA COVARIANCIA Considere o vector de estimadores dos minimos quadrados ordinarios ¢ fagamos um desenvolvimento preliminar: B= (x'x)'x'(Xp+u) (XX)X'XB+ (XK) Xa B+(X'X)'X'u implica que, p-p=(x’x)'x'u Equagio 60 Determinemos agora a varidneia da covaridn * Lembre-se que anteriormen! apresentado como: wr Dif referenciamos que 0 coeficiente de determinagio também pode 26 var-cov() = =| 6- B\p- 0] =H (xx) x'ul(e°xP' Xn) | - Ex) xu ’X(XX)" is (XX) XE(wu)X('XY"! = (XXX IX(X'X) finalmente obtemos a matriz variancia — covariancia: cov(B) =07(X"x)" Equacio 61 na verdade a equago apresentar-se-ia do seguinte modo, 10. 0 n yx, DX 0 1. OSX, Xs D%Xu 00 TWX Dee x onde por obediéncia das hipéteses basicas, apenas consideramos os valores da coluna diagonal esquerda-dircita, i.e. as varianeias va var— cov () = o| ‘Consequentemente, teremos: var(B,) —_cov(B,,B,) .. cov(B,,B,) covifs.f,) vari) var-covi) = covii,.8,) coviB,.B.) vary) De seguida, para o céleulo da matriz do erro padrio teremos: Yar) Yoov.B.) .. yoov,.B,) ep(iy =| VeorBs.8) Yvan) Voovi,,B,) yeov',.B,) Yeov’5,.B.) var(B,) onde sero validos apenas os elementos da diagonal. Note que vocé encontrara alguns valores negativos fora da diagonal (esquerda — direita) e estes nao terdo raiz quadrada. ~ 27 6. EXERCICIO: ILUSTRACAO Dados Ordem —— Qtid Ibs__Preg Silbs Gastos em Propaganda $ 1 5 100 35 2 70 90 63 3 90 80 12 4 100 70 7 s 90 70 63 6 105 70 738 7 80 10 56 8 110 65 715 9 us 60 1S 10 130 55 715 u 130 50 65 Pretende-sez 1. Provar se os dados conferem com a equagiio abaixo: Qtid, =117.532-1.326X,, +11.237X,, +8, 2. Fazer o check up dos sinais esperados 3. Fazer o teste de t para cada parametro. 4. Calcular 0 coeficiente de determinago sem tomar em conta os graus de liberdade. 5. Interprete os resultados obtidos RESOLUCAO: Primeiro formulimos 0 modelo: $8 1 100 5.50) u 70 1 90 6.30 uy 90 1 80 7.20 uy 100 1 70 7.00 Uy 90 1 70 630) [B, uy 105) =|1 70 735] |B,] +} u, 80 1 70 5.60) [B5),., [uy 110 1 65 7.15 Us us 1 60 7.50 uy 130 1 55 7.15 Uso 130}, [1 50 6.50],,,, Set y= xX Bf Fou Calculo da Matriz quadrada (X"X)das varidveis exogenas. fl 100 5.50) 1 90 630 1 80 7.20 1 70 7.00 Por odd dot to dt 2 1 tat 7 630) f 780 7355 7 100 90 80 70 70 70 70 65 60 SS SOf1 70 7.35/=| 780 57450 5163.5 S55 63 72 7 63 635 56 715 75 7.15 651 70 5.60) [73.55 5163.5 496.5975 1 65 715 1 60 7.50 155 7.15 1 50 6.50 CAleulo da matriz inversa da matriz quadrada {x'x)" fdas variiveis exdgenas 11 780 73.55 Seja A=] 780 57450 5163.5, 73.55 $163.5 496.5975 Calculamos o determinante: DET (A)=83815.75 Aplicar regra de Crammer neste momento segundo os passos: + Calcular determinante * Calcular a matriz dos coofactores © Caleular a matriz ajunta (transp cofactores) * Dividir pelo determinante de A Elementos da Coluna 1 Elementos da Coluna 2 $7450 = $163.5 780 5163 e+ =1867794.125 yy -1570.625 [5163.5 496.5975 [73.55 496.5975| 780 73.55 M7385 a= =~1570,625 n= 4 oe |=52.97 5163.5 496.5975| 173.55 496.5979 8073. 3 ey <4 780 7353) _ igr917.5 cn-!t 5) s705 57450 5163.5] ~ [780 5163. Elementos da coluna 3 780 57450! a= =-197917.5 173.55 5163. a 780 | =570.5 173.55 5163. =n 780 = 23550 780 5745 29 Montamos neste momento a matriz adjunta (1867794125 —7570.625 -197917.5) AdjA=| -—7570.625 52.97 370.5 -1979175 570.5 23550. } Calculamos a matriz inversa, dividindo o determinante a transposta da matriz adjunta, (1867794.125 -7570.625 -197917.5) -1570.625 $2.97 570.5 { -197917.5 570.5 23550 |83815.75| Encontramos a matriz inversa: 22.2845244 -0.090324611 -2.361313402) =| -0,0903246 — 0,000631981 — 0.006806597 (-2.361313402 0.006806597 _0.280973445 } Determinamos agora a matriz X’ y via multiplicagdo de mattizes, para computar 0 vector dos parametros 1 1 1 1 1 I 1 1 1 1 1 | 90 1075 X'y=|100 90 80 70 70 70 65 60 55 50 S50} 105|=| 72950 55 63 7.2 7 63 635 5.6 7.15 7.5 7.15 6.5] 80 \ 7301.75, 110 Ls 130 130 ok, conhecendo a férmula dos estimadores f = (X’X)"X'y, podemos calcula-los. ( 22.2845244 —0,090324611 -2.361313402\/ 1075 —0.0903246 0.000631981 — 0.006806597 || 72950 -2.361313402 0.006806597 —_0.280973445 7301.75, 6 Multiplicando obtém o vector dos estimadores 124.7475407 ) fi=| -1.295842369 { 9.698356216 E finalmente montamos a nossa fungdo estimada: 30 24.7475407 -1.295842369P, +9.698356216GP, +, Quid, ‘Vamos agora caleular a varincia do erro: x'(xB. 265.620251 33.30775314 n-k Sabendo que: var—cov(B) = 6° (X"X)" 22.2845244 = —0.090324611 -2.361313402' 0,000631981 — 0,006806597 = 33.32775314) —0.0903246 0,006806597 0.280973445, + 2.361313402 ( 742.693128 3.010316 78.698163) =3.010316 0.021063 0.226849 78.698163 0.226849 9.364214 } var—cov() \ Assim teriamos o vector do erro padrio: 27.2523967 | (fi) =| 0.14512933 3.06010026 | © as estatisticas de t que nos dizem qual o grau de significdncia estatistica 4.578223 16) =| -8.92888 3.169294 Neste momento, efectuamos o teste de hipdteses para avaliar o resultado obtidos: => Re jeigdo Ay Como se pode observar, a0 nivel de significadncia todos os pardmetros so poderosa e estatisticamente significantes. © Calculo do coeficiente de determinagao: A y? nY? _ 110408.378-105056.8182 _ 4 geos4ag1 110675 —105056.8182 31 Parte A - Cdlculo Automdatico 1. 7. ILUSTRAGAO MICROSOFT EXCEL PARA CALCULOS ECONOMETRICOS Considere que Ihe foram dadas 13 observacées trimestrais da quantidade onde as quantidades procuras do referido preco julgam-se depender dos gastos com publicidade segundo os dados descritos abaixo: Para computar estes dados, tenha-nos inseridos numa folha de cdlculo, tal como se visualiza na figura 1. De seguida, va a0 menu “Ferramentas” e no final, escolha “Andlise de dados”, depois de aparecer a janela, “analisar dados”, escolha Regressao, e de seguida, insira os dados como se visualiza na figura 2. Nota que a figura dois possui as referencias $B$1:$B$14, $C$1:$D$14 que sdo as coordenadas (coluna-linha) dos dados para a variavel dependente e para as varidveis independentes respectivamente. Data Compras, Prego Publicidad 1998+ 340 § 48,00 $ 234,00 199941 330 $ 7200 $ 256.00 199941 370 $ 96.00 $ 278.00 19981V 350 $ 72,00 $ 300.00 2000-1 380 $ 48.00 $ 322.00 2200041 380 § 144.00 $ 344,00 2000-1 400 § 96.00 $ 366,00 20004 210 § 168.00 $ 388,00 200141 390 § 98.00 $ 410.00 2001-1 400 $ 14400 $ 432.00 2001. 410 § 7200 § 45400 20016 230 § 216.00 $ 476.00 200241 420 $ 19200 $ 498.00 Poe een Ficheiro Edtar Yer Inserir Foamatar Ferrarentes D Oe eS @ os & 4h) ine 1 2 14 Figura 1 Dados Data 1399) [3 [ig09.0 4 199941 1999-1 2000-1 200041 2000-1 2000 2001-1 200i 2001-i 2001-1 2002+ B Compras Praca 340.00 48.00 330.00 72.00 370.00 96.00 350.00 72.00 380.00 48.00 330.00 144.00 00.00 96.00 210.00 186.00 390,00 96.00 40n.00 144.00 aio.00 72.00 230.00 216.00 4zo.00, 192.00 Publicidade 734.00 25.20 | 37.00 200.20 m0 344.00 265.00 363.00 410.20 432.00 454.00 175.20 495.00 Da figura 2, clicando OK, o resultado da analise de regressao para os dados apresentados é automaticamente representado na area comegando pela célula $C$17.- (sempre que vivelar 0 $ entre coerdenatss, le €usade para ‘sa- 9 csv. ASSIM Sendo os SeUS resultados basicos sero apresentados do seguinte modo. 32 Crtede eva a aes Interval Remsen ay Sel F Rotules F constanted zero Fnveldecenfings = [ES % ‘pci de sida © sykervalo de sada facta? © Nye fol de cab: © Novo esisie 1 Restduas F Deserta ce valores estuals IF Rescue padrenzados [~ Desenfa ce nha apstada bbblidade nema 1 esene de pica nova Figura 2 Jancla de Insergio de dados e definigao de pressupostos SUMARIO DOS RESULTADOS Finataio, ‘.anzTFaT Guadtsee da R o.gs92354 Guadiede de R ajustee 02980025 Eno-paurdo 57.273833 [hsenacties 2B anova, Fepressto F aFAO ae BTN TE FASRAT 0.1 N8R08z7F Raciaual 1a 3230292 928029 Tetal 12. 515230760 Tatereepr Wee sams Te OTsEsD 3770S GUase TTT THINS G5 Usz76 111 70182 eas gosTe rapa fo2nd2n2 042638412 298202 CO3eKe -1.9749196EC -20860207 -1.e740107 -0.0359207 Fublicidade ousggatia o274ae772 107118 0.09058 011153590 111191954 01116959 111131954 Figura 3 Resultados da Analise de Regressio 5. Em termos de apresentacdo da regressdo tomariamos os principais dados e apresenta-lo iamos do seguinte modo, (Nota que existam varias formas de apresentagio dos dads, diferindo uma da outra)? G, = 286.59928 — 1.0204202P, +0.49981 18Pub, (76.0136804) (0.42838422) | (0.27444772) R?=0, 36%; Onde os valores em paréntesis representam o desvio padréo. Algumas vezes, escrevemos directamente as estatisticas de t para cada um dos cocficientes estimados (assuminds a hipétese nula)ao invés de apresentar 0 desvio-padréo, Parte B-— Calculo Manual Como resolver manualmente o exercicio acima exposto com ajuda do Excel? 33 1. Cria um ficheiro novo no Excel. V4 0 menu Ficheiro, active guardar como, e grave designando-o “r-lienar” 2. Introduza os dados no espaco Al:D14 tal como consta na figura 1. Alternativamente, vocé poderd fazer 0 download deste ficheiro no website; 3. Coloque o curso na Coluna C, e va ao menu Inserir, clique “coluna” criar-se hé uma coluna a esquerda do vector do preco. Escreva Intercepto na célula C1, escreva 1 em cada célula de C2 a Cl Va para a célula B20, escreva Matrix X Transposte. Seleccione a drea C2:E14, clique no menu Editar, active copiar, de seguida, coloque 0 curso na célula C20 e va para o menu Editar, clique em colar especial Verd uma janela, clique na caixinha junto de transpor, e depois clique em OK. Teré assim criada a matriz transposta das variéveis independentes. 7. Va para a célula B25, escreva _X’X, de seguida seleccione a drea (C25:E27), clique na tecla F2 escreva =MATRIZ.MULT(C20:022,C2:E14) de seguida clique simultaneamente em na tecla Ctr+Shift, com estas primadas, aperte a tecla “Enter”, assim sendo vocé ter a multiplicacdo da matriz transposta de X pela matriz X 8. Va para a célula B29, escreva XX Inversa, seleccione a drea (C29:E31), clique F2, escreva =MATRIZ.INVERSA(C25:E27), de seguida clique simultaneamente em na tecla Ctrl+Shift, com estas primadas, aperte a tecla “Enter” 9. Vé para a Célula B34, escreva X’y, seleccione (C34:36) a drea posicione o cursor, prima F2 e escreva =MATRIZ.MULT (C20:022,B2:B14), de seguida clique simultaneamente em na tecla Ctrl+Shift, com estas primadas, aperte a tecla “Enter” 10.V4 para a célula B39, escreva Betas, seleccione a area (C39:C41), prima F2 e escreva =MATRIZ.MULT(C29:E31,C34:C36), de seguida clique simultaneamente em na tecla Ctrl+Shift, com estas primadas, aperte a tecla “Enter”, vocé tera assim coeficientes no valor exacto dos cAlculos obtido acima: 11. Agora confira os seus resultados com os resultados da impressao no verso, para averiguar se vocé obteve os parametros estimados conforme. Q, = 286.59928 — 1.0204202R +-0.4998118Pub, ous 199941 1999 19981 2001 2001-1 | 20004 V. FORMAS FUNDAMENTAIS DOS MODELOS DE REGRESSAO ‘Ao mudar unidades de medida das variiveis dependente e/ou independente, estimativas de MQO sao afectadas. — Se a variével dependente é multiplicada pela constante c(cada valor na amostra € multiplicado por c), entdo as estimativas de MQO de intercepto © de inclinagdo também so multiplicadas por c. — Se a varidvel independente é dividida (ou multiplicada) por alguma constante diferente de zero (c) entio o coeficiente de inclinagdo de MQO é multiplicado (ou dividido) por c, respectivamente. — Mudar as unidades de medida da varidvel independente no afecta o intercepto. — © grau de ajuste do modelo (R2) no depende das unidades de medida das vatiaveis. Formas funcionais populares usadas em economia podem ser incorporadas & andlise de regressio, — Até agora foram analisadas relagdes lineares entre as variéveis dependente independente. —No entanto, relagdes lineares ndo s condmicas e sociais. io suficientes para todas as aplicagdes — F. facil incorporar ndo-linearidade na andlise de regressdo simples. 1.1 Modelo Nivel — Nivel (Modelo Lin-tin) Suponha que a varidvel dependente ¢ varidvel independente que se quer analisar estio tanto na forma de nivel. Por exemplo se quisermos saber o efeito sobre os salirios de uma ano extra de educagio, e que os dados disponiveis permitem estimar a seguinte equagao: = 0+ Ed, + ByAge; + BE xp; + & Neste caso, 0 coeficiente da varidvel analisada pode ser interpretado como o efeito marginal. O efeito marginal ¢ a forma como a variével dependente muda quando as mudangas de varidveis independentes por uma unidade adicional mantendo todas as outras varidveis na equagdo constante (isto é, calculando a derivada parcial) ou: aw Ed, 3 1 Portanto, Bj pode ser interpretado como a variagio dos salirios a partir de um aumento de uma unidade (ou mudanga de estado se varidvel dummy) de Xj mantendo todas as outras varidveis independentes constantes, 35 Exemplo: W, = 3.5 + 0.75Ed, + 0.25Age; + 0.30Exp, + & Com base nos dados utilizados nesta regressio, um ano adicional de educagio corresponde a um aumento nos salirios de 0,75 USD/horas. Da mesma forma, um ano de experiéncia esté associado a um aumento de 0,3 USD/hora no salério, mantendo-se as demais variaveis constantes, 1.2 Modelo Log- Log Considere interpretar coeficientes de uma regressio em que a variivel dependente independente a analisar estio na forma de log. Os coeficientes j4 nfo podem ser interpretados como efeitos marginais. Supdes que a teoria econémica sugere estimativa da nossa equagio de salarios com a varidvel dependente na forma log ¢ incluso de horas de trabalho voluntitio da comunidade por semana (Comm), também em forma de log. A equagao de andlise agora é log(Ws) = a + Ai Bdy + BeAges + gE xp; + G4 log(Comm) + € Gostariamos de interpretar 0 coeficiente sobre a varidvel voluntirio da comunidade (B4), Para entender melhor a interpretagdo, considere o diferencial da equagao acima mantendo todas as varidveis independentes constantes, excepto Commi dilog(W;)] illog(Comm,)] 34 dW, = —— Comma, ‘oman, Uma vez que: d{log(X)] xX), Entdo podemos ter: 100 dW Wi _ TwadComm, = Comm, Onde o lado esquerdo ¢ a clasticidade (parcial) de W em relagdo ao Comm. A clasticidade 6 a razio entre a percentagem de alteragio numa varidvel para a percentagem de alteragdo em uma outra varidvel. O coeficiente de regressio é uma clasticidade parcial, j4 que todas as outras varidveis da equagio sio mantidos constantes. Portanto, B4 pode ser interpretado como a variagdo percentual no salario por hora de um aumento de um porcento em horas de trabalho voluntério da comunidade por semana mantendo-se a educacdo, idade e experiéncia constantes. log(W; = 3.26 + 0.24Ed, + 0.08Age; + 0.16 xp; + 1.2log(Comm,) 36 Com base nestes resultados de regresso, um aumento de um por cento em horas de trabalho voluntério da comunidade por semana é associada a um aumento de 1,2% no salitio por hora. 1.3 Modelo Log- Nivel (Log - Lin) Na equagdo do modelo 1.2, a educagao, idade e experiéncia esto em termos de nivel, enquanto a variavel dependente (salario) é, em termos de log. Gostariamos de interpretar os coeficientes dessas varidveis. Primeiro, considere educagdo. Leve o diferencial mantendo todas as outras varidveis independentes constantes. dllog Wi] = dEdi1 dW, Wi Multiplicandos os dois lados por 100 e reorganizando teremos: dEds 34 100 + dW; ; a = 100 + dE ds 3 a AW, dEd, ~ wnit MEd; Portanto, 100 x B1 pode ser interpretado como a variagio percentual de aumento Wi unidade em Edi, mantendo todas as outras variéveis independentes constantes Derivagées similares podem derivar da interpretagdo para os coeficientes da idade e experiéncia. Considerando © modelo estimado no ponto 1.2, podemos dizer 0 seguinte: mantendo todas as outras varidveis independentes constantes, um ano adicional de escolaridade esti associado a um aumento de 24% no salirio por hora, Da mesma forma, um ano adicional de experiéneia é associada a um aumento de 16% no salirio por hora 1.4- Modelo Nivel-Log (Lin-Log) Considere-se uma regresso em que a varivel dependente & em termos de nivel ¢ a variével independente de interesse ¢ em termos de log. Por exemplo, considei seguinte equagdo: Wi = 0+ Eds + Age: + SxExpi + Balog(Commy) + € a Lembre-se da secgdo de regressées de nivel-nivel que os coeficientes de educagao, idade e experiéncia podem ser interpretados como efeitos marginais. Gostariamos de interpretar coeficiente de horas de trabalho voluntério da comunidade (B4). Mais uma vez, levar o diferencial de ambos os lados, mantendo todas as variaveis independentes constantes excepto trabalho de voluntério da comunidade, 37 dW, = d{log(Comm)| 34 aw, = —\_acommy Comm, Dividindo os dois lados por 100 e reorganizando podemos ter: By aw, unit AW; 100 1dComm, GM Entio: Bs 100 Pode ser interpretado, interpretado como 0 aumento do salario por hora de um aumento de um porcento de trabalho voluntario da comunidade. W, = 3+ 0.67Bd; + 0.28Age; + 0.34Exp; + 13.2log(Comm,) Portanto, mantendo-se a educagdo, idade e experiéncia constante, um aumento de um porcento de trabalho voluntério da comunidade esta associado a um aumento de 0,132 délares em saldrios por hora. Podemos sumarizar os modelos no seguinte quadro: ee Variavel Variavel Interpretacao Dependente Independente de B, nivel-nivel y x Ay=ByAx nivel-log y log(x) Ay=(By/100)%Ax log-nivel log(y) x %Ay=(100B,)Ax log-log logty) log(x) %Ay=B,%AX 38 VI. RELAXANDO AS HIPOTESES BASICAS DO MODELO 1, A MICRONUMEROSIDADE E MULTICOLINEARIDADE © termo Multicolinaridade foi introduzido por Ragner Frisch para ilustrar a existéncia de uma perfeita ou exacta relago linear entre varidveis independentes de um modelo. Existe uma relagdo linear exacta quando: PyXy +P2Xy + PsXsun Py Xy =O Equagio 62 onde p,,p;...P, S40 constantes do modelo mas que todavia nem todas sao iguais a zero, E comum encontra-se modelos com multicolinearidade porem nao em situagdo de colinearidade perfeita Qe & A- Aus@ncia de Colinearidade —B- Colinearidade Baixa C-Colinearidade Alta Quando estamos em presenga de multicolinearidade perfeita, os coeficientes da regressio tornam-se indeterminaveis ¢ 0 erro padrdo tende para o infinito. Se a multicolinearidade € menos que perfeita, a tendéncia é tio somente de observar-se um alto erto padrao o que traduz a dificuldade de estimagao do erro padrao, Um aspecto importante a fazer mengo é que ainda que 0 modelo observe alta multicolinearidade, este facto nfo afecta as propriedade basicas dos estimadores dos minimos quadrados ordinarios. Eles mantém MELNV. De facto Cristopher Achen salienta: ‘studantes principiantes de metodologia ds vezes se preocupam com 0 facto de suas varidveis independentes estarem correlacionadas - 0 assim chamado problema da multicolinearidade. Mas a multicolinearidade nao viola nenhuma hipdtese de regressdo. Estimativas ndo-viesadas e consistentes yao ocorrer, e seus erros-padréo sero correctamente estimados. O iinico efeito da multicolinearidade é tornar dificil a obtengdo de estimativas de coeficientes com pequeno erro-padrao, Mas ter um nimero pequeno de observacaes também tem esse efeito, assim como ter varidveis independentes com pequenas varidincias. (Na verdade, em nivel tedrico, multicolinearidade, poucas observacoes € pequenas varidncias nas varidveis independentes so, basicamente, 0 mesmo problema.) Assim, "O que devo fazer com a multicolinearidade?” é uma questo semelhante a "O que devo fazer se nao tiver muitas observagées?". Nenhuma resposta estatistica pode ser dada.” 39 a) FONTES DA MULTICOLINEARIDADE Montogomery e Peck, terio desenvolvido um trabalho extensivo no qual é possivel identificar as potenciais fontes da multicolinearidade: 1. O método usado na colheita de dados: sobretudo quando consubstancia- se numa gama limitada de observagdes tende a traduzir-se em relagdes colineares no pressuposto de que tomando 0 comportamento de determinadas séries em tamanhos ou intervalos de tempo curtos, nun chega a ser suficientemente explicativo para captar as tendéncias reais de mudanga; Restrigdes impostas ao modelo: costuma-se usar 0 exemplo da relagéo rendimento e consumo de electricidade, partindo do pressuposto de que escalées de baixo rendimento tendem a associar-se com habitagdes restritas em termos de espago e consequentemente no consumo de energia; Mispecification Bias: Quando as variaveis a incluir no modelo nao forem devidamente especificadas ou quando o modelo possui um numero de pardmetros superior ao tamanho da populagdo (observagdes). 4) PRESENGA, DETENCAO E MEDIDAS CORRECTIVAS Como detectar a multicolinearidade constitui uma das questdes preocupantes para principiantes em econometria, De facto a existéncia ou a ndo existéncia da multicolinearidade jo deve constituir preocupagdo. O que mais deve preocupar so os distintos niveis da multicolinearidade; Veremos alguns indicadores ba ‘cos que nos permitem induzir a existéncia da multicolinearidade: 1 Alto coeficiente de determinagao e poucos parametros afigurando-se estatisticamente significantes: Geralmente toma-se como referencia 80%, € em muitos dos casos o teste de F rejeita a hipétese nula de simullaneidade dos coeficientes parciais; Correlagiio elevada entre dois a dois parimetros: se computando o grau de cortelago entre dois a dois pardmetros vislumbra-se num. Coeficientes de associagio acima de 80% constitui uma pista para suspeitar a existéncia de alto nivel de colinearidade; Argumenta-se também que para alguns casos a colinearidade pode existir mesmo em situagdes em que o grau de correla¢do de ordem zero entre varidveis & baixo. Regresses auxiliares: outra técnica pertinente para detengio da existéncia de multicolinearidade tem sido computar regressdes auxiliares de cada varidvel independente sobre as demais e o consequente calculo do coeficiente de determinago para averiguar o grau de ajustamento do modelo. 40 Conhecidas as fontes e detectada a presenga da multicolinearidade, que mediadas correctivas? A multicolinearidade é essencialmente um problema de amostra, © que torna simples identificar a s medidas correctivas para livrar-se dela, 1. A informagao a prior constitui um factor determinante na medida em que a percepsio do tipo de varidveis em causa ow 0 tipo de questdes que se tenham colocado num inquérito especifico, tendem a fornecer um foco de correc¢io; Exemplo, 0 modelo de determinagiio do consumo como fungdo do rendimento pessoal disponivel e da riqueza é um dos casos de alta associagao. 2. O tamanho da amostra, conforme jé abordado, sempre que for possivel incrementar o tamanho da amostra, para alguns dos casos tende a expurgar o efeito colinear entre determinadas varidveis; 3. Re-especificagao do Modelo: por vezes & possivel num determinado modelo ter variiveis redundantes, uma vez retiradas, 0 grau de significdncia estatistica do modelo nao sofre grandes alteragdes; Também associam-se nestes casos a especificagao correcta do modelo. Exemplo: modelo correcto previsto & dado por: Y,=B.+BLXs +B Xs HH; Equacao 63 todavia nés especificamos o modelo da seguinte maneira Y, =, +0,,X, +a, Equagio 64 quando sabe-se afinal de contas que: E(0.,2)=B; +Byt,. onde a,,6 0 Angulo de inclinagio das variaveis Xz ¢ Xs. Consequentemente, ocorrerd que a a, ser um estimador enviesado de B,desde que 0, seja diferente de zero. 4. A Transformagio de variaveis: Ocorre para muitas varidveis nio estaciondrias, geralmente quando estas apresentarem um comportamento com “trend” tal que usando o exemplo do rendimento e consumo, a tendéncia de ambas as variaveis seguem a mesma direcgao. Estes caso ria em certa parte um comportamento ilusério que para alguns dos casos traduz-se em multicolinearidade. A transformagio de variaveis muitos casos. consiste na aplicago de logaritmos para _abrandar 0 comportamento do trend ou no calculo da primeira diferenga. Y, =B, + BX; +BMsi +H Equagio 65 aplicando uma desfazem , teriamos Yun = By +BoXoer + Baa + Bia Equagio 66 consequentemente, a diferenga de ambas as fungdes seria: Y, Yi =Bz(X3, —Xa4) + Bs(Xq Xs) HV, Equagdo 67 5. A combinagio de dados de corte (cross-secionais) e séries temporais, embora seja um artificio um pouco complexo, constitui uma das sugestes pertinentes para resolugdo do problema; 4l ¢) CONSEQUENCIAS PRATICAS DA MULTICOLINERARIDADE Nao obstante continuarem sendo MELNY, os estimadores dos minimos quadrados ordindrios tendem a produzir varidncias ¢ covariancias com um tamanho bastante alto, dificeis de serem estimadas; Consequentemente, os intervalos de confidéncia tendem a ser bastante largos forgando a imediata aceitagdo da hipétese nula (de que o coeficiente da populagio real é igual a zero); Existe uma tendéncia das estatisticas de t de cada coeficiente, mostrarem-se estatisticamente insignificantes em contraste, o coeficiente de determinagio do modelo R? tende em muitos dos casos para um valor préximo de 100% demonstrando que 0 modelo estimado ajusta-se ‘ao modelo real; Pequenas alteragdes nos dados estatfsticos deixam os estimadores € os desvios-padrio bastante sensiveis a mudancas 42 2, ELEMENTOS CHAVE' DA MULTICOLINEARIDADE 1, Uma das hipéteses do modelo clissico de regressio linear é a de que nao haja multicolinearidade entre as varidveis explicativas, os Xs. Interpretada a grosso modo, multicolinearidade se refere & situagdo em que ha uma relagdo linear exacta ou aproximadamente exacta entre as varidveis X. 2. As consequéncias da multicolinearidade so estas: se houver uma colinearidade perfeita entre os X's, seus coeficientes de regressdo serdo indeterminados e seus erros-padrio no serio definidos. Se a colinearidade for alta, porém nao perfeita, a estimativa dos coeficientes de regressio seré possivel, mas seus erros-padrio tenderdo a ser grandes, Como resultado, os valores dos coeficientes na populagdo no podem ser estimados precisamente. Porém, se o objectivo for estimar as combinagdes lineares desses coeficientes, as fungdes estimaveis, isto pode ser feito mesmo na presenga da multicolinearidade perfeita. 3. Embora no haja nenhum método infalivel para detectar a colinearidade, ha diversos indicadores dela, que so os seguintes: (a) 0 indicio mais claro da multicolinearidade surge quando R* é bastante alto, mas nenhum dos coeficientes de regressdo é estatisticamente significativo segundo 0 teste t convencional. Este caso, naturalmente, é extremo. (b) Nos modelos envolvendo apenas duas variaveis explicativas, pode-se obter uma ideia razoavelmente boa da colinearidade examinando-se 0 coeficiente de correlago simples, ou de ordem zero, entre as duas varidveis. Se estio correlagdo for alta, geralmente a culpada é a multicolinearidade. (c) Os coeficientes de correlagio de ordem zero, porém, podem ser enganadores em modelos que envolvam mais de duas varidveis X, pois & possivel ter baixas correlagdes de ordem zero ¢, apesar disso, existir alta multicolinearidade. Em tais situagdes, talvez tenhamos de examinar os coeficientes de correlagao parcial, (d) Se R?for alto mas as correlagdes parciais forem baixas, a multicolinearidade e uma possibilidade. Aqui, uma ou mais varidveis podem ser supérfluas. Mas se 0 R? for alto e as correlagdes parciais também forem altas, a multicolinearidade pode nao ser facilmente detectavel (e) Portanto, podemos regredir cada uma das variveis X. sobre as demais varidveis X no modelo e descobrir os respectivos coeficientes de determinagao "quanto a alinea (a) al so, como destacaram C. Robert’ Keisha Kunar, John O*Fagan e Brendan MeCable, AA alguns problenas estalisticos com o Leste sugerido por Farrar e Glaube 43

Potrebbero piacerti anche