Sei sulla pagina 1di 9

Universidade federal do Rio de Janeiro Instituto de Economia

Introduo a Econometria Trabalho 1

Docente: Eduardo Pontual Ribeiro

Estudantes: Marvin Miranda Lpez Juan Matias de Lucchi

Data: Quarta Feira Oito de Abril de 2009

IE/ UFRJ Introduo Econometria 2009/I Prof. Eduardo P. Ribeiro Primeiro Trabalho Vamos estudar a estimao de uma funo de custos. No arquivo nerlove.xls, temos dados de custos e produo para o setor (termo-)eltrico norte-americano nos anos 50 coletados por Marc Nerlove (apud Hayashi, 2000). So dados de cross-section (um s ano) e temos 145 observaes As sries so TCcusto, Q produto em MWh, PL-preo do trabalho, PF-preo combustvel e PK-preo do capital. Vamos estimar uma funo de custos baseada em uma tecnologia Cobb-Douglas, TC = A PBK PCL PDF QE Supondo mercados concorrenciais de produto, a medida de retornos crescentes da tecnologia dada por 1/E (se E<1, retornos crescentes). Esta hiptese importante pois se os retornos forem verificados crescentes, a gerao de energia eltrica para os EUA no perodo pode ser considerado como monoplio natural. 1. Supondo um termo aleatrio da forma exp(), aplique uma transformao para obter um modelo linear nos parmetros. Supondo um termo aleatrio exp() se obtm o modelo econometrico apresentado abaixo, TC = A PBK PCL PDF QEei Onde ei o termo de perturbao aleatria normalmente distribuda. A transformao que se tem que aplicar para que o modelo fique linear nos parmetros Logaritmo natural e o modelo fica assim. Ln TC = Ln A + Ln PBK + Ln PCL + Ln PDF + Ln QE+ Ln ei Ln A o valor da constante tecnologia por isso seu valor com Ln tambm uma constante, assim poderia se chamar . O que acontece com a varivel perturbao uma propriedade de Log, onde todo Ln ex igual a x, por tanto o termo perturbao i. Alem disso o modelo pode ser transformado por outra propriedade de Log onde os expoentes das variveis que tem Ln passam a multiplicar o logaritmo, mudo tambm a notao dos expoentes por convenincia futura, o modelo fica assim: Ln TC = + 2LnPKi + 3LnPLi + 4LnPFi + 5LnQi + i 2. Qual justificativa poderia ser apresentada para tal termo aleatrio? Em que condies este termo exgeno? O termo aleatrio apresentado por que ele um substituto para todas aquelas variveis que so omitidas no modelo, mas afetam coletivamente o Y1(neste caso Q). Ele esta na forma exponencial por que este numero (constante) descreve o comportamento de acontecimentos fsicos que so explicados por equaes diferenciais2 no nosso caso, como o modelo Log-Linear mltiplo representa elasticidades parciais com respeito ao Custo mediante os , ento preciso utilizar as perturbaes desta forma. O termo exgeno quando este aleatrio, por convenincia nos precisamos que tenha uma distribuio normal, j que as propriedades da distribuio normal na perturbao, so utilizadas nas supostos do modelo econometrico, como no valor mdio da perturbao igual a 0, homocedasticidade, no autocorrelao, entre outros.

1 2

Gujarati, Damodar. Econometra. 4 Edio, folha 43. Nmero e http://es.wikipedia.org/wiki/Numero_e

3. Estime um modelo de regresso simples associando custos a produto apenas. Os retornos parecem ser crescentes? Em que situao haveria vis nas estimativas? a) LnTC = + 2LnQi + i Suj: supostos MQO

Modelo: estimaciones MCO utilizando las 145 observaciones 1-145 Variable dependiente: l_TC Coeficiente Desv. Tpica Estadstico t Valor p ----------------------------------------------------------------const -2.92532 0.127019 -23.03 5.74e-050 *** l_Q 0.709202 0.0186024 38.12 8.40e-077 *** Media de la vble. dep. Suma de cuad. Residuos R-cuadrado F(1, 143) Log-verosimilitud Criterio de Schwarz 1.724663 D.T. de la vble. dep. 1.421723 26.07182 D.T. de la regresin 0.426990 0.910427 R-cuadrado corregido 0.909800 1453.458 Valor p (de F) 8.40e-77 -81.34487 Criterio de Akaike 166.6897 172.6432 Crit. de Hannan-Quinn 169.1088

O modelo arriba apresentado avalia os custos totais respeito a o nvel de produo, esta apresentado de forma Log pela natureza dos dados e da teoria econmica. O estatstico t para L_Q (Ln Q) de 38.12 com um valor p muito baixo, o que nos diz que e muito pouco provvel cometer o erro tipo I(regra de 2t), se pode rejeitar a hiptese H0: 2 = 0 e aceitar a hiptese alterna de H1 0. Neste modelo se obtm o valor de 2 = 0.709202, com um desvio padro de 0.0186. O r2 alto, de 91% aproximadamente, assim as variaes em L_Q podem explicar muito bem as variaes no L_TC. Como o modelo Log-linear, assim representa elasticidades parciais para explicar TC, por isso a elasticidade de Q 70.92%, o valor menor do que 1, isto nos diz que aparentemente existem retornos crescentes no setor eltrico estudado. b) Teria vis nas estimativas se tivesse um erro de especificao no modelo, por exemplo, se deixasse fora variveis que pudessem explicar melhor a variao do custo. 4. Rode a regresso mltipla para a funo custo. Ln TC = + 2LnPKi + 3LnPLi + 4LnPFi + 5LnQi + i Suj: supostos MQO
Modelo: estimaciones MCO utilizando las 145 observaciones 1-145 Variable dependiente: l_TC Coeficiente Desv. Tpica Estadstico t Valor p ----------------------------------------------------------------const -3.52650 1.77437 -1.987 0.0488 ** l_Q 0.720394 0.0174664 41.24 3.30e-080 *** l_PL 0.436341 0.291048 1.499 0.1361 l_PF 0.426517 0.100369 4.249 3.89e-05 *** l_PK -0.219888 0.339429 -0.6478 0.5182 Media de la vble. dep. Suma de cuad. residuos R-cuadrado F(4, 140) Log-verosimilitud Criterio de Schwarz 1.724663 D.T. de la vble. dep. 1.421723 21.55201 D.T. de la regresin 0.392356 0.925955 R-cuadrado corregido 0.923840 437.6863 Valor p (de F) 4.82e-78 -67.54189 Criterio de Akaike 145.0838 159.9675 Crit. de Hannan-Quinn 151.1315

4.1. Qual o valor do R2? Ele alto ou baixo, isto , a regresso boa ou ruim. Inteprete o R2. O R2 alto, ms isto no quer dizer que o modelo bom. Devido a que a incluso de variveis no modelo faz que R2 sempre seja maior, O R2 perde significncia no analise. Se se tivesse que comparar o modelo numero 2 com o modelo numero um em termos de R2 tivssemos que usar o R ajustado.

4.2. Vamos para a ANOVA: Apresente a hiptese nula e alternativa do teste. Explique os graus de liberdade. Do ponto de vista estatstico, a regresso boa ou ruim? A hiptese nula neste caso : H0: 2 = 3 = 4 = 5 = 0 H1= Algum deles 0 Os graus de liberdade so 4 para o numerador, por que no modelo h 5 variveis incluindo a TC. O formula dos graus de liberdade do numerador k -1, onde k o numero de variveis. OS graus de liberdade do denominador so 140, j que a formula n k,onde n o numero de observaes e k o numero de variveis incluindo a TC. O estatstico F no modelo 437.68, maior do que qualquer numero da tabela estatstica do F. Assim baseado nesta prova se pode rejeitar a hiptese nula e aceitar a hiptese alterna. O modelo ainda no pode ser considerado bom o ruim por que os parmetros no tm sido avaliados individualmente e se poderia ter um parmetro que no seja significativo. 4.3. Visto a qualidade geral da regresso, vejamos os coeficientes angulares individualmente. Quais so positivos e quais negativos e significativos? Os coeficientes angulares positivos so a produo, o preo do trabalho, o preo do combustvel, se esperava que eles fossem positivos e menores do que 1 ou negativos, j que a medida que o fatores de produo aumentassem tambm o faria os custos. Tambm se esperavam menores do que 1 pela teoria dos monoplios naturais, e a relao da elasticidade da produo e do custo, onde a primeira E e a segunda e 1/E. Destas variveis as que tm significncia estatstica so a produo e o preo do combustvel, j que seus valores t so maiores do que 2 em regra 2t e a probabilidade de cometer erro tipo I baixa. No caso do preo do trabalho, aqui temos um alto desvio padro e o t estatstico no maior do que 2, comparado com estatstico da tabela, se encontra na rea de aceitao da H0 ao nvel de 0.05, ms H0 a pode ser rejeitada a 0.10. No caso do preo do capital, a hiptese nula aceita em qualquer nvel de significncia, e alem disso possui uma probabilidade de ter erro tipo I de ms de 50%. 4.4. Dentre os que so significativos, interprete seus coeficientes. Os coeficientes significativos, a produo e o preo do combustvel. A constante negativa por que existem custos fixos para produzir. Os coeficientes so elasticidades preo para os custos. As duas elasticidades so inelsticas j que elas so menores do que 1. Neste caso um aumento dos preos do combustvel no afetar seu consumo para produzir. No caso da produo uma variao positiva da produo ter como conseqncia um aumento nos custos.

5. Embora alguns dos coeficientes no sejam significativos a 1%, a teoria no indica que eles devam ser retirados. Assim, vamos deix-los e seguir para testes de hiptese adicionais com os coeficientes, sugeridos pela teoria. 5.1. Teste se a tecnologia possui retornos constantes de escala contra a hiptese que eles so crescentes. Qual sua concluso? Qual sua probabilidade de estar errado, se a hiptese nula for na realidade verdadeira (nome desta probabilidade)? H0: 5 = 1 H1: 5 < 1
Restriccin: b[l_Q] = 1 Estadstico de contraste: F(1, 140) = 256.262, con valor p = 1.95563e-033 Estimaciones restringidas: Coeficiente Desv. Tpica Estadstico t Valor p ----------------------------------------------------------------const -7.53038 2.94488 -2.557 0.0116 ** l_PK 0.0758046 0.568180 0.1334 0.8941 l_PL 0.0195454 0.485960 0.04022 0.9680 l_PF 0.715006 0.165526 4.320 2.93e-05 *** l_Q 1.00000 0.000000 NA NA

O resultado da prova que a hiptese nula rejeitada, j que usamos o F de 256.262 e tem p valor de 1.95563e-033. A probabilidade de estar errado o valor do P valor da prova F, e chamado erro tipo II, que o erro de rejeitar uma hiptese que verdadeira. 5.2. Vamos verificar uma imposio terica para a funo custos, a homogeneidade de grau 1 nos preos. Apresente a hiptese nula e alternativa. Qual a matriz R e r em um contexto de teste de hiptese linear H0: R=r ? Quantas restries esto envolvidas? Qual sua concluso? H0: 2 + 3 + 4 = 1 H1: 2 + 3 + 4 1 Para testar a homogeneidade grau 1 nos preos as matrizes so: 1 1 0] [ 2 3 4 5] [1] 1x5 5x1 1x1 Onde a primeira matriz R, a segunda a matriz dos betas, e a terceira a matriz r. Neste caso h somente uma restrio.
Restriccin: b[l_PL] + b[l_PF] + b[l_PK] = 1 Estadstico de contraste: F(1, 140) = 0.57366, con valor p = 0.450081 Estimaciones restringidas: Coeficiente Desv. Tpica Estadstico t Valor p ----------------------------------------------------------------const -4.69079 0.884871 -5.301 4.34e-07 *** l_PL 0.592910 0.204572 2.898 0.0044 *** l_PF 0.414471 0.0989512 4.189 4.92e-05 *** l_PK -0.00738106 0.190736 -0.03870 0.9692 l_Q 0.720688 0.0174357 41.33 1.09e-080 **

[0

Segundo a prova F a hiptese nula no rejeitada, porque se estimativa muito baixa seu p valor de 45%. Por o que existe homogeneidade grau 1 para os preos nos custos de energia eltrica nos estados unidos no perodo estudado.

6. Aplique as hipteses acima empregando modelos restritos e irrestritos e a estatstica F=[(SQRr __ SQRi)/SQRi ]*(n-k-1)/r, onde r o nmero de restries. Como seria o modelo restrito para retornos constantes de escala? O modelo restrito seria assim: LnTC- LnPk = + 3(LnPl LnPk) + 4(LnPf LnPk) + 5Ln Q + i Suj: supostos MQO J que Ho: 2 + 3 + 4 = 1 e por tanto 2 = 1 - 3 - 4 e sua H1: : 2 + 3 + 4 1
Modelo: estimaciones MCO utilizando las 145 observaciones 1-145 Variable dependiente: lnTC_lnPk Coeficiente Desv. Tpica Estadstico t Valor p -------------------------------------------------------------const -4.69079 0.884871 -5.301 4.34e-07 *** lnPL_lnPK 0.592910 0.204572 2.898 0.0044 *** lnPF_lnPK 0.414471 0.0989512 4.189 4.92e-05 *** l_Q 0.720688 0.0174357 41.33 1.09e-080 *** Media de la vble. dep. Suma de cuad. residuos R-cuadrado F(3, 141) Log-verosimilitud Criterio de Schwarz -3.432113 21.64032 0.927088 597.6166 -67.83836 155.5837 D.T. de la vble. dep. 1.435663 D.T. de la regresin 0.391762 R-cuadrado corregido 0.925537 Valor p (de F) 6.16e-80 Criterio de Akaike 143.6767 Crit. de Hannan-Quinn 148.5149

Segundo a formula o F ficaria asim: F = ((21.64032 - 21.5520)/ 21.5520) * (145 6 -1) = 0.5655, o valor muito baixo por o que a hiptese nula pode ser aceita. O modelo para retornos constantes de escala seria assim: Ln TC = + 2LnPKi + 3LnPLi + 4LnPFi + (5 - 1)LnQi + i 7. Finalmente, teste ambas hipteses simultaneamente. Quais as matrizes R e r empregadas? Quantas restries esto envolvidas? Apresente tambm um modelo restrito. Teste a hiptese conjunta obs: Note que se voc rejeitou a hiptese nula ficamos meio na mo. No sabemos se a hiptese conjunta foi rejeitada pois no h retornos constantes ou porque no h homogeneidade de grau 1 ou ambos. Neste sentido o teste F dito no-construtivo, pois no lhe indica que direo tomar. A matriz Rir ficaria assim: 0 1 1 1 0 0 0 0 0 1 [ 2 3 4 5] 1 1

Neste caso h duas restries envolvidas nos problemas, as duas podem ser expressas numa matriz s. O modelo com as duas restries ficaria assim: LnTC- LnPk = + 3(LnPl LnPk) + 4(LnPf LnPk) + (5- 1)Ln Q + i Que a mesma coisa que: (LnTC - LnPk + LnQ) = + 3(LnPl LnPk) + 4(LnPf LnPk) + 5Ln Q + i

Suj: supostos MQO Assim: Ho: 2 + 3 + 4 = 1 e Ho: 5 = 1 E suas H1: 2 + 3 + 4 1 e H1: 5 < 1
Modelo: estimaciones MCO utilizando las 145 observaciones 1-145 Variable dependiente: lnTC_lnPK_lnQ Coeficiente Desv. Tpica Estadstico t -------------------------------------------------------------const -4.69079 0.884871 -5.301 lnPL_lnPK 0.592910 0.204572 2.898 lnPF_lnPK 0.414471 0.0989512 4.189 l_Q 1.72069 0.0174357 98.69 Media de la vble. dep. Suma de cuad. residuos R-cuadrado F(3, 141) Log-verosimilitud Criterio de Schwarz 3.124538 21.64032 0.986273 3376.811 -67.83836 155.5837 D.T. de la vble. dep. D.T. de la regresin R-cuadrado corregido Valor p (de F) Criterio de Akaike Crit. de Hannan-Quinn Valor p 4.34e-07 *** 0.0044 *** 4.92e-05 *** 5.23e-132 *** 3.308694 0.391762 0.985981 4.7e-131 143.6767 148.5149

As hipteses nula so rejeitas, assim segundo a prova F, no temos homogeneidade de grau 1 para os preos e temos retornos de escala crescentes. Mas a prova F no construtiva, j que quando testamos individualmente homogeneidade grau 1 nos preos aceitamos a hiptese nula e nesta prova conjunta temos que rejeitar a hiptese. 8. Para avaliar se o modelo est bem especificado, faa um grfico dos resduos padronizados contra lnTC. Se h algum padro no grfico, isto seria indicativo de no-linearidade (em logs) da funo de custo. O desvio padro para dos resduos do modelo 0.3868 e sua media 0. Para padronizar dividimos pelo desvio padro a diferencia do valor dos resduos menos a media, e se obtm a varivel dos resduos padronizados. O grfico mostra que as perturbaes padronizadas pareceram seguir uma tendncia, por o que tem uma suspeita de no linearidade no modelo e, portanto de vis de especificao do modelo.

Um modo simples de estudarmos esta no linearidade incluindo a varivel [ln(Y)]2. 8.1. Rode uma nova regresso com esta varivel e verifique se o termo quadrtico relevante (significativo). Ln TC = + 2LnPKi + 3LnPLi + 4LnPFi + 5LnQi + 5[LnQ]2 + i Suj: supostos MQO
Modelo: estimaciones MCO utilizando las 145 observaciones 1-145 Variable dependiente: l_TC Coeficiente Desv. Tpica Estadstico t Valor p ----------------------------------------------------------------const -0.102785 1.39459 -0.07370 0.9414 l_PK -0.578146 0.261190 -2.214 0.0285 ** l_PL -0.0110635 0.226268 -0.04890 0.9611 l_PF 0.484491 0.0767329 6.314 3.42e-09 *** l_Q 0.115234 0.0614152 1.876 0.0627 * sq_l_Q 0.0537508 0.00532519 10.09 2.61e-018 *** Media de la vble. dep. 1.724663 D.T. de la vble. dep. 1.421723 Suma de cuad. residuos 12.43648 D.T. de la regresin 0.299117 R-cuadrado 0.957273 R-cuadrado corregido 0.955736 F(5, 139) 622.8389 Valor p (de F) 2.86e-93 Log-verosimilitud -27.67887 Criterio de Akaike 67.35774 Criterio de Schwarz 85.21814 Crit. de Hannan-Quinn 74.61502

O termo includo (o quadrado da varivel produo) estatisticamente significativo, isto a pesar de que o coeficiente em pequeno, mas seu erro e muito pequeno proporcionalmente, ademas posui uma t muito grande com um p valor que significativo ao 1% 8.2. Voc notou mais alguma mudana (R2, coeficientes angulares)? Como voc verificaria a superioridade deste modelo em relao ao anterior? O R2 maior no novo modelo, quase em 3%. E os coeficientes angulares diminuram no modelo novo, alem disso seus desvios padres aumentaram em uma pequena medida. Mas as variveis significativas continuam suas propriedades na t estatstica e no p valor. A superioridade pode ser comprovada a traves da prova RESET de Ramsey, j que quando agregada uma varivel, mas que tem a forma da regressada elevada a uma potencia se pode comparar a traves de uma prova F, que calculada a travs do R2. Se o F e maior que a F critica se pode dizer que o modelo original este mal especificado. F = [(R2 novo - R2 velho)/numero de variveis novas]/[(1 - R2 novo)/n numero de parmetros no modelo novo)] F = [(0.957273
- 0.925955 )/1]/[(1 - 0.957273 )/(145 6)] 0.031318/0.000348086 = 89.97

Segundo a prova de Reset de Ramsey e as observaes das perturbaes, as quais apresentam uma tendncia, existe vis de especificao no modelo original.

8.3. Como testar a hiptese de Rendimentos Constantes de Escala? Apresente as hipteses nulas e alternativas e o resultado do teste. Baseado na sua concluso, h espao para a competio no setor, ou o melhor seria criar um monoplio legal (pblico ou pivado)? H hiptese de RCE se pode apresentar assim num modelo de simple.

H0: 5 = 1 H0: 5 1 O qual apresentado assim: Ln TC = + (5 - 1)LnQi + i Ou, (Ln TC + Ln Qi) = + 5LnQi + i
Modelo: Estimaciones MCO utilizando las 145 observaciones 1-145 Variable dependiente: ln_TC_ln_Q Coeficiente Desv. Tpica Estadstico t Valor p ----------------------------------------------------------------const -2.92532 0.127019 -23.03 5.74e-050 *** l_Q 1.70920 0.0186024 91.88 4.69e-129 *** Media de la vble. dep. Suma de cuad. residuos R-cuadrado F(1, 143) Log-verosimilitud Criterio de Schwarz 172.6432 8.281314 D.T. de la vble. dep. 3.296921 26.07182 D.T. de la regresin 0.426990 0.983343 R-cuadrado corregido 0.983227 8442.082 Valor p (de F) 4.7e-129 -81.34487 Criterio de Akaike 166.6897 Crit. de Hannan-Quinn 169.1088

A prova F e prova t, fazem que Ho seja rejeitado e se aceite a hiptese alterna. Assim os retornos no seram constantes, onde o coeficiente maior do que 1, o modelo apresentado ajuda a conhecer que ainda h espao no setor e seria melhor que a concorrncia seja fomentada.